车轮上的数据中心

查克 厚势汽车 1周前

图片

图片

导语

车架构正在从基于域的架构快速演变为区域架构,利用在数据中心中发现的相同类型的高性能计算,在路上做出瞬间决策。

过去的五年中,汽车架构的第三次重大转变,使用 7nm5nm 技术、专用加速器、高速内存和高度针对性的软件架构来集中处理。几十年来,汽车上的大部分电子设备封装电子控制单元中,并按制动和信息娱乐等功能进行细分。随着更多安全功能的添加和集中,它们由基于不同域的软件堆栈和汽车操作系统组织,通过集中网关相互通信,这是当今大多数新车使用的。
但是,随着车辆中增加更多的自主权,集中式网关的延迟被证明是行不通的。更紧密的相互依赖、可扩展性和灵活性都是必需的,区域架构允许这样做,而 OEM 正处于采用这种方法的不同阶段。引人注目的是,汽车区域架构看起来很像缩小的 HPC 数据中心。
“传统 HPC 解决方案的设计通常很少考虑功耗,除了对占地面积要求的影响之外,”西门子数字工业软件自动驾驶ADAS 高级总监大卫弗里茨说。“用于汽车的 HPC 开始类似,并且需要大量额外的计算、冷却和电源设备成本。多年来,这被认为是必要的,并推动了市场对高昂成本的预测,以及只有长寿命的公共车辆才能证明高价位的后续假设。”
近年来,技术进步已经证明这些假设是不正确的,更好地了解汽车高性能计算的实际需求已经显着降低了整体系统成本。Fritz 指出,这使汽车制造商能够从头开始重新构建下一代平台,使其能够跨多个价值层进行扩展和利用。反过来,这为大众打造更智能、更安全、更可靠的自动驾驶汽车的愿景注入了新的活力。
区域架构是自动驾驶的关键,其中很大一部分涉及传感器。“您能否在传感器处处理数据,或者在下一步中,在区域控制器中进行预处理?” Cadence汽车解决方案总监 Robert Schweiger 问道。“或者你可以将原始数据传输到中央计算单元,并传输到原始传感器数据融合?这是原始设备制造商的愿景,因为这提供了同时到达这台超级计算机的各种信息。然后系统可以做出最明智的决定,而如果你做预先决定,它就像一个决策树。某些假设是预设的,这可能会导致非最佳决策。最终可能会有一个更智能的解决方案,在一个地方同时处理所有事情。”

图片

图 1:区域架构概念。资料来源:节奏
但这种处理也需要实时进行,特别是对于与安全相关的决策,这就是为什么如此强调高性能计算能力的原因。
Synopsys汽车 IP 部门经理 Ron DiGiuseppe 表示:“当我们谈论汽车中的 HPC 时,我们指的是汽车架构的下一个演变,即基于区域网关的架构。“它有点不同,不是独立的应用领域,而是各种传感器,无论是动力系统中的传感器,还是ADAS传感器系统,或信息娱乐领域的图像传感器传感器还在。它们是独立的,但它们通过汽车网络/区域网络。区域架构由多个区域网关组成,这些网关本质上是网络交换机。所有这些应用程序都在一个集中处理模块中,而不是基于独立的应用程序域,它们都可以使用更集中的处理模块来完成。”

图片

图 2:车辆区域架构的进展。资料来源:新思科技
对于 ADAS,必须认为设备在功能上是安全的,这意味着它们通常是专门为汽车在这些中央计算芯片中使用而设计的。“随着整个汽车行业转向电动汽车,目前电力存储仍然是限制,理想情况下,这样的芯片需要尽可能低的功耗,”施威格说。“因此,效率——每瓦性能——非常重要。如果您的硬件位于数据中心的云中,情况就大不相同了。使用水冷系统什么的都没有问题,但对于生产使用的汽车来说,功耗是重中之重。”
成本控制
麻烦的是,要实现Level 3及以上的自动驾驶,需要大量的传感器,而强大的计算平台则位于中间。这增加了车辆的价格。“如果你想超越高档汽车,在那里你可以更容易地隐藏这些成本,你需要看看如何降低这样一个系统的成本。因此,它不会是一个水冷系统,而是一个消耗功率低于 100 瓦的系统。这是一个挑战,”施威格说。
在汽车市场,价格是一个非常重要的考虑因素。“他们正在与每一分钱作斗争,” Arm技术副总裁兼研究员 Peter Greenhalgh 说。“不可避免地最终会发生的是他们将所有芯片焊接PCB 上,但你不能只是拿起一个然后再放入另一个,因为那个插座会花费他们 10 美分,而且他们无法证明是合理的那。”
在车辆中设计一个强大的集中计算系统是具有成本效益的,因为一个设计可以开发一次并在多个车型上使用。“从根本上说,CPUGPU机器学习处理器的微架构不会发生巨大变化,”格林哈尔格说。“如果是在汽车领域,您可以将其置于功能安全之上,或者如果它进入基础设施市场,则将其置于更大的物理寻址之上。显然,微架构内部有一些部分必须应对更大的工作负载或更小的工作负载。但从根本上说,这些区块的微架构不会突然改变。”
因此,虽然这些设计很昂贵,但开发成本可以在许多车辆上分摊。“一般的半导体行业专注于 16/14 纳米并转向 7 纳米,但是当您进入汽车中的集中处理 HPC 架构时,其中包括大量繁重的处理和在每个应用程序中同时运行的多个应用程序,”说Synopsys 的 DiGiuseppe。“现在我们谈论的是具有更高性能和多核的 5nm设备。”
尽管如此,这项技术在其他应用中也很成熟。Imperas营销副总裁 Kevin McDermott 表示:“任何 HPC 应用程序的计算需求都是相似的——即,大量数据和细粒度模式分析与复杂的系统建模——而汽车并不仅仅因为它在轮子上而不同。”. “实时和混合关键性方面很重要。在任何多阵列处理器配置中,处理元件的交互都需要软件优化,这些优化依赖于程序员的工具来调试和分析复杂的多核事件序列。虚拟平台提供了硬件原型无法实现的事件场景的洞察力和可控性,这允许在对安全关键和安全要求很重要的故障模式条件下进行广泛的验证。”
不过,汽车确实为 HPC 设计增加了一些新的变化。数据中心应用程序具有额外的安全层,包括物理墙和安全防护。相比之下,汽车与消费设备有更多相似之处。永久连接,包括无线更新,扩大了黑客的攻击面,这需要对系统稳健性进行持续测试。他指出,用于安全测试的虚拟平台允许以独特的方式探索意外事件情况,以对内部防御进行压力测试,这些选项很难用物理原型进行测试。
“混合临界性是嵌入式应用中常见的多核设计挑战,”McDermott 说。“随着更多功能组合在共享硬件资源上,不同区域发生故障的可能性可能会危及高优先级和/或安全功能。随着 IP 和软件提供商以及新服务提供商和 IT 基础设施的贡献不断增加,汽车供应链也在不断发展。在多层方法中,每个阶段都可以添加额外的软件作为增值。这导致复杂的软件维护和更新过程。虚拟平台可用作汽车 HPC数字孪生,使供应链与参考平台统一,以实现多维持续集成持续部署,
但是,这需要一些强大的处理能力,以及使用多核架构同时运行不同操作的能力。在单个 SoC 中看到多个 12 个 64 位多核独立处理器内核的情况并不少见。
“对于 ADAS 域控制器,就像区域架构中的中央处理器一样,它是一种多芯片实现,”DiGiuseppe 说。“可能会有一个高性能的 5nm 主机处理器,但即使这样也可能无法处理所有性能,因此可能会有一个协处理器,并且可能有一个集成的 AI 加速器。拥有一个带有深度学习 AI 加速器的额外外部芯片也很常见,所以即使现在我们看到多个芯片实现了 ADAS 级域控制器,这将开始看起来更像一个更传统的数据中心基于 HPC设计,具有应用程序集中化、多个应用程序并行运行、虚拟化操作系统、管理程序和分布式异构架构,这看起来很像数据中心中的服务器。”
对于刚刚开始瞄准汽车市场的加速器芯片公司来说,这是一首乐曲。Codasip 的首席技术官 Zdenek Prikryl 表示:“总的来说,我们发现人们对在 AI 应用程序中使用 RISC-V 产生了浓厚的兴趣。“这包括欧洲处理器计划,特别是对于汽车,有许多涉及功能安全的选择。”
加速器可用于加速不同类型数据的处理,例如流视频、振动和温度,并可提高整体系统性能和反应时间。
处理、网络、存储差异
DiGiuseppe 说,用于汽车的 HPC 与数据中心的 HPC 非常相似——这是另一个对处理、网络和存储有独特要求的领域。“在数据中心,您通常会分解处理、网络和存储。在汽车领域,它们具有相同的功能——中央处理、网络和区域网关,其中包括网络和片上存储。汽车的主要区别在于它更像是端点设备而不是数据中心。一个数据中心可能有 10,000 台服务器,因此所有东西都可以扩展。这是相同类型的设计,但性能并不完全相同。数据中心将在网络端配备 200/400/800 Gbps 以太网,配备 TB 级硬盘和 SSD 以实现极低延迟的存储,而汽车网络可能是 10 Gbps 而不是 200 或 400 Gbps。汽车可能会趋向于 25 Gbps。这是同样的挑战,但在不同的表现点上。”
这是处理器方面的类似故事。“数据中心中的英特尔至强服务器可能有一个 12 核英特尔处理器,主板上有四个处理器。数据中心发生的事情,类似于汽车,是异构的多核架构,可能有 1,000 台服务器,应用程序都是虚拟化的。在汽车领域也是同样的挑战,只是稍微缩小了一点。没有数千个处理器内核。您面临着相同的性能挑战,但规模不同,”他说。
软件架构
就像在数据中心中一样,软件架构需要明确定义。汽车中的虚拟化环境需要完美架构,因为对于异构架构,虚拟化应用程序必须分布在多个内核和/或多个 SoC/ECU 中。
Synopsys 汽车部高级经理 Chris Clark 解释说,在数据中心中,有高冗余以确保工作负载的完整性,而在汽车中,出于安全原因需要冗余。“最终,您仍然会遇到高速互连的相同挑战,以确保您所服务的不同域和计算平台具有必要的计算能力,但在某些情况下还要解决安全性、安全性和延迟问题。它们非常相似,但也有一个权衡。当我们的资源有限时,我们必须确保做到这一点。在一个数据中心,可能有 1,000 台服务器。每天有两三个人辍学。您在车辆内没有这种灵活性,尤其是当您查看诸如集中式计算平台之类的东西时。
对于设计团队而言,汽车对 HPC 技术要求的敏感性需要高于数据中心。
“如果你看看 HPC 数据中心,你可以四处走动并进行技术转换,”克拉克说。“也许核心网络基础设施不一定具有与核心数量相同的预期带宽,但您可以将其物理切换。从汽车的角度来看,所有这些都被缩小到一个平方英尺内的单个 SoC。您必须处理所有冷却要求和所有可靠性组件,例如振动。您的 SoC 会因热量而分层吗?现在必须考虑在传统数据中心中您不会考虑的所有这些事情,因此对于哪些组件,该基础架构是什么样子的敏感性要高得多,
汽车 HPC可靠性与商业数据中心的可靠性也有很大不同。DiGiuseppe 说:“汽车不允许出现故障,而在数据中心,你必须预料到它,如果发生这种情况,会自动故障转移到另一台服务器。” “在汽车领域,敏感性体现在长期运行、高可靠性、功能安全和零缺陷设计的设计方法中。这就是设计技术的全部。”
软件也是如此。在传统的数据中心中,裸机管理程序被构建到系统中。虽然非常轻量级,但这些管理程序控制对底层硬件基础架构的所有访问和理解,并为位于该管理程序之上的操作环境实施规则。其他虚拟化方案包括包含核心操作系统,甚至是成熟的操作系统的架构,但随后它会针对该平台之上的不同虚拟化环境拆分为小的计算域。这些方法在 HPC 数据中心以各种配置使用,具体取决于它们要实现的目标。
虚拟化和管理程序在汽车领域有不同的考虑。“您必须确保您的 SoC 设计同时支持这些管理程序和虚拟化环境,并以安全可靠的方式支持它们,”克拉克说。“在车辆中,如果有两台服务器并且其中一台发生故障,如果其中一台服务器实际上是虚拟化环境,并且它是制动控制器,那么重新启动该虚拟化环境所需的时间可能有特定要求,您在 HPC 环境中看不到。重新启动这些服务并以适当的方式重新启动它们的能力对于围绕功能安全的概念非常关键,而这些概念在传统数据中心 HPC 环境中确实不存在。在这里,它说在某些失败条件下,必须通知驱动程序,或者必须降低车辆的能力以确保车辆以已知的安全方式运行。对于汽车架构中的虚拟机管理程序和虚拟化,必须就该域架构中车辆中哪些类型的功能适合包含在虚拟机管理程序或虚拟化环境中做出一些决定。这通常不是 HPC 数据中心环境中发生的讨论,甚至不是真正的核心焦点,因为您有更广泛的机会进行更改并使您的数据中心更灵活地满足您的需求,具体取决于您的需求。重新尝试做。” 必须就该域架构中车辆中哪些类型的功能适合包含在虚拟机管理程序或虚拟化环境中做出一些决定。这通常不是 HPC 数据中心环境中发生的讨论,甚至不是真正的核心焦点,因为您有更广泛的机会进行更改并使您的数据中心更灵活地满足您的需求,具体取决于您的需求。重新尝试做。” 必须就该域架构中车辆中哪些类型的功能适合包含在虚拟机管理程序或虚拟化环境中做出一些决定。这通常不是 HPC 数据中心环境中发生的讨论,甚至不是真正的核心焦点,因为您有更广泛的机会进行更改并使您的数据中心更灵活地满足您的需求,具体取决于您的需求。重新尝试做。”
设计这些汽车 SoC 时,有一个非常具体的操作要求范围,管理程序将如何操作,以及管理程序可能看到的预期活动。如果包含虚拟化,则需要指定虚拟化哪些组件。
克拉克指出,在信息娱乐中心中包含虚拟化是有意义的一个领域。“如果我有新功能加入,我会使用容器化和虚拟化,并且我想执行更新。与通过无线方式进行软件更新相比,通过无线方式交换容器或虚拟化环境的更新可能要容易得多。这真的会取决于。这是目前与许多原始设备制造商进行的讨论之一。关于如何处理软件更新以及对区域架构的影响的新标准正在出台。”
这些类型的决策对于车辆芯片架构至关重要。“解决计算需求的限制因素是吞吐量,数据中心的吞吐量来自服务器的计算性能和特定任务的工作负载优化,”Cadence 设计 IP 营销总监 Tom Wong 说。“在汽车领域,今天选择的工艺节点是 16nm。但是,从计算的角度来看,您已经用尽了气体来尝试进行大量这些 AI 优化。16nm 根本不够快,而且在实施硅方面的计算资源量会非常大,以至于您将达到太高的晶圆成本。16nm的die size可能太大了,功耗曲线不适合汽车。这些成分正在推动转向更精细的几何形状,就在我们发言时,这正在发生。但我们可能要到 2022 年或 2023 年才能看到 7nm5nm 汽车,具体取决于工艺。”
高性能内存考虑也开始发挥作用。这些仍在制定中。并且为了可靠性,机械组件预计可以使用 12 年而不会出现故障。此外,随着汽车制造商为车辆增加越来越多的自主性,所有这些都必须完美无缺。
“越来越多地,看起来人工智能推理将处于边缘,它将在汽车内。这为传感器分析增加了大量的人工智能计算,导致寻路和路径预测,这些计算将在汽车中完成,”Wong 说。
考虑到整个 AI 市场的 38% 是汽车,并且最苛刻的 AI 应用程序在汽车内,Schweiger 指出,看看 AI 部分是如何被切片和切块会很有趣。“在多核配置中需要可以扩展的硬件加速器,以实现更高性能的 AI 操作,但仍然使用一个单元来处理较小的部分。这意味着 AI 的可扩展性非常重要。这也很有趣,因为随着人们学习如何利用人工智能,它在未来只会变得越来越重要。”
图片
END

图片