(题图 via AnandTech ) 过去几年,机器学习技术的应用已变得相当普及,可见其在广泛的行业和各种系统中。ARM 认为终端 AI 市场会在未来几年中迎来爆炸性增长,新 IP 就是为此做准备。 首先介绍下 Cortex-M55,它是与 M33 联系更加紧密的新一代 IP,引入了体系架构上的新改进,能够在机器学习和矢量指令方面实现较大的性能和灵活性改进。
Ethos-U55 是专用的 microNPU 推理加速器,可与 Cortex-M 系列 CPU 结合使用,带来专门面向于 NPU 的性能与能效提升。 与 Cortex-M 系列内核一样,Ethos-U55 的空间占用也比较少。至于 Cortex-M55,则是首款具有 Helium / 定制指令能力的 CPU 内核。
Helium 特指 M-Profile Vector Extension(简称 MVE),属于 M 系列 CPU 中的新矢量扩展和专用矢量执行单元,使之成为该范围内首款具有单指令多数据流(SIMD)功能的产品。 新增功能使得新内核的 DSP 性能提升了 5 倍,结合针对机器学习工作负载的优化指令和 MVE,整体表现可提高至 15 倍。
ARM 未提及微体系架构的主要细节,但可知它是一种非常精简的设计,注重的是面积和能源效率、具有较小的内存占用量,其中包含我们在 N 系列产品中见到的一些特性,如 Weight Decompression 。 即便如此,它与 N 系列在功能上并没有太大区别,因为该 IP 已包含 M 系列 CPU 。据说其架构与 NPU 有所不同(与更大的兄弟无关),且是专门为低功耗用例而设计。
就面积大小而言,U55 最小的 32 MAC 实现,约为 M55 的 2 倍。这里没有绝对的数字提供,实际上讨论的是平方毫米的分数。 与上一代解决方案相比,使用 M55 和 U55 的此类系统,其性能改进意味着相当重要的步进功能提升。与基于 Cortex-M7 的系统相比,ARM 带来了包含 50 倍的性能提升、以及 25X 的能效改进。 至于新 IP 的可用领域,ARM 展望了各式各样的嵌入式系统(主要是现有的芯片子系统)。比如在移动设备上,厂商可在 手机 的指纹传感器、语音助理(实时监听指令)、甚至在 RF 系统中(如天线调谐)使用它来优化工作负载。 当今的移动设备中,有数百种 M 系列 CPU 可从机器学习功能中获益,且其中大多数功能对用户来说是完全透明的。 目前 ARM 已向主要合作伙伴开放 M55 和 U55 的授权,并将在未来几个月内向更广泛的客户群开放,预计最终产品可在厂商二次开发的两年后走向市场。