Arm发布Cortex M55内核与Ethos U55 microNPU
摩尔芯闻
今天
来源:内容来自「
cnBeta.COM
」,谢谢。
近日,ARM 不仅宣布了最新的 Cortex-M 系列内核(最新的 Cortex M55),还引入了Ethos U55 microNPU 等改进。
ARM 希望通过新的 IP,于将来几年内为数十亿
低功耗
嵌入式
设备
提升
机器学习
和推理能力,扩展自家产品组合,以满足新的用例需求。
(题图 via
AnandTech
)
过去几年,
机器学习
技术的应用已变得相当普及,可见其在广泛的行业和各种系统中。
ARM 认为终端
AI
市场会在未来几年中迎来爆炸性增长,新 IP 就是为此做准备。
首先介绍下 Cortex-M55,它是与 M33 联系更加紧密的新一代 IP,引入了体系架构上的新改进,能够在
机器学习
和矢量指令方面实现较大的性能和灵活性改进。
Ethos-U55 是专用的 microNPU 推理加速器,可与 Cortex-M 系列
CPU
结合使用,带来专门面向于
NPU
的性能与能效提升。
与 Cortex-M 系列内核一样,Ethos-U55 的空间占用也比较少。
至于 Cortex-M55,则是首款具有 Helium / 定制指令能力的
CPU
内核。
Helium 特指 M-Profile Vector Extension(简称 MVE),属于 M 系列
CPU
中的新矢量扩展和专用矢量执行单元,使之成为该范围内首款具有单指令多数据流(SIMD)功能的产品。
新增功能使得新内核的
DSP
性能提升了 5 倍,结合针对
机器学习
工作
负载
的优化指令和 MVE,整体表现可提高至 15 倍。
整体
微架构
方面,新 IP 算是继承了 M33 和 ?arch 。
在频率提升的加持下,它将标量工作
负载
的性能提升了大约 20%,具体取决于供应商的配置。
新内核的
设计
重点,同样体现在
带宽
上。
其启用了需要
带宽
的新 MVE 和
机器学习
工作
负载
,因此对内存子系统进行了改进,比如 4×32-bit
接口
与紧密耦合内存(TCM)。
尽管 ARM 进入
NPU
领域的时间相对较晚,但新推出的 Ethos-U55 microNPU,还是较
嵌入式
市场有着独特的意义。
与移动
SoC
上更大的 Ethos-N 系列相比,它的面积和功耗要低得多。
Ethos-U55 是一种小型
NPU
,可从 32 路扩展到 256
MAC
、且需要与 Cortex-M 系列 NPU 耦合。
ARM 未提及微体系架构的主要细节,但可知它是一种非常精简的
设计
,注重的是面积和
能源
效率、具有较小的内存占用量,其中包含我们在 N 系列产品中见到的一些特性,如 Weight Decompression 。
即便如此,它与 N 系列在功能上并没有太大区别,因为该 IP 已包含 M 系列
CPU
。
据说其架构与
NPU
有所不同(与更大的兄弟无关),且是专门为
低功耗
用例而
设计
。
就面积大小而言,U55 最小的 32
MAC
实现,约为 M55 的 2 倍。
这里没有绝对的数字提供,实际上讨论的是平方毫米的分数。
与上一代解决方案相比,使用 M55 和 U55 的此类系统,其性能改进意味着相当重要的步进功能提升。
与基于
Cortex-M7
的系统相比,ARM 带来了包含 50 倍的性能提升、以及 25X 的能效改进。
至于新 IP 的可用领域,ARM 展望了各式各样的
嵌入式系统
(主要是现有的芯片子系统)。
比如在移动
设备
上,厂商可在 手机 的指纹
传感器
、语音助理(实时监听指令)、甚至在
RF
系统中(如
天线
调谐)使用它来优化工作
负载
。
当今的移动
设备
中,有数百种 M 系列
CPU
可从
机器学习
功能中获益,且其中大多数功能对用户来说是完全透明的。
目前 ARM 已向主要合作伙伴开放 M55 和 U55 的授权,并将在未来几个月内向更广泛的客户群开放,预计最终产品可在厂商二次开发的两年后走向市场。
福利
摩尔精英
粉丝福利:半导体行业资料,免费下载
点击阅读原文,了解
摩尔精英
!
阅读原文
阅读
在看
已同步到看一看
写下你的想法
前往“发现”-“看一看”浏览“朋友在看”
前往看一看
看一看入口已关闭
在“设置”-“通用”-“发现页管理”打开“看一看”入口
我知道了
已发送
取消
发送到看一看
发送
Arm发布Cortex M55内核与Ethos U55 microNPU
最多200字,当前共
字
发送中