通用MCU和边缘AI芯片之选:Arm还是RISC-V?
原创
顾正书
电子工程专辑
2022-07-05 12:22
发表于
广东
收录于合集
过去30年的计算时代发展大致可以分为三个阶段:1995年微软Windows开启了以x86架构
CPU
为主的PC时代;2007年
苹果
iPhone开启了以
Arm
架构为主的智能手机时代;2012年基于
英伟达
GPU
的卷积
神经网络
AlexNet的成功开启了
人工智能
(
AI
)时代。AI经过10年的快速发展,已经从云端扩展到边缘和终端,渗透到数据中心、边缘服务器、
5G
基站和各种各样的智能终端中。
无论应用是否使用定制化
ISA
扩展,
RISC-V
都可同时支持。(Image:Codasip)
在
Arm
架构处理器从手机扩展到新兴
物联网
、汽车
ADAS
/
自动驾驶
和各种
AI
应用场景的同时,开源灵活的
RISC-V
微处理器
架构也蓬勃发展起来。在越来越多的计算应用
设计
中,都可以看到
Arm
和RISC-V的身影。具体到芯片级别的硬件实现,广泛应用于
嵌入式
计算的
微控制器
(
MCU
)和面向边缘/端侧计算的
AI
芯片
成了
Arm
和RISC-V架构
微处理器
内核正面对决的主战场。
可定制化的指令集(
ISA
)
RISC-V
指令集
架构从一开始就支持基础
ISA
、标准扩展,以及定制化ISA扩展指令。
Arm
最初不支持定制化扩展,但迫于竞争压力也开始向Arm生态合作伙伴开放定制化功能了。即便封闭的x86生态也开始松动,
英特尔
最近也开始考虑对外授权,甚至定制化扩展也有可能。
因为没有
Arm
和
X86
的历史包袱,
RISC-V
ISA
在指令规划上比较简单。在标准指令集之上根据特定应用的需要进行扩展,为各种碎片化的新兴应用提供了极大的灵活性。例如,RISC-V矢量扩展(RVV)可以让处理器内核加速海量数据集的单指令流计算,特别适合如下计算任务:
机器学习
、图像压缩处理、数据加密、音频和视频多媒体处理、
语音识别
和
自然语言处理
。这些正是新兴
物联网
应用中实施
AI
所必须的计算任务。
RISC-V
对定制化扩展指令的支持在某些特定应用中可能是
设计
成败的关键所在。使用定制化扩展指令与其主
ISA
并不冲突,可以同时支持通用的RISC-V
软件
。
Codasip CTO ZdeněkPřikryl
在上面的
RISC-V
软件
堆栈示意图中,带定制化
ISA
扩展的RISC-V处理器可以支持对实时性要求比较高的
嵌入式
OS(比如embOS、FreeRTOS或RT-Thread),也可以支持对处理性能要求比较高的OS(比如Linux、
Android
或Windows)。其上的App1不需要性能增强,也不采用定制化
ISA
扩展指令,只需要标准的编译器就行了。而App2和App3采用了定制化ISA扩展以增强性能,因此必须使用兼容定制化ISA扩展的编译器。
Codasip是一家专注于
RISC-V
和特定域架构(DSA)处理器方案的欧洲开发商。该公司CTO ZdeněkPřikryl(裴德)在接受《
电子工程专辑
》采访时表示,对于任何一个
MCU
厂商来说,无论基于
RISC-V
还是
Arm
架构,如果采用的是通用
设计
,那么在性能上就一定会有所妥协。
人工智能
通常要求较高的处理性能,而边缘应用则需要
低功耗
、小尺寸的
MCU
。但现实情况是,通用处理器内核很少有适于这种组合的性能要求。对于一些边缘
AI
应用,通过在RISC-V处理器内核中添加定制指令可以使
算法
在相对有限的处理资源中得到充分执行。而可定制的领域专用架构能够使处理器更适合
AI算法
和
软件
工作
负载
。
微处理器
内核对性能的影响
处理器内核架构是影响处理器性能的关键因素,先进的架构具有更强大的指令集和更优秀的运算单元,因而拥有更为强大的算力。而在相同处理器架构下,采用不同的实现技术也会影响到性能的发挥。例如,采用
总线
并发架构技术实现
CPU
无等待指令访问,可比同级别处理器运算性能提高30%以上。
对于
MCU
性能,要从两个维度来衡量,一方面是主频,另一方面就是内核架构。主频很容易理解,类似于速度,对于同一种架构的MCU,当然是主频越高MCU的速度就越快。先进的架构可以使内核在单位时间内执行更多的指令,也就是完成更多的任务。因此,不同架构的MCU如果只看主频,是无法判断其性能高低的。一般来说,越先进的内核架构,在单位时间内可以执行的指令数和处理数据的数量就越多。
由此可以看出,主频越高且内核架构越先进的
MCU
,其性能就越好。这可以类比为赛跑:当步幅一样大(即架构相同)的时候,步频快(主频高)的选手跑得就快;而当步频一样(主频相同)时,步幅大(即指令执行效率高)的选手跑得就快。
当然还有其他影响因素,内存容量大小以及
晶圆
工艺
等也都会在一定程度上影响处理器性能。例如,
缓存
越大,处理器访问数据的命中率越高,内核计算的效能就越高。
通常情况下,
嵌入式
MCU
对处理器内核的主要诉求为稳定、可靠、
安全
、实时等控制特性需求,而边缘
AI
芯片
往往要求更高的计算性能和存储容量,以及更低的功耗。对
MCU
来说,不同架构内核的区别更多地体现在
软件
和开发生态上,而不是性能上。对于
AI
芯片,除了通用处理器的功能要求以外,还会有针对
算法
和应用的需求,这可能需要相关的算力和性能,比如SIMD/Vector能力、
DSP
能力、扩展指令的开放性等。
MCU
:
Arm
还是
RISC-V
?
国民技术
市场总监颜君生
根据
国民技术
市场总监颜君生的看法,在
MCU
市场,
Arm
内核目前占比最大,其生态比较健全,架构也已经完善成熟了,因此应用十分广泛。但Arm内核局限于封闭的
指令集架构
、授权及专利费用,不方便细分定制。此外,不同
Arm
内核的性能差异较大,而随着Arm内核工作频率的提升,
MCU
芯片的能耗增加很快。因此,采用高主频Arm内核的MCU芯片如何降低能耗,这对MCU厂商来说是个不小的挑战。
对通用
MCU
来说,采用
Arm
架构的好处是可以跟主流的生态保持兼容,充分复用现有的应用
设计
,降低design-in的门槛。大多数国产
MCU
厂商都是基于这个理念而切入MCU市场的,事实证明这也符合中国半导体行业的发展需求。然而,这样做的危害也日渐凸显,我们已经看到国产MCU芯片的同质化问题越来越严重。如果只能在价格上竞争,这对整个行业和其中的大部分公司都没有益处。一些有实力和远见的国产MCU厂商已经意识到这一点,并开始转向差异化的产品规划和市场竞争。
在处理器内核的选择上,除
Arm
外现在还有
RISC-V
。RISC-V架构具有
低功耗
、低成本、开源开放、可模块化、简洁、面积小和速度快等优点。但其缺点也很明显,主要表现在:开发工具链不够友好;
软件
生态不够完善;没有丰富的芯片系列选型。归结到底,其实是因为发展时间太短,整体生态不完善。
爱普特产品市场总监魏璐
据
爱普特微电子
产品市场总监魏璐称,其公司从成立之初就一直坚持使用自主产权的内核和
MCU
所需要的各种IP。虽然通过技术研发创新来实现
微处理器
的自主可控十分艰难,但坚持下来的价值和优势也十分明显。针对目前
RISC-V
MCU
的发展痛点,爱普特与平头哥一起合作打造了一个“开发编辑工具链”。目前编译器已经可以支持“所见即所得”,支持包括AliOS在内的多个
RTOS
,整个工具连从底层到基础系统,再到核心组件都已实现完整生态。
针对工程师和开发者面临的开发选型丰富度不够问题,爱普特开发了完整系列的
RISC-V
产品:
引脚
从20Pin直到200Pin,频率从32KHz直到2
GHz
,处理器从32位到64位。魏璐表示,其公司计划发布25个系列,超过300多个型号的RISC-V产品,覆盖消费类、工控类和
车规级
应用。
边缘
AI
芯片
:
Arm
还是
RISC-V
?
时擎科技是一家基于
RISC-V
内核开发边缘
AI芯片
的初创公司,其联合创始人兼总裁于欣在接受《
电子工程专辑
》采访时表达了对
Arm
和
RISC-V
架构的观点。
Arm
拥有更好的生态,包括开发工具、
操作系统
支持和广泛的开发者基础,以及更丰富的可选型号。然而,
AI芯片
更需要的是对于各类
人工智能
算法
的高效支持,而这本身不是通用处理器的强项。如果仅仅通过
Arm
原生的VFP、NEON等扩展,起到的效果还是比较有限的。因此,
AI芯片
需要更专用的处理器内核,这就在
Arm
(或者说通用处理器)覆盖的范围之外了。
时擎科技总裁于欣
与
Arm
相反,
RISC-V
的开放性、模块化及可扩展特性会帮助
AI
处理器
更好地与应用和
算法
特点及需求相结合。时擎在这方面也做了一些探索,基于RISC-V架构开发的Timesformer处理器就是针对端侧语音和
视觉
算法
特点而
设计
的DSA处理器,这也是RISC-V所具有的独特优势。
在
软件
和生态方面,基于
RISC-V
架构的
AI芯片
目前还会遇到一些挑战。但是由于
AI
应用往往需要芯片原厂提供芯片+
算法
的完整解决方案,底层的架构对于大多数下游客户来说并不是特别敏感,这在一定程度上掩盖了RISC-V的缺失。
微处理器
与应用的最佳匹配
对于处理器架构,没有绝对的好与坏,而要看具体的应用需求。偏通用型的芯片采用
Arm
架构会存在得天独厚的优势,短时间来看还是难以撼动的。Arm是一个32位精简指令集(RISC)处理器架构,其应用领域十分广泛,目前主要有手机、PC、服务器、汽车、
物联网
、
人工智能
解决方案等。在新兴应用领域,特别是在智能控制、
边缘计算
、便携式产品等
嵌入式
产品应用领域,
Arm
架构处理器具有非常好的应用前景。例如,
物联网
、工业联网及工业控制、智能家电及智能家庭物联网终端、消费电子、电机驱动、
电池
及
能源
管理、智能表计、医疗电子、
汽车电子
、安防、
生物识别
、
通讯
、
传感器
、机器
自动化
等,都非常适合采用
Arm
架构的
MCU
产品。
据颜君生介绍,
国民技术
目前主要基于
Arm
Cortex-M0、Cortex-M4、
Cortex-M7
等内核平台开发系列芯片产品,其中以通用
MCU
、
安全
芯片
和无线
射频
为主,现已广泛应用于电控、工业、车载、医疗、
物联网
、消费等领域,并正在扩展到车规
MCU
、数字
电源
、电机控制等细分MCU市场。
物联网
类应用和专用性较强的应用比较适合采用基于
RISC-V
的
MCU
。RISC-V是一种适合通用MCU和特定领域专用加速器(例如
AI
)的
ISA
,具有模块化和可定制的优势,这意味着它可以被部署以满足特定应用的需求,因此可以为
物联网
应用的不同需求‘量体裁衣’。物联网应用属于长尾市场,碎片化很严重,有很多绝对体量不大但种类繁多的应用陆续显现出来。至于专用性市场,RISC-V凭借着开源和低成本的特性,更加如鱼得水。
据魏璐透露,爱普特计划2022年同步进军通用市场和专用市场。在专用市场方面,其新产品将覆盖公司已经涉足的领域,包括电机驱动、触摸按键、HMI、智能语音等应用场景;通用市场方面,计划推出具有各种丰富外设的通用型
MCU
,从48MHz到250MHz,存储容量从6
4K
/
8K
到512K/128K全覆盖,外设方面也包括了
USB
、CAN、SDIO、加密引擎等关键外设。
时擎于欣认为,对于偏专用型的
AI芯片
,即需要通过底层架构创新来实现更好的
算法
和硬件融合的芯片,
RISC-V
可能是个不错的选择,可以让芯片开发者有更多的灵活性来
设计
处理器的
微架构
,并且一些底层和基础的工具链和指令集不需要从零开始去造轮子,也在很大程度上是对现阶段RISC-V扬长避短的可行做法。
未来生态发展
Arm
的精简指令集功耗较小、价格便宜、并发处理效率高、升级速度快,而且Arm自带
物联网
基因,在
5G
网络基础设施和物联网应用领域具有竞争优势。Arm目前的趋势是往服务器和高性能计算的方向发展,也许会蚕食更多
X86
的份额。Arm未来面对的市场主要包括服务器、移动终端、ICT基础设施、汽车、
嵌入式
等场景。Arm生态在以上这些应用方面的整体可参与度和市场上升空间都十分巨大,有着非常好的发展前景。
目前整个
MCU
生态绝大部分仍被
Arm
架构主导,许多厂商选择仿制和兼容欧美芯片这条捷径。但是慢慢地,我们看到越来越多的国产厂商加入
RISC-V
这个行列。现在终端客户也开始接受RISC-V
MCU
了。
谈及
RISC-V
MCU
生态建设,魏璐表示爱普特将携手平头哥一起打造完整的RISC-V工具链和完整MCU生态。除了RISC-V的CSI组件认证外,爱普特还会打造“1520”生态标准,即1天上手、5天出原型,20天量产。目前爱普特已独立开发了完整的开发套件,包括调试工具、烧录工具、编译
软件
等,可以让工程师很方便地使用RISC-V MCU。
RISC-V
生态在
嵌入式
应用中得到了迅速发展。随着高性能RISC-V内核的出现,RISC-V生态系统将朝着高性能计算的方向发展。但是,在可以预见的未来(比方说3-5年内),RISC-V想要与
Arm
分庭抗礼,全面对抗还是比较困难的。于欣认为,RISC-V也
许可
以先从一些细分领域突破,再去寻求以点带面,这是比较现实的路径。某些细分领域对生态不敏感,对差异化要求比较高,比如端侧
AI芯片
。此外,对于国内市场来说,对“自主可控”有着更高要求的领域也是RISC-V发展的沃土,比如信创行业。
总的来说,作为后来者和相对小众的
RISC-V
,需要立足其开放、精简、可扩展、模块化这些优势,充分扬长避短,才有可能一步步发展壮大,最终形成与
Arm
和
X86
“三分天下”之势。
作者:顾正书
EET
电子工程专辑
原创
EDN
电子工程专辑
,赞
2
预览时标签不可点
收录于合集
#
个
上一篇
下一篇
阅读原文