1.8万亿智能音箱上演三国杀,其“硬核”秘密在哪儿?
Challey & 老刘
EDN电子技术设计
今天
“
天猫精灵
,讲个故事”
“
天猫精灵
,请在周一至周四早上六点半叫醒我”
“小度小度,讲下红楼梦第20回”
“
小爱同学
,唱支歌”
……
智能音箱
经过几年的“野蛮”发展,现在已经家喻户晓,据悉,2019年9月25日阿里巴巴
人工智能
实验室暨
天猫精灵
秋季发布会上宣布:天猫精灵销量连续两年中国第一、全球第三。
阿里曾表示,机器的智能进化史,是从功能性服务到人类情感满足,
机器智能
将会更有温度。
阿里巴巴集团副总裁、A.I.Labs总经理浅雪表示,马老师的3H战略提到:未来不是以平台为中心,而以家为中心。浅雪认为“家庭大脑”是家庭的中枢,是生态的连接器,是未来社区的智慧引擎。她表示
5G
IOT
时代变化的最终目的:为了Happy,为了Health,为了Home!
一、
智能音箱
的起源与发展
智能音箱
最早是亚马逊内部实验室Lab126研发,最开始的名字叫Amazon
Flash
,后来改名Echo,Echo于2014年11月发布,一举成名,开启了这座金矿的挖掘。
早在2018年,Strategy Analytics调查发现,88%的用户家中拥有至少一部亚马逊
智能音箱
,31%拥有至少一部
谷歌
智能音箱。据Voicebot.ai和Voicify曾经发布的一份新报告,美国智能音箱拥有者在2018年增长了40%,达到了6640万,占美国成年人口的26.2%。
2019年,据外媒报道,根据CIRP日前分享的最新数据显示,第二季度,美国
智能音箱
的安装数量预计为7600万台,而
苹果
的
HomePod
仅占了其中的5%。亚马逊仍旧是美国最大的
智能音箱
供应商,
谷歌
紧随其后。据统计,亚马逊Echo
设备
占美国智能
扬声器
市场份额的70%,
Google
Home
设备
25%。
至此,美国
智能音箱
形成了亚马逊、
谷歌
、
苹果
巨头的三足鼎立。
二、 中国
智能音箱
市场三国杀
在中国,2015年3月由京东和
科大讯飞
联合推出第一款中国的叮咚
智能音箱
,然后,陆续开始出现了华强北、三线小厂、深圳方案商等一大批探路者。
据GFK数据统计显示,2015年以来我国
智能音箱
市场实现的零售量整体来看是保持着高速增长,但从绝对量来看,从2015年的1万台到2017年1-8月的10万台的规模都是非常小的。
这时,巨头们,又是阿里马云首先捕捉到先机,在很短的时间内,极速出手(据说研发只有短短数月),于2017年7月5日发布
天猫精灵
X1,其时亚马逊Echo在美国市场的销量已经是千万量级。而在2017“双11”当天,天猫精灵售出超过100万台!
从此,中国
智能音箱
的发展进入快车道!
随着巨头们的进入,到如今的2019年,中国的
智能音箱
也出现了三国杀:
经过几轮洗牌博弈后,中国
智能音箱
市场的出货量已经跃居全球第一。海外数据统计机构Canalys的报告显示:2019年第一季度中国市场智能音箱出货量全球占比51%,首次超过美国,成为全球最大智能音箱市场。至此,“Made in China”的智能音箱领跑世界。
Canalys 2019年第三季度发布的统计数据显示,全球
智能音箱
出货量增长44.9%,达到2860万台,整体市场进一步增速。其中,国外智能音箱一家独大的亚马逊,同比增长65.9%;国内智能音箱三巨头之一的百度,以同比增长高达290.1%的数据持续领跑,阿里巴巴、小米的同比增长则分别为77.6%,77.7%。
至此,国内
智能音箱
市场已经开始形成“一超二强”巨头垄断的市场局面。近日,全球权威咨询公司Euromonitor International(欧睿国际)在调研报告中指出“2019年前三季度,按照销量统计,
天猫精灵
、小米和百度三大智能音箱品牌在中国市场集中度高达93%。”
其中,
天猫精灵
更是以89元的价格,誓要撬动1.8万亿的未来市场。
为什么这些巨头对
智能音箱
这么“痴迷”?现在的原因已经众所周知了,那是为了下一个
AIoT
的布局,说得落地一点就是未来可能通过智能音箱,
AI
语音随时随地控制各种场景:
智能家居
、智能教育、智能汽车等等,形成又一个万亿级的闭环生态。
关于
智能音箱
&
AIoT
的发展,在此暂且不表。
国内
智能音箱
出货量达到几千万之多,口碑这么好,体验这么劲(笔者很早就买了
天猫精灵
给孩子用,几年了音箱还是那个音箱,可孩子越用越有趣,音箱也越来越智能),其售价却能做到如此之低,他们都用的什么方案,硬件核心都有什么不同?
机器人
网怀着满满的好奇,请来了有着二十多年硬件
设计
、研发经验的老刘,开启了一波“拆拆拆”之旅,以此揭开智能音箱的硬核秘密。
三、 大拆解
首先,我们通过电商平台买来了四款
智能音箱
,分别是阿里
天猫精灵
IN糖,阿里天猫精灵方糖R,百度小度智能音箱play,小米小爱音箱play。
至于为什么要买两款
天猫精灵
,是觉得很奇怪,IN糖与方糖R似乎没什么差别,可是价格IN糖要贵很多,那到底贵在哪里,我们只有“剖”开它看一看。百度选择的是小度Play青春版,小米小爱似乎只有一个选择。
下面是“全家福”
这次拆解主要分为三个部分:
A、 首先对声音、智能语音的唤醒进行了简单
测试
,由于这次主要偏重硬件拆解,详细的语音智能方面就不做深入测评。
由于这几款
智能音箱
价格在百元上下,除去各芯片
器件
,留给音箱单元的成本不多了,因此不用太期望其音质的完美。但是
机器人
网在进行了简单
测试
后,发现他们的发音都非常清晰,音质非常纯正。其中小米小爱的喇叭尺寸大,用料足,其音质效果要好上一筹。但是
小爱同学
在语音、噪音等
算法
处理方面稍微差一点,表现在音箱声音过大时,再用语音唤醒需要很大的音量,而唤醒小度和
天猫精灵
三个音箱只需人的正常发声即可。
B、 大拆解:对每个音箱进行拆解,找出其核心主板、
CPU
等元
器件
,看看各家用的什么方案和器件。
C、 谜底大揭晓,看看中国三大家
智能音箱
的硬件核心的秘密到底在哪儿?
如果觉得过程过于像“裹脚布”,请直接“滚”动到末尾看谜底大揭晓。
详情请看下面一一分解。
(一) 、小米小爱
智能音箱
Play
1. 外壳
拆解底部防滑胶垫,露出底部固定螺丝,4颗螺丝拆下:
底座添加一块配重块,上部露出导音锥:
2. 音箱
拆除导音锥,拆除
电源
插座板,露出内部音箱:
取出音箱,从上到下主板、内部箱体、全频
扬声器
固定一体:
扬声器
为2寸6欧5瓦双磁钢全频喇叭,箱体带倒相孔,双磁钢和倒相孔都是用来改善音质,提升灵敏度、提高
低频
动态和声压,该处
设计
用心了:
3. 主板
主板两面:
面板正面,4个按钮+中心一颗RGB
LED
状态指示灯:
4.
功放
ESMT AD52058
晶豪科技
15W立体声D类
功放
IC,带Limit,4.5V~14.4V,兼容TPA3136/TPA3137。
5.
CPU
去掉屏蔽罩,全志R328-S2
CPU
:
6.
Flash
GigaDevice 5F1GQ4UBYIG
兆易创新
1Gb SPI
NAND
Flash
。
LDO
电源
芯片
,BCCAQ—降压IC,5V降压IC, AACAT—降压ICx2:
7. 无线模块
RTL8723DS---
Realtek
瑞昱WiFi、
蓝牙
4.2二合一芯片:
8. 小爱全家福
9. 优缺点
小爱具有语音交互+百科搜索引擎+内容+
智能家居
控制,智能家居
设备
需要加入小米
IOT
生态链;
总体来说,在四款音箱中最具
设计
感,声音比较甜美柔和,
低频
有弹性,这跟其双磁钢喇叭及倒相式音箱设计有关系,用心了,但不知为何一到播放音乐,声
音响
度就降低,另外在播音过程中,多次出现呼唤“小爱小爱”无响应的情况。
(二) 、小度
智能音箱
Play青春版
1. 外壳
小度整体注塑,外壳上无螺丝,只能从前面板开始。
撬开前面罩,其面罩周边粘胶,另靠中间四个带胶套支撑柱子支撑固定。
拔掉喇叭线,拆除4颗内音箱固定螺丝:
2. 音箱
取出音箱:
箱体为密封箱,无辐射盆,1.75英寸5W全频扬声单元:
3. 主板
注意拆主板前要先撕掉地面标签,从底部四个孔位卸螺丝:
主板和
电源
插座板:
主板正面4个薄膜按钮,两路
麦克风
:
主板反面拆掉固定金属挡板:
主板正面:
4.
功放
标号JWBNA的
LDO
降压IC及
功放
IC TPA3138:
TPA3138D2德州10W 3.5V–14.4V 无
电感
器型立体声模拟输入 D 类音频
放大器
:
5.
CPU
去掉屏蔽罩,看到了
CPU
:全志R328-S3 CPU,小米小爱为R328-S2。
6.
Flash
全志R328-S3及Foresee FS35ND0
1G
,江波龙1Gb SPI
NAND
Flash
:
7. 无线模块
RTL8723DS---
Realtek
瑞昱WiFi、
蓝牙
4.2二合一芯片:
8. 全家福
9. 特点
具有语音交互+百科搜索引擎+内容+
智能家居
控制,智能家居
设备
需要加入百度
IOT
生态链;
总体来说,小度也采用全志R328标准参考
设计
,中规中矩,最大惊喜是黑科技技能——与爱奇艺深度合作,带DLNA智能电视投屏。
(三) 、
天猫精灵
方糖R
1. 外壳
2. 音箱
4R 3W 单喇叭,音箱带辐射盆,以增强低音效果:
双
麦克风
:
3. 主板
4.
功放
与小度一样,用的TPA3138D2,德州立体声模拟输入 D 类音频放大。
5.
CPU
大家都看到了,依然与小爱,小度一样的全志R328(小度是S3,其他都是S2)!布局不太一样,不是用的“铁壳”屏蔽罩,用的是
散热
泥盖子(后面IN糖有)。
6.
Flash
Winbond
25N01GVZEIG华邦3V 1G bit SPI
NAND
Flash
,那上面的泥巴可不是我们手误弄上去的。
7. 无线模块
依然用的是:RTL8723 DS---
Realtek
瑞昱WiFi、
蓝牙
4.2二合一芯片。
8. 全家福
9. 特点
具有语音交互+百科搜索引擎+内容+
智能家居
控制,智能家居
设备
需要加入天猫
IOT
生态链;
(四) 、
天猫精灵
IN糖
1. 外壳与
LED
矩阵
RGB
LED
矩阵:
LED
矩阵控制芯片U2628:
2. 音箱
4R 3W 单喇叭,音箱带辐射盆,以增强低音效果,辐射盆比方糖R要大一些:
3. 主板
与方糖R的布局差不多。
4.
功放
如上图,与方糖R一样,采用TPA3138D2。
5.
CPU
全志R328-S2,与方糖R一样
6.
Flash
如上图,与方糖R一样,采用
Winbond
25N01GVZEIG华邦3V 1G bit SPI
NAND
Flash
7. 无线模块
如上图,RTL8723 DS---
Realtek
瑞昱WiFi、
蓝牙
4.2二合一芯片
8. 全家福
9. 特点
具有语音交互+百科搜索引擎+内容+
智能家居
控制,智能家居
设备
需要加入天猫
IOT
生态链;
IN糖的惊喜在于前面板
LED
矩阵,显示时间及情绪,很有人性化,前面板带光感应
器件
,根据现场明暗度自动调节LED矩阵亮度。
四、 硬核秘密
至此,我们都看到了上面三家四款
智能音箱
的
CPU
均为全志R328,(只有小度用的是R328-S3,其余用的均是R328-S2)。下面是各音箱主要部件的对比:
从中可以看出,方案大同小异,完全相同之处是用的都是R328
CPU
和集成了WiFi和
蓝牙
的RTL8723DS芯片。其他只在flash和
功放
芯片的选择上有所不同,这就看各厂家与具体元
器件
供应商的合作以及供应链的管理了。
我们现在来分析一下这个方案:
CPU
作用自不必说;
RTL8723DS承载的作用其实不仅仅是我们表面看到的WiFi与
蓝牙
连接,更重要的是
智能音箱
将起着控制各场景
IoT
设备
的入口作用,而RTL8723DS作为通信桥梁其重要性就不言而喻了,高稳定性、高
可靠性
,以及整个架构的普适性等都必须得到保障。
于是我们又找来了全志R328的芯片架构图。
R328芯片框架图
包括:
CPU
(ARM A7)、Audio(声音)、Security System(
安全
系统)、Intenal System(内部处理系统)、
Embedded
Memory
(
嵌入式
存储)、Connectivity(连接扩展器)六大部分。
根据
机器人
网的了解,全志还与其他
智能音箱
产品有合作,包括叮咚(2015年3月份由京东和
科大讯飞
联合推出,可以说是中国第一款
智能音箱
)、魅族Gravity悬浮
音响
、Polk Alexa、
Sony
LF-S80D、网易三音音箱、腾讯听听、百度小度在家、小鱼在家等。有的音箱还能插卡,因此,上面的芯片架构图其实还隐藏了一部分:Extenal
Memory
(外部存储,插卡)。
我们来看看
全志科技
R328的官方描述:
R328智能语音专用处理器,可以提供语音交互方面的可靠应用,广泛适用于
智能音箱
等
电子产品
,R328集成了双核CortexTM-A7、64 MB
DDR
2或128 MB DDR 3,3个
ADC
通道和1个差分
DAC
通道提供音频输入/输出
接口
和丰富灵活的
麦克风
阵列,无需再外挂芯片。
全志公司专门为R328定制了低成本高集成
智能音箱
软硬件集成方案,套片WiFi/BT,为用户节约开发时间,通过IN糖可以看到,R328具有极高的集成度和丰富的扩展
接口
,也易让客户扩展定制差异化个性化的功能,是目前市面上最具竞争力的智能语音芯片方案。
我们来看看R328
智能音箱
方案框架图:
R328
智能音箱
方案框架图
按照全志R328官方文档介绍,R328最大支持8路数字
麦克风
,即在外围添加
ADC
芯片情况下,可以使用多麦克风拾音矩阵,包括在基本方案基础上,增加
DAC
解码和数字
功放
,选择好的
扬声器
单元,优化音箱
设计
,可玩性非常大。
R328-S2与R328-S3的区别
有一个细节:上面只有小度音箱用的
CPU
是R328-S3 ,其他用的都是R328-S2,那他们的区别在哪儿呢?其实,细心的朋友能发现在R328芯片框架图上的最下面有一个部分:
Embedded
Memory
,里面有两个选项:512Mbit
DDR
2 / 1Gbit DDR3,根据实际的硬件经验联想到此,S3与S2的区别可能与此有关。经过
机器人
网请行业内专业人士的求证,R328-S3确实是1Gbit
DDR
3(128MB),R328-S2为512Mbit DDR2(64MB),也就是说百度的小度可能因为需要更多的运算内存而选择了S3,而其他都是S2。
我们再来看看R328与其他方案的对比
从R328芯片框架图、R328
智能音箱
方案框架图和上面的智能音箱方案横向对比得知,全志的解决方案内置了512M
DDR
2或者
1G
DDR3(取决于产品方的选择),高度集成了WiFi+
蓝牙
芯片RTL8723DS,降低了整体方案的成本。对于产品方来说,只需提供外部存储SPI
NAND
Flash
或者
NOR
Flash
,再选择什么样的
功放
芯片和音箱单元,再连接自己(或者租用云端)的
AI
后台,即可快速定制一款
智能音箱
。这可能是几家大厂一致采用了全志R328方案的原因,也是全志这款智能音箱最热门硬件解决方案的优势所在。
尽管
智能音箱
的后端还涉及到云端、
AI
深度学习
等软硬件平台技术,但是前端智能硬件统一采用了R328方案,可见全志在智能音箱的硬核技术不容小觑。
阅读
在看
已同步到看一看
写下你的想法
前往“发现”-“看一看”浏览“朋友在看”
前往看一看
看一看入口已关闭
在“设置”-“通用”-“发现页管理”打开“看一看”入口
我知道了
已发送
取消
发布到看一看
发送
最多200字,当前共
字
发送中