小米宣布声学语音技术实现全面自研,部分领域已持续领先

近日,小米发布了小爱音箱Art,作为小米推出的第9款智能音箱,小米小爱音箱Art背后的声学语音技术也重磅升级,搭载第三代小爱同学,支持情感化语音交互、全屋播放及就近唤醒等。



6月22日,小米官方透露,小米的声学语音技术已经实现全面自研,并在自研部分领域持续领先。





首先是语音交互实现“情感化”。为了让机器加入情感元素,小米AI实验室在“情感数据量有限”的前提下,通过不同声学模型、不同声码器组合最终上线自然、拟人效果的情感TTS(Text to speech,人工语音合成),成为业内首家情感化TTS大规模落地的企业。


此次小米小爱同学Art全面支持情感化语音交互,基于有限但类型不同的情感音频数据(如开心、关心、害羞、惊讶等),通过不同技术训练并迭代声学模型,最终支持情感TTS合成并实现“小爱同学”音色情感化、拟人化。


未来,小米语音将升级此技术——支持情感TTS实时合成。


其次是,AIoT放音技术升级,首次实现一句话全屋同步播放相同音频功能。据悉,小米小爱音箱Art是首款可以实现语音支持全屋播放的设备。用户直接对小爱同学说“全屋播放XXX”,无需提前在App端进行手动设置,即可实现一句话语音交互。


第三,就近唤醒全新升级,业内首次上线跨设备关闭闹钟功能。此次小米小爱音箱Art就近唤醒全新升级,可支持跨设备关闭闹钟。远处的音箱闹钟响了,唤醒近处的音箱可以直接关闭远处的闹钟。此功能在业内首次上线,小米小爱音箱Art也是首款支持该功能的产品。


第四,两麦阵列唤醒新策略,兼顾低功耗与高性能,高效降噪,获得干净人声。小米小爱音箱Art同步支持两麦阵列唤醒技术。在麦克风阵列方面,小米采用两麦盲源分离降噪前端,通过盲源分离、降噪、回声消除等技术,在多声源的嘈杂环境、音箱自身播放音乐时,都能结合语音增强技术,消除噪音的强干扰,获得干净、准确的人声音频。


5月21日,小米小爱音箱Art正式发布,首次采用金属机身,主打设计、音质、智能,零售价349元,到手价299元。设计方面,小米小爱音箱Art采用质感金属机身,搭配1600万色极光灯带。亚光细石纹壳体,一体式无缝触控按键。在智能交互方面,支持自研茉莉情感音色,靠近一键配网。语音控制支持2000+智能设备,覆盖1600+使用生活技能。


目前,小米IoT平台连接的智能硬件数已达到2.5亿台,音箱出货量已经达到2200万台。


往期精彩文章

细思极恐!一堆“安创”系投资公司与Arm没一毛钱关系?

印度计划禁用中国电信设备!真离得开华为中兴

中兴通讯5nm 5G基站芯片正在技术导入!

覆铜板大厂建滔宣布:7月1日起所有材料涨价!影响几何?

华米科技“黄山2号”发布:AI性能提升7倍,功耗降低50%!

打破国外垄断!国产5G毫米波芯片研发成功:成本将由1000元降至20元!

三星将为华为代工5G基站芯片?可能性有多大?

吴雄昂发内部信:Arm的指控是莫须有的,现有成果不允许有任何损害!

Arm中国夺权大战的背后:“独立”两年,仍难“自主”?

台积电:不希望失去华为订单,但会迅速完成替代!

中芯国际:在获得美国许可之前,可能无法为华为代工芯片

半导体测试设备市场现状:国产化率仍不足10%!

行业交流、合作请加微信:icsmart01
芯智讯官方交流群:221807116