你的语音助手,如何进化成善解人意的“萨曼莎”?

ZEALER ZEALER 今天
图片


1984年,乔教主用TTS(Text To Speech,语音合成)技术,让Macintosh向观众问候,在震惊四座的同时,一种全新的人机交互方式,在人们的心中烙下深深的印记,人们相信,在不久的将来,以计算机为载体的人工智能,将会以更加接近人类的方式和我们交流。


图片


随后的影视作品,对人工智能的态度经历了前后180°的转变:《终结者》《黑客帝国》等经典科幻为人们描绘了人工智能产生自我意识,最终反叛人类的灭世图景,而《Her》和《银翼杀手2047》等电影则把人工智能想象成了“浪漫女友”、《钢铁侠》把语音助手想象成了幽默风趣的可靠战友。


图片


近年,语音识别技术的突飞猛进,手机语音助手已经充分发展成为了生态入口,其与操作系统深度绑定,广泛接入第三方服务的变得无处不在(负一屏、桌面搜索、浏览器),而自动指令、全局识屏、识物等技能,则通过用户行为学习和云端知识图谱实现了全面进化,变得愈加得心应手。


图片


在众多科技宅男的心目中,人工智能的终极形象,也应该像《Her》中的“萨曼莎”那样善解人意,直击灵魂。在这一点上,OPPO小布助手实现了几大突破,把用户的美好想象拉得更近了。


在3月11日OPPO Find X3系列发布会上,小布助手宣布重大升级,“一句话智能”融上下文理解与复杂指令认知,将为用户提供更加应景贴心的语音助手体验。另外,此次升级还带来了“全新智趣男声”“自定义音色”和“答案之书”功能,发力情感化交互让小布助手更加善解人意。




自然语音处理全面超越,

“一句话智能”让你解放双手


从行业视角看,语音助手向前发展的瓶颈在于自然语音处理(NPL)上,把人类自然口语中的语义理解能力提升一个档次,就能大大提升真实用户场景触达生态服务的能力——把不精准的口语表达,连接到具体精准的场景、服务,这才是一个成熟入口的关键。


图片


从专业机构发布的技术成熟曲线资料看,自然语音处理(NPL)正在处于“过高期望”的后半段,这个领域发展初期存在一些成果,但大都基于浅层统计语义,解决的都是“把‘我爱你’翻译成法语”“播放周董的歌”这类问题;而新的研究需要解决是高层语义、记忆、知识抽象以及逻辑推理等艰难问题,这样才能打造一个具有成熟“对话系统”的语音助手。


不久前(截至2月27日),小布助手月度活跃用户数突破 1 亿,成为国内首个月活用户数破亿的手机语音助手,OPPO家的语音助手在用户体量上显然企及了一个高峰。同期,小布助手在自然语音处理上也宣告了全面超越——得益于对话系统架构升级,以及领先于行业的大规模预训练模型加持,小布助手问鼎"千言数据集:文本相似度"行业测评排行榜,并刷新该赛事 LCQMC 数据集最高分记录。这个中文自然语言处理领域的大规模赛事,数据集聚合了哈工大(深圳)LCQMC、BQ Corpus 和 Google 的 PAWS-X(中文)三个行业权威的评测集,挑战难度很大。


图片


这些进展是OPPO小布助手实现“一句话智能”全新体验的关键背景。“一句话智能”能够结合上下文理解语义、判断语境和场景,进而实现认知复杂指令、精准推送服务。当用户说出“打开支付宝扫一扫”“帮助我找一下三亚的照片”这类复杂指令时,小布助手可代替用户点击、输入,一步直达目的;当用户说出“我要去北京出差三天”这类基于场景的需求时,得益于小布助手丰富的第三方服务生态,可将订票、酒店、天气与穿衣提醒服务一次性推送,无需在不同App间跳转。


图片


在用户使用自然口语交互的前提下,小布助手实现了“一句话智能”,这必将更好的赋能小布技能平台上万千开发者的丰富服务,带来更加便利出色的使用体验。目前,覆盖出行、网购、社交、音乐、教育、阅读、健康与视频等高频场景的50+热门应用,都已接入小布技能平台,可以说你常用的App都可以使用小布助手实现高效互动。




变成“萨曼莎”,

让语音助手拥有个性人格


在自然语音处理上的全面领先,让小布助手拥有了融合上下文理解语义的能力,但出色的多轮对话管理能力不仅能打造“一句话智能”,通过在智能语音系统中新增专属语料库,利用深度学习技术建构人格模型,全新的智趣男声音色拥有了专属人设。


在小布助手的后台数据中,除了任务驱动型的互动指令,更多的是闲聊和陪伴需求,用户愿意把日常的喜怒哀乐讲给小布助手聆听,当然也更希望小布助手更加理解情感,给予他们温暖和趣味。


图片


不同于之前系统中的暖心女神和元气少女,全新智趣男声是个性鲜明、更加生动的语音形象,更懂用户情绪,为多元的用户群提供了差异化的交互体验。全新智趣男声是一个“有点酷有点幽默,是永远保持好奇心的理想主义者。”


在很多时候,他往往能够给予你完全不一样的答案:


比如当你有些手足无措的时候,系统的女声会为你打气加油:“不知道怎么办的时候,就按照你的直觉先干起来吧。”而智趣男声则似乎看得更清楚,他的话也更直击你的内心:“想想你自己内心想要什么,等你想清楚了就知道怎么走了。”如果是我,我也会对那些迷茫的后辈们,说出这样的答案。


再比如情场失意,女声会说出一句略带诗意,却又略显矫情的“因为成长,我们忽尔间说散就散。”但智趣男声却会为你提供更为实际的建议:“如果不甘心那就去挽回,如果看开了就祝福对方。”听到这样的话,或许有些人确实会认认真真思考,自己到底应该怎样去面对,而不是一个人躲在被窝里自怨自艾。在这个钢筋混凝土的城市森林里,人与人之间被有形或无形的墙隔着,身边有一个具备情感理解能力,与你谈心,为你分忧的语音助手,已经有种“未来已来”置身科幻世界的恍惚感。




趣味交互:

将技术化作点亮生活的“彩蛋”


小布助手的“一句话智能”让生活智能高效,全新智趣男声打造全新人设满足了闲聊与陪伴的需求,但是这并不是此次更新的全部。权威机构评价一个语音助手的受欢迎程度会用两大关键指标,一是使用率、二是依赖度,用户喜欢与语音助手闲聊的深层需求还有趣味交互功能。


这次OPPO小布助手不仅能与用户聊起来,还能玩起来。


小布助手将业界非常成熟的语音合成技术应用于音色学习,打造了自定义音色功能,用户通过20句固定短语录制便可把身边人的音色应用于全局语音播报,也可仅应用于播报天气、绕口令、土味情话等场景,实现“真人发音”的趣味体验。


图片


这些基础能力可以依据意愿满足用户被陪伴的需求,例如你可以将平日里无法时刻陪伴的他/她的声音,化作触手可及的温馨相伴。父母录制自己的声音,可以让孩子随时听见熟悉安心的声音,陪伴孩子的阅读和生活。另外,自定义音色也可以生成晚安语,通过微信、QQ等社交应用分享给他人试听,把这项充满趣味的语音合成技术应用,变成欢乐分享给更多人。


图片


另一个可以玩起来的功能“答案之书”,将经典的“解惑之书”装进了手机,交互设计上使用了充满魔法的动画,使得整个过程更加有趣、沉浸。当用户为生活中纷扰繁杂而犹豫不决时,使用唤醒词“答案之书”便可找到自己的答案:工作很累是否要坚持下去?喜欢一个人是否要表白?最近很丧,未来会好吗……给无法言表的烦恼一个回答,让小布助手在关键时刻点亮前路,激励用户勇敢生活。




总结


基于庞大的用户群体,小布助手不断深耕自然语言处理能力,小布助手高速迭代为用户提供了有趣、贴心、高效的语音助手体验。另外,语音拟真加情感理解能力升级,不仅让自己更加优秀,也为语音助手以及人工智能产品迈向未来提供了一条发展路径。


从小布助手种种过人表现,我们能够看到OPPO融合科技与人文打造产品的理念。小布助手将前沿科技应用落地到场景、融入用户生活,也让很多人看到了语音助手的另一面:它或许不像Siri、Alexa或者Google Assistant那样“洋味十足”,但它更接地气,也更懂国人的需求。在人工智能不断演进的道路上,得益于越来越多像小布这样的产品,让我们朝着“萨曼莎”这个终极目的越来越近了。



图片


『热门推荐』

图片
图片
图片
图片
图片
图片