讯飞影片上新!请你去苏州听小曲儿

iFLYTEK 科大讯飞 2021-12-21 18:07
冬至上新!
当AI说起了吴侬软语!
12月21日,讯飞输入法、科大讯飞苏州研究院联合蜃楼志STUDIO
推出《姑苏琐记·金缕衣》方言保护计划公益短片

《姑苏琐记》系列方言文化公益片共4集
从冬至讲起,记录姑苏不同时令下市井人家生活
通过对于传统美学与方言的认知和研究
用AI技术与影像创作唤起少时乡音记忆
重现心目中的吴语“江南”

希望通过这部短片能让更多人领略姑苏方言之美、文化之韵
戳下方一起来看!图片 
讯飞输入法
#方言保护计划 首支AI方言文化公益短片《姑苏琐记·金缕衣》为世界留下多彩乡音,传递家乡文化的美好~
短片中苏州方言旁白是由科大讯飞苏州方言语音合成系统
将方言合成出来后配音完成
为重现软糯婉约的“吴侬软语”
将AI技术和古装文艺结合在一起
此次“破圈”互动用技术手段赋予传统文化新活力

我AI说方言 交易担保 放心买 为苏州方言贡献力量

↑ 点击上方为苏州方言贡献一份力量 ↑

 
图片
AI是如何听懂,又是怎么学会说苏州话的?
 
由于方言数据稀缺,方言数据的获取渠道稀少、成本高昂,有不少方言处于衰退甚至濒危状态。

绝大部分方言也仅停留在口头上,没有形成统一的方言用字,这对方言识别也是一个比较大的挑战。

随着方言识别技术的突破,讯飞输入法、家电控制、车载等场景都有应用,让AI更懂我们的表达,帮助释放双手,带来真正的便利。
 
方言的声韵调系统比汉语普通话复杂,没有成熟的文字系统,有些使用意译,有些使用方言百读音译,有些使用方言文读音译。即使写成方言用字,多数母语者也还是看不懂。

在连续语流中由连读变调引起的声调变化研究尚不成熟,也是语音合成文本分析的最大难点。所以,在方言数据采集方面也十分困难。

科大讯飞苏州研究院联合讯飞上海研究院与合肥研究院等技术团队,持续进行语料采集与苏州方言识别、合成系统开发。

随着苏州方言专项计划的推进,已有2.2万人次参与。

由于苏州话来源多样,十里不同音,标准难以制定,又缺少母语发音人和志愿者,我们历时三年,积累千余小时的方言语料,收集苏州方言语料5.7万条
 

图片

让机器学会说方言,让发音更接近真人
 
“让机器能听会说,能理解会思考”一直以来都是科大讯飞的使命。
 
为更好保护传承各地方言,科大讯飞于2017年发起方言保护计划,通过“AI+公益”创新方言保护形式,助力乡音传续。

四年时间,利用现代技术创建“方言库”,收集150多万条珍贵方言语料,扩大方言的采集与利用的渠道,并在讯飞输入法App中实现23种方言以及3种少数民族语言的语音识别,此外完成11种方言合成和2种方言翻译,将成果普惠大众。
 
方言合成能够让机器学会说方言,让发音更接近真人。

当AI听懂了方言,便能够将声音转成文字,让不同方言不同口音的人与人之间对话成为可能。机器发出指令,机器也可以用一口地道的乡音做出答复。
 
不仅如此,方言合成还可实现全球首个多语种虚拟主播苏州方言合成播报系统,实现方言的保护和传承,推进方言落地栏目、广电日常新闻类内容的AI虚拟主播,提升内容生产效率。
 
* 特别感谢为科大讯飞苏州方言语音识别、合成系统默默付出3年的技术开发人员
* 本片BGM由自得琴社提供,在此特别鸣谢
* 数据来源方言保护计划官网

助力方言保护图片
评论区留言互动#一人一句家乡方言#吧图片