Talk预告 | 字节跳动AI Lab叶蓉&董倩倩: 端到端语音翻译中的知识融合方法

原创让创新获得认可将门创投今天

收录于话题

#持续上新 | Talk合辑 149

#字节跳动 5

本期为TechBeat人工智能社区第335期线上Talk。

北京时间8月18日(周三)晚8点，字节跳动AI Lab 算法工程师—叶蓉和字节跳动AI Lab 算法研究员—董倩倩的Talk将准时在TechBeat人工智能社区开播！

她们与大家分享的主题是: “端到端语音翻译中的知识融合方法”，届时将介绍她们在利用融合多源知识提升系统性能过程中所遇到的挑战和进展。

Talk·信息

▼

主题：端到端语音翻译中的知识融合方法

嘉宾：字节跳动AI Lab 算法工程师

叶蓉

字节跳动AI Lab 算法研究员

董倩倩

时间：北京时间 8月18日 (周三) 20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

长按识别二维码，一键完成预约！

Talk·提纲

▼

端到端建模缓解了传统级联语音翻译方法的不足，但是缺少有标注的训练数据严重制约了这一研究领域的发展。一个可商用的中、英语音识别系统需要使用上万小时音频-转写平行数据训练得到，而一个商用的中到英文本机器翻译系统则需要上亿条平行句对训练得到，而目前可用于语音翻译模型训练的音频-翻译标注数据的量级只有几百小时。如何融合多源知识来提升系统性能是目前亟需考虑的问题。

端到端语音翻译的背景介绍：

· LUT：学习单语预训练模型的知识

· COSTT：利用双语平行数据的知识

· XSTnet：渐进式融合多源知识

Talk·参考资料

▼

这是本次分享中将会提及的资料，建议提前预习哦！

[1] LUT

https://arxiv.org/abs/2009.09704

[2] COSTT

https://arxiv.org/abs/2009.09737

[3] XSTnet

https://arxiv.org/pdf/2104.10380

Talk·提问交流

▼

通过以下两种方式提问都将获得微信现金红包奖励哦！

方式 ①

在Talk界面下的【交流区】参与互动！留下你的打call🤟和问题🙋，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

方式 ②

在本文留言区直接提出你的问题，或扫描下方二维码提问！

快来提问啦！

Talk·嘉宾介绍

▼

叶蓉

字节跳动AI Lab 算法工程师

叶蓉，字节跳动AI Lab算法工程师，硕士毕业于复旦大学。她主要研究方向为语音翻译和文本生成，并以第一作者/主要作者在ICLR/AAAI/InterSpeech等发表论文。

个人主页：

https://github.com/ReneeYe

董倩倩

字节跳动AI Lab 算法研究员

董倩倩，现在是字节跳动 AI Lab研究员，博士毕业于中科院自动化所听觉模型和认知计算实验室，导师为徐波研究员，曾获第一届AI Challenger比赛机器同声传译赛道冠军。她主要研究兴趣为语音翻译、机器翻译、语音识别，并以第一作者/主要作者在AAAI、ACL、COLING、IWSLT等自然语言处理/机器学习的会议上发表论文数篇，并长期担任相关会议的审稿人。

个人主页：

https://github.com/dqqcasia

长按识别二维码，一键完成预约！