本期为TechBeat人工智能社区第335期线上Talk。
北京时间8月18日(周三)晚8点,字节跳动AI Lab 算法工程师—叶蓉和字节跳动AI Lab 算法研究员—董倩倩的Talk将准时在TechBeat人工智能社区开播!
Talk·信息
▼
叶蓉
董倩倩
地点:TechBeat人工智能社区
http://www.techbeat.net/
长按识别二维码,一键完成预约!
Talk·提纲
▼
端到端建模缓解了传统级联语音翻译方法的不足,但是缺少有标注的训练数据严重制约了这一研究领域的发展。一个可商用的中、英语音识别系统需要使用上万小时音频-转写平行数据训练得到,而一个商用的中到英文本机器翻译系统则需要上亿条平行句对训练得到,而目前可用于语音翻译模型训练的音频-翻译标注数据的量级只有几百小时。如何融合多源知识来提升系统性能是目前亟需考虑的问题。
端到端语音翻译的背景介绍:
· LUT:学习单语预训练模型的知识
· COSTT:利用双语平行数据的知识
· XSTnet:渐进式融合多源知识
Talk·参考资料
▼
https://arxiv.org/abs/2009.09704
[3] XSTnet
https://arxiv.org/pdf/2104.10380
▼
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
在本文留言区直接提出你的问题,或扫描下方二维码提问!
快来提问啦!
Talk·嘉宾介绍
▼
字节跳动AI Lab 算法工程师
叶蓉,字节跳动AI Lab算法工程师,硕士毕业于复旦大学。她主要研究方向为语音翻译和文本生成,并以第一作者/主要作者在ICLR/AAAI/InterSpeech等发表论文。
个人主页:
https://github.com/ReneeYe
字节跳动AI Lab 算法研究员
董倩倩,现在是字节跳动 AI Lab研究员,博士毕业于中科院自动化所听觉模型和认知计算实验室,导师为徐波研究员,曾获第一届AI Challenger比赛机器同声传译赛道冠军。她主要研究兴趣为语音翻译、机器翻译、语音识别,并以第一作者/主要作者在AAAI、ACL、COLING、IWSLT等自然语言处理/机器学习的会议上发表论文数篇,并长期担任相关会议的审稿人。
个人主页:
https://github.com/dqqcasia
长按识别二维码,一键完成预约!
如果你也想成为讲者
▼
关于TechBeat人工智能社区
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区