Talk预告 | OSU博士生刘濠赫: VoiceFixer: 面向通用的语音修复

让创新获得认可 将门创投 今天
图片

本期为TechBeat人工智能社区347线上Talk。

北京时间9月30(周四)晚8点美国俄亥俄州立大学(OSU) 计算机科学与工程博士在读刘濠赫的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “VoiceFixer: 面向通用的语音修复”,届时将探讨语音修复技术方面的进展与挑战。

Talk·信息

主题:VoiceFixer: 面向通用的语音修复

嘉宾美国俄亥俄州立大学(OSU
计算机科学与工程博士在读 刘濠赫
时间:北京时间 9月30日 (周四) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

长按识别二维码,一键完成预约!

图片
图片

Talk·提纲

对数字语音中失真的修复,不论是在当今社会还是对于历史研究都有非常重要的应用意义。然而受到技术的限制,语音修复并没有像图像修复算法一样得到广泛的应用。这个Talk探讨了其中可能的原因,存在的问题以及我们的解决方案。

本次分享主要为:

1. 引述

2. 现代和历史语音修复效果展示
3. 研究背景介绍

a) 语音修复在实际场景和科学研究中的应用

b)语音信号的数学表征

c) 常见的四种语音失真及主流的处理方案

d) 主流方案中可能存在的问题

4. 当前语音修复方法存在的问题及解决方案
5. 设计VoiceFixer的脑科学启发
6. VoiceFixer模型结构介绍
7. 实验设置与讨论
8. 实验结果分析
9. 结论与未来可做的工作

Talk·参考资料

这是本次分享中将会提及的资料,建议提前预习哦!
1. Demo网站:

https://haoheliu.github.io/demopage-voicefixer/

2. 项目主页:

https://github.com/haoheliu/voicefixer_main
3. 语音修复相关文章:
Speech Super Resolution:
[1708.00853] Audio Super Resolution using Neural Networks (arxiv.org)
4. Speech Enhancement: 
[1708.07524] Supervised Speech Separation Based on Deep Learning: An Overview (arxiv.org)
5. Speech Dereverberation:
Speech Dereverberation Using Fully Convolutional Networks | IEEE Conference Publication | IEEE Xplore
6. Speech Declipping:
[1910.12116] Image to Image Translation based on Convolutional Neural Network Approach for Speech Declipping (arxiv.org)
7. 声码器相关文章:
TFGAN Neural Vocoder:
[2011.12206] TFGAN: Time and Frequency Domain Based Generative Adversarial Network for High-fidelity Speech Synthesis (arxiv.org)

Talk·提问交流

通过以下两种方式提问都将获得微信现金红包奖励哦!
方式 ①

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!图片

方式 ②

在本文留言区直接提出你的问题,或扫描下方二维码提问!

♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
图片
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩

快来提问啦!


Talk·嘉宾介绍

图片

刘濠赫

美国俄亥俄州立大学(OSU) 

计算机科学与工程博士在读

刘濠赫,目前为美国俄亥俄州立大学计算机科学与工程博士一年级在读,师从Deliang Wang教授,此前在西北工业大学获得学士学位。本科期间在谢磊老师ASLP实验室从事音乐分离的相关研究。随后在字节跳动进行语音降噪和声音修复的研究。曾在2021 ISMIR国际音乐分离大赛中取得人声效果第二名(Leaderboard A)的成绩。研究兴趣主要为音源分离和声音修复。相关成果已在INTERSPEECH, ICASSP,ISMIR等语音和声学领域主流会议上发表。

个人主页:

haoheliu (Leo) (github.com)

长按识别二维码,一键完成预约!

图片
图片

图片

如果你也想成为讲者

 自荐 / 推荐 
图片
单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~


图片

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区


报名传输门在此,即刻报名参加!

收录于话题
160
下一篇 Talk预告 | 清华大学在读博士李一鸣: 后门攻击简介