"AI"和"音乐"的跨界合作,听起来很不可思议,但它绝非不可能。前不久,OpenAI实验室就让这一切成真了,他们推出的会自弹自唱的AI点唱机"Jukebox"将为音乐界带来不小的震动,能在短时间内写出数十首歌。
OpenAI推出了一款可以自主创作音乐的AI系统“Jukebox”(即英文中“点唱机”的意思),在吸收了曲库里成千上万的乐曲数据之后,它创造出的旋律但足以让普通听众耳目一新,如果不告诉听众这是AI做的歌曲,他可能完全听不出来。
事实上,让AI学会做音乐是一个比较艰巨的课题,主要在于AI的核心能力时数据训练和检索,而创作这一不可预知性的能力对于AI略有些"超纲"。
自动生成音乐的历史可以追溯到半个多世纪前。技师在节拍器上设定每个音符的间隔时间和音调等,让它根据固定的和弦模式来按动琴键。但是,它的局限性非常显著,捕捉不到更细微的音色、动感和音乐表现力。
现在,时代变了,人们尝试让机器在多种音乐风格中进行切换,而不止步于那几个简单的和弦。这也就是OpenAI的灵感源泉:建立庞大的数据库,让AI系统广泛接触各式各样的歌曲乐章,充分训练它的作曲能力。
在研究方法上,OpenAI的研究人员也称得上相当有创意。他们首先借助原始音频数据源来训练Jukebox模型,模型在吸收数据库后,会将这些原始音频进行适当加工,又将它们“吐”了出来,从而形成它自己的“创作”。
为了保证音乐加工过程的有效性,研究人员使用卷积神经网络对原始音频进行编码和压缩,用音频转换器生成新的压缩音频,对其进行音谱采样,再将它们转换为第二代原始音频数据库,让AI加工更便捷快速。
💽
更庞大的数据库 = 更有新意的创作输出
这种方法也被用于OpenAI的前代虚拟音乐制作系统MuseNet的研发过程当中。不过,Jukebox比前代要更智能,在加工过程中,它能够与OpenAI研究人员合作共同编写乐曲。与使用MIDI数据的MuseNet不同,这些乐段模型是在统共包含120万首歌曲的原始数据集上展开训练的,把从LyricWiki上搜集筛选得到的元数据和歌词信息添加到音频之中。
可惜的是,这款AI版点唱机还不会自己生成歌词,在歌词合成环节,必须需要人工干预。而且,严格意义上来说,它根据前人的音乐所创作的旋律,并不能算是真正的音乐,听上去还常让人颇感耳熟。研究人员有些惋惜地说:“尽管AI点唱机的‘创作’成就,在音乐质量以及对艺术家流派的适应能力方面迈出重要一步,但它与人类的音乐创作还有着云泥之别。例如,虽然歌曲保持了良好的连贯性,能够遵循传统的和弦演奏模式,产出令人印象深刻的独奏,但我们还无法期待复杂的编曲,或者人声合唱等内容。”
Jukebox的原始曲库里,势必也包含水果姐、坎爷和黄老板等当红歌手的歌曲,那么,它在再创作时,有取得这些歌曲的版权吗?这又是个难解的话题。
说了这么多,归根结底,AI点唱机仍是一个非常吸引人的技术成就,它突破了机器学习技术可能性的界限。如果你对它颇感好奇,链接在此,不妨去听听吧:
https://openai.com/blog/jukebox/
来扫我呀
关于我“门”
▼
将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
将门创新服务专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。
将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。
将门创投基金专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在近四年的时间里,将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”: bp@thejiangmen.com
将门创投
让创新获得认可!
微信:thejiangmen
bp@thejiangmen.com
点击“❀在看”,让更多朋友们看到吧~