下一个对你唱Mojito的天王巨星，可能不是“人”

原创让创新获得认可将门创投今天

From: The Verge; 编译：Iris

当你感受夏天进行时，用音乐冰一杯MOJITO，为你献唱的可能不是英俊的杰伦，而是智能的AI点唱机🎶。点唱机自己作曲，各种流派都不在话下，异域风情的和弦还带着Havana的微醺味道。

"AI"和"音乐"的跨界合作，听起来很不可思议，但它绝非不可能。前不久，OpenAI实验室就让这一切成真了，他们推出的会自弹自唱的AI点唱机"Jukebox"将为音乐界带来不小的震动，能在短时间内写出数十首歌。

🎵

音乐界的"奇迹"？

「AI版卡拉OK」

OpenAI推出了一款可以自主创作音乐的AI系统“Jukebox”（即英文中“点唱机”的意思），在吸收了曲库里成千上万的乐曲数据之后，它创造出的旋律但足以让普通听众耳目一新，如果不告诉听众这是AI做的歌曲，他可能完全听不出来。

事实上，让AI学会做音乐是一个比较艰巨的课题，主要在于AI的核心能力时数据训练和检索，而创作这一不可预知性的能力对于AI略有些"超纲"。

自动生成音乐的历史可以追溯到半个多世纪前。技师在节拍器上设定每个音符的间隔时间和音调等，让它根据固定的和弦模式来按动琴键。但是，它的局限性非常显著，捕捉不到更细微的音色、动感和音乐表现力。

现在，时代变了，人们尝试让机器在多种音乐风格中进行切换，而不止步于那几个简单的和弦。这也就是OpenAI的灵感源泉：建立庞大的数据库，让AI系统广泛接触各式各样的歌曲乐章，充分训练它的作曲能力。

在研究方法上，OpenAI的研究人员也称得上相当有创意。他们首先借助原始音频数据源来训练Jukebox模型，模型在吸收数据库后，会将这些原始音频进行适当加工，又将它们“吐”了出来，从而形成它自己的“创作”。

原始音频的加工过程示意图

为了保证音乐加工过程的有效性，研究人员使用卷积神经网络对原始音频进行编码和压缩，用音频转换器生成新的压缩音频，对其进行音谱采样，再将它们转换为第二代原始音频数据库，让AI加工更便捷快速。

💽

更庞大的数据库 = 更有新意的创作输出

这种方法也被用于OpenAI的前代虚拟音乐制作系统MuseNet的研发过程当中。不过，Jukebox比前代要更智能，在加工过程中，它能够与OpenAI研究人员合作共同编写乐曲。与使用MIDI数据的MuseNet不同，这些乐段模型是在统共包含120万首歌曲的原始数据集上展开训练的，把从LyricWiki上搜集筛选得到的元数据和歌词信息添加到音频之中。

Jukebox的应用封面

可惜的是，这款AI版点唱机还不会自己生成歌词，在歌词合成环节，必须需要人工干预。而且，严格意义上来说，它根据前人的音乐所创作的旋律，并不能算是真正的音乐，听上去还常让人颇感耳熟。研究人员有些惋惜地说：“尽管AI点唱机的‘创作’成就，在音乐质量以及对艺术家流派的适应能力方面迈出重要一步，但它与人类的音乐创作还有着云泥之别。例如，虽然歌曲保持了良好的连贯性，能够遵循传统的和弦演奏模式，产出令人印象深刻的独奏，但我们还无法期待复杂的编曲，或者人声合唱等内容。”

Jukebox依赖曲库数据集来加工产出乐曲，意味着音乐界的版权纷争。知名播客主播Cherie Hu在Twitter上指出，AI版点唱机可能带来版权灾难。

（* Tip：就在不久前，著名歌手Jay-Z表示他将以抵制侵权的名义，将那些未经授权的、其原创歌曲的合成音频从YouTube上全部删除。)