- 下一个AI颠覆性应用发生在音乐领域?
- 2023年02月13日来源:科技日报
提要:近期,谷歌的一个研究团队发布了新的AI模型MusicLM,这是一种可将文本信号转换为音频片段的音乐生成器。继ChatGPT之后,音乐或将成为AI生成的前沿领域。这是创意AI在短短几年内创新步伐飞速的又一个例子。
过去几年里,人工智能(AI)在创意领域的应用出现了爆炸性增长。新一代图像和文本生成器不断给人惊喜。现在,AI正在下一个领域掀起浪潮。
近期,谷歌的一个研究团队发布了新的AI模型MusicLM,这是一种可将文本信号转换为音频片段的音乐生成器。继ChatGPT之后,音乐或将成为AI生成的前沿领域。这是创意AI在短短几年内创新步伐飞速的又一个例子。
传统音乐行业仍在适应互联网和流媒体服务带来的巨大冲击,AI会改变人们创作和体验音乐的方式,使音乐行业再次复兴吗?
把文字变音乐的AI“艺术家”
最近爆火的聊天机器人ChatGPT或许还无法制作音乐,但谷歌的MusicLM可以。
这一AI“艺术家”可根据不同地点、时代或要求创作音乐。其样本由指定音乐流派、音乐气氛甚至特定乐器的长段旋律组成。
当MusicLM“听到”某人吹口哨、哼唱、演唱或是演奏乐器后,能从中推断出额外的旋律小节。它可调节乐器的种类,甚至是演奏的力度。它还可创建一曲连续音乐即兴表演的“故事”,例如创作“在电子游戏中播放的电子歌曲”“在河边播放的冥想歌曲”、表达意境为“火”和“烟花”等音乐。
MusicLM甚至可产生适合视觉艺术的声音。例如,它根据萨尔瓦多·达利的名画《记忆的永恒》和雅克-路易·大卫的《跨越阿尔卑斯山圣伯纳隘道的拿破仑》的描述创建了配乐。
AI生成音乐史上的重要突破
AI生成音乐有着悠久的历史,甚至被认为是创作热门歌曲和助力现场表演的“功臣”。
在MusicLM之前,已经有其他尝试利用AI生成音乐的尝试,比如谷歌发布的AudioML和OpenAI的Jukebox,视觉和声音AI项目Riffusion则使用稳定扩散将文本提示转换为声图。还有一些AI工具可将生成式AI和音乐结合在一起,比如Voicesmod的合成歌曲生成器,它可将提交的歌词与一系列流行歌曲和AI声音进行匹配。
不过,谷歌研究人员在论文中也提到了AI音乐生成面临的各种挑战。相比从文本到图像的机器学习,缺乏配对的音频和文本数据是一大障碍。此外,音乐是“沿着时间维度”构建的,让AI了解文本表达的意图,创作出一段符合主题的持续的音乐要困难得多。
MusicLM是克服挑战的重要一步。据极客邦科技网站报道,MusicLM将有条件的音乐生成过程建模,变为分层序列到序列建模,也就是说,它使用机器学习为歌曲的不同层次生成序列,如结构、旋律和单独的声音,并在几分钟内以恒定的24千赫兹创建音乐。
AI会取代人类创作音乐吗
目前,自动化创作音乐的技术已经在快速发展。AI工具可能会给艺术家提供更好的灵感。
但众所周知,机器学习技术如同一个非常难以预测的“盲盒”。澳大利亚《对话》杂志发文称,使用AI生成音乐只是目前的一次“幸运的探险”。使用这些工具时,人们有时可能会发现黄金,但不知其中的原理是什么。艺术家们现在不得不接受“潘多拉魔盒”已经被打开的现实,就像当初合成器和电子鼓第一次出现时一样,在某些情况下,它可能会部分取代对音乐家的需求。
但目前,MusicLM还无法与人类作曲家匹敌,尤其是在歌词创作方面。美国专注于语音智能的在线媒体Voicebot.ai评论称,MusicLM生成的歌词充其量只是乱码,甚至是在胡诌。谷歌研究人员也承认,MusicLM大约1%的创作内容只是在单一地复制现有的音乐。
因担心版权风险以及道德问题,谷歌表示目前没有立即发布MusicLM的计划。有法律版权专家表示,AI系统音乐可被视为衍生作品,在这种情况下,只有原创元素才会受到版权保护。不过,如果艺术家的作品在其不知情或未经他们同意的情况下被用来训练AI系统,那么AI音乐生成器还可能面临涉及侵权的诉讼。如果没有监管,这很可能成为音乐行业的另一个灰色地带。
版权及免责声明:
1. 任何单位或个人认为南方企业新闻网的内容可能涉嫌侵犯其合法权益,应及时向南方企业新闻网书面反馈,并提供相关证明材料和理由,本网站在收到上述文件并审核后,会采取相应处理措施。
2. 南方企业新闻网对于任何包含、经由链接、下载或其它途径所获得的有关本网站的任何内容、信息或广告,不声明或保证其正确性或可靠性。用户自行承担使用本网站的风险。
3. 如因版权和其它问题需要同本网联系的,请在文章刊发后30日内进行。联系电话:01083834755 邮箱:news@senn.com.cn