AI的风终于吹到音乐圈“宫保鸡丁”唱起来
AI的风终于吹到音乐圈“宫保鸡丁”唱起来“这是它写的歌词?包括伴奏吗?”听完作品,在被介绍Suno V3的使用方法后,李亮华连续追问:“演唱,混音,伴奏,还有整个作品都这样搞出来的,还是说只写了词跟曲?”
李亮华是湖南第一师范学院作曲老师,也是湖南省创作委员会副会长兼秘书长,曾与韩磊、杨洪基、杨丽达等歌唱家合作。而现在,他还多了一重新的身份——一名小有名气的网红。在短视频平台上,李亮华会将征集而来的粉丝投稿作品演唱和点评。他还提到他自己,他现在也用AI人声录歌,他抖音上发的部分作品,就是用AI唱的。
在得到肯定回复,并得知正在播放的歌曲从伴奏、歌词、人声、编曲都是由AI在获得关键词数秒内生成后,李亮华感叹道:“和真人没什么区别了,能超越我们99%的人了,我预测 AI在10年之内会干掉我们大部分作曲的。”
3月22日,AI音乐生成软件Suno发布了V3版本。我们体验发现,用户通过输入关键词,几秒内便可制作出2分钟时长的成品音乐。这些关键词可以指定如摇滚、重金属、中国古风、流行、乡村等音乐风格,也可指定如吉他、钢琴、二胡等伴奏乐器。毫无乐理知识的普通人,也可快速生成自己想要的音乐。一经发布Suno V3便引起热议,截至发稿前官宣Twitter已有30w+互动量。
“请写一首歌,描述一个青年追求梦想的故事,吉他,摇滚,鼓,勇敢,克服困难。”我们打开Suno主页,输入了这些需求,然后点击“Create”键。静等几秒,一首歌曲就完成了。这首被AI创作的歌曲,已完成制作曲谱、填入歌词、匹配人声、系统编曲等步骤,算得上一首成品歌曲。
从得到的这首歌来看,曲风基本符合我们的需求。有趣的是,Suno V3每次会同时生成2个版本的音乐作品。用户可以根据自己的喜好选择自己中意的版本,还可以接着这2分钟继续创作,也可以将其以音频和视频下载下来。
按照同样的步骤,我们指定以《将进酒》为词,以“中国古风”“古筝”为关键词作了一首中国风的歌曲。
在使用的过程中,我们发现,Suno有两种音乐合成模式选择,即Custom Mode(自定义模式,可输入歌词)和Instrumental(生成纯音乐)。用户可以选择生成歌曲,也可选择生成纯音乐。具体来看,自定义模式中,用户可由AI生成歌词,也可以自己输入特定歌词,比如我们上文中提到的以《将进酒》为词所做的歌曲,还有网友在Suno V3制作出的《水调歌头》都是由用户输入特定歌词生成的歌曲。
截止到3月26日,在Suno制作库排行榜中,收听量排名第一的是中文摇滚歌曲《We Go!》,生成关键词为heavy metal(重金属),hard rock(硬摇滚), guitar(吉他),bass(贝斯),drum(鼓),powerful(有力的),aggresive(昂扬)。
李亮华对这首歌表示震惊,他说AI在音乐创作方面确实是进步很大,甚至称赞从伴奏制作、后期混音到演唱与真人几乎没什么区别了。
据了解,通常一首歌曲的制作需要经历灵感获取、写谱、填词、编曲等一系列流程,大致需要历时1~2个月左右,成熟的职业作曲致1~2天也可完成,一张专辑的完成常常需要以年为单位来计算。而Suno V3将音乐创作周期从“年月日”压缩到了“秒”。
对于这首摇滚歌曲《We Go!》,李亮华点评表示:“Suno在歌词方面,还是有一定欠缺,整篇歌词的排布显得十分空洞、生硬,比其对标的、现在市面上优秀的摇滚曲歌词,还有一定差距。”
原创歌手、音乐制作人极光旅客与李亮华的观点相似。他这样说道:“这首《We Go!》是一首中规中矩的简单摇滚乐,歌曲中的乐器音质基本还原了演出现场乐器的声音,这比以往常规音乐制作软件中的音质要真实很多,但目前在Suno听到的歌曲风格相对人工制作来说比较单一,节奏也比较平淡。”
截止到3月26日,该榜单排行前五中的其他四首歌曲,分别为《Guys what is wrong with my cat》《Deep Night》《Ein neuer Beginn》和《宫保鸡丁》。其中《宫保鸡丁》是以菜谱为词谱出的歌,配合AI人声演唱反差感十足。
流行歌手杨凯杰表示,目前听到的这些AI合成音乐作品听起来很耳熟,相对来说比较粗糙,还无法达到发行的标准。AI生成音乐是基于一定的数据训练并重组来生成歌曲,能够轻松生成大量类似作品的同时,也呈现出了高度的同质性。
尽管Suno V3的问世让大家惊叹AIGC的神奇,但Suno此前的版本却并不尽人意。2023年12月21日,为庆祝《海贼王》动画25周岁生日,制作方WIT STUDIO公司决定筹划重制《海贼王》“东海篇”。为此,作者尾田荣一郎制作了贺曲《YO-HO-HOおれ達海賊》。而该首曲子便是尾田借助Suno版本所作出来的。
然而,曲目一经官方发布便被网友吐槽歌曲过于AI化,旋律的编排、简单的歌词充斥着机械的声音,部分网友甚至因此开始动画。
但尾田所使用的Suno并非近日的新版本,而是V2版本。根据Suno官网的详情页面显示, 本次发布的最新V3版本,主要完成了这三点迭代:
AI进入音乐行业最早可以追溯到上个世纪。20世纪60年代,部分音乐人开始以计算机编程的形式来实现对于音乐旋律的搭建;到了90年代,人工智能技术开始能够制作出部分乐器的声音。
2001年英国爱丁堡大学的爱默生发布了E-MI,自此各式各样的AI音乐制作工具开始逐步成型和发展。当下,音乐人们在进行歌曲创作时,基本都会借助AI音乐制作软件。
AI合成音乐需要攻破多个困难,这是由于音频不像文字那样是离散的形态,声音是一串波型的连续信号。据Suno V3的联合创始人之一Mikey Shulman表示,因为高质量音频的采样率通常为44Khz或48Khz,这意味着“每秒48000个token”。
自2022年末ChatGPT横空出世开始,过去一年多,人工智能在文本、图像、视频生成等多个领域都呈现出落地与应用化的趋势。今年年初,Sora问世后,外界更是将其视为“带入AI 2.0新”的代表。
据《滚石》杂志报道,Suno创业团队目前仅12人,成立不到两年,其中四位联合创始人分别为Mikey Shulman、Martin Camacho乐鱼官网、Georg Kucsko 和 Keenan Freyberg。这四人都是机器学习方面的专家,此前曾共同就职于人工智能企业Kensho。其中,Shulman和Camacho还是音乐家,常常一起即兴演出。在 Kensho 公司任职时,四人所在的团队负责转录技术的研发,主要是转录上市公司的财报电话会议。
在合力工作中,四人都对于音频的开发技术产生了浓厚兴趣。他们组成初创团队推出的第一个产品是一个文本转语音程序,产品名为“Bark”。在该产品发布后他们对于用户进行了调研,发现大多数的用户真正想要的并非文本转语音之类的技术,而是期待音乐创作方面的技术。
后来四人察觉到,人工智能在文本、图像、视频生成等多个领域的表现十分抢眼。文本生成图片、文本生成视频领域的多模态大模型正进行着如火如荼的革新,而AIGC在音乐创作方向似乎还没有相应成熟的技术,于是四人开始着手对Suno的研发。“我们开始进行了一些初步的实验,结果看起来非常有前景。”Shulman在采访中这样说道。
Suno的创始人们多次表示,他们想创造的是一个“音乐创造门槛极低”的世界,并设想全球有10亿人每个月支付10美元就能用Suno创作歌曲。
AI在音乐行业中的使用并非新鲜事儿。其实此前也有其他AI生成音乐的产品,比如Adobe的Project Music GenAI、YouTube的Dream Track等。李亮华在采访中表示,20年前自己就开始用AI生成乐器、伴奏了,但也只是部分乐器、人声AI生成,还是需要人工操作相当多的编排程序,像Suno这样的“一条龙”服务在过去是完全没有的。
李亮华还说道,近些年随着AI音质的提升,他在为学生们上课时也会提到,“再过几年,大部分歌手也要下岗了”。
“随着数据库的更新、技术的迭代,AI将在未来5~10年内‘干掉’作曲人。”李亮华认为,AI显然为业内人士敲响了警钟,但他同时也提到,即便AI技术再升级,永远有1%是无法被替代的,这1%的来源也正是音乐行业的核心部分:创造力。
此外,杨凯杰还谈到,AI合成音乐可能会将音乐创作过度商业化,这完全本末倒置了。他认为音乐创作很多时候是主观的、能动的、感性的,是自己的生活记录和情感抒发。机器与人之间的最大区别往往就在于人文情怀,再好的词曲也比不上“周杰伦”三个字在听众心中的存在意义,再无瑕的人声演绎也难以与Taylor Swift演唱会现场的万合唱相比较。
“AI未来会超越99%的人类,但我不怕它,我反倒期待AI在音乐行业后续的发展,这敦促着音乐人、音乐行业的进步,或许可以进入一种良性循环。”李亮华总结。
值得注意的是,Suno V3对于著作权的归属问题在官网做了详尽的描述与规定,同时为了防止模型作品被滥用,还开发了专有的无声水印技术,用以检测歌曲是否是使用Suno创作。
根据官网介绍,目前Suno平台向用户免费开放。不过存在一定限制,每位用户每天最多可免费获得50个积分,用户利用这50积分可创作出10首音乐,但这类用户不能将制作出来的音乐用于商业盈利用途。如果用户订阅Suno的Pro计划,每月支付8美元,每天便能最多制作500首歌曲,并且还可以将这些歌曲用于商业用途,例如上传至YouTube、Spotify或Apple Music等平台。