“AI孙燕姿”正成为当下网络上最火的“歌手”。随着AI技术的日新月异,人们突然间就可以听到以歌手孙燕姿声线演唱的《好汉歌》和《挪威的森林》了,尽管这两首粗犷高亢的歌曲与孙燕姿本身的风格完全不搭,但经AI合成后,《好汉歌》似乎也有了吴侬软语的味道,网友们对此接受度也很高,纷纷追逐着欣赏“AI孙燕姿”带来的音乐表演。
记者发现,最近1年时间,AI歌手正成为国内众多音乐平台重点打造的项目和盈利增长点。除了目前比较受关注的版权问题外,AI歌手在技术上是如何实现的?它是否会对现实歌手的工作造成冲击?AI歌手能否独立演唱原创的音乐?带着这些疑问,记者采访了相关音乐平台和人工智能专家。
文、图/广州日报全媒体记者 武威(除署名外)
各平台热推 AI歌手获不少歌迷青睐
记者发现,最近1年来,各大华语音乐平台都在纷纷推出自己的AI歌手,目前,有些平台已经开始利用AI歌手收费。
酷狗音乐相关负责人向记者介绍,2022年6月,该公司推出基于“凌音引擎”技术、以歌手杨超越真人声音打造的首个AI歌手“超越AI”。同年9月,该公司又宣布推出“扇宝AI”“温奕心”“郑鱼”“范茹”“王茗”“童珺”“张逸辰”等7位AI歌手,形成国内首个AI歌手矩阵,类型多元,覆盖流行、国风等。今年4月13日,该公司又推出国内首个AI说唱歌手“柒月”,挑战10秒唱85个字的中文说唱极限语速。据介绍,“柒月”不仅拥有清晰的吐字和稳定的气息,还拥有完全由科技制造的独特嗓音,实现了在快节奏的音乐中能用密集的歌词演唱多变的旋律,打破了AI歌手在说唱领域的局限。
记者看到,“超越AI”的歌手主页显示,目前已经有超过158万人收听过其演绎的歌曲,可见这位AI歌手受到了不少歌迷的喜爱与支持。并且“超越AI”不仅能唱歌,还可以变身为说书人,给听众朗读小说。
记者在使用时也发现,“超越AI”所演唱的歌曲中,并非每首歌都免费,大部分需要开通“AI会员”才可以畅听,目前该平台AI会员的月卡费用为18元,季卡费用为45元。从倾听的个人感受来看,记者发现“超越AI”的演唱已经基本没有机械感,音色自然,与人类几乎无异,有时甚至能唱出一些假音。
记者还发现,如今不仅歌星的声线可以被用来建模,用户个人的声线也可以被“复刻”,从而演唱其他歌曲。酷狗音乐相关负责人告诉记者,今年初,公司基于“凌音引擎”技术推出AI音乐神器 “音色制作人”,用户可借此打造自己的AI声库,不仅能演唱各种高难度的歌曲,甚至能突破语言障碍,比如让不会讲粤语的人也能“唱”粤语歌。“即便你五音不全、普通话不标准,通过‘音色制作人’也能生成专属的音色,用AI制作不同曲风的歌曲。”该负责人告诉记者。
除酷狗外,记者发现其他音乐平台也正在AI音乐上发力。5月16日,腾讯音乐CEO梁柱介绍,本季度该平台探索了大语言模型在AIGC领域落地的多元应用,推出了“TME Studio音乐创作助手”与“音色制作人”两款产品,协助音乐人在作词、作曲、音乐内容分析与剪辑等制作环节的效率提升;而在B站,由“AI孙燕姿”翻唱的《半岛铁盒》《爱在西元前》等歌曲也突破了百万点击量;在网易云音乐上,《AI翻唱,孙燕姿》已经出了歌曲合集。
AI歌手技术已成熟 但要唱原创音乐仍有难度
“AI歌手所运用的技术其实是比较久了,我很多年前就曾带团队建模模仿过邓丽君的声音,只不过现在我们团队专心搞别的AI应用了。”提到AI歌手背后的技术,一位人工智能专家这样告诉记者。
那么,AI歌手到底是通过什么技术实现的呢?
来自琶洲实验室的人工智能领域专家张通教授告诉记者:“训练一个AI歌手实际上涉及多个领域的知识,包括自然语言处理、音频处理、音乐理论和深度学习等。目前,常见的AI歌手普遍指的是能够‘发声’的AI,并不是真正意义上具备作曲、作词、编曲能力的歌手。从这个角度出发,训练一个AI歌手所需要的就是让某一个声线去贴合歌曲的变化。”
张通表示:“事实上,多年之前兴起的虚拟歌手就是AI歌手的雏形,但传统的虚拟歌手需要人为地去调整音轨,AI歌手则通过无人工或者少人工的模型,将任意输入的声音拟合到歌曲当中。因此,做成AI歌手的关键就在于声线的提取模型与歌声的拟合模型,通过声线提取模型提取出声音中具有身份或情感辨识度的声线,再将这一种声线与我们谱好的乐章共同输入到歌声拟合的模型当中。”
酷狗音乐的相关负责人则介绍,公司的“凌音引擎”采用自主设计的深度神经网络模型,用不同语种混合建模,通过学习不同语言专业歌手的发音特点,创造出了多语种AI歌声系统,能够高度还原和复刻歌手的声音,合成逼真且富有表现力的歌声,让AI歌手演绎不同曲风的歌曲。该负责人同时介绍,“凌音引擎”技术申请了近20件发明专利,相继获得了“2022年广东省服务贸易优秀案例”“2022年数字化创新引领奖”“广州数字经济优秀案例”等奖项。
张通认为:“按照目前的技术来看,如果我们希望将某个声音迁移到一段已经有人演唱过的音乐中,这样的技术是很成熟的,并且也被广泛地运用在二次创作中;但如果我们只提供旋律音乐,而这段音乐并没有真人演唱过,那么,直接利用声线去演唱依然是当下需要克服的技术难点和亟待解决的问题。”
“听歌不只是听声音” 人类的艺术创造力难以被替代
尽管目前AI歌手的声音已经十分逼真,但记者发现,这些歌听久了之后,仍不免会呈现出一定的“机械感”,声线似乎也“永远是一个调调”。
张通告诉记者,要想改善这种状况,就需要对AI歌手的演唱增加反馈机制,不断进行优化。“首先,我们要知道AI歌手的声音是基于它的训练数据生成的,如果训练数据是高质量且多样性的人类歌手的表演,那么AI歌手就更有可能产生类似人类的声音。这包括各种风格、语言、情感状态下的人类声音。”他介绍,人类歌手在演唱时会运用各种表演技巧,如变声、颤音、强弱音等。而现在比较先进的AI歌手模型也正是采用了这些技巧,以增加歌曲的表现力。“人类歌手在演唱时会根据歌曲的情感内容调整他们的声音和表演,AI歌手若要理解歌词的情感内容,并根据情感内容调整声音,这就涉及音乐情感表达如何获取,并融入到模型中的问题。”
张通认为,从模型的角度来讲,还应该通过设计如同音乐点评或者相似的反馈机制,来对模型进行迭代优化,不断改进AI歌手的声音和表演。这可能需要人类专家的参与,以提供关于如何改进模型的指导。
随着AI歌手受到越来越多的关注和追捧,很多人担心它是否会对人类歌手造成职业冲击。对此,张通认为:“这是一个相对复杂的问题。从某种角度看,AI歌手的存在确实可能对人类歌手的职业前景产生一定的影响,尤其是在一些需要大量制作背景音乐或者需要快速生成音乐的领域;然而,我们不可忽视的一点是,音乐不仅仅是声音,它还包含了人的情感、创造力、个性特征,甚至是歌手自身的人生经历等,这些都是目前的AI技术难以完全复制的。而且,人们听音乐往往不仅是因为音乐本身,更是因为他们喜欢音乐背后的故事以及歌手的个人魅力。因此,虽然AI歌手可能会在某些领域取代人类歌手的工作,但人类在艺术层面的创造力是难以被替代的,相关技术的发展还有很长的路要走。”
AI歌手是否涉及侵权?
AI歌手是否涉及侵权?据央视报道,有法律界人士对此表示,如果仅仅是歌手的音色或者唱腔,它本身是不受著作权法保护的。但是在商标法的规定当中,声音是可以作为商标来受到保护的;但如果声音并没有注册商标的话,就难以作为商标受到商标法的保护。
不过有律师在采访中也表示,在民法典里,对声音的保护是参照肖像权保护进行的,而对肖像权保护有明确的规定——那就是不允许进行伪造。因此法律界相关人士就表示,AI歌手在未经相关授权的情况下有可能涉嫌侵权,同时,AI歌手也可能会造成故意误导、混淆或者是形成假冒别人名义等行为,这些都可能会涉嫌不正当竞争。