隨著人工智能和大數(shù)據(jù)技術(shù)的日漸成熟,我們可以讓過去的照片動起來、可以讓人工智能模型模仿杜甫作一首詩、可以基于一個(gè)主題生成一段視頻,也可以讓我們有機(jī)會聽到數(shù)字人模仿我們喜歡的歌手唱其他任意歌手的歌。
孫燕姿,新加坡華語流行樂女歌手,曾經(jīng)的“四小天后”之一,是很多80后、90后的偶像,與周杰倫并稱“男周女孫”,在其巔峰期卻選擇主動隱退。2021年4月27日,某網(wǎng)友在論壇中發(fā)文“推薦一個(gè)冷門的新加坡華語歌手—— 孫燕姿”,使得“冷門歌手”孫燕姿成了網(wǎng)絡(luò)熱搜話題,而孫燕姿本人也樂于接受這個(gè)稱呼。在榮獲“冷門歌手”這一“殊榮”的同年9月9日晚上,孫燕姿線上歌會1小時(shí)獲得6億個(gè)點(diǎn)贊,用實(shí)力證明了這個(gè)歌手不太冷,同時(shí)也證明了80后、90后這批粉絲依然在線。而對于00后的人群來說,孫燕姿之所以能夠被推薦,也從側(cè)面證明了好的聲音、好的音樂,是不會因?yàn)榇鷾隙У摹?/p>
孫燕姿的再次火爆,并非孫燕姿本人又發(fā)表了新的作品或者頻繁的活動,而是因?yàn)榱硪粋€(gè)孫燕姿—— “AI孫燕姿”的出現(xiàn)。
隨著人工智能和大數(shù)據(jù)技術(shù)的日漸成熟,我們可以讓過去的照片動起來、可以讓人工智能模型模仿杜甫作一首詩、可以基于一個(gè)主題生成一段視頻,也可以讓我們有機(jī)會聽到數(shù)字人模仿我們喜歡的歌手唱其他任意歌手的歌——這樣,也就誕生了“AI孫燕姿”“AI陶喆”“AI周杰倫”們。而最為火爆的“AI孫燕姿”,其在抖音、嗶哩嗶哩(以下簡稱B站)、快手等平臺上都是 “頂流”,僅在B站,“AI孫燕姿”演唱的歌曲達(dá)到100萬播放量以上的歌曲就有11首。
面對“AI孫燕姿”的出現(xiàn),孫燕姿本人表現(xiàn)得相當(dāng)佛系,回應(yīng)道:“凡事皆有可能,凡事皆無所謂,我認(rèn)為思想純凈、做自己,已然足夠。”
但是,孫燕姿本人不在意,并不代表“AI孫燕姿”不存在問題和潛在的風(fēng)險(xiǎn),粉絲們在享受科技帶給我們愉悅與便利的同時(shí),也要注意知識產(chǎn)權(quán)、肖像權(quán)、隱私權(quán)等可能存在的法律問題以及倫理道德問題,更甚者,更要注意可能存在的安全性問題。
“AI 孫燕姿”到底是一個(gè)什么樣的“人”?
“AI孫燕姿”是一個(gè)虛擬數(shù)字人,它本質(zhì)上是基于孫燕姿本人現(xiàn)有的音樂和聲音,通過數(shù)據(jù)處理技術(shù)以及人工智能模型等技術(shù),模擬孫燕姿的音色、音質(zhì)、聲線和發(fā)音方式、演唱風(fēng)格等聲音特征,生成翻唱歌曲或語音內(nèi)容的虛擬聲音模型,使用這一虛擬聲音模型,可以定制“AI孫燕姿”演唱任何歌曲。
“AI孫燕姿”是通過哪些技術(shù)實(shí)現(xiàn),或者與哪些技術(shù)相關(guān)聯(lián)呢?筆者認(rèn)為,其主要包括以下技術(shù):
數(shù)據(jù)集的采集與構(gòu)建
使用網(wǎng)絡(luò)爬蟲等技術(shù)從網(wǎng)絡(luò)采集大量孫燕姿的音樂作品以及其他音視頻文件,提取文件中的音頻數(shù)據(jù),并對音頻數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、降噪等預(yù)處理操作,得到適于模型訓(xùn)練的數(shù)據(jù)集。
自然語言處理
包括語音識別、文本切分、語義分析、語音合成等技術(shù),語音識別是將孫燕姿的原始音頻轉(zhuǎn)換為文本,文本切分是指將連續(xù)文本按特定規(guī)則分割為更小單元,語義分析是對文本單元進(jìn)行情感、類別等的語義劃分,而語音合成是使用深度學(xué)習(xí)模型生成類似孫燕姿的聲音。
模型的構(gòu)建及訓(xùn)練
將采集的數(shù)據(jù)輸入到GAN、RNN、Transformer等人工智能模型中進(jìn)行訓(xùn)練,生成高質(zhì)量語音。
音頻后期處理
對生成的音頻進(jìn)行混響、均衡等處理,使其更接近真實(shí)孫燕姿的聲音,以達(dá)到較高的聽覺效果。
科技是一把雙刃劍
“AI孫燕姿”的出現(xiàn)拓展了娛樂的邊界,但對社會也產(chǎn)生了多方面的影響。
在娛樂產(chǎn)業(yè)方面,“AI孫燕姿”展示了人工智能在音樂創(chuàng)作和表演中的巨大潛力,AI技術(shù)為人們提供了一個(gè)重要的創(chuàng)作途徑。許多我們喜歡的歌手已經(jīng)過世,通過AI手段,我們將有機(jī)會欣賞到這些優(yōu)秀歌手的新作品,歌手之間也可以隔空對唱,給我們帶來更加豐富的音樂體驗(yàn)。例如,臺灣女歌手陳珊妮的單曲《教我如何做你的愛人》,就是由其本人的AI模型生成。在江蘇衛(wèi)視2022跨年演唱會中,歌手周深和已故歌手鄧麗君通過AI技術(shù),跨越時(shí)空合唱了《小城故事》《漫步人生路》《大魚》等膾炙人口的歌曲。
在社會生活方面,“AI孫燕姿”的出現(xiàn)改變了人們對音樂和藝術(shù)的認(rèn)知。虛擬歌手的興起可能重塑粉絲文化,粉絲可以定制自己的偶像。AI技術(shù)使得音樂創(chuàng)作的門檻進(jìn)一步降低,普通人也可以根據(jù)自己對音樂的理解,創(chuàng)作出屬于自己的音樂作品。
在技術(shù)發(fā)展方面,“AI孫燕姿”的成功應(yīng)用推動了語音合成、自然語言處理和深度學(xué)習(xí)等技術(shù)的發(fā)展與進(jìn)步。這些技術(shù)不僅限于音樂領(lǐng)域,還可以應(yīng)用于如虛擬助手、智能客服和教育輔助、養(yǎng)老陪護(hù)等更廣泛的場景。
在法律建設(shè)方面,目前,我國并未確認(rèn)AI具有法律的主體資格,因此,AI的制造者以及使用者,需要受到法律的約束。雖然孫燕姿本人并沒有追究“AI孫燕姿”的作者是否侵犯了她的權(quán)利,但我們需要清醒地認(rèn)識到孫燕姿的姓名、聲音和音樂作品是受法律保護(hù)的,即便創(chuàng)作者在作品上附加了“免責(zé)聲明”,也并不能完全逃避責(zé)任。
抖音平臺在2023年5月9日發(fā)布了《抖音關(guān)于人工智能生成內(nèi)容的平臺規(guī)范暨行業(yè)倡議》,其中提到,創(chuàng)作者、主播、用戶、商家、廣告主等平臺生態(tài)參與者,在抖音應(yīng)用生成式人工智能技術(shù)時(shí),發(fā)布者應(yīng)對人工智能生成內(nèi)容進(jìn)行顯著標(biāo)識,幫助其他用戶區(qū)分虛擬與現(xiàn)實(shí),特別是易混淆場景;發(fā)布者需對人工智能生成內(nèi)容產(chǎn)生的相應(yīng)后果負(fù)責(zé),無論內(nèi)容是如何生成的;虛擬人需在平臺進(jìn)行注冊,虛擬人技術(shù)使用者需實(shí)名認(rèn)證;禁止利用生成式人工智能技術(shù)創(chuàng)作、發(fā)布侵權(quán)內(nèi)容,包括但不限于肖像權(quán)、知識產(chǎn)權(quán)等。一經(jīng)發(fā)現(xiàn),平臺將嚴(yán)格處罰。禁止利用生成式人工智能技術(shù)創(chuàng)作、發(fā)布違背科學(xué)常識、弄虛作假、造謠傳謠的內(nèi)容。一經(jīng)發(fā)現(xiàn),平臺將嚴(yán)格處罰。
此外,AI生成的內(nèi)容是否享有版權(quán),以及其版權(quán)歸屬問題,也需要法律進(jìn)一步明晰。2023年4月,杭州互聯(lián)網(wǎng)法院審結(jié)了我國首例涉及虛擬數(shù)字人侵權(quán)的案件,引發(fā)了業(yè)界的極大關(guān)注,首例虛擬數(shù)字人侵權(quán)案的判決對于我國相關(guān)案件的審理具有重要的判例意義。
在財(cái)產(chǎn)安全方面,由于AI技術(shù)可以模擬人的聲音,不法分子就可能利用這一技術(shù),對未成年人、老年人等防范意識較為薄弱的群體實(shí)施詐騙,通過模擬親人的聲音騙取錢財(cái)或者實(shí)施侵犯,這也是需要特別防范的安全問題。
在倫理道德方面,中國臺灣知名藝人包小柏在2021年痛失22歲愛女(包容),喪女之痛促使他攻讀博士研究AI技術(shù),以期通過AI技術(shù)重現(xiàn)女兒的音容笑貌。在《臺灣啟示錄》節(jié)目中,公開了其女“包容”的AI影像,女兒透過熒幕告白爸爸,催人淚下。但另一方面,AI復(fù)活技術(shù)也引起了人們對AI技術(shù)在倫理方面的思考。例如,如果公眾可以使用AI技術(shù)任意復(fù)活逝者,是否違背了公序良俗,對于逝者本人是否尊重、對于逝者親友的影響也應(yīng)加以考慮。
音樂人包小柏通過AI復(fù)刻出了“數(shù)字女兒”,以表達(dá)思念。
在專利技術(shù)方面,“AI孫燕姿”的實(shí)現(xiàn)依賴于多項(xiàng)人工智能和語音處理技術(shù),其背后可能涉及多家科技公司的授權(quán)專利。例如谷歌公司的一件授權(quán)專利是基于深度神經(jīng)網(wǎng)絡(luò)的音樂合成技術(shù),通過直接從數(shù)據(jù)學(xué)習(xí),生成樣本級別的聲音;Supertone公司的一件授權(quán)專利結(jié)合遷移學(xué)習(xí)技術(shù),使用預(yù)先訓(xùn)練的人工神經(jīng)網(wǎng)絡(luò)模型可以合成新輸入歌手的歌唱聲音;百度的一件專利通過少量語音樣本復(fù)刻特定人聲音色;以上專利在語音合成與音色克隆方面有較高影響。科大訊飛的一件專利可以通過波形生成模型進(jìn)行波形學(xué)習(xí),可以提高語音合成的音質(zhì)、音色以及自然度;Antares的一件專利是Auto-Tune技術(shù)的核心專利,用于調(diào)整音高。華為的一件專利可以通過訓(xùn)練基于BLSTM的深度神經(jīng)網(wǎng)絡(luò)模型,生成不同情感類型 情感強(qiáng)度的語音。
以上列舉的專利技術(shù)涉及了語音合成與音色克隆、音頻信號處理、深度學(xué)習(xí)模型訓(xùn)練、語音內(nèi)容生成等方面,是否會侵犯到以上權(quán)利主體的利益,如何尋求技術(shù)與法律的雙重合規(guī),也是需要思考的問題。
無意中聽到的她的歌,聲音非常有特色。查了一下,零幾年就出道了,但感覺在國內(nèi)不是很多人聽過。她的歌很棒,曲風(fēng)多變,最喜歡《遇見》和《綠光》,還有《180度》。 大家去qq音樂、酷狗都可以免費(fèi)聽。
政策需要及時(shí)跟進(jìn)
為了促進(jìn)AI音樂發(fā)展,平衡技術(shù)創(chuàng)新、藝術(shù)創(chuàng)作保護(hù)與社會倫理需求,筆者提出以下建議:
明確法律框架
制定相關(guān)法律法規(guī),明確AI音樂的版權(quán)歸屬、使用范圍、數(shù)據(jù)使用權(quán)限、利益分配規(guī)則等,鼓勵人性化執(zhí)法。
平臺監(jiān)管與懲罰機(jī)制
平臺成立AI音樂監(jiān)管機(jī)構(gòu),負(fù)責(zé)審核AI音樂生成內(nèi)容的合規(guī)性。對違規(guī)賬號采取限期整改、罰款、永久封號等措施。
倫理與創(chuàng)作規(guī)范
要求AI生成音樂必須標(biāo)注“AI制作”標(biāo)簽,避免誤導(dǎo)聽眾,對深度偽造音樂實(shí)施分級管理,限制傳播范圍。禁止AI創(chuàng)作的惡意模仿或詆毀性創(chuàng)作(如生成低質(zhì)量歌曲損害藝術(shù)家聲譽(yù)、傳播暴力、歧視性內(nèi)容、不良價(jià)值觀等)
鼓勵良性競爭
通過權(quán)威媒體宣傳合法AI音樂,鼓勵平臺舉辦“AI+音樂”創(chuàng)新大賽,鼓勵技術(shù)公司與音樂人聯(lián)合開發(fā)高質(zhì)量作品。
跨領(lǐng)域融合
尋求AI音樂與影視、教育、醫(yī)療、廣告等多行業(yè)的跨界合作,豐富AI音樂的創(chuàng)新形式。
迎接 AI 音樂的新紀(jì)元
“AI孫燕姿”的出現(xiàn)只是科技與音樂融合的一個(gè)開始。未來,隨著人工智能技術(shù)的不斷進(jìn)步,可以預(yù)見的是,更多類似的應(yīng)用將會涌現(xiàn)。例如,AI技術(shù)可以用于生成更多類型的音樂作品,與其他藝術(shù)形式(如舞蹈、戲劇)結(jié)合,創(chuàng)造出全新的藝術(shù)作品。此外,AI技術(shù)還可以用于音樂教育和治療,幫助人們更好地理解和享受音樂。隨著社會老齡化的加劇,人們也可以將AI技術(shù)應(yīng)用到養(yǎng)老服務(wù),例如可以合成親人的影音信息與老人互動,為老人提供情緒價(jià)值。
AI賦能沉浸式音樂創(chuàng)作場景,探索人機(jī)協(xié)同藝術(shù)未來。圖/AI生成
然而,未來,AI音樂在發(fā)展的同時(shí)也需要在技術(shù)開發(fā)和應(yīng)用過程中,加強(qiáng)法律規(guī)范、倫理審查和社會討論,以確保AI技術(shù)的健康發(fā)展。如何在技術(shù)進(jìn)步和藝術(shù)創(chuàng)作之間尋找到平衡,如何保護(hù)藝術(shù)家的權(quán)益和創(chuàng)作的原創(chuàng)性,如何防止AI技術(shù)詐騙等,都是需要深入探討的問題。AI技術(shù)的腳步已經(jīng)無法阻擋,我們應(yīng)該積極擁抱科技,在法律、倫理和社會共識的共同作用下,AI技術(shù)必然能 夠?yàn)橐魳樊a(chǎn)業(yè)和人類社會帶來積極的影響。
(文章來源:《創(chuàng)意世界》2025年4月號)
編校:范曉華,審讀:郭麗
/ / / / /
/ / / / /
/ /
/ / / / /
/ / / /
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.