- 編輯部 整理自 AIGC峰會
- 量子位 | 公眾號 QbitAI
AI音樂創作正掀起普惠浪潮。人人都能玩一點音樂的時代正在到來。
趣丸作為AI音樂大模型賽道的獨角獸,憑借其自研「天譜樂」,正在讓藝術創作的門檻變得觸手可及。
在本次第三屆AIGC產業峰會上,趣丸科技副總裁賈朔分享了這樣的觀點:
- AI對于音樂是硬幣的兩面,AI取代了重復性的音樂工作流,也讓真正的音樂創作者化繁為簡,擁抱技術紅利。同時,國產AI音樂的歌聲自然度已經突破音樂“圖靈測試”,效果超越美國頭部模型。
為了完整體現賈朔的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啟發。
中國AIGC產業峰會是由量子位主辦的AI領域前沿峰會,20余位產業代表與會討論。線下參會觀眾超千人,線上直播觀眾320萬+,累計曝光2000萬+。
話題要點
- 技術突破推動音樂產業從專業創作向“人人可創作”范式轉移。
- 國產AI音樂的歌聲自然度效果已超越美國頭部模型。
- AI不會完全替代人類創作者,而是作為輔助工具提升創作效率。
- 營造開放的行業生態,有助于賦能產業上下游方。
以下為賈朔演講全文:
AI讓音樂創作者化繁為簡
我從音樂賽道的產業視角出發,跟大家分享一下AI對音樂產業影響的觀察,并且分享一下我們自身探索的一些案例。
2024年對于AI音樂模態的發展是比較重要的節點,音樂是在文字、圖片、視頻后,跨越了GPT之后智能飛躍的節點。之前要創作音樂是門檻很高的事情,但去年隨著Suno 3.5出來,技術門檻、創作門檻被極大降低。
這個事實發生之后,從科技普惠的視角來說,這是一件蠻令人興奮的事情。如果從音樂行業的視角來看,這其中既有興奮、機遇,同時也包含了危機、挑戰。所以我跟很多從業者交流的時候,發現大家不約而同會拋出這么一個問題——
在AI帶來的變量下,未來的五年音樂行業可能會如何被AI改變?
因為是否改變已經不是問題了,是一個確定性的結論,只是說會如何改變。我把這個問題問了一下DeepSeek,因為現在遇事不決先問一下DeepSeek怎么看。
這里DeepSeek給的回答很有意思,僅供參考。我覺得也提供了大致的思考框架,首先確實讓音樂創作這件事情變得非常普惠,并且讓原來一個相對來說復雜、專業的創作流程,隨著AI技術發展發生了很大的變化。
在消費體驗上,過往更多的普通人跟音樂進行交互,只能通過一些像類似聽歌這種體驗,而未來將會有更多從創作切入的玩音樂的方式。
這里DeepSeek也說了,挑戰和機遇是并存的,那可能的風險是什么?
大家如果關注各種媒體報道的話,也經常聽到,動不動就是一個新AI模型發布要讓多少人失業了,或者對音樂人的工作和未來發展造成巨大沖擊。
我們也收集整理了海外智庫關于音樂發展的一些預判,根據他們的觀點,音樂行業里面有很多細分的工作,確實在未來五年的時間內,會或多或少地被音樂模型帶來不小的沖擊跟改變。
從滲透率的角度來說,可能從智庫的觀點,相當一部分工作都會被AI參與,甚至是替代。并且可能當中的一部分用例也會影響一部分音樂人的收入,包含娛樂音樂、氛圍音樂。部分游戲領域BGM創作的群體,有較高概率會被AI影響甚至替代。
一個硬幣也有兩面,我們會看到,雖然有一部分相對來說可能簡單或重復度高的工作有可能會被AI介入,甚至是局部替代。但還有很多工作其實會隨著AI的輔助方式的介入,而大大地提效,并且從而提高創作的效率跟質量。
所以在這塊也能看到,傳統音樂制作里面,無論是創意的獲取、還是編曲編排等方面,我們也看到有較高的可能性會以AI輔助的方式來幫助到音樂人。
站在2025年應用元年的時間點,我們也想分享一下,從一個行業從業者的角度,我們看AI有可能以什么樣的方式,去對這個產業做出一些正向的影響。
大家在媒體上看到一些比較吸引眼球的,往往是一個完整的AI數字人來唱歌,這種效果固然會引起很多的關注,但事實上我們也相信,其實有很多AI的產業化的應用,有可能是以潤物細無聲的方式在背后默默進行的。
這里也給大家分享一個案例,這個案例發生在今年年初的小年夜,在國家級舞臺中國網絡視聽盛典上其中的一個節目,就是以我們的AI音樂模型天譜樂作為詞曲創作,并且與人類藝術家共同演唱的作品。
在這里我們也可以看到AI完全取代人類唱作的另外一種可能,我們認為AI更有可能作為輔助的方式幫助現有的從業者、創作家,以更低的成本、更快的速度去完成更高質量的藝術創作。
以這次舞臺表演為例,以AI的方式創作的提效提速的比例,我們初步估算至少是在10倍以上,我們也看到這樣一種新的可能性。AI的應用與傳統的產業不是一個替代跟競爭的關系,更有可能是協助產業升級的方式。
音樂最打動人的部分往往是人聲部分,這也是大家去認識和評價一首歌非常重要的一部分。但音樂帶有一定的主觀性,很難像其他大模型領域,靠題庫打榜的方式證明自己SOTA的技術效果。
但我們也找到一種方式,我們邀請了音樂專業的一些學生用盲測的方式。所謂盲測,就是事先不知道這個作品來自哪個模型,以同樣的方式、同樣的prompt生成,讓專業的從業者去做打分對比。
在相應的打分結果出來后,會發現天譜樂大模型,尤其在中文人聲唱詞層面的效果,如果跟美國領先的SUNO模型相比有一定的優勢,并且大多數評測者其實已經較難區分人聲是機器還是真人。
以上是我們模型能力的效果。當然雖然有自研的模型能力,但我們更多認為趣丸科技是一個有模型能力的應用廠商,應用層也是2025年趣丸探索的重要方向。
從產業視角看,雖然AI音樂生成效果已經非常領先和優秀,但還有一些問題得不到從業者的認可。
我跟很多音樂人交流的時候,發現大家都有一個共同的問題,或者比較排斥AI的地方,即AI更多是類似盲盒式的創作方式,就是所謂的搖歌——更多的是靠多試、多篩去找出符合自己想要效果的音樂。
這種方式可能對于音樂這種特殊的媒介來說,并不符合行業的創作習慣,以及音樂人的創作直覺。經過跟大量音樂人的交流,我們拿出了我們的解決方案,我們以尊重傳統音樂人對于MIDI電子編曲的音樂方式作為切入點,同時讓音樂人的核心旋律、創意作為音樂的骨干,由AI輔助幫助音樂人去快速地生成完整的作品。
我們既保留了AI創作的提效部分,同時我們讓整個音樂最核心的創意部分,也就是曲的創作部分,還是交由藝術家來做最核心的創作,這就是我們提到的價值主張。
我們還是希望在藝術創作這件事情上,應該由人類把握最終的方向盤,而不是由AI托著人類去跑,這個是我們想要對這個產業做出的一點貢獻跟改變。
剛才提到了天譜樂具備的音樂能力,我們在過去幾個月模型發布后,也接收到很多從業者朋友們來咨詢我們,他們問我們有沒有考慮把能力開放出來?當時我想好像確實也沒有什么理由不開放出來。
所以我們在今年早些時候已經上線了API開放平臺,來公開AI音樂的生成能力。
近期我們會把更多的能力做上線和賦能,包括前面演示的完整的歌曲生成能力,能夠達到唱片級的完整效果,同時還有深受影視行業歡迎的純音樂能力的創作。我們現在使用這個能力的合作方,也包括在好萊塢的一些影視制作公司。
另外像二次編輯、音色控制、音色克隆的能力,我們也會逐步開放跟提供。我們希望通過這些能力的開放,能夠幫助到更多對音樂有需求的產業上下游方,能夠更加普惠地享受到技術升級帶來的能力變化。
關于趣丸科技
趣丸科技于2014年12月正式成立,從移動互聯網時代到AI時代,趣丸科技已在深耕多年的AI語音、AI音樂等領域均有落地應用。
在AI音樂領域,去年7月他們發布了全球首個多模態配樂大模型——天譜樂AI。天譜樂從一上線就全面接入了其旗下應用唱鴨APP,并向所有用戶開放。
作為自研的音樂大模型,天譜樂在多模態的音樂生成、中文人聲的歌曲生成、錄音棚級的精確編曲等方面能力表現突出。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.