文 | 闌夕
出道即巔峰,又一款純正中國(guó)血統(tǒng)的大模型,跑出了SOTA(當(dāng)前最佳水平)的分?jǐn)?shù)。
昆侖萬(wàn)維發(fā)布的音樂(lè)大模型Mureka O1,在音樂(lè)生成品質(zhì)的評(píng)測(cè)上,全面超越作為行業(yè)領(lǐng)頭羊的Suno——相當(dāng)于ChatGPT在文本大模型的優(yōu)勢(shì)地位——成了又一個(gè)空降而來(lái)的「新王」。
當(dāng)然,和普通大模型通常通過(guò)做題的準(zhǔn)確率來(lái)對(duì)比能力差異不同,音樂(lè)內(nèi)容的好壞缺少完全客觀的評(píng)判標(biāo)準(zhǔn),所以昆侖萬(wàn)維也做到了力所能及的公平:
在最新的音樂(lè)評(píng)測(cè)中,Mureka O1展現(xiàn)出卓越的音樂(lè)品質(zhì),在最終的整體聽(tīng)感評(píng)測(cè)超過(guò)了Suno V4。
圖丨Mureka O1在主觀測(cè)評(píng)中整體聽(tīng)感超越Suno V4
而在 發(fā)音唱對(duì)率、樂(lè)段準(zhǔn)確率、文本相關(guān)度、制作質(zhì)量等客觀指標(biāo), 多個(gè)維度上,Mureka O1都完全勝過(guò)了目前市場(chǎng)份額最高的Sonu V4,讓海外的AI技術(shù)圈再次發(fā)出了靈魂三問(wèn):
圖丨Mureka O1在文本生成音樂(lè)的客觀測(cè)評(píng)中得分
這是誰(shuí)?哪兒來(lái)的?怎么辦到的?
怎么說(shuō)呢,疑惑的起點(diǎn)都是傲慢,從看不到中國(guó)AI的奮起,到不關(guān)心大廠以外的突破,這筆認(rèn)知債務(wù),還有很長(zhǎng)時(shí)間要還。
作為一家上市公司,昆侖萬(wàn)維沒(méi)有所謂「2VC」的敘事需求,它對(duì)AI的研究投入,一方面是對(duì)技術(shù)創(chuàng)新的敏感,另一方面也是自身業(yè)務(wù)的延伸。
早在3年前,昆侖萬(wàn)維就用AI生成的音樂(lè)和圖形為旗下游戲業(yè)務(wù)做了降本增效——2萬(wàn)塊錢的一首BGM版權(quán),被5塊錢的AI成本頂替——這種基于現(xiàn)實(shí)需要的回報(bào),客觀上也為昆侖萬(wàn)維的AI版圖去掉了表演性質(zhì)。
昆侖萬(wàn)維的創(chuàng)始人周亞輝每年都會(huì)在朋友圈銳評(píng)各家公司的AI表現(xiàn),并經(jīng)常流傳出媒體喜聞樂(lè)見(jiàn)的金句,比如「字節(jié)跳動(dòng)2023年的AI戰(zhàn)略不及格,但并不影響它在2024年的AI戰(zhàn)略能打滿分。」
而在對(duì)自家公司的評(píng)價(jià)上,周亞輝用了一個(gè)自創(chuàng)的詞組:「小而大美」。
昆侖萬(wàn)維的市值,在500億人民幣左右,真要和全球互聯(lián)網(wǎng)大廠正面硬剛,顯然沒(méi)有多少勝算,但在周亞輝看來(lái),昆侖萬(wàn)維的AI進(jìn)展不是「小而美」,而是「小而大美」,大在哪兒?
大在全球,大在對(duì)AI商業(yè)化上游的卡位。
如果在YouTube搜索Mureka,就能發(fā)現(xiàn)已經(jīng)有很多創(chuàng)作者在用這款產(chǎn)品創(chuàng)作音樂(lè)了,這和很多AI概念產(chǎn)品的擴(kuò)散路徑——先由技術(shù)社區(qū)引爆,再去尋找應(yīng)用場(chǎng)景——還不太一樣,是市場(chǎng)先行、「炸裂」后至。
這和昆侖萬(wàn)維的海外業(yè)務(wù)早已打下基底有關(guān),語(yǔ)音社交應(yīng)用StarMaker是中國(guó)互動(dòng)娛樂(lè)出海的標(biāo)志性產(chǎn)品,全球幾千萬(wàn)人擠在里面唱歌打榜,對(duì)于音樂(lè)創(chuàng)作者會(huì)在多大程度上為生產(chǎn)力買單,熟念于心。
在這波AI浪潮襲來(lái)之前,StarMaker就在自己做語(yǔ)料庫(kù)了,單個(gè)小語(yǔ)種每個(gè)月要花幾百萬(wàn)美元,這種積累,也相當(dāng)于昆侖萬(wàn)維在今天闖入音樂(lè)大模型的「合法外掛」,當(dāng)一個(gè)高等級(jí)玩家出現(xiàn)在新手村,任何動(dòng)作都會(huì)是降維打擊。
于是就有了Mureka O1的順利登頂。
某種程度上,Mureka O1會(huì)讓海外的AI從業(yè)者內(nèi)心生出「快別卷了」的無(wú)奈,因?yàn)樗堑谝粋€(gè)引入思維鏈(Chain-of-Thought)的音樂(lè)大模型。
思維鏈就是OpenAI o1和DeepSeek-R1為大模型行業(yè)帶來(lái)的第二條進(jìn)化曲線,通過(guò)教會(huì)大模型推理能力,在預(yù)訓(xùn)練陷入瓶頸之后重新解決了智能不再提升的問(wèn)題。
不過(guò)思維鏈幾乎只被用在文本大模型領(lǐng)域,從來(lái)沒(méi)有在音樂(lè)大模型有過(guò)嘗試,而昆侖萬(wàn)維實(shí)現(xiàn)了讓Mureka O1像一個(gè)真實(shí)的唱作人那樣,用經(jīng)驗(yàn)和思考——而非直覺(jué)——來(lái)譜曲寫歌。
在已經(jīng)發(fā)布的論文里,Mureka團(tuán)隊(duì)意識(shí)到傳統(tǒng)自回歸模型在生成音頻時(shí)的局限性,也就是遵循Transformer的預(yù)測(cè)模式,只能按順序吐出音符(Token),而在開(kāi)創(chuàng)了思維鏈之后,Mureka O1可以在生成之前就對(duì)整體作曲結(jié)構(gòu)做出計(jì)劃和梳理,大幅提高音樂(lè)的連貫性。
而這正是現(xiàn)階段音樂(lè)大模型最深的痛點(diǎn),沒(méi)有之一。
簡(jiǎn)單來(lái)說(shuō),以Suno為代表的舊式音樂(lè)大模型,在創(chuàng)作音樂(lè)時(shí)很容易出現(xiàn)「有曲調(diào)而無(wú)旋律」的特點(diǎn),有曲調(diào)意味著這確實(shí)可被辨識(shí)出是一首音樂(lè)作品,無(wú)旋律則說(shuō)明和那些真正由人譜寫出來(lái)的音樂(lè)相比,AI的工作成果不夠動(dòng)聽(tīng),沒(méi)有朗朗上口的藝術(shù)審美。
這和文本大模型被詬病的地方是一致的,看起來(lái)AI很能寫作,吐起詞句來(lái)連綿不絕,卻在很多時(shí)候經(jīng)不起細(xì)看,因?yàn)槎哑龊圹E過(guò)重,給人「AI味」太濃的觀感,更嚴(yán)重的指責(zé),甚至將AI生成的作品稱作是「尸塊」。
而Mureka O1提供的推理能力,可以讓AI站在全局的視角規(guī)劃一首音樂(lè)從無(wú)到有的構(gòu)建過(guò)程,避免「走一步算一步」的強(qiáng)行成分,這在實(shí)際體驗(yàn)上再造了魔法般的美學(xué)功底。
比如這首放克風(fēng)格的音樂(lè)作品「Hands up high」,你們聽(tīng)完一定會(huì)和我產(chǎn)生同樣的驚訝,不止是完整度,連同旋律構(gòu)思和歌詞卡點(diǎn),包括逼真的人聲唱腔,幾乎都不再有AI生成時(shí)那種揮之不散的電子感,達(dá)到了可以發(fā)行的地步:
還有充滿自由氣息的歡快的鄉(xiāng)村歌曲:
置身于海灘的充滿激情的拉丁歌曲:
充滿未來(lái)感的賽博電子舞曲:
我自己 也用Mureka O1寫了一小段音樂(lè),用電影「指環(huán)王」里阿拉貢在最終決戰(zhàn)前的陣前演講作為填詞,雖然做得簡(jiǎn)單潦草,但是那句「But it is not this day」的停頓和轉(zhuǎn)折,已經(jīng)相當(dāng)驚艷了,我沒(méi)有輸入任何提示詞引導(dǎo),純粹是Mureka O1自己做出的判斷。
從個(gè)人體感來(lái)看,Mureka生成一首完整音樂(lè)的速度在50秒左右,8美金/月的最低檔會(huì)員價(jià)格,對(duì)應(yīng)400首音樂(lè)(V6模型)或者80首音樂(lè)(O1模型),平均「單曲成本」只有0.02美金或者0.1美金,可以說(shuō)是白菜價(jià)了。
考慮到Mureka對(duì)于訂閱用戶生成的AI音樂(lè)都提供了商用授權(quán),這是意味著普通人也能獲得每年超過(guò)5000首音樂(lè)的創(chuàng)作能力,無(wú)論是自用還是上傳到Spotify等流媒體平臺(tái),對(duì)于數(shù)字音樂(lè)市場(chǎng)的沖擊將是空前絕后的。
這里可以插入一個(gè)也許有些反直覺(jué)的數(shù)據(jù),那就是全球音樂(lè)市場(chǎng)的產(chǎn)值,其實(shí)是比全球電影市場(chǎng)還要略高的,這是一個(gè)300億美金的盤子,而且集中度偏高,僅是環(huán)球、索尼、華納三大唱片公司,就占到了錄制音樂(lè)市場(chǎng)份額的60%以上。
和視頻大模型的發(fā)展類似,音樂(lè)大模型的顛覆性也在于雙線作戰(zhàn):不只是給素人創(chuàng)作者賦權(quán),還能為專業(yè)創(chuàng)作者增效,還是那句老話,AI不會(huì)直接取代人,而是用AI的人會(huì)取代不會(huì)用AI的人。
就像今天幾乎已經(jīng)沒(méi)有工程師不在用Cursor寫代碼,Mureka對(duì)于音樂(lè)制作人而言,有著純粹的暴力美學(xué)價(jià)值,比如基于一小段音符「填補(bǔ)」音樂(lè),或是將歌曲反編譯為詞干,這些原本需要投入大量智力勞動(dòng)的工作,都能交給Mureka以近乎無(wú)限的生成資源供給選用。
A16z曾經(jīng)發(fā)過(guò)一篇關(guān)于AI音樂(lè)的前瞻報(bào)告,認(rèn)為音樂(lè)產(chǎn)業(yè)非常適合AI的貨幣化,因?yàn)檫@里有著高度成熟化的商業(yè)鏈路,分賬模式也相對(duì)穩(wěn)定,這種確定性,讓從業(yè)者們?cè)敢鉃樯a(chǎn)力的提高支付費(fèi)用。
這大概就是周亞輝所說(shuō)的「小而大美」真正的意思,以盡可能小的機(jī)會(huì)成本,切入相對(duì)大且確定的增值市場(chǎng),和文本的量級(jí)相比,全世界古往今來(lái)的所有音樂(lè)曲目,只有4000萬(wàn)首,對(duì)應(yīng)繁榮的商業(yè)市場(chǎng),訓(xùn)練起來(lái)的性價(jià)比很高。
在Mureka之外,昆侖萬(wàn)維還在海外做了AI短劇平臺(tái)SkyReels,同樣是以打掉90%以上生產(chǎn)成本的方法,刺激供給端的爆發(fā)。
加上TikTok等短視頻平臺(tái)已經(jīng)新創(chuàng)了洗腦神曲和BGM模版的經(jīng)濟(jì)體系,新的生產(chǎn)關(guān)系,一定會(huì)長(zhǎng)出新的音樂(lè)創(chuàng)作者,他們所用的工具,也并非必須和傳統(tǒng)創(chuàng)作者保持一致。
畢竟,從智人時(shí)代開(kāi)始,越早掌握先進(jìn)工具的人類,越能取得物種進(jìn)化的優(yōu)勢(shì),尼安特人的石器制作技術(shù)曾經(jīng)一度領(lǐng)先,但在幾十萬(wàn)年里沒(méi)有任何改進(jìn),但智人已經(jīng)在舊石器晚期已經(jīng)開(kāi)發(fā)出了可投擲的標(biāo)槍和箭矢等復(fù)合工具,最終幫助智人在競(jìng)爭(zhēng)中取得了勝利。
兩年前,孫燕姿寫了一篇文章回應(yīng)「AI孫燕姿」的泛濫,她的態(tài)度很有意思,混雜著自嘲和看戲——「此刻,我覺(jué)得自己就像一個(gè)吃爆米花、坐在電影院最好的位置上的人。」
當(dāng)時(shí),距離Suno的發(fā)布還有半年時(shí)間,所謂AI音樂(lè)的生產(chǎn),主要還停留在「臨摹」的層面,也就是復(fù)制音樂(lè)人的聲線,讓「她」去唱?jiǎng)e的歌曲,還沒(méi)有達(dá)到原創(chuàng)的地步。
但是孫燕姿已經(jīng)敏銳察覺(jué)到技術(shù)發(fā)展的一日千里——這份敏銳甚至超過(guò)了大多數(shù)行業(yè)人士——她說(shuō)可能有人會(huì)反對(duì)AI音樂(lè)的影響,認(rèn)為自己能夠分辨出區(qū)別,因?yàn)樗鼪](méi)有情緒、音調(diào)和呼吸的變化,而孫燕姿則表示:「很抱歉,我懷疑這只是一個(gè)非常短期內(nèi)的回應(yīng),人類無(wú)法超越它已指日可待。」
果然,從Suno的驚世登場(chǎng),到Mureka的急起逆襲,音樂(lè)大模型能做的事情,正在驗(yàn)證著孫燕姿的預(yù)判,所以她才主動(dòng)選擇了接受,并相信音樂(lè)人做自己——也就是發(fā)揮人的那部分價(jià)值——才是最大的護(hù)城河。
不過(guò),對(duì)于更多想要揚(yáng)名立萬(wàn)的創(chuàng)作者來(lái)說(shuō),AI才是能幫他們做自己的工具,Mureka O1的大受好評(píng),就建立在這種濃得無(wú)法化開(kāi)的需求之上,一次古登堡式的歌唱平權(quán)。
而在DeepSeek橫空出世之后,國(guó)產(chǎn)AI行業(yè)就開(kāi)始呈現(xiàn)出類似工業(yè)領(lǐng)域的供應(yīng)鏈溢出效應(yīng),讓音樂(lè)大模型學(xué)會(huì)推理創(chuàng)作,就是其中一個(gè)例證,更重要的是,從人才密度,到技術(shù)突破,中國(guó)的AI公司都開(kāi)始騎臉輸出,反過(guò)來(lái)向全球貢獻(xiàn)經(jīng)驗(yàn),并挨個(gè)占領(lǐng)所有榜單的前列位置。
波瀾壯闊的創(chuàng)新,永遠(yuǎn)的科技發(fā)展史上最美麗的那道風(fēng)景線。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.