會思考的AI已經席卷到了音樂領域,這一次,引領這場變革的,也是一家來自中國的公司——昆侖萬維。
作者|伍月??
編輯|栗子??
生成式AI的發展已進入關鍵的應用落地階段,AI正在從快速生成轉向深度推理。更聰明的AI不僅會回答問題,還能在推理過程中深思熟慮地推理和解決問題。
2025年春節,DeepSeek R1驚艷全球,其突破性地將諾貝爾經濟學獎得主卡尼曼提出的“慢思考”(System 2)理論工程化,通過動態思維鏈技術重構模型推理范式,不僅推動OpenAI被迫開放思維鏈功能,更標志著AI從“刺激-反應”的直覺型生成,正式進化為具備自主推理能力的認知主體。
當全球目光聚焦于文本領域的突破時,會思考的AI已經席卷到了音樂領域。這一次,引領這場變革的,也是一家來自中國的公司——昆侖萬維。
3月26日,昆侖萬維正式發布Mureka O1模型與Mureka V6模型。其中,Mureka O1作為全球首款音樂推理大模型,性能超越Suno、模型登頂SOTA。中國科技創新再次在AI音樂領域領跑全球。
具體來說,Mureka是昆侖萬維在2024年發布的一款AI音樂產品。第一代音樂生成模型Mureka V1(SkyMusic)發布于2024年4月,目前基座模型已經迭代到第六版,也就是Mureka V6。而Mureka O1模型是基于Mureka V6的推理優化版本,也是全球范圍內首個引入CoT的音樂模型。
經過「甲子光年」實際體驗,具備推理能力的Mureka O1在實際效果上的確更加驚艷,也是此次Mureka模型更新的最大看點。
比如,輸入相同的prompt給到Mureka O1和Suno V4,對比之下,Mureka O1生成的音樂在歌手聲音質感、節奏、旋律上都明顯更勝一籌。
輸入同一prompt,對比Mureka O1和Suno V4生成音樂效果
在「甲子光年」看來,一場音樂創作革命正在發生:AI不只是輔助工具,而是能根據簡單指令即興寫詞,還能理解布魯斯的憂郁藍調曲風的智能創作伙伴。
如同DeepSeek在上線推理模型R1之后的爆火一樣,今天Mureka O1的問世讓我們感覺,AI音樂的“GPT時刻”正在到來。
1.Mureka O1 & Mureka V6一手實測:人人都能成為音樂創作者
前面提到,最新發布的Mureka O1模型是基于Mureka V6思維鏈的推理優化版本,而Mureka V6是當前Mureka的基座模型,支持純音樂生成,還支持10種語言的AI音樂創作,包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、意大利語和俄語。
Mureka支持10種語言作曲,來源:Mureka官網
我們先來感受一下Mureka官方創作的作品demo。
Mureka O1和Mureka V6發布后的第一時間,「甲子光年」就進行了一手實測。
在對話框中輸入“小巷人家”這四個字后,Mureka便自動生成了一段生動的文字,詞句間洋溢著濃濃的煙火氣息:“雞鳴犬吠迎晨曦,日子悠然緩行,青石板路上苔痕碧綠,老樹垂下斑駁樹影。”
點擊創作鍵,不出一會兒,一段兩分半鐘的音樂便緩緩流淌而出。
由Mureka生成的《大街小巷》音樂
目前,可以直接通過Mureka的網頁端(官網界面:www.mureka.AI)體驗Mureka O1和Mureka V6。
打開Mureka官網,可以直接到達創作頁面。歌曲創作有簡單模式和高級模式。高級模式下,輸入你想創作的歌曲名稱,可以直接讓AI生成相應的歌詞。
在模型界面,用戶可以選擇Mureka O1、Mureka V6和Mureka V5.5多個模型進行創作。
Mureka支持模型切換,來源:Mureka官網
曲風上,Mureka不僅可以支持“爵士(Jazz)、電子(Electronic)、流行(Pop)、鄉村(Country)、節奏布魯斯(R&B)、靈魂樂(Soul)、藍調(Blues)、搖滾(Rock)、舞曲(Dance)”等,還能直接讓用戶上傳參考歌曲,或者粘貼YouTube鏈接,讓AI根據用戶選擇定向生成不同的曲風。在列表中可以看到,很多用戶上傳的歌曲列表。
用戶上傳參考歌曲,讓Mureka生成相似曲風的音樂,來源:Mureka官網
詞曲都設置完成后,就可以點擊創作生成不同歌曲,每次Mureka都會生成兩首不同的歌供選擇。歌曲生成后,可以直接點擊發布分享歌曲鏈接,還可以根據歌詞讓AI生成對應的視頻。
音樂生成后支持下載、視頻生成和發布,來源:Mureka官網
Mureka還推出了很多對于音樂工作創作者非常友好的功能。比如,Mureka不僅提供豐富的官方歌手音色選擇,還允許用戶上傳自己的聲音,通過AI學習和復刻,實現個性化音色定制。人人都能成為AI歌手的時代來臨,每個人都能輕松創作出具有個人特色的音樂作品。
上傳自己的聲音,定制自己的專屬音樂,來源:Mureka官網
歌曲生成后,用戶也可以下載分軌音頻和伴奏等,且能對音樂進行局部編輯,自定義自己想做的作品。
支持對歌曲的二次編輯,來源:Mureka官網
各種順滑的體驗之外,Mureka還搞了個大動作:開放API服務和模型微調功能。
Mureka是全球首批開放API服務的高質量AI音樂生成平臺。更重要的是,不僅在全球范圍內首次開放API服務,Mureka還同步開放基于Mureka V6的模型微調服務,成為全球首個開放模型微調功能的AI音樂生成平臺。
來源:Mureka官網
面向企業和開發者,Mureka開放了兩大類靈活的API服務,具體包括音樂音頻生成API,還有語音合成API。
使用Mureka,音樂工作室就可以上傳版權作品,訓練專屬廠牌風格模型。這意味著,音樂工作室和眾多創業者可以直接通過Mureka API實現創作的工業化。
當游戲公司利用該API批量生成1000個NPC(非玩家角色)的專屬背景音樂(BGM)時,音樂生產便真正融入了智能化的工作流之中。
之前,網友們調侃李榮浩詞曲創作一手包辦,一個人就是一支隊伍。而現在,AI技術的發展正使得這樣的個人全能現象變得更加普遍和可行。
音樂史上個人全能創作的時代正在逐步到來——零基礎用戶同樣能夠創作出熱門單曲,獨立音樂人正迎來黃金時代。
2.Mureka O1如何定義“音樂推理”?
DeepSeek R1的深度思考功能讓很多人都感受到了思維鏈的魅力。如今,包括OpenAI的O1在內的很多語言模型都已經上線深度思考功能,讓用戶通過思維鏈(簡稱CoT)直觀的看到大模型的動態思考推理過程。
實踐證明,CoT能顯著提升模型的推理能力,并促進模型的研究和迭代。
昆侖萬維的Mureka團隊開創性的把這種深度思考的“思維鏈(CoT)”能力引入了音樂生成模型上。在GitHub項目主頁:MusiCoT.github.io,可以看到論文和項目介紹。
https://arxiv.org/abs/2503.19611
MusiCoT利用了思維鏈Chain-of-Thought (CoT)方法,不同于傳統自回歸模型逐步生成音頻,MusiCoT首次在細粒度音頻token預測前預生成整體音樂結構,大幅提升生成音樂的結構連貫性與樂器編排精準度。
語言模型的CoT實踐在跨領域方面并不是一項可以拿來即用的技術。因為傳統的CoT方法通常是通過自然語言展示中間推理步驟,讓AI像人一樣,一步一步地解釋它是怎么想的,然后得出結論。
但在音樂領域,音樂的情緒、節奏、旋律比較復雜,沒辦法像分析文字那樣,一步步“思考”音樂。
Mureka團隊的工程師們想出了個聰明的辦法,為AI理解和生成音樂提供了一種新的“思考”方式。
傳統的AI作曲方式,就像寫日記一樣,一個音符接一個音符地寫,想到哪寫到哪,沒有整體規劃。
Mureka團隊引入了一種能"聽懂"音樂的AI翻譯器 CLAP模型,把一段旋律或節奏轉化一串“數字指紋”,同時還使用了RVQ技術,像是一個“翻譯官”,把復雜的“數字指紋”翻譯成 AI 能夠理解的“標簽”。
RVQ的粗到細粒度標記化方法,就像是一個“分層翻譯”的過程:先翻譯出音樂的整體框架,比如歌曲的結構、主要旋律等,就像是畫一個草圖; 然后再逐步翻譯出音樂的細節,比如具體的音符、節奏變化等,就像是在草圖上添加細節。
Mureka自研基于MusiCoT的自回歸模型音樂生成技術,來源:MusiCoT.github.io
如此,AI創作時,不再是生硬地拼湊音符,而是像音樂家那樣,先開始“畫藍圖”,想出一個大概的音樂結構,然后再慢慢細化,生成具體的音樂。
這是一種創新性的嘗試,且這種方式方式更貼近人類的創作流程,有助于產生更具整體性和連貫性的音樂作品。
這樣,Mureka O1就像一位不斷打磨作品的作曲家,能夠持續學習,不斷推理,優化自己的創作能力。
在最新的音樂評測中,Mureka O1在最終的整體聽感評測中已經超過了Suno V4,在總分為10分評測中,拿到了6.93分,且在聲音質感和背景音樂質感上也超過了Suno V4。
Mureka O1在主觀測評中整體聽感超越Suno V4
此外,在客觀評測中,在音樂連貫性、歌詞發音準確度、文本相關性、作品復雜度和質量等維度上,Mureka O1表現明顯超越Suno V4。
相同prompt下生成歌曲的橫向對比
技術報告也顯示,同一段prompt輸入后,Mureka O1實現了行業領先的低延遲音樂生成。
Mureka O1實現了行業領先的低延時音樂生成
MusiCoT的創新技術實踐,不僅在技術層面實現了突破,更加提升了音樂生成的質量和效率,讓音樂成為成為更加普及、更加多元、更加個性化的表達方式。
通過引入AI的深度思考能力,很多人也能夠生成超越人類固有思維模式的音樂作品,從而拓展音樂創作的邊界,探索全新的音樂風格和表達方式。
3.AI音樂創作作曲革命:“智能創作大腦”重新定義音樂生產力
“Mureka”不僅僅是一個產品名,它也代表著在音樂的世界里,靈感抵達之際,創意的噴薄而出。它象征著一種頓悟,一種靈感迸發的瞬間,如同阿基米德在浴缸中發現浮力定律時喊出的“Eureka!”一樣,充滿了驚喜和激動。
這種靈感時刻,也恰如其分的隱含了MusiCoT的出現,讓AI音樂呈現出了靈感與算法的共鳴。AI能夠像人類一樣,在音樂中表達情感和創意。
毋庸置疑,音樂創作將迎來巨變。
由于Mureka開放 API 服務和模型微調功能。開發者不僅可以將Mureka強大的AI音樂生成能力集成到各種應用程序和平臺中;還可以據特定需求,對Mureka的AI模型進行個性化訓練。任何音樂人都可以以極低的成本,用自己創作的版權音樂,訓練屬于自己的音樂模型。已經有游戲開發者在嘗試,通過微調模型,使其生成特定游戲風格的背景音樂。即使沒有專業的音樂知識和技能,用戶也可以通過Mureka生成高質量的音樂作品。
對于個人創作者而言,Mureka降低了專業音樂制作門檻,讓腦海中的“靈光一現”能夠快速轉化為作品,被更多人看見。更多人能夠參與到音樂創作中來,用音樂表達自己的情感和想法。對于專業的音樂制作人而言,Mureka更是一個激發創意的平臺,它能夠為音樂人提供豐富的靈感和創意,幫助他們突破創作瓶頸。
比如輸入prompt:love song,Mureka可以自動生成歌詞,點擊創作就生成了下面這首歌。
在更廣闊的文娛和內容產業,AI音樂將會被廣泛應用,對于游戲、影視、廣告等領域而言,Mureka能夠提供高效、高質量的配樂解決方案,縮短制作周期,降低制作成本,讓創作者能夠更專注于內容創作本身。更多嶄新的音樂教育、音樂治療、音樂娛樂等業態會誕生,為人們帶來更加美好的音樂體驗。
昆侖萬維最新還發了一支《Mureka》的同名MV,歌曲由AI音樂人Mureka演唱,動畫部分則由AI視頻生成平臺SkyReels制作,進一步展示了AI音樂與AI視頻的融合潛力。
目前,Mureka產品已經在全球化100多個國家被使用。Mureka向「甲子光年」談到他們的愿景:“音樂是情感表達最重要的手段之一,過去因為學習門檻過高,學習曲線過于陡峭,影響了人們使用音樂這一載體表達情感。AI 技術可以讓人們更好的使用音樂這一手段表達自己的情感。”
Mureka在音樂生成領域的驚艷背后,依托的也是在大模型全產業鏈進行布局的昆侖萬維。
昆侖萬維是國內少數在AI領域全產業鏈布局的互聯網大廠。
昆侖萬維創始人周亞輝曾在朋友圈表示,昆侖萬維的AI戰略優勢在于差異化,并強調公司找到了“小而大美的空間”。
此次,Mureka O1 & V6兩個模型的上線,不僅向外界展示了昆侖萬維在 AI 技術上卓越的創新能力,更印證了其“小而大美”戰略的成功實踐。
通過聚焦 AI 音樂生成這一細分領域,Mureka團隊創新性地引入“思維鏈(CoT)”等技術,賦予 AI 更強的理解和創造力,實現了技術和應用的突破。
據團隊透露,接下來,Mureka還將開發更多創新性的音樂創作功能,例如音樂生成的二次編輯、歌曲的創意再造等;同時也會積極拓展開發者生態和合作伙伴關系,通過開放平臺和合作,構建一個充滿活力和創新力的音樂創作社區。
從DeepSeek到Mureka,中國AI在認知架構上的突破并非孤立存在,而是密不可分的。DeepSeek在通用AI領域的突破,為Mureka在音樂領域的創新,提供了頗具借鑒意義的方向。Mureka的創新實踐,是中國AI在認知架構突破的基礎上,針對音樂領域進行深度探索和創新的成果。不僅展示了中國 AI 在垂直領域的技術實力,也為 AI 音樂的未來發展,開辟了新的道路。
Mureka讓AI成為靈感之源,將音樂靈感的門扉向大眾敞開,未來,隨著AI技術的不斷進步,音符在科技與藝術的交融中,將會綻放更加耀眼的光芒。
(封面圖來源:昆侖萬維)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.