網易首頁 > 網易號 > 正文申請入駐

中國AI再突破，全球首個音樂推理大模型Mureka O1誕生，超越Suno登頂SOTA｜甲子光年

2025-03-26 20:10:20　來源: 甲子光年

北京舉報

分享至

會思考的AI已經席卷到了音樂領域，這一次，引領這場變革的，也是一家來自中國的公司——昆侖萬維。

作者｜伍月??

編輯｜栗子??

生成式AI的發展已進入關鍵的應用落地階段，AI正在從快速生成轉向深度推理。更聰明的AI不僅會回答問題，還能在推理過程中深思熟慮地推理和解決問題。

2025年春節，DeepSeek R1驚艷全球，其突破性地將諾貝爾經濟學獎得主卡尼曼提出的“慢思考”（System 2）理論工程化，通過動態思維鏈技術重構模型推理范式，不僅推動OpenAI被迫開放思維鏈功能，更標志著AI從“刺激-反應”的直覺型生成，正式進化為具備自主推理能力的認知主體。

當全球目光聚焦于文本領域的突破時，會思考的AI已經席卷到了音樂領域。這一次，引領這場變革的，也是一家來自中國的公司——昆侖萬維。

3月26日，昆侖萬維正式發布Mureka O1模型與Mureka V6模型。其中，Mureka O1作為全球首款音樂推理大模型，性能超越Suno、模型登頂SOTA。中國科技創新再次在AI音樂領域領跑全球。

具體來說，Mureka是昆侖萬維在2024年發布的一款AI音樂產品。第一代音樂生成模型Mureka V1（SkyMusic）發布于2024年4月，目前基座模型已經迭代到第六版，也就是Mureka V6。而Mureka O1模型是基于Mureka V6的推理優化版本，也是全球范圍內首個引入CoT的音樂模型。

經過「甲子光年」實際體驗，具備推理能力的Mureka O1在實際效果上的確更加驚艷，也是此次Mureka模型更新的最大看點。

比如，輸入相同的prompt給到Mureka O1和Suno V4，對比之下，Mureka O1生成的音樂在歌手聲音質感、節奏、旋律上都明顯更勝一籌。

輸入同一prompt，對比Mureka O1和Suno V4生成音樂效果

在「甲子光年」看來，一場音樂創作革命正在發生：AI不只是輔助工具，而是能根據簡單指令即興寫詞，還能理解布魯斯的憂郁藍調曲風的智能創作伙伴。

如同DeepSeek在上線推理模型R1之后的爆火一樣，今天Mureka O1的問世讓我們感覺，AI音樂的“GPT時刻”正在到來。

1.Mureka O1 & Mureka V6一手實測：人人都能成為音樂創作者

前面提到，最新發布的Mureka O1模型是基于Mureka V6思維鏈的推理優化版本，而Mureka V6是當前Mureka的基座模型，支持純音樂生成，還支持10種語言的AI音樂創作，包括英語、中文、日語、韓語、法語、西班牙語、葡萄牙語、德語、意大利語和俄語。

Mureka支持10種語言作曲，來源：Mureka官網

我們先來感受一下Mureka官方創作的作品demo。

Mureka O1和Mureka V6發布后的第一時間，「甲子光年」就進行了一手實測。

在對話框中輸入“小巷人家”這四個字后，Mureka便自動生成了一段生動的文字，詞句間洋溢著濃濃的煙火氣息：“雞鳴犬吠迎晨曦，日子悠然緩行，青石板路上苔痕碧綠，老樹垂下斑駁樹影。”

點擊創作鍵，不出一會兒，一段兩分半鐘的音樂便緩緩流淌而出。

由Mureka生成的《大街小巷》音樂

目前，可以直接通過Mureka的網頁端（官網界面：www.mureka.AI）體驗Mureka O1和Mureka V6。

打開Mureka官網，可以直接到達創作頁面。歌曲創作有簡單模式和高級模式。高級模式下，輸入你想創作的歌曲名稱，可以直接讓AI生成相應的歌詞。

在模型界面，用戶可以選擇Mureka O1、Mureka V6和Mureka V5.5多個模型進行創作。

Mureka支持模型切換，來源：Mureka官網

曲風上，Mureka不僅可以支持“爵士(Jazz)、電子(Electronic)、流行(Pop)、鄉村(Country)、節奏布魯斯(R&B)、靈魂樂(Soul)、藍調(Blues)、搖滾(Rock)、舞曲(Dance)”等，還能直接讓用戶上傳參考歌曲，或者粘貼YouTube鏈接，讓AI根據用戶選擇定向生成不同的曲風。在列表中可以看到，很多用戶上傳的歌曲列表。

用戶上傳參考歌曲，讓Mureka生成相似曲風的音樂，來源：Mureka官網

詞曲都設置完成后，就可以點擊創作生成不同歌曲，每次Mureka都會生成兩首不同的歌供選擇。歌曲生成后，可以直接點擊發布分享歌曲鏈接，還可以根據歌詞讓AI生成對應的視頻。

音樂生成后支持下載、視頻生成和發布，來源：Mureka官網

Mureka還推出了很多對于音樂工作創作者非常友好的功能。比如，Mureka不僅提供豐富的官方歌手音色選擇，還允許用戶上傳自己的聲音，通過AI學習和復刻，實現個性化音色定制。人人都能成為AI歌手的時代來臨，每個人都能輕松創作出具有個人特色的音樂作品。

上傳自己的聲音，定制自己的專屬音樂，來源：Mureka官網

歌曲生成后，用戶也可以下載分軌音頻和伴奏等，且能對音樂進行局部編輯，自定義自己想做的作品。

支持對歌曲的二次編輯，來源：Mureka官網

各種順滑的體驗之外，Mureka還搞了個大動作：開放API服務和模型微調功能。

Mureka是全球首批開放API服務的高質量AI音樂生成平臺。更重要的是，不僅在全球范圍內首次開放API服務，Mureka還同步開放基于Mureka V6的模型微調服務，成為全球首個開放模型微調功能的AI音樂生成平臺。

來源：Mureka官網

面向企業和開發者，Mureka開放了兩大類靈活的API服務，具體包括音樂音頻生成API，還有語音合成API。

使用Mureka，音樂工作室就可以上傳版權作品，訓練專屬廠牌風格模型。這意味著，音樂工作室和眾多創業者可以直接通過Mureka API實現創作的工業化。

當游戲公司利用該API批量生成1000個NPC（非玩家角色）的專屬背景音樂（BGM）時，音樂生產便真正融入了智能化的工作流之中。

之前，網友們調侃李榮浩詞曲創作一手包辦，一個人就是一支隊伍。而現在，AI技術的發展正使得這樣的個人全能現象變得更加普遍和可行。

音樂史上個人全能創作的時代正在逐步到來——零基礎用戶同樣能夠創作出熱門單曲，獨立音樂人正迎來黃金時代。

2.Mureka O1如何定義“音樂推理”？

DeepSeek R1的深度思考功能讓很多人都感受到了思維鏈的魅力。如今，包括OpenAI的O1在內的很多語言模型都已經上線深度思考功能，讓用戶通過思維鏈（簡稱CoT）直觀的看到大模型的動態思考推理過程。

實踐證明，CoT能顯著提升模型的推理能力，并促進模型的研究和迭代。

昆侖萬維的Mureka團隊開創性的把這種深度思考的“思維鏈（CoT）”能力引入了音樂生成模型上。在GitHub項目主頁：MusiCoT.github.io，可以看到論文和項目介紹。

https://arxiv.org/abs/2503.19611

MusiCoT利用了思維鏈Chain-of-Thought （CoT）方法，不同于傳統自回歸模型逐步生成音頻，MusiCoT首次在細粒度音頻token預測前預生成整體音樂結構，大幅提升生成音樂的結構連貫性與樂器編排精準度。

語言模型的CoT實踐在跨領域方面并不是一項可以拿來即用的技術。因為傳統的CoT方法通常是通過自然語言展示中間推理步驟，讓AI像人一樣，一步一步地解釋它是怎么想的，然后得出結論。

但在音樂領域，音樂的情緒、節奏、旋律比較復雜，沒辦法像分析文字那樣，一步步“思考”音樂。

Mureka團隊的工程師們想出了個聰明的辦法，為AI理解和生成音樂提供了一種新的“思考”方式。

傳統的AI作曲方式，就像寫日記一樣，一個音符接一個音符地寫，想到哪寫到哪，沒有整體規劃。

Mureka團隊引入了一種能"聽懂"音樂的AI翻譯器 CLAP模型，把一段旋律或節奏轉化一串“數字指紋”，同時還使用了RVQ技術，像是一個“翻譯官”，把復雜的“數字指紋”翻譯成 AI 能夠理解的“標簽”。

RVQ的粗到細粒度標記化方法，就像是一個“分層翻譯”的過程：先翻譯出音樂的整體框架，比如歌曲的結構、主要旋律等，就像是畫一個草圖；然后再逐步翻譯出音樂的細節，比如具體的音符、節奏變化等，就像是在草圖上添加細節。

Mureka自研基于MusiCoT的自回歸模型音樂生成技術，來源：MusiCoT.github.io

如此，AI創作時，不再是生硬地拼湊音符，而是像音樂家那樣，先開始“畫藍圖”，想出一個大概的音樂結構，然后再慢慢細化，生成具體的音樂。

這是一種創新性的嘗試，且這種方式方式更貼近人類的創作流程，有助于產生更具整體性和連貫性的音樂作品。

這樣，Mureka O1就像一位不斷打磨作品的作曲家，能夠持續學習，不斷推理，優化自己的創作能力。

在最新的音樂評測中，Mureka O1在最終的整體聽感評測中已經超過了Suno V4，在總分為10分評測中，拿到了6.93分，且在聲音質感和背景音樂質感上也超過了Suno V4。

Mureka O1在主觀測評中整體聽感超越Suno V4

此外，在客觀評測中，在音樂連貫性、歌詞發音準確度、文本相關性、作品復雜度和質量等維度上，Mureka O1表現明顯超越Suno V4。

相同prompt下生成歌曲的橫向對比

技術報告也顯示，同一段prompt輸入后，Mureka O1實現了行業領先的低延遲音樂生成。

Mureka O1實現了行業領先的低延時音樂生成

MusiCoT的創新技術實踐，不僅在技術層面實現了突破，更加提升了音樂生成的質量和效率，讓音樂成為成為更加普及、更加多元、更加個性化的表達方式。

通過引入AI的深度思考能力，很多人也能夠生成超越人類固有思維模式的音樂作品，從而拓展音樂創作的邊界，探索全新的音樂風格和表達方式。

3.AI音樂創作作曲革命：“智能創作大腦”重新定義音樂生產力

“Mureka”不僅僅是一個產品名，它也代表著在音樂的世界里，靈感抵達之際，創意的噴薄而出。它象征著一種頓悟，一種靈感迸發的瞬間，如同阿基米德在浴缸中發現浮力定律時喊出的“Eureka！”一樣，充滿了驚喜和激動。

這種靈感時刻，也恰如其分的隱含了MusiCoT的出現，讓AI音樂呈現出了靈感與算法的共鳴。AI能夠像人類一樣，在音樂中表達情感和創意。

毋庸置疑，音樂創作將迎來巨變。

由于Mureka開放 API 服務和模型微調功能。開發者不僅可以將Mureka強大的AI音樂生成能力集成到各種應用程序和平臺中；還可以據特定需求，對Mureka的AI模型進行個性化訓練。任何音樂人都可以以極低的成本，用自己創作的版權音樂，訓練屬于自己的音樂模型。已經有游戲開發者在嘗試，通過微調模型，使其生成特定游戲風格的背景音樂。即使沒有專業的音樂知識和技能，用戶也可以通過Mureka生成高質量的音樂作品。

對于個人創作者而言，Mureka降低了專業音樂制作門檻，讓腦海中的“靈光一現”能夠快速轉化為作品，被更多人看見。更多人能夠參與到音樂創作中來，用音樂表達自己的情感和想法。對于專業的音樂制作人而言，Mureka更是一個激發創意的平臺，它能夠為音樂人提供豐富的靈感和創意，幫助他們突破創作瓶頸。

比如輸入prompt：love song，Mureka可以自動生成歌詞，點擊創作就生成了下面這首歌。

在更廣闊的文娛和內容產業，AI音樂將會被廣泛應用，對于游戲、影視、廣告等領域而言，Mureka能夠提供高效、高質量的配樂解決方案，縮短制作周期，降低制作成本，讓創作者能夠更專注于內容創作本身。更多嶄新的音樂教育、音樂治療、音樂娛樂等業態會誕生，為人們帶來更加美好的音樂體驗。

昆侖萬維最新還發了一支《Mureka》的同名MV，歌曲由AI音樂人Mureka演唱，動畫部分則由AI視頻生成平臺SkyReels制作，進一步展示了AI音樂與AI視頻的融合潛力。

目前，Mureka產品已經在全球化100多個國家被使用。Mureka向「甲子光年」談到他們的愿景：“音樂是情感表達最重要的手段之一，過去因為學習門檻過高，學習曲線過于陡峭，影響了人們使用音樂這一載體表達情感。AI 技術可以讓人們更好的使用音樂這一手段表達自己的情感。”

Mureka在音樂生成領域的驚艷背后，依托的也是在大模型全產業鏈進行布局的昆侖萬維。

昆侖萬維是國內少數在AI領域全產業鏈布局的互聯網大廠。

昆侖萬維創始人周亞輝曾在朋友圈表示，昆侖萬維的AI戰略優勢在于差異化，并強調公司找到了“小而大美的空間”。

此次，Mureka O1 & V6兩個模型的上線，不僅向外界展示了昆侖萬維在 AI 技術上卓越的創新能力，更印證了其“小而大美”戰略的成功實踐。

通過聚焦 AI 音樂生成這一細分領域，Mureka團隊創新性地引入“思維鏈（CoT）”等技術，賦予 AI 更強的理解和創造力，實現了技術和應用的突破。

據團隊透露，接下來，Mureka還將開發更多創新性的音樂創作功能，例如音樂生成的二次編輯、歌曲的創意再造等；同時也會積極拓展開發者生態和合作伙伴關系，通過開放平臺和合作，構建一個充滿活力和創新力的音樂創作社區。

從DeepSeek到Mureka，中國AI在認知架構上的突破并非孤立存在，而是密不可分的。DeepSeek在通用AI領域的突破，為Mureka在音樂領域的創新，提供了頗具借鑒意義的方向。Mureka的創新實踐，是中國AI在認知架構突破的基礎上，針對音樂領域進行深度探索和創新的成果。不僅展示了中國 AI 在垂直領域的技術實力，也為 AI 音樂的未來發展，開辟了新的道路。

Mureka讓AI成為靈感之源，將音樂靈感的門扉向大眾敞開，未來，隨著AI技術的不斷進步，音符在科技與藝術的交融中，將會綻放更加耀眼的光芒。

（封面圖來源：昆侖萬維）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.