網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

從架構(gòu)創(chuàng)新到多模態(tài)探索，MiniMax如何為國(guó)產(chǎn)AI持續(xù)賦能？

2025-03-27 10:16:10　來(lái)源: 數(shù)據(jù)結(jié)構(gòu)和算法

上海舉報(bào)

分享至

2025年剛過(guò)，中國(guó)AI技術(shù)在國(guó)際舞臺(tái)上持續(xù)閃耀，國(guó)產(chǎn)開(kāi)源模型的集體爆發(fā)成為行業(yè)焦點(diǎn)。實(shí)際上在DeepSeek的開(kāi)源模型爆火之前，中國(guó)的另一家公司MiniMax的MiniMax-01模型就已經(jīng)發(fā)布和開(kāi)源。目前MiniMax，與DeepSeek、阿里千問(wèn)系列共同構(gòu)成了國(guó)產(chǎn)開(kāi)源模型的中流砥柱，展現(xiàn)出中國(guó)在AI開(kāi)源領(lǐng)域的強(qiáng)大實(shí)力。

MiniMax 用實(shí)力成為“行業(yè)標(biāo)桿”

MiniMax-01開(kāi)源模型作為全球首個(gè)突破傳統(tǒng)Transformer架構(gòu)限制的模型，其核心創(chuàng)新在于通過(guò)線性注意力機(jī)制實(shí)現(xiàn)了對(duì)4M長(zhǎng)文本的高效處理能力，是 GPT-4o 的 32 倍、Claude-3.5-Sonnet 的 20 倍。被海外科技媒體、投資人及研究員認(rèn)為一個(gè)來(lái)自中國(guó)的可以與OpenAI“掰手腕”的頂尖開(kāi)源模型。

這一突破源自對(duì)AI基礎(chǔ)架構(gòu)痛點(diǎn)的深刻洞察。傳統(tǒng)Transformer雖在自然語(yǔ)言處理領(lǐng)域取得巨大成功，但其核心的注意力機(jī)制存在二次計(jì)算復(fù)雜度（O(n2)）的根本性缺陷：隨著輸入序列長(zhǎng)度增加，計(jì)算量呈平方級(jí)增長(zhǎng)，這不僅導(dǎo)致算力需求暴增，更成為長(zhǎng)文本處理的瓶頸。

在技術(shù)路徑選擇上，研究界曾提出稀疏注意力方案，試圖通過(guò)選擇性忽略部分注意力矩陣來(lái)降低計(jì)算量。但MiniMax認(rèn)為這本質(zhì)上是以有損壓縮的方式逼近完整注意力（Full Attention）的效果。

而MiniMax團(tuán)隊(duì)創(chuàng)新性地發(fā)現(xiàn)，傳統(tǒng)注意力機(jī)制中隱含的計(jì)算冗余恰為算法優(yōu)化提供了空間——線性注意力將復(fù)雜度降至線性級(jí)別（O(n)），在完全保留信息交互能力的前提下實(shí)現(xiàn)無(wú)損優(yōu)化。

這種架構(gòu)級(jí)突破展現(xiàn)出顯著的技術(shù)優(yōu)勢(shì)：當(dāng)模型規(guī)模擴(kuò)大時(shí)，線性注意力相較傳統(tǒng)方案的計(jì)算效率優(yōu)勢(shì)呈指數(shù)級(jí)放大，尤其在處理超長(zhǎng)文本場(chǎng)景中，其可擴(kuò)展性為模型賦予了處理海量上下文信息的潛力。

這種長(zhǎng)文本處理能力在即將到來(lái)的Agent時(shí)代具有戰(zhàn)略價(jià)值。智能體（Agent）需要持續(xù)記憶交互歷史、處理多輪復(fù)雜對(duì)話、整合跨文檔知識(shí)，這對(duì)模型的上下文窗口長(zhǎng)度提出剛性需求。MiniMax-01的突破，標(biāo)志著AI基礎(chǔ)架構(gòu)從"算力堆砌"向"算法革新"的關(guān)鍵轉(zhuǎn)折。

同樣值得關(guān)注的是，MiniMax在多模態(tài)領(lǐng)域的持續(xù)探索，1 月 10 日發(fā)布的視頻模型 S2V-01，把傳統(tǒng)的輸入和計(jì)算成本降低到1% 。只需輸入一張圖片，即可實(shí)現(xiàn)視覺(jué)細(xì)節(jié)的精確還原；2月24日上線了圖生視頻模型I2V-01-Director，與此前的文生視頻T2V-01-Director共同組成01-Director系列，使普通人如專業(yè)導(dǎo)演一樣，自如控制鏡頭語(yǔ)言，實(shí)現(xiàn)精細(xì)的創(chuàng)作控制。

MiniMax將這些技術(shù)運(yùn)用到了HailuoAI以及Talkie上，極大地提升了用戶體驗(yàn)。目前這兩款出海產(chǎn)品均在榜全球權(quán)威風(fēng)投機(jī)構(gòu)公布的a16z全球AI應(yīng)用TOP50的web排行榜和app排行榜前列，其中海螺AI力壓可靈、Sora穩(wěn)居全球視頻AI賽道top1。

原文鏈接：https://a16z.com/100-gen-ai-apps-4/

MiniMax的創(chuàng)新堅(jiān)守與企業(yè)精神

正如MiniMax-01的架構(gòu)創(chuàng)新以及不同領(lǐng)域的多模態(tài)布局，MiniMax以技術(shù)為驅(qū)動(dòng)，以技術(shù)創(chuàng)新為核心不斷探索和突破AI技術(shù)的邊界。MiniMax CEO閆俊杰在采訪中表達(dá)的“好模型的本質(zhì)是技術(shù)驅(qū)動(dòng)，而模型是產(chǎn)品出現(xiàn)的驅(qū)動(dòng)力”。DeepSeek的爆火以及海螺AI成為全球用戶訪問(wèn)量第一的視頻網(wǎng)站，都充分證明了“技術(shù)驅(qū)動(dòng)”可以帶來(lái)更多的用戶和市場(chǎng)認(rèn)可。

閆俊杰還說(shuō)“我們認(rèn)為真正有價(jià)值的事，不是當(dāng)前做得怎么樣，而是技術(shù)進(jìn)化速度。而開(kāi)源會(huì)加速技術(shù)進(jìn)化，做得好的地方有鼓勵(lì)，不好的地方會(huì)有很多批評(píng)，外面的人也會(huì)有貢獻(xiàn)，這是我們開(kāi)源的最大驅(qū)動(dòng)力。”這一觀點(diǎn)體現(xiàn)了其對(duì)開(kāi)源價(jià)值的深刻認(rèn)識(shí)，不僅促進(jìn)了自身技術(shù)的發(fā)展，更為整個(gè)AI行業(yè)帶來(lái)了更多的創(chuàng)新和可能性。

據(jù)了解MiniMax 即將在 4 - 5 月份發(fā)布基于 Linear Attention 架構(gòu)的深度推理多模態(tài)模型，將融合Text&VL兩個(gè)模態(tài)，平衡文本能力和視覺(jué)理解能力，為AI技術(shù)的應(yīng)用開(kāi)辟更廣闊的前景。我們有理由相信，它將繼續(xù)引領(lǐng)行業(yè)的發(fā)展潮流，為全球AI 技術(shù)的未來(lái)帶來(lái)更多的可能性，見(jiàn)證中國(guó)AI的持續(xù)輝煌。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.