2025年剛過(guò),中國(guó)AI技術(shù)在國(guó)際舞臺(tái)上持續(xù)閃耀,國(guó)產(chǎn)開(kāi)源模型的集體爆發(fā)成為行業(yè)焦點(diǎn)。實(shí)際上在DeepSeek的開(kāi)源模型爆火之前,中國(guó)的另一家公司MiniMax的MiniMax-01模型就已經(jīng)發(fā)布和開(kāi)源。目前MiniMax,與DeepSeek、阿里千問(wèn)系列共同構(gòu)成了國(guó)產(chǎn)開(kāi)源模型的中流砥柱,展現(xiàn)出中國(guó)在AI開(kāi)源領(lǐng)域的強(qiáng)大實(shí)力。
MiniMax 用實(shí)力成為“行業(yè)標(biāo)桿”
MiniMax-01開(kāi)源模型作為全球首個(gè)突破傳統(tǒng)Transformer架構(gòu)限制的模型,其核心創(chuàng)新在于通過(guò)線性注意力機(jī)制實(shí)現(xiàn)了對(duì)4M長(zhǎng)文本的高效處理能力,是 GPT-4o 的 32 倍、Claude-3.5-Sonnet 的 20 倍。被海外科技媒體、投資人及研究員認(rèn)為一個(gè)來(lái)自中國(guó)的可以與OpenAI“掰手腕”的頂尖開(kāi)源模型。
這一突破源自對(duì)AI基礎(chǔ)架構(gòu)痛點(diǎn)的深刻洞察。傳統(tǒng)Transformer雖在自然語(yǔ)言處理領(lǐng)域取得巨大成功,但其核心的注意力機(jī)制存在二次計(jì)算復(fù)雜度(O(n2))的根本性缺陷:隨著輸入序列長(zhǎng)度增加,計(jì)算量呈平方級(jí)增長(zhǎng),這不僅導(dǎo)致算力需求暴增,更成為長(zhǎng)文本處理的瓶頸。
在技術(shù)路徑選擇上,研究界曾提出稀疏注意力方案,試圖通過(guò)選擇性忽略部分注意力矩陣來(lái)降低計(jì)算量。但MiniMax認(rèn)為這本質(zhì)上是以有損壓縮的方式逼近完整注意力(Full Attention)的效果。
而MiniMax團(tuán)隊(duì)創(chuàng)新性地發(fā)現(xiàn),傳統(tǒng)注意力機(jī)制中隱含的計(jì)算冗余恰為算法優(yōu)化提供了空間——線性注意力將復(fù)雜度降至線性級(jí)別(O(n)),在完全保留信息交互能力的前提下實(shí)現(xiàn)無(wú)損優(yōu)化。
這種架構(gòu)級(jí)突破展現(xiàn)出顯著的技術(shù)優(yōu)勢(shì):當(dāng)模型規(guī)模擴(kuò)大時(shí),線性注意力相較傳統(tǒng)方案的計(jì)算效率優(yōu)勢(shì)呈指數(shù)級(jí)放大,尤其在處理超長(zhǎng)文本場(chǎng)景中,其可擴(kuò)展性為模型賦予了處理海量上下文信息的潛力。
這種長(zhǎng)文本處理能力在即將到來(lái)的Agent時(shí)代具有戰(zhàn)略價(jià)值。智能體(Agent)需要持續(xù)記憶交互歷史、處理多輪復(fù)雜對(duì)話、整合跨文檔知識(shí),這對(duì)模型的上下文窗口長(zhǎng)度提出剛性需求。MiniMax-01的突破,標(biāo)志著AI基礎(chǔ)架構(gòu)從"算力堆砌"向"算法革新"的關(guān)鍵轉(zhuǎn)折。
同樣值得關(guān)注的是,MiniMax在多模態(tài)領(lǐng)域的持續(xù)探索,1 月 10 日發(fā)布的視頻模型 S2V-01,把傳統(tǒng)的輸入和計(jì)算成本降低到1% 。只需輸入一張圖片, 即可實(shí)現(xiàn)視覺(jué)細(xì)節(jié)的精確還原;2月24日上線了圖生視頻模型I2V-01-Director,與此前的文生視頻T2V-01-Director共同組成01-Director系列,使普通人如專業(yè)導(dǎo)演一樣,自如控制鏡頭語(yǔ)言,實(shí)現(xiàn)精細(xì)的創(chuàng)作控制。
MiniMax將這些技術(shù)運(yùn)用到了HailuoAI以及Talkie上,極大地提升了用戶體驗(yàn)。目前這兩款出海產(chǎn)品均在榜全球權(quán)威風(fēng)投機(jī)構(gòu)公布的a16z全球AI應(yīng)用TOP50的web排行榜和app排行榜前列,其中海螺AI力壓可靈、Sora穩(wěn)居全球視頻AI賽道top1。
原文鏈接:https://a16z.com/100-gen-ai-apps-4/
MiniMax的創(chuàng)新堅(jiān)守與企業(yè)精神
正如MiniMax-01的架構(gòu)創(chuàng)新以及不同領(lǐng)域的多模態(tài)布局,MiniMax以技術(shù)為驅(qū)動(dòng),以技術(shù)創(chuàng)新為核心不斷探索和突破AI技術(shù)的邊界。MiniMax CEO閆俊杰在采訪中表達(dá)的“好模型的本質(zhì)是技術(shù)驅(qū)動(dòng),而模型是產(chǎn)品出現(xiàn)的驅(qū)動(dòng)力”。DeepSeek的爆火以及海螺AI成為全球用戶訪問(wèn)量第一的視頻網(wǎng)站,都充分證明了“技術(shù)驅(qū)動(dòng)”可以帶來(lái)更多的用戶和市場(chǎng)認(rèn)可。
閆俊杰還說(shuō)“我們認(rèn)為真正有價(jià)值的事,不是當(dāng)前做得怎么樣,而是技術(shù)進(jìn)化速度。而開(kāi)源會(huì)加速技術(shù)進(jìn)化,做得好的地方有鼓勵(lì),不好的地方會(huì)有很多批評(píng),外面的人也會(huì)有貢獻(xiàn),這是我們開(kāi)源的最大驅(qū)動(dòng)力。”這一觀點(diǎn)體現(xiàn)了其對(duì)開(kāi)源價(jià)值的深刻認(rèn)識(shí),不僅促進(jìn)了自身技術(shù)的發(fā)展,更為整個(gè)AI行業(yè)帶來(lái)了更多的創(chuàng)新和可能性。
據(jù)了解MiniMax 即將在 4 - 5 月份發(fā)布基于 Linear Attention 架構(gòu)的深度推理多模態(tài)模型,將融合Text&VL兩個(gè)模態(tài),平衡文本能力和視覺(jué)理解能力,為AI技術(shù)的應(yīng)用開(kāi)辟更廣闊的前景。我們有理由相信,它將繼續(xù)引領(lǐng)行業(yè)的發(fā)展潮流,為 全球AI 技術(shù)的未來(lái)帶來(lái)更多的可能性,見(jiàn)證中國(guó)AI的持續(xù)輝煌。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.