網易首頁 > 網易號 > 正文申請入駐

國內最被低估的大模型公司，用非共識路線引領技術創新

2025-03-20 19:07:30　來源: 技術領導力

上海舉報

分享至

最近，全球科技投資界的標桿機構發布的a16z榜單Top 50的AI產品中有近半是來自中國。要知道，只有投資價值極高的產品才會被收錄其中。更值得注意的是，躋身web榜單前列的海螺AI（Hailuo AI）和APP榜前列的Talkie都是來自同一家中國AI公司。其中海螺AI更是力壓可靈和OpenAI的Sora穩居全球視頻生成賽道王座。這家公司就是國內大模型“六小虎”之一，MiniMax。而在較早之前的2025年1月，MiniMax還陸續發布了多款涵蓋多領域的大模型。

模型發布后，很快就吸引了國內外專家、學者和AI愛好者的廣泛關注。這比DeepSeek的爆火，早了一個多月，讓中國AI技術在國際間引發了持續的回響。

MiniMax發布多款大模型，引爆全球AI圈

2025年開年，MiniMax連續發布多個大模型，這非常符合MiniMax“技術驅動”的作風：一旦出手，就是王炸。

1）視頻新模型S2V-01。1月10日，MiniMax發布了S2V-01視頻模型，通過單圖主體參考架構，能夠做到傳統方案1%以下的輸入和計算成本。你只需輸入一張圖片，就可以得到細節還原精確的視頻，具有高自由度和組合性，而且用時大大縮短。

2）新一代開源模型MiniMax-01系列。緊接著，在1月15日發布了新一代MiniMax-01系列開源大模型，包含基礎語言大模型 MiniMax-Text-01 和視覺多模態大模型MiniMax-VL-01。不同于Transformer傳統架構的是，它采用了線性注意力機制，綜合性能比肩GPT-4o、Claude-3.5等海外領軍模型，并且能夠高效處理高達400萬token的輸入，可輸入長度是GPT-4o的32倍，Claude-3.5-Sonnet的20倍。

MiniMax-01系列模型發布后，立刻引發國內外熱議浪潮。海外AI從業者與媒體，對其技術架構路線、模型綜合能力、技術創新性給予了高度肯定。被認為一個來自中國的可以與OpenAI“掰手腕”的頂尖開源模型。

3）語音模型T2A-01-HD。創新的步伐永不停歇，1月20日，MiniMax繼續發布T2A-01系列語音模型，不僅支持17種語言的流暢表達和上百種預置音色，而且音質穩定清晰、韻律自然、情緒精準表達、準確度高，語音生成速度更快、能力更穩定。

4）圖生視頻模型I2V-01-Director。2月24日，MiniMax再度發力，新推出了圖生視頻模型I2V-01-Director。與此前「鏡頭控制」的文生圖視頻T2V-01-Director共同組成01-Director系列。「鏡頭控制」模型讓普通用戶也可以成為導演，無論是文生視頻、圖生視頻，都能夠靈活自主地控制鏡頭語言，釋放你的創作潛能。T2V-01-Director、I2V-01-Director，現已對全球用戶開放，在MiniMax開放平臺和海螺視頻均已上線。

押注非共識技術路線：“線性注意力”是未來

在技術創新方面，MiniMax始終保持著業界領先的地位，在底層模型算法上更是不走尋常路，打破Transformer的傳統架構，押注非共識技術路線“線性注意力”。使得MiniMax-01的超長文本處理能力成為業界天花板。

1）Transformer的“稀疏注意力”，有其局限性。Transformer的二次復雜度一直是學界關注的問題，隨著token長度增加，計算量與序列長度的平方成正比，導致算力增加迅速。

稀疏注意力的方案思想是采樣注意力矩陣的部分數據來計算，避免全局計算來減少計算復雜度。但MiniMax認為這樣是以有損的方案逼近Full Attention，而線性注意力的方案可以實現無損優化。

2）模型規模越大，“線性注意力”優勢越明顯。在長文本領域，線性注意力比稀疏注意力更有優勢，尤其當模型規模越大時，線性注意力在計算復雜度上的優化效果越明顯，而且上限極高。而長上下文處理能力可以加強智能體的記憶和通訊，這將是在Agent時代的核心基建。

3）新的深度推理多模態模型，即將發布。K哥了解到，MiniMax將在4～5月份發布基于Linear Attention架構的深度推理多模態模型，模型的綜合能力非常值得期待。

MiniMax真正的目標是，加速全球技術迭代

以上，K哥跟大家聊了MiniMax的硬核技術，技術的背后體現了公司的文化以及創始人的技術哲學理念。MiniMax之所以能夠在強手如林的全球AI產業界保持領先位置，跟它的技術信仰是息息相關的。

1）堅持技術驅動的公司，才有生命力

在AI領域不管創業公司還是大廠，仍沿襲互聯網產品的慣性思維，都還在用做推薦系統的方法來做大模型產品。“推薦” 的邏輯是，用戶越多，反饋越多，推薦引擎越聰明。MiniMax創始人閆俊杰卻不這么認為，他在接受媒體采訪時說，“當技術與產品沖突時，技術優先”——他堅定地認為MiniMax為技術驅動型公司，強調技術迭代速度才是核心競爭力，而非短期用戶規模或商業化指標。這一理念外化為兩大實踐：一是清晰定義模型能力分級，通過技術手段逼近目標，而非依賴用戶反饋的被動優化；二是堅信“模型即應用”，即頂尖模型的突破直接催生顛覆性應用，而非通過用戶數據反哺模型升級。

這一洞見不僅顛覆了傳統互聯網方法論，更揭示了AI技術革命的本質：以底層創新驅動上層爆發，而非在既有范式內做數據內卷。海螺AI的快速崛起與DeepSeek的爆火出圈，正是對這一理念的強有力佐證。

2）開源會加速技術進化

當談到MiniMax為何選擇開源時，閆俊杰給出了他的思考，如果重新選，第一天就應該開源。開源會加速技術進化，做得好的地方有鼓勵，不好的地方會有很多批評，外面的人也會有貢獻，這是MiniMax選擇開源的最大驅動力。K哥認為，這是回歸“第一性原理”的思考，但凡能夠加速技術進化的事情，優先級是最高的。

開源的另一個好處，就是有助于技術品牌的建立，MiniMax非常重視技術品牌的打造，這源于閆俊杰對技術品牌的深刻認知，他認為技術品牌之所以重要，本質也是因為這個行業最大的驅動力是技術進化。

在AI領域有一種偏保守的思想認為，開源會影響公司的核心競爭力——因為你把核心技術都開源了，競爭對手很快就會迎頭趕上。閆俊杰卻不認同這種說法，他認為開源不會影響公司的核心競爭力，即便是OpenAI，今天也應該開源，因為它的核心能力已經不是模型比Claude或Gemini好多少，而是ChatGPT的品牌與心智。開源恰恰是對一家AI公司的技術品牌以及用戶心智有好處的。

開源對于AI公司來說是一種長期策略，因為所有模型一年之后都會落后，只有技術的不斷進步才能保持領先，基于這個判斷，MiniMax的通用模型后面也會持續開源。

結束語

凱文·凱利說過：“技術想要什么？它想要進化。”

MiniMax選擇了一條既深且遠的道路，堅持“線性注意力”的非共識技術路線，相信技術驅動，選擇開源。這或許正是科技文明的終極意義：不是獨行者的領跑，而是同行者的共舞。

當硅谷仍沉迷于算力軍備競賽時，中國AI企業正以算法優化與工程效率重塑游戲規則。全球AI競爭的敘事已悄然改寫，中國AI企業正以技術為筆墨，書寫著開放、協作與普惠的新篇章。

在算法的星河中，每一次創新都在追問——我們能否以更低的熵增，抵達更遠的未來？答案，或許就藏在下一行開源代碼當中。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.