最近,全球科技投資界的標桿機構發布的a16z榜單Top 50的AI產品中有近半是來自中國。要知道,只有投資價值極高的產品才會被收錄其中。更值得注意的是,躋身web榜單前列的海螺AI(Hailuo AI)和APP榜前列的Talkie都是來自同一家中國AI公司。其中海螺AI更是力壓可靈和OpenAI的Sora穩居全球視頻生成賽道王座。這家公司就是國內大模型“六小虎”之一,MiniMax。而在較早之前的2025年1月,MiniMax還陸續發布了多款涵蓋多領域的大模型。
模型發布后,很快就吸引了國內外專家、學者和AI愛好者的廣泛關注。這比DeepSeek的爆火,早了一個多月,讓中國AI技術在國際間引發了持續的回響。
01
MiniMax發布多款大模型,引爆全球AI圈
2025年開年,MiniMax連續發布多個大模型,這非常符合MiniMax“技術驅動”的作風:一旦出手,就是王炸。
1)視頻新模型S2V-01。1月10日,MiniMax發布了S2V-01視頻模型,通過單圖主體參考架構,能夠做到傳統方案1%以下的輸入和計算成本。你只需輸入一張圖片, 就可以得到細節還原精確的視頻, 具有高自由度和組合性,而且用時大大縮短。
2)新一代開源模型MiniMax-01系列。緊接著,在1月15日發布了新一代MiniMax-01系列開源大模型,包含基礎語言大模型 MiniMax-Text-01 和視覺多模態大模型MiniMax-VL-01。不同于Transformer傳統架構的是,它采用了線性注意力機制,綜合性能比肩GPT-4o、Claude-3.5等海外領軍模型,并且能夠高效處理高達400萬token的輸入,可輸入長度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。
MiniMax-01系列模型發布后,立刻引發國內外熱議浪潮。海外AI從業者與媒體,對其技術架構路線、模型綜合能力、技術創新性給予了高度肯定。被認為一個來自中國的可以與OpenAI“掰手腕”的頂尖開源模型。
3)語音模型T2A-01-HD。創新的步伐永不停歇,1月20日,MiniMax繼續發布T2A-01系列語音模型,不僅支持17種語言的流暢表達和上百種預置音色,而且音質穩定清晰、韻律自然、情緒精準表達、準確度高,語音生成速度更快、能力更穩定。
4)圖生視頻模型I2V-01-Director。2月24日,MiniMax再度發力,新推出了圖生視頻模型I2V-01-Director。與此前「鏡頭控制」的文生圖視頻T2V-01-Director共同組成01-Director系列。「鏡頭控制」模型讓普通用戶也可以成為導演,無論是文生視頻、圖生視頻,都能夠靈活自主地控制鏡頭語言,釋放你的創作潛能。T2V-01-Director、I2V-01-Director,現已對全球用戶開放,在MiniMax開放平臺和海螺視頻均已上線。
02
押注非共識技術路線:“線性注意力”是未來
在技術創新方面,MiniMax始終保持著業界領先的地位,在底層模型算法上更是不走尋常路,打破Transformer的傳統架構,押注非共識技術路線“線性注意力”。使得MiniMax-01的超長文本處理能力成為業界天花板。
1)Transformer的“稀疏注意力”,有其局限性。Transformer的二次復雜度一直是學界關注的問題,隨著token長度增加,計算量與序列長度的平方成正比,導致算力增加迅速。
稀疏注意力的方案思想是采樣注意力矩陣的部分數據來計算,避免全局計算來減少計算復雜度。但MiniMax認為這樣是以有損的方案逼近Full Attention,而線性注意力的方案可以實現無損優化。
2)模型規模越大,“線性注意力”優勢越明顯。在長文本領域,線性注意力比稀疏注意力更有優勢,尤其當模型規模越大時,線性注意力在計算復雜度上的優化效果越明顯,而且上限極高。而長上下文處理能力可以加強智能體的記憶和通訊,這將是在Agent時代的核心基建。
3)新的深度推理多模態模型,即將發布。K哥了解到,MiniMax將在4~5月份發布基于Linear Attention架構的深度推理多模態模型,模型的綜合能力非常值得期待。
03
MiniMax真正的目標是,加速全球技術迭代
以上,K哥跟大家聊了MiniMax的硬核技術,技術的背后體現了公司的文化以及創始人的技術哲學理念。MiniMax之所以能夠在強手如林的全球AI產業界保持領先位置,跟它的技術信仰是息息相關的。
1)堅持技術驅動的公司,才有生命力
在AI領域不管創業公司還是大廠,仍沿襲互聯網產品的慣性思維,都還在用做推薦系統的方法來做大模型產品。“推薦” 的邏輯是,用戶越多,反饋越多,推薦引擎越聰明。MiniMax創始人閆俊杰卻不這么認為,他在接受媒體采訪時說,“當技術與產品沖突時,技術優先”——他堅定地認為MiniMax為技術驅動型公司,強調技術迭代速度才是核心競爭力,而非短期用戶規模或商業化指標。這一理念外化為兩大實踐:一是清晰定義模型能力分級,通過技術手段逼近目標,而非依賴用戶反饋的被動優化;二是堅信“模型即應用”,即頂尖模型的突破直接催生顛覆性應用,而非通過用戶數據反哺模型升級。
這一洞見不僅顛覆了傳統互聯網方法論,更揭示了AI技術革命的本質:以底層創新驅動上層爆發,而非在既有范式內做數據內卷。海螺AI的快速崛起與DeepSeek的爆火出圈,正是對這一理念的強有力佐證。
2)開源會加速技術進化
當談到MiniMax為何選擇開源時,閆俊杰給出了他的思考,如果重新選,第一天就應該開源。 開源會加速技術進化,做得好的地方有鼓勵,不好的地方會有很多批評,外面的人也會有貢獻,這是MiniMax選擇開源的最大驅動力。K哥認為,這是回歸“第一性原理”的思考,但凡能夠加速技術進化的事情,優先級是最高的。
開源的另一個好處,就是有助于技術品牌的建立,MiniMax非常重視技術品牌的打造,這源于閆俊杰對技術品牌的深刻認知,他認為技術品牌之所以重要,本質也是因為這個行業最大的驅動力是技術進化。
在AI領域有一種偏保守的思想認為,開源會影響公司的核心競爭力——因為你把核心技術都開源了,競爭對手很快就會迎頭趕上。閆俊杰卻不認同這種說法,他認為開源不會影響公司的核心競爭力,即便是OpenAI,今天也應該開源,因為它的核心能力已經不是模型比Claude或Gemini好多少,而是ChatGPT的品牌與心智。開源恰恰是對一家AI公司的技術品牌以及用戶心智有好處的。
開源對于AI公司來說是一種長期策略,因為所有模型一年之后都會落后,只有技術的不斷進步才能保持領先,基于這個判斷,MiniMax的通用模型后面也會持續開源。
結束語
凱文·凱利說過:“技術想要什么?它想要進化。”
MiniMax選擇了一條既深且遠的道路,堅持“線性注意力”的非共識技術路線,相信技術驅動,選擇開源。這或許正是科技文明的終極意義:不是獨行者的領跑,而是同行者的共舞。
當硅谷仍沉迷于算力軍備競賽時,中國AI企業正以算法優化與工程效率重塑游戲規則。全球AI競爭的敘事已悄然改寫,中國AI企業正以技術為筆墨,書寫著開放、協作與普惠的新篇章。
在算法的星河中,每一次創新都在追問——我們能否以更低的熵增,抵達更遠的未來?答案,或許就藏在下一行開源代碼當中。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.