2025年開年,國產的大模型頻頻“刷屏”。
DeepSeek用低成本和高性能震撼了世界,MiniMax一出手就是“王炸”,MiniMax-01憑借超長的長文本理解能力,被海外媒體、投資人和研究員認為是可以和OpenAI“掰手腕”的頂尖開源模型。
之前還有人說中國頂尖企業的大型語言模型大約落后美國同行6到9個月,這怎么突然間就領先了呢?
其實,如果我們仔細看看這些優秀大模型的特點和最近的發展策略,就能從中找到答案。
01
底層技術創新是根本
MiniMax針對大模型最底層、最核心的Transformer架構進行了重構,它第一次在一個超大規模商用模型上,引入了有別于傳統Transformer架構的線性注意力機制,以極低的算力成本,為困擾著整個大模型行業的難題提供一個新的解題思路。
這種底層技術創新讓MiniMax-01大模型能夠高效處理高達400萬token的輸入,可輸入長度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。
特別值得一提的是,最近包括DeepSeek在內的多家公司的最新研究論文均聚焦于通過改進傳統稀疏注意力機制的架構來提升大語言模型的長文本處理能力,而MiniMax早在1月中旬就把具備超長文本處理能力的模型發布并且開源了!
同樣,DeepSeek也是在大模型中采用了創新的架構,從而實現了極低的訓練成本和很好的推理能力。
由于MiniMax-01大模型在底層技術層面做出了創新,所以一經發布,立刻在海外引起了熱議浪潮。
除了開源模型,在文生視頻領域,MiniMax也做了重要更新。
基于MiniMax S2V-01視頻模型的“主體參考”功能,僅需上傳一張圖片即可識別并鎖定主體角色。文本框內輸入Prompt提示詞,無需漫長等待,即可生成富有創意且主體保持一致的高質量視頻。
主體參考+Prompt:A close-up of a young boy in a dimly lit room, his eyes fixed on the glowing screen of a gaming console. The camera is positioned slightly above eye level, focusing on his concentrated expression as his fingers nimbly manipulate the controller. A game character appears, breaking free from the screen's confines.
2024年12月,基于MiniMax大模型的海螺AI海外訪問量超2700萬,突破歷史新高并榮登12月全球AI視頻產品榜首位。
所以,對于一家大模型公司來說,堅持技術驅動,堅持底層架構創新,不在產品上繡花,才是AI時代的正確打法。
DeepSeek、MiniMax等公司就是這么做的,所以它們可以在眾多大模型中脫穎而出。
02
前瞻性的戰略布局
MiniMax的CEO閆俊杰在接受采訪時說道:“中國大部分公司,不管創業公司還是大廠,都還在用做推薦系統的方法來做大模型產品。”
“推薦” 的邏輯是:用戶越多,反饋越多,推薦引擎越聰明。
而閆俊杰認為,AI 大模型和產品的真實關系是:“更好的模型可以導向更好的應用,但更好的應用和更多用戶并不會導向更好的模型。”
換句話說,一個大模型智能的提升,并不是靠上層的應用和更多的用戶,而是靠模型自己的迭代創新。
用戶數并不是AI競爭的核心,所以MiniMax很早就轉換了自己的目標:加速模型的技術迭代。
MiniMax-01模型就是這種前瞻性戰略決策的成果之一,它首次在 4000 億以上參數的大模型中,使用了線性注意力機制新架構,能高效處理全球最長的 400 萬 token 上下文。
DeepSeek的爆火也證明了這一點,它不宣傳用戶數、API調用量這些數據,就靠強悍的模型能力,便宜的價格,在7天內狂攬1億用戶,增長速度非常夸張。
除此之外,MiniMax和DeepSeek一樣,都走上了和OpenAI相反的道路:開源。
這種策略立刻點燃了全球用戶的熱情,掀起了討論、部署、使用的狂潮,這種盛況是前所未有的,在封閉的ChatGPT時代是絕對不可能看到的。
當全世界的用戶都能接觸到最前沿的技術,并且進行持續改進時,閉源是無論如何都打不過開源的。
全世界的開發者完全可以站在開源的MiniMax-01的肩膀上,構建無數的應用生態,推動大模型加速向AGI方向發展。
開源形成巨大的影響力,占領了用戶的心智,無形中極大地提升了MiniMax和DeepSeek的全球技術品牌。
這就給閉源的大模型公司形成了巨大的壓力,最近,就連OpenAI CEO 山姆?阿爾特曼也承認:“我們過去在開源方面一直站在歷史錯誤的一邊...... OpenAI需要‘弄清楚另一種開源戰略’”
03
中國大模型很有希望
從DeepSeek、MiniMax等公司的成長軌跡和戰略布局中,我們可以清晰地看到,國產大模型不僅有能力迅速追趕國際領先水平,更具備超越的潛力。
它們選擇了一條艱難但正確的道路:深耕底層技術,以創新為核心驅動力,同時通過開源大模型吸引全球開發者,構建開放生態。
這種“技術深耕+生態開放”的雙輪驅動模式,釋放出了強大的創新勢能。在通往AGI(通用人工智能)的道路上,“顛覆”將成為常態,而只有那些持續突破底層技術、并成功構建繁榮生態的企業,才能在激烈的競爭中脫穎而出,成為最后的贏家。
隨著更多類似MiniMax企業的涌現,中國大模型的發展前景將不可限量,有望在全球AI舞臺上占據領先地位。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.