從6月17日開始,MiniMax“發(fā)布周”拉開序幕,發(fā)布新模型、開源等一系列動(dòng)作引發(fā)全球AI圈的關(guān)注。“世界上第一個(gè)開源的大規(guī)模混合架構(gòu)的推理模型”、“性價(jià)比之王”、“登頂全球榜單的開源AI大模型”等關(guān)鍵字更是刷爆海外科技媒體。這是今年,DeepSeek之后,首個(gè)火爆到海外的中國(guó)AI公司,屠榜無數(shù),圈粉許多硅谷科技圈大佬。
下面就跟隨K哥一探究竟,看看MiniMax的系列模型到底牛在哪里。
01
MiniMax系列大模型,在海外掀起浪潮
MiniMax的系列大模型,正在海外掀起熱潮,更重要的是,這些大模型是全自研的基座,并且支持全模態(tài)。這些模型無論是技術(shù)領(lǐng)先性,還是能力,都獲得了國(guó)際權(quán)威測(cè)評(píng)機(jī)構(gòu)的認(rèn)可。
MiniMax-M1,是世界上第一個(gè)開源的大規(guī)模混合架構(gòu)的推理模型。M1在復(fù)雜場(chǎng)景中的能力是開源模型中最好的一檔,超過國(guó)內(nèi)的閉源模型,接近海外的最領(lǐng)先模型,同時(shí)又有業(yè)內(nèi)最高的性價(jià)比。在Artificial Analysis Intelligence榜單當(dāng)中,MiniMax-M1-80k排名前六。
在之前的Artificial Analysis Speech Arena榜單當(dāng)中,MiniMax的Speech-02-HD排名第一。
Artificial Analysis Video Arena上,模型的一個(gè)早期版本Hailuo02(0616),排名全球第二。
MiniMax系列模型的亮眼表現(xiàn),不僅收獲了眾多權(quán)威機(jī)構(gòu)的認(rèn)可,也在海外社交媒體上掀起熱議:這個(gè)能力強(qiáng)悍到碾壓一眾世界頭部AI公司的模型產(chǎn)品,竟然出自一家中國(guó)科技企業(yè)。
02
押注“非共識(shí)”架構(gòu),效果超預(yù)期!刷屏海外媒體圈
MiniMax獨(dú)創(chuàng)的以閃電注意力機(jī)制為主的混合架構(gòu),在計(jì)算長(zhǎng)的上下文輸入以及深度推理的時(shí)候顯著高效。例如,在用8萬Token深度推理的時(shí)候,只需要使用DeepSeek R1約30%的算力,使得訓(xùn)練和推理都有很大的算力效率優(yōu)勢(shì)。
此外,更快地強(qiáng)化學(xué)習(xí)算法CISPO,通過裁剪重要性采樣權(quán)重提升強(qiáng)化學(xué)習(xí)效率。在AIME的實(shí)驗(yàn)中,比字節(jié)近期提出的DAPO等強(qiáng)化學(xué)習(xí)算法收斂性能快了一倍,顯著地優(yōu)于DeepSeek早期使用的GRPO。
最終強(qiáng)化訓(xùn)練過程非常高效,超出預(yù)期。整個(gè)強(qiáng)化學(xué)習(xí)階段只用到512塊H800三周的時(shí)間,租賃成本只有53.47萬美金,比預(yù)期少了一個(gè)數(shù)量級(jí)。
基于以上技術(shù)優(yōu)勢(shì),MiniMax模型一經(jīng)推出,就刷屏海外媒體圈,國(guó)外頂尖科技媒體VentureBeat對(duì)MiniMax-M1進(jìn)行了詳細(xì)報(bào)道,對(duì)其超高效率強(qiáng)化學(xué)習(xí)能力表示贊嘆。
HuggingfaceH的Tiezhen發(fā)帖推薦MiniMax開源模型,點(diǎn)贊其架構(gòu)、模型能力;X知名博主testtm直言,愛上了MiniMax模型,并驚嘆其強(qiáng)悍到不可思議的模型能力;MattVidProAI則表示被MiniMax-M1-80k表現(xiàn)徹底震撼了。
MiniMax系列模型,除了強(qiáng)悍的模型能力,其卓越的性價(jià)比也備受追捧。
03
“AI界的中國(guó)制造”,技術(shù)SOTA,成本碾壓美國(guó)公司
MiniMax被譽(yù)為“AI界的中國(guó)制造”,以模型HAILUO 02為例,不僅技術(shù)領(lǐng)先、優(yōu)勢(shì)明顯,模型價(jià)格上也吊打一眾第一梯隊(duì)的模型廠商。從各廠商官方數(shù)據(jù)來看,價(jià)格是第一梯隊(duì)里最低的,跟豆包、可靈、veo3相比,HAILUO02每秒價(jià)格/視頻單價(jià)最低。
Hailuo 02模型,在架構(gòu)上做了創(chuàng)新。設(shè)計(jì)了更高效的NCR架構(gòu)(Noise-aware Compute Redistribution),訓(xùn)練和推理效率各提升2.5倍;模型參數(shù)量提升3倍,數(shù)據(jù)提升4倍,訓(xùn)練成本并沒有增加太多。正如MiniMax的初心:讓視頻模型accessible to everyone,讓用戶都能用到上限最高、成本最低的模型。他們確實(shí)做到了。
海螺視頻(HailuoVideo)的產(chǎn)品,至今為止已經(jīng)幫助創(chuàng)作者生成了超過3.7億個(gè)視頻,甚至可以生成像馬戲、體操等高度復(fù)雜的場(chǎng)景,也是目前全球唯一一個(gè)可以做到的模型。
美國(guó)AI界正感受到來自中國(guó)力量的挑戰(zhàn),從年初的DeepSeek橫空出世,到最近MiniMax-M1的發(fā)布,中國(guó)企業(yè)堅(jiān)持走技術(shù)自主創(chuàng)新之路,在面對(duì)美國(guó)技術(shù)封鎖和芯片限制的重重困難之下,中國(guó)企業(yè)沒有絲毫退縮,反而催生出算法優(yōu)化和架構(gòu)創(chuàng)新的重大突破。
MiniMax已經(jīng)取得了全球文本模型第一、視頻模型第二、語音模型第一的成績(jī),并且是業(yè)界公認(rèn)的“性價(jià)比之王”。實(shí)際上MiniMax一直被國(guó)內(nèi)低估,這跟他們一貫低調(diào)務(wù)實(shí)的硬核技術(shù)派作風(fēng)有關(guān),其實(shí)技術(shù)實(shí)力很強(qiáng),就目前來說已經(jīng)是國(guó)內(nèi)第一梯隊(duì)的大模型公司了,并且將代表中國(guó)繼續(xù)留在世界AI牌桌上,跟國(guó)外科技巨頭抗衡。
值得注意的是,MiniMax選擇了開源這條路,在當(dāng)前AI基礎(chǔ)大模型競(jìng)爭(zhēng)激烈的背景下,這個(gè)決定不簡(jiǎn)單。體現(xiàn)了中國(guó)企業(yè)的智慧與大度。首先,開源能夠迅速擴(kuò)大影響力,讓全球開發(fā)者都能共享中國(guó)AI技術(shù)成果;其次,這是對(duì)美國(guó)AI技術(shù)封鎖最強(qiáng)有力地反擊,集全世界的力量共同對(duì)抗美國(guó)AI霸權(quán)。
在MiniMax等中國(guó)AI公司的不斷努力之下,已經(jīng)有效縮短了中美大模型之間的技術(shù)代際差,雖然與GPT-4等頂級(jí)模型相比,仍然有差距,但是AI產(chǎn)業(yè)正處于快速發(fā)展階段,套用一句中國(guó)的老話:乾坤未定,你我皆黑馬。美國(guó)很可能進(jìn)一步加強(qiáng)技術(shù)封鎖,中國(guó)的優(yōu)勢(shì)是人口多、市場(chǎng)大,年輕一代的企業(yè)家有智慧有謀略、敢打敢拼,任憑誰也無法將我們邊緣化。毫無疑問,中國(guó)企業(yè)將會(huì)成為AI時(shí)代的中流砥柱。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.