全球AI圈又沸騰起來了。
6月17號(hào),MiniMax“發(fā)布周”拉開序幕,又是開源又是發(fā)布新模型,一系列動(dòng)作令業(yè)內(nèi)驚呼。新模型MiniMax-M1,是“世界上第一個(gè)開源的大規(guī)模混合架構(gòu)的推理模型”,被視為“性價(jià)比新王”。值得一提的是,這只是一道“開胃菜”。
MiniMax,這個(gè)名字創(chuàng)投圈并不陌生。身后掌舵者是一位89年的博士閆俊杰,他早年任職于AI四小龍之一的商湯科技,后來在2022年投身到AGI創(chuàng)業(yè)之中。早在ChatGPT爆紅前,MiniMax就已經(jīng)成為國產(chǎn)大模型的代表性企業(yè)。
三年長成一只獨(dú)角獸,MiniMax成長速度驚人,無疑是這波瀾壯闊的AI時(shí)代一抹最生動(dòng)的寫照。
89年博士帶隊(duì)
一個(gè)上海AI獨(dú)角獸崛起
閆俊杰是MiniMax的靈魂人物。
1989年,閆俊杰出生在河南的一座小縣城。他從中國科學(xué)院自動(dòng)化研究所博士畢業(yè)后,繼續(xù)在清華大學(xué)計(jì)算機(jī)系從事博士后研究。他的學(xué)術(shù)成就令人印象深刻在深度學(xué)習(xí)和計(jì)算機(jī)視覺領(lǐng)域,發(fā)表過頂級(jí)會(huì)議和期刊論文100余篇, Google Scholar引用超過10000次。
博士期間,閆俊杰加入商湯科技,從實(shí)習(xí)生一路做起,曾任商湯集團(tuán)副總裁、研究院副院長和智慧城市事業(yè)群 CTO。期間,他一手打造了通用計(jì)算機(jī)視覺模型、深度學(xué)習(xí)工具鏈、智慧城市和人臉識(shí)別相關(guān)的技術(shù)體系。
直到2021年年底,閆俊杰結(jié)束了這份工作,一度做好了去當(dāng)老師的準(zhǔn)備,但一件事改變了他的想法。
在去年的MiniMax OpenDay上,閆俊杰講到,有一天外公告訴他想寫一本回憶錄,卻沒辦法做到,因?yàn)樾枰浅:玫恼Z言組織能力,并且外公不會(huì)打字。“那個(gè)時(shí)候,我認(rèn)為只有人工智能可以幫他實(shí)現(xiàn)這件事。”
當(dāng)時(shí),人工智能技術(shù)是根據(jù)特殊的需求來定制模型,只能解決特定的問題,例如人臉識(shí)別和語音識(shí)別,實(shí)際產(chǎn)生的價(jià)值很局限。閆俊杰意識(shí)到,唯一的解決辦法就是把人工智能變的更加通用,變成普通人生活中的一部分。
于是在2022年初,閆俊杰在上海正式創(chuàng)立MiniMax,在一個(gè)不到 100 平米的房間里寫下了初心和路徑以“與所有人共創(chuàng)智能”為使命,致力于實(shí)現(xiàn)通用人工智能(AGI)。此時(shí)“大模型”這一概念尚未出現(xiàn),MiniMax所做的事情,簡而言之就是一邊做模型一邊做模型驅(qū)動(dòng)的產(chǎn)品。
(2024年8月MiniMax OpenDay現(xiàn)場,團(tuán)隊(duì)展示最早對智能體的思考)
由此一來,MiniMax成為國內(nèi)僅有的兩家在ChatGPT發(fā)布前,便積極布局大模型研發(fā)的企業(yè)之一。直到2023年,爆火的ChatGPT才將大模型帶入大眾視野,從而點(diǎn)燃國內(nèi)“百模大戰(zhàn)”的戰(zhàn)火。
而早在2022 年 10 月,MiniMax的第一款A(yù)I產(chǎn)品就已上線,之后又陸續(xù)推出星野/Talkie、海螺 AI 等C端產(chǎn)品,覆蓋了內(nèi)容創(chuàng)作、智能助手以及娛樂應(yīng)用等領(lǐng)域。閆俊杰一直將MiniMax定位為一家“技術(shù)驅(qū)動(dòng)的公司”。他曾以海螺AI對比同類型產(chǎn)品,表示有一些簡單的功能問題不是不能解決,而是一旦去解決,精力就會(huì)分散,導(dǎo)致模型進(jìn)步速度變慢,因此MiniMax優(yōu)先做算法上限高的功能。
正因如此,2023下半年,在大部分國內(nèi)大模型廠商還在繼續(xù)迭代稠密模型(dense model)之際,MiniMax卻出乎意料地將大量資源投入到MoE架構(gòu)中,這在當(dāng)時(shí)業(yè)內(nèi)看來是一個(gè)非共識(shí)選擇。隨后,MiniMax在2024年1月上線abab 6模型,成為國內(nèi)首個(gè)MoE大模型。緊接著又推出abab 6.5 系列模型,開創(chuàng)了用 MoE 架構(gòu)進(jìn)行大規(guī)模商業(yè)化部署的先河。
這一幕極具風(fēng)向標(biāo)意義。
自此,MoE架構(gòu)徹底取代稠密架構(gòu),成為大模型領(lǐng)域技術(shù)迭代的新方向。但這還遠(yuǎn)遠(yuǎn)不夠,布局多模態(tài)則是他們打出的另一張牌。2024年8月,MiniMax一口發(fā)布了視頻生成大模型 abab-video-1、音樂模型abab-music-1;隨后在2025年1月,又推出了基于MOE+ Lightning Attention的新一代開源文本模型。
憑借于此,這只國產(chǎn)AI獨(dú)角獸也成功出海數(shù)據(jù)顯示,每天MiniMax的大模型和全球終端用戶進(jìn)行30億次交互;此外從2024年10月到2025年3月,海螺視頻/Hailuo AI的月訪問量位列全球第一,力壓海外的Sora、Runway等產(chǎn)品;同時(shí),MiniMax開放平臺(tái)快速成長,到今年已有全球超過5萬名注冊企業(yè)客戶和開發(fā)者,在超過200多個(gè)國家和地區(qū)實(shí)現(xiàn)了合作落地。
悄然間,這股來自中國的AI力量開始席卷全球。
最“卷”大模型誕生
震撼全球AI圈
在業(yè)內(nèi)看來,MiniMax正在朝著“AI無人區(qū)”沖刺。
眾所周知,在今年DeepSeek爆火出圈之后,一個(gè)問題接踵而來,擺在一眾大模型企業(yè)面前:是做別人的跟隨者,還是要踏出一條嶄新的路?
對于MiniMax而言,答案自然是后者。因?yàn)檫@支團(tuán)隊(duì)十分清楚,盲目去做一個(gè)跟隨者,要么被甩開看不見蹤影,要么早早淘汰出局。只有做自己,去開辟一條大模型新征程,繼續(xù)永無止境的創(chuàng)新,才能將未來掌握在自己手中,越過一座座高山。
于是,MiniMax-M1模型應(yīng)運(yùn)而生。作為本次“發(fā)布周”的第一個(gè)重頭戲,MiniMax-M1留給外界深刻印象。技術(shù)報(bào)告顯示,M1模型支持目前業(yè)內(nèi)最高的100萬上下文的輸入,跟閉源模型里面的 Google Gemini 2.5 Pro 一樣,是 DeepSeek R1 的 8 倍,以及業(yè)內(nèi)最長的8萬Token的推理輸出。
此外,MiniMax-M1的RL(強(qiáng)化訓(xùn)練)成本下降一個(gè)量級(jí),成本僅53萬美元,推理效率則數(shù)倍于同類模型;在工具使用場景中MiniMax-M1-40k同樣領(lǐng)跑所有開源權(quán)重模型,超過Gemini-2.5Pro。
由此不免讓人感慨,“性價(jià)比新王誕生。”閆俊杰在微信朋友圈分享感受,“第一次感覺到大山不是不能翻越。”
而性能方面,M1通過17個(gè)主流評測集進(jìn)行了全面“大考”。結(jié)果顯示,M1在軟件工程、長文本理解和工具使用等面向生產(chǎn)力的復(fù)雜場景中,優(yōu)勢尤為突出。一個(gè)鮮為人知的細(xì)節(jié)是,其實(shí)早于DeepSeek R1發(fā)布前一周,MiniMax就已經(jīng)在今年1月發(fā)布了MiniMax-01并正式開源,并首次嘗試使用線性注意力架構(gòu)Linear Attention。
當(dāng)中還有一個(gè)插曲前不久,將被OpenAI收購的多模型支持平臺(tái)Windsurf,突然遭到AI巨頭Anthropic斷供。這顯然給AI應(yīng)用開發(fā)者敲響警鐘,意味著當(dāng)基礎(chǔ)模型等核心技術(shù)無法掌握在自己手里時(shí),危險(xiǎn)時(shí)刻存在。進(jìn)而AI產(chǎn)品勢必要考慮模型層不被卡脖子,保持一定的技術(shù)儲(chǔ)備,在最大程度上抵消風(fēng)險(xiǎn)。開源模型,在此刻顯得尤為重要。
由此一來,MiniMax-M1作為開源大模型的價(jià)值更加凸顯。于MiniMax而言,這是打開新商業(yè)化突破口所在,一旦形成規(guī)模化的商業(yè)落地,就能獲得源源不斷地“子彈”,從而應(yīng)對接下來更多未知的挑戰(zhàn)。
MiniMax“發(fā)布周”的好戲才剛剛開場外界期待已久的新視頻生成模型 Hailuo 02也來了。據(jù)MiniMax透露,得益于創(chuàng)新架構(gòu)“NCR”,Hailuo 02的總參數(shù)量,相比上一版模型擴(kuò)大了3倍,數(shù)據(jù)量也擴(kuò)大到4倍,由此使得模型提升顯著。同時(shí),Hailuo 02可以用相對實(shí)惠的價(jià)格生成原生的1080p視頻,對比其它同類模型,成本優(yōu)勢十分明顯。
令人驚訝的是,在AA視頻競技場視頻競技排行榜中, Hailuo?02 已在“Image to Video”欄目中高居第 2 位。
而稍早前,MiniMax的新一代語音大模型 Speech-02 亮相,一舉在國際權(quán)威的 Artificial Analysis和Hugging Face TTS Arena 兩大語音評測榜單上,拿下“雙料冠軍”。這也意味著,中國AI技術(shù)在語音生成領(lǐng)域直接實(shí)現(xiàn)“彎道超車”。
如此一幕幕,印證了閆俊杰此前所言,“更好的模型可以導(dǎo)向更好的應(yīng)用。
Sequoia Capital(紅杉資本)曾分享過三種PMF框架:緊急解決型(hair on fire)、痛點(diǎn)轉(zhuǎn)換型(hard fact)、未來愿景型(future vision)。其中,“未來愿景”路徑失敗的方式最多,成功的方式最少,但潛在回報(bào)最大。顯然,閆俊杰與MiniMax走的就是這第三條路,一條真正屬于自己的創(chuàng)新之路。
一段新征程開啟
回顧MiniMax的成長歷程,身后早已集結(jié)一支長長的投資人隊(duì)伍。
早在成立之初,MiniMax就完成了首輪融資,高瓴、米哈游、IDG資本和云啟資本出手。彼時(shí)在云啟資本合伙人陳昱的印象中,閆俊杰“very rounded(全面)”。后來,他便介紹云啟資本創(chuàng)始合伙人毛丞宇與閆俊杰見面,雙方很快就完成這筆投資。
2022年7月,MiniMax完成了Pre-A輪融資,投資方包括明勢資本和米哈游等。明勢資本創(chuàng)始合伙人黃明明曾回憶,最早是在2021年底,經(jīng)米哈游聯(lián)合創(chuàng)始人劉偉介紹,他認(rèn)識(shí)了剛剛創(chuàng)業(yè)的閆俊杰。“第一次見面,坦白說我并沒有聽懂在講什么,但好在夏令聽懂了,說這個(gè)項(xiàng)目一定要投。”夏令是明勢資本合伙人,最終明勢資本完成了這一筆投資。
隨后MiniMax又完成多輪融資,但并未公開披露。據(jù)悉在2023年6月,MiniMax完成一輪超過2.5億美元的融資,估值超過了12億美元。時(shí)隔一年,MiniMax又獲得6億美元A輪融資,投后估值25億美元,由阿里巴巴領(lǐng)投,轟動(dòng)一時(shí)。據(jù)知情人士消息,MiniMax估值早已超過30億美元。
眼下,全球AI融資競賽仍在繼續(xù)。
然而一半海水一半火焰,技術(shù)創(chuàng)新陷入瓶頸的AI企業(yè)不在少數(shù),一旦融資無門,等待他們的只有被淘汰的結(jié)局。而目前MiniMax的估值仍在上漲,這背后無疑是投資人在用真金白銀投票。
今年以來,海內(nèi)外頭部AI大廠加快了攻城略地的速度,例如OpenAI已連續(xù)發(fā)布多款新模型,GPT-5預(yù)計(jì)將于今年夏季發(fā)布;字節(jié)跳動(dòng)掀起了新一輪的價(jià)格戰(zhàn),阿里巴巴則宣布未來三年在云和AI投入3800億元……
如何突破巨頭的夾擊,擺在了大多數(shù)AI獨(dú)角獸面前。
此情此景,走出自己的路,不去追隨別人的成長路徑更顯重要。正所謂“打鐵仍需自身硬”,MiniMax突圍的關(guān)鍵,就在于要繼續(xù)做自己,靠自己才能贏。
于是,當(dāng)Agent 爆發(fā)元年來臨,MiniMax再度發(fā)力。“發(fā)布周”第三天,MiniMax Agent宣告誕生,這是一個(gè)能完成長程復(fù)雜任務(wù)的通用智能體,用團(tuán)隊(duì)的話來說,他們是按照“靠譜的人”的標(biāo)準(zhǔn)來設(shè)計(jì)和要求Agent。僅從這一標(biāo)準(zhǔn)而言,就已與市面上同類型產(chǎn)品形成差異化。
與此同時(shí),MiniMax今天還發(fā)布了Hailuo Video Agent,一款視頻創(chuàng)作Agent。只需簡單輸入,Agent將自動(dòng)分析、構(gòu)思并生成具有專業(yè)水準(zhǔn)、富有觀看價(jià)值的完整視頻內(nèi)容,以往具有挑戰(zhàn)的視頻創(chuàng)作流程將被取而代之。
正如云啟資本合伙人陳昱此前分析,“無限長的長文本能力是MiniMax團(tuán)隊(duì)一直在打磨的重要維度,對于做社交應(yīng)用、情感陪伴應(yīng)用,Agent等來說是很關(guān)鍵的技術(shù)。”
猶記得今年4月,MiniMax曾在一場重要活動(dòng)上路透過一張對于未來Agent的規(guī)劃圖,將Agent的進(jìn)化分為了五大要素,包含模態(tài)內(nèi)容、上下文窗口、模型調(diào)用、任務(wù)復(fù)雜度和智能體協(xié)作。可以發(fā)現(xiàn),這些要素如今正在MiniMax的產(chǎn)品中一一落地。
換言之,MiniMax想做的都在做,并且一直在堅(jiān)持做自己,不為外界噪音所干擾。
長路漫漫。中國AGI這場新征途才剛剛開始。閆俊杰曾判斷,“未來全球AGI只有五家公司的話,至少有兩家中國公司。”言語間,MiniMax正朝著這個(gè)目標(biāo)前進(jìn)。
毋庸置疑,中國需要誕生自己的OpenAI,也終將誕生屬于自己的OpenAI。在這條未知路上,一批批新鮮血液從四面八方趕來,共同投身到這場不能輸?shù)目萍几傎悺?/p>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.