繼2月、5月楊植麟和梁文鋒兩次論文“撞車”后,本周,楊植麟和閆俊杰首次在大模型賽道中“撞車”,目標(biāo)則是梁文鋒的DeepSeek。
近日,月之暗面發(fā)布首款面向軟件工程任務(wù)的開源代碼大模型Kimi-Dev-72B,基于720億參數(shù)的Qwen2.5-72B模型訓(xùn)練,采用大規(guī)模強化學(xué)習(xí)方式優(yōu)化,在SWE-bench Verified基準(zhǔn)上實現(xiàn)60.4%準(zhǔn)確率,超越DeepSeek等模型。而且,6月20日晚,月之暗面發(fā)布首個Agent,宣布小范圍內(nèi)測Kimi-Researcher(深度研究)。
與此同時,“大模型六小虎”(智譜、百川、零一、MiniMax、月之暗面、階躍星辰)里面的另一家公司MiniMax進入新品周,連續(xù)發(fā)布五個產(chǎn)品:RL訓(xùn)練成本僅53萬美元(約380萬元)、性能比肩DeepSeek的開源推理模型MiniMax-M1,成為上下文最長的推理模型;性能僅次于字節(jié)Seedance 1.0、超越Veo3的Hailuo 02(0616)視頻模型;通用智能體產(chǎn)品MiniMax Agent;海螺視頻Agent;以及今天發(fā)布的MiniMax Audio更新版本。
值得注意的是,“大模型六小虎”也在爭奪第一股。繼智譜之后,據(jù)彭博,稀宇科技(MiniMax)正考慮赴港首次公開募股(IPO),估值約30億美元,目標(biāo)是在今年IPO,已經(jīng)與投行進行溝通。另據(jù)字母榜,六小虎里已經(jīng)有五家在籌備上市。
顯然,隨著DeepSeek躋身AI領(lǐng)域“頂流”之列,從月之暗面CEO楊植麟、閆俊杰,到其他“大模型六小虎”企業(yè)創(chuàng)業(yè)者,都仿佛被DeepSeek、字節(jié)、阿里等多座“大山”壓得步履維艱。他們借助技術(shù)產(chǎn)品發(fā)聲,字里行間無不透露著“自己不希望被遺忘”。
MiniMax創(chuàng)始人兼CEO閆俊杰近期發(fā)文表示,“第一次感覺到大山不是不能翻越。”
然而,多名業(yè)內(nèi)專家告訴筆者,基座級大模型的爭奪,關(guān)鍵還是參數(shù)的大小,而目前的情況是,這六家公司都缺少強大的計算能力,也沒有足夠的專業(yè)技術(shù)人員,不少高管都已經(jīng)離開了字節(jié)跳動、阿里這樣的大公司。因此,錢不夠、卡不夠、數(shù)據(jù)不夠、商業(yè)化艱難,這種情況下“大模型六小虎”不得不分化找尋融資出路,面臨多重挑戰(zhàn)。
IDC分析師稱,2023年-2028年中國生成式AI軟件市場規(guī)模大約只有48.9億元,包含企業(yè)級AI平臺、應(yīng)用規(guī)模,相比算力和基礎(chǔ)設(shè)施規(guī)模簡直不值一提。“現(xiàn)在消費級AI應(yīng)用培育出來市場規(guī)模并不大。”
針尖對麥芒,MiniMax和kimi都對標(biāo)DeepSeek
“DeepSeek之前,人們認(rèn)為中國的 AI 模型落后了好幾年,而我們意識到它們實際上只落后了幾個月。”美國白宮加密貨幣和AI事務(wù)負(fù)責(zé)人David Sacks近期表示,在AI大模型方向,中國落后美國大概是3-6個月。
事實上,自年初開始,DeepSeek(深度求索)以低成本、高性能的開源模型迅速崛起,導(dǎo)致“大模型六小虎”的融資面臨挑戰(zhàn),這六家企業(yè)正經(jīng)歷著前所未有的行業(yè)洗牌。從商業(yè)模式的重構(gòu)到資本寒冬的侵襲,從人才流失的陣痛到技術(shù)路線的迷茫,“六小虎”的生存圖景在DeepSeek的沖擊下呈現(xiàn)出復(fù)雜而嚴(yán)峻的局面。
“市面上90%的AI服務(wù),都是‘偽AI’。”梅花創(chuàng)投創(chuàng)始合伙人吳世春近期表示,很多AI技術(shù)缺乏護城河,AI技術(shù)公司若無法構(gòu)建底層技術(shù)壁壘,終將面臨被替代風(fēng)險,行業(yè)需警惕偽創(chuàng)新泡沫。每次大模型升級都會對其造成沖擊,所有套殼行為都只是短期套利。
“大模型六小虎”公司早期普遍以“通用大模型+行業(yè)解決方案”為核心商業(yè)模式,試圖通過技術(shù)授權(quán)、定制化項目和云服務(wù)獲得收入,包括API服務(wù)、內(nèi)嵌廣告業(yè)務(wù)、訂閱服務(wù)、定制化開發(fā)、應(yīng)用合作分成等。
而如今,在DeepSeek熱潮刺激之下,對于通用人工智能(AGI)的目標(biāo)更為明確。
清華大學(xué)教授、智譜AI創(chuàng)始人唐杰近期分享了上述這張圖,通過多種多類的多模態(tài)AI大模型,可以直接對標(biāo)人類的大腦、小腦,形成讓機器像人一樣的思考能力。
而這次,MiniMax和Kimi月之暗面迎來了首次在大模型賽道“撞車”,幾乎同一時間發(fā)布新產(chǎn)品。
其中,MiniMax連續(xù)五天發(fā)布新品,推出了推理模型、視頻模型、語音模型、Agent智能體等技術(shù),幾乎瞄準(zhǔn)的都是智譜現(xiàn)有的技術(shù)產(chǎn)品。
而MiniMax發(fā)布的MiniMax-M1系列模型引發(fā)廣泛關(guān)注,其在處理百萬級Token的長文本上實現(xiàn)了重大突破,并且其RL(強化訓(xùn)練)成本下降一個量級,成本僅53萬美元(約380萬元),推理效率則數(shù)倍于競爭對手。
據(jù)論文顯示,在工具使用場景(TAU-bench)中MiniMax-M1-40k同樣領(lǐng)跑所有開源權(quán)重模型,超過Gemini-2.5 Pro;代碼能力(SWE-bench)方面,M1-40k和M1-80k版本分別取得了55.6%和56.0%的優(yōu)異成績,顯著超越其他所有開源模型,穩(wěn)居第一梯隊;長文本(MRCR)方面,依托百萬級上下文窗口,M1系列在此項任務(wù)中不僅全面超越了所有開源對手,甚至擊敗了OpenAI的GPT-4o和Anthropic的Claude 3 Opus,在全球范圍內(nèi)僅以微弱差距落后于谷歌的Gemini 2.5 Pro,位列全球第二。
目前,MiniMax-M1已宣布開源。價格方面,針對0-32k Token處理層面,輸入0.8元/百萬Token,輸出8元/百萬Token;32k-128k Token層面,輸入1.2元/百萬Token,輸出16元/百萬Token;128k-1M Token層面,輸入2.4元/百萬Token,輸出24元/百萬Token。
相比文本模型,雖然MiniMax圖生視頻模型海螺Hailuo-02效果更好,但會員價格更昂貴,一年訂閱最高1499.99美元(約為人民幣10769元),每月12000個積分(約合生成480個視頻)、10秒視頻生成,相比愛詩、生數(shù)Vidu(一年6710元)、快手可靈(鉆石5594元)等同行C端收費模式貴很多,更不用說B端的預(yù)付費模式了。
從MiniMax整體來看,一方面在于拓展產(chǎn)品矩陣,目前海螺 AI 與新上線的 MiniMax Agent 均已開啟訂閱服務(wù);另一方面則聚焦付費意愿更強的海外市場,近期推出的模型及產(chǎn)品均同步在海外進行上線。
很顯然,結(jié)合與MiniMax即將IPO消息來看,MiniMax或許“燒不動”投資人的錢,打算用更大的利潤和收入滿足IPO上市要求,從而讓MIniMax盡快實現(xiàn)IPO上市。
閆俊杰曾向筆者表示,當(dāng)國內(nèi)大模型“價格戰(zhàn)”發(fā)生后,大部分公司認(rèn)為大模型很貴,之后很多人認(rèn)為大模型很便宜,可以放心地使用。最終非常驚人地發(fā)現(xiàn),有許多傳統(tǒng)企業(yè)非常愿意使用大模型,他們覺得反正成本低,出錯了之后也不要緊,多調(diào)用一次就好了。客觀地來說,這極大提高了模型調(diào)用量,從而推動模型做得更好,至少目前在非英語語種上,國內(nèi)大模型水平已與GPT不相上下。因此,從樂觀角度看,國內(nèi)大模型的使用量確實在顯著地增長,并且中國 AI 大模型在海外確實越來越具有競爭力。
“競爭不可避免,既然不能避免,就要努力做到最好。”閆俊杰稱,“在同等計算GPU條件下,盡可能訓(xùn)練更多的輪次、更大數(shù)據(jù),做一些科研上的比較有挑戰(zhàn)的事,做別人沒有做過的事情。經(jīng)過幾次科研的突破,其實能以比較有限的資源,做出一個在國際上第一梯隊多模態(tài)的表現(xiàn),這個我們目前還是比較驕傲的。”
相比MiniMax,月之暗面不再專門做文生視頻、圖生視頻模型,而是專注于LLM理解和思考,直接瞄準(zhǔn)DeepSeek。
6月17日,月之暗面發(fā)布最新開源編碼模型Kimi-Dev-72B,在SWE-bench Verified上取得了 60.4% 的性能提升,超越DeepSeek,創(chuàng)下開源模型SOTA成績。
隨后,月之暗面更進一步,6月20日晚發(fā)布其首個Agent——Kimi-Researcher,采用異步執(zhí)行方式,用更多時間逐步推理、檢索和撰寫內(nèi)容。月之暗面表示,模型即Agent,Kimi-Researcher是基于端到端自主強化學(xué)習(xí)技術(shù)訓(xùn)練的新一代Agent模型,也是一個專為深度研究任務(wù)而生的Agent產(chǎn)品。
性能方面,在紅杉中國發(fā)布的xbench基準(zhǔn)測試,Kimi-Researcher在DeepSearch任務(wù)中取得69%的平均通過率,領(lǐng)先該榜DeepSeek等其他模型。而在Humanity’s Last Exam(HLE)中,Kimi-Researcher性能超過OpenAI Deep Research(26.6%)、Gemini 2.5 Pro(21.6%),和Gemini-Pro 的 Deep Research Agent(26.9%)打平。
“我們也將逐步開源 Kimi-Researcher 基礎(chǔ)預(yù)訓(xùn)練模型、以及強化學(xué)習(xí)后的模型,希望與大家一起推動Agent強化學(xué)習(xí)方向的探索。”月之暗面表示。
據(jù)筆者了解,月之暗面也在考慮IPO上市或其他資本化事宜。早前有報道指出,楊植麟已在內(nèi)部定下通用AI模型目標(biāo),減少投流而把更多資源轉(zhuǎn)向AI模型技術(shù)能力迭代。
很顯然,大家都想對標(biāo)DeepSeek。筆者了解到,近期智譜也將推出新技術(shù)產(chǎn)品,依然瞄準(zhǔn)DeepSeek。
六小虎搶大模型第一股,今年上半年A股 IPO融資增長14%
2023年上半年,百川智能、階躍星辰、零一萬物和月之暗面成立,DeepSeek 也是這一年成立。智譜和 MiniMax 要更早些,分別是在2019年和2021年,如今估值都高達200億元左右。
從時間來看,“大模型六小虎”已經(jīng)可以開始籌備IPO了。因此當(dāng)前,六家公司都在追逐IPO上市之路。
今年4月14日,智譜正式提交上市輔導(dǎo)備案,由中金公司擔(dān)任輔導(dǎo)機構(gòu)。成為六小虎中首家啟動IPO進程的企業(yè)。
如今,MiniMax也在籌劃赴港IPO。
然而,時間先后并非IPO的最大優(yōu)勢,智譜未必有先發(fā)優(yōu)勢。據(jù)智譜公布的備案計劃,上市輔導(dǎo)分三階段推進:4月完成摸底調(diào)查與方案制定;5月至7月聚焦規(guī)范整改與持續(xù)盡調(diào);8月至10月進入沖刺期,籌備上市申請文件。也就是籌備IPO,再加上審批、路演等等必要程序,距離招股書還有半年多時間,離IPO上市執(zhí)照還有半年到一、兩年的時間。
2025陸家嘴論壇上,中國證監(jiān)會宣布計劃在上海以科技股為主的科創(chuàng)板設(shè)立新板塊,以容納尚未盈利的成長型企業(yè)。其中不僅重點提到 AI 企業(yè),更提及將重啟未盈利企業(yè)適用科創(chuàng)板第五套標(biāo)準(zhǔn)上市,近期兆芯、PPIO等多家AI公司都是在這樣一個大環(huán)境下啟動IPO。
有多家企業(yè)負(fù)責(zé)人告訴筆者,對于科創(chuàng)板第五套標(biāo)準(zhǔn)上市正在仔細(xì)研讀,這對于很多AI、半導(dǎo)體、機器人等領(lǐng)域處于虧損的科技企業(yè)來說是一件利好。
智譜今年3月曾向筆者透露,2024年以來,智譜的ARR商業(yè)化收入取得了100%以上的增長。
“在B端,在 API 價格大幅普惠的情況下,智譜MaaS開放平臺API年收入同比增長超過30倍;在C端,2024年三季度上線付費功能以來,‘智譜清言’預(yù)計年收入超過千萬元。目前,智譜清言擁有超過2500萬用戶。”智譜稱。
不過,“大模型六小虎”陸續(xù)出現(xiàn)高管離職情況,對于企業(yè)發(fā)展和市場觀感等極為不利,有可能成為上市阻礙。
- 智譜AI在2025年上半年有4名高管離職,包括首席運營官張帆、智譜應(yīng)用AI與合作副總裁李惠子等,但公司表示這些變動不會影響整體融資和業(yè)務(wù)進展。同時,公司引入了Midjourney前高管,強化C端市場布局。
- MiniMax公司合伙人魏偉等商業(yè)化負(fù)責(zé)人離職,但官方表示這是B端業(yè)務(wù)進入新發(fā)展階段的正常調(diào)整。
零一萬物聯(lián)合創(chuàng)始人谷雪梅、技術(shù)副總裁戴宗宏等核心成員離職創(chuàng)業(yè),并獲得創(chuàng)新工場投資支持。
零一萬物創(chuàng)始人兼CEO李開復(fù)今年3月表示,DeepSeek掀起的行業(yè)變革徹底顛覆了 AI 行業(yè)發(fā)展模式,可能讓OpenAI創(chuàng)始人輾轉(zhuǎn)難眠。他預(yù)測,中國市場最終可能只剩下DeepSeek、阿里巴巴和字節(jié)跳動三家主要的AI模型公司,其中DeepSeek目前勢頭最強。
然而,從大環(huán)境來看,當(dāng)前資本市場環(huán)境極佳,是AI公司上市的好時機。
德勤中國資本市場服務(wù)部發(fā)布的最新報告顯示,2025年上半年(數(shù)據(jù)預(yù)估至2025年6月30日),A股市場將有50只新股上市,合計融資371億元。相較去年上半年的44只新股合計融資325億元,今年上半年A股的IPO數(shù)量、融資額同比均上升14%。
其中,19只新股將于上海證券交易所上市融資202億元人民幣,同時深圳證券交易所錄得26只新股融資150億元人民幣。北京證券交易所將有5只新股融資19億元人民幣。創(chuàng)業(yè)板以新股數(shù)量成為最活躍的市場板塊,而上海主板則以融資金額帶領(lǐng)其他的市場板塊。
港股方面,德勤報告顯示,今年上半年,港股有40只新股融資1021億港元,與去年同期的30只新股融資132億港元相比,代表新股上市數(shù)量增加33%,融資總額攀升673%。接近四分之三的2025年上半年的融資額來自4只超大型A+H新股及1只H股上市。
僅在6月(截至2025年6月22日),港交所、上交所官網(wǎng)就有超過60家企業(yè)提交IPO上市招股書。
展望2025年下半年,對于港股,目前有超過170宗正在處理的上市申請個案,包括超過5家公司每家或會融資最少10億美元,德勤中國資本市場服務(wù)部預(yù)計2025年全年港股新股市場可從80只新股融資2000億港元。除了年內(nèi)或會錄得25只A+H新股外,大部分的上市項目將會來自科技、消費業(yè)等。
德勤中國資本市場服務(wù)部上市業(yè)務(wù)華北及華西區(qū)主管合伙人任紹文解釋指出,上半年港交所憑借多只超大型新股榮升第一。鼓勵內(nèi)地龍頭企業(yè)來港上市、簡化A股上市公司的申請上市程序,及更理想的估值、更佳的市場流動性及資金承接能力均一一推動新股市場的動力。
任紹文指出,只要未出現(xiàn)重大負(fù)面的地緣政治或宏觀經(jīng)濟干擾,其對港股在2025年具備條件爭取全球IPO市場領(lǐng)先地位持審慎樂觀態(tài)度。
“越來越多A股上市公司,包括來自全國中小企業(yè)股份轉(zhuǎn)讓系統(tǒng)(即新三板),正積極利用香港這個國際融資平臺,拓展全球資本、提升品牌影響力,實現(xiàn)‘出海’的戰(zhàn)略。同時,隨著‘科企專線’等政策新措施落地,將有更多生物科技及特專科技企業(yè)來港上市,為市場注入更多增長動能。港股上市制度持續(xù)優(yōu)化,吸引了大量新經(jīng)濟企業(yè)及潛在上市申請人,資本市場的深度與競爭力不斷提升,進一步鞏固其作為全球領(lǐng)先上市平臺的地位。”任紹文稱。
A股方面,德勤預(yù)計,在目前新環(huán)境下,隨著證監(jiān)會推出進一步深化科創(chuàng)板改革的“1+6”政策措施,以及在創(chuàng)業(yè)板正式啟用第三套標(biāo)準(zhǔn)支持優(yōu)質(zhì)未盈利創(chuàng)新企業(yè)上市等政策的實施,接下來A股市場有望逐步活躍,尤其是高科技企業(yè)的上市。
德勤中國資本市場服務(wù)部華北區(qū)上市業(yè)務(wù)合伙人楊紅梅指出,國家對科技及創(chuàng)新行業(yè)的支持將推動科技、新能源等新質(zhì)生產(chǎn)力到資本市場募融資金,并將成為2025年下半年A股市場的亮點。(本文首發(fā)于鈦媒體App,作者|林志佳,編輯|蓋虹達)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.