繼2月、5月楊植麟和梁文鋒兩次論文“撞車”后,本周,楊植麟和閆俊杰首次在大模型賽道中“撞車”,目標則是梁文鋒的DeepSeek。
近日,月之暗面發布首款面向軟件工程任務的開源代碼大模型Kimi-Dev-72B,基于720億參數的Qwen2.5-72B模型訓練,采用大規模強化學習方式優化,在SWE-bench Verified基準上實現60.4%準確率,超越DeepSeek等模型。而且,6月20日晚,月之暗面發布首個Agent,宣布小范圍內測Kimi-Researcher(深度研究)。
與此同時,“大模型六小虎”(智譜、百川、零一、MiniMax、月之暗面、階躍星辰)里面的另一家公司MiniMax進入新品周,連續發布五個產品:RL訓練成本僅53萬美元(約380萬元)、性能比肩DeepSeek的開源推理模型MiniMax-M1,成為上下文最長的推理模型;性能僅次于字節Seedance 1.0、超越Veo3的Hailuo 02(0616)視頻模型;通用智能體產品MiniMax Agent;海螺視頻Agent;以及今天發布的MiniMax Audio更新版本。
值得注意的是,“大模型六小虎”也在爭奪第一股。繼智譜之后,據彭博,稀宇科技(MiniMax)正考慮赴港首次公開募股(IPO),估值約30億美元,目標是在今年IPO,已經與投行進行溝通。另據字母榜,六小虎里已經有五家在籌備上市。
顯然,隨著DeepSeek躋身AI領域“頂流”之列,從月之暗面CEO楊植麟、閆俊杰,到其他“大模型六小虎”企業創業者,都仿佛被DeepSeek、字節、阿里等多座“大山”壓得步履維艱。他們借助技術產品發聲,字里行間無不透露著“自己不希望被遺忘”。
MiniMax創始人兼CEO閆俊杰近期發文表示,“第一次感覺到大山不是不能翻越。”
然而,多名業內專家告訴筆者,基座級大模型的爭奪,關鍵還是參數的大小,而目前的情況是,這六家公司都缺少強大的計算能力,也沒有足夠的專業技術人員,不少高管都已經離開了字節跳動、阿里這樣的大公司。因此,錢不夠、卡不夠、數據不夠、商業化艱難,這種情況下“大模型六小虎”不得不分化找尋融資出路,面臨多重挑戰。
IDC分析師稱,2023年-2028年中國生成式AI軟件市場規模大約只有48.9億元,包含企業級AI平臺、應用規模,相比算力和基礎設施規模簡直不值一提。“現在消費級AI應用培育出來市場規模并不大。”
針尖對麥芒,MiniMax和kimi都對標DeepSeek
“DeepSeek之前,人們認為中國的 AI 模型落后了好幾年,而我們意識到它們實際上只落后了幾個月。”美國白宮加密貨幣和AI事務負責人David Sacks近期表示,在AI大模型方向,中國落后美國大概是3-6個月。
事實上,自年初開始,DeepSeek(深度求索)以低成本、高性能的開源模型迅速崛起,導致“大模型六小虎”的融資面臨挑戰,這六家企業正經歷著前所未有的行業洗牌。從商業模式的重構到資本寒冬的侵襲,從人才流失的陣痛到技術路線的迷茫,“六小虎”的生存圖景在DeepSeek的沖擊下呈現出復雜而嚴峻的局面。
“市面上90%的AI服務,都是‘偽AI’。”梅花創投創始合伙人吳世春近期表示,很多AI技術缺乏護城河,AI技術公司若無法構建底層技術壁壘,終將面臨被替代風險,行業需警惕偽創新泡沫。每次大模型升級都會對其造成沖擊,所有套殼行為都只是短期套利。
“大模型六小虎”公司早期普遍以“通用大模型+行業解決方案”為核心商業模式,試圖通過技術授權、定制化項目和云服務獲得收入,包括API服務、內嵌廣告業務、訂閱服務、定制化開發、應用合作分成等。
而如今,在DeepSeek熱潮刺激之下,對于通用人工智能(AGI)的目標更為明確。
清華大學教授、智譜AI創始人唐杰近期分享了上述這張圖,通過多種多類的多模態AI大模型,可以直接對標人類的大腦、小腦,形成讓機器像人一樣的思考能力。
而這次,MiniMax和Kimi月之暗面迎來了首次在大模型賽道“撞車”,幾乎同一時間發布新產品。
其中,MiniMax連續五天發布新品,推出了推理模型、視頻模型、語音模型、Agent智能體等技術,幾乎瞄準的都是智譜現有的技術產品。
而MiniMax發布的MiniMax-M1系列模型引發廣泛關注,其在處理百萬級Token的長文本上實現了重大突破,并且其RL(強化訓練)成本下降一個量級,成本僅53萬美元(約380萬元),推理效率則數倍于競爭對手。
據論文顯示,在工具使用場景(TAU-bench)中MiniMax-M1-40k同樣領跑所有開源權重模型,超過Gemini-2.5 Pro;代碼能力(SWE-bench)方面,M1-40k和M1-80k版本分別取得了55.6%和56.0%的優異成績,顯著超越其他所有開源模型,穩居第一梯隊;長文本(MRCR)方面,依托百萬級上下文窗口,M1系列在此項任務中不僅全面超越了所有開源對手,甚至擊敗了OpenAI的GPT-4o和Anthropic的Claude 3 Opus,在全球范圍內僅以微弱差距落后于谷歌的Gemini 2.5 Pro,位列全球第二。
目前,MiniMax-M1已宣布開源。價格方面,針對0-32k Token處理層面,輸入0.8元/百萬Token,輸出8元/百萬Token;32k-128k Token層面,輸入1.2元/百萬Token,輸出16元/百萬Token;128k-1M Token層面,輸入2.4元/百萬Token,輸出24元/百萬Token。
相比文本模型,雖然MiniMax圖生視頻模型海螺Hailuo-02效果更好,但會員價格更昂貴,一年訂閱最高1499.99美元(約為人民幣10769元),每月12000個積分(約合生成480個視頻)、10秒視頻生成,相比愛詩、生數Vidu(一年6710元)、快手可靈(鉆石5594元)等同行C端收費模式貴很多,更不用說B端的預付費模式了。
從MiniMax整體來看,一方面在于拓展產品矩陣,目前海螺 AI 與新上線的 MiniMax Agent 均已開啟訂閱服務;另一方面則聚焦付費意愿更強的海外市場,近期推出的模型及產品均同步在海外進行上線。
很顯然,結合與MiniMax即將IPO消息來看,MiniMax或許“燒不動”投資人的錢,打算用更大的利潤和收入滿足IPO上市要求,從而讓MIniMax盡快實現IPO上市。
閆俊杰曾向筆者表示,當國內大模型“價格戰”發生后,大部分公司認為大模型很貴,之后很多人認為大模型很便宜,可以放心地使用。最終非常驚人地發現,有許多傳統企業非常愿意使用大模型,他們覺得反正成本低,出錯了之后也不要緊,多調用一次就好了。客觀地來說,這極大提高了模型調用量,從而推動模型做得更好,至少目前在非英語語種上,國內大模型水平已與GPT不相上下。因此,從樂觀角度看,國內大模型的使用量確實在顯著地增長,并且中國 AI 大模型在海外確實越來越具有競爭力。
“競爭不可避免,既然不能避免,就要努力做到最好。”閆俊杰稱,“在同等計算GPU條件下,盡可能訓練更多的輪次、更大數據,做一些科研上的比較有挑戰的事,做別人沒有做過的事情。經過幾次科研的突破,其實能以比較有限的資源,做出一個在國際上第一梯隊多模態的表現,這個我們目前還是比較驕傲的。”
相比MiniMax,月之暗面不再專門做文生視頻、圖生視頻模型,而是專注于LLM理解和思考,直接瞄準DeepSeek。
6月17日,月之暗面發布最新開源編碼模型Kimi-Dev-72B,在SWE-bench Verified上取得了 60.4% 的性能提升,超越DeepSeek,創下開源模型SOTA成績。
隨后,月之暗面更進一步,6月20日晚發布其首個Agent——Kimi-Researcher,采用異步執行方式,用更多時間逐步推理、檢索和撰寫內容。月之暗面表示,模型即Agent,Kimi-Researcher是基于端到端自主強化學習技術訓練的新一代Agent模型,也是一個專為深度研究任務而生的Agent產品。
性能方面,在紅杉中國發布的xbench基準測試,Kimi-Researcher在DeepSearch任務中取得69%的平均通過率,領先該榜DeepSeek等其他模型。而在Humanity’s Last Exam(HLE)中,Kimi-Researcher性能超過OpenAI Deep Research(26.6%)、Gemini 2.5 Pro(21.6%),和Gemini-Pro 的 Deep Research Agent(26.9%)打平。
“我們也將逐步開源 Kimi-Researcher 基礎預訓練模型、以及強化學習后的模型,希望與大家一起推動Agent強化學習方向的探索。”月之暗面表示。
據筆者了解,月之暗面也在考慮IPO上市或其他資本化事宜。早前有報道指出,楊植麟已在內部定下通用AI模型目標,減少投流而把更多資源轉向AI模型技術能力迭代。
很顯然,大家都想對標DeepSeek。筆者了解到,近期智譜也將推出新技術產品,依然瞄準DeepSeek。
六小虎搶大模型第一股,今年上半年A股 IPO融資增長14%
2023年上半年,百川智能、階躍星辰、零一萬物和月之暗面成立,DeepSeek 也是這一年成立。智譜和 MiniMax 要更早些,分別是在2019年和2021年,如今估值都高達200億元左右。
從時間來看,“大模型六小虎”已經可以開始籌備IPO了。因此當前,六家公司都在追逐IPO上市之路。
今年4月14日,智譜正式提交上市輔導備案,由中金公司擔任輔導機構。成為六小虎中首家啟動IPO進程的企業。
如今,MiniMax也在籌劃赴港IPO。
然而,時間先后并非IPO的最大優勢,智譜未必有先發優勢。據智譜公布的備案計劃,上市輔導分三階段推進:4月完成摸底調查與方案制定;5月至7月聚焦規范整改與持續盡調;8月至10月進入沖刺期,籌備上市申請文件。也就是籌備IPO,再加上審批、路演等等必要程序,距離招股書還有半年多時間,離IPO上市執照還有半年到一、兩年的時間。
2025陸家嘴論壇上,中國證監會宣布計劃在上海以科技股為主的科創板設立新板塊,以容納尚未盈利的成長型企業。其中不僅重點提到 AI 企業,更提及將重啟未盈利企業適用科創板第五套標準上市,近期兆芯、PPIO等多家AI公司都是在這樣一個大環境下啟動IPO。
有多家企業負責人告訴筆者,對于科創板第五套標準上市正在仔細研讀,這對于很多AI、半導體、機器人等領域處于虧損的科技企業來說是一件利好。
智譜今年3月曾向筆者透露,2024年以來,智譜的ARR商業化收入取得了100%以上的增長。
“在B端,在 API 價格大幅普惠的情況下,智譜MaaS開放平臺API年收入同比增長超過30倍;在C端,2024年三季度上線付費功能以來,‘智譜清言’預計年收入超過千萬元。目前,智譜清言擁有超過2500萬用戶。”智譜稱。
不過,“大模型六小虎”陸續出現高管離職情況,對于企業發展和市場觀感等極為不利,有可能成為上市阻礙。
- 智譜AI在2025年上半年有4名高管離職,包括首席運營官張帆、智譜應用AI與合作副總裁李惠子等,但公司表示這些變動不會影響整體融資和業務進展。同時,公司引入了Midjourney前高管,強化C端市場布局。
- MiniMax公司合伙人魏偉等商業化負責人離職,但官方表示這是B端業務進入新發展階段的正常調整。
零一萬物聯合創始人谷雪梅、技術副總裁戴宗宏等核心成員離職創業,并獲得創新工場投資支持。
零一萬物創始人兼CEO李開復今年3月表示,DeepSeek掀起的行業變革徹底顛覆了 AI 行業發展模式,可能讓OpenAI創始人輾轉難眠。他預測,中國市場最終可能只剩下DeepSeek、阿里巴巴和字節跳動三家主要的AI模型公司,其中DeepSeek目前勢頭最強。
然而,從大環境來看,當前資本市場環境極佳,是AI公司上市的好時機。
德勤中國資本市場服務部發布的最新報告顯示,2025年上半年(數據預估至2025年6月30日),A股市場將有50只新股上市,合計融資371億元。相較去年上半年的44只新股合計融資325億元,今年上半年A股的IPO數量、融資額同比均上升14%。
其中,19只新股將于上海證券交易所上市融資202億元人民幣,同時深圳證券交易所錄得26只新股融資150億元人民幣。北京證券交易所將有5只新股融資19億元人民幣。創業板以新股數量成為最活躍的市場板塊,而上海主板則以融資金額帶領其他的市場板塊。
港股方面,德勤報告顯示,今年上半年,港股有40只新股融資1021億港元,與去年同期的30只新股融資132億港元相比,代表新股上市數量增加33%,融資總額攀升673%。接近四分之三的2025年上半年的融資額來自4只超大型A+H新股及1只H股上市。
僅在6月(截至2025年6月22日),港交所、上交所官網就有超過60家企業提交IPO上市招股書。
展望2025年下半年,對于港股,目前有超過170宗正在處理的上市申請個案,包括超過5家公司每家或會融資最少10億美元,德勤中國資本市場服務部預計2025年全年港股新股市場可從80只新股融資2000億港元。除了年內或會錄得25只A+H新股外,大部分的上市項目將會來自科技、消費業等。
德勤中國資本市場服務部上市業務華北及華西區主管合伙人任紹文解釋指出,上半年港交所憑借多只超大型新股榮升第一。鼓勵內地龍頭企業來港上市、簡化A股上市公司的申請上市程序,及更理想的估值、更佳的市場流動性及資金承接能力均一一推動新股市場的動力。
任紹文指出,只要未出現重大負面的地緣政治或宏觀經濟干擾,其對港股在2025年具備條件爭取全球IPO市場領先地位持審慎樂觀態度。
“越來越多A股上市公司,包括來自全國中小企業股份轉讓系統(即新三板),正積極利用香港這個國際融資平臺,拓展全球資本、提升品牌影響力,實現‘出海’的戰略。同時,隨著‘科企專線’等政策新措施落地,將有更多生物科技及特專科技企業來港上市,為市場注入更多增長動能。港股上市制度持續優化,吸引了大量新經濟企業及潛在上市申請人,資本市場的深度與競爭力不斷提升,進一步鞏固其作為全球領先上市平臺的地位。”任紹文稱。
A股方面,德勤預計,在目前新環境下,隨著證監會推出進一步深化科創板改革的“1+6”政策措施,以及在創業板正式啟用第三套標準支持優質未盈利創新企業上市等政策的實施,接下來A股市場有望逐步活躍,尤其是高科技企業的上市。
德勤中國資本市場服務部華北區上市業務合伙人楊紅梅指出,國家對科技及創新行業的支持將推動科技、新能源等新質生產力到資本市場募融資金,并將成為2025年下半年A股市場的亮點。(本文首發于鈦媒體App,作者|林志佳,編輯|蓋虹達)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.