解密“基模五強”的制勝密碼。
作者|小喇叭
編輯|栗子
2025年的中國大模型市場,正經歷一場靜默卻深刻的洗牌。
曾在2023-2024年瘋狂融資、高調亮相的“六小虎”們有些逐漸淡出主流視野,而以字節跳動、阿里巴巴、階躍星辰、智譜AI和DeepSeek為代表的“基模五強”則強勢崛起,成為國產基礎大模型領域的核心力量。
這場變局的背后,是資本、技術、人才和戰略的多重博弈。
接下來,大模型能力的重要性將愈發凸顯。追求智能的上限,仍然是當下大模型領域最重要的事情。大模型的應用,繞不過基礎模型的能力邊界。只有不斷突破基礎模型的天花板,大模型應用才有可能呈現百花齊放的局面。
1.國產大模型公司正加速洗牌
大模型的故事開始于2022年底,OpenAI發布的ChatGPT以顛覆性效果引爆全球 AI行業。
此后,中國市場迅速反應。2023-2024年,國內大模型市場迎來爆發式增長,政策、資本、企業三股力量共振,觸發了一場持續一年的“百模大戰”。
首先是政策定調。中國政府將大模型列為戰略性新興產業,多地出臺專項扶持政策(如上海“人工智能算力券”、北京“智源計劃”),鼓勵企業布局通用大模型。
在政策指引下,各類大模型如雨后春筍般涌現,既有互聯網巨頭布局,也有創業公司紛紛入局,資本也大量涌入大模型賽道,迅速催熟了全國大模型市場。到2024年,國內公開披露的大模型項目達數百個,覆蓋語言、視覺、代碼等領域。
可以說,整個2023年,幾乎都在白熱化的“百模大戰”中度過。最終,這場混戰以“6+2”的市場格局暫告一段落。“6”為月之暗面、階躍星辰、智譜、MiniMax、零一萬物與百川智能,業內也稱為“大模型六小虎”;“2”即兩家規模稍小但各具特色的公司:深度求索(DeepSeek)與面壁智能。
然而,在這一階段,由于行業尚在早期,入局的企業幾乎都在摸著石頭過河,很多企業都在拼參數、拼算力,試圖復刻OpenAI的暴力美學路線,一味追求模型規模和性能指標,反而沒有考慮到實際的國情和商業環境需要;更有部分初創公司缺乏技術積累,依賴短期融資和概念炒作,商業化路徑模糊。
到了2024年,市場格局開始發生重大變化。隨著2024年全球AI融資環境收緊,中美融資總額同比縮水超60%,中國大模型市場也開始“去泡沫化”。
具體表現來看,融資重心逐漸向技術和商業化路徑更成熟的頭部企業傾斜。例如,階躍星辰在2024年底完成數億美元B輪融資;智譜AI則在2025年先后完成多筆融資,并開啟IPO進程。
事實上,2024年底,“六小虎"中的部分公司已經開始調整戰略方向。據市場消息顯示,其中兩家已經放棄大模型預訓練。2025年初,隨著DeepSeek的異軍突起,對“六小虎”的生態位置形成擠壓,行業加速進入“洗牌時刻”。
2025年,“百模大戰”落幕已成為共識,市場格局收斂為“基模五強”(字節、阿里、階躍星辰、智譜 AI、DeepSeek)為主的新秩序。
巧合的是,美國市場也呈現出OpenAI、Google、Anthropic、X.ai 和 Meta“五強爭霸”的格局。某種程度上,這也是技術逐漸深入市場的過程中,市場格局從粗放到收斂的必然經過。
2.“新基模五強”,各有不同
不同于“六小虎”時期的無知者無畏,“新基模五強”格局下,每位玩家都走出了鮮明的差異化路徑。依次來看:
字節跳動的 AI 戰略不疾不徐,兼具“航母級資源”和“創業級敏捷”。
而字節之所以能走得這么穩,一個關鍵原因便是,公司將 AI 做成了“一把手”工程。張一鳴直接擔任起AI戰略的核心推動者,不僅從戰略層面統籌全局,還深度參與技術路線與產品落地方向。
通過資源整合、技術攻堅和生態閉環,字節試圖從流量驅動轉向AI驅動。而其成敗關鍵在于,能否在基礎模型、視頻生成等領域實現技術突破,同時構建可持續的商業化模式與生態壁壘。
為此,字節也有著充分的人才和資金儲備。團隊整合了光年之外(LingYuan)、零一萬物(01.AI)等外部頂尖 AI 團隊,并吸納吳永輝、黃文灝等技術大牛,形成兼具學術背景與工程落地能力的 AI 團隊;資金儲備更不用說,支撐其在AI領域的長期投入。同時,抖音、今日頭條等平臺還可為模型提供海量數據和應用場景。
阿里是全球最早大規模開源大模型的科技巨頭之一,以開源為杠桿,撬動開發者生態與行業應用,同時通過全棧技術布局(從算力到模型到應用)構建護城河。
阿里通義系列模型(如Qwen、萬相)覆蓋文本、視覺、語音等多模態領域,參數規模從0.5B到110B全尺寸覆蓋,滿足不同場景需求。其開源模型下載量已超9000萬次,開發者生態規模僅次于Hugging Face,形成“開源獲客-商業版變現”的閉環。
而這些成績則是得益于阿里云的全棧布局。阿里云未來三年將計劃投入超3800億元建設AI基礎設施,包括自研AI芯片(含光系列)、液冷數據中心和高速網絡;通過專有云+公共云組合,滿足企業敏感數據本地化與彈性算力需求。
與此同時,阿里的通義系列模型也正在深入阿里的整個業務生態。例如,淘寶通過通義千問優化推薦系統,提升用戶粘性;通義靈碼輔助醫生生成診斷報告,提升效率;夸克還推出AI作業助手,解析學生問題并提供解題思路,覆蓋K12教育場景。
階躍星辰則是最低調卻也最務實的大模型創業公司,多模態是其顯著標簽。
目前,階躍星辰已發布22款自研基座模型,其中16款為多模態模型(占比 70%),覆蓋文本、圖像、視頻、語音、音樂、推理等全模態,多次拿下國內外權威榜單第一,被業界稱為“多模態卷王”。
創始人、CEO姜大昕認為,多模態是實現AGI的必經之路。人類智能的多元性(語言、視覺、運動等)需通過多模態融合才能復現,而當前多模態模型仍處于“前 Transformer”階段,需探索可擴展的多模態理解生成一體化架構。據悉,階躍也正在此領域加速探索。
因性能行業領先,階躍的多模態模型已取得廣泛落地應用,成為多個爆款AI應用技術底座。公開信息顯示,2024年下半年階躍星辰多模態API的調用量增長了超45倍。
目前,階躍星辰正將多模態能力嵌入智能終端(手機、汽車、機器人),打造“用戶感知的延伸”,并與Oppo、吉利、智元機器人等頭部廠商展開深度合作。
智譜AI是首個啟動IPO的大模型創業公司。其之所以能成為“清華系”學院派大模型企業中規模最大的一家,很大一部分原因在于,智譜最大程度釋放了“清華大學”背后所蘊含的學術、社會以及商業生態價值。
智譜AI脫胎于清華大學計算機系知識工程實驗室(KEG),擁有27年AI技術積累。其自研的GLM(通用語言模型)系列通過多階段增強預訓練方法,在中文問答、代碼生成等領域表現卓越。
目前,智譜構建了基座模型(GLM)、推理模型(GLM-Z1-32B)、多模態模型(清影文生視頻)及智能體(AutoGLM)的全棧產品體系,滿足不同場景需求。
此外,智譜將2025年視為開源年,開源旗下多款模型,通過開源社區積累技術反饋,可進一步優化模型性能。
商業方面,智譜則專注2G/2B業務,智譜在B端覆蓋金融、醫療、政務等20余個行業,2024年中標32個政府及企業項目(金額1.29億元)。
DeepSeek的崛起則打破了國產大模型的“常規路線”。
在LMSYS Org榜單中,DeepSeek其模型在數學、代碼生成等任務中排名第一。其驚艷的性能表現來自于底層的工程創新。
DeepSeek通過降秩KV矩陣(MLA)減少顯存消耗,結合混合專家(MOE)架構動態激活部分專家模型,顯著降低計算量(參數數量減少約60%)。同時,DeepSeek放棄傳統SFT微調,轉向基于GROP算法的強化學習(RL),通過“模糊思考+精確證明”的訓練機制,縮小非正式與正式數學推理之間的差距。
更重要的是,DeepSeek憑一己之力,通過開源打破大廠技術壟斷,推動全球開發者協作(如與法國AI峰會、國際科研機構的合作),形成以中國為核心的全球AI生態。
通過工程創新,DeepSeek-R1訓練成本僅為行業頭部模型的1/10,API定價低至 OpenAI的1/30(輸入1元/百萬token,輸出 16元/百萬token),將AI服務從“奢侈品”變為“日用品”。
3.“基模五強”誕生背后,資金、人才與技術缺一不可
雖然如今的“基模五強”各成一派,但他們能在“百模大戰”中走到下一階段,并逐漸形成差異化路線,找到商業閉環方向的深層原因,實則有一定共通性。
訓練大模型是典型的“重資產”模式,確保資金來源是入局的基礎。
字節跳動和阿里巴巴依托自身大廠優勢,明確基礎大模型建設戰略,得以長期投入。
智譜和階躍星辰分別背靠北京、上海,國家隊實力自不用說。
DeepSeek則依靠自有量化基金平臺資本投入,通過開源策略、技術工程優化(如模型壓縮、分布式訓練)降低邊際成本。
而有了資金保障,大模型競爭本質是人才戰爭。
“基模五強”每家公司均圍繞自身技術定位構建差異化團隊,字節與阿里側重全棧生態,階躍星辰與智譜AI依托多模態與學術創新,DeepSeek則專注數理能力與成本優化。具體來看:
字節的AI團隊以張一鳴為核心,吳永輝擔任AI基礎研究負責人,朱文佳擔任AI業務負責人。整個團隊以“技術+商業”復合型團隊為核心,通過開放創新文化和“Top Seed”博士計劃強化人才梯隊。
團隊注重多模態技術(視覺、語音)與商業場景的快速落地,通過Seed與Flow雙軌并行的架構(基礎研究與應用開發分離)提升效率,并依托全球AI實驗室(北京、上海、新加坡等)構建技術壁壘。
阿里大模型研發一號位是阿里云CTO和通義實驗室負責人周靖人。整個團隊以“全棧技術矩陣+資源整合”為核心,通過“達摩院(前沿研究)+阿里云(工程落地)+行業應用(電商、政務、物流等)”形成閉環。團隊具備連續創業基因與國際化視野,通過“飽和式投入”布局AI基礎設施(如通義千問系列),并依托淘天、釘釘、夸克等業務實現技術商業化。
階躍星辰核心團隊,由獲得2025 IEEE follow的創始人姜大昕、首席科學家ResNet作者張祥雨以及系統負責人朱亦博等大牛組成。通過頂尖科學家的加入,強化視覺、語音等前沿的模型能力研究,以多模態技術驅動為核心,覆蓋手機、汽車、機器人等終端場景,實現技術與數據飛輪和B2C商業化方向。
智譜AI則依托清華大學知識工程實驗室(KEG)的學術背景,通過“學術+產業”結合模式構建技術壁壘,核心成員在知識圖譜、自然語言處理等領域具有深厚積累。
DeepSeek則匯聚了一群“技術奇兵”,以數理推理與工程優化為核心,團隊年輕化且本土化,成員多來自清華、北大等高校。
有了資金和人才的充分儲備后,能否孕育出差異化的技術創新能力,是決定企業能否在市場站穩腳跟的關鍵。
目前,基模五強的技術路線可分為兩類:
字節、阿里、階躍星辰、智譜AI可歸為“全才型”,技術矩陣全面覆蓋,通過生態協同和行業滲透構建長期壁壘。
這條路線的玩家未來可能通過全棧技術覆蓋線上和線下的廣泛場景(如類移動互聯網的超級應用、AI+硬件等),優先搶占AGI(通用人工智能)入口的主導權。
DeepSeek則更像“專才型”,聚焦語言模型與數理推理,通過開源普惠和極致工程優化,搶占高精度場景的“技術護城河”。在數理推理、代碼生成等高精度領域形成差異化競爭力,真正成為垂直場景的“基礎設施”。
無論哪種路線,都在共同推動大模型行業從“工具化”向真正的“智能化”演進。
4.下一階段的決勝點:突破智能的上限
盡管“基模五強”在戰略定位、技術路線和商業化路徑上呈現出鮮明的差異化特征,但它們的共同目標始終指向一個核心命題——突破大模型的“智能上限”。
無論是字節跳動的全棧布局、阿里的開源閉環、階躍星辰的多模態探索,還是DeepSeek的極致工程優化,本質上都在為大模型的“天花板”尋找新的突破點。
當然,他們也面臨著不小的挑戰。從大環境來看,中美技術脫鉤加劇的背景下,美國對華AI芯片出口限制可能影響國產大模型的算力供給。
具體到商業模式方面,如何在To B、To C場景中實現規模化盈利,仍是核心命題。而隨著AI應用范圍越來越廣泛,以及人類對智能上限的探索越來越機制,AI的可控性與安全性問題將越發不容忽視。
可以預見,以“基模五強”為代表的頭部玩家將在未來3-5年繼續主導中國大模型產業的發展,而這場AGI競賽的真正贏家,或將是那些能突破“智能上限”、實現AGI 愿景的企業。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.