新智元報道
編輯:編輯部 HYZ
【新智元導讀】中國基礎大模型市場,徹底變天了!如今牌桌上的玩家已經變成了「基模五強」——字節、阿里、階躍星辰、智譜和DeepSeek。接下來的巔峰之戰,關鍵制勝點又會在哪里?
DeepSeek的橫空出世,已經徹底改變了全球的AI局勢。
從此,不僅中美大模型競爭格局改變,國產大模型的產業版圖,也被一舉打破!
縱觀中國基礎大模型的市場,可以看到,如今的基礎大模型版圖已然改天換地,演變為全新的五強格局——
字節、阿里、階躍星辰、智譜,以及DeepSeek。
新基模五強突圍,下一個制勝點在哪?
脫穎而出的這五強,為何能成為留在最后的玩家?
答案很簡單——要么有錢,要么有人。
前者,道理不言自明。訓練大模型是明牌重注,要么得自家有糧,要么就得有大腿。
像字節、阿里、DeepSeek,都屬于有糧的類型;而智譜和階躍星辰,則無疑屬于后者。
其中,上海隊的階躍星辰,最新一輪融資發生在24年底至25年初,B輪已融資數億美金;北京隊的智譜,在2025年3月已經拿下18億人民幣的融資。
而說到人,當然就是高密度人才,尤其要有行業認可的技術領軍人物。
我們仔細盤盤就能發現,五強在這方面是分足鼎立,各有骨干。
字節的吳永輝,阿里的吳泳銘、周靖人,階躍星辰的姜大昕、張祥雨、朱亦博,智譜的唐杰、張鵬,DeepSeek的梁文鋒,都是在業界足以撼動局勢的人物。
滿足了有錢又有人,在這方面起跑線上各家都差不多,接下來要比拼的,就是硬貨了。
基模五強,各領風騷
其實仔細分析,就能發現這五強的共性。
要么是全才,模型的能力要能做到全面覆蓋,且性能在第一梯隊。要么就是專才,模型在某一方面遙遙領先。
阿里:開源王者,全球第三
阿里以「開源王者」的獨特定位,不僅在國內市場占據重要席位,更在全球AI開源生態中,穩居全球TOP 3模型貢獻者。
斯坦福2025年人工智能指數報告
可以說,阿里是國內過最開源自研LLM互聯網巨頭,也是全球唯一一家實現「全尺寸、全模態」開源的云計算廠商。
可以說,作為開源最早、最完整的大公司,阿里在AI的投入上最堅決,也是如今布局最全、最先賺到錢的中國互聯網大廠。
自2023年以來,通義團隊累積開源200+模型,涵蓋了千問(Qwen)大語言模型和萬相(Wan)視覺生成模型兩大基座系列。
這些模型覆蓋了文本生成、視覺/語音理解生成、文生圖,以及視頻生成等全模態,參數規模從0.5B到235B不等,跨越119種語言及方言。
兩年前,國內LLM市場尚處于「百模」混戰階段,阿里率先將Qwen-7B開源,吸引了全球開發者的關注。
截至目前,Qwen全球下載量超3億,衍生模型數量超10萬,超越Llama成為全球第一開源模型。
在Hugging Face社區,2024年Qwen系列占全球模型下載量的30%以上,穩居第一。
25年2月,Hugging Face全球開源大模型榜單中,排名前十開源模型全部基于Qwen二次開發
在這場「燒錢」的游戲中,未來三年,阿里還將投入3800億元用于AI研發,用于云和AI硬件基礎設施,總額超過去十年總和。
這一投入規模在國內互聯網公司中首屈一指,恰恰展現了阿里在AI賽道上的戰略決心。
相較于其他大模型玩家,阿里憑借成熟的商業化路徑和廣泛的客戶基礎,率先實現了投入到回報的閉環。
截止2025年1月底,通過阿里云百煉平臺調用通義大模型API的企業已超過29萬。
字節:巨型航母,重回創業
字節的大模型以「綜合能力強」為特色,覆蓋了文本生成、圖像理解、視頻生成、語音處理等多模態領域。
在這場技術與資源的巔峰對決之中,字節不僅在自研大模型和AI應用領域,展現出了「兇殘的戰斗力」。
目前,字節旗下的AI應用超20多款,爆火核心產品「豆包」憑借其強大文本生成和多模態能力,迅速占領用戶心智,月活用戶超1億。
視頻生成工具「即夢」也被賦予了更高的戰略優先級,已在虛擬偶像、電商直播等領域,實現商業化落地。
同樣,字節在AI編程領域不敢落后。他們推出的AI編程工具Trae,直接對標Cursor等AI集成開發環境。
在企業服務方面,基于豆包大模型,火山引擎「飛連」也在多場景落地AI應用等。
字節的全面布局,還體現在其生態整合能力上。通過抖音、今日頭條、飛書等平臺,字節將大模型嵌入到內容推薦、協同辦公中,形成了技術到應用的生態閉環。
而如今,字節以「巨型航母重回創業」姿態,憑借雄厚資金、超高人才密度、多方向全面布局,成為中國AI賽道領跑者之一。
階躍星辰:低調的大模型國家隊
跟其他家相比,階躍星辰可以算是這五強中最低調的大模型國家隊了。
可以說,階躍星辰是生于上海、長于上海的國家隊。2024年底,階躍星辰完成了總額達數億美元的融資,核心投資方包括上海國有資本投資有限公司及其旗下基金,戰略和財務投資人包括騰訊投資、五源資本、啟明創投等。
如今,才成立2年的階躍星辰,已累計發布22款自研基座模型,覆蓋文字、語音、圖像、視頻、音樂、推理,其中有16款是多模態模型,性能領跑全行業,成為行業內公認的「多模態卷王」。
其中,Step-1o Vision便在2025年初分別在知名大模型競技場Chatbot Arena和國內權威評估平臺「司南」(OpenCompass)中,分別拿下了視覺領域中國大模型第一,以及多模態模型榜單第一的成績。
更難得的是,階躍星辰的多模態矩陣既全面,又在全行業領先。要知道,多模態模型的核心,就是綜合能力,既要求語音、圖片、視頻多個模態的能力,又要求模型能理解、生成、推理。在此布局上,階躍星辰的每條線都達到了第一梯隊。
而多模還有一大難點,就是融合過程中不能損失單個模特的性能,尤其不能降智。而階躍星辰采取了原生多模的方式,在此方面經驗獨到。
在階躍星辰看來,多模態是通往AGI的必經之路。隨著多模態交互和推理的融合愈加成熟,更多Agent會在智能終端上涌現。
現在,階躍星辰正在發力徹底解決視覺領域根本難題——表征和對齊的基礎問題,也即「predict next frame」。
未來,按照階躍星辰的多模研發路徑,AI將能建模物理世界交互,模擬整個世界,構建世界模型。至此,AGI就將實現。
在成立之初,姜大昕團隊曾繪制過這樣一幅智能演進路線圖,將智能進化分為模擬世界、探索世界、歸納世界三個階段
與此同時,階躍星辰的核心技術人員已經在一線親歷十年AI發展,這支隊伍的人才密度極高,既有技術洞察,又有實戰經驗,堪稱是基模的「夢之隊」。
其中,創始人、CEO姜大昕曾擔任微軟全球副總裁,微軟亞洲互聯網工程院副院長、首席科學家。入選2025年IEEE Fellow的姜大昕博士,是唯一來自中國大模型創業公司的入選者。
而首席科學家張祥雨,其參與著作的《用于圖像識別的深度殘差學習》論文(ResNet)是21世紀以來全球被引用次數最多的論文,引用量已超過25萬次。
商業化方面,目前已有多家頭部企業和大量AI應用開發者對階躍的多模態模型表示認可,紛紛接入。同時,階躍還將智能終端Agent視為大模型落地的核心突破點,已和吉利汽車、千里科技、OPPO、智元機器人、原力靈機、TCL等達成了深度合作。
智譜:全棧創新,發力智能體
作為國內首個開啟IPO大模型創業公司,智譜背靠清華技術底蘊以「學院派」獨特氣質脫穎而出,在基座模型、多模態技術和智能體展開全面布局。
目前,智譜已經建立了新一代認知大模型技術體系,研發了全棧自主GLM系模型,性能指標與國際頂尖LLM對齊。
去年8月,GLM-4-Plus問世在多個任務上表現優異,與GPT-4系不相上下。
今年4月,智譜再次開源32B/9B系列GLM模型,包括基座、推理和沉思模型。以320億參數比肩千億參數主流模型性能。
其中的GLM-Z1-Rumination沉思模型,便是智譜對AGI下一代技術的最新探索。
在智能體方面,智譜先于OpenAI提出Phone Use概念并推出Agent產品,并發布了全球首個集深度研究與實際操作于一體L3級智能體——AutoGLM沉思。
如今,他們正憑借AutoGLM及GLM-PC與全球車企、PC及手機廠商展開深度合作,推動大模型從Chat走向Act。
智譜的商業化路徑以2G和2B業務為核心,深度綁定政府和企業需求。
其構建了MaaS私有化部署和智能體平臺等服務模型,形成了包含百萬規模開發者的模型服務新生態。
據統計,MaaS平臺支撐80余萬企業、應用開發者。
這種學院派創業模式,使得智譜在技術深度和戰略穩定上,占據領先優勢。
DeepSeek:研究導向,厚積薄發
DeepSeek,則是五強中目前最受國外矚目的一位。在中美AI競賽中,也是被提及最多、存在感最強的一家。
可以說,這是一位特立獨行的技術奇兵,直接以一己之力,掀翻了大模型的牌桌。
DeepSeek技術的特點,就是聚焦語言模型,特別是數理能力,走堅定的開源路線。
今年過年時,DeepSeek-R1給全世界帶來了億點點震撼,以極低的計算資源,取得了媲美GPT-4等頂級AI模型的性能。
相比OpenAI、Anthropic訓模型時動輒投入的數億美元資金、數萬張高端GPU,DeepSeek四兩撥千斤的核心秘訣,就在于下面這種極致的工程優化。
比如,MoE架構讓模型總參數量達到671B,而在運行時卻只需激活37B,大幅降低了計算需求;多token預測(MTP),則提高了AI的訓練效率,避免逐字預測;多頭潛注意力(MLA),讓模型更精準地分配了計算資源。
總之,DeepSeek成功的關鍵,就在于偏研究型的導向,而非以盈利為短期目標。從研究角度鼓勵工程師提效,不必面臨財務變現壓力。
而DeepSeek團隊,也匯聚了多位頂尖人才。創始人梁文鋒,在用人上也有著自己獨特的原則。
比如,以應屆和畢業一兩年的人才為主,不追求規模,而是構建小而精的團隊。
隨著大規模的破圈,云廠商、行業伙伴紛紛積極接入,讓模型的生命力持續旺盛。
在DeepSeek的熱潮下,如今已經有億萬普通用戶開始擁抱AI。
決戰下一階段
「智能上限」與「多模態能力」
當「基模五強」的格局初步形成,競爭的焦點也隨之轉向更為核心和前沿的技術領域。
技術決勝點,聚焦何處?
顯然,追求更高的「智能上限」和突破的「多模態能力」,已成為通往AGI路上必須搶攻的兩大技術高地。
一方面,追求智能的上限,仍是當下大模型領域最重要的事情。
當前領先的模型雖然在許多任務中表現驚艷,但在邏輯推理、常識理解、長文本處理等方面,仍有較大的提升空間。
提升智能上限的最終目標,是邁向能夠執行任何人類智力任務的AGI,這需要模型具備更深層次的理解、學習、推理和創造能力。
另一方面,多模態理解與生成的統一是走向AGI的必經之路。
人類通過多種感官與世界交互,并獲取信息。要讓AI真正理解并融入復雜的世界,就必須賦予其處理和融合文本、圖像、音頻、視頻等多種模態信息的能力。
當理解與生成統一,不僅能推動智能體在智能終端的普及,還能通過具身智能與物理世界交互,自己收集環境數據,構建世界模型。
在世界模型的基礎上,再加上復雜任務的規劃、抽象概念歸納的能力,強化學習算法能力,以及超級對齊能力,就有可能實現AGI。
總而言之,未來對更高智能上限的無盡探索和多模態能力的深度融合,將是決定這場競賽勝負的關鍵。
如今站在AGI的門檻前,「基模五強」的競爭不僅是技術的較量,更是資源、人才、生態的全面博弈。
字節、阿里、階躍星辰、智譜、DeepSeek這五大領軍者,正以其各自獨特的優勢和戰略遠見,引領中國AI不斷逼近世界前沿。
而這場競爭的終點,或許正是AGI的曙光。
參考資料:
https://qwenlm.github.io/zh/blog/
https://seed.bytedance.com/zh/
https://platform.stepfun.com/
https://www.deepseek.com/
https://zhipuai.cn/
https://chat.z.ai
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.