網易首頁 > 網易號 > 正文申請入駐

“新五強”爭鋒，基礎大模型玩家再洗牌

2025-05-13 20:40:50　來源: 光錐智能

北京舉報

分享至

文｜魏琳華

編｜王一粟

大模型公司正在進行新一輪的排位賽。

AI應用如火如荼，但在“看不見”的水面之下，基礎大模型的戰爭仍在繼續。不像預期般放緩腳步，而是變得更“卷”了：

據光錐智能不完全統計，2025年開始至今，中國參與模型競爭的百度、字節、阿里、DeepSeek和“六小虎”等主要大模型公司，發布了超過45款基礎大模型（不包括行業垂類大模型），相當于每3.3天，就有一款新的模型發布。

而在上半年，國內大模型公司的第一梯隊，正在無限接近海外第一梯隊的格局。

對比三家大廠+兩家創業公司組合成海外“五強”的OpenAI、Google、Anthropic、X.AI和Meta，國內大模型團隊也在分化成由阿里、字節、DeepSeek、階躍星辰和智譜的“3+2”組合，成為國內的“新基模五強”。

神仙打架，“新基建五強”半年發30個大模型

上半年，基礎大模型領域仍然是“神仙打架”的局面。

以國內“基模五強”公司上半年發布的模型數量統計來看，五家公司共發布32個大模型。從發布數量上來看，阿里和階躍星辰是突出的兩個“卷王”，其中階躍星辰發布11款模型，阿里發布9款模型，加起來超過五家公司的半數。

結合大模型行業發展趨勢，開源、推理和多模態，成為三個關鍵詞：

從時間線來看，五家公司中，阿里、智譜和DeepSeek三家早就堅定走開源路線。

其中，阿里是獨一無二的“開源卷王”，自2023年起，阿里就將旗下多款模型發布在開源社區。無論從開源數量還是類型來說，阿里都是最全面的一家。

這也讓阿里成為了當下多個領域的開源SOTA提供者。4月29日上線的混合推理模型Qwen3成為目前全球最強的開源模型，而其成本僅為DeepSeek-R1的35%。

當然，在Qwen3之前，國內上一個掀起推理模型熱的公司，就是“鯰魚”DeepSeek。

對比上述四家公司，DeepSeek是唯一一家“專才”，不做大模型矩陣。比如春節期間發布的推理大模型DeepSeek R1，性能拉滿的同時做到了極低成本，訓練只要GPT-4o的1/10，輸入成本更是低至2%，一舉出圈，成為后續推理大模型的“標桿”。

多模態大模型，則是今年大模型公司的研發重點方向。

比如，被稱為“多模態卷王”的階躍星辰，目前共發布22個基礎模型，其中多模態領域的大模型高達16個。

其中，階躍星辰聯合吉利開源文生視頻大模型Step-Video-T2V，成為當時全球范圍內參數量最大、性能最好的開源視頻生成大模型，Step-Audio則是行業內首個產品級的開源語音交互模型。

布局全面的字節今年在多模態領域表現也開始加入第一梯隊。以文生圖模型Seedream 3.0來說，除了提升畫質和生成效率之外，它還提升了AI生圖在商業化領域的應用能力。由此，其對應產品即夢AI的文生圖效果一度出圈。

不過，相比大語言模型，行業內多模態大模型的發展程度還遠遠不夠。用姜大昕的話來說，“多模態模型領域，目前還沒有出現GPT-4時刻。”

在姜大昕看來，它的卡點就在于整個行業缺少多模態領域的理解生成一體化架構。大語言模型已經做到了，但多模態大模型的理解和生成仍然由不同的模型完成。對于計算機視覺來說，這是一個幾十年沒有解決的頑固問題。

對比大語言模型的ChatGPT和推理模型DeepSeek-R1，多模態領域仍有機會等到下一個爆款模型。

走向AGI，什么是必經之路？

在AI應用落地如火如荼、Scaling Law邊際效益遞減的今天，繼續押注基礎大模型還有價值嗎？

100天之前，DeepSeek的發布無疑給行業了一個無比確定的答案。

“一切變化都太快了，每天早上起來，新模型、新產品的發布都可能顛覆掉過往的認知。”一位創業者向光錐智能感慨道。

正如我們上面提到，這半年，模型發布的速度不減反增。同時，由模型能力提升帶來的技術紅利讓DeepSeek們站到臺前，而沒有技術優勢的公司則在投資熱情退潮時，失去了繼續立在第一梯隊的機會。

為了更長久地留在牌桌上，無論是大廠還是創業公司，搶錢、搶人才，依舊是2025年的主旋律。

如今，算力、人才和資金仍然是衡量大模型公司立在牌桌上的三個硬指標。對大廠來說，資金自然不成問題，但對于創業公司來說，必須拉到足夠的投資來為公司前期的研發買單。

以資金作為衡量指標，大廠自然相對充沛，但是初創陣營中只有“北京隊”智譜和“上海隊”階躍星辰這兩家被國資看好的企業，可以在大模型公司的寒冬期持續獲得資本青睞。

以智譜來說，它在三月接連拿下杭州、珠海和成都三家國資的投資，累計共達到18億人民幣；去年12月，階躍星辰拿到數億美元資金，完成B輪融資。

再從人才衡量，目前“基模五強”正在展現對人才的虹吸效應。以字節來說，從2023-2025年，這家公司挖走了海內外的多位研發骨干，比如曾任谷歌DeepMind研究副總裁的吳永輝，今年加入字節成為大模型團隊Seed的基礎研究負責人。

在大量堆積資金和人才的基礎上，上述基模五強逐漸建立了優勢：“開源卷王”阿里用生態拉攏B端用戶，字節則一邊補齊基礎模型的版圖，一邊靠豆包、扣子等應用反哺模型升級，DeepSeek靠性能和低價成為性價比之王，智譜的大模型落地在政企端優勢明顯，階躍則成了“多模態卷王”，發出多款SOTA模型。

上述企業的目標都是繼續提升大模型的“智能上限”，用溢出的模型能力支撐AI應用的能力突破。

以智能體（Agent）來說，其關鍵能力在于多模態、慢思考以及記憶能力。

有了多模態理解能力，才能讓以大模型為技術底座的Agent能夠“閱讀”并理解手機和電腦屏幕中的信息，從而讓AI也能夠代替人類操作智能終端；而推理能力則讓AI能夠根據用戶需求拆解任務，按照每一個規劃好的步驟推進，最終完成任務。

Google DeepMind CEODemis Hassabis認為，目前通往 AGI 的道路已經開始變得清晰，但要真正抵達這個目標，仍需要突破多個技術瓶頸，整合多項關鍵能力。

在有限的時間內，誰的硬指標更全面、基座模型能力更強，誰才能有機會真正獲得AGI的入場券。

大模型商業化趨勢：開源、垂類場景落地

商業化是基礎大模型公司不能跳過去的命題，其商業化的策略，往往和技術的戰略也一脈相承。

2025年，開源和垂類場景應用成為模型商業化的兩個關鍵方向。

先來說開源，開源的中國大模型已經在全球占據了半壁江山。目前，在開源社區HuggingFace上，前30的熱門模型，已經有12個模型來自于中國公司，其中出現了階躍星辰最新的音樂模型ACE-Step、DeepSeek的R1和Prover-v2、阿里的Qwen3系列、字節Seed的小參數代碼模型和騰訊混元的AI視頻模型。

開源之后，大模型公司可以嘗試的商業化手段變得更加多樣：國內以DeepSeek和阿里作為代表，采用的是更加開放的協議，這種模型一般可以走三種模式，最直觀的是調用API付費，云廠商則通過提供GPU服務收“水電費”，另外，圍繞開源模型的定制化調整和技術服務也是一種模式。

不過，真正能直接使用開源模型的企業和個人都是少數，多數人更需要一個“開箱即用”的完整產品。所以，AI在垂類場景的應用越來越火熱。

最火熱的無疑就是各行各業的智能體（Agent），從政企、金融到醫療，智能體可謂無處不在。但目前熱度更高的，還是智能體和智能終端的結合。

為什么智能體+智能終端成為了關鍵的落地方向？

“汽車不僅具有高價值的軟硬件系統，還與用戶有著密切的聯系，這使其成為理想的AI載體。”長城汽車CTO吳會肖說。同樣，這條規則也適用于手機、具身智能等產品。

而對于廠商來說，和多模態、強化學習能力等相同，做Agent，同樣也是大模型企業通向AGI之路的基石之一。在OpenAI給出的AGI五階段來說，Agent對應的就是L3階段，即AI擁有自主操作能力，在L3的基礎上，AI才能進一步追求自主學習的能力。

所以，對于大模型公司來說，做Agent的商業化戰略就是在技術基礎上延伸而來的一步棋。

階躍星辰和智譜，這兩家大模型的南北雙雄，也不約而同地都瞄準了智能終端賽道。

智譜在去年就推出了能夠在手機端運行的智能體AutoGLM，讓Agent接管各種應用調配，實現用戶需求。

而在今年，階躍星辰進一步擴大了Agent在智能終端的落地范圍，在2月份的開放日上，這家公司放出了Agent在汽車、手機、具身智能、IoT四個領域的應用。

如今，各家大模型公司都在搶奪智能終端客戶的訂單。以階躍星辰來說，在今年拿到了和OPPO、千里科技、吉利汽車集團、智元機器人等廠商的合作。

Agent能力的疊加，也在成為智能終端產品的賣點。比如，搭載了“一鍵全能搜”、“一鍵問屏”的OPPO手機Find N5和Find X8銷量亮眼。據悉，其中Find X8成為Find 系列史上同期銷量最高的產品。

比起其他業務來說，智能體+智能終端的合作，也為企業帶來了可觀的收入。據《智能涌現》報道，隨著三星等大單的簽訂，智譜節后不到一個月，收入已經過億。

從這一代AI大模型公司的商業化來看，大家都在避免傳統ToB賽道重復造輪子的私有化定制，希望借助技術的紅利，把產品盡量做得標準化，以此來實現更高的毛利率。

無論是提供開源工具的“自助火鍋店”，還是垂類智能體的“私房菜餐廳”，大模型商業化的前景都在變得越來越樂觀。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.