文|魏琳華
編|王一粟
大模型公司正在進行新一輪的排位賽。
AI應用如火如荼,但在“看不見”的水面之下,基礎大模型的戰爭仍在繼續。不像預期般放緩腳步,而是變得更“卷”了:
據光錐智能不完全統計,2025年開始至今,中國參與模型競爭的百度、字節、阿里、DeepSeek和“六小虎”等主要大模型公司,發布了超過45款基礎大模型(不包括行業垂類大模型),相當于每3.3天,就有一款新的模型發布。
而在上半年,國內大模型公司的第一梯隊,正在無限接近海外第一梯隊的格局。
對比三家大廠+兩家創業公司組合成海外“五強”的OpenAI、Google、Anthropic、X.AI和Meta,國內大模型團隊也在分化成由阿里、字節、DeepSeek、階躍星辰和智譜的“3+2”組合,成為國內的“新基模五強”。
神仙打架,“新基建五強”半年發30個大模型
上半年,基礎大模型領域仍然是“神仙打架”的局面。
以國內“基模五強”公司上半年發布的模型數量統計來看,五家公司共發布32個大模型。從發布數量上來看,阿里和階躍星辰是突出的兩個“卷王”,其中階躍星辰發布11款模型,阿里發布9款模型,加起來超過五家公司的半數。
結合大模型行業發展趨勢,開源、推理和多模態,成為三個關鍵詞:
從時間線來看,五家公司中,阿里、智譜和DeepSeek三家早就堅定走開源路線。
其中,阿里是獨一無二的“開源卷王”,自2023年起,阿里就將旗下多款模型發布在開源社區。無論從開源數量還是類型來說,阿里都是最全面的一家。
這也讓阿里成為了當下多個領域的開源SOTA提供者。4月29日上線的混合推理模型Qwen3成為目前全球最強的開源模型,而其成本僅為DeepSeek-R1的35%。
當然,在Qwen3之前,國內上一個掀起推理模型熱的公司,就是“鯰魚”DeepSeek。
對比上述四家公司,DeepSeek是唯一一家“專才”,不做大模型矩陣。比如春節期間發布的推理大模型DeepSeek R1,性能拉滿的同時做到了極低成本,訓練只要GPT-4o的1/10,輸入成本更是低至2%,一舉出圈,成為后續推理大模型的“標桿”。
多模態大模型,則是今年大模型公司的研發重點方向。
比如,被稱為“多模態卷王”的階躍星辰,目前共發布22個基礎模型,其中多模態領域的大模型高達16個。
其中,階躍星辰聯合吉利開源文生視頻大模型Step-Video-T2V,成為當時全球范圍內參數量最大、性能最好的開源視頻生成大模型,Step-Audio則是行業內首個產品級的開源語音交互模型。
布局全面的字節今年在多模態領域表現也開始加入第一梯隊。以文生圖模型Seedream 3.0來說,除了提升畫質和生成效率之外,它還提升了AI生圖在商業化領域的應用能力。由此,其對應產品即夢AI的文生圖效果一度出圈。
不過,相比大語言模型,行業內多模態大模型的發展程度還遠遠不夠。用姜大昕的話來說,“多模態模型領域,目前還沒有出現GPT-4時刻。”
在姜大昕看來,它的卡點就在于整個行業缺少多模態領域的理解生成一體化架構。大語言模型已經做到了,但多模態大模型的理解和生成仍然由不同的模型完成。對于計算機視覺來說,這是一個幾十年沒有解決的頑固問題。
對比大語言模型的ChatGPT和推理模型DeepSeek-R1,多模態領域仍有機會等到下一個爆款模型。
走向AGI,什么是必經之路?
在AI應用落地如火如荼、Scaling Law邊際效益遞減的今天,繼續押注基礎大模型還有價值嗎?
100天之前,DeepSeek的發布無疑給行業了一個無比確定的答案。
“一切變化都太快了,每天早上起來,新模型、新產品的發布都可能顛覆掉過往的認知。”一位創業者向光錐智能感慨道。
正如我們上面提到,這半年,模型發布的速度不減反增。同時,由模型能力提升帶來的技術紅利讓DeepSeek們站到臺前,而沒有技術優勢的公司則在投資熱情退潮時,失去了繼續立在第一梯隊的機會。
為了更長久地留在牌桌上,無論是大廠還是創業公司,搶錢、搶人才,依舊是2025年的主旋律。
如今,算力、人才和資金仍然是衡量大模型公司立在牌桌上的三個硬指標。對大廠來說,資金自然不成問題,但對于創業公司來說,必須拉到足夠的投資來為公司前期的研發買單。
以資金作為衡量指標,大廠自然相對充沛,但是初創陣營中只有“北京隊”智譜和“上海隊”階躍星辰這兩家被國資看好的企業,可以在大模型公司的寒冬期持續獲得資本青睞。
以智譜來說,它在三月接連拿下杭州、珠海和成都三家國資的投資,累計共達到18億人民幣;去年12月,階躍星辰拿到數億美元資金,完成B輪融資。
再從人才衡量,目前“基模五強”正在展現對人才的虹吸效應。以字節來說,從2023-2025年,這家公司挖走了海內外的多位研發骨干,比如曾任谷歌DeepMind研究副總裁的吳永輝,今年加入字節成為大模型團隊Seed的基礎研究負責人。
在大量堆積資金和人才的基礎上,上述基模五強逐漸建立了優勢:“開源卷王”阿里用生態拉攏B端用戶,字節則一邊補齊基礎模型的版圖,一邊靠豆包、扣子等應用反哺模型升級,DeepSeek靠性能和低價成為性價比之王,智譜的大模型落地在政企端優勢明顯,階躍則成了“多模態卷王”,發出多款SOTA模型。
上述企業的目標都是繼續提升大模型的“智能上限”,用溢出的模型能力支撐AI應用的能力突破。
以智能體(Agent)來說,其關鍵能力在于多模態、慢思考以及記憶能力。
有了多模態理解能力,才能讓以大模型為技術底座的Agent能夠“閱讀”并理解手機和電腦屏幕中的信息,從而讓AI也能夠代替人類操作智能終端;而推理能力則讓AI能夠根據用戶需求拆解任務,按照每一個規劃好的步驟推進,最終完成任務。
Google DeepMind CEODemis Hassabis認為,目前通往 AGI 的道路已經開始變得清晰,但要真正抵達這個目標,仍需要突破多個技術瓶頸,整合多項關鍵能力。
在有限的時間內,誰的硬指標更全面、基座模型能力更強,誰才能有機會真正獲得AGI的入場券。
大模型商業化趨勢:開源、垂類場景落地
商業化是基礎大模型公司不能跳過去的命題,其商業化的策略,往往和技術的戰略也一脈相承。
2025年,開源和垂類場景應用成為模型商業化的兩個關鍵方向。
先來說開源,開源的中國大模型已經在全球占據了半壁江山。目前,在開源社區HuggingFace上,前30的熱門模型,已經有12個模型來自于中國公司,其中出現了階躍星辰最新的音樂模型ACE-Step、DeepSeek的R1和Prover-v2、阿里的Qwen3系列、字節Seed的小參數代碼模型和騰訊混元的AI視頻模型。
開源之后,大模型公司可以嘗試的商業化手段變得更加多樣:國內以DeepSeek和阿里作為代表,采用的是更加開放的協議,這種模型一般可以走三種模式,最直觀的是調用API付費,云廠商則通過提供GPU服務收“水電費”,另外,圍繞開源模型的定制化調整和技術服務也是一種模式。
不過,真正能直接使用開源模型的企業和個人都是少數,多數人更需要一個“開箱即用”的完整產品。所以,AI在垂類場景的應用越來越火熱。
最火熱的無疑就是各行各業的智能體(Agent),從政企、金融到醫療,智能體可謂無處不在。但目前熱度更高的,還是智能體和智能終端的結合。
為什么智能體+智能終端成為了關鍵的落地方向?
“汽車不僅具有高價值的軟硬件系統,還與用戶有著密切的聯系,這使其成為理想的AI載體。”長城汽車CTO吳會肖說。同樣,這條規則也適用于手機、具身智能等產品。
而對于廠商來說,和多模態、強化學習能力等相同,做Agent,同樣也是大模型企業通向AGI之路的基石之一。在OpenAI給出的AGI五階段來說,Agent對應的就是L3階段,即AI擁有自主操作能力,在L3的基礎上,AI才能進一步追求自主學習的能力。
所以,對于大模型公司來說,做Agent的商業化戰略就是在技術基礎上延伸而來的一步棋。
階躍星辰和智譜,這兩家大模型的南北雙雄,也不約而同地都瞄準了智能終端賽道。
智譜在去年就推出了能夠在手機端運行的智能體AutoGLM,讓Agent接管各種應用調配,實現用戶需求。
而在今年,階躍星辰進一步擴大了Agent在智能終端的落地范圍,在2月份的開放日上,這家公司放出了Agent在汽車、手機、具身智能、IoT四個領域的應用。
如今,各家大模型公司都在搶奪智能終端客戶的訂單。以階躍星辰來說,在今年拿到了和OPPO、千里科技、吉利汽車集團、智元機器人等廠商的合作。
Agent能力的疊加,也在成為智能終端產品的賣點。比如,搭載了“一鍵全能搜”、“一鍵問屏”的OPPO手機Find N5和Find X8銷量亮眼。據悉,其中Find X8成為Find 系列史上同期銷量最高的產品。
比起其他業務來說,智能體+智能終端的合作,也為企業帶來了可觀的收入。據《智能涌現》報道,隨著三星等大單的簽訂,智譜節后不到一個月,收入已經過億。
從這一代AI大模型公司的商業化來看,大家都在避免傳統ToB賽道重復造輪子的私有化定制,希望借助技術的紅利,把產品盡量做得標準化,以此來實現更高的毛利率。
無論是提供開源工具的“自助火鍋店”,還是垂類智能體的“私房菜餐廳”,大模型商業化的前景都在變得越來越樂觀。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.