當技術范式重構,強者也不得不重新起跑。
作者|連冉
編輯|鄭玄
過去幾個月,尤其是 2025 年一季度,國內大廠在 AI 大模型領域的聲量明顯低調了不少。最直觀的感受就是,發布會明顯少了許多。對比去年同期,大廠幾乎是輪番上陣、接連發布新成果,而今年則低調了不少,聲音變得謹慎,動作也更克制。
這種轉變,多少跟 DeepSeek-R1 在春節期間的發布有關,這個模型以開源、低價、高性能的組合,打破了「大模型=高投入、高門檻」的行業共識,也撬動了模型產業的權力結構。
它不僅刷新了開發者對開源模型的認知,也動搖了此前被大廠視為護城河的「重資產」范式。一時間,硅谷科技股應聲回調,千億美元研發投入的必要性也被重新審視。
而在國內,這場「技術地震」最先震動的,其實正是那些原本被認為應該在 AI 戰役中沖在最前的大廠們。一邊是像 DeepSeek、Manus 這樣的新玩家用「小而強」「快而靈」的策略不斷迭代突破,另一邊卻是大廠在產品落地、組織架構、技術方向上的多次調整與遲疑。
新玩家沖擊的,不只是模型性能或訓練成本,更是許多建立在歷史經驗基礎上的路徑依賴——比如「只有閉環才有護城河」「只有高預算才能出好模型」「只有通用大一統才是正確方向」。
越來越多的事實正在指向同一個結論:在 AI 快速演進的浪潮中,任何僵化的范式認知,都可能成為創新的絆腳石。
今天的大廠,正在面臨一次理念上的轉向:不再追求「我的模型服務我的應用」的閉環邏輯,而是回到「用最合適的模型,構建最好的產品」這一產品主義原點。
一系列深層次的戰略重構,正在中國互聯網大廠里悄然發生。
01
Deepseek-R1 出現前,大廠鏖戰大模型賽道,各自押注不同
回頭看 2023 年,國產大模型賽道迅速升溫,幾乎所有有技術儲備或生態優勢的公司都在投入資源,試圖在百模大戰中找到自己的突破口。
彼時,百度、字節、騰訊等大廠紛紛亮出自研模型,「自研閉環」幾乎成為主流打法(阿里則探索開源較早),強調的是「模型要自主可控,生態要自給自足」,從底層模型到應用產品都要打通。
在這樣的背景下,百度主打「模型+搜索」路徑,字節力推豆包,阿里對通義千問團隊進行拆分以優化資源配置,騰訊則相對謹慎地投入「混元」大模型,整體更強調「應用場景驅動」,小廠中也出現了面壁、智譜、百川、月之暗面等一批專注通用大模型訓練的「AI 六小龍」,試圖在技術路線或創新方向上突圍。
圖片來源:視覺中國
彼時大家的競爭邏輯還建立在幾個假設之上:1)自研能力越強越有護城河;2)參數量和能力相關,性能靠堆大模型贏;3)需要構建一個「自我可控」的模型+應用閉環。
但這些共識在 DeepSeek-R1 發布之后被徹底打破。2025 年 1 月 DeepSeek-R1 的亮相,被行業視為一個「臨界點」事件——一方面,它以極低的成本訓練出了對標 GPT-4 的能力,公開技術細節并放出權重;另一方面,它代表著一種更徹底的「開源范式」:不是簡單開放一個模型,而是直接讓下游開發者「拿來即用」,訓練思路、數據比例、推理效率都一目了然。
這直接打在了原來那種「閉環型自研」的路線要害上。很多大廠花大錢訓練的模型,在 DeepSeek-R1 面前變得毫無優勢——不是能力不行,而是「性價比不行」:你沒法再說「自研比別人更強」,因為別人把過程全開了,而且你追上也要幾個月;你也沒法說「閉環護城河更高」,因為別人三兩天就能基于 DeepSeek-R1 搭個 demo,甚至用它打磨出產品。
這種「開源即能力平權」的沖擊,不只打到了大廠,也打亂了 AI 小龍們的節奏。以面壁、百川為代表的「小模型派」,原本還希望在訓練效率和推理速度上做文章,現在發現 DeepSeek 直接掀了桌子,把效率和能力統統平衡好了,而且是白送的——這讓「閉源商業化」變得更加困難。
行業由此進入了一段顯著的「戰略迷茫期」:
大廠開始重新評估自研的價值:是否還值得燒錢去追一個很可能被開源趕超的模型?是否應該把精力轉向「拼裝模型能力+打造 AI 原生應用」的組合打法?
AI小龍們則面臨最直接的生存壓力:原來講閉源、講技術棧的優勢正在消失;大廠又開始加速從開源模型中「拿貨」,對它們的合作需求也在下滑;只能重新找定位,要么抱團,要么找「差異化垂直場景」。
投資人也在重新審視項目價值:一個大模型初創公司如果沒有特別的創新機制或生態合作資源,其估值邏輯就會受到挑戰。
總之,DeepSeek 不是推出了一個強模型這么簡單,它更像是一次「范式洗牌」:用極致透明和開源方式打破舊有路徑依賴,把「自研大模型閉環」從主流選項變成了一個「代價極高」的冒險。這個時刻之后,誰能快速認清現實,找到新生態位,誰才有可能留在下一輪的牌桌上。
02
震蕩之后,大廠摸索新方向
DeepSeek 帶來的沖擊在持續發酵時,整個行業一開始是懵的,迷茫、不確定、不知所措。大家都知道這是一次系統性沖擊,但具體要怎么應對、往哪兒走,其實那時候沒有明確答案。
但從 2 月下旬開始,情況慢慢變了。大廠開始陸續有所動作,新的敘事也浮出水面。一句話總結就是:戰略重心從去年強調「應用先行」「超級 App」的落地路線,重新回到了「AGI 優先」的軌道上。
這輪轉向有幾個關鍵的變化。
第一個變化是目標清晰了。過去講 AI 應用的時候,很多公司都停留在「做一個超級 App」的層面,比如搞一個 AI 助手、一個 AI 搜索或者 AI 辦公工具。
但現在,在字節與阿里最新的對外表達中,都明確把「沖刺 AGI」作為最核心的目標。
在 2 月的全員會上,字節 CEO 梁汝波曾表示:「智能水平是最重要的,要把提高智能本身當成最重要的目標,而不是某個產品的 DAU。」
3 月,豆包大模型部門召開全員會,明確部門的最重要目標是探索智能上限;同時強調進一步加強組織文化,提高技術開放程度,并考慮推進開源。
「Seed Edge」是字節豆包大模型團隊在年初組建的 AGI 長期研究團隊,鼓勵探索更長周期的 AGI 研究課題,如推理能力、感知能力、軟硬一體化等。
這個項目強調「寬松的研究環境」和「長周期考核」,為入選課題提供獨立算力支持,體現了字節對 AGI 的長期布局。
Seed Edge 的目標是探索 AGI 的新方法,鼓勵跨模態、跨團隊合作,目前初步確定了五大研究方向,包括探索推理能力的邊界、探索感知能力的邊界、探索軟硬一體的下一代模型設計、探索下一代 AI 學習范式、探索下一個 scaling 方向。
可以看出,字節正在為通向 AGI 的下一階段做技術儲備。
2025 財年財報后的電話會上,阿里 CEO 吳泳銘首次明確提出 AGI 是阿里 AI 戰略的核心目標,甚至用了「AI 將影響全球 50% GDP 結構」這樣激進的表述。
這也意味著,阿里正在從強調「云+模型」服務能力,逐步走向更高層次的通用智能探索。
第二個變化,是對「開源」和「模型選擇」的態度發生了實質變化。過去講模型、做應用時,往往強調「全鏈路自主可控」,什么都要自己來。但現在,尤其是騰訊和百度,看起來越來越強調實用主義導向:誰的模型能力強就接誰的模型,應用產品的目標是用戶滿意、場景落地,而不是一定要套用自家大模型。
這背后,其實是每家公司在重新厘清自己的生態位——它在AI時代扮演什么角色,它的核心競爭力到底在哪里。
阿里的反應看起來「穩」一些,或者可以說是延續之前的節奏。
因為阿里在大模型上的投入本身就走在了開源路線的前列。通義千問(Qwen)系列在海外和開源社區持續表現強勁,Qwen2.5-Max 一度號稱性能超越 DeepSeek-V3,而 4 月底剛開源的 Qwen3,不僅成本顯著降低,性能更是反超 DeepSeek-R1 和 OpenAI-o1,登上開源模型榜首。阿里的打法很明確:先用模型性能證明自己,再用開源吸引全球開發者,把生態「引進來」。
不過,阿里的路徑也并非一帆風順。過去一段時間,由于組織架構頻繁調整,大模型和 AI 業務一度陷入「各自為戰」的割裂狀態。但隨著 2024 年阿里云重新整合、AI 團隊在馬云回歸后重新聚攏,阿里開始回到「集中力量辦大事」的主模式。阿里云的回暖也證明了整合效果:在最新一個季度重新恢復雙位數增長,再次穩坐國內市場頭把交椅。
可以說,相比強調 C 端產品或 Agent 體驗的打法,阿里正在重新確認自己在 AI 時代的角色——不是沖在最前的應用先鋒,而是一個全球級的模型平臺和技術基礎設施提供者。
百度的選擇,是比較務實的。一方面它有自己的文心模型體系,但另一方面它也明白,真正能打動用戶的,是像百度文庫、百度網盤這樣的具體應用能不能變得更智能。所以在實際落地中,百度強調「誰好用就用誰」,哪怕不是自家的模型也沒關系,只要能讓文庫變得更好用,就可以接入。
這種態度其實是經歷過一次反思的。之前極客公園就曾經了解到,2024 年百度內部其實是為了推動模型在各應用場景落地,分散了大量精力,導致文心團隊反而沒能集中精力把模型本身推上一個更高的臺階。新的調整,就是不再強求「模型服務所有應用」,而是讓每個業務線根據場景靈活選擇,把用戶體驗拉起來才是第一位。
而關于開源閉源之爭,此前作為大模型閉源路線的堅定支持者,李彥宏此前曾多次公開表示,"閉源才能保證技術可控性、才有商業模式,開源其實是一種智商稅"。
李彥宏在 Create2025 百度 AI 開發者大會|圖片來源:百度
直到今年 2 月,百度選擇了順應開源的大趨勢,宣布將在未來幾個月中陸續推出文心大模型 4.5 系列,并于 6 月 30 日起正式開源。
騰訊的路徑更清晰,也更符合它一貫的產品哲學。無論是微信、QQ 還是游戲體系,騰訊最核心的資源就是這些連接用戶的高頻產品。對它來說,自研大模型不是必須的,關鍵是能不能把 AI 能力快速嵌入到這些產品里,提升效率和體驗。
所以,當 DeepSeek-R1 新模型出現之后,騰訊是第一時間接入的公司之一,沒有太多顧慮。畢竟據晚點報道,騰訊董事局主席兼 CEO 馬化騰跟一些 AI 團隊說過,「要好好與外部合作,不要想著什么都自己做」,以及「要清醒地認識到實際情況,不要過高估計自己的能力。」
2 月 13 日,騰訊率先官宣接入「滿血版」DeepSeek-R1,并迅速在全平臺展開推廣攻勢。從微信、小紅書到 B 站、知乎,元寶產品的廣告鋪天蓋地,引發了用戶對騰訊 AI 助手的集中關注。與此同時,騰訊內部也緊急協調,加速推動微信與 DeepSeek 的融合。
「元寶」入駐微信|圖片來源:極客公園
相應地,騰訊也在組織架構上進行了一系列調整。繼騰訊元寶從 TEG(技術工程事業群)并入 CSIG(騰訊云與產業事業群)之后,QQ 瀏覽器、搜狗輸入法、ima 等更多產品也陸續劃歸 CSIG,組成騰訊在大模型時代面向 C 端的新產品陣列。同時,這些產品原本隸屬的團隊和組織也將從 PCG(平臺與內容事業群)整體調整至 CSIG,以更集中地推進 AI 戰略下的產品布局與升級。
這一系列快速動作,其實體現了騰訊對「AI 是能力,不是目的」的判斷。更強的模型、更開放的生態,只要能賦能微信和游戲,那就應該立刻用起來。這一波,它反而成了最快適應變局的一家公司——甚至可以說,這次 AI 開放生態的發展節奏,剛好踩中了騰訊最擅長的能力嵌套邏輯。
字節跳動則是四家里最復雜、或許也可以說是最糾結的那個。它一方面擁有豆包大模型體系,另一方面又掌握了抖音、今日頭條、番茄小說等超大規模應用場景。既想做 AGI 技術的引領者,又不愿放棄在應用層面的優勢閉環。
但這就帶來了兩頭要抓的壓力——模型要領先,產品也要突出,生態既要自洽又要開放。在 DeepSeek-R1 爆火之后,字節一方面開始重申「AGI 是核心目標」,加強對豆包的投入,也在開源方面更多動作;另一方面在應用層也出現了新的挑戰:到底是堅持「豆包+字節應用」的閉環路線,還是打破內外壁壘,接入更強的外部模型去賽馬?
據晚點報道,字節跳動最初對是否將 DeepSeek 接入旗下產品持觀望態度,內部普遍認為「隨時可以接入,不急」。然而,時機稍縱即逝,春節過后,字節開始緊急調動團隊加班開發,加速整合 DeepSeek。
目前看,字節的策略還在過渡期。一方面,它在對外表達中強調開源、強調開放生態價值;另一方面,在內部系統上,豆包仍然是很多應用場景的默認選擇,只在少許應用上開放對 DeepSeek 模型的接入。但未來會不會像騰訊一樣,開始在更廣泛的層面接入第三方模型,或者在某些應用上放開「自家模型優先」的原則,現在還沒有完全看清楚。
過去幾個月是 AI 大廠們重新定位自己的生態角色、重新判斷技術路徑的關鍵窗口期。經歷了 DeepSeek-R1 帶來的「能力維度重構」之后,各家公司幾乎都開始重新聚焦 AGI 這個長期目標,同時也在技術和生態層面更加現實與開放。
不過,即便目標一致,路徑選擇依然千差萬別。這背后,是每家公司對自身優勢的認知差異,也是它們對「AI 時代應該怎么跑」的不同下注。
03
技術顛覆面前,沒有永遠的「歷史贏家」
AI 行業不會因為某一個產品突然「殺出重圍」而終結對抗,它注定是一場持續上演的生態重構游戲——生態位置、能力分工將反復洗牌,而每一次沖擊,都會逼迫玩家重新思考「我是誰、我該怎么做」。
在 DeepSeek-R1 的沖擊下,大廠開始重新審視自己與 AI 的關系。這場變化不會停止:在 AI 這個快速演進的技術浪潮中,任何人其實都沒有資格背負歷史包袱。
歷史包袱,不只是落后的產線、繁重的組織、冗余的團隊,更是一種路徑依賴式的認知慣性。
過去幾年,整個 AI 行業積累了太多「默認共識」:比如做大模型一定要砸上億美金、做 AI 應用一定要追求閉環、只有 To B 業務才能形成收入閉環、AI 不是消費品只能是工具型軟件……這些「理性判斷」在過去的技術范式下看似正確,但在新路徑被打通之后,很多「理性」就變成了限制想象力的牢籠。
技術革命的殘酷性就在于,它并不會給巨頭太多「吃老本」的機會。AI 的快速迭代,正不斷吞噬那些依賴過往成功經驗的慣性組織。于是我們看到:百度轉向開源,騰訊放下身段借勢引流,字節加速重構算力體系……這些動作背后,藏著大廠對現實的一種「覺醒」:在 AI 的無限游戲中,唯一的生存法則,是保持戰略彈性——既要摒棄對歷史經驗的盲目依賴,也要以開放姿態,擁抱技術普惠的新趨勢。
舊范式困住了誰?
回顧國內過去兩三年內大廠與頭部創業公司的發展路徑,幾乎都踩在一套「經典劇本」上:
先圍繞一個目標設定 OKR;
再從模型能力、數據體系、應用矩陣做完整閉環;
最終希望通過模型降本、產品增長、生態協同走通商業路徑。
這個邏輯沒錯,但問題是它太像過去互聯網時代的打法了——它默認「資源越多,路徑越清晰」;但AI的突變恰恰是在路徑模糊中爆發的。
比如,之前很多團隊一邊追求「閉環場景」,一邊困于「能力不足」;一邊想講「自主模型」的故事,一邊又拿不到基礎設施層的調優能力。很多戰略決策是「既定假設+組織慣性」的結果——看起來合理,但沒人停下來問:如果這些假設本身就錯了呢?
反觀這輪跑出來的新玩家,無論是 DeepSeek、Manus,他們有個共同點:思維輕盈,沒有歷史負擔,也沒有路線執念,這反而讓他們成了這輪范式躍遷的開拓者。
如果回過頭去看,DeepSeek 和 Manus 做的那些事,其實都沒有多么玄學,甚至可以說都站得住工程邏輯。但為什么幾乎沒有大廠走這條路?因為它們過于理性、過于系統化,也就過于保守。
比如大廠可能會問:做 MoE 到底能不能規模化?極限調優是不是浪費時間?——這些問題本身沒錯,但當還沒驗證過路徑,就先否定它,那可能永遠不會發現新大陸。
這也是為什么,越來越多投資人、開發者、行業觀察者開始重新審視 AI 創業的價值判斷:不是誰能講出最全的閉環,不是誰能招來最多的模型科學家,而是——誰能打破「歷史正確性」,走出一條技術與產品都能快速驗證的新路線。
在 AI 這條超高速前進的技術公路上,最危險的不是落后一步,而是還相信舊的紅綠燈規則。真正的變化總是發生在「不合理」與「不被看好」之間。
*頭圖來源:視覺中國
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
極客一問
你如何看待 DeepSeek 帶來的影響?
馬斯克:我希望死后人們還能記得我為文明發展做出了貢獻。
點贊關注 極客公園視頻號 ,
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.