1. 未來不僅僅是預訓練和推理階段存在規模定律,我們將看到更多新的規模定律持續驅動模型性能的提升。
2. 可持續的規模定律也會對算力提出更高的要求,模型發展的上限必然與算力成正比。在完全開放的市場里,泡沫和過度投資在所難免,但AI的發展還遠遠沒到“泡沫頂點”。
3. 人類與工具的關系正在改變,我們正在進入“智能體群(agent swarm)”時代,也就是數量龐大的智能體之間彼此交互、執行任務、交換數據、交換信息,甚至交換任務。而人類與這些智能體群的交互,將構成所謂的“智能體經濟(agent economy)”。
4. 雖然新技術總是會創造新工作崗位、淘汰舊工作崗位,但這些新工作可能不一定是給人類的,而是給智能體的,這是令人擔憂的部分。
本文系盤古智
庫學術委員、北京智源人工智能研究院創始理事長張宏江
在“ 2025羅漢堂-北大國發院數字經濟年會”“AI智變時代:技術、經濟、產業與組織的未來”論壇上的發言內容整理
文章來源于
“羅漢堂觀點
本文大約5700字,讀完約14分鐘。
大家早上好。感謝邀請我來分享關于近期人工智能技術發展的想法。我的演講將涵蓋幾個主要方面。首先,我將討論支撐大語言模型發展的“規模定律(scaling law)”是否可持續。然后,我會談談大模型如何推動整個AI生態的規模化發展,特別是在算力和電力基礎設施的投資建設方面。最后,我還將講一下核心的技術方向,特別是AI智能體和智能體經濟,并花幾分鐘想象一下未來的可能性。
1
可持續的規模定律
對于大語言模型或AI基礎模型,我們必須了解推動它們進步的一個關鍵驅動力就是“規模定律”。今天的大型AI模型的本質在于由規模提升而涌現出來的能力,這是模型在達到一定規模、一定性能參數臨界點時,突然具備的能力,也可以說是拐點。我們在GPT-3上觀察到了這種現象,后來的ChatGPT以及過去兩年快速發展的其他模型也都體現了這一點。一般來說,參數越多,性能就越好——這一點目前仍然成立。
盡管業內普遍感覺預訓練模型(pretraining model)的規模定律在逐漸放緩,但它依然非常重要:隨著訓練時間和模型規模的增加,模型的準確率在提高,只是提高的速度沒有以前那么快了。與此同時的好消息是,在OpenAI的o1模型發布后,我們看到了一個重要的拐點,那就是規模定律可以被拓展到推理模型(reasoning model)。這意味著在推理階段,模型所獲得的時間越多,它的表現就越好,結果就越準確。我們稱這種現象為“推理規模定律(reasoning scaling)”,或“測試時規模定律(test-time scaling)”。這是過去六個月中推動模型性能提升的重要力量,同時也是拉動算力需求迅速上升的重要因素。
這將我們引向一種新的提升模型性能的路徑。我們以前主要依賴轉換器(transformer)來做預訓練,現在則進入了強化學習(reinforcement learning)階段。我敢大膽預測,未來不僅僅是預訓練和推理階段存在規模定律,我們將看到更多新的規模定律持續驅動模型性能的提升,同時也會對算力提出更高的要求。也就是說,盡管預訓練的規模定律有所減緩,但后訓練(post-training)階段、強化學習階段的規模定律則開始顯現,進一步提升模型性能,并持續增加對算力的需求。
另一個好消息是所謂的“大語言模型通縮(LLMflation)”:模型的使用價格(即單位token的價格)在過去三年中以非常快的速度下降。我們看到基本上每年token的價格下降約10倍,三年總計下降約1000倍。與此同時,從主流模型的發布可以看到,每一代模型發布時,token價格下降了,但性能卻更好了。所以我要強調的是:規模定律依然有效,token價格在持續下降,我們因此可以把它看作一種新的“摩爾定律(Moore’s Law)”——模型能力持續提升的同時,使用成本在不斷降低。
2
AI產業規模化升級
我講的第二點是AI正在大規模的產業化。這不僅是模型本身的規模提升,更是整個產業生態體系的規模擴展。大家看到OpenAI、Anthropic這些初創公司提供的是“模型即服務(Model-as-a-Service)”,同時大型平臺和云計算公司在持續提供“平臺即模型(Platform-as-a-Service)”。我們應該意識到,AI模型不僅是模型,它將會成為一個平臺,平臺將會進一步構建自身的生態體系:平臺的上層會出現越來越多的應用程序,而在下層則是云計算,再往下一層是計算的硬件,其中最關鍵的是GPU。這也是為什么在過去兩年里,GPU在AI領域中處于絕對主導地位。大家最終認識到,從規模定律的角度來看,不論是模型訓練還是模型使用,雖然token價格下降了,但用戶越來越多、應用場景越來越豐富,這都將消耗越來越多的算力。
因此,我們看到AI基礎設施建設正以前所未有的速度快速擴張。比如OpenAI宣布的Stargate項目,計劃投入約1000億美元和上千名工人在德克薩斯建設數據中心,未來可能將投資規模進一步上漲至5000億美元,預計部署10萬個——甚至擴展至50萬個——GPU。另外,Elon Musk的Colossus項目,在前四個月就已經部署了10萬個GPU,計劃最終包括20萬個GPU。我算了一下,10萬個GPU的運行功耗大約是150兆瓦;如果擴展到100萬個GPU,則將消耗約1.5吉瓦。這意味著什么?整個北京市的耗電量約為13吉瓦。也就是說,僅僅一個擁有100萬個GPU的數據中心,就會消耗北京市總用電量的八分之一。由此可見AI基礎設施的投建規模之大。
正是這種對GPU的大量需求使得NVIDIA股價持續上漲。除了OpenAI和Musk之外,Google、Microsoft、Amazon等公司也都在加大投資,僅2025年他們在AI相關的資本開支上就預計投入超過3000億美元。這將直接導致美國出現電力緊張的問題。如果這種速度持續下去,美國的電網明年就將不堪重負。這也解釋了為什么過去一年里大家又開始關注核能——尤其是小型核電站技術——相關的股票也漲勢強勁。整個AI數據中心產業鏈,在過去一年經歷了大規模的建設潮,并且還將持續下去。這不僅僅是GPU、數據中心,還包括能源。這就是我們所說的AI產業規模化。
3
核心技術方向
我想更深入地談談技術方向的問題。技術發展路徑的第一階段主要還是“預訓練(pretraining)”,這是核心。一個公司如果沒有能力構建強大的基礎模型,它就無法開發出優秀的推理模型,更不可能構建出高質量的智能體。接下去的整個路線圖非常清晰:預訓練 → 微調(fine tuning) → 強化學習 → 智能體 (agent) → 具體應用場景 (specific domain)。這是為什么我們看到OpenAI在發布GPT-4之后,又發布了o1,將來會在整合了GPT-4.5和o3后推出GPT-5。這樣,他們的預訓練模型和推理模型已經趨于統一,其他大模型開發者也都會走這條路徑。
當AI模型既具備預訓練能力,又擁有強化學習能力后,就會走向“測試時推理模型(test-time reasoning model)”。也就是說,AI模型不再只是“快思維”(快速提取知識),它現在也具備“慢思維”(理性推理)的能力。“慢思維”能力的增強是AI解決更復雜問題的關鍵。換句話說,如今的AI模型已經不再是靜態的,不再只是一個知識庫,也不再是靜態的網絡。以前我們說,如果今天沒有給模型訓練新知識,那模型就沒有長進。但現在,模型自身具備了持續學習的能力,它可以根據我們提供的數據,從網絡中不斷學習。我們已經開始看到計算機科學和AI奠基人Alan Turing所設想的那種能夠從經驗中學習的機器。
過去在預訓練時,訓練模型的主要方式是人類提供數據給它學習,例如AlphaGo 就是從人類下棋的經驗數據中學習的。目前訓練基礎模型——尤其是訓練推理模型——的主流方法已經變為強化學習。在強化學習階段,我們并不直接提供數據,而是提供規則和目標,并教模型如何從數據中學習。這不僅是“授人以魚”,而是“授人以漁”。
接下來,我們不僅要教模型怎么釣魚,還將賦予它“饑餓感”,讓它自己明白魚是好吃的,然后讓它自己感到餓,這樣模型就會主動去找魚吃。(所謂“饑餓感”,就是要為模型設置更高層次的目標函數,讓它不僅滿足于完成單一任務,而是持續自我優化、避免“餓死”。只有目標驅動、持續迭代,模型才能真正突破。)也就是說,模型要自己學會如何釣魚,而不再需要人類去教;它將不僅會使用數據,還知道去哪里獲取數據,甚至如何自己構建數據集。這就是我們目前所處的階段,我們正在邁入一個全新的AI智能體時代。
人們經常談論強化學習、預訓練和推理之間的關系。過去我們談論了很多預訓練(比如GPT),但現在我們進入了后訓練、強化學習和推理階段。強化學習曾經只是整個模型訓練中的一小部分。但從OpenAI的o3模型開始,強化學習變成了很重要的一部分,并且在未來會進一步擴大比重。可以說,強化學習和推理在過去就像蛋糕上的櫻桃,在未來則將成為模型性能的主要驅動因素,也將成為計算資源消耗的主要部分。
今天我們已經擁有能夠長時間思考的模型,就像圍棋大師一樣,它邁出一步的時間更長,解決一個復雜問題甚至需要非常聰明的人花很長時間。你可能會問,時間更長就一定更好嗎?我的觀點是,當一個推理模型花更多時間思考時,它實際上是在問自己更多的問題,它在思考中提出更多假設,搜索更多路徑,甚至在這個過程中構建自己的工具。未來我們將看到一個模型就像科學家一樣,可以花上數天、數月時間思考一個特定問題并找到解決方案。
4
AI智能體與智能體經濟
現在大家都在談論“智能體(agent)”。如果我們借用Sam Altman關于人工智能五個階段的劃分,我們現在正處于第二和第三階段之間,但很快將進入第三階段,也就是所謂的智能體階段。在這個階段,AI系統能夠采取行動,能夠自我學習。
從這個角度看,人類與工具的關系正在發生變化。以前我們把計算機、AI 視為人的工具。現在我們已經把 AI 看作助手或副駕駛(copilot)。而在不久的將來,人類與工具將會進入一個新的共生階段:人和機器網絡的共生。那時會有更多的自主AI智能體,并將受人類控制——但愿我們成為控制者,否則就可能變成它的奴隸,或者被它們同化。
舉例而言,OpenAI 的一個前沿項目Deep Research,它是在推理模型基礎上構建的智能體。你給它一個任務,它會首先分析這個任務,然后意識到需要一些數據,它會自己去搜索。接著它意識到需要一些分析工具,它會去尋找這些工具。它可能還意識到有些工具根本不存在,于是它自己編程開發這個工具,然后再使用這些工具完成任務。所以你可以看到,它既可以使用現有工具,也可以自己構建工具來完成任務。
今天我們已經開始有智能體能夠執行任務,并在復雜的工作流中工作。未來,每一個任務、每一個工作流程都有可能由智能體來完成。這些智能體將組成一個系統,形成企業決策的完整閉環,運行整個操作流程。這一天很快就會到來。我們正在進入一個階段,叫“智能體群(agent swarm)”時代,也就是數量龐大的智能體之間彼此交互、執行任務、交換數據、交換信息,甚至交換任務。而人類與這些智能體群的交互,將構成我們所謂的“智能體經濟(agent economy)”。設想一下,現在的大模型是由海量的神經元構成的。未來,這些智能體會像今天神經網絡中的單個神經元一樣,而未來的社會和經濟系統將由大量的智能體構成,就像今天的神經網絡。那將是我們的未來。
圖片來源:AI’s Trillion-Dollar Opportunity: Sequoia AI Ascent 2025 Keynote
圖片來源:AI’s Trillion-Dollar Opportunity: Sequoia AI Ascent 2025 Keynote
圖片來源:AI’s Trillion-Dollar Opportunity: Sequoia AI Ascent 2025 Keynote
我想說,未來是自主的(autonomous):自主的智能體、智能體群和智能體經濟。如果僅看模型的智商測試結果,今天不少大語言模型的水平已經落在人類IQ 分布曲線的右側,也就是說,它們的IQ測試分數已經高于人類平均水平。這意味著什么?我們還記得當年AlphaGo戰勝人類圍棋大師的那一刻,尤其是它的下棋方式是前所未見的,那時我們才突然意識到AlphaGo已經具備了所謂的“上帝視角(God’s angle)”:人類下了兩千年圍棋,其實只是站在一座小山上看風景,而 AlphaGo 看到的是整個地貌。
我們在大語言模型中看到的就是這種潛力。當我們談到奇點是否到來,其實就是說兩條曲線是否交匯:一條是人類的適應能力或學習能力,這條曲線幾乎是平的;另一條是技術或機器的學習能力,這條曲線增長得非常快。當這兩條曲線交匯時,就意味著機器已經比人類更聰明了。人類能做的一切,最終都可以由機器完成,而且機器學習得更快。這就可能意味著,雖然新技術總是會創造新工作崗位、淘汰舊工作崗位,但這些新工作可能不一定是給人類的,而是給智能體的。這就是令人擔憂的部分。
因此,未來組織的核心資產將會完全不同。GPU,也就是算力,會成為核心資產。模型,也就是智能,也會成為資產。未來我們不斷訓練模型,而不是不斷培訓員工。今天我們要擴展業務,會去招聘新員工,建立新組織,建設新辦公室。未來,我們只需要獲取更多的算力,改進模型,獲得更多的數據。這是一種巨大的結構性變革,前所未見,只在科幻小說中出現過。
最后講一個我從網上看到的笑話。一家公司有三位C-level的高管。CFO關心錢:“如果我們花了很多錢培養員工,他們卻離職了怎么辦?” CEO說:“那如果我們不培養他們,他們卻留下來呢?”然后CTO說:“機器人從來不會離職。” 這也許就是我們即將面對的場景,它要求我們必須制定應對計劃和采取行動,去面對可能的結構性轉型及其風險。
謝謝大家!
在論壇的圓桌討論環節,張宏江博士進一步指出:
1.過去一年中,中國大模型的研發進步值得肯定。但此前追趕階段的優勢在于“別人把路也給你指出來了”,而當距離縮短后,就需要自己選路線、比拼創新能力尤其重要,競爭仍會十分激烈。此外,大模型的能力上限高度依賴算力。集中化的算力經濟是未來的關鍵,有100個1000張卡的算力中心,不等于有一個10萬張卡的算力中心,尤其是在訓練方面,能夠管理和運營大規模算力的能力是非常重要的。雖然DeepSeek是一個了不起的突破,但如果我們只是抱著“多快好省”的思維,就會誤判形勢,最終在算力上也一定要趕上。模型發展的上限必然與算力成正比,這是不可回避的物理約束。在完全開放的市場里,泡沫和過度投資在所難免,但AI的發展還遠遠沒到“泡沫頂點”,眼下大模型仍有大量待解問題,也需要大量的專利和投入。
2. 在經濟層面,人與智能體的交互合作是非常重要的。隨著智能體變得越來越強大,我們會看到智能體會替代企業或機構中許多流程和決策點,這將會提高生產率,但也會帶來一些大的結構性變化。未來企業的規模,如果以人員的數量來衡量的話,會出現一些小規模的大企業,就像“單人獨角獸”(one person unicorn)。這些企業的銷售額和利潤可能非常大,但員工人數卻很少。可以想象,當智能體能夠自動編程,甚至自動生成工具時,這個趨勢是顯而易見的。小公司會大量涌現,而大公司則裁員更多。所以,未來是人和一群智能體的合作。智能體會變得越來越主動,越來越自動化。我們不能指望未來機器永遠只是人的助手。■
文章來源于“羅漢堂觀點”微信公眾號????
責任編輯:劉菁波
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.