99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

【關注】張宏江:從可持續的規模定律到智能體經濟,意味著什么?

0
分享至



1. 未來不僅僅是預訓練和推理階段存在規模定律,我們將看到更多新的規模定律持續驅動模型性能的提升。

2. 可持續的規模定律也會對算力提出更高的要求,模型發展的上限必然與算力成正比。在完全開放的市場里,泡沫和過度投資在所難免,但AI的發展還遠遠沒到“泡沫頂點”。

3. 人類與工具的關系正在改變,我們正在進入“智能體群(agent swarm)”時代,也就是數量龐大的智能體之間彼此交互、執行任務、交換數據、交換信息,甚至交換任務。而人類與這些智能體群的交互,將構成所謂的“智能體經濟(agent economy)”。

4. 雖然新技術總是會創造新工作崗位、淘汰舊工作崗位,但這些新工作可能不一定是給人類的,而是給智能體的,這是令人擔憂的部分。

本文系盤古智

庫學術委員、北京智源人工智能研究院創始理事長張宏江
在“ 2025羅漢堂-北大國發院數字經濟年會”“AI智變時代:技術、經濟、產業與組織的未來”論壇上的發言內容整理
文章來源于
“羅漢堂觀點

本文大約5700字,讀完約14分鐘。


大家早上好。感謝邀請我來分享關于近期人工智能技術發展的想法。我的演講將涵蓋幾個主要方面。首先,我將討論支撐大語言模型發展的“規模定律(scaling law)”是否可持續。然后,我會談談大模型如何推動整個AI生態的規模化發展,特別是在算力和電力基礎設施的投資建設方面。最后,我還將講一下核心的技術方向,特別是AI智能體和智能體經濟,并花幾分鐘想象一下未來的可能性。

1

可持續的規模定律

對于大語言模型或AI基礎模型,我們必須了解推動它們進步的一個關鍵驅動力就是“規模定律”。今天的大型AI模型的本質在于由規模提升而涌現出來的能力,這是模型在達到一定規模、一定性能參數臨界點時,突然具備的能力,也可以說是拐點。我們在GPT-3上觀察到了這種現象,后來的ChatGPT以及過去兩年快速發展的其他模型也都體現了這一點。一般來說,參數越多,性能就越好——這一點目前仍然成立。

盡管業內普遍感覺預訓練模型(pretraining model)的規模定律在逐漸放緩,但它依然非常重要:隨著訓練時間和模型規模的增加,模型的準確率在提高,只是提高的速度沒有以前那么快了。與此同時的好消息是,在OpenAI的o1模型發布后,我們看到了一個重要的拐點,那就是規模定律可以被拓展到推理模型(reasoning model)。這意味著在推理階段,模型所獲得的時間越多,它的表現就越好,結果就越準確。我們稱這種現象為“推理規模定律(reasoning scaling)”,或“測試時規模定律(test-time scaling)”。這是過去六個月中推動模型性能提升的重要力量,同時也是拉動算力需求迅速上升的重要因素。


這將我們引向一種新的提升模型性能的路徑。我們以前主要依賴轉換器(transformer)來做預訓練,現在則進入了強化學習(reinforcement learning)階段。我敢大膽預測,未來不僅僅是預訓練和推理階段存在規模定律,我們將看到更多新的規模定律持續驅動模型性能的提升,同時也會對算力提出更高的要求。也就是說,盡管預訓練的規模定律有所減緩,但后訓練(post-training)階段、強化學習階段的規模定律則開始顯現,進一步提升模型性能,并持續增加對算力的需求。

另一個好消息是所謂的“大語言模型通縮(LLMflation)”:模型的使用價格(即單位token的價格)在過去三年中以非常快的速度下降。我們看到基本上每年token的價格下降約10倍,三年總計下降約1000倍。與此同時,從主流模型的發布可以看到,每一代模型發布時,token價格下降了,但性能卻更好了。所以我要強調的是:規模定律依然有效,token價格在持續下降,我們因此可以把它看作一種新的“摩爾定律(Moore’s Law)”——模型能力持續提升的同時,使用成本在不斷降低。

2

AI產業規模化升級

我講的第二點是AI正在大規模的產業化。這不僅是模型本身的規模提升,更是整個產業生態體系的規模擴展。大家看到OpenAI、Anthropic這些初創公司提供的是“模型即服務(Model-as-a-Service)”,同時大型平臺和云計算公司在持續提供“平臺即模型(Platform-as-a-Service)”。我們應該意識到,AI模型不僅是模型,它將會成為一個平臺,平臺將會進一步構建自身的生態體系:平臺的上層會出現越來越多的應用程序,而在下層則是云計算,再往下一層是計算的硬件,其中最關鍵的是GPU。這也是為什么在過去兩年里,GPU在AI領域中處于絕對主導地位。大家最終認識到,從規模定律的角度來看,不論是模型訓練還是模型使用,雖然token價格下降了,但用戶越來越多、應用場景越來越豐富,這都將消耗越來越多的算力。

因此,我們看到AI基礎設施建設正以前所未有的速度快速擴張。比如OpenAI宣布的Stargate項目,計劃投入約1000億美元和上千名工人在德克薩斯建設數據中心,未來可能將投資規模進一步上漲至5000億美元,預計部署10萬個——甚至擴展至50萬個——GPU。另外,Elon Musk的Colossus項目,在前四個月就已經部署了10萬個GPU,計劃最終包括20萬個GPU。我算了一下,10萬個GPU的運行功耗大約是150兆瓦;如果擴展到100萬個GPU,則將消耗約1.5吉瓦。這意味著什么?整個北京市的耗電量約為13吉瓦。也就是說,僅僅一個擁有100萬個GPU的數據中心,就會消耗北京市總用電量的八分之一。由此可見AI基礎設施的投建規模之大。


正是這種對GPU的大量需求使得NVIDIA股價持續上漲。除了OpenAI和Musk之外,Google、Microsoft、Amazon等公司也都在加大投資,僅2025年他們在AI相關的資本開支上就預計投入超過3000億美元。這將直接導致美國出現電力緊張的問題。如果這種速度持續下去,美國的電網明年就將不堪重負。這也解釋了為什么過去一年里大家又開始關注核能——尤其是小型核電站技術——相關的股票也漲勢強勁。整個AI數據中心產業鏈,在過去一年經歷了大規模的建設潮,并且還將持續下去。這不僅僅是GPU、數據中心,還包括能源。這就是我們所說的AI產業規模化。

3

核心技術方向

我想更深入地談談技術方向的問題。技術發展路徑的第一階段主要還是“預訓練(pretraining)”,這是核心。一個公司如果沒有能力構建強大的基礎模型,它就無法開發出優秀的推理模型,更不可能構建出高質量的智能體。接下去的整個路線圖非常清晰:預訓練 → 微調(fine tuning) → 強化學習 → 智能體 (agent) → 具體應用場景 (specific domain)。這是為什么我們看到OpenAI在發布GPT-4之后,又發布了o1,將來會在整合了GPT-4.5和o3后推出GPT-5。這樣,他們的預訓練模型和推理模型已經趨于統一,其他大模型開發者也都會走這條路徑。

當AI模型既具備預訓練能力,又擁有強化學習能力后,就會走向“測試時推理模型(test-time reasoning model)”。也就是說,AI模型不再只是“快思維”(快速提取知識),它現在也具備“慢思維”(理性推理)的能力。“慢思維”能力的增強是AI解決更復雜問題的關鍵。換句話說,如今的AI模型已經不再是靜態的,不再只是一個知識庫,也不再是靜態的網絡。以前我們說,如果今天沒有給模型訓練新知識,那模型就沒有長進。但現在,模型自身具備了持續學習的能力,它可以根據我們提供的數據,從網絡中不斷學習。我們已經開始看到計算機科學和AI奠基人Alan Turing所設想的那種能夠從經驗中學習的機器。


過去在預訓練時,訓練模型的主要方式是人類提供數據給它學習,例如AlphaGo 就是從人類下棋的經驗數據中學習的。目前訓練基礎模型——尤其是訓練推理模型——的主流方法已經變為強化學習。在強化學習階段,我們并不直接提供數據,而是提供規則和目標,并教模型如何從數據中學習。這不僅是“授人以魚”,而是“授人以漁”。

接下來,我們不僅要教模型怎么釣魚,還將賦予它“饑餓感”,讓它自己明白魚是好吃的,然后讓它自己感到餓,這樣模型就會主動去找魚吃。(所謂“饑餓感”,就是要為模型設置更高層次的目標函數,讓它不僅滿足于完成單一任務,而是持續自我優化、避免“餓死”。只有目標驅動、持續迭代,模型才能真正突破。)也就是說,模型要自己學會如何釣魚,而不再需要人類去教;它將不僅會使用數據,還知道去哪里獲取數據,甚至如何自己構建數據集。這就是我們目前所處的階段,我們正在邁入一個全新的AI智能體時代。

人們經常談論強化學習、預訓練和推理之間的關系。過去我們談論了很多預訓練(比如GPT),但現在我們進入了后訓練、強化學習和推理階段。強化學習曾經只是整個模型訓練中的一小部分。但從OpenAI的o3模型開始,強化學習變成了很重要的一部分,并且在未來會進一步擴大比重。可以說,強化學習和推理在過去就像蛋糕上的櫻桃,在未來則將成為模型性能的主要驅動因素,也將成為計算資源消耗的主要部分。

今天我們已經擁有能夠長時間思考的模型,就像圍棋大師一樣,它邁出一步的時間更長,解決一個復雜問題甚至需要非常聰明的人花很長時間。你可能會問,時間更長就一定更好嗎?我的觀點是,當一個推理模型花更多時間思考時,它實際上是在問自己更多的問題,它在思考中提出更多假設,搜索更多路徑,甚至在這個過程中構建自己的工具。未來我們將看到一個模型就像科學家一樣,可以花上數天、數月時間思考一個特定問題并找到解決方案。

4

AI智能體與智能體經濟

現在大家都在談論“智能體(agent)”。如果我們借用Sam Altman關于人工智能五個階段的劃分,我們現在正處于第二和第三階段之間,但很快將進入第三階段,也就是所謂的智能體階段。在這個階段,AI系統能夠采取行動,能夠自我學習。

從這個角度看,人類與工具的關系正在發生變化。以前我們把計算機、AI 視為人的工具。現在我們已經把 AI 看作助手或副駕駛(copilot)。而在不久的將來,人類與工具將會進入一個新的共生階段:人和機器網絡的共生。那時會有更多的自主AI智能體,并將受人類控制——但愿我們成為控制者,否則就可能變成它的奴隸,或者被它們同化。

舉例而言,OpenAI 的一個前沿項目Deep Research,它是在推理模型基礎上構建的智能體。你給它一個任務,它會首先分析這個任務,然后意識到需要一些數據,它會自己去搜索。接著它意識到需要一些分析工具,它會去尋找這些工具。它可能還意識到有些工具根本不存在,于是它自己編程開發這個工具,然后再使用這些工具完成任務。所以你可以看到,它既可以使用現有工具,也可以自己構建工具來完成任務。

今天我們已經開始有智能體能夠執行任務,并在復雜的工作流中工作。未來,每一個任務、每一個工作流程都有可能由智能體來完成。這些智能體將組成一個系統,形成企業決策的完整閉環,運行整個操作流程。這一天很快就會到來。我們正在進入一個階段,叫“智能體群(agent swarm)”時代,也就是數量龐大的智能體之間彼此交互、執行任務、交換數據、交換信息,甚至交換任務。而人類與這些智能體群的交互,將構成我們所謂的“智能體經濟(agent economy)”。設想一下,現在的大模型是由海量的神經元構成的。未來,這些智能體會像今天神經網絡中的單個神經元一樣,而未來的社會和經濟系統將由大量的智能體構成,就像今天的神經網絡。那將是我們的未來。


圖片來源:AI’s Trillion-Dollar Opportunity: Sequoia AI Ascent 2025 Keynote


圖片來源:AI’s Trillion-Dollar Opportunity: Sequoia AI Ascent 2025 Keynote


圖片來源:AI’s Trillion-Dollar Opportunity: Sequoia AI Ascent 2025 Keynote

我想說,未來是自主的(autonomous):自主的智能體、智能體群和智能體經濟。如果僅看模型的智商測試結果,今天不少大語言模型的水平已經落在人類IQ 分布曲線的右側,也就是說,它們的IQ測試分數已經高于人類平均水平。這意味著什么?我們還記得當年AlphaGo戰勝人類圍棋大師的那一刻,尤其是它的下棋方式是前所未見的,那時我們才突然意識到AlphaGo已經具備了所謂的“上帝視角(God’s angle)”:人類下了兩千年圍棋,其實只是站在一座小山上看風景,而 AlphaGo 看到的是整個地貌。

我們在大語言模型中看到的就是這種潛力。當我們談到奇點是否到來,其實就是說兩條曲線是否交匯:一條是人類的適應能力或學習能力,這條曲線幾乎是平的;另一條是技術或機器的學習能力,這條曲線增長得非常快。當這兩條曲線交匯時,就意味著機器已經比人類更聰明了。人類能做的一切,最終都可以由機器完成,而且機器學習得更快。這就可能意味著,雖然新技術總是會創造新工作崗位、淘汰舊工作崗位,但這些新工作可能不一定是給人類的,而是給智能體的。這就是令人擔憂的部分。

因此,未來組織的核心資產將會完全不同。GPU,也就是算力,會成為核心資產。模型,也就是智能,也會成為資產。未來我們不斷訓練模型,而不是不斷培訓員工。今天我們要擴展業務,會去招聘新員工,建立新組織,建設新辦公室。未來,我們只需要獲取更多的算力,改進模型,獲得更多的數據。這是一種巨大的結構性變革,前所未見,只在科幻小說中出現過。


最后講一個我從網上看到的笑話。一家公司有三位C-level的高管。CFO關心錢:“如果我們花了很多錢培養員工,他們卻離職了怎么辦?” CEO說:“那如果我們不培養他們,他們卻留下來呢?”然后CTO說:“機器人從來不會離職。” 這也許就是我們即將面對的場景,它要求我們必須制定應對計劃和采取行動,去面對可能的結構性轉型及其風險。

謝謝大家!

在論壇的圓桌討論環節,張宏江博士進一步指出:

1.過去一年中,中國大模型的研發進步值得肯定。但此前追趕階段的優勢在于“別人把路也給你指出來了”,而當距離縮短后,就需要自己選路線、比拼創新能力尤其重要,競爭仍會十分激烈。此外,大模型的能力上限高度依賴算力。集中化的算力經濟是未來的關鍵,有100個1000張卡的算力中心,不等于有一個10萬張卡的算力中心,尤其是在訓練方面,能夠管理和運營大規模算力的能力是非常重要的。雖然DeepSeek是一個了不起的突破,但如果我們只是抱著“多快好省”的思維,就會誤判形勢,最終在算力上也一定要趕上。模型發展的上限必然與算力成正比,這是不可回避的物理約束。在完全開放的市場里,泡沫和過度投資在所難免,但AI的發展還遠遠沒到“泡沫頂點”,眼下大模型仍有大量待解問題,也需要大量的專利和投入。

2. 在經濟層面,人與智能體的交互合作是非常重要的。隨著智能體變得越來越強大,我們會看到智能體會替代企業或機構中許多流程和決策點,這將會提高生產率,但也會帶來一些大的結構性變化。未來企業的規模,如果以人員的數量來衡量的話,會出現一些小規模的大企業,就像“單人獨角獸”(one person unicorn)。這些企業的銷售額和利潤可能非常大,但員工人數卻很少。可以想象,當智能體能夠自動編程,甚至自動生成工具時,這個趨勢是顯而易見的。小公司會大量涌現,而大公司則裁員更多。所以,未來是人和一群智能體的合作。智能體會變得越來越主動,越來越自動化。我們不能指望未來機器永遠只是人的助手。

文章來源于“羅漢堂觀點”微信公眾號????

責任編輯:劉菁波

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“愛國企業家”宗慶后徹底塌墳:人老 實話不多

“愛國企業家”宗慶后徹底塌墳:人老 實話不多

爆角追蹤
2025-07-19 23:29:04
150國被征15%稅,美對華石墨關稅飆93%,外交部回應

150國被征15%稅,美對華石墨關稅飆93%,外交部回應

三農老歷
2025-07-22 02:45:15
臺灣商界大佬公開力挺大罷免,趙少康發出靈魂九問,拷問對方!

臺灣商界大佬公開力挺大罷免,趙少康發出靈魂九問,拷問對方!

二大爺觀世界
2025-07-21 18:00:08
22歲女生在重慶爬樓送外賣6天瘦10斤,精致打扮被指炒作,當事人回應質疑

22歲女生在重慶爬樓送外賣6天瘦10斤,精致打扮被指炒作,當事人回應質疑

瀟湘晨報
2025-07-21 17:51:23
他擔任局長后,和12個女下屬有染,一個26歲的女人將他拉下馬

他擔任局長后,和12個女下屬有染,一個26歲的女人將他拉下馬

喬生桂
2024-07-01 16:26:12
字越少,事兒越大!

字越少,事兒越大!

我是歷史其實挺有趣
2023-09-27 10:51:46
中國汽車流通協會:小米SU7一年保值率88.91%排名第一,問界M7排第二,理想mega排第三!雷軍:感謝大家支持

中國汽車流通協會:小米SU7一年保值率88.91%排名第一,問界M7排第二,理想mega排第三!雷軍:感謝大家支持

和訊網
2025-07-21 12:03:31
俄軍終于醒悟拿不下烏克蘭的關鍵:俄不妥協,給北約一記警告

俄軍終于醒悟拿不下烏克蘭的關鍵:俄不妥協,給北約一記警告

Ck的蜜糖
2025-07-22 01:40:13
喜訊!黑龍江補發2025年1月到7月調整增加的養老金,上調公式

喜訊!黑龍江補發2025年1月到7月調整增加的養老金,上調公式

興史興談
2025-07-21 18:17:04
音綜舞臺吵翻了!郝蕾點評被水木年華怒懟,這事真不怪她?

音綜舞臺吵翻了!郝蕾點評被水木年華怒懟,這事真不怪她?

情感大頭說說
2025-07-22 02:30:44
1979年鄧穎超說出:國民黨元老級人物有一位是潛伏50多年的共產黨

1979年鄧穎超說出:國民黨元老級人物有一位是潛伏50多年的共產黨

紀實文錄
2025-07-15 10:00:32
7月21日,黑龍江、河北、天津、湖南養老金上調金額可查詢,查查

7月21日,黑龍江、河北、天津、湖南養老金上調金額可查詢,查查

探源歷史
2025-07-21 17:33:47
30個學員無一人道謝!孫繼海問家長:你們教出來的是什么樣的孩子

30個學員無一人道謝!孫繼海問家長:你們教出來的是什么樣的孩子

風過鄉
2025-07-20 11:13:17
這還是林允兒嗎?

這還是林允兒嗎?

吃瓜黨二號頭目
2025-07-21 08:09:12
江蘇女乘客造謠司機:司機家人硬剛,女子身份被扒,還是臺球助教

江蘇女乘客造謠司機:司機家人硬剛,女子身份被扒,還是臺球助教

領悟看世界
2025-07-21 19:47:07
為什么河北總能養出重量級抽象網紅?

為什么河北總能養出重量級抽象網紅?

X博士
2025-07-21 14:04:03
詹姆斯曾聯系籃網簽約 蔡崇信拒給5000萬頂薪 老詹去哪存四大變數

詹姆斯曾聯系籃網簽約 蔡崇信拒給5000萬頂薪 老詹去哪存四大變數

籃球話題團
2025-07-22 01:35:03
把親美總統趕下臺,菲國變天,首富女兒選邊站,莎拉再也不怕彈劾

把親美總統趕下臺,菲國變天,首富女兒選邊站,莎拉再也不怕彈劾

回京歷史夢
2025-07-21 10:19:38
42歲蒼井空老師紅色性感裙子亮相,童顏巨乳,少女感滿滿

42歲蒼井空老師紅色性感裙子亮相,童顏巨乳,少女感滿滿

說真話的小陳
2025-06-25 09:25:05
剛剛,新西蘭最新涉華表態!西方國家大為震驚,尷尬一幕即將上演

剛剛,新西蘭最新涉華表態!西方國家大為震驚,尷尬一幕即將上演

新財迷
2025-07-21 13:52:58
2025-07-22 04:04:49
盤古智庫 incentive-icons
盤古智庫
盤古智庫官方賬號
5485文章數 9765關注度
往期回顧 全部

科技要聞

劉強東闊氣出手!兩月投了4家具身智能公司

頭條要聞

男子為終身質保花60萬買蔚來 1年跑17萬公里權益沒了

頭條要聞

男子為終身質保花60萬買蔚來 1年跑17萬公里權益沒了

體育要聞

這四位大兄弟,你們真敢要3000萬吶

娛樂要聞

五哈全員為寶石老舅送祝福

財經要聞

炒港美股"補稅潮"突襲?一文了解始末

汽車要聞

勞斯萊斯前設計師全新力作 榮威M7正式亮相

態度原創

旅游
時尚
健康
數碼
軍事航空

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

二搭的風正在吹向你的CP

呼吸科專家破解呼吸道九大謠言!

數碼要聞

首發 AMD 銳龍 9 9850HX 處理器,雷神預熱獵刃 S Ultra 游戲本

軍事要聞

美客機空中險與美軍B-52轟炸機相撞

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 大名县| 大田县| 灵山县| 建平县| 溧阳市| 石首市| 肥东县| 黄骅市| 临朐县| 杂多县| 通化县| 永济市| 慈利县| 石景山区| 嘉定区| 孝感市| 兴宁市| 福鼎市| 筠连县| 宣恩县| 黎川县| 武义县| 乌鲁木齐县| 娄烦县| 丰镇市| 江达县| 灵山县| 海南省| 宜章县| 黄浦区| 奇台县| 重庆市| 塔城市| 丽江市| 白河县| 襄樊市| 商洛市| 马关县| 大方县| 石屏县| 迭部县|