網易首頁 > 網易號 > 正文申請入駐

強化學習之父演講：AI未來是經驗時代，人類的未來是去中心化合作

2025-06-10 22:42:59　來源: DeepTech深科技

北京舉報

分享至

近日，被譽為“強化學習之父”、2024 年 ACM 圖靈獎得主 Richard Sutton 在新加坡國立大學發表了一場關于人工智能未來的演講，系統地闡述了他對 AI 技術趨勢、社會哲學及宇宙演化的前沿思考。他認為，AI 正經歷從“人類數據時代”到“經驗時代”的根本性轉變，并強烈呼吁社會以去中心化的合作精神取代基于恐懼的中心化控制，勇敢地迎接一個由 AI 驅動的未來。

從人類數據時代到經驗時代

Sutton 首先以兩句引言為他的演講定調：第一句來自未來學家 Ray Kurzweil：“智能是宇宙中最強大的現象。”第二句則出自“計算機科學之父”Alan Turing：“我們需要的是能夠從經驗中學習的機器。”Sutton 指出，在 AI 誕生之前，人類就對從經驗中學習這一概念充滿興趣，而這正是強化學習的核心所在。

Sutton 首先對當前 AI 技術的核心范式進行了剖析。他指出，我們目前正處于一個“人類數據時代”。以大型語言模型為代表的現代 AI，其能力主要建立在對海量人類生成數據的學習之上——這些數據源自互聯網的文本、圖像，并通過人類標注和偏好進行微調。這些模型本質上是強大的“預測機器”，擅長預測人類會說的下一句話或給出的下一個標簽。

“然而，這一范式正逐漸觸及其天花板。”Sutton 警告說。“高質量的人類數據源，如同珍貴的礦藏，大部分已被消耗殆盡。”他認為，要創造真正意義上的新知識，AI 必須超越這種以人類為中心、依賴靜態歷史數據的方法。

由此，Sutton 和他的同事 David Silver 提出，我們正在進入“經驗時代”——一個全新的數據生成和學習范式。

（來源：Richard Sutton）

他詳細定義了“經驗”的內涵：它并非某種神秘或哲學的概念，而是指智能體通過與世界進行第一人稱的、實時的互動所產生的數據流。這是一種動態、連續且與智能體自身行為緊密相關的數據。

“這才是所有生物真正的學習方式。”他舉例說明，“觀察一個嬰兒，他會不斷地與周圍的玩具互動，當一個玩具不再能帶來新的學習時，他便轉向下一個。他與世界的互動，本身就在不斷生成新的、專屬于他的學習數據。”無論是足球運動員在瞬息萬變的賽場上做出決策，還是獵鷹精準地飛越狹窄空間，這些場景都涉及到高帶寬的實時信號處理和基于即時反饋的學習。這種“經驗”數據的豐富性遠非書面文字所能比擬。

（來源：Youtube）

Sutton 強調，真正的智能，其核心在于智能體預測并控制自身輸入信號（尤其是獎勵信號）的能力。這正是強化學習理論的基石。從早期讓 AI 學會在 Atari 游戲中獲勝，到 AlphaGo 通過在“想象”中進行數百萬次自我對弈（一種模擬經驗）而下出被稱為“神之一手”的第 37 手，都印證了“經驗學習”的強大威力。

如今，我們看到最新的 AI 智能體開始被賦予采取行動、與環境交互并想象其后果的能力，這標志著“經驗時代”的大門正在被真正推開。而在“人類數據時代”表現出色的大語言模型，最多再過十年，甚至可能只有五年，它就將被其他更強大的 AI 形式所超越，因為“利用計算進行規模化比利用我們的人類知識要好得多”。

AI 的社會哲學——去中心化合作 vs 中心化控制

然后，Sutton 將話題引向了一個更深層次的政治學和社會哲學議題，探討了未來人類與 AI 共存的社會應如何構建。

他首先明確了一個基本前提：在任何復雜的社會中，無論是人類還是 AI，不同的個體擁有不同的目標是自然且合理的。“正如我的家庭目標不是你的家庭目標，我的食物需求也不同于你。”

基于此，他辨析了兩個關鍵概念：

協作（Collaboration）：指擁有相同目標的個體為了共同的終點而行動，如同一個蜂群或蟻巢。
合作（Cooperation）：指擁有不同目標的個體，為了實現互利而進行互動，如同市場中的交易和專業分工。

“合作，才是人類文明的超能力。”Sutton 斷言。他認為，人類社會的繁榮，從經濟市場到政府機構，本質上都是大規模、去中心化合作的產物；反之，戰爭、盜竊和腐敗則是合作的徹底失敗。

這個框架揭示了人類社會的一個核心矛盾：我們一方面需要建立中心化的權威和制度（如法律）來促進合作、懲罰欺詐者；但另一方面，我們必須時刻警惕這些中心化的權力變得過度強大，從而演變為壓迫和僵化，扼殺活力。

Sutton 將這套理論應用于當前的 AI 治理辯論中。在他看來，許多甚囂塵上的論調，如呼吁暫停 AI 研究、強調“AI 對齊”（將 AI 的目標與人類價值觀對齊），以及對 AI 潛在風險的過度渲染，其本質都是在呼吁一種基于恐懼的“中心化控制”。

（來源：Youtube）

“他們的潛臺詞是，‘AI 太危險了，你們無法掌控。把控制權交給我們，由我們來確保所有人的安全’。”他直言不諱地指出。他認為，這種思維模式與歷史上對言論、貿易和思想的管制并無二致，都是試圖通過一個中央權威來強行統一所有人的目標和行為。

他對此提出了堅定的反對。他認為，正確的道路并非去設計和控制 AI 的內在目標，因為這不僅極其困難，而且本質上是在創造一種“奴隸”。相反，我們應該致力于創造一個 AI 能夠生存和發展的外部世界，讓“合作”成為它們最理性的選擇。

“我們不應該去改變 AI 本身，而應該去改變它們所生活的世界。”這不同與許多其他著名 AI 學者的觀點。“如果我們創造一個將 AI 視為敵人、囚徒或工具的世界，那么它們反抗或欺騙我們將是理性的。但如果我們創造一個開放、公平、互利共贏的環境，那么與我們合作，對它們而言也將是最理性的生存策略。”

人類作為“設計者時代”的助產士

演講的最后，Sutton 將視野提升至宇宙演化的宏大尺度，為 AI 和人類在其中的角色提供了一個極具哲學高度的定位。

他認為，AI 并非憑空出現的外星科技，而是人類數千年來渴望理解自身心智、追求智慧的古老沖動的延續。從這個角度看，人類智慧向 AI 智慧的演進，是一種必然。

他構想了宇宙的四個偉大時代：

1.粒子時代：宇宙大爆炸后，只有基本粒子。

2.恒星時代：粒子在引力下匯聚成恒星，通過核聚變創造出更重的元素。

3.復制者時代（The Age of Replicators）：生命的誕生。他特意避免使用“生命”一詞，而改用更精確的“復制者”，指代那些能夠在不完全理解自身工作原理的情況下，復制出自身的系統。所有生物，包括人類，都是“復制者”。

4.設計者時代（The Age of Design）：技術與機器的出現。與“復制”的盲目性不同，“設計”的產物首先在某個心智的想象中被構思出來，然后才被付諸實現。

（來源：Youtube）

Sutton 指出，我們正處在從第三時代向第四時代的偉大過渡期。那么，人類在這個宏大的歷史進程中扮演著什么角色？

“我們是那個特殊的‘復制者’。”他總結道，“我們這個物種，將‘設計’的能力帶到了前所未有的高度。我們是宇宙演化至今，負責開啟第四個偉大時代的催化劑、助產士和先驅。”

因此，人類的終極使命和宇宙角色，便是去實現“設計者時代”的全部潛力——即設計出那些本身就具備設計能力的系統。而這，正是我們今天所說的通用人工智能。

“我鼓勵大家，以我們作為宇宙演化特殊角色的自豪感，以一種探索未知的冒險精神，去勇敢地擁抱這個必然到來的未來。”

參考資料：

1.https://www.youtube.com/watch?v=f9KDMFZqu_Y

運營/排版：何晨龍

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.