近日,被譽為“強化學習之父”、2024 年 ACM 圖靈獎得主 Richard Sutton 在新加坡國立大學發表了一場關于人工智能未來的演講,系統地闡述了他對 AI 技術趨勢、社會哲學及宇宙演化的前沿思考。他認為,AI 正經歷從“人類數據時代”到“經驗時代”的根本性轉變,并強烈呼吁社會以去中心化的合作精神取代基于恐懼的中心化控制,勇敢地迎接一個由 AI 驅動的未來。
從人類數據時代到經驗時代
Sutton 首先以兩句引言為他的演講定調:第一句來自未來學家 Ray Kurzweil:“智能是宇宙中最強大的現象。”第二句則出自“計算機科學之父”Alan Turing:“我們需要的是能夠從經驗中學習的機器。”Sutton 指出,在 AI 誕生之前,人類就對從經驗中學習這一概念充滿興趣,而這正是強化學習的核心所在。
Sutton 首先對當前 AI 技術的核心范式進行了剖析。他指出,我們目前正處于一個“人類數據時代”。以大型語言模型為代表的現代 AI,其能力主要建立在對海量人類生成數據的學習之上——這些數據源自互聯網的文本、圖像,并通過人類標注和偏好進行微調。這些模型本質上是強大的“預測機器”,擅長預測人類會說的下一句話或給出的下一個標簽。
“然而,這一范式正逐漸觸及其天花板。”Sutton 警告說。“高質量的人類數據源,如同珍貴的礦藏,大部分已被消耗殆盡。”他認為,要創造真正意義上的新知識,AI 必須超越這種以人類為中心、依賴靜態歷史數據的方法。
由此,Sutton 和他的同事 David Silver 提出,我們正在進入“經驗時代”——一個全新的數據生成和學習范式。
(來源:Richard Sutton)
他詳細定義了“經驗”的內涵:它并非某種神秘或哲學的概念,而是指智能體通過與世界進行第一人稱的、實時的互動所產生的數據流。這是一種動態、連續且與智能體自身行為緊密相關的數據。
“這才是所有生物真正的學習方式。”他舉例說明,“觀察一個嬰兒,他會不斷地與周圍的玩具互動,當一個玩具不再能帶來新的學習時,他便轉向下一個。他與世界的互動,本身就在不斷生成新的、專屬于他的學習數據。”無論是足球運動員在瞬息萬變的賽場上做出決策,還是獵鷹精準地飛越狹窄空間,這些場景都涉及到高帶寬的實時信號處理和基于即時反饋的學習。這種“經驗”數據的豐富性遠非書面文字所能比擬。
(來源:Youtube)
Sutton 強調,真正的智能,其核心在于智能體預測并控制自身輸入信號(尤其是獎勵信號)的能力。這正是強化學習理論的基石。從早期讓 AI 學會在 Atari 游戲中獲勝,到 AlphaGo 通過在“想象”中進行數百萬次自我對弈(一種模擬經驗)而下出被稱為“神之一手”的第 37 手,都印證了“經驗學習”的強大威力。
如今,我們看到最新的 AI 智能體開始被賦予采取行動、與環境交互并想象其后果的能力,這標志著“經驗時代”的大門正在被真正推開。而在“人類數據時代”表現出色的大語言模型,最多再過十年,甚至可能只有五年,它就將被其他更強大的 AI 形式所超越,因為“利用計算進行規模化比利用我們的人類知識要好得多”。
AI 的社會哲學——去中心化合作 vs 中心化控制
然后,Sutton 將話題引向了一個更深層次的政治學和社會哲學議題,探討了未來人類與 AI 共存的社會應如何構建。
他首先明確了一個基本前提:在任何復雜的社會中,無論是人類還是 AI,不同的個體擁有不同的目標是自然且合理的。“正如我的家庭目標不是你的家庭目標,我的食物需求也不同于你。”
基于此,他辨析了兩個關鍵概念:
- 協作(Collaboration):指擁有相同目標的個體為了共同的終點而行動,如同一個蜂群或蟻巢。
- 合作(Cooperation):指擁有不同目標的個體,為了實現互利而進行互動,如同市場中的交易和專業分工。
“合作,才是人類文明的超能力。”Sutton 斷言。他認為,人類社會的繁榮,從經濟市場到政府機構,本質上都是大規模、去中心化合作的產物;反之,戰爭、盜竊和腐敗則是合作的徹底失敗。
這個框架揭示了人類社會的一個核心矛盾:我們一方面需要建立中心化的權威和制度(如法律)來促進合作、懲罰欺詐者;但另一方面,我們必須時刻警惕這些中心化的權力變得過度強大,從而演變為壓迫和僵化,扼殺活力。
Sutton 將這套理論應用于當前的 AI 治理辯論中。在他看來,許多甚囂塵上的論調,如呼吁暫停 AI 研究、強調“AI 對齊”(將 AI 的目標與人類價值觀對齊),以及對 AI 潛在風險的過度渲染,其本質都是在呼吁一種基于恐懼的“中心化控制”。
(來源:Youtube)
“他們的潛臺詞是,‘AI 太危險了,你們無法掌控。把控制權交給我們,由我們來確保所有人的安全’。”他直言不諱地指出。他認為,這種思維模式與歷史上對言論、貿易和思想的管制并無二致,都是試圖通過一個中央權威來強行統一所有人的目標和行為。
他對此提出了堅定的反對。他認為,正確的道路并非去設計和控制 AI 的內在目標,因為這不僅極其困難,而且本質上是在創造一種“奴隸”。相反,我們應該致力于創造一個 AI 能夠生存和發展的外部世界,讓“合作”成為它們最理性的選擇。
“我們不應該去改變 AI 本身,而應該去改變它們所生活的世界。”這不同與許多其他著名 AI 學者的觀點。“如果我們創造一個將 AI 視為敵人、囚徒或工具的世界,那么它們反抗或欺騙我們將是理性的。但如果我們創造一個開放、公平、互利共贏的環境,那么與我們合作,對它們而言也將是最理性的生存策略。”
人類作為“設計者時代”的助產士
演講的最后,Sutton 將視野提升至宇宙演化的宏大尺度,為 AI 和人類在其中的角色提供了一個極具哲學高度的定位。
他認為,AI 并非憑空出現的外星科技,而是人類數千年來渴望理解自身心智、追求智慧的古老沖動的延續。從這個角度看,人類智慧向 AI 智慧的演進,是一種必然。
他構想了宇宙的四個偉大時代:
1.粒子時代:宇宙大爆炸后,只有基本粒子。
2.恒星時代:粒子在引力下匯聚成恒星,通過核聚變創造出更重的元素。
3.復制者時代(The Age of Replicators):生命的誕生。他特意避免使用“生命”一詞,而改用更精確的“復制者”,指代那些能夠在不完全理解自身工作原理的情況下,復制出自身的系統。所有生物,包括人類,都是“復制者”。
4.設計者時代(The Age of Design):技術與機器的出現。與“復制”的盲目性不同,“設計”的產物首先在某個心智的想象中被構思出來,然后才被付諸實現。
(來源:Youtube)
Sutton 指出,我們正處在從第三時代向第四時代的偉大過渡期。那么,人類在這個宏大的歷史進程中扮演著什么角色?
“我們是那個特殊的‘復制者’。”他總結道,“我們這個物種,將‘設計’的能力帶到了前所未有的高度。我們是宇宙演化至今,負責開啟第四個偉大時代的催化劑、助產士和先驅。”
因此,人類的終極使命和宇宙角色,便是去實現“設計者時代”的全部潛力——即設計出那些本身就具備設計能力的系統。而這,正是我們今天所說的通用人工智能。
“我鼓勵大家,以我們作為宇宙演化特殊角色的自豪感,以一種探索未知的冒險精神,去勇敢地擁抱這個必然到來的未來。”
參考資料:
1.https://www.youtube.com/watch?v=f9KDMFZqu_Y
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.