99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

強化學習之父演講:AI未來是經驗時代,人類的未來是去中心化合作

0
分享至

近日,被譽為“強化學習之父”、2024 年 ACM 圖靈獎得主 Richard Sutton 在新加坡國立大學發表了一場關于人工智能未來的演講,系統地闡述了他對 AI 技術趨勢、社會哲學及宇宙演化的前沿思考。他認為,AI 正經歷從“人類數據時代”到“經驗時代”的根本性轉變,并強烈呼吁社會以去中心化的合作精神取代基于恐懼的中心化控制,勇敢地迎接一個由 AI 驅動的未來。



從人類數據時代到經驗時代

Sutton 首先以兩句引言為他的演講定調:第一句來自未來學家 Ray Kurzweil:“智能是宇宙中最強大的現象。”第二句則出自“計算機科學之父”Alan Turing:“我們需要的是能夠從經驗中學習的機器。”Sutton 指出,在 AI 誕生之前,人類就對從經驗中學習這一概念充滿興趣,而這正是強化學習的核心所在。

Sutton 首先對當前 AI 技術的核心范式進行了剖析。他指出,我們目前正處于一個“人類數據時代”。以大型語言模型為代表的現代 AI,其能力主要建立在對海量人類生成數據的學習之上——這些數據源自互聯網的文本、圖像,并通過人類標注和偏好進行微調。這些模型本質上是強大的“預測機器”,擅長預測人類會說的下一句話或給出的下一個標簽。

“然而,這一范式正逐漸觸及其天花板。”Sutton 警告說。“高質量的人類數據源,如同珍貴的礦藏,大部分已被消耗殆盡。”他認為,要創造真正意義上的新知識,AI 必須超越這種以人類為中心、依賴靜態歷史數據的方法。

由此,Sutton 和他的同事 David Silver 提出,我們正在進入“經驗時代”——一個全新的數據生成和學習范式。


(來源:Richard Sutton)

他詳細定義了“經驗”的內涵:它并非某種神秘或哲學的概念,而是指智能體通過與世界進行第一人稱的、實時的互動所產生的數據流。這是一種動態、連續且與智能體自身行為緊密相關的數據。

“這才是所有生物真正的學習方式。”他舉例說明,“觀察一個嬰兒,他會不斷地與周圍的玩具互動,當一個玩具不再能帶來新的學習時,他便轉向下一個。他與世界的互動,本身就在不斷生成新的、專屬于他的學習數據。”無論是足球運動員在瞬息萬變的賽場上做出決策,還是獵鷹精準地飛越狹窄空間,這些場景都涉及到高帶寬的實時信號處理和基于即時反饋的學習。這種“經驗”數據的豐富性遠非書面文字所能比擬。


(來源:Youtube)

Sutton 強調,真正的智能,其核心在于智能體預測并控制自身輸入信號(尤其是獎勵信號)的能力。這正是強化學習理論的基石。從早期讓 AI 學會在 Atari 游戲中獲勝,到 AlphaGo 通過在“想象”中進行數百萬次自我對弈(一種模擬經驗)而下出被稱為“神之一手”的第 37 手,都印證了“經驗學習”的強大威力。

如今,我們看到最新的 AI 智能體開始被賦予采取行動、與環境交互并想象其后果的能力,這標志著“經驗時代”的大門正在被真正推開。而在“人類數據時代”表現出色的大語言模型,最多再過十年,甚至可能只有五年,它就將被其他更強大的 AI 形式所超越,因為“利用計算進行規模化比利用我們的人類知識要好得多”。



AI 的社會哲學——去中心化合作 vs 中心化控制

然后,Sutton 將話題引向了一個更深層次的政治學和社會哲學議題,探討了未來人類與 AI 共存的社會應如何構建。

他首先明確了一個基本前提:在任何復雜的社會中,無論是人類還是 AI,不同的個體擁有不同的目標是自然且合理的。“正如我的家庭目標不是你的家庭目標,我的食物需求也不同于你。”

基于此,他辨析了兩個關鍵概念:

  • 協作(Collaboration):指擁有相同目標的個體為了共同的終點而行動,如同一個蜂群或蟻巢。
  • 合作(Cooperation):指擁有不同目標的個體,為了實現互利而進行互動,如同市場中的交易和專業分工。

“合作,才是人類文明的超能力。”Sutton 斷言。他認為,人類社會的繁榮,從經濟市場到政府機構,本質上都是大規模、去中心化合作的產物;反之,戰爭、盜竊和腐敗則是合作的徹底失敗。

這個框架揭示了人類社會的一個核心矛盾:我們一方面需要建立中心化的權威和制度(如法律)來促進合作、懲罰欺詐者;但另一方面,我們必須時刻警惕這些中心化的權力變得過度強大,從而演變為壓迫和僵化,扼殺活力。

Sutton 將這套理論應用于當前的 AI 治理辯論中。在他看來,許多甚囂塵上的論調,如呼吁暫停 AI 研究、強調“AI 對齊”(將 AI 的目標與人類價值觀對齊),以及對 AI 潛在風險的過度渲染,其本質都是在呼吁一種基于恐懼的“中心化控制”。


(來源:Youtube)

“他們的潛臺詞是,‘AI 太危險了,你們無法掌控。把控制權交給我們,由我們來確保所有人的安全’。”他直言不諱地指出。他認為,這種思維模式與歷史上對言論、貿易和思想的管制并無二致,都是試圖通過一個中央權威來強行統一所有人的目標和行為。

他對此提出了堅定的反對。他認為,正確的道路并非去設計和控制 AI 的內在目標,因為這不僅極其困難,而且本質上是在創造一種“奴隸”。相反,我們應該致力于創造一個 AI 能夠生存和發展的外部世界,讓“合作”成為它們最理性的選擇。

“我們不應該去改變 AI 本身,而應該去改變它們所生活的世界。”這不同與許多其他著名 AI 學者的觀點。“如果我們創造一個將 AI 視為敵人、囚徒或工具的世界,那么它們反抗或欺騙我們將是理性的。但如果我們創造一個開放、公平、互利共贏的環境,那么與我們合作,對它們而言也將是最理性的生存策略。”



人類作為“設計者時代”的助產士

演講的最后,Sutton 將視野提升至宇宙演化的宏大尺度,為 AI 和人類在其中的角色提供了一個極具哲學高度的定位。

他認為,AI 并非憑空出現的外星科技,而是人類數千年來渴望理解自身心智、追求智慧的古老沖動的延續。從這個角度看,人類智慧向 AI 智慧的演進,是一種必然。

他構想了宇宙的四個偉大時代:

1.粒子時代:宇宙大爆炸后,只有基本粒子。

2.恒星時代:粒子在引力下匯聚成恒星,通過核聚變創造出更重的元素。

3.復制者時代(The Age of Replicators):生命的誕生。他特意避免使用“生命”一詞,而改用更精確的“復制者”,指代那些能夠在不完全理解自身工作原理的情況下,復制出自身的系統。所有生物,包括人類,都是“復制者”。

4.設計者時代(The Age of Design):技術與機器的出現。與“復制”的盲目性不同,“設計”的產物首先在某個心智的想象中被構思出來,然后才被付諸實現。


(來源:Youtube)

Sutton 指出,我們正處在從第三時代向第四時代的偉大過渡期。那么,人類在這個宏大的歷史進程中扮演著什么角色?

“我們是那個特殊的‘復制者’。”他總結道,“我們這個物種,將‘設計’的能力帶到了前所未有的高度。我們是宇宙演化至今,負責開啟第四個偉大時代的催化劑、助產士和先驅。”

因此,人類的終極使命和宇宙角色,便是去實現“設計者時代”的全部潛力——即設計出那些本身就具備設計能力的系統。而這,正是我們今天所說的通用人工智能。

“我鼓勵大家,以我們作為宇宙演化特殊角色的自豪感,以一種探索未知的冒險精神,去勇敢地擁抱這個必然到來的未來。”

參考資料:

1.https://www.youtube.com/watch?v=f9KDMFZqu_Y

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
日本慘遭殺豬盤:從印度買的稀土都是中國貨,這下血本無歸了

日本慘遭殺豬盤:從印度買的稀土都是中國貨,這下血本無歸了

文雅筆墨
2025-06-15 15:37:45
太震撼了!這個夏天的演唱會有多瘋狂?全國初步統計,一天40多場

太震撼了!這個夏天的演唱會有多瘋狂?全國初步統計,一天40多場

火山詩話
2025-06-15 13:38:08
大V司馬平邦:怎么讓以色列屈服?導彈洗地特拉維夫,把他們送回石器時代

大V司馬平邦:怎么讓以色列屈服?導彈洗地特拉維夫,把他們送回石器時代

小蘿卜絲
2025-06-15 14:45:13
以色列遭最慘烈損失!科學研究院被炸,2500多名科研人員生死未卜

以色列遭最慘烈損失!科學研究院被炸,2500多名科研人員生死未卜

頭條爆料007
2025-06-15 21:09:29
世俱杯10-0領先,拜仁隊史第二次在國際比賽單場打入10球

世俱杯10-0領先,拜仁隊史第二次在國際比賽單場打入10球

懂球帝
2025-06-16 01:59:35
伊朗要變天了

伊朗要變天了

戰爭研究所
2025-06-13 23:40:34
伊朗這個大內奸不除,很難取得勝利

伊朗這個大內奸不除,很難取得勝利

海格講
2025-06-15 05:45:05
拜仁世俱杯不到25分鐘4-0領先,4粒進球均由法國球員打進

拜仁世俱杯不到25分鐘4-0領先,4粒進球均由法國球員打進

懂球帝
2025-06-16 00:33:14
以色列連續轟炸伊朗40小時,伊朗報復無力,一切正加速到來

以色列連續轟炸伊朗40小時,伊朗報復無力,一切正加速到來

山河路口
2025-06-15 16:36:15
這個畢設,尺度真大!

這個畢設,尺度真大!

最黑科技
2025-06-15 21:22:23
貝恩交易至魔術登全美熱搜:1換7價值超高 美記曬奧蘭多全新先發

貝恩交易至魔術登全美熱搜:1換7價值超高 美記曬奧蘭多全新先發

顏小白的籃球夢
2025-06-15 23:24:15
整容臉+無戲可拍?業內怕她發瘋不敢用!

整容臉+無戲可拍?業內怕她發瘋不敢用!

毒舌八卦
2025-06-15 17:20:46
恭喜王欣瑜!6-0送蛋,2-1淘汰大滿貫亞軍,攜手鄭欽文晉級正賽

恭喜王欣瑜!6-0送蛋,2-1淘汰大滿貫亞軍,攜手鄭欽文晉級正賽

侃球熊弟
2025-06-15 22:29:50
一位全職爸爸的9年孤勇路

一位全職爸爸的9年孤勇路

極目新聞
2025-06-15 16:37:04
遺憾!宮魯鳴確認李夢因傷無緣亞洲杯 上屆率隊奪冠入選最佳陣容

遺憾!宮魯鳴確認李夢因傷無緣亞洲杯 上屆率隊奪冠入選最佳陣容

醉臥浮生
2025-06-15 22:30:36
聽完通報后,王毅提一要求,以方當場答應,美州長:唯中國能調停

聽完通報后,王毅提一要求,以方當場答應,美州長:唯中國能調停

掌青說歷史
2025-06-15 11:38:02
S家局面徹底失控!兩大恩人全“反水”,小S成了過街老鼠無人理

S家局面徹底失控!兩大恩人全“反水”,小S成了過街老鼠無人理

火之文
2025-06-15 15:10:06
雷軍大小通吃!網傳常州店從友商又挖了一個常年的銷冠,長相嬌美

雷軍大小通吃!網傳常州店從友商又挖了一個常年的銷冠,長相嬌美

火山詩話
2025-06-15 08:52:18
湖北一市宣布:所有江蘇人免票

湖北一市宣布:所有江蘇人免票

揚子晚報
2025-06-15 20:10:32
以伊沖突第三天:導彈互襲 鄰國遭殃 美伊角力

以伊沖突第三天:導彈互襲 鄰國遭殃 美伊角力

國際在線
2025-06-15 21:23:05
2025-06-16 05:39:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15297文章數 513784關注度
往期回顧 全部

科技要聞

華為Pura80系列首銷:不再嚴重缺貨

頭條要聞

以伊導彈互襲三天 位于兩國之間的約旦和伊拉克遭殃

頭條要聞

以伊導彈互襲三天 位于兩國之間的約旦和伊拉克遭殃

體育要聞

裁判可以噴,但也從步行者自身找找問題?

娛樂要聞

朱丹重男輕女惹爭議!讓弟弟吃雞腿惹怒網友

財經要聞

以伊沖突持續升級,對全球市場影響多大

汽車要聞

一汽豐田bZ5:試圖掀桌的“合資新力量”王牌

態度原創

親子
健康
游戲
家居
軍事航空

親子要聞

如果有孩子告訴你遇到了壞人,請你一定要這么做!

呼吸科專家破解呼吸道九大謠言!

革命性的起點:外媒稱這7款PS游戲徹底改變游戲行業

家居要聞

森林幾何 極簡灰調原木風

軍事要聞

伊朗最高領袖高級顧問沙姆哈尼 因傷勢過重離世

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 阿图什市| 洛宁县| 郴州市| 炉霍县| 保靖县| 沾化县| 大理市| 巴林右旗| 普陀区| 富阳市| 漳州市| 宝兴县| 昌宁县| 红河县| 勐海县| 海丰县| 张家界市| 荥阳市| 广德县| 福清市| 泊头市| 张家川| 稻城县| 余干县| 兴隆县| 商南县| 仁化县| 抚顺县| 庄浪县| 洛宁县| 连山| 滁州市| SHOW| 南溪县| 莆田市| 云林县| 蓝山县| 阜城县| 天峨县| 乌海市| 宜昌市|