99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

強化學習之父演講:AI未來是經驗時代,人類的未來是去中心化合作

0
分享至

近日,被譽為“強化學習之父”、2024 年 ACM 圖靈獎得主 Richard Sutton 在新加坡國立大學發表了一場關于人工智能未來的演講,系統地闡述了他對 AI 技術趨勢、社會哲學及宇宙演化的前沿思考。他認為,AI 正經歷從“人類數據時代”到“經驗時代”的根本性轉變,并強烈呼吁社會以去中心化的合作精神取代基于恐懼的中心化控制,勇敢地迎接一個由 AI 驅動的未來。



從人類數據時代到經驗時代

Sutton 首先以兩句引言為他的演講定調:第一句來自未來學家 Ray Kurzweil:“智能是宇宙中最強大的現象。”第二句則出自“計算機科學之父”Alan Turing:“我們需要的是能夠從經驗中學習的機器。”Sutton 指出,在 AI 誕生之前,人類就對從經驗中學習這一概念充滿興趣,而這正是強化學習的核心所在。

Sutton 首先對當前 AI 技術的核心范式進行了剖析。他指出,我們目前正處于一個“人類數據時代”。以大型語言模型為代表的現代 AI,其能力主要建立在對海量人類生成數據的學習之上——這些數據源自互聯網的文本、圖像,并通過人類標注和偏好進行微調。這些模型本質上是強大的“預測機器”,擅長預測人類會說的下一句話或給出的下一個標簽。

“然而,這一范式正逐漸觸及其天花板。”Sutton 警告說。“高質量的人類數據源,如同珍貴的礦藏,大部分已被消耗殆盡。”他認為,要創造真正意義上的新知識,AI 必須超越這種以人類為中心、依賴靜態歷史數據的方法。

由此,Sutton 和他的同事 David Silver 提出,我們正在進入“經驗時代”——一個全新的數據生成和學習范式。


(來源:Richard Sutton)

他詳細定義了“經驗”的內涵:它并非某種神秘或哲學的概念,而是指智能體通過與世界進行第一人稱的、實時的互動所產生的數據流。這是一種動態、連續且與智能體自身行為緊密相關的數據。

“這才是所有生物真正的學習方式。”他舉例說明,“觀察一個嬰兒,他會不斷地與周圍的玩具互動,當一個玩具不再能帶來新的學習時,他便轉向下一個。他與世界的互動,本身就在不斷生成新的、專屬于他的學習數據。”無論是足球運動員在瞬息萬變的賽場上做出決策,還是獵鷹精準地飛越狹窄空間,這些場景都涉及到高帶寬的實時信號處理和基于即時反饋的學習。這種“經驗”數據的豐富性遠非書面文字所能比擬。


(來源:Youtube)

Sutton 強調,真正的智能,其核心在于智能體預測并控制自身輸入信號(尤其是獎勵信號)的能力。這正是強化學習理論的基石。從早期讓 AI 學會在 Atari 游戲中獲勝,到 AlphaGo 通過在“想象”中進行數百萬次自我對弈(一種模擬經驗)而下出被稱為“神之一手”的第 37 手,都印證了“經驗學習”的強大威力。

如今,我們看到最新的 AI 智能體開始被賦予采取行動、與環境交互并想象其后果的能力,這標志著“經驗時代”的大門正在被真正推開。而在“人類數據時代”表現出色的大語言模型,最多再過十年,甚至可能只有五年,它就將被其他更強大的 AI 形式所超越,因為“利用計算進行規模化比利用我們的人類知識要好得多”。



AI 的社會哲學——去中心化合作 vs 中心化控制

然后,Sutton 將話題引向了一個更深層次的政治學和社會哲學議題,探討了未來人類與 AI 共存的社會應如何構建。

他首先明確了一個基本前提:在任何復雜的社會中,無論是人類還是 AI,不同的個體擁有不同的目標是自然且合理的。“正如我的家庭目標不是你的家庭目標,我的食物需求也不同于你。”

基于此,他辨析了兩個關鍵概念:

  • 協作(Collaboration):指擁有相同目標的個體為了共同的終點而行動,如同一個蜂群或蟻巢。
  • 合作(Cooperation):指擁有不同目標的個體,為了實現互利而進行互動,如同市場中的交易和專業分工。

“合作,才是人類文明的超能力。”Sutton 斷言。他認為,人類社會的繁榮,從經濟市場到政府機構,本質上都是大規模、去中心化合作的產物;反之,戰爭、盜竊和腐敗則是合作的徹底失敗。

這個框架揭示了人類社會的一個核心矛盾:我們一方面需要建立中心化的權威和制度(如法律)來促進合作、懲罰欺詐者;但另一方面,我們必須時刻警惕這些中心化的權力變得過度強大,從而演變為壓迫和僵化,扼殺活力。

Sutton 將這套理論應用于當前的 AI 治理辯論中。在他看來,許多甚囂塵上的論調,如呼吁暫停 AI 研究、強調“AI 對齊”(將 AI 的目標與人類價值觀對齊),以及對 AI 潛在風險的過度渲染,其本質都是在呼吁一種基于恐懼的“中心化控制”。


(來源:Youtube)

“他們的潛臺詞是,‘AI 太危險了,你們無法掌控。把控制權交給我們,由我們來確保所有人的安全’。”他直言不諱地指出。他認為,這種思維模式與歷史上對言論、貿易和思想的管制并無二致,都是試圖通過一個中央權威來強行統一所有人的目標和行為。

他對此提出了堅定的反對。他認為,正確的道路并非去設計和控制 AI 的內在目標,因為這不僅極其困難,而且本質上是在創造一種“奴隸”。相反,我們應該致力于創造一個 AI 能夠生存和發展的外部世界,讓“合作”成為它們最理性的選擇。

“我們不應該去改變 AI 本身,而應該去改變它們所生活的世界。”這不同與許多其他著名 AI 學者的觀點。“如果我們創造一個將 AI 視為敵人、囚徒或工具的世界,那么它們反抗或欺騙我們將是理性的。但如果我們創造一個開放、公平、互利共贏的環境,那么與我們合作,對它們而言也將是最理性的生存策略。”



人類作為“設計者時代”的助產士

演講的最后,Sutton 將視野提升至宇宙演化的宏大尺度,為 AI 和人類在其中的角色提供了一個極具哲學高度的定位。

他認為,AI 并非憑空出現的外星科技,而是人類數千年來渴望理解自身心智、追求智慧的古老沖動的延續。從這個角度看,人類智慧向 AI 智慧的演進,是一種必然。

他構想了宇宙的四個偉大時代:

1.粒子時代:宇宙大爆炸后,只有基本粒子。

2.恒星時代:粒子在引力下匯聚成恒星,通過核聚變創造出更重的元素。

3.復制者時代(The Age of Replicators):生命的誕生。他特意避免使用“生命”一詞,而改用更精確的“復制者”,指代那些能夠在不完全理解自身工作原理的情況下,復制出自身的系統。所有生物,包括人類,都是“復制者”。

4.設計者時代(The Age of Design):技術與機器的出現。與“復制”的盲目性不同,“設計”的產物首先在某個心智的想象中被構思出來,然后才被付諸實現。


(來源:Youtube)

Sutton 指出,我們正處在從第三時代向第四時代的偉大過渡期。那么,人類在這個宏大的歷史進程中扮演著什么角色?

“我們是那個特殊的‘復制者’。”他總結道,“我們這個物種,將‘設計’的能力帶到了前所未有的高度。我們是宇宙演化至今,負責開啟第四個偉大時代的催化劑、助產士和先驅。”

因此,人類的終極使命和宇宙角色,便是去實現“設計者時代”的全部潛力——即設計出那些本身就具備設計能力的系統。而這,正是我們今天所說的通用人工智能。

“我鼓勵大家,以我們作為宇宙演化特殊角色的自豪感,以一種探索未知的冒險精神,去勇敢地擁抱這個必然到來的未來。”

參考資料:

1.https://www.youtube.com/watch?v=f9KDMFZqu_Y

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
?Shams:不用擔心哈利伯頓,他沒事&可以出戰G3

?Shams:不用擔心哈利伯頓,他沒事&可以出戰G3

雷速體育
2025-06-12 07:04:49
醫生提醒:起床后不立刻疊被子!5個以為很衛生,實際很臟的習慣

醫生提醒:起床后不立刻疊被子!5個以為很衛生,實際很臟的習慣

資說
2025-06-09 18:58:07
提前決戰!總決賽1-1后贏下G3球隊,奪冠概率高達80.5%

提前決戰!總決賽1-1后贏下G3球隊,奪冠概率高達80.5%

雷速體育
2025-06-12 07:47:08
1.3萬到2146!江西教師崗蒸發84%,下一個“萬年縣停招”輪到誰?

1.3萬到2146!江西教師崗蒸發84%,下一個“萬年縣停招”輪到誰?

李砍柴
2025-06-11 22:50:45
記者:小凱文-波特預計將拒絕執行255萬美元球員選項

記者:小凱文-波特預計將拒絕執行255萬美元球員選項

懂球帝
2025-06-12 03:40:10
0-3!比國足還慘,18強賽最差球隊誕生,僅積3分,排名倒數第一

0-3!比國足還慘,18強賽最差球隊誕生,僅積3分,排名倒數第一

體育就你秀
2025-06-11 08:16:17
李寧翻車的主要原因是他根本不清楚國人為什么會無條件支持全紅嬋

李寧翻車的主要原因是他根本不清楚國人為什么會無條件支持全紅嬋

逍遙論經
2025-06-11 11:25:03
汕頭一市場凌晨起火3名孩子不幸遇難 親屬:事發前其母剛好外出買藥 當地婦聯:會盡力幫扶

汕頭一市場凌晨起火3名孩子不幸遇難 親屬:事發前其母剛好外出買藥 當地婦聯:會盡力幫扶

紅星新聞
2025-06-11 17:18:19
無恥敗類!聲稱“餓死不去內地工作”,如今卻妄想來內地撈金?

無恥敗類!聲稱“餓死不去內地工作”,如今卻妄想來內地撈金?

頭號劇委會
2025-06-10 22:22:05
我當年高考628分,現在工資才7千!老公只考了400多分,目前年入80萬……

我當年高考628分,現在工資才7千!老公只考了400多分,目前年入80萬……

19樓
2025-06-11 20:34:50
以快制快,500海軍陸戰隊部署洛杉磯,川普沒有重蹈黑命貴

以快制快,500海軍陸戰隊部署洛杉磯,川普沒有重蹈黑命貴

移光幻影
2025-06-10 22:08:05
從歐洲糧倉到戰爭廢墟:63%烏克蘭人開始懷念亞努科維奇

從歐洲糧倉到戰爭廢墟:63%烏克蘭人開始懷念亞努科維奇

任紀煙
2025-06-09 19:39:20
女大學生深夜在宿舍玩“狼牙棒”!這不是可愛,是沒素質

女大學生深夜在宿舍玩“狼牙棒”!這不是可愛,是沒素質

狐貍先森講升學規劃
2025-06-10 14:49:13
江蘇一市市管領導干部任前公示

江蘇一市市管領導干部任前公示

揚子晚報
2025-06-11 21:18:25
小鵬G7全球首秀!預售價23.58萬起 又一Model Y殺手?

小鵬G7全球首秀!預售價23.58萬起 又一Model Y殺手?

手機中國
2025-06-11 21:25:06
給小白鼠天天喝這種水:心臟壞了、炎癥高了!不少人也天天喝

給小白鼠天天喝這種水:心臟壞了、炎癥高了!不少人也天天喝

FM93浙江交通之聲
2025-06-07 06:41:19
正式退賽,孫穎莎發聲,原因曝光,并非傷病,馬琳或不該犯錯

正式退賽,孫穎莎發聲,原因曝光,并非傷病,馬琳或不該犯錯

樂聊球
2025-06-11 12:35:41
中印邊境沖突升級,印軍越界,中方強硬反制,火箭炮群壓境警告

中印邊境沖突升級,印軍越界,中方強硬反制,火箭炮群壓境警告

一個有靈魂的作者
2025-06-09 19:22:39
小沈陽女兒也太牛了!18歲出道驚艷韓國,徹底擺脫最丑星二代標簽

小沈陽女兒也太牛了!18歲出道驚艷韓國,徹底擺脫最丑星二代標簽

娛樂圈筆娛君
2025-06-11 16:07:25
小米su7 Ultra起火燃燒,小米副總裁迅速回應:副駕易燃物品起火

小米su7 Ultra起火燃燒,小米副總裁迅速回應:副駕易燃物品起火

揚子晚報
2025-06-11 14:17:09
2025-06-12 07:56:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15282文章數 513774關注度
往期回顧 全部

科技要聞

OpenAI CEO:這是我最后一篇沒有AI幫助的文章了

頭條要聞

牛彈琴:網上熱議美國新版圖變小了 讓全世界哭笑不得

頭條要聞

牛彈琴:網上熱議美國新版圖變小了 讓全世界哭笑不得

體育要聞

一位中國老板,復興了歐洲百年俱樂部

娛樂要聞

那爾那茜定向委培違約事件 持續發酵

財經要聞

美法院為何決定暫時維持特朗普關稅?

汽車要聞

5萬級5座純電微型車 奇瑞QQ多米正式上市

態度原創

手機
家居
親子
房產
軍事航空

手機要聞

谷歌 Pixel 史上最佳音質:Pixel 10 系列手機被曝升級揚聲器

家居要聞

木質灰調 現代輕奢質感

親子要聞

西蒙愛哭愛鬧摔東西?我覺得他更多的是戲精而已!

房產要聞

曝光!食堂問題頻發,海口這所名校被重罰百萬!

軍事要聞

加州請求阻止特朗普政府派兵被駁回

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 临高县| 龙海市| 兴业县| 邮箱| 津南区| 封开县| 张家川| 阳江市| 广宗县| 吉木萨尔县| 山丹县| 竹溪县| 日土县| 屯门区| 资兴市| 会东县| 铜鼓县| 开化县| 塔河县| 东兰县| 临澧县| 浮梁县| 吴堡县| 仲巴县| 潞西市| 青海省| 滕州市| 闽清县| 思茅市| 安图县| 当涂县| 岑溪市| 宜宾市| 贡嘎县| 贵港市| 建昌县| 霍林郭勒市| 原平市| 甘孜县| 承德县| 穆棱市|