99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

又一篇“苦澀的教訓”,讓AI覺得人間有不值,發現無窮盡 | 筆記

0
分享至

“我們正站在人工智能新時代的門檻上。”

“新一代智能體將主要通過自身經驗學習,獲得超越人類的能力?!?/p>

短短兩句話,足以說明《歡迎來到體驗世界》絕對是近兩三年來最重要的AI論文。

作者是DeepMind的強化學習副總裁席爾瓦( David Silver)和圖靈獎得主薩頓(Richard Sutton)。


1 體驗式學習通向超人智能(ASI)

“我們認為,一旦充分釋放體驗式學習(experiential learning)的潛力,人工智能將獲得驚人的新能力。這個“體驗時代”將以這樣一類智能體及其環境為特征:它們不僅能從海量的經驗數據中學習,還將在多個層面上突破以人為中心的 AI 系統的限制:

  • 智能體將生活在持續不斷的經驗流中,而非僅僅經歷片段式的交互;

  • 它們的行動與觀察將深深扎根于環境之中,而不僅僅通過人類語言進行互動;

  • 它們的獎勵將來源于與環境的實際互動,而不是基于人類的主觀判斷;

  • 它們將圍繞自身經驗進行規劃與推理,而不是僅按照人類語言或思維方式來推理。

我們相信,當前的技術水平,配合適當的算法,已具備實現這些突破的強大基礎。同時,AI 社區在這一方向上的持續探索,將激發一系列創新,推動 AI 快速邁向真正具備超人能力的智能體。”

2 再次咀嚼苦澀的教訓

薩頓是強化學習之父,人類知識與認知結構的局限性,他已經在中說得很清楚:

人類試圖注入知識與結構性設計的努力,終將被計算與學習能力所取代。 真正有效的 AI 方法,是那些能夠利用計算進行廣泛訓練、學習以取得成果的方法。

這里他再次提醒的,顯然是機器在自我學習中的經驗,而主要不是人類的經驗。

3 Ilya Sutzkever的超級智能

看到這篇文章,不禁想起OpenAI前首席科學家Ilya Sutzkever。

他在離開 OpenAI 后創辦了公司 Safe Superintelligence Inc.(SSI)。

Ilya去年底已經公開。他把互聯網上的數據,比作AI的“化石能源”,總有一天要開采完。他指出了將來三個數據來源:AI可以產生新的數據,AI自己可以決定從大量可能的答案中選取最好的那個,人類可以從真實世界獲取數據。


Ilya預言,我們將會向著超級智能前行,這將與之前的智能有著本質的不同 。“AI系統的本質和特征即將劇變?!?/p>

關于超級智能的推理能力,Ilya這樣描述:“它想得越深,就會越不可測。(The more it reasons, the more unpredictable it becomes。)。我們現有的AI是可測的,因為它是對人類直覺的模仿重現,想想人類大腦如果你讓它在0.1秒內給出答案,它只能是直覺反應?!?/p>

所以(機器的)推理將會是不可預測的。就像2016年AlphaGo對弈李世石時,在第二番棋中下出的第37“神之一手”。

“AI只有變得不可預測,才能戰勝人類。”

4LLM在走出低谷

去年9月份,我們發表了一篇文章,《》,提醒西爾瓦在MIT的一個演講,提出超級規模的強化學習展開了一條通向超人智能的明確路徑,而這一切“僅僅是開始”?,F在,他正式提出了AI的新范式。


我們可以對比下,8個月之前,他在當時正在走出谷底的曲線上,只是打出了3個問號;現在,出現了AlphaProof和Computer Use這兩個智能體。


(主流人工智能范式的簡要時間軸草圖。縱軸表示該領域在強化學習(RL)上的總體研究投入與計算資源所占比例。)

5AI肯定會有自我意識

可以肯定,機器會有自我意識。對于人類個體來說,終極的獎勵機制,就是人類的意識,以及從中產生的意義。當機器會為自己設定獎勵函數后,肯定會產生自我意識。這已經不再是個哲學問題,或者說不是存在意義上的哲學問題,而是一個在倫理意義上的哲學問題,也是個工程問題。

Ilya認為超級智能將會產生自我意識?!盀槭裁床荒??自我意識是有用的,就像我們人類,意識是自我的一部分,自我意識是我們世界模型的一部分?!?/p>

6 東方的頓悟

論文中提到了DeepSeek的推理模型進行強化學習訓練時,所出現的“頓悟時刻”。

一個有趣的“頓悟時刻”出現在DeepSeek-R1-Zero的中間版本中。該模型學會了以擬人化的語氣重新思考。這對我們來說也是一個頓悟時刻,讓我們見證了強化學習的力量與美感。


(來源:DeepSeek R1論文)

7 人類需要獨立于自己的智能

論文表達了這樣一個意思,如果說AI產生了garbage in, garbage out的結果,那也可能是因為人類自己在科學與迷信、真實與謬誤上還分不清:

一個被訓練來模仿人類思想甚至匹配人類專家答案的智能體,可能會繼承深深嵌入在數據中的謬誤思維方法,例如有缺陷的假設或內在的偏見。

想想看,當互聯網上的語言已經被虛假的信息和垃圾內容污染后,而烏合之眾又以此為自己的精神食糧,可能以后AI的價值,在于幫助人們獲得最起碼的知識營養。

人類要為自己的認知備份,那就是讓機器更加科學地思考,從體驗中產生更真實的數據,更真誠的獎勵機制。我們需要一個與人類對照的智能。

8 真正的智能體

它有長期記憶,有短期目標與長期目標,它可能在即時的獎勵機制中犯下錯誤 ,但是會根據長期獎勵機制進行糾錯。這才是真正的智能體,持續糾錯,終身學習。

9 科學大發現

論文中提到最多的,是下一代智能體對科學探索的價值。一旦擺脫以人為中心的強化學習,下一代智能體將會超越人類已有的知識。體驗式學習把知識扎根于真實的世界中,并且從世界模型中預測和產生獎勵機制,在與環境的互動過程中,不斷試錯,這非常類似于人類的科學探索過程:

也許最具變革意義的將是科學發現的加速。人工智能智能體將在材料科學、醫學或硬件設計等領域自主設計和進行實驗。通過不斷從自身實驗的結果中學習,這些智能體可以迅速探索新的知識前沿,從而以前所未有的速度開發出新型材料、藥物和技術。

10 后果

人類自負。

論文來源:

https://storage.googleapis.com/deepmind-media/Era-of-Experience%20/The%20Era%20of%20Experience%20Paper.pdf

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“成筐的充電寶被攔”!有機場已經提前執行新規定

“成筐的充電寶被攔”!有機場已經提前執行新規定

上觀新聞
2025-06-27 07:34:08
600分無緣211,690無緣清北,特控線全國最高,心疼這個高考大省

600分無緣211,690無緣清北,特控線全國最高,心疼這個高考大省

史書無明
2025-06-25 22:29:55
一天打8小時零工,過了40歲的我,“還沒讓自己認輸” | 深度報道

一天打8小時零工,過了40歲的我,“還沒讓自己認輸” | 深度報道

北青深一度
2025-06-26 16:06:50
不想被電車背刺的人,都去搶小米YU7了

不想被電車背刺的人,都去搶小米YU7了

源Auto
2025-06-26 21:57:28
以色列證實地面部隊進入伊朗!德黑蘭確認最高指揮官身亡

以色列證實地面部隊進入伊朗!德黑蘭確認最高指揮官身亡

項鵬飛
2025-06-26 22:11:12
家庭聚餐要報備?餐館冷清!新華社:基層整治跑偏,普通人遭了殃

家庭聚餐要報備?餐館冷清!新華社:基層整治跑偏,普通人遭了殃

春序娛樂
2025-06-27 11:42:25
徹底涼涼?保時捷銷量暴跌42%、降40萬沒人買,網友:誰當冤大頭

徹底涼涼?保時捷銷量暴跌42%、降40萬沒人買,網友:誰當冤大頭

劉曠
2025-06-27 10:02:19
小米YU7九色全開箱!實拍無濾鏡,哪個是你的

小米YU7九色全開箱!實拍無濾鏡,哪個是你的

葡萄說娛
2025-06-27 10:09:30
68歲大爺全身重彩刺青腸子悔青了:身份證辦不了親戚躲著走

68歲大爺全身重彩刺青腸子悔青了:身份證辦不了親戚躲著走

大象新聞
2025-06-27 09:43:27
29歲女孩跑網約車,一天掙夠500元才收工

29歲女孩跑網約車,一天掙夠500元才收工

瀟湘晨報
2025-06-27 11:44:12
27歲河南女子“李福貴”走村賣貨吸粉600多萬,自學英語、會開拖拉機,面對流量她痛哭稱壓力太大

27歲河南女子“李福貴”走村賣貨吸粉600多萬,自學英語、會開拖拉機,面對流量她痛哭稱壓力太大

極目新聞
2025-06-27 14:12:35
確實接受不了!很多北大學生退學,竟是醫學部調劑學生到護理專業

確實接受不了!很多北大學生退學,竟是醫學部調劑學生到護理專業

火山詩話
2025-06-27 12:36:37
1歲工作22歲退休?山西一疾控中心職工,領69萬養老金

1歲工作22歲退休?山西一疾控中心職工,領69萬養老金

大象新聞
2025-06-26 17:30:59
太尷尬了!女兒高考成績662分,朋友圈集體沉默,只收獲幾個贊…

太尷尬了!女兒高考成績662分,朋友圈集體沉默,只收獲幾個贊…

火山詩話
2025-06-27 05:43:50
伊朗看到朝鮮的滾筒洗衣機陣列,會流下羨慕嫉妒恨的口水吧?

伊朗看到朝鮮的滾筒洗衣機陣列,會流下羨慕嫉妒恨的口水吧?

科羅廖夫
2025-06-26 13:20:13
足協開始慌了?蘇超除了球技有點業余,這幾點已經完美碾壓中超!

足協開始慌了?蘇超除了球技有點業余,這幾點已經完美碾壓中超!

田先生籃球
2025-06-27 11:59:43
1棵樹采購價近80萬!福州煙臺山公園“天價樹”調查:已有多棵死亡

1棵樹采購價近80萬!福州煙臺山公園“天價樹”調查:已有多棵死亡

揚子晚報
2025-06-27 10:38:28
安徽一女子網購5斤荔枝,一口氣剝完后僅退款,網友:氣死了

安徽一女子網購5斤荔枝,一口氣剝完后僅退款,網友:氣死了

大笑江湖史
2025-06-26 17:55:06
帝國的挽歌與鋼軌上的黎明,從中伊鐵路看歐亞陸權重構與霸權黃昏

帝國的挽歌與鋼軌上的黎明,從中伊鐵路看歐亞陸權重構與霸權黃昏

小皮霸2025
2025-06-27 11:32:21
突發!83歲蔡瀾離世消息瘋傳!港星邵音音發文悼念,官方尚未回應

突發!83歲蔡瀾離世消息瘋傳!港星邵音音發文悼念,官方尚未回應

大笑江湖史
2025-06-27 09:19:51
2025-06-27 16:12:49
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
134文章數 38關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

27歲"李福貴"賣貨吸粉600多萬 面對流量哭稱壓力太大

頭條要聞

27歲"李福貴"賣貨吸粉600多萬 面對流量哭稱壓力太大

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

網傳白玉蘭最佳男女主獎將“爆冷”

財經要聞

1萬就能刪行政處罰?信用修復江湖起底

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

家居
房產
健康
公開課
軍事航空

家居要聞

明亮寬敞 空間合理安排

房產要聞

最強黑馬殺出!海南這些區域,教育正悄悄崛起!

呼吸科專家破解呼吸道九大謠言!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美媒揭美軍37小時奔襲伊朗細節

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 梓潼县| 冷水江市| 尉犁县| 来安县| 东兰县| 和田县| 河北区| 伊川县| 定西市| 高邑县| 祥云县| 来凤县| 黔江区| 阿瓦提县| 民权县| 兴国县| 宜城市| 化州市| 沙田区| 尼木县| 同江市| 武山县| 灌南县| 息烽县| 改则县| 纳雍县| 灌南县| 马山县| 东平县| 武穴市| 濮阳市| 牙克石市| 临邑县| 成都市| 台北县| 大兴区| 乳源| 泽普县| 涿州市| 澄迈县| 大丰市|