99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

強化學習之父:LLM主導只是暫時,擴展計算才是正解

0
分享至

鷺羽 發自 凹非寺
量子位 | 公眾號 QbitAI

大模型目前的主導地位只是暫時的,在未來五年甚至十年內都不會是技術前沿。

這是新晉圖靈獎得主、強化學習之父Richard Sutton對未來的最新預測。

就在剛剛的新加坡國立大學建校120周年(NUS120)之際,Sutton受邀發表演講——塑造AI和強化學習的未來。



其實,這已經不是Sutton第一次在公開場合表達類似的觀點,早在他19年的著作《痛苦的教訓》中,他就明確提出:

讓AI尤其是LLM模仿人類思維方式,只能帶來短期的性能提升,長期看只會阻礙研究的持續進步。

在他4月份新發表的論文《歡迎來到體驗時代》也再度強調了這點,同時他表示,擴展計算才是正解。



本次NUS120演講長達一個多小時,可謂是干貨滿滿、信息量超大。

讓我們一起來看看完整演講內容。

LLM主導是暫時的

Sutton首先提及當前人類處于數據時代,像ChatGPT這類大語言模型,都是靠分析人類產生的大量數據(如文本、圖像、視頻)進行訓練。

但始終追逐人類思維方式,至多也只能達到“人類水平”

在數學、科學等領域,人類數據里的知識已經接近極限,AI難以突破現有認知,純靠模仿已經很難再有創新。



AI需要新的數據來源,且要隨著AI增強而改進,靜態數據集顯然不足。

因此他認為AI終將從依賴人類數據,轉向通過Agent與世界的第一人稱交互,以獲取“體驗數據”的學習。

AlphaGo在與李世石對弈的第二局中,下出的神之一手——第37手,在人類標準下完全非常規的走法,就充分展現了AI在這種體驗學習下的思考潛力。

也就是說,AI將會在自主體驗中,完成自己的更新迭代,產生更高級的數據并反哺自身,構成一個“越學越強”的循環。

還能不受人類現有知識限制,自由探索人類未涉及的領域,比如全新的科學理論、材料設計等。

Sutton舉了個例子:

一個蹣跚學步的嬰兒會通過不斷探索周圍環境主動學習,然后隨著認知增長,每一次互動方式都會隨著經驗有所不同。

因此AI的未來將屬于通過互動和經驗學習的“體驗時代”,Agent需要從經驗中學習,而這遠遠超出了LLM的能力范疇。

即使現有LLM在連接全球知識上表現出色,但通往這一未來的核心路徑始終是強化學習。

強化學習正是圍繞著經驗學習構造,但要發揮強化學習全部潛力,還需具備持續學習能力的深度學習算法



而這背后要靠對大規模算力的充分利用來支撐,繼續基于搜索和學習擴展算力,以適應AI性能需求增加。

可以說,從長遠看,真正的突破還是來自規模計算

不同Agent去中心化互利共贏

談及Agent的前景,Sutton提出對不同目標的Agent可以尋求去中心化合作。

他認為每個Agent的獎勵信號都各不相同,且都試圖最大化自己的回報,那么只需要讓不同Agent各自實現其目標,再通過互動,就能實現互利共贏。

這就類似于人類社會中的經濟運轉,得益于自然語言和貨幣的發明,盡管人們擁有不同的目標和能力,但在過程中相互協調配合,也能產生出不錯的效果。

但還是有不少人主張集中控制AI,甚至呼吁暫停AI。

Sutton認為這種聲音更多的是來源于對未知的恐懼,要接受個體目標的多樣性,建立合作化秩序,AI的潛力恰恰就在去中心化合作。



另外,Sutton還提到了“設計時代”的概念,當前的機器越來越類生命化,而生命也被視作生物機器。

但生命與技術之間存在本質差異,生命是在無意識下被復制產生,而技術則先經設計師意識想象再落地創造,這是一個設計過程,且設計產物也更易改進。

因此人類發展AI,就是為了將設計做到極致——設計出能自主設計的Agent,而人類將會在設計時代扮演催化劑和創造者的角色,將AI視作推動發展的機遇,而非單純的技術產物。

One More Thing

Sutton的言論一出,很快在社區引起了激烈討論。

支持者認為技術的突破往往來自未知與偶然,技術已趨向成熟的LLM似乎即將觸及領域天花板。



而反對者則認為技術的發展在于不斷改進,也許LLM不是AI的最終形態,但它也必定在AGI發展過程中占據重要作用。



那么你對LLM的未來抱有怎樣的看法呢?歡迎在評論區留言討論。

參考鏈接:
[1]https://x.com/slow_developer/status/1931497651926892673

[2]https://www.youtube.com/live/f9KDMFZqu_Y
[3]https://x.com/bryanklow/status/1931229131162955801
[4]https://goo.gle/3EiRKIH

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
反轉?韋東奕未獨立在頂刊發論文,成果不夠,學生說聽不懂他的課

反轉?韋東奕未獨立在頂刊發論文,成果不夠,學生說聽不懂他的課

古希臘掌管松餅的神
2025-06-12 12:54:35
哪吒汽車宣布今日起居家辦公 員工:門禁失效,母公司將破產重整

哪吒汽車宣布今日起居家辦公 員工:門禁失效,母公司將破產重整

紅星新聞
2025-06-12 14:56:12
全運會驚天逆轉!四強誕生,五隊為生死戰拼盡全力!

全運會驚天逆轉!四強誕生,五隊為生死戰拼盡全力!

恨透誓言
2025-06-12 14:34:20
廣汽豐田將推出增程版全新一代漢蘭達、賽那,中國工程師主導

廣汽豐田將推出增程版全新一代漢蘭達、賽那,中國工程師主導

IT之家
2025-06-12 11:04:16
外媒反思中美倫敦談判三大驚人發現,最終的框架協議很可能長這樣

外媒反思中美倫敦談判三大驚人發現,最終的框架協議很可能長這樣

生思孰慮
2025-06-12 15:44:51
確認了!上海燃氣將取消紙質賬單!但這類人仍可保留紙質版

確認了!上海燃氣將取消紙質賬單!但這類人仍可保留紙質版

新民晚報
2025-06-12 15:14:08
臺“館長”大陸行,島內瘋狂打賞,黃智賢批評被掩蓋

臺“館長”大陸行,島內瘋狂打賞,黃智賢批評被掩蓋

南宗歷史
2025-06-12 15:49:37
美財長突然退出談判回國,白宮收到更大噩耗:中方讓關鍵底牌失效

美財長突然退出談判回國,白宮收到更大噩耗:中方讓關鍵底牌失效

大道無形我有型
2025-06-11 13:14:25
梁洛施攜大8歲導演男友覓食,為愛定居北京,仨子已認可準繼父

梁洛施攜大8歲導演男友覓食,為愛定居北京,仨子已認可準繼父

星改造
2025-06-12 13:01:18
新版人民幣全面落地!紙幣會被取代?蘇州6年試點揭曉真相

新版人民幣全面落地!紙幣會被取代?蘇州6年試點揭曉真相

搬磚營Z
2025-06-08 01:52:44
腦梗去世的人越來越多?醫生勸告:天熱寧可打麻將,也別做6件事

腦梗去世的人越來越多?醫生勸告:天熱寧可打麻將,也別做6件事

墜入二次元的海洋
2025-06-10 14:47:58
超市里最適合糖尿病人的6款主食!糖友們可無限回購

超市里最適合糖尿病人的6款主食!糖友們可無限回購

墜入二次元的海洋
2025-06-12 13:57:22
民進黨創黨元老洪奇昌率島內生技產業界人士來京參訪交流

民進黨創黨元老洪奇昌率島內生技產業界人士來京參訪交流

海峽導報社
2025-06-12 15:11:07
2025年養老金迎來新調整,退休新規實施,還有個好消息

2025年養老金迎來新調整,退休新規實施,還有個好消息

詩詞中國
2025-06-12 13:07:51
3戰狂輸67分!CBA冠軍廣廈亞冠36分慘負衛冕冠軍 止步八強

3戰狂輸67分!CBA冠軍廣廈亞冠36分慘負衛冕冠軍 止步八強

醉臥浮生
2025-06-12 07:59:55
臺灣館長變形計!上飛機前:大陸人民每天水深火熱,落地后:真香

臺灣館長變形計!上飛機前:大陸人民每天水深火熱,落地后:真香

垛垛糖
2025-06-11 21:58:28
螞蟻國際回應在香港申請穩定幣牌照:相關通道開啟后盡快提交

螞蟻國際回應在香港申請穩定幣牌照:相關通道開啟后盡快提交

澎湃新聞
2025-06-12 15:02:26
出大事了,美特種兵出動,希拉里重出江湖,特朗普:逮捕加州州長

出大事了,美特種兵出動,希拉里重出江湖,特朗普:逮捕加州州長

今墨緣
2025-06-11 09:59:13
韋東奕否認生活不能自理,煩惱是給本科生開的課,上著上著沒人選

韋東奕否認生活不能自理,煩惱是給本科生開的課,上著上著沒人選

行者聊官
2025-06-09 18:26:10
泯!"20歲"穆科科被雙重棄用,歐青賽預選賽10場12球踢不上正賽

泯!"20歲"穆科科被雙重棄用,歐青賽預選賽10場12球踢不上正賽

直播吧
2025-06-12 15:57:20
2025-06-12 17:44:49
量子位 incentive-icons
量子位
追蹤人工智能動態
10647文章數 176167關注度
往期回顧 全部

科技要聞

一鏡雙目捅破天,華為最快明年Q2超越蘋果

頭條要聞

全美多地或舉行"拒絕國王"抗議活動 特朗普已發出警告

頭條要聞

全美多地或舉行"拒絕國王"抗議活動 特朗普已發出警告

體育要聞

沒有人會不喜歡TJ-麥康奈爾

娛樂要聞

鄧紫棋自爆因官司6年沒收到版稅, 重錄舊作反擊

財經要聞

"特馬"互撕反轉?特朗普回應馬斯克反悔

汽車要聞

方程豹最大SUV比豹8便宜?鈦7搭華為智駕

態度原創

健康
房產
手機
家居
公開課

呼吸科專家破解呼吸道九大謠言!

房產要聞

曝光!食堂問題頻發,海口這所名校被重罰百萬!

手機要聞

魅族新機 M582Q 三證齊全,預計為魅族 22 小屏版

家居要聞

精致奢華 豐富的連貫空間

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 唐海县| 盐山县| 龙陵县| 东宁县| 定襄县| 康马县| 大化| 静乐县| 平度市| 莱州市| 武义县| 潍坊市| 象山县| 庆安县| 临海市| 延庆县| 揭阳市| 子洲县| 玛沁县| 钟山县| 青神县| 安丘市| 和顺县| 泰和县| 黔西| 故城县| 江口县| 通许县| 阿尔山市| 商洛市| 资中县| 尖扎县| 中方县| 新余市| 文安县| 广水市| 南昌市| 汕尾市| 桐乡市| 上思县| 浦东新区|