99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不是視頻模型學習慢,而是LLM走捷徑|18萬引大牛Sergey Levine

0
分享至

聞樂 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

為什么語言模型能從預(yù)測下一個詞中學到很多,而視頻模型卻從預(yù)測下一幀中學到很少?

這是UC伯克利大學計算機副教授Sergey Levine最新提出的靈魂一問。

他同時是Google Brain的研究員,參與了Google知名機器人大模型PALM-E、RT1和RT2等項目。

Sergey Levine在谷歌學術(shù)的被引用次數(shù)高達18萬次。



“柏拉圖洞穴”是一個很古老的哲學比喻,通常被用來說明人們對世界認知的局限性。



Sergey Levine的這篇文章以《柏拉圖洞穴中的語言模型》為題,又想要揭示AI的哪些缺陷呢?



在文章的開頭,作者提到人工智能就是在研究能夠反映人類智能的靈活性和適應(yīng)性的假想智能。

一些研究者推測,人類心智的復(fù)雜性和靈活性源自于大腦中應(yīng)用的一個單一算法,通過這個算法可以實現(xiàn)所有多樣化的能力。

也就是說,AI如果能復(fù)現(xiàn)這個終極算法,人工智能就能通過經(jīng)驗自主獲取多元能力,達到人類智能的高度。

在這個探索過程中,語言模型取得了非常成功的突破。

甚至,LLMs實現(xiàn)能力躍升背后的算法(下一詞預(yù)測+強化學習微調(diào)),也非常簡單。



單一終極算法假設(shè)似乎就是AI模型的答案……

然而,這個假設(shè)對視頻模型并不適用。

語言模型與視頻模型的對比

早在基于Transformer的語言模型出現(xiàn)之前,AI研究人員就已經(jīng)忙著研究一個看似非常相似的問題:

就像LLM通過預(yù)測來自網(wǎng)絡(luò)文本數(shù)據(jù)的下一個詞來學習一樣,視頻模型也可能通過預(yù)測視頻數(shù)據(jù)的下一個幀來學習。

甚至從數(shù)據(jù)上來說,視頻數(shù)據(jù)比文本數(shù)據(jù)包含的信息更豐富,那么預(yù)測下一幀得到的認知會遠比預(yù)測下一詞得到的認知更全面。

比如,一個飛往宇宙探索的機器人,在那里沒有人能提供文本,但是它仍然能獲取豐富的視頻數(shù)據(jù)。

基于這些證據(jù),我們可以認為能夠“觀察”到更多物理世界的視頻模型應(yīng)該比語言模型更加強大。

然而,事情并沒有按研究人員所期望的那樣發(fā)展。



盡管視頻預(yù)測模型可以生成逼真的視頻,但在解決復(fù)雜問題、進行復(fù)雜推理方面,語言模型仍然是主要且唯一的選擇。

這與LLMs對物理世界的“觀察”更少,卻獲得了更復(fù)雜的認知能力形成了鮮明對比。

就像文章中舉出的例子:我們并不能用Veo 3估算夏威夷群島的巖石體積是否比珠穆朗瑪峰更大,但ChatGPT卻可以回答這個問題。

這是因為LLMs只需要調(diào)用人類總結(jié)的地理知識(文本中已有相關(guān)數(shù)據(jù)或推理路徑)。

簡單來說,視頻數(shù)據(jù)是物理世界的直接映射,而非人類認知的加工產(chǎn)物。

視頻模型需自主歸納物理規(guī)律,而LLMs卻可以 “抄近路” 模仿人類已有的推理結(jié)果。

LLMs 僅接觸文本 “影子”(人類認知的投影),卻比直接觀察物理世界的視頻模型更具推理能力。

作者認為,這是LLMs只會對人類進行“腦部掃描”,而非真正學會了像人類一樣推理問題。

就像是AI系統(tǒng)存在于「柏拉圖洞穴」中。



AI系統(tǒng)的“柏拉圖洞穴”

“柏拉圖洞穴”原本的故事是指一群人被綁在洞穴里,只能看到墻壁上的影子,不能看到洞穴外的陽光。

這個故事通常被用來說明人們對世界認知的局限性。

在文章中,作者將互聯(lián)網(wǎng)比作洞穴,將真實世界比洞穴外的陽光,用“柏拉圖洞穴”來類比AI的現(xiàn)狀。

AI通過語言模型學習人類的知識和思維方式,但這些知識就像洞穴墻壁上的影子,是人類智慧的間接反映。

它們并沒有真正理解世界,其能力是對人類認知的 “逆向工程”,而不是自主探索。

而視頻模型目前連影子都無法認知……

AI該如何走出洞穴?

作者認為既然LLMs已經(jīng)了實現(xiàn)人類認知的部分模擬(如推理、生成),那么就可以將它可 “心智原型”,為通用AI提供起點。

而長期目標則是突破“影子依賴”,不再依賴人類中介(類似文本數(shù)據(jù)),讓AI通過傳感器直接與物理世界交互,自主探索。

對此,有評論者提出:視覺、語言、行動系統(tǒng)就像獨立的洞穴,如果能夠通過共享結(jié)構(gòu)建立橋梁,可能就不需要逃離“洞穴”,跨模態(tài)連接就成了探索過程中的挑戰(zhàn),需要找到一個連接這些模態(tài)的統(tǒng)一的方法。



對于AI的“洞穴困境”,你有怎樣的看法呢?

參考鏈接:
[1]https://x.com/svlevine/status/1931796654233194534
[2]https://sergeylevine.substack.com/p/language-models-in-platos-cave

— 完 —

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
新疆12歲男孩撿1歲女嬰,18年后娶她為妻,找到妻子親生父母后傻了

新疆12歲男孩撿1歲女嬰,18年后娶她為妻,找到妻子親生父母后傻了

如煙若夢
2025-06-12 17:20:44
俞灝明太尷尬了!王曉晨回應(yīng)和俞灝明結(jié)婚:我頭昏了大家開心就好

俞灝明太尷尬了!王曉晨回應(yīng)和俞灝明結(jié)婚:我頭昏了大家開心就好

小咪侃娛圈
2025-06-12 15:08:26
越南正在發(fā)生巨變

越南正在發(fā)生巨變

17譚
2025-06-12 12:57:38
特朗普長子發(fā)文“讓屋頂?shù)捻n國人更加偉大”,引發(fā)韓國人震怒?

特朗普長子發(fā)文“讓屋頂?shù)捻n國人更加偉大”,引發(fā)韓國人震怒?

隨波蕩漾的漂流瓶
2025-06-12 16:00:08
71歲老帥留任!國足恥辱紀錄后,伊萬合同藏關(guān)鍵條件

71歲老帥留任!國足恥辱紀錄后,伊萬合同藏關(guān)鍵條件

老瑋是個手藝人
2025-06-13 02:21:12
印度墜機事故致超290人死亡!警方發(fā)現(xiàn)一名墜機幸存者:手持登機牌能行走,座位是11A!英國首相發(fā)聲

印度墜機事故致超290人死亡!警方發(fā)現(xiàn)一名墜機幸存者:手持登機牌能行走,座位是11A!英國首相發(fā)聲

每日經(jīng)濟新聞
2025-06-13 00:15:07
震驚!網(wǎng)傳上海一知名企業(yè)裁員,要求員工配合離職,沒有經(jīng)濟補償

震驚!網(wǎng)傳上海一知名企業(yè)裁員,要求員工配合離職,沒有經(jīng)濟補償

火山詩話
2025-06-11 18:30:37
女子被射瞎最新進展,肇事男已經(jīng)找到,家屬想出三十萬私了

女子被射瞎最新進展,肇事男已經(jīng)找到,家屬想出三十萬私了

映射生活的身影
2025-06-11 17:51:27
王鈺棟:戰(zhàn)印尼那腳遠射感覺要進了;為老大哥們感到可惜

王鈺棟:戰(zhàn)印尼那腳遠射感覺要進了;為老大哥們感到可惜

懂球帝
2025-06-12 22:50:06
“鎖死”對華關(guān)稅?特朗普半場開香檳,中方直接扯下美方遮羞布

“鎖死”對華關(guān)稅?特朗普半場開香檳,中方直接扯下美方遮羞布

熱點網(wǎng)友
2025-06-12 22:53:00
張桂梅創(chuàng)辦女高17年,為何至今無一人考上清北?這個回答振聾發(fā)聵

張桂梅創(chuàng)辦女高17年,為何至今無一人考上清北?這個回答振聾發(fā)聵

娛樂故事
2025-06-12 12:25:19
三位港獨藝人妄圖內(nèi)地撈金,遭遇滑鐵盧!演唱會取消,全面遭抵制

三位港獨藝人妄圖內(nèi)地撈金,遭遇滑鐵盧!演唱會取消,全面遭抵制

歸史
2025-06-06 14:49:41
共和報:米蘭與馬競就特奧達成協(xié)議,以2300萬歐+獎金完成交易

共和報:米蘭與馬競就特奧達成協(xié)議,以2300萬歐+獎金完成交易

懂球帝
2025-06-12 11:31:40
為加速拋美債,344噸黃金運回中國,加州要獨立,關(guān)稅戰(zhàn)的水很深

為加速拋美債,344噸黃金運回中國,加州要獨立,關(guān)稅戰(zhàn)的水很深

紅色鑒史官
2025-04-15 12:10:03
武漢網(wǎng)紅花錢要李維剛刪除包殘疾人魚塘視頻,因為這會給當?shù)啬ê?>
    </a>
        <h3>
      <a href=映射生活的身影
2025-06-11 20:17:34
美媒痛心:特朗普成美國世紀終結(jié)者,而中國手里還有一張王牌沒用

美媒痛心:特朗普成美國世紀終結(jié)者,而中國手里還有一張王牌沒用

博覽歷史
2025-06-12 06:00:03
38.98萬元,斯巴魯純正瓦罐WRX Wagon tS上市,2.4T+CVT,充一波?

38.98萬元,斯巴魯純正瓦罐WRX Wagon tS上市,2.4T+CVT,充一波?

CLauto酷樂汽車
2025-06-12 23:46:33
北約“5%軍費”或?qū)κ澜鐦?gòu)成更大威脅

北約“5%軍費”或?qū)κ澜鐦?gòu)成更大威脅

環(huán)球時報國際
2025-06-12 10:44:14
一家獨大英超轉(zhuǎn)播收入高達33億鎊,超其他任何歐洲聯(lián)賽總收入

一家獨大英超轉(zhuǎn)播收入高達33億鎊,超其他任何歐洲聯(lián)賽總收入

直播吧
2025-06-12 16:50:24
俄報復(fù)第二階段,敖德薩港、杜布諾機場成轟炸中心,阻斷北約援助

俄報復(fù)第二階段,敖德薩港、杜布諾機場成轟炸中心,阻斷北約援助

菠蘿欣賞家本尊
2025-06-13 01:26:38
2025-06-13 03:19:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
10647文章數(shù) 176167關(guān)注度
往期回顧 全部

科技要聞

一鏡雙目捅破天,華為最快明年Q2超越蘋果

頭條要聞

印度墜機幸存者:我站起來時周圍都是尸體 嚇壞了

頭條要聞

印度墜機幸存者:我站起來時周圍都是尸體 嚇壞了

體育要聞

沒有人會不喜歡TJ-麥康奈爾

娛樂要聞

鄧紫棋自爆因官司6年沒收到版稅, 重錄舊作反擊

財經(jīng)要聞

787客機首起空難 波音飛機事故頻發(fā)引質(zhì)疑

汽車要聞

方程豹最大SUV比豹8便宜?鈦7搭華為智駕

態(tài)度原創(chuàng)

手機
旅游
本地
房產(chǎn)
公開課

手機要聞

iPhone一季度全球減產(chǎn)40%:小米即將反超蘋果

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

本地新聞

非遺里的河南 | 黃河泥變身千年墨寶,寫字都帶仙氣兒~

房產(chǎn)要聞

18位頂級買家瘋搶!凱旋新世界,憑何成為廣州頂豪終極價值錨點?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 汉寿县| 德阳市| 本溪| 辛集市| 临海市| 旺苍县| 仁寿县| 霸州市| 孝昌县| 衡东县| 彝良县| 巧家县| 修文县| 雷波县| 元谋县| 福贡县| 张家界市| 文昌市| 汉源县| 镇雄县| 永平县| 绥宁县| 鹤岗市| 侯马市| 平山县| 尼玛县| 桐柏县| 五大连池市| 宣恩县| 阳信县| 鄱阳县| 图们市| 金湖县| 琼中| 通江县| 通州市| 宁夏| 宁陕县| 南丹县| 德兴市| 娄烦县|