- 人類智能并非通用智能。
我們的大腦是進化的產(chǎn)物,只擅長解決對生存有用的問題,而不是真正“通用”的計算……
在最新一檔播客節(jié)目中,Meta首席AI科學家&圖靈獎得主LeCun發(fā)表了如上觀點。
他表示,AGI(通用人工智能)一詞非常具有誤導性,但人類智能本質(zhì)是非通用的,它非常專業(yè)。
更有意思的是,當大家都在談?wù)撋墒紸I時,他卻憑借直覺大膽預(yù)測:下一代AI的突破可能基于非生成式。
同時他還再次cue到了DeepSeek,并直言對于這個走紅硅谷的新事物,他們這些長期深耕AI領(lǐng)域的人實則并不感到意外。
整場節(jié)目中,LeCun與兩位主持人的討論涵蓋了從大語言模型 (LLMs) 的局限性到人工智能研究的下一個范式轉(zhuǎn)變等主題,重點關(guān)注了推理、規(guī)劃和世界建模等概念。
省流版如下:
- LeCun直覺認為,下一代AI的突破可能基于非生成式;
- 否認AGI會在未來兩年內(nèi)實現(xiàn),但十年內(nèi)可能取得重大進展;
- 人類和動物的智能核心,不是語言,而是對物理世界的建模和行動規(guī)劃;
- 創(chuàng)新可以來自世界任何角落;
- 智能眼鏡代表著AI技術(shù)落地的一個重要方向。
與此同時,量子位在不改變原意的基礎(chǔ)上,對部分問題進行了翻譯整理。
“下一代AI可能基于非生成式”
Q:如何看待一邊是收益遞減,一邊是企業(yè)們紛紛押注生成式AI?
LeCun:毫無疑問,生成式AI很有用,尤其是編程助手之類的。近來人們正在討論Agent系統(tǒng),但它還并不完全可靠。
從技術(shù)演示到實際部署需要巨大跨越,類似10年前自動駕駛的困境——初期演示驚艷,但規(guī)模化落地極難。
過去七十年,人工智能領(lǐng)域一直在重復這樣的歷史:人們提出一個新范式,然后宣稱這將達到人類智能水平,但每次都被證明是錯誤的。要么缺乏泛化性,要么被證明只擅長某個子任務(wù)而非通用任務(wù)。
所以,我們應(yīng)該對它們進行大量投資,尤其是投向運行它們的大量基礎(chǔ)設(shè)施。實際上,大量資金都涌向了AI基礎(chǔ)設(shè)施,這并非為了訓練AI,而是為了讓其運行起來服務(wù)潛在數(shù)十億用戶。
如今,如果我們需要達到人類智能水平,我們需要發(fā)明新技術(shù)。我們還遠未達到這一水平。
Q:人工智能下一步何在?應(yīng)該把資源投向哪里?
LeCun:3年前我寫了一篇文章《A Path Towards Autonomous Machine Intelligence》(通往自主機器智能的道路),闡述了未來十年AI研究的方向。
我認為,未來的AI必須具備幾個關(guān)鍵能力:
- 理解物理世界——不僅僅是處理符號或文本,而是真正“懂”現(xiàn)實世界的運作規(guī)律;
- 具備推理和規(guī)劃能力——能夠像人類一樣思考“如果這樣做,會發(fā)生什么”,并制定策略;
- 擁有持久記憶——不是簡單的數(shù)據(jù)存儲,而是能像人類一樣長期積累和調(diào)用經(jīng)驗;
- 安全可控——AI必須嚴格遵循我們設(shè)定的目標,不能偏離或“自作主張”。
人類和動物的大腦里都有一個“世界模型”——它讓我們能預(yù)測現(xiàn)實世界的運行方式。比如,你扔出一個球,不用計算拋物線,大腦就能預(yù)測它的落點。這種能力讓我們能規(guī)劃行動,比如:“如果我現(xiàn)在左轉(zhuǎn),會不會撞到那輛車?”
在AI領(lǐng)域,我們希望能讓機器也學會這種模型。但問題是:如何讓AI像嬰兒一樣,通過觀察世界來自主學習?
LLM的成功證明了自監(jiān)督學習的強大——讓AI通過預(yù)測文本的下一個token來學習語言規(guī)律。但同樣的方法直接套用到視覺(比如預(yù)測視頻的下一幀)卻行不通,因為現(xiàn)實世界的可能性太多,無法像文字那樣用概率分布建模。
我們提出的解決方案是JEPA(聯(lián)合嵌入預(yù)測架構(gòu)),它不直接生成像素級的預(yù)測,而是在一個更抽象的“表征空間”里進行推理。這有點像人類的大腦——我們不會在腦子里渲染每一幀畫面,而是用更高效的方式理解世界。
有趣的是,現(xiàn)在大家都在談?wù)撋墒紸I,但我的直覺是,下一代AI的突破可能會來自非生成式模型。
這就是我的思考方向——LLM的爆發(fā)沒有改變它,反而讓我更堅信:AI的下一個突破,在于讓機器真正“理解”世界,而不僅僅是生成內(nèi)容。
“AI的未來是像動物一樣思考”
Q:如何看待AGI?
LeCun:我堅信未來必然會出現(xiàn)全面超越人類智能的機器系統(tǒng)——這不是能否實現(xiàn)的問題,而是時間問題。
當前AI已經(jīng)在特定領(lǐng)域展現(xiàn)出超越人類的能力(比如圍棋、圖像識別),但真正的挑戰(zhàn)在于構(gòu)建能夠像生物一樣適應(yīng)現(xiàn)實世界的智能體。
我必須指出,“AGI”這個詞具有誤導性。 它暗示人類智能是“通用”的,而實際上,人類智能極其專業(yè)化。我們的大腦是進化的產(chǎn)物,只擅長解決對生存有用的問題,而不是真正“通用”的計算。
我們覺得自己“通用”,只是因為我們對無法理解的問題根本意識不到。所以,我更傾向于用“高級機器智能(AMI)”這個概念,它在Meta內(nèi)部也被稱為“Ami”(法語“朋友”的意思),而不是誤導性的“AGI”。
我不認為AGI(或AMI)會在明年或未來兩年內(nèi)實現(xiàn)。但十年內(nèi),我們可能會取得重大進展。當然,這取決于我們能否填補當前缺失的關(guān)鍵技術(shù)。
歷史告訴我們,AI的突破總是比預(yù)期更難。比如,深度學習在20世紀80年代就被提出,但直到2010年后才真正爆發(fā)。所以,我保持謹慎樂觀——我相信我們能成功,但絕不會像某些人想象的那么快。
今天的AI(比如大語言模型)在某些任務(wù)上表現(xiàn)驚人,比如通過律師考試(本質(zhì)是信息檢索)、生成代碼(語法嚴格,相對容易)、總結(jié)和改寫文本。
但它們有一個致命缺陷:無法解決從未見過的新問題。比如,讓最好的大語言模型去做最新的奧數(shù)題,它們幾乎得零分,因為它們沒有訓練過類似的題目。
更關(guān)鍵的是,它們沒有真正的推理能力。所謂的“思維鏈”(Chain-of-Thought)只是讓模型生成更多文本,而不是像人類那樣進行抽象推理。
人類和動物(比如貓、老鼠)的智能核心,不是語言,而是對物理世界的建模和行動規(guī)劃。例如:
- 空間推理:如果我讓你想象一個立方體旋轉(zhuǎn)90度,你能在腦中模擬,而不需要語言描述;
- 分層規(guī)劃:如果我要從紐約去巴黎,我不會一步步計算“先邁左腳還是右腳”,而是抽象成“打車→機場→飛機”;
- 動作學習:貓能學會開門、松鼠能記住藏食物的位置,它們沒有語言,但能通過觀察和嘗試掌握復雜技能。
這才是真正的智能,而今天的AI完全做不到這一點。
要讓AI達到動物(甚至人類)的智能水平,我們需要:
1、建立世界模型:讓AI能模擬物理規(guī)律(比如重力、物體互動);
2、分層行動規(guī)劃:像人類一樣,從高層次目標分解到具體動作;
3、非語言推理:真正的智能不依賴語言,而是基于抽象表征;
4、適應(yīng)不確定性:現(xiàn)實世界是混亂的、連續(xù)的,不像語言那樣結(jié)構(gòu)化。
如果能讓AI達到貓的智能水平,就已經(jīng)是巨大突破。 今天的AI能在棋盤上擊敗人類,但一只貓對物理世界的理解,仍然遠超最先進的大語言模型。
我們離真正的人類級AI還有距離,但方向是明確的:不是讓AI更擅長語言,而是讓它像動物一樣理解世界、規(guī)劃行動。這需要全新的架構(gòu),而不僅僅是更大的語言模型。
我相信,未來十年,我們會看到重大進展——但絕不會是“突然覺醒”的超級AI,而是逐步接近生物智能的機器。
“我們對DeepSeek的出現(xiàn)并不意外”
Q:Meta的人工智能策略是怎樣的?
LeCun:作為Meta的AI負責人,我想分享一下我們決定開源LLaMA系列模型的戰(zhàn)略思考。
這個決定源于幾個關(guān)鍵考量:首先,從倫理角度來看,開源是正確的事情。LLaMA 2采用開源模式發(fā)布后,直接推動了整個AI生態(tài)系統(tǒng)的爆發(fā)式增長。這不僅惠及企業(yè)和初創(chuàng)公司,更重要的是讓學術(shù)界能夠真正參與到前沿研究中來。要知道,大學和研究機構(gòu)通常根本沒有資源來訓練自己的基礎(chǔ)模型。
我們的開源策略實際上產(chǎn)生了兩個顯著效果:它確實影響了少數(shù)幾家閉源商業(yè)公司的利益(大家都知道是哪幾家),但它同時為成千上萬的企業(yè)和研究者創(chuàng)造了機會。
在教育領(lǐng)域,正如Jeff教授提到的,LLaMA讓大學能夠運行、研究和改進這些模型。這種開放創(chuàng)新模式正是AI領(lǐng)域最需要的。
有些人可能會問:Meta為什么要免費開放這么重要的技術(shù)?
這其實與我們的商業(yè)模式有關(guān):我們不像某些公司直接靠AI技術(shù)本身盈利,Meta的核心收入來自廣告。而廣告業(yè)務(wù)依賴于基于這些技術(shù)構(gòu)建的高質(zhì)量產(chǎn)品、社交網(wǎng)絡(luò)的網(wǎng)絡(luò)效應(yīng)以及用戶規(guī)模和參與度。
所以,開源不僅不會損害我們的商業(yè)利益,反而能幫助我們建立更強大的生態(tài)系統(tǒng)。當更多人使用和改進這些技術(shù)時,最終也會反哺我們的產(chǎn)品。
在追求人類級AI的道路上,開源是加速突破的關(guān)鍵。這可能是人類面臨的最重大科技挑戰(zhàn)之一,沒有任何一家公司能壟斷所有創(chuàng)新。最近DeepSeek等開源項目的突破就證明了這一點——它們讓硅谷大吃一驚,但我們這些長期參與開源的人并不感到意外。
我堅信以下幾點:
- 創(chuàng)新可以來自世界任何角落
- 沒有人能壟斷好點子(除了那些自我感覺特別良好的人)
- 過去十年AI的快速發(fā)展,很大程度上要歸功于代碼和知識的開放共享
在Meta,我們將繼續(xù)堅持開源策略,因為這是推動AI技術(shù)進步、實現(xiàn)真正創(chuàng)新的最佳途徑。我們期待與全球的研究者和開發(fā)者一起,共同邁向更智能的未來。
“智能眼鏡成技術(shù)落地重要方向”
Q:如何看待智能眼鏡等設(shè)備的出現(xiàn)?
LeCun:我認為智能眼鏡代表著AI技術(shù)落地的一個重要方向。
在我看來,未來的AI助手應(yīng)該具備以下特點:
- 全天候陪伴:像真正的助手一樣隨時待命;
- 多感官交互:能夠”看到”和”聽到”用戶所處的環(huán)境(在獲得許可的前提下);
- 專業(yè)化分工:不是單一助手,而是一組各有所長的虛擬助手團隊。
有趣的是,很多人擔心AI比人類聰明會帶來威脅,但我認為這反而是賦能。就像在科研或企業(yè)管理中,最理想的情況就是能找到比自己更優(yōu)秀的人才一起工作。
最后,關(guān)于開源的重要性,我想強調(diào)就像Linux改變了互聯(lián)網(wǎng)基礎(chǔ)設(shè)施一樣,開源AI將重塑整個行業(yè)格局。
我預(yù)見未來會有成千上萬種不同的AI助手,它們將基于像Meta這樣的大公司提供的開源基礎(chǔ)模型,由全球各地的開發(fā)者進行定制開發(fā)。這種模式不僅能避免技術(shù)壟斷,更能促進真正的創(chuàng)新。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.