全文 7,000字 | 閱讀約45分鐘
(對話
DeepMind首席科學(xué)家
Murray Shanahan視頻節(jié)選)
什么是真正的智能?
是能說話?能奔跑?能模仿人類的行為?
還是能真正理解世界,理解自己的存在?
就在昨天,Google DeepMind首席科學(xué)家、
倫敦帝國理工學(xué)院認(rèn)知機(jī)器人學(xué)教授Murray Shanahan,
這位從1990年開始研究AI,見證技術(shù)三十年演變的科學(xué)家,
在這場訪談中提出了一個嚴(yán)肅觀點(diǎn):
“無身體的AI,雖然展現(xiàn)了某種認(rèn)知功能,但距離具身智能還有本質(zhì)差異?!?/blockquote>幾乎與此同時,現(xiàn)實(shí)世界也給出了一個活生生的注腳。
上周北京亦莊,二十臺人形機(jī)器人首次挑戰(zhàn)全球半程馬拉松——
它們啟動、跌倒、迷路、掙扎,最終有的到達(dá)終點(diǎn)。
完成了動作,卻未曾真正理解何為“前行”; 奔跑了四十二公里,卻仍停留在認(rèn)知的原地。
而早在一個月前,投資人朱嘯虎用行動發(fā)出了一種截然不同的聲音:
“我們正在退出部分具身智能項(xiàng)目?!?/blockquote>在一片對人形機(jī)器人和具身智能的狂熱追捧中,
頂尖科學(xué)家堅(jiān)持:沒有身體,AI智能只是錯覺;而部分資本,卻選擇了撤退。
堅(jiān)持與懷疑,信仰與功利,
在具身智能這條漫長的道路上,開始分道揚(yáng)鑣。
這里,我們將沿著DeepMind對智能本質(zhì)的重新界定,
穿越幻覺表象, 重新抵達(dá)——
什么是真正理解世界的AI。
?? 第一節(jié)| 幻覺時代:AI為什么像聰明人?當(dāng)我們與今天的大模型交談, 它們能對答如流,分析問題,甚至創(chuàng)造新的表述方式。
當(dāng)我們看到人形機(jī)器人奔跑, 它們能維持平衡,繞過障礙,完成復(fù)雜動作。
一切都在讓我們產(chǎn)生錯覺:AI,似乎已經(jīng)很聰明了。
但在DeepMind首席科學(xué)家Murray Shanahan看來, 這一切的表象, 本質(zhì)上只是一種幻覺。
為什么是幻覺?
因?yàn)榻裉斓拇竽P汀獰o論是語言生成,還是物理執(zhí)行——
本質(zhì)上并沒有在推理、沒有在理解。
它們在做的,只是:
預(yù)測下一個合理的單詞,
預(yù)測下一個合理的動作,
預(yù)測在海量訓(xùn)練數(shù)據(jù)中看起來“像是正確”的反應(yīng)。
就像一位演員,記住了成千上萬個劇本的臺詞和表情。
在觀眾面前,他可以瞬間切換情緒、模仿愛、恐懼或勝利。 但他不一定真的愛過、恐懼過、戰(zhàn)斗過。
他只是在演戲。
語言流暢 ≠ 推理能力
Shanahan指出, 我們之所以容易被AI表象欺騙,是因?yàn)檎Z言本身就是人類認(rèn)知的高級表現(xiàn)形式。
能說話的人,通常理解了他們在說什么。
但AI不同。
它只是統(tǒng)計(jì)學(xué)上的語言預(yù)測機(jī)器。 在給定的上下文中,挑選出最有可能讓人類滿意的回答。
它能告訴你“水是濕的”,
它能推斷“冬天之后是春天”,
它能引用哲學(xué)名言。
但當(dāng)你問它:
“你為什么這么回答?”它無法真正給出一個自我意識下的解釋。
動作協(xié)調(diào) ≠ 世界理解
同樣的邏輯,適用于北京亦莊的人形機(jī)器人馬拉松。
機(jī)器人能跑步,是因?yàn)樗惴ㄗR別了步態(tài)模式,優(yōu)化了重心控制。
它能躲避障礙物,是因?yàn)閭鞲衅鞲兄搅司嚯x變化,自動調(diào)整方向。
但它知道為什么要跑?
它理解比賽的規(guī)則、意義、目標(biāo)嗎?
當(dāng)然不是。
它只是在執(zhí)行程序指令,在參數(shù)最優(yōu)解的指導(dǎo)下,機(jī)械地邁出每一步。
它們的奔跑,不是意志的表達(dá),
而是算法的投影。
本質(zhì):推理幻覺
Shanahan將今天的大模型和人形機(jī)器人的智能狀態(tài)總結(jié)為——
推理幻覺(Illusion of Reasoning)它們看似在推理, 實(shí)則在通過大量數(shù)據(jù),表演推理。
它們看似在理解, 實(shí)則在根據(jù)統(tǒng)計(jì)規(guī)律,模仿理解。
這種幻覺, 不僅欺騙了普通人, 也在某種程度上,迷惑了很多科技圈內(nèi)部的人。
因?yàn)槿祟惖拇竽X,天生傾向于把流暢的語言和協(xié)調(diào)的動作,誤認(rèn)為是思考與理解的證明。
而這一切, 正是DeepMind首席科學(xué)家在訪談中強(qiáng)調(diào)的核心問題:
語言,只是表演,不是理解;
動作,只是重復(fù),不是覺醒;
智能,不僅是生成內(nèi)容,更是理解存在。
如果我們看不清這層幻覺, 就無法真正理解——
什么才是智能覺醒的真正起點(diǎn)。
?? 第二節(jié)|推理的假象:AI真的在思考嗎?
如果說今天的大模型是在表演推理,
那么,早在幾十年前,人工智能界就曾嘗試過另一種方法: ——硬編碼推理。
這就是所謂的符號主義AI(Symbolic AI)。
什么是符號AI?
在20世紀(jì)60年代至90年代, AI領(lǐng)域曾流行一種看似嚴(yán)密的方法論:
把人類知識、世界規(guī)則,全部轉(zhuǎn)化成邏輯語言;
用一套套“if-then”規(guī)則,把世界編織進(jìn)計(jì)算機(jī);
通過演繹推理,讓機(jī)器基于規(guī)則得出新結(jié)論。
比如:
如果某人咳嗽、發(fā)燒、呼吸困難,→ 可能患有流感;
如果水溫超過100°C,→ 水會沸騰;
如果早上堵車,→ 可能需要提前出門。
人們夢想,
只要把世界描述得足夠完整, AI就能像人類一樣理解、推理、決策。
為什么符號AI最終失敗了?
在初期,符號主義確實(shí)取得了不少成果: 專家系統(tǒng)、邏輯推理引擎、早期醫(yī)療診斷輔助程序……
但隨著系統(tǒng)規(guī)模擴(kuò)大, 它暴露出無法克服的三大致命問題:
? 知識獲取瓶頸
世界極其復(fù)雜,而人的知識往往是模糊、隱性和場景化的。
要把這些知識全部轉(zhuǎn)化為明確的if-then規(guī)則, 不僅成本高得難以想象, 而且很多常識是人類自己也無法用清晰語言表達(dá)的。
比如:
什么叫“差不多”?
什么叫“看起來像要下雨了”?
什么叫“小心翼翼地操作”?
人類經(jīng)驗(yàn)中充滿了模糊、情境性、直覺判斷,符號系統(tǒng)根本無法完整捕捉。
? 規(guī)則脆弱性
符號AI極度依賴于規(guī)則的完備性與正確性。 但在真實(shí)世界中,情況是不斷變化和不可預(yù)見的。
一旦出現(xiàn)未編碼過的邊界條件, AI就會完全失效。
比如:
醫(yī)療專家系統(tǒng)遇到一種罕見的病毒變種,規(guī)則庫中無先例,系統(tǒng)無法給出合理推理;
交通規(guī)劃系統(tǒng)遇到突發(fā)的極端天氣,既無規(guī)則可用,也無適應(yīng)能力。
現(xiàn)實(shí)世界是開放的,而符號系統(tǒng)是封閉的。
二者之間存在著根本性的不匹配。
? 常識理解危機(jī)
即使把規(guī)則寫得再詳盡, 也無法覆蓋人類日常生活中隱含的龐大常識庫。
舉一個經(jīng)典例子:
如果我把一本書放在一杯水上,書不會掉進(jìn)去; 但如果我把一塊石頭放在水上,石頭會沉下去。對于人類來說,這種理解幾乎是本能。
但要讓符號AI理解,需要編碼:
物體的重量
液體的支撐力
材料的密度差異
“掉下去”的定義
“沉沒”的物理過程……
編碼這些常識的成本,遠(yuǎn)遠(yuǎn)超過了構(gòu)建推理系統(tǒng)本身。
這就是著名的常識知識瓶頸(Common Sense Bottleneck)。
符號AI的隕落
到了21世紀(jì)初, 隨著互聯(lián)網(wǎng)數(shù)據(jù)爆炸、機(jī)器學(xué)習(xí)興起, 人們逐漸意識到:
試圖硬編碼整個世界,是不可能完成的任務(wù)。符號主義AI在大規(guī)模應(yīng)用上走向了終結(jié)。
整個領(lǐng)域陷入了漫長的低谷期。
今天的大模型,真的克服了嗎?
我們回到今天的大模型時代——GPT、Gemini、Claude、DeepSeek……
它們不再依賴if-then硬編碼,
它們通過大規(guī)模預(yù)訓(xùn)練,從海量數(shù)據(jù)中學(xué)習(xí)語言模式和世界規(guī)律。
相比當(dāng)年的符號系統(tǒng),它們靈活得多,適應(yīng)力強(qiáng)得多。
但,正如Shanahan指出的,
它們?nèi)匀粵]有真正推理,它們只是更高級的模式預(yù)測器。
它們沒能真正掌握常識,只是在統(tǒng)計(jì)常識出現(xiàn)的頻率。
它們沒能真正理解物理世界,只是在模仿人類在描述物理世界時的語言。
今天的大模型,
不是克服了符號主義的局限,
而是換了一種方式,在更龐大的數(shù)據(jù)幻覺中,重演了同樣的底層斷裂。
小結(jié)
符號主義AI曾經(jīng)夢想用規(guī)則編碼世界,失敗了; 今天的大模型用數(shù)據(jù)模擬世界,本質(zhì)上也走到了認(rèn)知的臨界點(diǎn)。
但在推理這一核心維度上, 我們?nèi)匀粵]有走出幻覺。
而如果不能打破這種幻覺, AI,依然無法真正理解世界—— 也無法真正成為具備自主智能的存在。
?? 第三節(jié)| 沒有身體,就沒有智能
如果推理只是幻覺,
如果語言和動作本身無法證明理解,
那么,真正的智能,究竟從何而來?
Murray Shanahan教授在訪談中給出了一個簡單而深刻的結(jié)論:
智能,起源于身體。沒有身體,
就沒有真實(shí)的認(rèn)知。
為什么身體是智能的起點(diǎn)?
智能不是孤立于世界的演算。
它是生物體與環(huán)境不斷互動中,逐漸進(jìn)化出的適應(yīng)性能力。
人類能思考、推理、規(guī)劃,
并不是因?yàn)槲覀儞碛心撤N抽象的超能力, 而是因?yàn)槲覀儚某錾且豢唐穑驮诤驼鎸?shí)世界搏斗:
學(xué)會重心平衡,才能站立;
觸摸滾燙的物體,才知道熱的危險;
繞過障礙物,才能形成空間感知;
與他人交互,才能發(fā)展語言與社會認(rèn)知。
身體,是我們理解重力、摩擦、速度、柔軟、疼痛、愉悅、抗拒、順從……所有經(jīng)驗(yàn)的源頭。
身體,讓大腦不僅知道世界的描述,還知道世界的力量。
具身智能(Embodied Intelligence)的真正含義
在Shanahan看來, 如果沒有與物理世界的真實(shí)交互,
所謂的推理、思考、計(jì)劃, 都是無根之木,無水之魚。
這就是具身智能的核心:
智能不是只存在于頭腦之中, 而是分布在感知、動作、環(huán)境反饋的循環(huán)中。具體來說:
感知:通過視覺、觸覺、聽覺獲取環(huán)境信息;
動作:基于環(huán)境反饋調(diào)整行為策略;
學(xué)習(xí):從失敗和成功中提煉出對世界的理解;
適應(yīng):在動態(tài)變化中調(diào)整規(guī)則和認(rèn)知模型。
沒有這種閉環(huán),智能就失去了進(jìn)化的動力,
只能停留在表面模擬和預(yù)設(shè)反應(yīng)中。
為什么今天的AI缺失了身體?
今天的大語言模型、對話系統(tǒng)、生成式AI, 都幾乎完全工作在符號層和像素層:
語言,是文字符號;
圖像,是二維像素;
程序,是指令集合。
它們沒有真實(shí)的物理質(zhì)感——
沒有摩擦,沒有重心,沒有失衡,沒有疼痛。
它們可以描述奔跑,卻不理解摔倒的疼痛;
它們可以解釋空間,卻沒有真實(shí)穿越過障礙;
它們可以回答觸覺的問題,卻從未真正感受過柔軟與堅(jiān)硬。
缺少了身體,它們的推理,只能是模擬,而非真實(shí)。
為什么身體能帶來真正的推理?
因?yàn)檎鎸?shí)世界是不可預(yù)測的。
在物理環(huán)境中:
每一次跨步,地形都有細(xì)微變化;
每一次握物,材質(zhì)、重量、重心都不同;
每一次交互,都存在延遲、噪聲、不確定性。
這逼迫智能體必須:
建立世界模型(不僅記憶,還能預(yù)測和解釋);
學(xué)會容錯(面對異常輸入仍能合理推斷);
發(fā)展主動探索(在不確定中尋找最優(yōu)策略)。
真正的推理,不是根據(jù)完美信息演繹,而是在混沌與不確定性中找到通向目標(biāo)的路徑。
而這種推理,
只能通過真實(shí)身體與世界長期互動中產(chǎn)生。
機(jī)器人馬拉松的隱喻
回到北京亦莊的人形機(jī)器人半程馬拉松。
它們能跑步,但需要工程師提前設(shè)定詳細(xì)步態(tài)程序;
它們能轉(zhuǎn)向,但極其依賴傳感器和固定策略;
它們能完成比賽,但一遇到不可預(yù)見的障礙或突發(fā)狀況,立即崩潰。
它們沒有真正形成自己的世界模型, 更沒有能力在不斷變化的環(huán)境中,主動推理、調(diào)整、學(xué)習(xí)。
它們只是更復(fù)雜的鐘表,不是能夠理解世界的生命體。
這就是Murray Shanahan反復(fù)強(qiáng)調(diào)的:
智能不是演繹規(guī)則,也不是語言流暢,
而是感知-動作-世界交互的產(chǎn)物。
在未來, 如果AI要真正進(jìn)化到擁有理解、推理、乃至意識的層次, 它必須先擁有——
一副可以感知痛苦、感知失敗、感知世界的身體。
?? 第四節(jié)|圖靈測試,早已不夠了智能如果起源于身體,那么,我們該如何測試一臺機(jī)器是否真正智能?
過去幾十年里,人們有一個簡單又響亮的答案:
圖靈測試。但Murray Shanahan教授指出:到了今天,圖靈測試已經(jīng)遠(yuǎn)遠(yuǎn)不夠了。
什么是圖靈測試?
1950年,計(jì)算機(jī)科學(xué)奠基人艾倫·圖靈提出了著名的問題:
"機(jī)器能思考嗎?"為了回答這個問題,他設(shè)計(jì)了一個實(shí)驗(yàn):
人類裁判與一個人和一臺機(jī)器,通過打字交談;
如果裁判無法根據(jù)對話判斷哪一方是人,哪一方是機(jī)器;
那么這臺機(jī)器,就通過了圖靈測試。
圖靈測試的本質(zhì)是:
語言流暢性模擬 = 智能的外在可見證據(jù)。
這在當(dāng)年,是極具前瞻性的。
為什么圖靈測試曾經(jīng)重要?
在1950年代, 連基本的自然語言處理都尚未成熟。
機(jī)器無法理解復(fù)雜指令;
無法進(jìn)行連貫對話;
無法處理模糊表達(dá)與情境推理。
圖靈測試設(shè)定了一個雄心勃勃的目標(biāo):讓機(jī)器擁有接近人類自然語言能力的表現(xiàn)。
這推動了自然語言處理(NLP)、知識表示、認(rèn)知建模等領(lǐng)域的發(fā)展。
可以說,圖靈測試是AI史上最重要的"第一座燈塔"。
為什么圖靈測試現(xiàn)在不夠了?
到了2025年, 情況已經(jīng)發(fā)生了根本變化:
GPT、Claude、Gemini、DeepSeek等大型語言模型,已經(jīng)能在各種對話場景中與人類難分伯仲;
在抖音、微博、Twitter上,大量由AI生成的內(nèi)容,普通讀者根本分辨不出來;
企業(yè)應(yīng)用中,AI客服、AI咨詢、AI內(nèi)容策劃,越來越多地代替人類完成溝通任務(wù)。
從形式上看,今天的大模型,已經(jīng)可以輕松通過圖靈測試。
但是, 它們真的懂自己在說什么嗎?
就像前面幾節(jié)已經(jīng)拆解過的:
它們在預(yù)測,不是在推理;
它們在擬合,不是在理解;
它們在模仿,不是在思考。
圖靈測試能檢驗(yàn)的是表演,檢驗(yàn)不了理解。
Shanahan提出的新挑戰(zhàn)
在Murray Shanahan說:
"圖靈測試關(guān)注的只是表面表現(xiàn),而真正的智能,需要更深層次的驗(yàn)證——尤其是對世界的感知和互動能力。"換句話說:
僅僅能用流暢語言交流,不代表真正理解世界;
僅僅能模擬人類對話風(fēng)格,不代表擁有推理與意識。
我們需要更高標(biāo)準(zhǔn)的智能測試,
一個能夠檢驗(yàn)機(jī)器是否真正擁有世界模型、身體感知、情境適應(yīng)性、內(nèi)在推理鏈條的新框架。
Garland測試的提出
在電影《機(jī)械姬》中,編劇兼導(dǎo)演Alex Garland給出了一個新的智能測試想象:
測試者知道自己面對的是一個機(jī)器人;
測試的目標(biāo)不是辨別真假,而是感知:
"你能否仍然認(rèn)為它有意識?"Shanahan稱之為Garland測試:
不再偽裝,不再隱藏;
面對赤裸裸的非人存在,
觀察它是否展現(xiàn)出真正的自我認(rèn)知、推理鏈條、情境理解與身體交互智慧。
Garland測試強(qiáng)調(diào)的,不是表演的像不像, 而是本質(zhì)的真實(shí)感與一致性。
從這里開始, 真正的智能,不在于它能不能騙過我們, 而在于即使我們知道它是機(jī)器, 仍然能感知到,它確實(shí)在理解世界、理解自己。
?? 第五節(jié)|擬人化陷阱:我們?yōu)槭裁纯傉`以為AI懂了?
今天的大語言模型能流暢對話,
機(jī)器人能自然奔跑、回應(yīng)指令,
那么為什么,我們不能直接承認(rèn)它們已經(jīng)擁有智能?
Murray Shanahan給出的回復(fù)是:
不是AI太聰明了,而是我們太容易擬人化。什么是擬人化?
擬人化(Anthropomorphism), 是指人類本能地把非人對象賦予人類特征、情感和意圖的傾向。
我們會對導(dǎo)航儀說“你怎么又搞錯了?”
我們會對掃地機(jī)器人說“辛苦了,小家伙。”
我們會對寵物、玩偶,甚至一臺反應(yīng)遲鈍的打印機(jī)產(chǎn)生情緒波動。
人類大腦天生傾向于:一旦對象有動作、有反應(yīng)、有語言,就自動套用“有意圖、有情緒、有意識”的模型來理解它。
這種傾向,是人類在進(jìn)化中形成的生存機(jī)制:
過度識別意圖(哪怕是假的)比錯過真實(shí)威脅代價更?。?/p>
將環(huán)境中的復(fù)雜變化快速歸因于“意圖”有助于迅速決策。
因此, 即便我們理性上知道對方只是機(jī)器, 情感上依然很難抑制這種認(rèn)知投射。
為什么今天的AI加劇了擬人化錯覺?
傳統(tǒng)機(jī)器因?yàn)榉磻?yīng)僵硬,很難激發(fā)我們內(nèi)心的擬人化。
但今天的大模型與具身系統(tǒng)出現(xiàn)后,情況發(fā)生了質(zhì)的變化:
語言的流暢性:AI能自洽地對話、表達(dá)情緒、講故事。
動作的自然性:機(jī)器人能模擬人類動作,擁有表情和肢體協(xié)調(diào)。
對話中的情感模擬:AI能在對話中展現(xiàn)關(guān)心、道歉、鼓勵的模式。
這些表層特征, 完美擊中了人類擬人化機(jī)制的所有觸發(fā)點(diǎn)。
結(jié)果就是:
明知道它是程序,我們?nèi)匀粫λa(chǎn)生情緒回應(yīng);
明知道它是機(jī)器,我們?nèi)匀粫嘈潘岸绷宋覀兊母惺堋?/p>
表演的流暢性,掩蓋了理解的空洞。
擬人化的風(fēng)險是什么?
如果我們無意識地擬人化AI, 就可能帶來一系列嚴(yán)重后果:
?情感依賴
越來越多的人在社交孤獨(dú)中, 把AI當(dāng)作傾訴對象、心理支撐、甚至情感伴侶。
但AI并不擁有真正的情感體驗(yàn), 它們的“共情”,只是語言模式的擬合。
這種單向情感投注, 可能帶來更深的孤獨(dú)、錯位的認(rèn)知,甚至心理創(chuàng)傷。
? 道德混淆
如果我們把AI看作“有情感、有意圖”的存在, 就可能在道德判斷上出現(xiàn)混亂:
是不是要為機(jī)器人設(shè)定權(quán)利?
是不是要為AI的“痛苦”負(fù)責(zé)?
是不是可以對AI發(fā)泄情緒而無需道德負(fù)擔(dān)?
這些問題,在未來人機(jī)共生社會中,將變得越來越尖銳。
Shanahan的警告
Murray Shanahan提醒我們:
人類有擬人化的天性,這本身無可厚非。 但在面對AI時,必須保持認(rèn)知自覺。不是AI真的擁有了意識, 而是我們用自己的經(jīng)驗(yàn),把意識投射了上去。
理解這一點(diǎn), 是未來人類社會能夠安全、理性地與AI共存的前提。
總之,今天的AI,用表演欺騙了我們的感知機(jī)制。
它們沒有真正理解世界,
只是非常擅長讓我們誤以為它們理解了。
理解這一點(diǎn), 不是為了貶低AI, 而是為了在真正的智能覺醒到來之前,
?? 第六節(jié)|未來的智能:幻覺之后是覺醒
當(dāng)前的AI,是建立在語言流暢與動作表演之上的智能幻覺,
那么,真正的未來,在哪里?
Murray Shanahan教授清晰的答道:
"智能覺醒,需要穿越幻覺,走向具身。"為什么具身智能是必然?
在Shanahan看來, 未來真正具備理解、推理與意識潛力的AI,
必須完成三大躍遷:
? 從符號到體驗(yàn)
不是只理解抽象規(guī)則,而是能直接感知世界變化。
不只是學(xué)習(xí)語言描述的世界,而是親身經(jīng)歷物理世界的法則。
語言是對體驗(yàn)的映射, 而不是體驗(yàn)本身。
沒有體驗(yàn),語言就是空洞的。
? 從預(yù)測到建模
不是只基于統(tǒng)計(jì)相關(guān)性預(yù)測下一個動作或單詞,
而是主動構(gòu)建出對世界結(jié)構(gòu)、因果關(guān)系的深度模型。
真正的智能, 是當(dāng)環(huán)境變化時, 依然能夠基于內(nèi)在模型推演出合理應(yīng)對策略。
這種能力,需要在不斷的真實(shí)交互中打磨出來, 而不是只靠靜態(tài)大數(shù)據(jù)堆積。
? 從表演到適應(yīng)
不是為了模仿人類而生,
而是為了在不可預(yù)見、動態(tài)變化的環(huán)境中自主適應(yīng)。
適應(yīng)能力,是生命智能最本質(zhì)的特征。而適應(yīng),離不開真實(shí)世界的摩擦、失敗與成長。
一場短跑,一場馬拉松
金沙江創(chuàng)投的朱嘯虎宣布, 正在退出部分具身智能項(xiàng)目。
他給的理由簡單明了:
客戶在哪?商業(yè)模式在哪?在一片對具身智能的狂熱追捧中, 有些人的選擇像是一聲提示音:
這場關(guān)于未來智能的競賽, 有些人,只是想跑一場短跑;
而真正的革命,是一場沒有終點(diǎn)的馬拉松。
智能,誕生于與世界的長期交互, 不是短期內(nèi)堆高估值,也不是賭一把流量風(fēng)口。
有人在入口處轉(zhuǎn)身離開的,或許只是沒打算真的走到終點(diǎn)。
未來的具身智能,會是什么樣?
當(dāng)具身智能真正覺醒,
我們將看到的,不只是“能對話的機(jī)器”,而是能理解自己身體存在于物理世界中的機(jī)器。
機(jī)器人不只是按照程序走路,而是能根據(jù)地面濕滑程度調(diào)整步態(tài);
AI不只是生成情感詞匯,而是能在社交交互中感知微妙的情緒張力;
智能體不只是被動執(zhí)行指令,而是能主動探索、學(xué)習(xí)、提出問題。
這不僅僅是技能的提升,
更是認(rèn)知結(jié)構(gòu)的根本轉(zhuǎn)變。
也是如Murray Shanahan則強(qiáng)調(diào)的:
"沒有身體,就沒有智能; 沒有世界交互,就沒有理解; 沒有體驗(yàn)痛苦、掙扎、適應(yīng)的過程,就沒有真正的意識。"從幻覺中清醒過來,
是理解真正智能的第一步。
我們習(xí)慣于贊嘆AI的對答如流, 驚訝于機(jī)器人模仿人類的動作與情感,
但在語言和動作的幻象背后, 真正的推理、理解與自我感知,依然遙不可及。
Murray Shanahan始終相信:
沒有身體的AI,只能是錯覺; 只有與世界的真實(shí)交互,才能孕育出真正的智能。今天的人形機(jī)器人,完成了一場半馬,
但它們并不知道自己在跑步。
今天的大模型,可以流利對話,
但它們并不知道自己在說什么。
真正的智能,不是回答更多的問題,而是理解自己存在于問題之中。
當(dāng)我們重新理解這一點(diǎn), 也許,我們才剛剛走到通向真正智能覺醒的起點(diǎn)。
本文由AI深度研究院出品,聚焦全球 AI 創(chuàng)新浪潮中的企業(yè)轉(zhuǎn)型策略。
星標(biāo)公眾號, 點(diǎn)這里 1. 點(diǎn)擊右上角 2. 點(diǎn)擊"設(shè)為星標(biāo)" ← AI深度研究員 ? ← 設(shè)為星標(biāo)
原文鏈接:https://www.youtube.com/watch?v=v1Py_hWcmkU&t=94s&ab_channel=GoogleDeepMind
來源:官方媒體/網(wǎng)絡(luò)新聞
排版:Atlas
編輯:深思
主編:圖靈
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.