人形機器人,是科技領(lǐng)域的熱門話題,尤其是近期,某國產(chǎn)機器人更成為輿論和公眾新寵,風(fēng)頭一時無兩。
但圖靈獎得主、Facebook首席人工智能科學(xué)家和紐約大學(xué)教授楊立昆的“大嘴巴”又來了。楊立昆近期在一檔播客節(jié)目中表示,“很多人形機器人演示令人印象深刻,但實際很蠢,不少機器人公司都在豪賭未來3到5年AI會突飛猛進。”言辭之間,是對當(dāng)下人形機器人智能性的嚴(yán)重質(zhì)疑。
智能機器人,機器是個殼,AI做靈魂。楊立昆對AI的批評由來已久。早在2024年5月,他就在社交媒體上質(zhì)疑AI威脅論,認為當(dāng)前AI大模型的智力水平甚至不如家貓,缺乏推理能力和對物理世界的理解。
同年10月,在《華爾街日報》專訪中,他再次強調(diào)AI威脅論是“胡說八道”,指出生成式AI僅擅長預(yù)測文本,缺乏真正的推理和常識。
他還批評馬斯克、奧特曼(Oenp AI創(chuàng)始人)等對通用人工智能(AGI)的樂觀預(yù)測,認為其缺乏科學(xué)依據(jù)。
2025年2月,在巴黎人工智能行動峰會上,楊立昆再次炮轟生成式AI,稱其“無法達到人類智慧水平”,并呼吁學(xué)術(shù)界轉(zhuǎn)向研究“聯(lián)合嵌入預(yù)測架構(gòu)(JEPA)”,以構(gòu)建能理解物理世界的AI系統(tǒng)。
楊立昆(Yann LeCun)何許人也?
這位是人工智能領(lǐng)域的大拿之一,其核心成就包括發(fā)明卷積神經(jīng)網(wǎng)絡(luò)(CNN)并推動其實際應(yīng)用。他于1987年提出CNN概念,1998年開發(fā)的LeNet-5成為首個成功應(yīng)用于手寫體識別的CNN模型,奠定了現(xiàn)代計算機視覺的基礎(chǔ)。還在深度學(xué)習(xí)領(lǐng)域持續(xù)突破,改進反向傳播算法,推動無監(jiān)督與自監(jiān)督學(xué)習(xí)研究,減少對標(biāo)注數(shù)據(jù)的依賴,并提出能量模型等理論框架。
2018年,他因在深度學(xué)習(xí)的突破性貢獻與辛頓、本吉奧共同獲得圖靈獎。
加入Meta后,他領(lǐng)導(dǎo)團隊將AI技術(shù)應(yīng)用于社交、醫(yī)療等多領(lǐng)域,并主導(dǎo)開發(fā)開源大模型Llama系列。其數(shù)百篇頂級論文與合著的《深度學(xué)習(xí)》著作,系統(tǒng)構(gòu)建了學(xué)科理論體系。
作為學(xué)界與工業(yè)界的橋梁,楊立昆培養(yǎng)了大批人才,推動AI從實驗室走向產(chǎn)業(yè),被公認為計算機視覺與神經(jīng)網(wǎng)絡(luò)研究的先驅(qū)。
所以,楊立昆對人形機器人及AI的批評,可不是外行人看熱鬧。
誠然,人形機器人是一大風(fēng)口,這些年,執(zhí)著在人形機器人下注的企業(yè)很多。
波士頓動力可能是大家最早了解人形機器人的代表性企業(yè), 特斯拉的Optimus(擎天柱)人形機器人研發(fā)也在推進中。
而在國內(nèi),從優(yōu)必選到宇樹科技、稚暉君創(chuàng)立的智元機器,在人形機器人領(lǐng)域的身影也分外活躍。
數(shù)據(jù)顯示,截至2024年12月底,全國共有45.17萬家智能機器人產(chǎn)業(yè)企業(yè),注冊資本共計64445.57億元。這其中,哪怕只有百分之一的企業(yè)是專注人形機器人,其投入也是天文數(shù)字。
但與此同時,對人形機器人熱潮冷眼旁觀的不止楊立昆一人。
作為RT-X項目(一個旨在提升機器人智能和泛化能力的研究項目)參與者的Wolfram Burgard教授接受媒體采訪時指出,當(dāng)下的基礎(chǔ)模型訓(xùn)練方式有著能效上的巨大問題,它需要太多的算力和數(shù)據(jù)才能達到泛化的門檻。
他舉了個例子:在RT-X數(shù)據(jù)集項目中,雖然他們收集了超過100萬個片段,覆蓋了機器人的500多項技能和在16萬項具體任務(wù)上的表現(xiàn),但當(dāng)桌子高度稍有不同,RT-2就可能完全無法正確進行任務(wù)了。
機器人,到底要不要弄個人樣?技術(shù)分歧的背后是產(chǎn)業(yè)實踐的矛盾。
今年世界機器人大會上,人形機器人打詠春、跳熱舞的視頻刷屏社交網(wǎng)絡(luò),但在家庭場景演示中,疊衣、擦桌等基礎(chǔ)任務(wù)頻頻失誤。
人性機器人能前后空翻,卻疊不好一件衣服?
原因在于,人形機器人需要通過傳感器感知自身的姿態(tài)和位置,然后通過控制系統(tǒng)調(diào)整機械結(jié)構(gòu)來完成動作,其過程主要依賴于預(yù)編程的算法和模型,不需要對物理世界進行深入的理解和推理。
相比之下,疊衣服則是一個更加復(fù)雜的任務(wù)。它要求機器人對物體的形狀、質(zhì)地、紋理等進行感知和理解,然后根據(jù)這些信息進行精確的操作。
上述現(xiàn)象稱為目標(biāo)驅(qū)動與規(guī)劃能力缺失,是當(dāng)前AI技術(shù)面臨的一個重大挑戰(zhàn)。
分層規(guī)劃是一種復(fù)雜的決策和執(zhí)行過程,它涉及到將一個宏大的目標(biāo)分解為一系列逐步細化的子目標(biāo),且這些子目標(biāo)又可以進一步細分為具體的行動步驟。
人類和動物在日常生活中經(jīng)常使用這種策略來解決問題或完成任務(wù)。例如,一個人想要做一頓飯,這個大目標(biāo)可能被分解為準(zhǔn)備食材、烹飪不同的菜肴、布置餐桌等多個子目標(biāo)。每個子目標(biāo)又包含更具體的動作,如切菜、調(diào)味、加熱等。
相比之下,現(xiàn)有的AI系統(tǒng)往往缺乏這樣的靈活性。盡管現(xiàn)代AI可以在特定領(lǐng)域內(nèi)表現(xiàn)出色,例如圍棋或象棋中的決策制定,但在面對復(fù)雜多變的真實世界任務(wù)時,它們的表現(xiàn)就顯得力不從心了。
家務(wù)活動就是一個很好的例子,看似簡單但其實包含了無數(shù)細微的動作和判斷。例如,清理桌子不僅涉及物理上的移動物品,還需要決定哪些物品應(yīng)該放在哪里,如何避免打翻水杯等。這些都需要對環(huán)境有深刻的理解以及靈活應(yīng)對的能力。
現(xiàn)有AI系統(tǒng)的局限性,在于它們通常依賴于預(yù)設(shè)的算法和大量訓(xùn)練數(shù)據(jù)來執(zhí)行特定任務(wù),而不是像人類那樣基于經(jīng)驗進行即時調(diào)整。
如此意味著,當(dāng)面對未曾見過的情況或者需要跨多個領(lǐng)域綜合考慮的問題時,AI可能會感到“困惑”。
此外,由于缺乏對因果關(guān)系的理解,AI難以預(yù)測其行為可能帶來的長期后果,這也是導(dǎo)致其規(guī)劃能力受限的重要原因之一。
人是造物主的杰作。人手共有22個自由度,而當(dāng)前大多數(shù)機械手,如夾爪形態(tài)(8個自由度)、6自由度仿人手機械手(同樣8個自由度),以及全驅(qū)動靈巧手(如Shadow hand,超過20個自由度),均無法完美復(fù)刻人手的功能。
此外,能源與硬件的“不可能三角”進一步制約發(fā)展。人形機器人需在有限體積內(nèi)平衡動力、續(xù)航與成本。高能耗傳感器和復(fù)雜機械結(jié)構(gòu),導(dǎo)致現(xiàn)有電池技術(shù)難以支撐長時間自主運行。
稚暉君創(chuàng)立的智元機器近日爆紅,但講到機器人的性能時,相關(guān)工作人員承認,目前只能達到人類效率的20%-30%,而且電池續(xù)航僅有兩個小時。續(xù)航短也是業(yè)內(nèi)人形機器人的普遍問題。
用一個通俗的比喻,當(dāng)下人形機器人就像垂垂老矣的白發(fā)翁,每做幾個動作,就得停下來充電。
機器人行業(yè)突圍,需正視三大現(xiàn)實。
首先是放棄“通用幻想”,深耕垂直場景。藍橙實驗室與清華大學(xué)合作的五軸并聯(lián)加工機器人,專攻航空發(fā)動機葉片打磨,通過限定工作場景將精度提升至微米級;華中科技大學(xué)吸附式移動機器人聚焦船舶曲面焊接,放棄人形設(shè)計換取更強環(huán)境適應(yīng)性。
其次是重構(gòu)技術(shù)路線圖。哈工大教授朱延河團隊建立工業(yè)機器人開源架構(gòu),允許廠商共享運動控制算法,避免重復(fù)造輪子。
相關(guān)探索雖未突破根本,但指向更務(wù)實的技術(shù)迭代路徑。
最后是重新定義“智能”標(biāo)準(zhǔn)。智能與否不看動作復(fù)雜度,而看任務(wù)泛化能力。工業(yè)機器人若實現(xiàn)自主更換夾具的模塊化設(shè)計,或許比執(zhí)著人形更易打開市場。
顯然,圍繞人形機器人的爭論,是技術(shù)路線之爭,更是對機器人及AI的認知之爭。一方堅持“人形是通用智能最佳載體”,認為雙足移動與人類環(huán)境天然兼容;另一方主張“形態(tài)服務(wù)于功能”,認為輪式、臂式或模塊化設(shè)計更易商業(yè)化。工業(yè)機器人歷經(jīng)60年發(fā)展,從Unimate機械臂到現(xiàn)代協(xié)作機器人,技術(shù)突破均圍繞專用場景展開。人形機器人若執(zhí)著于“通用性”標(biāo)簽,可能重蹈早期自動駕駛企業(yè)盲目追求全場景的覆轍。
機器人產(chǎn)業(yè)的終極目標(biāo)不是創(chuàng)造“人造人”,而是拓展人類能力的邊界。向左,是繼續(xù)追逐“像人”的幻想,向右,是擁抱細分場景的實用主義。選擇哪條路徑,將決定這個行業(yè)是真正走向為人所常用,還是又一場資本狂歡的泡沫。
作者簡介
當(dāng)你關(guān)注財經(jīng)和時事熱點時,我愿和你分享背后的故事和觀點
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.