撰文 | 張祥威 編輯|馬青竹
圣誕節(jié),大洋彼岸,波士頓動力給人形機器人Altas穿上圣誕老人服裝,原地翻起跟頭。
咱們這邊,宇樹科技的機器狗B2-W,上演“天賦覺醒”,出盡風(fēng)頭。馱起成年人,能上山,能下水,能翻筋斗。網(wǎng)友大呼,“騎狗上班,就在今天”。
幾天后,智元機器人發(fā)布開源項目AgiBot World,基于百萬真機數(shù)據(jù)集,相比 Google 開源的 Open X-Embodiment 數(shù)據(jù)集,長程數(shù)據(jù)規(guī)模高出10倍,場景范圍覆蓋面擴大100倍。
智元機器人由華為天才少年“稚暉君”創(chuàng)立,在過去一年時間完成七輪融資,估值已達到70億元。
近2年來,機器人賽道滾燙熱辣,也吸引了一撥汽車人。
布局早的,特斯拉的Optimus已進化到第二代,2024年11月小鵬發(fā)布了Iron。據(jù)國家知識產(chǎn)權(quán)局信息,蔚來剛獲得一項“換電機器人及充換電站”的專利。12月底,廣汽展示了最新產(chǎn)品,第三代人形機器人GoMate。
李想也坐不住了,表示理想汽車百分百會做人形機器人,但并非現(xiàn)在?!叭绻覀冞BL4級自動駕駛的汽車都解決不了,怎么去解決更復(fù)雜的?”
而這個世界不可能等L4智駕實現(xiàn)之后,才去發(fā)展人型機器人。
比如上文提到的,隸屬三星的先行者波士頓動力成立于1992年,當紅的宇樹科技成立于2016年。2017年,人型機器人領(lǐng)域已經(jīng)集中吸引了一波巨頭布局,比如小米、華為等,2019年,蘋果也加入。
而汽車勢力入局人形機器人,大致分兩種,一種由車企孵化團隊進行研發(fā),比如小鵬和廣汽等。另一種由汽車人離開原公司,組隊創(chuàng)業(yè)。
做人形機器人這撥汽車人,許多與智能駕駛關(guān)系密切。他們熟悉規(guī)則算法、深度學(xué)習(xí)、大模型、世界模型。大疆車載的沈劭劼甚至說,大疆車載底色是機器人公司。
人形機器人結(jié)構(gòu)復(fù)雜,包括關(guān)節(jié)、靈巧手等硬件,負責(zé)運動控制的小腦,以及通過大語言模型、模仿學(xué)習(xí)提供認知和規(guī)劃能力的大腦。
宇樹科技創(chuàng)始人王興興認為,相比硬件,機器人行業(yè)當下面臨的AI挑戰(zhàn)更大,且AI技術(shù)路線并不統(tǒng)一,已出現(xiàn)模仿學(xué)習(xí)、深度學(xué)習(xí)、世界模型、空間模型等多種路線。數(shù)據(jù)也稀缺。
傅利葉副總裁周斌認為,可用的物理數(shù)據(jù)集遠遠不夠,具身智能處在非常初期的階段,人工遙操是目前主流的機器人數(shù)據(jù)采集方法,但這種方法費時費力。
在現(xiàn)實層面,可以簡單說很多硬核問題尚未解決,具備真正的“可用性”和商業(yè)性的具身智能非常少。
當汽車人闖進來,或許能帶來破局之法?
智駕人切入機器人賽道
2024年世界機器人大會,774家企業(yè)參展,其中機器人公司169家。九年前,2015年世界機器人大會,參展企業(yè)規(guī)模一共100多家。
“機器人賽道允許大家想象,更多面向C端消費群體,現(xiàn)階段各憑本事?!币晃贿M入機器人賽道的前自動駕駛高管人士告訴《出行百人會/AutocarMax》。
為何離開智駕領(lǐng)域?
他表示,自動駕駛行業(yè)本身不賺錢,有了“地大華魔”四家后,其它家機會就更少了,就算拿到訂單也不賺錢。再加上,部分甲方車企相對保守,影響了汽車智能化生態(tài)。
相比智駕日益收斂的格局,機器人還在春秋戰(zhàn)國階段。國家地方共建人形機器人創(chuàng)新中心總經(jīng)理許彬近日披露數(shù)據(jù),截至2024年,國內(nèi)外通用人形機器人整機商業(yè)公司約150家,國內(nèi)超過80家。
據(jù)《出行百人會/AutocarMax》不完全統(tǒng)計,從智能駕駛切入機器人賽道重新創(chuàng)業(yè)的,大概占國內(nèi)總體玩家的十分之一,主要來自華為、小米汽車、蔚來、阿里巴巴達摩院自動駕駛實驗室、地平線、大疆、文遠知行、廣汽集團等。
智駕轉(zhuǎn)戰(zhàn)機器人,技術(shù)有淵源,也有區(qū)別。
比如,自動駕駛采用車規(guī)級Orin芯片,人形機器人采用工規(guī)級Jetson Orin芯片,屬于降維關(guān)系,且芯片的功能安全要求不如自動駕駛。
汽車行業(yè)的激光雷達、攝像頭、IMU等,可以平移給機器人賽道,不同處在于嗅覺、觸覺等傳感器。
人形機器人的硬件尚未出現(xiàn)統(tǒng)一范式。類似早期的激光雷達賽道,曾出現(xiàn)過轉(zhuǎn)鏡、振鏡、機械旋轉(zhuǎn)、Flash、FMCW等多種技術(shù)路線,今天僅剩下轉(zhuǎn)鏡和振鏡兩派,代表分別是禾賽和速騰(參數(shù)丨圖片)聚創(chuàng)。
小腦方面,自動駕駛采用相對簡單的PID(Proportional Integral Derivative)等算法。機器人更多采用非線性控制算法,以及更高級的預(yù)測算法等。
汽車高速行駛,要求算法達到短平快的效果。機器人的控制算法更復(fù)雜,但好在節(jié)拍慢,事故后果不嚴重,有時間進行運算收斂。
舉個例子,近日南京展會上,宇樹科技H人形機器人突然站立不穩(wěn),出現(xiàn)“抽搐”,對此宇樹科技官方表示,“這種情況正常,修一下就可以了?!?/p>
但如果汽車在路上突然發(fā)癲,可能就會釀成重大安全事故,遠非“修一下就可以”。
大腦方面,自動駕駛包括感知、決策、規(guī)劃、控制;機器人則強調(diào)具身感知、具身想象和具身執(zhí)行。
機器人完成感知后,會為任務(wù)目標規(guī)劃出數(shù)百種甚至上千種可能性,然后在大腦的虛擬仿真中跑一遍,看哪一種可能性更容易成功,然后進行嘗試。
一名機器人供應(yīng)鏈人士說,機器人就有點像奇異博士,擅長從萬千可能性中找到唯一成功,重在邊緣端的推理和虛擬仿真。筆者認為,自動駕駛必須見招拆招,重在感知和博弈能力,在一條路上,沒有很多選擇,但是萬不能出錯。
此外,智能駕駛出身的這撥人具備量產(chǎn)經(jīng)驗,對進度和關(guān)鍵節(jié)點把控有一定經(jīng)驗。而機器人賽道的既有玩家,量產(chǎn)經(jīng)驗相對少一些。
以至于有聲音認為,“我們現(xiàn)在覺得,這些已有的機器人玩家大概率會死掉,原因是撲進來的大多是科學(xué)家,科學(xué)家會切入到一個自己不熟悉的領(lǐng)域,比如量產(chǎn)、銷售環(huán)節(jié)。”言外之意,科學(xué)家不懂量產(chǎn)和商業(yè)落地。
智能駕駛玩家的到來,可以為機器人賽道帶來更多支持,有可能打破機器人AI困境。
用大模型煉丹,汽車人敢想敢沖
不久前,一次溝通會上,銀河通用創(chuàng)始人王鶴向波士頓動力創(chuàng)始人Marc Raibert提問:
“通用人形機器人終極形態(tài)是什么樣的?您認為視覺-語言-動作多模態(tài)大模型,以及端到端模型是實現(xiàn)通用人形機器人的終極方法嗎?”
Marc Raibert不看好端到端,給出的回答是:
“我不認為端到端模型是推動人形機器人取得重要進展的方法。說實話,人們關(guān)注‘學(xué)習(xí)’太多了。我知道應(yīng)該對這些方法保持樂觀的態(tài)度,但是你看看現(xiàn)在產(chǎn)業(yè)中存在的機器人最佳解決方案,就會發(fā)現(xiàn),‘學(xué)習(xí)’在其中起到的作用微不足道。”
Marc Raibert認為,控制系統(tǒng)、控制理論等過去二三十年積累下的技術(shù),依然發(fā)揮著重要作用。
但在做慣自動駕駛的人看來,他的觀點值得商榷。
“大模型通常被業(yè)內(nèi)比作煉丹。現(xiàn)階段咱們煉了個丹,很好用。然后應(yīng)該有一幫人去研究它為什么好用,尋找背后支撐的理論,再去豐富控制學(xué)?,F(xiàn)在的問題在于,用現(xiàn)有的控制理論得不到這么好用的控制結(jié)果,所以煉丹是沒錯的?!鄙鲜銮白詣玉{駛高管人士稱。
人形機器人公司和大模型公司,早期界線分明。眼下國內(nèi)估值最高的兩家,宇樹科技的重心放在硬件層面的本體,對AI投入相對謹慎;另一家智元機器人,更多注重動作編排大模型。
Figure AI上一代產(chǎn)品Figure 01,基于OpenAI的GPT-4多模態(tài)大模型,能夠聽懂人的指令并進行對話,按照指令完成指定任務(wù)。新一代產(chǎn)品Figure 02,除了將裸露的線束盡可能集成,噴了啞光漆之外,再次集成了OpenAI 4o大模型。
人形機器人公司對大模型的應(yīng)用,處于跟隨狀態(tài),這也導(dǎo)致現(xiàn)有的人形機器能完成的任務(wù)相對單一,且大多相似。
大模型公司起初也有邊界感,谷歌Deepmind先后推出RT-1、RT-2等用于人形機器人的大模型,從VLM一直到VLA,一度未踏足人形機器人研發(fā)。
直到最近,才變了。
據(jù)外媒The Information報道,OpenAI重啟了四年前解散的內(nèi)部機器人軟件團隊,考慮開發(fā)一種人形機器人。
本月,谷歌DeepMind 宣布攜手機器人公司Apptronik,針對動態(tài)現(xiàn)實環(huán)境的復(fù)雜作業(yè)挑戰(zhàn),共同研發(fā)新一代人形機器人。
但人形機器人公司,對大模型的投入態(tài)度仍未轉(zhuǎn)向,直到自動駕駛出身的新玩家進場。
近日,原地平線副總裁、軟件平臺產(chǎn)品線總裁余軼南創(chuàng)辦的新公司浮出水面,名為維他動力(北京)科技有限公司,經(jīng)驗范圍包括智能機器人研發(fā)等。公司另外兩位聯(lián)合創(chuàng)始人,分別是前地平線軟件平臺總架構(gòu)師宋巍,和理想汽車前智能駕駛產(chǎn)品總監(jiān)趙哲倫。
“本體我們會向宇樹科技看齊,機器人模型、智能化是我們的核心突破點?!币晃痪S他動力內(nèi)部人士告訴我們。
此前,阿里巴巴達摩院自動駕駛實驗室負責(zé)人陳俊波創(chuàng)立的有鹿機器人,已將大模型應(yīng)用在清掃機器人上,可以實時根據(jù)地面垃圾量,靈活調(diào)整清掃策略。
“大模型是終局。有了大模型之后,比如對機器人說,我渴了幫我拿杯水,你不需要再編程說,掃描SLAM,找到冰箱,規(guī)劃路徑走過去,識別冰箱門,打開。人去冰箱里拿水就是一種下意識。想培養(yǎng)機器人的下意識,讓機器人的控制變得更加高級,除了大模型,沒別的方法?!鄙鲜銮白詣玉{駛高管人士說。
結(jié)語
倫敦的人工智能投資公司 Air Street Capital 對2025年做出十大預(yù)測,指出由于難以實現(xiàn)產(chǎn)品和市場契合,對人形機器人的投資水平將下降。
高盛發(fā)布報告顯示,2035年全球人形機器人出貨量將達140萬臺,市場規(guī)模約380億美元。并預(yù)測,人形機器人最早應(yīng)用到工廠的時間為2024至2027年,應(yīng)用到消費市場的時間為2028至2031年。
可見大規(guī)模商業(yè)化時間線還是比較遠,在這之前機器人的AI需要大手筆投入,需要解決商業(yè)落地難問題。難意味著窗口還在,自動駕駛新玩家們能否帶來新的想象,有足夠時間檢驗。
—THE END—
出行百人會 | AutocarMax
追蹤汽?出行產(chǎn)業(yè)鏈進化,關(guān)注新產(chǎn)品、新科技、商業(yè)邏輯與商業(yè)人物,影響圈層中有影響力的人。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.