機器人AI之困，智駕人請戰(zhàn)

2025-01-02 19:20:55　來源: autocarmax

上海舉報

分享至

撰文 | 張祥威編輯｜馬青竹

圣誕節(jié)，大洋彼岸，波士頓動力給人形機器人Altas穿上圣誕老人服裝，原地翻起跟頭。

咱們這邊，宇樹科技的機器狗B2-W，上演“天賦覺醒”，出盡風(fēng)頭。馱起成年人，能上山，能下水，能翻筋斗。網(wǎng)友大呼，“騎狗上班，就在今天”。

幾天后，智元機器人發(fā)布開源項目AgiBot World，基于百萬真機數(shù)據(jù)集，相比 Google 開源的 Open X-Embodiment 數(shù)據(jù)集，長程數(shù)據(jù)規(guī)模高出10倍，場景范圍覆蓋面擴大100倍。

智元機器人由華為天才少年“稚暉君”創(chuàng)立，在過去一年時間完成七輪融資，估值已達到70億元。

近2年來，機器人賽道滾燙熱辣，也吸引了一撥汽車人。

布局早的，特斯拉的Optimus已進化到第二代，2024年11月小鵬發(fā)布了Iron。據(jù)國家知識產(chǎn)權(quán)局信息，蔚來剛獲得一項“換電機器人及充換電站”的專利。12月底，廣汽展示了最新產(chǎn)品，第三代人形機器人GoMate。

李想也坐不住了，表示理想汽車百分百會做人形機器人，但并非現(xiàn)在?！叭绻覀冞BL4級自動駕駛的汽車都解決不了，怎么去解決更復(fù)雜的？”

而這個世界不可能等L4智駕實現(xiàn)之后，才去發(fā)展人型機器人。

比如上文提到的，隸屬三星的先行者波士頓動力成立于1992年，當紅的宇樹科技成立于2016年。2017年，人型機器人領(lǐng)域已經(jīng)集中吸引了一波巨頭布局，比如小米、華為等，2019年，蘋果也加入。

而汽車勢力入局人形機器人，大致分兩種，一種由車企孵化團隊進行研發(fā)，比如小鵬和廣汽等。另一種由汽車人離開原公司，組隊創(chuàng)業(yè)。

做人形機器人這撥汽車人，許多與智能駕駛關(guān)系密切。他們熟悉規(guī)則算法、深度學(xué)習(xí)、大模型、世界模型。大疆車載的沈劭劼甚至說，大疆車載底色是機器人公司。

人形機器人結(jié)構(gòu)復(fù)雜，包括關(guān)節(jié)、靈巧手等硬件，負責(zé)運動控制的小腦，以及通過大語言模型、模仿學(xué)習(xí)提供認知和規(guī)劃能力的大腦。

宇樹科技創(chuàng)始人王興興認為，相比硬件，機器人行業(yè)當下面臨的AI挑戰(zhàn)更大，且AI技術(shù)路線并不統(tǒng)一，已出現(xiàn)模仿學(xué)習(xí)、深度學(xué)習(xí)、世界模型、空間模型等多種路線。數(shù)據(jù)也稀缺。

傅利葉副總裁周斌認為，可用的物理數(shù)據(jù)集遠遠不夠，具身智能處在非常初期的階段，人工遙操是目前主流的機器人數(shù)據(jù)采集方法，但這種方法費時費力。

在現(xiàn)實層面，可以簡單說很多硬核問題尚未解決，具備真正的“可用性”和商業(yè)性的具身智能非常少。

當汽車人闖進來，或許能帶來破局之法？

智駕人切入機器人賽道

2024年世界機器人大會，774家企業(yè)參展，其中機器人公司169家。九年前，2015年世界機器人大會，參展企業(yè)規(guī)模一共100多家。

“機器人賽道允許大家想象，更多面向C端消費群體，現(xiàn)階段各憑本事?！币晃贿M入機器人賽道的前自動駕駛高管人士告訴《出行百人會/AutocarMax》。

為何離開智駕領(lǐng)域？

他表示，自動駕駛行業(yè)本身不賺錢，有了“地大華魔”四家后，其它家機會就更少了，就算拿到訂單也不賺錢。再加上，部分甲方車企相對保守，影響了汽車智能化生態(tài)。

相比智駕日益收斂的格局，機器人還在春秋戰(zhàn)國階段。國家地方共建人形機器人創(chuàng)新中心總經(jīng)理許彬近日披露數(shù)據(jù)，截至2024年，國內(nèi)外通用人形機器人整機商業(yè)公司約150家，國內(nèi)超過80家。

據(jù)《出行百人會/AutocarMax》不完全統(tǒng)計，從智能駕駛切入機器人賽道重新創(chuàng)業(yè)的，大概占國內(nèi)總體玩家的十分之一，主要來自華為、小米汽車、蔚來、阿里巴巴達摩院自動駕駛實驗室、地平線、大疆、文遠知行、廣汽集團等。

智駕轉(zhuǎn)戰(zhàn)機器人，技術(shù)有淵源，也有區(qū)別。

比如，自動駕駛采用車規(guī)級Orin芯片，人形機器人采用工規(guī)級Jetson Orin芯片，屬于降維關(guān)系，且芯片的功能安全要求不如自動駕駛。

汽車行業(yè)的激光雷達、攝像頭、IMU等，可以平移給機器人賽道，不同處在于嗅覺、觸覺等傳感器。

人形機器人的硬件尚未出現(xiàn)統(tǒng)一范式。類似早期的激光雷達賽道，曾出現(xiàn)過轉(zhuǎn)鏡、振鏡、機械旋轉(zhuǎn)、Flash、FMCW等多種技術(shù)路線，今天僅剩下轉(zhuǎn)鏡和振鏡兩派，代表分別是禾賽和速騰（參數(shù)丨圖片）聚創(chuàng)。

小腦方面，自動駕駛采用相對簡單的PID（Proportional Integral Derivative）等算法。機器人更多采用非線性控制算法，以及更高級的預(yù)測算法等。

汽車高速行駛，要求算法達到短平快的效果。機器人的控制算法更復(fù)雜，但好在節(jié)拍慢，事故后果不嚴重，有時間進行運算收斂。

舉個例子，近日南京展會上，宇樹科技H人形機器人突然站立不穩(wěn)，出現(xiàn)“抽搐”，對此宇樹科技官方表示，“這種情況正常，修一下就可以了?！?/p>

但如果汽車在路上突然發(fā)癲，可能就會釀成重大安全事故，遠非“修一下就可以”。

大腦方面，自動駕駛包括感知、決策、規(guī)劃、控制；機器人則強調(diào)具身感知、具身想象和具身執(zhí)行。

機器人完成感知后，會為任務(wù)目標規(guī)劃出數(shù)百種甚至上千種可能性，然后在大腦的虛擬仿真中跑一遍，看哪一種可能性更容易成功，然后進行嘗試。

一名機器人供應(yīng)鏈人士說，機器人就有點像奇異博士，擅長從萬千可能性中找到唯一成功，重在邊緣端的推理和虛擬仿真。筆者認為，自動駕駛必須見招拆招，重在感知和博弈能力，在一條路上，沒有很多選擇，但是萬不能出錯。

此外，智能駕駛出身的這撥人具備量產(chǎn)經(jīng)驗，對進度和關(guān)鍵節(jié)點把控有一定經(jīng)驗。而機器人賽道的既有玩家，量產(chǎn)經(jīng)驗相對少一些。

以至于有聲音認為，“我們現(xiàn)在覺得，這些已有的機器人玩家大概率會死掉，原因是撲進來的大多是科學(xué)家，科學(xué)家會切入到一個自己不熟悉的領(lǐng)域，比如量產(chǎn)、銷售環(huán)節(jié)。”言外之意，科學(xué)家不懂量產(chǎn)和商業(yè)落地。

智能駕駛玩家的到來，可以為機器人賽道帶來更多支持，有可能打破機器人AI困境。

用大模型煉丹，汽車人敢想敢沖

不久前，一次溝通會上，銀河通用創(chuàng)始人王鶴向波士頓動力創(chuàng)始人Marc Raibert提問：

“通用人形機器人終極形態(tài)是什么樣的？您認為視覺-語言-動作多模態(tài)大模型，以及端到端模型是實現(xiàn)通用人形機器人的終極方法嗎？”

Marc Raibert不看好端到端，給出的回答是：

“我不認為端到端模型是推動人形機器人取得重要進展的方法。說實話，人們關(guān)注‘學(xué)習(xí)’太多了。我知道應(yīng)該對這些方法保持樂觀的態(tài)度，但是你看看現(xiàn)在產(chǎn)業(yè)中存在的機器人最佳解決方案，就會發(fā)現(xiàn)，‘學(xué)習(xí)’在其中起到的作用微不足道。”

Marc Raibert認為，控制系統(tǒng)、控制理論等過去二三十年積累下的技術(shù)，依然發(fā)揮著重要作用。

但在做慣自動駕駛的人看來，他的觀點值得商榷。

“大模型通常被業(yè)內(nèi)比作煉丹。現(xiàn)階段咱們煉了個丹，很好用。然后應(yīng)該有一幫人去研究它為什么好用，尋找背后支撐的理論，再去豐富控制學(xué)?，F(xiàn)在的問題在于，用現(xiàn)有的控制理論得不到這么好用的控制結(jié)果，所以煉丹是沒錯的?！鄙鲜銮白詣玉{駛高管人士稱。

人形機器人公司和大模型公司，早期界線分明。眼下國內(nèi)估值最高的兩家，宇樹科技的重心放在硬件層面的本體，對AI投入相對謹慎；另一家智元機器人，更多注重動作編排大模型。

Figure AI上一代產(chǎn)品Figure 01，基于OpenAI的GPT-4多模態(tài)大模型，能夠聽懂人的指令并進行對話，按照指令完成指定任務(wù)。新一代產(chǎn)品Figure 02，除了將裸露的線束盡可能集成，噴了啞光漆之外，再次集成了OpenAI 4o大模型。

人形機器人公司對大模型的應(yīng)用，處于跟隨狀態(tài)，這也導(dǎo)致現(xiàn)有的人形機器能完成的任務(wù)相對單一，且大多相似。

大模型公司起初也有邊界感，谷歌Deepmind先后推出RT-1、RT-2等用于人形機器人的大模型，從VLM一直到VLA，一度未踏足人形機器人研發(fā)。

直到最近，才變了。

據(jù)外媒The Information報道，OpenAI重啟了四年前解散的內(nèi)部機器人軟件團隊，考慮開發(fā)一種人形機器人。

本月，谷歌DeepMind 宣布攜手機器人公司Apptronik，針對動態(tài)現(xiàn)實環(huán)境的復(fù)雜作業(yè)挑戰(zhàn)，共同研發(fā)新一代人形機器人。

但人形機器人公司，對大模型的投入態(tài)度仍未轉(zhuǎn)向，直到自動駕駛出身的新玩家進場。

近日，原地平線副總裁、軟件平臺產(chǎn)品線總裁余軼南創(chuàng)辦的新公司浮出水面，名為維他動力（北京）科技有限公司，經(jīng)驗范圍包括智能機器人研發(fā)等。公司另外兩位聯(lián)合創(chuàng)始人，分別是前地平線軟件平臺總架構(gòu)師宋巍，和理想汽車前智能駕駛產(chǎn)品總監(jiān)趙哲倫。

“本體我們會向宇樹科技看齊，機器人模型、智能化是我們的核心突破點?！币晃痪S他動力內(nèi)部人士告訴我們。

此前，阿里巴巴達摩院自動駕駛實驗室負責(zé)人陳俊波創(chuàng)立的有鹿機器人，已將大模型應(yīng)用在清掃機器人上，可以實時根據(jù)地面垃圾量，靈活調(diào)整清掃策略。

“大模型是終局。有了大模型之后，比如對機器人說，我渴了幫我拿杯水，你不需要再編程說，掃描SLAM，找到冰箱，規(guī)劃路徑走過去，識別冰箱門，打開。人去冰箱里拿水就是一種下意識。想培養(yǎng)機器人的下意識，讓機器人的控制變得更加高級，除了大模型，沒別的方法?！鄙鲜銮白詣玉{駛高管人士說。

結(jié)語

倫敦的人工智能投資公司 Air Street Capital 對2025年做出十大預(yù)測，指出由于難以實現(xiàn)產(chǎn)品和市場契合，對人形機器人的投資水平將下降。

高盛發(fā)布報告顯示，2035年全球人形機器人出貨量將達140萬臺，市場規(guī)模約380億美元。并預(yù)測，人形機器人最早應(yīng)用到工廠的時間為2024至2027年，應(yīng)用到消費市場的時間為2028至2031年。

可見大規(guī)模商業(yè)化時間線還是比較遠，在這之前機器人的AI需要大手筆投入，需要解決商業(yè)落地難問題。難意味著窗口還在，自動駕駛新玩家們能否帶來新的想象，有足夠時間檢驗。

—THE END—

出行百人會 | AutocarMax

追蹤汽?出行產(chǎn)業(yè)鏈進化，關(guān)注新產(chǎn)品、新科技、商業(yè)邏輯與商業(yè)人物，影響圈層中有影響力的人。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.