中國人形機器人的產業發展史可能會有幾個繞不過去的時刻。比如2025年蛇年春晚通過一場表演讓大眾對人形機器人建立了感知。
又比如4月19日的北京亦莊馬拉松,一群鐵疙瘩歪歪扭扭地沖向終點,它們沒有“意念”,主要靠電機驅動和工程師遙操,有的因電量耗盡步伐拖沓,有的剛登場就退賽,有的半路“掉”頭??20支隊伍里最終有6支順利完賽。
當人形機器人走出PPT和Demo(演示)視頻,普通人看的是熱鬧,產業鏈企業關心技術和商機,而嗅覺敏銳的資本則在揣摩著風向??種種期待和現實落差,令人不禁疑惑:先進到可以玩雜技和跑步都跑不利索,哪個才是中國人形機器人的真實現狀。
為了深入了解這一新興產業的發展動態,4月中旬,經濟觀察報走訪了機器人重鎮深圳具有代表性的9家具身智能頭部企業,它們分別是作為深圳機器人“八大金剛”的帕西尼、普渡科技、數字華夏、智平方、跨維智能、逐際動力,以及越疆科技、大象機器人、云鯨智能。
我們發現,除了對人形機器人行業的前程遠大頗具信心外,目前各家企業在技術路線、應用場景等方面押注不同的邏輯,甚至可以說沒什么共識——這本質上是人形機器人從實驗室走向產業化的必經階段。
以下是我們根據實地調研梳理出的人形機器人行業的9大分岔口:
1.人形機器人需要兩條腿嗎?
2.人形機器人要不要臉?
3.人形機器人如何感知外界?
4.“大腦”“小腦”和“本體”,哪個更重要?
5.怎么訓練人形機器人?
6.人形機器人有什么用?
7.人形機器人賣給誰?
8.何時進入量產階段?
9.亦莊馬拉松應該被群嘲還是鼓掌?
1.人形機器人需要兩條腿嗎?
沒有腿的人形機器人(從左到右依次是帕西尼Tora、智平方AlphaBot 2、跨維DexForce W1、大象機器人水星Mercury X1)
把機器人做成雙足、四足還是輪式,是人型機器人賽道上的第一個分叉口。
在我們調研的9家企業中,數字華夏、越疆科技是“雙足派”,帕西尼、智平方、跨維智能、大象機器人是“輪式派”,普渡科技兩種形態產品都有。
當下機器人企業的人才、資金等資源有限,只能集中精力做好其中一種形態,這就導致做輪式機器人的企業更多強調精準抓取、泛化能力等,而做雙足機器人的企業則側重于精密機械關節的協同,走得更快更穩、能跳能翻,還抗擊打。
從目前頭部企業發布的產品案例看:輪式機器人的常見展示場景是參與工廠作業,而人形機器人似乎更擅長跳舞、爬山、翻跟頭等技巧動作。
帕西尼的人形機器人采用輪式底盤的邏輯,代表很多同類企業的考量:一方面,目前雙足技術還沒有完全成熟。做雙足比較好的企業,無論是宇樹科技還是波士頓動力,即使設計再精細,偶爾還是會“撲街”;另一方面,輪式底盤的機器人產品計劃優先在工廠、家庭等平整地面場景應用,而非野外等復雜地形。因此,帕西尼更注重鍛煉機器人上半身的能力,特別是手部的功能設計和落地應用。
相比之下,雙足機器人的技術實現難度更大。機器人主要靠關節、電機驅動,而要實現雙足行走需要模擬人類28個以上關節的協同運動,背后涉及動態平衡控制、重心轉移、地面反作用力計算等。在人類看來很容易實現的很多任務,對機器人來說卻很難,例如穩定地走路、上下樓梯、不同角度被推倒后起身站立等。
從能耗的角度,輪式機器人續航普遍在5小時以上,雙足機器人一般在2小時左右。目前,雙足機器人的大部分能量用于維持平衡,而輪式機器人的底盤通過物理結構就能實現靜態穩定,控制復雜度低,且能放置更大容量的電機。
因此在大多數工業化場景中,輪式機器人有更穩定、成本更低、效率更優的特點,例如搬抬運送貨物、上下料等,考驗的是機器人上肢的靈巧程度。
不過,雙足也有不可替代性。一家做雙足機器人的企業認為,雙足人形機器人可以側身穿過更狹窄的空間。在需要上下臺階或穿越障礙物較多、非平面地形時,輪式機器人會受限制。此外,輪式機器人只能在單個平整車間工作,而理論上雙足可以像人一樣在工廠里自由移動。
雙足人形機器人(從左到右依次是數字華夏“夏瀾”、普渡D9、越疆Dobot Atom)
數字華夏一位人士稱,堅持做雙足的原因是機器人被做成輪式后,很大程度上會失去深度交流的功能,只是為了干活,但眼下干活還不是機器人的長項。
他認為,機器人摔倒不是硬件問題,而是算法出現了故障。就像早期的新能源汽車,等到出貨量足夠大,足夠多的問題被發現、被解決,才能更成熟和智能。
為什么選擇做人形機器人?5月10日,宇樹科技創始人王興興在一次公開演講中表示,人類更喜歡長得像人的機器人,更能夠提供情緒價值。此外,人形結構最簡單,適配人類通用數據,還可以處理需要人做的不少事,“一旦人形機器人技術成熟,甚至可以用幾個關鍵零部件拼在一起,下載一個程序就可以讓人形機器人干活了。”
2.人形機器人到底要不要臉?
數字華夏研發的有臉人形機器人“夏瀾”(陳月芹/攝)
這是一個與“要不要腿”類似的問題。目前市面上絕大多數人形機器人產品是“無臉派”。
宇樹科技頭部采用中空或黑色玻璃面罩,避免使用復雜表情模塊,而波士頓動力 Atlas和特斯拉 OptimusGen2都采用黑色面罩+LED燈效來顯示機器人的狀態。“無臉派”的邏輯是降低額外成本,側重工業場景下機器人的協作能力,同時規避倫理爭議,如身份偽裝風險和恐怖谷效應。
而數字華夏把具有仿生人臉、能提供交互需求作為機器人的主要特色。它想做有溫度的機器人,未來在機器人融入人類社會時,讓人感覺更舒適。
該公司旗下的機器人“夏瀾”長著一張“人臉”。得益于仿生硅膠皮膚和表情驅動系統的精密配合,“夏瀾”能根據人的說話指令,識別語義并匹配22種表情,例如聽到“地震了”會皺眉驚恐、聽到“今天天氣很好”會微笑。
數字華夏公關總監吳為介紹,這張“臉”皮成本約3萬元,如果產量能上千,單張臉皮的成本可以降到200元左右。
3.人形機器人如何感知外界?
機器人如何自主感知外界環境,是行業一大難題。
有的企業以單目、紅外感應、激光雷達作為環境建模的核心。不過,在這種技術路線下,機器人一旦遇到強光等復雜環境,或攝像頭被遮擋,感知精度會下降。
跨維智能的雙目視覺技術,通過兩個攝像頭同步采集圖像,模擬人眼視差原理,生成三維空間信息,讓機器人攝像頭被部分遮擋時不至于陷入盲區。
視覺感知更適用物流等非精細操作的工業場景,不過,一旦要求機器人感知微小接觸力的變化,例如檢測壓力、溫度和紋理,或讓機械臂根據力的反饋調整抓取力度,視覺感知遠遠不夠。這也是帕西尼想解決的難題,其核心產品是基于霍爾原理和力控算法設計的傳感器和靈巧手,這一優勢也使得帕西尼做整機人形機器人時更關注上半身、手和手臂的協同能力。在同類企業大多只能做到三維力感知時,帕西尼的傳感器能感知六維力,獲取接近15種不同觸覺維度信息。
帶多維觸覺傳感器的機械手(陳月芹/攝)
機器人是否需要觸覺?有人認為,視覺與語言已經能覆蓋多數交互場景,如自動駕駛。但觸覺感知的支持者強調觸覺是物理交互的必需,醫療手術、精密裝配都需要機器人更“敏感”。
是否需要觸覺,取決于不同廠商機器人的落地消費場景。非觸覺機器人僅需800萬像素相機即可完成毫米級追蹤,硬件成本較觸覺路線機器人低6成以上。帕西尼的一對具備六維感知力的機械手售價則在20萬元左右,物流、大部分制造業、家庭服務等場景還無法為此買單,目前主流客戶來自下游機器人廠商等。
4.“大腦”“小腦”和“本體”,哪個更重要?
在商業化和規模化前夕,產業鏈各環節的代表企業都希望掌控生態話語權,而不是甘于做二級供應商。多數投資人也希望自己買的是未來產業鏈鏈主的號碼牌,培養出掌握減速器、伺服系統、傳感器等關鍵技術的企業,或挖掘出具備“核心零部件→整機制造→場景落地”垂直整合能力的“下一個特斯拉”。
我們在調研中發現,所有人形機器人企業都必須回答一個問題:人形機器人的“大腦”“小腦”和“本體”,哪個更重要?這里的“大腦”指人形機器人負責感知和決策的智能中樞,“小腦”負責運動控制,“本體”則是硬件結構。
與不少科研機構和頭部公司扎堆研發“大腦”不同,一家專注于運動控制的深圳初創企業選擇做連接“大腦”和“本體”的橋。他們的邏輯是,“大腦”算法能力的投入巨大,中小型企業很難與大型企業比拼,而等到“大腦”開發得越來越成熟,大模型的想法怎么傳輸給機器人、機器人怎么應對物理環境的變化,這些都是純大模型公司沒法做的。
在“本體”通用性不足的情況下,機器人沒法“交付即使用”,這家公司要把大腦和本體的底層運動控制“解耦”的接口或工具鏈做好,做一個適合更多客戶的機器人本體。
智平方向客戶交付的產品形態是機器人,但其中值錢的是“大腦”,嚴格來說是軟硬一體的解決方案。現在的機器人切換硬件形態或換個關節,對大腦的適配性改動非常大,“大腦”很難獨立于硬件存在。
亦莊馬拉松期間,宇樹科技專門發聲明稱公司沒有直接參賽,而是客戶使用其機器人G1本體參賽,試圖廓清“機器人上場即摔倒”的責任。這反映出具身智能行業的現狀:硬件供應商只賣本體,客戶負責算法優化,機器人的性能高度依賴算法調優能力,再強的“大腦”、再硬核的本體,技術鏈條間仍存在斷層。
5.怎么訓練人形機器人?
2025年,機器人行業新的爭奪戰悄然打響,各大廠商絞盡腦汁,奪取最有價值的AI“燃料”——數據。
聰明的機器人是一條條數據“喂”出來的,僅一個倒水的動作,大模型就需要“吃”下上萬條數據才能學會。根據來源劃分,這些數據可能來自于真實數據、仿真數據和互聯網數據。
真實數據訓練即通過實體機器人手把手采集物理交互數據,更真實,采集慢,成本也高;仿真數據是利用英偉達等工具生成虛擬環境數據,成本次之;而互聯網數據則是整合互聯網開放資源,成本最低。
為了投喂真實數據,數字華夏在南京設有數據采集中心,做各類模擬的真實場景,如銀行、線下門店等導購場景,幾十臺甚至上百臺機器在人的遙操下一遍遍地練習,記錄標注數據集,再把數據輸入模型進行訓練,回傳給機器人。
數字華夏方面認為,機器人終有一天會走穩,具身智能的能力一定會出現,屆時企業比拼的是覆蓋客戶的多少,有多少有效數據——有多少數據意味著機器人有多少能力、能進入多少場景。
以銀河通用、宇樹科技為代表的仿真數據優先派,主張自己學得更快、成本更低,甚至能在零真實數據情況下啟動。遇到較難模擬的極端場景,如火災救援,仿真系統也可以批量生成。不過,仿真數據還須解決模擬器效果不夠理想、數據實用性不高的難題,Sim2Real(模擬到現實)之間的差距是核心挑戰。
跨維智能開發了一款Sim2Real引擎,在虛擬世界中訓練、獲取數據,再把訓練好的能力復制到物理世界的機器人本體上。
智平方是三類數據融合派,創始人郭彥東稱智平方所用的訓練數據量和很多搜索引擎相近,龐大的數據量在整個機器人賽道里位列第一梯隊。
數據和強化學習算法是機器人區別于大型遙控玩具的核心。“吃”夠數據后,機器人還需要泛化學習能力,把已有的經驗遷移到未知場景中,機器人才能算得上“聰明”“有用”,能舉一反三處理復雜、動態的人類世界出現的任務。
為了解決數據和泛化能力不足的問題,帕西尼在籌建數據采集中心,搭建多個核心場景樣本間,例如打掃衛生、餐廳場景里的切菜等,將任務拆細后反復訓練,以達到最終的理想狀態:機器人在開放場景下,“看到什么就知道怎么操作”。
6.人形機器人到底可以干什么?
每家機器人廠商的展示PPT里,一定有幾頁關于機器人應用場景的內容,主流方向包含工業、物流、零售商業、按摩服務、家庭、農業、科研等,然而沒有人會明確告訴你這些愿景哪天能實現。這也就不難理解,投資人朱嘯虎為什么潑冷水:機器人沒什么用處、沒有人愿意花十幾萬買機器人去干活。
機器人怎么應用?當前行業主流思路是按照工業→商業服務→家庭的路徑逐步滲透,優先級由場景標準化程度和任務復雜度決定。
其中,環境更標準化、任務單一的工業制造場景最為擁擠,尤其是新能源汽車制造、3C電子裝配、倉儲物流,是特斯拉、優必選等機器人廠商都想攻克的高地。
越疆科技也選擇讓人形機器人走協作機器人走過的路,先在特定工廠車間反復訓練,再在實地工廠運行。其協作機械臂掌握的力控技術可以做曲面打磨、涂膠等精細的工作,應用在汽車、3C等行業。
數字華夏做過評估:工業生產對準確度、精度的要求太高,如果打10個螺絲錯1個就沒人愿意用;家庭養老難度最大,空間小、環境復雜,內部判斷2028年以前,機器人很難走進家庭。因此他們認為機器人短期的用處是通過“流量效應”吸引顧客,給消費者帶來更好的購物體驗。
還有一批機器人廠商把科研教育作為突破口,比如優必選、逐際動力、大象機器人,不僅賣本體,還搭建開放式開發平臺,支持二次開發。高校、科研機構是目前業內愿意為機器人買單的主流客戶,一方面高校有教育系統專項資金支持,另一方面,相較于工業場景對精度、穩定性(千小時無故障運行),以及家庭場景交互安全性的要求,科研教育場景的容錯性更高。
帕西尼的機器人手上裝有眾多傳感器,能填補人形機器人觸覺模態缺失的空白,這一差異化使得帕西尼側重進入對手部精細動作要求更高的場景,如照顧老人、手術或危險作業等。近期正和帕西尼洽談合作意向的是一家大型垃圾分揀廠,想讓機器人代替人類在惡劣條件下長時間作業,還能讓觸覺技術發揮作用,區分不同材料的垃圾。
7.人形機器人賣給誰?
朱嘯虎認為,人形機器人企業至今仍沒有找到較清晰的商業化路徑。即便是火出圈、不愁訂單的宇樹科技,在他眼里仍“沒有為客戶創造持續的價值”。
一個瀕臨倒閉的難關改變了大象機器人的商業路線:2019年以前,大象機器人的主營業務是研發工業機器人,到了2020年,疫情導致很多合作工廠不開工、不付尾款,大象機器人一度裁員到只剩20人。管理層決心從市場需求和應用層面出發,做“個人可以擁有的機器人”,隨后推出了第一款輕量級協作臂myCobot,收獲了扭虧為盈的第一桶金。從那之后,大象機器人確定了做小型化、高性價比機器人的路線,其主打產品輕量型雙臂機器人能連續工作3萬小時、售價約8萬元/臺,目標是做輕工業柔性產線的人工替代。
一臺機器人8萬元,與一個人工的全年成本(工資、社保、食宿等)相比仍有優勢。這也是大象機器人幫客戶算的賬。
機器人跳舞火了之后,越疆科技今年來自商業領域的訂單增長最快,例如艾灸、按摩等場景。一家大型連鎖按摩品牌苦于人員流失、用工成本高,主動找到越疆科技,希望用按摩機器人替代技師。
機器人產品的迅速落地,也許不是投資人喜歡的,但確實讓一些機器人公司拿到訂單、活下來了。而大多數愿景廣闊、高談技術理想的機器人公司至今仍然靠投資人燒錢。
8.何時進入量產階段?
在機器人走進工廠和千家萬戶前,需要先過量產關。除了大宗訂單來源不穩定,機器人量產的產品性能也參差不齊。少數購買人形機器人的客戶常遇到買家秀和賣家秀不符的問題,到手的機器永遠沒有像展示樣機那樣動作“絲滑”,淪為人工“智障”。而廠商手上摔得坑坑洼洼的樣機,性能才是最好的。
據了解,目前國內還沒有真正實現量產的人形機器人公司,量產的難度在于解決軟硬件一致性。例如,工程師在仿真平臺上做強化學習,再把算法灌給兩臺裝配零部件一模一樣的機器人,依然可能存在一臺走得很穩、而另一臺摔倒的情況。
據了解,這種差異主要在于硬件沒有達到車規級的精密標準,和算法軟件的匹配也不夠好,很多樣機的機器人都是花了長時間調試出來的,導致機器人難以量產、良品率低。
“現在90%的人形機器人公司交不出批量的貨。”數字華夏的吳為解釋,因為每臺機器都要調試數月,每臺樣機的出爐都要算上硬件、調試時間和人員成本。數字華夏判斷,一個機器人公司進入量產的標志是一年至少產出1000臺。
9.亦莊馬拉松應該被群嘲還是鼓掌?
朱嘯虎斷言人形機器人行業沒有未來。此后在亦莊馬拉松,機器人出了不少洋相,又強化了人形機器人科技泡沫化的形象。
應該肯定的是,部分參賽機器人如天工Ultra在2小時40分內完成21公里路跑,并且在碎石路、斜坡等復雜地形中保持穩定,已經說明人形機器人的長足進步。
事實上,這場賽事的價值,不在于瞬間的掌聲或噓聲,而在于為機器人產業的“馬拉松”提供了真實的起跑線。
不得不警惕的是,早先輿論渲染機器人“未來已來”致使公眾的期待過高,而忽視了人形機器人目前相當于“博士生的大腦、三歲小孩的身體”的現實。因此,當這個“小孩”還沒有站穩,就開始翻跟頭炫技,要求他去干重活,無疑是揠苗助長。而現在,因為機器人在一場馬拉松上摔倒,就否定整個行業的前景,則有些因噎廢食了。
值得注意的是,在這次調研中,多數企業人士對朱嘯虎提出的“機器人應實用”“花拳繡腿沒有用”等觀點表示認同。他們都提到,行業應該警惕過度泡沫,但也希望大家對人形機器人的不完美多一點包容。
(作者 陳月芹)
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。
陳月芹
可聯系:chenyueqin@eeo.com.cn
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.