摩根士丹利分析師最新報告稱,2024年,中國在全球機器人市場所占份額為約40%。分析師預計,未來四年,中國機器人市場預計以平均每年23%的增幅快速增長,市場規模將從2024年的470億美元增長至2028年的1080億美元,足足翻一倍有余。
但訓練一臺能靈活抓取豆腐、理解復雜指令的人形以及具身智能機器人,仍面臨“數據荒”——要么“食材”(數據模態)種類不全,要么“烹飪過程”(采集管理)過于繁瑣復雜,這使得當前主流機器人模型依賴視覺與關節數據,在精密裝配、柔軟物體操作等需要力反饋的場景中頻頻“翻車”。在IEEE 2024的一項行業調研中,提到高達72%的研發團隊認為多模態數據缺失是當前落地的最大瓶頸。
機器人智能化訓練的核心瓶頸之一在于高質量、多維度數據的獲取與管理。機器人大講堂注意到,6月,國內首家實現專項場景超長序列多任務連貫操作機器人公司——零次方行業創新再突破,正式發布“全模態”具身數據全鏈路解決方案。
方案涵蓋軟硬件兩大方向,如同打造了一條從“食材源頭”到“美味佳肴”的完整自動化廚房,旨在解決具身智能模型訓練普遍存在的“數據模態缺失、數據采集流程繁瑣、任務數據管理繁雜、模型訓練推理部署門檻高”等難題。方案完美覆蓋了“全模態”數據采集設備、數據采集與管理平臺、模型訓練、模型推理全流程需求,打造了一個從數據采集到模型訓練、再到部署應用的完整閉環工具鏈,同時其起步價定為9.9萬元,將顯著降低數據高質量高效率獲取門檻,從而推動機器人智能化的發展。
↑ 解決方案圖示
▍瞄準未來需求,打造高維數據基座
當前,具身智能模型正處于快速發展與探索階段,技術路線正朝著融合更豐富數據類型的“多模態”方向演進。
當下主流方案主要包括以下幾個方面:
?視覺-關節融合方案(如ACT、Diffusion Policy、DP3等):通過聯合嵌入視覺信息與機器人本體感知,利用本體數據補償視覺觀測歧義性,提升動作泛化能力,但因缺乏力學反饋,在物理交互密集型任務中適應性不足。
?語義-視覺-關節融合方案(如Pi0、GROOT等):引入語義信息(如語言指令/場景描述)增強環境與長序列任務的理解,結合視覺與關節狀態實現多模態決策,提升復雜任務泛化性。
?視覺-關節-力聯合建模(如RDP等):引入力/觸覺反饋構建物理表征,提升泛精密操作的魯棒性;
對比這些多模態融合方案可以發現,更為齊全的模態架構正成為新趨勢,多個模型都在嘗試通過跨模態對齊實現環境-物理-語義的協同推理。
在此背景下,機器人大講堂認為,零次方的全模態數據架構很明顯具備雙重核心優勢。
1.維度兼容性:其采集的高維度“全模態”數據可輕松降維,生成任意子模態數據集(例如剝離力觸覺數據得到純視覺-關節數據),無縫兼容現有所有主流算法框架的訓練需求。
2.價值持續性:方案預設了傳感器冗余通道,并通過工具標注對齊多模態數據流,確保當前采集的數據能夠持續服務于未來3-5年可能涌現的新一代具身智能模型,成為支撐長期算法進化的“高維數據基座”。
這種前瞻性設計能兼容當下技術生態、支撐長期算法進化的“高維數據基座”。此外,零次方的“全模態”數采人形機器人ZERITH-H1,完美兼顧零次方的全模態數據架構設計,實現全模態數據采集與落地,是更加典型面向未來3-5年具身數據需求設計的方案。
▍核心硬件:“全模態”數據采集機器人ZERITH-H1
作為解決方案的硬件核心,零次方推出了專為數據采集設計的人形機器人ZERITH-H1。它完美體現了“全模態”架構的理念,成為“全模態”理念的物理化身。
首先,ZERITH-H1有著“擬人”身體架構,“超人”活動范圍,其上肢結構、自由度設計全部參考人類的身體,并在此基礎上大幅增加關節的活動范圍,使得其具備超越成年男性的靈活操作空間。
↑ ZERITH-H1 基礎參數介紹
其次,為應對具身智能模型訓練普遍存在的“數據模態缺失”問題,零次方機器人在Zerith-H1設計階段即整合了各種模態的傳感器,可實現對二維視覺信息、三維空間信息、關節信息、力觸覺信息、聲音信息的“完整”模態信息采集,實現了感知能力升維。
↑ 集成觸覺感知,抓取豆腐等易碎物
值得注意的是,針對于力觸覺感知部分,ZERITH-H1還搭載了觸覺夾爪,集成了高分辨率視觸覺傳感器,實現對抓取力觸覺的精準感知。零次方在視觸覺傳感器方面技術積累深厚,源于清華AI&Robot實驗室。實驗室曾提出過超越人類觸覺感知水平的超光譜視觸覺傳感方案,相關視觸覺成果多次獲ICRA、IROS Best Paper Finalists,多次在T-RO、Soft Robotics、T-MECH等頂級期刊上發表。
▍便捷軟件:數據采集管理加速器
為了讓數據采集變得像“玩游戲”一樣簡單高效,同時保障數據質量,零次方開發了配套軟件,在硬件之外有了強大的軟件“助手”。
↑ VR遙操演示
例如零次方基于主流vr設備自研了ZERITH-VR APP,以此快速構建物理世界與虛擬世界交互渠道,實現遙操作設備與機器人本體、具身數據管理平臺超低數據傳輸延時。同時通過“一鍵式”設備連接、“引導式”數據采集工作流,幫助用戶快速掌握復雜任務數據采集能力,確保數據收集質量、提升數據采集效率。
ZERITH-H1能夠實現“孿生式”映射同步感知,將機器人與操作員之間的通訊延遲無限逼近零延遲。設備單次連續運行時間超過4小時,能滿足長時間、高質量的數據采集需求。
↑ ZERITH-VR APP界面
針對數據采集任務多樣、采集流程繁雜、數據管理及可視化等需求,零次方還自研具身數據管理平臺用于數據全流程管理,依托自身開發模型的經歷,通過數萬次的數據采集與測試,不斷測試數據管理平臺易用性,現正式對外推出具有:對具身任務數據分類、清洗、標注、檢索等模塊化高易用性的具身數據采集管理平臺,能幫助用戶將采集到的原始“多元數據”高效轉化為“即用型訓練燃料”。
↑ 具身數據采集流程
▍集成高效訓練與部署工具鏈:加速訓練與場景落地
為了讓用戶能快速將數據應用于模型訓練和實際部署,零次方這套解決方案還集成了強大的工具鏈。
零次方數據平臺設計兼容主流開源算法框架的標準化接口(如ACT、Diffusion Policy、DP3等);數據接口兼容對基座模型(Pi0、GROOT、ZERITH-V0等)的后訓練(LORA、Fine tuning、RL等),提供符合許可證要求的快速訓練接入能力。
在模型訓練過程,零次方深度集成AI訓練工具Swanlab,實現對模型訓練的全過程記錄、實時監控、數據可視化與批量實驗分析,幫助用戶科學調參、管理歷史訓練實驗數據,高效迭代自己的具身智能模型。
↑ 訓練過程可視化監控與記錄
在模型推理上,機器人可選配最高500TOPS算力的主機,結合優化后的易用部署框架,顯著提升模型推理效果,實現流暢、精準的動作執行,確保智能模型在真實場景中能快速落地并展現優異性能。
▍結語與未來
整體而言,零次方的“全模態”具身數據全鏈路解決方案,通過創新的ZERITH-H1硬件采集平臺、易用的VR操控與數據管理軟件,以及深度集成的訓練推理工具鏈,在業內率先構建了一個“從數據到動作”的完整閉環。它直擊機器人智能化訓練中數據模態缺失、采集繁瑣、管理復雜、訓練部署門檻高的核心痛點,以高維、兼容、可持續的數據基座,為當下及未來的具身智能模型研發提供了強大的基礎設施支撐。
隨著中國智能制造對柔性機器人的需求激增,數據供給能力正成為競爭分水嶺。零次方通過將全模態采集設備、VR交互平臺與訓練工具鏈深度耦合,首次讓中小廠商能以低于10萬元的投入獲取實驗室級數據資源。
正如有專家所言:“誰掌握高質量具身數據流,誰就握緊了下一代機器人進化的閥門?!边@場數據平權革命,或將重構人機協作的產業地圖。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.