合成數據是放大人類示范的“放大器”,是打通具身智能“最后一公里”的關鍵鑰匙。與真實場景數據的采集面臨的成本高、周期長、場景覆蓋率低等問題不同,具身仿真數據構建的是場景足夠豐富、物理交互真實及人在環的數據,能夠有效打通機器人進入物理世界現存的技術難點。
近日,在第二屆中國人形機器人與具身智能產業大會上,光輪智能(北京)科技有限公司聯合創始人兼總裁楊海波,發表了主題為《合成數據:具身智能的必經之路》的演講,楊海波認為,在實現通用人工智能(AGI)的過程中,AI必須具備與復雜物理世界交互并深入理解的能力。楊海波強調,具身合成數據有三個必備條件:一是要有足夠真實的物理交互能力、二是要有人的示范在環、三是場景足夠豐富。
光輪智能(北京)科技有限公司聯合創始人 &總裁 楊海波
楊海波在會上指出,物理交互是讓機器人真正“學會做事”的基礎,就像學游泳不能光在岸上看,必須跳進水里感受浮力和阻力一樣。要讓機器人像真人一樣學習,必須模擬出真實的物理反饋,比如物體的重量、材質軟硬、碰撞時的反應、關節如何活動,以及動作之間的邏輯聯系(比如按下開關燈才會亮)等物理屬性,細節構成的動態交互體驗,才能幫機器人在不斷試錯中積累經驗,逐步優化算法,而這種能力無法通過標注圖像或視頻獲得,需要依賴物理交互真實的數據閉環。
光輪智能可交互物理資產
楊海波還認為具身合成數據中的人類示范是不可替代的,AI的進化永遠需要人類智慧的指引,合成數據的核心價值并非取代真實數據,而在于放大專家示范(Demonstration)。OpenAI借助數千名專業標注員提煉人類反饋,Scale AI 有數萬個博士、工程師等專家標注員,特斯拉FSD V12/13基于"五星級駕駛員"數據進行自動駕駛訓練——具身同樣需要專家的遙操作數據作為種子,再通過仿真泛化出多樣化的操作范式,填補99%的具身Pre-Train(預訓練)階段的數據缺口。
“足夠豐富的場景多樣性是極其重要的,大家都在談Sim2Real Gap,卻忽略了Real2Real 在場景豐富度上的巨大Gap”,楊海波在會上說到,“自動駕駛汽車,在封閉的測試場或賽車場訓練得再好,也沒法真正上路,本質上是場景豐富度遠遠不夠,而具身要求的場景豐富度更是指數級攀升”。當前絕大多數具身采集場停留在先搭建硬件場景、再采集具身數據的階段,這樣很容易因硬件快速迭代和場景復雜度不足而極大提高采集成本、降低數據獲取效率。而具身仿真數據的價值不僅在于能夠有效降低硬件迭代成本,更在于它能夠大規模、靈活的泛化百萬級不同場景,實現場景的廣泛覆蓋、數據分布合理,只有具有足夠的場景豐富度才能有效服務具身智能算法訓練。因此,楊海波指出,政府亟需以頂層設計推動現有具身數據采集工廠構建“仿真能力基座”,實現Real2Sim2Real的數據高效采集和泛化
光輪智能廚房場景泛化
光輪智能目前已和全球頂尖企業深度合作,客戶涵蓋NVIDIA、Figure、Deepmind、智元機器人、銀河通用機器人、字節跳動、Wayve、博世等。光輪智能(北京)科技有限公司成立于2023年1月,成立之初就設定了 Simulation & Synthetic Data for Robotics(機器人的仿真和合成數據)的愿景。
楊海波談到,光輪智能最初以自動駕駛切入具身智能第一個規模化的場景,在未來,具身合成數據會是機器人通往AGI的關鍵一環。而目前具身的 Robotics Foundation Model預訓練數據幾乎為零,這為光輪智能提供了機會。楊海波指出未來具身智能合成數據將占比超過90%,甚至99%以上。目前光輪智能正在構建一個上千人的仿真運營團隊,致力于構建全球最大的具身數據工廠,做仿真技術驅動的具身智能界Scale AI,打造AI進入物理世界的數據基礎設施。
光輪智能在英偉達大會上分享合成數據加速GR00T N1人形基礎模型開發的具體實踐
▍結語與未來:
相較于自動駕駛,具身智能模型訓練的VLA 模型需要更海量訓練數據。因此,具身智能領域的數據匱乏已經成為制約AGI發展的關鍵瓶頸。光輪智能憑借獨特的技術優勢,通過頂尖的仿真技術和合成數據解決方案,高效生成視覺真實、物理可交互的3D資產,源源不斷地為客戶提供高質量的合成數據,得到行業認可,獲得“具身數據集構建獎”榮譽。
在商業化方面,光輪智能展現出卓越的執行力和市場影響力。盡管成立僅兩年,已迅速贏得多家全球頂尖具身智能公司的訂單、國內外頭部主機廠和Tier 1供應商等公司的訂單,成果斐然。作為具有頂尖仿真技術和運營能力的合成數據公司,其數據交付的專業性和工程化能力使其市場份額穩居國內合成數據市場份額第一,并成為全球技術領先的具身智能合成數據供應商。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.