機器之心報道
機器之心編輯部
具身智能持續進化的浪潮下,“具身 AI 模型+人形機器人”為 AGI 走進物理世界提供了更多可能。多模態大模型的興起為具身 AI 注入強勁動力,世界模型的出現也為具身智能訓練和測試提供了新范式。如何讓機器智能不僅「看懂」物理世界,更能像人類一樣理解、規劃并操作,是當下學術和業界共同面臨的挑戰和機遇。
5 月 29 日,2025 張江具身智能開發者大會暨國際人形機器人技能大賽在上海浦東張江科學會堂順利舉行。作為大會重要組成模塊,“具身·無界:智能模型的范式創新與架構革命”論壇(以下簡稱“論壇”)在上海市經濟和信息化委員會、上海市浦東新區人民政府指導下,由上海張江(集團)有限公司主辦,上海張江數智經濟發展有限公司、機器之心承辦,上海市浦東新區工商聯張江人工智能商會協辦。
本場論壇匯聚頂尖技術專家、知名高校學者、具身智能明星廠商代表等 10 余位重磅嘉賓,行業領袖深度洞察,技術大咖同臺論道,深入探討具身 AI 與世界模型、分層決策與端到端路線、具身智能 Scaling Law 等業界熱點話題,帶來五場精彩的主題演講與一場高質量圓桌對話,論壇由機器之心副主編謝文菲主持。論壇旨在共建開放共贏的具身 AI 技術創新與產業應用繁榮生態,助力張江高能級創新平臺建設及硬核產業集聚,力求浦東在具身智能賽道的全球競速中拔得頭籌。
張江集團副總經理陳衡為論壇致辭。他指出浦東張江作為國內人形機器人領域產業高地,正憑借獨特優勢積極推動人形機器人產業進入“加速跑”階段。依托“一中心、兩基地”的產業布局,通過國家地方共建人形機器人創新中心,聯動張江機器人谷、人形機器人訓練場,持續完善政策環境、打造成熟產業生態,集聚深厚科研實力,張江正為具身智能的發展提供重要支撐。希望各位專家學者的深度交流和思想碰撞,能夠為具身智能的發展注入新的活力,為產業的未來描繪更清晰藍圖。
具身智能的核心,在于讓機器像人類一樣理解并適應物理世界的復雜規律。而新型大物理模型,正為這一目標注入全新動力。拓元智慧首席科學家、中山大學計算機學院副教授、博士生導師王廣潤以“基于新型大物理模型的具身智能”為題進行了報告。他指出以物理建模為基礎的新型大物理模型在具身智能領域大有作為。相較于 CoT(Chain of Thought),CoA(Chain of Action)更有利于泛化、端到端及統一大小腦等。此外,他也詳細介紹了團隊推出的具身智能世界模型、具身智能物理仿真平臺、具身智能應用支撐平臺等前沿成果。
如何將實驗室成果轉化為可落地的智能機器人產品?維他動力聯合創始人趙哲倫圍繞“智能機器人的十字路口”作了深入分享。怎么定義智能機器人?趙哲倫認為,智能機器人由 “V-L-A” 三要素組成。“V” 代表的對環境的感知能力;“L” 是對于知識的理解能力;“A” 是行動能力。今天很多的機器人完成了 “A”,但趙哲倫認為,即便是一個很簡單的硬件,也必須得滿足 V、L、A 整體的閉環,才是智能機器人。在此基礎之上,趙哲倫從三個維度:用戶場景的劃分(Indoor 和 Outdoor)、技術發展階段的判斷(尋找原理性技術和工程化技術的交叉點)、用戶場景的選擇(尋找復雜度高但失效成本低的場景)分享了對智能機器人產品化的核心思考。
具身智能終極形態,或許是對人類大腦與行為的深度仿生。清華大學自動化系研究員趙明國以“基于脈沖神經網絡的機械臂類腦仿生控制”為題,介紹了最新研究進展。為結合類腦仿生算法和類腦計算神經以實現機械臂的擬人高效控制,在算法結構上,他提出了一種受人類中樞神經系統結構屬性啟發的控制框架,實現了機械臂在復雜環境中的高效控制;在模塊的功能實現上,設計了完全基于 SNN 的框架實現方法,實現了機械臂在復雜環境中的自適應、靈巧控制;并在仿真環境和實物機械平臺上,驗證了該方法的有效性、魯棒性。
視覺大模型(VLM)是具身智能的“眼睛”,它如何賦能機器人更精準的環境感知與決策?聯匯科技 CEO 兼首席科學家趙天成細致分享了“視覺大模型 VLM 在具身智能中的應用”。他指出基于端到端 VLM 模型實現高性能、低成本的視覺感知、時空記憶與決策執行是當前的迫切挑戰。他介紹了聯匯科技推出的開源 VLM 強化學習框架(VLM-R1),分享了如何讓 VLM 進行視覺縮放層面深度思考的研究進展,以及視覺 VLM 模型與智能終端的聯動情況,解析了 VLM 驅動自主行動機器人的工作原理與前沿案例。
模塊化設計正在顛覆傳統機器人開發模式。如何像搭樂高一樣構建靈巧的機器人硬件?星際光年 CEO 位德浩以“具身智能機器人設計革命:‘樂高’式搭建靈巧手”為題進行了分享。他指出傳統機器人面臨價格昂貴、構型確定難以定制、硬件迭代約等于整機報廢的開發困境,如何像搭建樂高積木一樣搭建靈巧手?模塊化的關節模組是星際光年的解題路徑,此外,星際光年也開源了靈巧手范例,“關節模組+開源方案”使得靈巧手開發成本和開發周期都有著顯著降低。
隨后的圓桌對話環節以“具身智能的破曉:從前沿探索到產業落地與未來展望”為題,智元機器人具身智能算法專家陳立梁、智萊特具身智能科技有限公司 CEO 鄧振華、光輪智能 技術生態負責人甘宇飛、靈御智能 CEO 金戈分別分享了自己的觀點。
智元機器人具身智能算法專家陳立梁為我們描繪了世界模型和 Scaling Law 的算法前景,他指出具身智能通往 Scaling Law 的路線尚未收斂,世界模型路線是極具潛力的一條路徑。智元機器人世界模型的應用領域包含“心智模型”及生成式仿真器,用生成式 AI 技術來賦能機器人動作規劃,并縮小虛擬與現實的差距。
智萊特具身智能科技有限公司 CEO 鄧振華從硬件角度詮釋了算法與執行系統的協同發展,指出具身智能的算法層對硬件要求非常高,特別是在響應時效性和多模態融合上。如何讓機器人硬件與大模型有機結合是我們當前的關注重點。在具身智能商業落地上,工業場景(如搬運、清潔等),商超展廳場景是優先落地的領域,在這個基礎上,我們推測具身智能或許能在未來 5~10 年面向 C 端,走進家庭。
光輪智能 技術生態負責人甘宇飛指出,具身智能從實驗室走向產業應用所面臨的數據領域挑戰,主要是包含視覺真實的、物理可交互的、可泛化數據的缺乏。仿真合成數據相較于真實數采的在采集效率、場景泛化、產能規模化等方面都有顯著優勢。合成數據中包含了人類示范信息,是真實數據的放大器,可以百倍放大數據的價值,加速具身模型訓練部署。
靈御智能 CEO 金戈認為,技術為核心的人機混合具身智能商業化路徑,低成本高質量的真機數據采集是現階段提升模型能力的最佳方案之一。指出技術發展是漸進式的,優先滿足市場需求投入到實用化場景是一個企業長久生存的必要條件。在滿足市場需求的前提下,充分發揮技術先進性,建立技術壁壘,是市場化競爭的核心競爭力。
本場論壇是一場碰撞智慧、激活潛能的頂級思想盛宴,驅動具身智能技術變革的行業大咖們面對面暢談,從多視角勾勒了具身智能模型革命的發展藍圖。以此次深度鏈接為起點,張江將致力于推動各方跨界交流與創新合作,緊抓具身模型發展新契機,加速人形機器人等具身載體商業化進程,推動更高質量具身智能產業生態集群建設與繁榮。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.