2025 年 IEEE 國際機器人與自動化大會(ICRA 2025)已于 5 月 23 日在美國亞特蘭大·喬治亞世界會議中心落幕,最佳論文等獎項消息隨之傳來, 其中上海交通大學盧策吾團隊與新加坡國立大學邵林團隊分別斬獲 Best Paper 獎項。
作為機器人與自動化領域最具影響力的國際頂級會議之一,ICRA 匯聚全球科研先鋒、產業巨擘與創新力量,評選出的最佳論文通常代表著前沿技術與重大突破。
本次 ICRA 2025 共收到全球超 3000 篇論文投稿,吸引 7000 余名參會者。大會公布的 Best Paper 獎項共設 12 項,每項獎項的入圍論文通常僅3篇,最終從中遴選出一篇最佳論文,競爭態勢激烈。
其中上海交通大學盧策吾團隊斬獲“Best Paper Award on Human-Robot Interaction”(人機交互最佳論文獎),新加坡國立大學助理教授邵林團隊榮獲“Best Paper Award on Robot Manipulation and Locomotion”(機器人操作與運動最佳論文獎)。
Best Paper 花落誰家
ICRA 2025 共有 50 篇論文入圍,其中最佳論文獎有 16 篇。
官網鏈接:https://2025.ieee-icra.org/program/awards-and-finalists/
最佳論文
本屆 ICRA 總共評選出 2 篇最佳論文。
第一篇最佳論文頒給了由加拿大多倫多大學、蒙特利爾麥吉爾大學共同發布的《Marginalizing and Conditioning Gaussians Onto Linear Approximations of Smooth Manifolds with Applications in Robotics》。
論文鏈接:https://arxiv.org/pdf/2409.09871
作者:Zi Cong Guo, James Richard Forbes, and Timothy Barfoot
論文介紹:本文給出對高斯分布進行邊緣化和條件化到線性流形上的閉式表達式,并展示如何將這些表達式應用于對非線性流形進行線性化。盡管邊緣化和條件化操作已得到了充分研究,但將其應用于非軸對齊流形的操作還未被充分理解。本文通過三個應用展示了這些表達式的效用:1)投影正態分布,隨著問題非線性程度的增加,線性近似的質量也會提高;2)科普曼(Koopman)同時定位與地圖構建(SLAM),展示了在真實世界數據集上,協方差收縮問題會隨著非線性程度的增加而減輕;3)約束廣義時間同步與空間感知(GTSAM),展示了在模擬中協方差收縮是一致的。
第二篇最佳論文屬于來自卡內基梅隆大學、上海交通大學團隊共同推出的《MAC-VO: Metrics-Aware Covariance for Learning-Based Stereo Visual Odometry》,這一工作由國防科技與工程局(DSTA)贊助。
論文鏈接:https://arxiv.org/pdf/2409.09479
作者:Yuheng Qiu, Yutian Chen, Zihao Zhang, Wenshan Wang, and Sebastian Scherer
論文介紹:本文提出了MAC-VO,一種基于學習的立體視覺里程計(VO)方法,其性能優于視覺里程計,甚至在具有挑戰性的數據集上超越了同時定位與地圖構建(SLAM)算法。在本文當前的工作中,模型聚焦于兩幀姿態優化。本文認為未來的工作將集中在通過光束平差法、多幀優化和回環檢測帶來的優勢上。此外,本文計劃將此度量感知協方差模型應用于多傳感器融合,例如與慣性測量單元(IMUs)融合。
最佳學生論文
今年的最佳學生論文一共有 4 篇獲獎。
第一篇頒給了由卡內基梅隆大學、新加坡國立大學共同推出的《Deploying Ten Thousand Robots: Scalable Imitation Learning for Lifelong Multi-Agent Path Finding》。
論文鏈接:https://arxiv.org/pdf/2410.21415
作者:He Jiang, Yutong Wang, Rishi Veerapaneni, Tanishq Harish Duhan, Guillaume Adrien Sartoretti, Jiaoyang Li
論文介紹:終身多智能體路徑規劃(LMAPF)旨在為不斷有新目標的多個智能體找無碰撞路徑。近來該領域用基于學習的方法,依局部觀測生成單步動作,但要比肩先進算法仍具挑戰,尤其在大規模場景。本研究提出基于模仿學習的 LMAPF 求解器,引入新通信模塊及系統單步碰撞解決與全局引導技術。可擴展模仿學習算法(SILLM)兼具基于學習方法的快速推理和GPU加持下基于搜索方法的高求解質量。在六個大規模地圖(含多達 10,000 智能體)測試中,SILLM 優于最佳學習和搜索基線算法,平均吞吐量分別提升 13.7% 和 16.0% ,還在 2023 年國際 LMAPF 競賽勝出。最后,在模擬倉庫用 10 個真實、100 個虛擬機器人驗證了SILLM 。
第二篇是《ShadowTac: Dense Measurement of Shear and Normal Deformation of a Tactile Membrane from Colored Shadows》
作者:Giuseppe Vitrani, Basile Pasquale, and Michael Wiertlewski
論文介紹:機器人需通過豐富觸覺感知機械作用以處理物體,新型觸覺傳感器借微型攝像頭實現相關測量與信息提取。回射傳感雖能解析物體形狀,但無法檢測橫向位移,會忽略關鍵摩擦信息,而嵌入不透明標記物又難以制造。本文提出 ShadowTac 觸覺傳感器,將回射照明與彩色陰影形成的非侵入性標記物結合,其回射表面有亞毫米凹坑圖案,不遮擋視覺且能投射可見陰影,可捕獲密集法向和精確橫向位移場,且易于制造。經評估,它測量可靠,能有效估計物體初始滑動,適合追蹤機器人與操作物體間動態作用。
第三篇是《Point and Go: Intuitive Reference Frame Reallocation in Mode Switching for Assistive Robotics》
作者:Allie Wang, Chen Jiang, Michael Przystupa, Justin Valentine, and Martin Jagersand
論文介紹:對于輪椅搭載機器人操縱器的用戶而言,操作高自由度機器人頗具挑戰,笛卡爾空間模式切換存在控制參考系不直觀、控制分離及運動受限等問題。本文提出“Point and Go”模式切換,以新掃動動作定義平移軸構建直觀動作空間,含平移與旋轉模式,旋轉模式結合位置控制與末端執行器定向框架。經三任務用戶研究對比,該模式使任務完成時間減 31%、停頓減 41% 、模式切換次數減 33% ,且收獲用戶高度認可。
第二篇頒給華盛頓大學團隊發布的《TinySense: A Lighter Weight and More Power-Efficient Avionics System for Flying Insect-Scale Robots》,本研究部分由美國國家科學基金資助。
論文鏈接:https://arxiv.org/pdf/2501.03416
作者:Zhitao Yu, Josh Tran, Claire Li, Aaron Weber, Yash P. Talwekar, and Sawyer Fuller
論文介紹:本文介紹自主飛行昆蟲機器人(FIR)傳感器套件方面的進展,該機器人重量小于一克,采用 FIR 技術,因為其重量輕,所以有可能實現大規模部署和可擴展性。然而,其尺寸小帶來了顯著的控制挑戰,包括高帶寬動力學、功率受限以及有效載荷能力有限等問題。雖然在開發輕量級傳感器方面已有進展,且許多靈感源自生物系統,但亞克級無人機仍無法實現無需依賴外部傳感(如運動捕捉系統)的持續懸停。
盧策吾、邵林團隊摘獲最佳論文獎
在本次最佳論文名錄里,各單項最佳論文獎項與當前具身智能產業界的重點議題緊密呼應。相較于去年的最佳論文方向,今年新增了機器人學習、運動與操作、規劃與控制等方向的獎項論文。
ICRA 2025 機器人操作與運動最佳論文獎屬于新加坡國立大學助理教授邵林團隊的《D(R,O) Grasp: A Unified Representation of Robot and Object Interaction for Cross-Embodiment Dexterous Grasping》
論文鏈接:https://arxiv.org/pdf/2410.01702
作者:Zhenyu Wei、Zhixuan Xu、Jing翔Guo、Yiwen Hou、Chongkai Gau、Zhehao Cai、Jiayu Luo、Lin Shao
操作與運動是具身智能兩大重點方向,也是廣受探討的議題。據了解,邵林團隊此次獲獎,是近五年來亞洲機構首次以第一單位身份斬獲該獎項。
文中提出一種用于改進靈巧抓取的新方法,即引入 D(R,O) 表示法,該方法捕捉了機器人手與物體交互的本質。與現有的高度依賴物體或機器人特定表示的方法不同,該方法通過統一框架彌合了差距,能很好地在不同機器人和物體幾何形狀間通用。此外,本文訓練方法增強了模型適應不同手構型的能力,使其適用于廣泛的機器人系統。實驗結果證實,本文方法在成功率、多樣性和計算效率方面均有顯著提升。
在 ICRA 2025 獲獎名單中,一支中國團隊榮獲人機交互領域最佳論文獎。
論文鏈接:https://arxiv.org/pdf/2407.00299
ICRA 2025 機器人交互最佳論文獎頒給由上海交通大學人工智能學院和伊利諾伊大學厄巴納-香檳分校(UIUC)聯合推出的《Human - Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition》。
在機器人操作領域,如何高效地讓機器人從人類示范中學習技能一直是研究的核心挑戰。傳統遙操作系統依賴人類手動控制機器人完成任務,然而,生理結構差異、缺乏觸覺反饋等問題導致數據收集效率低下,操作者需耗費大量精力重復執行任務。
例如,在基于視覺的遙操作中,即使使用先進的 3D 手勢估計算法,手部動作與機器人末端執行器的映射誤差仍顯著影響操作精度,尤其在開抽屜、工具使用等接觸密集型任務中,人類難以通過視覺精準控制力度和角度,導致數據收集成功率低、耗時長。
為解決上述難題,研究團隊吸收繼承了傳統的 shared autonomy 的思想,將數據采集和模型訓練兩個過程深度耦合,使得數據采集能夠伴隨著模型訓練的推進,提出 Human-Agent Joint Learning(HAJL)框架通過創新“人-智能體聯合學習”范式,應對機器人操作技能學習中高質量數據獲取成本高、效率低的核心難題,與傳統方法相比,數據收集成功率提高了30%,收集速度幾乎翻倍,同時減少人類操作員的適應需求。可擴展的具身數采和大規模訓練奠定了基礎。
具體而言,Human-Agent Joint Learning(HAJL)核心是通過動態共享控制機制,實現人類與學習型代理的協作。該框架引入擴散模型輔助代理,通過 “正向擴散 - 反向去噪” 過程融合人類動作與代理動作:
正向過程為人類動作添加高斯噪聲,模擬操作中的不確定性;
反向過程則通過神經網絡對噪聲動作進行去噪,生成兼顧人類意圖與代理優化的協作動作。通過調整 “控制比例 γ”(0 為全手動,1 為全自主),人類只需提供高層意圖(如 “抓取物體”),代理自動補全底層動作細節(如手指彎曲角度)。例如,在拾取雞蛋任務中,人類指定抓取目標后,代理可根據歷史數據自動計算最佳抓握力度,避免因人工控制過緊導致物體損壞。
這個過程反復進行,智能體不斷地加噪和去噪,逐步優化人類的初始動作,最終得到一個高質量、精確的操作結果。
在訓練的開始階段,研究者會收集少量的數據,并使用這些少量的數據開始進行模型的訓練;此時的模型因為數據不足并不能很好的完成目標任務,但卻可以對任務有大致的理解,或者能夠在任務的某些簡單環節掌握一定的技巧,因而研究者讓模型開始與遙操作員共享對機器人的控制,這種共享控制會讓數據采集的過程變得輕松。
例如人可能只需要將手朝著目標位置做比較輕微的移動,機械臂就可以在人與模型共享控制下移動到接近目標位置的狀態。這樣,采集員能夠更快速更輕易地收集數據;而隨著數據的積累,模型能力會逐漸增強,研究者也就可以將模型共享控制權重逐漸升高,數據采集也愈發輕松,直到模型能夠完整的勝任目標任務;數據采集和模型訓練過程也便同時完成了。
本文作者呂峻解釋這背后的更深層的想法在于,其認為遙操作采集數據訓練模型本質上是機器人的示教系統,而手把手的、一毫米對一毫米的遙操作應當是一種過時的示教,好的示教應當如同人類教人類一樣——很多時候只需要語言甚至是肢體語言一點即通、必要的精細操作才需要手把手這樣費時費力的指導,這篇文章的背后更多是希望去探索一種更加靈活的示教范式。
在模擬環境中,研究團隊測試了 6 類任務(包括靈巧手和夾爪操作),結果表明:
成功率提升 30%:如工具使用任務中,共享控制模式成功率從純手動的 42% 提升至 66.5%;
收集速度翻倍:拾取放置任務的效率從 176 樣本 / 小時提升至 320 樣本 / 小時;
軌跡更平滑:平均軌跡長度降低 40%,動作連貫性顯著改善。
在真實物理實驗中,基于 Flexiv Rizon4 機械臂和 RealSense 相機的測試顯示,共享控制模式收集的數據訓練出的模型性能與純人類數據相當,部分任務(如推立方體)甚至更優。用戶反饋也證實,系統顯著降低了操作負擔,易用性和滿意度評分分別達到 Cronbach’s α=0.852 和 α=0.769。
這篇論文的共同一作分別為羅盛成、彭泉泉(上交ACM班大三本科生)、呂峻,合作者為 Kaiwen Hong(UIUC)、Katherine Rose Driggs-Campbell(UIUC助理教授)、盧策吾(上交人工智能學院教授、副院長,上海創智學院副院長),通訊作者為李永露(上交人工智能學院助理教授、上海創智學院全時導師)。
參考鏈接:https://2025.ieee-icra.org/program/awards-and-finalists/
雷峰網雷峰網
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.