《International Journal of Robotics Research》(簡稱IJRR)創刊于1982年,是第一本有關機器人研究的學術出版物,也是當今機器人學領域的頂刊。IJRR致力于提供領域內杰出學者針對突破性前沿問題、技術發展和機器人學理論等方面研究撰寫的開創性原創論文。惠及應用數學、人工智能、計算機科學,電氣和機械工程等多個領域。本文對IJRR上近期發表的七篇精選論文進行了綜述,涵蓋軟體驅動器、人機交互、機器人操作、雙臂機器人、多機器人系統、人機協作、雙足機器人運動控制等多個研究方向。原論文相關信息在文章末尾。
▍新型低型軟體旋轉氣動執行器設計與分析
成均館大學的研究團隊在《A new design and analysis of low-profile soft rotary pneumatic actuator for enhanced rotation and torque》一文中提出了一種新型低型軟體旋轉氣動執行器。隨著模仿人類肌肉動作需求的增加,軟體驅動器在抓取、可穿戴設備和生物醫用裝置等領域獲得了廣泛關注。
研究背景與挑戰
傳統軟氣動驅動器(SPA)利用彈性材料在施加壓力后產生變形,展現出高柔性、低重量和低能耗的優點。然而,旋轉型軟體驅動器的發展相對滯后,現有設計多采用螺旋纖維在圓柱形彈性體上排列,使旋轉量隨軟體長度增加而提高,但在空間有限場景中存在局限性。同時,現有建模方法多依賴對變形后固定形狀的假設,無法準確描述實際變形過程。
創新設計與方法
研究團隊提出的新型低型軟體旋轉氣動執行器具有三大創新點:
1、緊湊型設計:利用纖維增強的彈性體結構,通過內部嵌入螺旋排列的纖維實現旋轉,輔以外部剛性部件抑制軸向變形并穩定旋轉軸,解決了傳統設計體型龐大的問題。
2、精確分析模型:構建了基于平衡方程與本構方程的解析模型,不依賴對變形后形狀的先驗假設,全面描述柔性體的非線性變形,同時考慮旋轉與反作用扭矩。
3、實驗驗證系統:利用旋轉編碼器、扭矩傳感器和壓力傳感器搭建了完整的實驗平臺,對理論模型進行了全面驗證。
實驗結果與分析
研究通過有限元模擬和實物實驗進行了詳盡驗證:
- 有限元分析
- 顯示,不同數量纖維(6、9、18根)和不同纏繞角(180°和240°)的模型在低壓時差異較小,高壓時出現明顯偏差,但總體誤差控制在20%以內。
- 實驗驗證
- 表明,盡管在高壓區域存在一定滯后現象,但理論模型與實驗數據總體趨勢一致,理論模型與仿真數據之間平均絕對誤差約1°,證明了模型的預測能力。
該研究為軟體機器人領域提供了一種緊湊、高效的旋轉驅動解決方案,未來可進一步改進材料滯后性建模、纖維滑移效應以及高動態情況下的粘彈性和慣性效應建模。
▍大規模室內運動捕捉數據集:TH?R-MAGNI
來自厄勒布魯大學等機構的研究者在《TH?R-MAGNI: A large-scale indoor motion capture recording of human movement and robot interaction》中發布了一個創新性數據集,旨在解決社交導航與人機交互研究中的數據瓶頸。
研究背景與意義
現有數據集存在兩大局限:一是上下文信息不足,缺乏環境語義和個體行為線索;二是模態單一,忽略眼動、力覺等多模態數據對意圖預測的重要性。經典數據集如ETH/UCY僅記錄室外行人軌跡,而工業場景數據集未涵蓋動態機器人交互。
數據集特點與創新
TH?R-MAGNI數據集具有四大核心優勢:
1、全場景覆蓋:包含5類場景,從基礎導航到工業協作,涵蓋40名參與者的單人與群體任務,支持差速驅動與全向驅動機器人行為。
2、多模態融合:整合高精度運動捕捉(精度1mm)、眼動追蹤(Tobii與Pupil設備)、機器人傳感器(3D激光雷達、RGB-D攝像頭、魚眼攝像頭)等多種數據源。
3、標準化工具鏈:提供可視化儀表盤和數據處理包(thor-magni-tools),支持軌跡、眼動、激光雷達數據的2D/3D動態可視化與預處理。
4、開放性與可擴展性:包含3.5小時數據量(22,500條軌跡、8.3小時眼動數據),覆蓋54種物體交互場景,數據與工具完全開源。
數據分析與應用價值
TH?R-MAGNI在多項數據指標上超越現有數據集:
- 追蹤質量
- :平均追蹤時長達41.3秒,遠超ETH/UCY(15-25秒),支持長期行為預測。
- 運動復雜度
- :軌跡非線性系數(0.75-0.78)顯著低于ETH/UCY(0.85-0.92),體現更復雜的避障與交互行為。
- 多模態驗證
- :實驗表明,人類在接近機器人時視線集中在其運動方向,為意圖預測提供關鍵線索;多模態策略在動態避障任務中比單一視覺模型成功率提升23%。
該數據集為社交導航與人機交互研究提供了標桿基準,支持長時軌跡預測、眼動-行為關聯分析和機器人運動規劃等任務,標志著人機交互研究從"單模態實驗"邁向"多模態協同"的新階段。
▍功能操作基準:FMB
加州大學伯克利分校的研究團隊在《FMB: A functional manipulation benchmark for generalizable robotic learning》中提出了一個綜合性的機器人操作基準測試平臺。
研究背景與挑戰
機器人操作研究面臨兩大挑戰:一是物理復雜性,包括接觸動力學和技能組合的復雜性;二是泛化能力不足,難以適應新物體或場景。現有研究要么聚焦于簡單任務的廣泛泛化,要么專注于復雜任務的狹窄優化,缺乏兼顧物理復雜性和泛化能力的統一基準。
基準設計與特點
FMB基準通過四大模塊設計,成為機器人學習研究的標準化工具包:
1、多樣化可復現物體:包含66種不同形狀、尺寸和顏色的3D打印物體,支持單物體操作和多物體復雜裝配,并提供CAD文件確保全球研究者可低成本復現。
2、大規模多模態數據集:提供22,500條人類演示軌跡,涵蓋RGB/深度圖像、機器人運動學數據、末端力/力矩信息,按技能和任務模塊化分割。
3、模塊化模仿學習框架:基于ResNet和Transformer的基線策略,支持分階段技能訓練或端到端長序列任務,靈活組合輸入模態。
4、標準化評估協議:嚴格測試流程包括訓練集外物體和隨機初始位姿,量化策略的泛化性與魯棒性。
實驗結果與驗證
研究團隊通過三類任務驗證了FMB的有效性:
1、抓取任務:數據量和深度信息顯著影響成功率(100%數據:27/50;RGB+深度比純RGB提升約10%),而訓練集外物體測試驗證了泛化能力。
2、插入任務:加入力覺信息后,插入成功率從2/25提升至11/25,不同形狀復雜度展現任務難度梯度(三叉形:4/25;矩形:19/25)。
3、多階段任務:端到端策略因誤差累積成功率接近0,而基于人類預設序列的分層策略顯著提升性能(單物體:19/30;多物體:7/10)。
FMB通過標準化設計為機器人學習研究提供了可擴展的測試平臺,其數據集、3D模型、代碼和預訓練模型已完全開源,為推動機器人操作技術發展提供了重要基礎設施。
▍雙臂機器人操作可變形線性物體
清華大學與加州大學伯克利分校的聯合研究《Generalizable whole-body global manipulation of deformable linear objects by dual-arm robot in 3-D constrained environments》解決了雙臂機器人在受限三維空間操作可變形線性物體(DLO)的復雜問題。
研究背景與挑戰
在工業裝配、醫療手術等場景中,機器人操作DLO(如電纜、繩索)面臨三大挑戰:
1、高維與多約束性:DLO形變自由度、雙臂機器人高自由度、復雜環境中的碰撞避免導致規劃和控制復雜度極高。
2、模型不確定性:DLO的非線性力學特性使精確建模困難,傳統基于模型的開環規劃易失效。
3、泛化能力不足:現有方法多針對特定任務或簡化環境,難以適應不同DLO類型和復雜場景。
創新框架與方法
研究提出一種全局規劃與局部控制互補的框架,包含三大創新:
1、全局規劃器:基于離散彈性桿模型(DER)快速生成可行路徑,采用改進雙向RRT算法和投影方法約束節點生成,引入任務空間引導策略加速搜索,提出簡化DER參數識別方法適應不同DLO。
2、局部控制器:設計模型預測控制器結合自適應DLO雅可比模型實時補償規劃誤差,引入硬約束(碰撞避免、拉伸限制),通過閉環反饋實現高精度跟蹤。
3、系統整合:首次實現雙臂機器人在真實三維受限環境中對多種DLO的全身無碰撞操作,任務復雜度遠超現有方法。
實驗驗證與結果
研究通過仿真和真實實驗全面驗證了方法的有效性:
- 仿真驗證
- :在4類復雜任務中,規劃成功率100%,平均規劃時間1-10秒,平均規劃時間1-10秒(最復雜任務為10秒)。閉環控制下,400次測試全部成功,最終形變誤差<0.5 mm,碰撞時間趨近于0;開環控制因模型誤差碰撞率顯著上升(如任務4碰撞時間從0.03秒增至1.71秒)。
- 真實實驗
- :使用5種不同材質DLO(TPU彈性體、尼龍繩等)完成3類復雜任務(避障、旋轉、穿窄縫),135次測試
- 全部成功,平均執行時間<60秒;閉環控制顯著降低碰撞風險(僅1次輕微碰撞),開環控制成功率降至94%。
- 對比分析
- 模型優勢:相比Bretl的六維流形模型,DER模型考慮重力效應,規劃路徑更短,執行時間減少50%。
- 框架優勢:相比McConachie的彈性帶方法,本文在碰撞避免和路徑質量上表現更優,復雜任務規劃成功率提升至100%。
該研究為工業與醫療場景提供了通用解決方案,未來可進一步研究全局路徑優化、加速DER投影計算、融合環境接觸的DLO操作以及結合實時動態模型與深度學習提升預測精度。
▍大規模異構多機器人系統的實時規劃
中國科學技術大學研究團隊在《Real-time reactive task allocation and planning of large heterogeneous multi-robot systems with temporal logic specifications》中提出了一種創新的大規模異構多機器人系統實時規劃方法。
研究背景與挑戰
傳統多機器人系統的任務分配與規劃(TAP)方法面臨三大問題:
1、計算成本高:隨機器人數量和任務復雜度增加,狀態空間呈指數級增長("維度災難")。
2、實時性不足:難以應對動態環境中的突發狀況,如火災救援中的新火點或幸存者檢測。
3、異構性支持有限:現有方法難以高效協調具有不同能力的異構機器人協作完成復雜任務。
創新方法與貢獻
研究提出基于規劃決策樹(PDT)的實時反應式任務分配與規劃框架,核心創新包括:
1、規劃決策樹結構:將任務進度和系統狀態編碼為樹形結構,避免構建復雜的產品自動機,顯著降低狀態空間;支持增量式任務分配,任務分配復雜度僅與機器人數量和類型呈線性關系(O(n))。
2、雙階段搜索算法:包括離線規劃(PDTS)生成滿足全局時序邏輯(LTL)任務的初始計劃,以及在線交互式規劃(IPDTS)動態調整計劃響應環境變化。
3、理論保證:提供可行性(生成的計劃可執行且滿足任務需求)和完備性(若存在可行解,算法保證找到)的數學證明。
4、超大規模適用性:可處理超過200個任務狀態、100種機器人類型及10^4規模的機器人集群。
實驗結果與應用
研究通過多項實驗驗證了方法的性能:
- 計算效率
- :PDTS在200個任務狀態和10^4機器人規模下規劃時間僅16.4秒,比傳統MILP方法快10^3倍;IPDTS在全局與臨時任務耦合時平均規劃時間僅0.0134秒。
- 場景測試
- :在火災救援(200個異構機器人實時協調)、醫院清潔(4臺異構機器人動態協作)和塔防游戲(防御與臨時任務響應)等場景均表現出色。
- 魯棒性
- :機器人故障或環境突變時,系統可在10毫秒內重新規劃;任務需求動態調整時,系統能無縫切換。
該框架在災害救援、工業物流等領域具有廣泛應用潛力,未來研究方向包括考慮通信約束下的規劃、引入時間敏感任務約束以及結合強化學習優化局部任務分配策略。
▍人機交互中的機器人學習通信
弗吉尼亞理工學院和普渡大學的研究者在《A survey of communicating robot learning during human-robot interaction》中系統性地綜述了學習與通信閉環研究的進展。
研究背景與意義
隨著機器人智能化與自主性提升,人類與機器人之間的理解鴻溝依然存在。傳統研究通常將機器人學習算法與通信接口設計割裂開來:
- 學習算法(如模仿學習、強化學習)常被視為"黑箱",人類難以實時理解機器人的學習進展與意圖。
- 通信接口(如視覺、觸覺、聽覺)雖能傳遞信息,但往往未針對"學習狀態"優化,缺乏直觀性與多模態協同。
該研究首次系統性地探索了如何通過雙向信息流提升人機協作效能。
閉環通信框架與趨勢
研究提出了一個完整的閉環學習與通信框架,包括:
通信方式分類:
隱式:通過人類參與學習過程間接傳遞學習狀態(如機器人行為變化)。
顯式:通過預處理(如行為樹、層次化策略)或后處理(如關鍵狀態可視化、自然語言解釋)主動生成可解釋信號。
研究趨勢識別:
從單一視覺反饋轉向沉浸式多模態接口(如AR投影結合觸覺提示)。
從靜態學習模型轉向動態人機協同適應(co-adaptation)。
開放問題提出:
如何設計可解釋且兼容多模態接口的學習表示?
如何開發標準化通信接口以支持復雜學習狀態(如不確定性、決策邏輯)的傳遞?
如何實時測量人類對機器人學習的理解并優化反饋策略?
實驗驗證與未來方向
研究通過物理示教機械臂完成椅子組裝任務的用戶實驗,對比了三種通信方式:
- 實驗結果
- :顯式AR+觸覺方式在正確預測率(100%)、任務誤差(5.0cm)和用戶信任度方面均優于僅GUI和隱式方式。
該研究系統性地論證了"學習與通信閉環"對人機協作的三大提升:
1、教學效率:顯式反饋幫助人類聚焦機器人薄弱環節,減少無效示教。
2、信任建立:透明化學習狀態使人類更準確評估機器人能力,增強協作信心。
3、協同適應:動態反饋促進人機角色調整(如機器人學習后接管重復任務)。
未來研究方向包括開發兼顧學習效率與可解釋性的表示方法、設計標準化多模態接口協議、引入神經信號實時量化人類認知負荷與理解深度,推動機器人從"工具"向"伙伴"演進。
▍強化學習在雙足機器人控制中的應用
加州大學伯克利分校等機構的研究團隊在《Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control》中展示了強化學習在復雜雙足機器人運動控制中的突破性應用。
研究背景與挑戰
在復雜、非結構化的人類環境中實現穩定且多樣化的雙足機器人運動控制長期是機器人學的核心難題。傳統的模型驅動控制方法在特定任務中表現良好,但面臨三大挑戰:
1、系統復雜性:高維、非線性、欠驅動系統難以精確建模。
2、動力學不連續:接觸模式變化帶來的動力學跳變難以處理。
3、多樣化動作:非周期動作(如跳躍)對有限時間穩定性的需求難以滿足。
創新方法與貢獻
研究提出了五大創新點:
1、通用控制框架:統一的強化學習框架可訓練涵蓋周期性(走、跑)、非周期性(跳躍)、靜止(站立)等多種動態技能的控制策略,實現從模擬到實機的零樣本遷移。
2、雙歷史控制策略結構:非遞歸控制器結構融合短期I/O歷史(4步,用于高頻反饋控制)和長期I/O歷史(2秒,66步,用于系統動態識別與狀態估計),通過深度網絡結合1D卷積與MLP實現。
3、適應性研究:實證展示RL策略可處理時間不變的系統參數變化和時間變異干擾,在穩定站立、跳躍著陸等場景展現適應能力。
4、魯棒性提升機制:使用任務隨機化(Task Randomization)訓練策略,超越常規的動力學隨機化(Dynamics Randomization),增強策略對多任務泛化能力和擾動合規性。
5、廣泛實機驗證:在Cassie機器人上展示了穩健站立、多速度行走、快速奔跑(400米沖刺)、多樣跳躍任務(遠跳、高跳、方向跳)及未訓練地形適應能力,實驗持續一年,驗證了策略的一致性和實用性。
實驗結果與對比
研究團隊通過全面實驗驗證了方法的優越性:
- 行走能力
- :同時實現多速度、多高度行走和地形適應,而絕大多數基線方法無法同時實現。
- 奔跑表現
- :支持轉向并完成400米沖刺,多數基線方法無法完成此任務。
- 跳躍性能
- :實現0.47米腳尖離地高度和0.58秒滯空時間,遠超其他方法(最大0.42米)。
- 遷移能力
- :純模擬訓練可直接無調參部署到實機,而多數基線方法需微調或失敗。
- 魯棒性
- :展示了對非預設擾動的恢復能力,多數基線方法未展示此能力。
該研究展示了強化學習在復雜雙足機器人運動控制中的通用性與實用性,標志著多技能、動態、穩健的仿人機器人控制向實用化邁出重要一步,為未來更復雜系統的強化學習應用提供了指導路徑。
▍結語
本文綜述的七篇《International Journal of Robotics Research》近期精選論文,展示了機器人學研究的多個前沿方向。從軟體驅動器的精確建模到大規模多機器人系統的實時規劃,從功能操作基準到雙足機器人的強化學習控制,這些研究不僅推動了各細分領域的技術進步,更共同指向了機器人技術發展的未來趨勢:更靈活、更智能、更可靠的機器人系統將逐步融入人類生活和工作環境。
通過多模態感知、閉環控制、學習與通信融合以及強化學習等先進技術的應用,機器人正從簡單重復的工業應用向復雜、動態、非結構化環境中的智能助手轉變。這些研究成果不僅具有學術價值,更為解決實際問題提供了可行方案,推動了機器人技術向更廣泛的應用領域擴展。
如果您對這些研究感興趣,歡迎深入閱讀原論文(下方為相關信息),探索機器人技術的更多可能!
[1] Lee, Young Min, et al. "A new design and analysis of low-profile soft rotary pneumatic actuator for enhanced rotation and torque." The International Journal of Robotics Research (2024): 02783649241273662.
[2] Schreiter, Tim, et al. "TH?R-MAGNI: A large-scale indoor motion capture recording of human movement and robot interaction." The International Journal of Robotics Research (2024): 02783649241274794.
[3] Luo, Jianlan, et al. "Fmb: a functional manipulation benchmark for generalizable robotic learning." The International Journal of Robotics Research (2023): 02783649241276017.
[4] Yu, Mingrui, et al. "Generalizable whole-body global manipulation of deformable linear objects by dual-arm robot in 3-d constrained environments." The International Journal of Robotics Research (2023): 02783649241276886.
[5] Chen, Ziyang, and Zhen Kan. "Real-time reactive task allocation and planning of large heterogeneous multi-robot systems with temporal logic specifications." The International Journal of Robotics Research (2024): 02783649241278372.
[6] Habibian, Soheil, et al. "A survey of communicating robot learning during human-robot interaction." The International Journal of Robotics Research (2024): 02783649241281369.
[7] Li, Zhongyu, et al. "Reinforcement learning for versatile, dynamic, and robust bipedal locomotion control." The International Journal of Robotics Research (2024): 02783649241285161.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.