2025 年 5 月,美國加州大學河濱分校 (UC Riverside) 與賓夕法尼亞州立大學 (Penn State University) 聯合團隊在機器人領域頂級會議 ICRA 2025 上發布最新研究成果LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。
LaMMA-P 首次將大型語言模型與 PDDL 規劃器深度融合,解決了異構多機器人系統中長時任務的自動分解與分配難題,大幅提升多機器人協同規劃的智能水平。該技術在全新基準數據集上經過大量模擬實驗驗證,相比現有最先進方法 SMART-LLM,任務成功率提高105%,執行效率提升36%,在復雜長程任務規劃上取得了突破性進展,為異構多機器人協同完成復雜任務提供了全新解決方案。
- 論文標題: LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner
- 論文鏈接: https://arxiv.org/abs/2409.20560
- 項目主頁: https://lamma-p.github.io
- 代碼開源: https://github.com/tasl-lab/LaMMA-P
技術亮點:語言模型與經典規劃算法融合,支撐通用異構多機器人長時協同任務
面對復雜長時任務和異構多機器人系統,LaMMA-P 首創性地將大語言模型的語義理解能力與 PDDL 規劃器的嚴謹性結合,不僅解決了傳統方法在任務分解和資源分配上的瓶頸,還顯著提升了任務成功率與執行效率。通過全面開源的代碼與 MAT-THOR 基準數據集,LaMMA-P 為多機器人協同規劃開辟了新的技術路徑:
- 大模型驅動的 PDDL 規劃框架:提出將大型語言模型 (Large Language Model, LLM) 的強大任務理解和推理能力與經典規劃領域定義語言 (Planning Domain Definition Language, PDDL) 規劃器相結合的新框架。利用 LLM 將人類指令轉化為高層任務描述,再由 PDDL 規劃器進行嚴謹的子任務搜索和規劃,實現對長時復雜任務的自動分解與分配。該方法融合了學習式推理與啟發式搜索的優勢,既能理解復雜自然語言指令,又能提供可靠高效的規劃方案。
- 模塊化設計與強泛化能力:LaMMA-P 采用模塊化架構,將大型語言模型、PDDL 規劃系統與仿真環境無縫集成。通過模塊間清晰的接口,系統可根據不同機器人技能靈活分解任務并高效分配子任務。該框架支持任意數量的機器人參與,同一套算法無需修改即可擴展到更多機器人協作場景,體現出優異的泛化能力。在不同家庭任務、不同機器人組合下,LaMMA-P 都能產出有效的協同計劃,表現出對任務種類和團隊規模的強適應性。
- 新基準數據集與性能超越:構建了全新的多智能體長時任務模擬基準MAT-THOR,基于 AI2-THOR 仿真環境設計家庭場景下的復雜協同任務(包含簡單復合任務和高復雜任務兩種級別)。該數據集為多機器人長程任務規劃提供了標準評測平臺。實驗結果顯示,LaMMA-P 在 MAT-THOR 基準上取得了當前最優成績:相較于最新的大模型多機器人規劃方案 SMART-LLM,LaMMA-P 的任務完成成功率提高了 105%,效率提升了 36%,在長時任務的成功執行率和執行速度兩方面均大幅領先現有方法。
一.研究背景
隨著多機器人系統在搜救、倉儲、家庭服務等場景中日益普及,讓多臺異構機器人協同執行復雜任務成為機器人領域的重要課題。在現實應用中,長時任務通常需要被分解為一系列關聯的子任務,并合理分配給具備不同能力的機器人個體協同完成。例如家庭助理機器人需要合作完成 “整理房間” 這樣的復雜指令,其中包含搬運物品、清潔、整理等多個步驟。然而,長時任務的自動分解與多機器人分工極具挑戰:如何讓機器人隊伍理解人類的高層意圖,將其細化為可執行的子任務清單,并根據每臺機器人的能力進行最佳分配,是當前智能體協作面臨的難點。
傳統的多機器人任務規劃方法往往依賴預先定義的規則或啟發式算法,在任務規模和復雜度較小時尚能奏效,但面對具有長時間跨度、復雜依賴關系的任務時往往力不從心。這類方法缺乏對自然語言指令語義的深入理解,難以及時調整規劃來應對動態環境和任務變化。此外,基于大型語言模型的機器人任務規劃雖然在單機器人的簡單任務上取得了一定進展,但在多機器人協同的長程任務上依然存在成功率低、效率差、難以泛化等問題。為了解決上述瓶頸,研究人員開始探索將新興的大語言模型與經典人工智能規劃技術相結合,試圖兼顧兩者優勢來提升多機器人系統的自主協同能力。LaMMA-P正是在這樣的背景下應運而生。
二.研究方法
大型語言模型和啟發式搜索規劃器共同驅動的多機器人規劃框架
面對異構多機器人長時任務規劃難題,LaMMA-P 提出了融合大型語言模型與 PDDL 規劃的創新框架。首先,系統利用大語言模型強大的推理與文本解析能力來理解復雜的自然語言指令,從中抽取高層任務目標和約束,并生成初步的任務分解方案。接著,LaMMA-P 將任務分解結果轉換為形式化的 PDDL 表述,由經典規劃器執行全局搜索與最優子任務規劃,找出滿足約束的最優執行序列和分配方案。在這個過程中,大語言模型負責語義理解和高層決策,PDDL 規劃器保證了規劃結果的嚴謹性和完備性。通過人機指令理解和形式規劃求解的結合,LaMMA-P 實現了對長時任務既能清楚理解又能精確計算。
整個框架采用模塊化設計,包括指令解析模塊、任務規劃模塊、執行仿真模塊等。指令解析模塊由預訓練的大型語言模型實現,輸出任務結構圖和初步分配建議;任務規劃模塊基于 PDDL,通過迭代深化搜索得到任務分配的具體行動序列;執行模塊在仿真環境中驗證并反饋執行結果用于可能的調整。各模塊解耦的設計使得增加機器人數量或更改任務類型時無需更改框架主體邏輯,只需調整相應的任務描述和機器人能力配置,體現出高度的靈活性和通用性。
三.實驗結果
性能全面超越現有方案
研究團隊構建了MAT-THOR數據集來評估 LaMMA-P 的有效性。MAT-THOR 基準涵蓋了在家庭場景下多機器人協作完成長時任務的多種情況,包括簡單的順序任務和復雜的并行任務,模擬真實家庭環境中的多樣挑戰。實驗在不同數量機器人(包括 2 臺及更多)和不同任務復雜度組合下進行,并將 LaMMA-P 與當前最新的多機器人任務規劃方法SMART-LLM進行了對比。實驗從性能對比模塊消融可視化分析三個方面系統展示了 LaMMA-P 的優勢。
1. 性能對比
LaMMA-P 在任務成功率、效率以及機器人利用率等多個核心指標上均大幅領先當前最優方法SMART-LLM (GPT-4o)
關鍵發現:
- 長時任務成功率提升顯著:在 Compound 任務中,成功率提升至93%(領先 23%)。Complex 任務中,成功率提升至77%(領先 57%)。在 Vague Command 任務中,成功率達到45%,而現有方法完全失敗。
- 效率與機器人利用率全面提升:執行效率(Eff)在三類任務中分別提升26% ~ 48%。機器人利用率(RU)在 Complex 任務中提升22%,顯著優化多機器人協作調度。執行動作可行性(Exe)達到100%,保證任務分配后每一步都能順利完成。
- 復雜任務中優勢更加突出:隨著任務復雜度增加,LaMMA-P 優勢愈發明顯,表現出卓越的泛化和推理能力。Vague Command 場景中唯一能夠成功完成任務的方法,展現強大的自然語言理解和模糊指令解析能力。
2. 模塊消融分析
通過消融不同模塊,驗證了 LaMMA-P 各模塊對整體性能的關鍵貢獻:
關鍵發現:
- Precondition Identifier (P) 模塊顯著提升規劃成功率:移除 P 模塊后,Compound 任務成功率下降14%,Complex 任務下降9%。P 模塊幫助模型更好解析先決條件,提高子任務合理性和計劃成功率。
- PDDL Validator (V) 和 Problem Generator (G) 提高執行可靠性:去除 V 和 G 后,Complex 任務執行率下降至87%(相比完整系統的 100%)。V 模塊確保生成的 PDDL 問題格式正確,有效避免因不合規計劃導致的失敗。
- 完整模塊組合帶來最優性能:包含全部模塊的 LaMMA-P 實現最佳效果,Compound 任務成功率高達93%,Complex 任務成功率達77%。整體效率(Eff)提升最明顯,表明完整系統能夠優化任務分解、資源調度與計劃執行的全流程。
3. 可視化分析
通過 AI2-THOR 仿真環境可視化展示,直觀體現 LaMMA-P 優化的任務規劃效果:
關鍵發現:
- 并行與順序任務合理調度:在 Compound 任務中,多個機器人基于自身能力并行執行不同子任務,提高整體任務完成速度。通過智能順序安排,避免因場景擁堵或任務沖突導致的執行延遲。
- 復雜依賴關系下的精準協作:在 Complex 任務中,機器人能夠合理等待必要條件滿足(如等待抽屜被打開),體現對任務先后約束的精準把控。有效減少無效等待和重復移動,提高機器人整體利用率。
四.總結與展望
多機器人協同規劃新范式
LaMMA-P 的提出為多機器人長時任務協同規劃提供了全新的思路:它成功地將大模型的智能推理與經典 PDDL 規劃有機結合,彌補了各自的短板,顯著提升了復雜任務的自動化程度和執行可靠性。這一成果標志著異構多機器人自主協作邁出了關鍵一步。在未來工作中,研究團隊計劃進一步探索端到端的優化(例如使語言模型與規劃器聯結形成可微分閉環),以及引入多模態感知信息(如視覺、語音)來豐富指令理解,不斷提升系統在真實環境中的適應性和魯棒性。隨著代碼、數據集和交互式演示的開源發布,更多研究者和開發者可以基于 LaMMA-P 框架進行拓展創新,加速多機器人協同領域的技術演進??梢灶A見,LaMMA-P 所代表的 “大模型驅動規劃” 新范式有望在未來走出實驗室,應用到智能制造、家庭服務等眾多場景,推動多機器人系統朝著更加高效、智能的方向發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.