99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

R2D2 利用 NVIDIA 研究中心工作流和 AI 模型,提升機器人移動和控制

0
分享至



歡迎閱讀首期“NVIDIA 機器人研究與開發摘要(R2D2)”。此技術博客系列將讓開發者和研究人員更深入地了解 NVIDIA 各個研究實驗室在物理 AI 和機器人領域的最新研究突破。

開發強大的機器人面臨著諸多重大挑戰,例如:

  • 數據稀缺:為 AI 模型生成多樣的真實世界訓練數據。
  • 適應性:確保解決方案能夠在各種不同類型的機器人和環境中通用,并適應動態、不可預測的場景。
  • 集成性:有效地將移動能力、操作能力、控制能力和推理能力結合起來。

我們通過在自身平臺上經過驗證的先進研究來應對這些挑戰。我們的方法將前沿研究與工程工作流相結合,并在我們的 AI 和機器人平臺(包括NVIDIA OmniverseCosmosIsaac SimIsaac Lab)上進行測試。最終生成的模型、策略和數據集可作為研究人員和開發者社區的可定制參考,以適應特定的機器人開發需求。我們期待分享我們的研究成果,共同構建機器人技術的未來。

在本期 R2D2 中,您將了解以下機器人移動及全身控制的工作流及模型,以及它們如何應對機器人導航、移動和控制方面的關鍵挑戰:

  • MobilityGen:基于仿真的工作流,利用 Isaac Sim 快速生成大型合成運動數據集,用于為不同形態和環境下的機器人構建模型,以及測試機器人在新環境中的導航能力。與真實世界的數據采集相比,該工作流可降低成本并節省時間。
  • COMPASS(Cross-embOdiment Mobility Policy via ResiduAl RL and Skill Synthesis):一種用于開發跨形態移動策略的工作流,可借助 Isaac Lab 實現微調,并支持零樣本從仿真到現實的部署。
  • HOVER(Humanoid Versatile Controller):Isaac Lab 中用于人形機器人多種控制模式的工作流和統一全身控制通用策略。
  • ReMEmbR(適用于具身機器人的檢索增強內存):一種支持機器人使用 LLMs、VLMs 和 RAG(檢索增強生成)進行推理并采取移動行動的工作流。

NVIDIA 機器人移動工作流

和 AI 模型

包括人形機器人、四足機器人和自主移動機器人(AMR)等在內的移動機器人,越來越多地應用于各種不同的環境中,這對強大的導航系統提出了更高的要求,需要能夠支持在已繪制地圖和未知的環境中安全運行,同時避開障礙物并減少停機時間。目前的導航軟件在適應性方面存在困難,因為不同類型的機器人(例如,自主移動機器人與人形機器人)的算法差異很大,并且需要針對環境變化進行大量的微調,這增加了工程復雜性并限制了可擴展性。

NVIDIA 研究中心通過開發由 AI 驅動的端到端基礎模型、高效的數據生成流程以及支持零樣本部署的訓練工作流來應對這些挑戰,使機器人無需依賴昂貴的傳感器即可在雜亂的空間中導航。



圖 1. 移動工作流包括三個主要步驟,即數據生成、在生成的數據上訓練和微調模型,以及在對真實機器人進行零樣本部署之前對模型進行測試

用于數據生成的 MobilityGen

MobilityGen 工作流借助 NVIDIA Isaac Sim,為包括人形機器人、四足機器人和輪式機器人在內的移動機器人生成合成運動數據。您可以使用這些數據來訓練和測試機器人的移動模型以及感知算法,從而解決訓練機器人時的數據稀缺問題。

MobilityGen 通過以下方式幫助增加數據集的多樣性:

  • 添加動態對象
  • 添加機器人動作數據
  • 結合人類演示數據
  • 增強數據(例如光照條件)

MobilityGen 提供真實數據的形式包括占用地圖、位姿信息、速度信息、RGB 圖像、深度圖像和分割圖像,以及可定制的動作和渲染數據。它支持的數據采集方法包括鍵盤或游戲手柄遠程操作,以及自動隨機動作或可定制的路徑規劃。

通過解決數據稀缺問題,MobilityGen 增強了集成機器人堆棧的感知能力和移動基礎。通過 NVIDIA 深度學習培訓中心(DLI)的免費自學課程,了解更多關于 MobilityGen 的信息,以及如何使用遠程操作為人形機器人 Unitree H1 生成運動和導航數據集。



圖 2. 機器人移動合成數據生成包括四個主要步驟:在仿真中構建或導入環境、導入機器人模型、在仿真環境中移動機器人并記錄軌跡,最后渲染數據以用于訓練和測試

用于跨形態移動策略的 COMPASS

COMPASS 是一個用于開發跨形態移動策略的工作流。它提供了一種可通用的端到端移動工作流和模型,能夠在多種機器人形態下實現零樣本從仿真到現實的部署。其目標是解決由于機器人專家開發和測試周期緩慢而導致的可擴展性問題。

COMPASS 將基于視覺的端到端模仿學習(IL)與 Isaac Lab 中的 X-Mobility 的殘差強化學習(RL)以及策略蒸餾方法相結合,以擴展到不同的機器人平臺。雖然基于模仿學習的 X-Mobility 策略是在使用 MobilityGen 生成的特定形態數據上進行預訓練的,但 COMPASS 的通用策略對于不同形態的機器人可實現高出 5 倍的成功率。這使得不同的機器人能夠使用統一的策略在復雜環境中高效導航。它還為用戶提供了針對特定形態和環境微調策略的靈活性和便利性。



圖 3. COMPASS 工作流

該工作流的第一階段使用基于模仿學習的方法進行世界建模,以訓練針對環境狀態與行動的移動性“常識”表征。這類“常識”的具體體現包括對世界動態變化的理解、障礙物探測與規避、路徑規劃,以及環境感知能力等。

第二階段使用殘差強化學習,將第一階段中基于模仿學習的策略逐步具體化為特定的專家策略。第三階段使用每個專家策略的數據,并通過策略蒸餾將它們合并為一個跨形態模型。通過這種方式,每個專家的專業知識被融入到最終的蒸餾策略中,從而提高不同平臺的適應性。

COMPASS 實現了零樣本多機器人交互,展示了機器人在不同環境中的功能。它還可用于連接 loco-manipulation 控制器,以執行 loco-manipulation 相關的任務。

COMPASS 通過解決跨形態的通用性問題,增強了集成式機器人堆棧的移動性基礎。

用于人形機器人全身控制的 HOVER

到目前為止,我們已經了解了使機器人能夠從一個點移動到目標位置的移動策略。但對于穩健的運動來說,這還不夠,我們還需要實現平衡和全身控制,以確保安全、平穩的移動。HOVER 的目標就是為此提供一個參考工作流。

傳統上,人形機器人需要不同的控制模式來執行各種任務,例如用于導航的速度追蹤和用于桌面操作的上半身關節追蹤。HOVER 是一個在 Isaac Lab 中訓練的工作流,它將這些控制模式整合為人形機器人的統一策略。對于使用本文中所提到的其他工作流的機器人,也可以使用其他控制器來替代 HOVER。

通過將復雜的人形機器人的多個運動部件集成到一個統一的神經全身控制器中,HOVER 增強了集成機器人堆棧的基控制礎。HOVER(Humanoid Versatile Controller)是一種多模式策略蒸餾框架,可以將多種控制模式統一到單個策略中,實現了它們之間的無縫過渡。通過強化學習對 oracle 策略進行訓練,并模仿人類運動數據,然后使用策略蒸餾流程將技能從 oracle 策略轉移到通用策略。

HOVER 代碼還包括一個在 Unitree H1 機器人上使用的部署代碼示例,使用戶能夠使用機器人來復制下圖中展示的運動和穩定性。



圖 4. HOVER 策略在 Isaac Lab 中進行訓練、在 MuJoCo 中測試并部署到真實的機器人上;(左)使用 MuJoCo 在仿真中進行測試,(右)部署到真實機器人



圖 5. HOVER 策略在執行手臂動作的同時保持平衡

用于機器人推理的 ReMEmbR

到目前為止,我們探討的工作流解決了數據集創建、移動策略以及人形機器人的全身控制問題。為了通過對話式智能實現完全的自主移動,我們還需要集成機器人的推理和認知能力。機器人如何記住在環境中看到的內容,并根據用戶輸入采取相應的行動呢?

ReMEmbR 是一種將大語言模型、視覺語言模型和檢索增強生成技術相結合的工作流,使機器人能夠使用長時間記憶動作,進行推理、回答問題并在大范圍內執行導航操作。它可以充當具身機器人的“記憶”,有助于基于感知的問答和語義動作執行。



圖 6. ReMEmbR 工作流

ReMEmbR 可用于為本文中介紹的其他工作流提供輸入,將它們整合在一起,以幫助解決機器人移動性的復雜問題。我們還發布了用于評估的 NaVQA 數據集(Navigation Visual Question Answering),其中包含具有各種輸出類型的空間、時間和描述性問題的示例。



圖 7. MobilityGen、ReMEmbR、COMPASS 和 HOVER 四個工作流相結合

通過利用大語言模型和視覺語言模型的強大功能來解決推理問題,ReMEmbR 強化了基于 AI 的集成機器人堆棧的推理和適應能力。

生態系統應用情況

人形機器人、倉庫自動化和自主系統領域的領先機構正在采用 NVIDIA 的研究工作流,以加速開發,并在可擴展性和適應性方面取得突破。

UCR(Under Control Robotics)集成了 X-Mobility,以引導其機器人 Moby 順暢抵達目的地。事實證明,這套模塊化系統能夠靈活適配各類工業任務,比如數據采集、物料搬運,以及實現高風險作業的自動化操作。

研華科技(Advantech)、威剛科技(ADATA)和 Ubitus 合作,采用 ReMEmbR 技術,使機器人能夠依據大量的觀察進行推理并采取行動。

開始使用

想要了解更多信息,請探索以下資源:

MobilityGen

  • GitHub:
  • https://github.com/NVlabs/MobilityGen
  • DLI 教程:
  • https://learn.nvidia.com/courses/course-detail?course_id=course-v1:DLI+S-OV-37+V1

COMPASS

  • 項目網站:
  • https://nvlabs.github.io/COMPASS/
  • 論文:
  • https://arxiv.org/pdf/2502.16372
  • GitHub:
  • https://github.com/NVlabs/COMPASS

X-Mobility

  • 項目網站:
  • https://nvlabs.github.io/X-MOBILITY/
  • 論文:
  • https://arxiv.org/abs/2410.17491
  • GitHub:
  • https://github.com/NVlabs/X-MOBILITY

HOVER

  • 項目網站:
  • https://hover-versatile-humanoid.github.io/
  • 論文:
  • https://arxiv.org/abs/2410.21229
  • GitHub:
  • https://github.com/NVlabs/HOVER/

ReMEmbR 和 NaVQA 數據集

  • 項目網站:
  • https://nvidia-ai-iot.github.io/remembr/
  • 論文:
  • https://arxiv.org/abs/2409.13682
  • GitHub:
  • https://github.com/NVIDIA-AI-IOT/remembr
  • 借助 ReMEmbR 利用生成式 AI 賦予機器人推理與行動能力

這篇文章是“NVIDIA 機器人研究與開發摘要(R2D2)”的一部分,旨在讓開發者更深入地了解 NVIDIA 研究中心在物理 AI 和機器人應用方面的最新突破。

了解 NVIDIA 研究中心的更多信息:

https://www.nvidia.cn/research/

立即注冊 NVIDIA 機器人基礎課程,即刻開始您的機器人技術之旅:

https://www.nvidia.com/en-us/learn/learning-path/robotics/

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中國留英博士生被法院判處終身監禁

中國留英博士生被法院判處終身監禁

華人生活網
2025-06-20 03:40:54
7月開始:銀行存款利率調整!存1萬元,一年可以有多少利息?

7月開始:銀行存款利率調整!存1萬元,一年可以有多少利息?

詩詞中國
2025-06-20 13:23:08
怪不得國家要叫停國補,原來國家萬億補貼,成了一部分人的搖錢樹

怪不得國家要叫停國補,原來國家萬億補貼,成了一部分人的搖錢樹

史行途
2025-06-19 23:38:30
廣東留英博士性侵多人被判無期徒刑 英檢察官:接獲新報案將追加起訴

廣東留英博士性侵多人被判無期徒刑 英檢察官:接獲新報案將追加起訴

封面新聞
2025-06-20 12:47:02
打了6天,大批中國同胞逃離,以色列援軍已到齊,37國公開選邊站

打了6天,大批中國同胞逃離,以色列援軍已到齊,37國公開選邊站

吳欣純Deborah
2025-06-19 14:23:10
以總理:可自行襲擊福爾多核設施 消息人士:特朗普已討論使用鉆地炸彈的后勤保障

以總理:可自行襲擊福爾多核設施 消息人士:特朗普已討論使用鉆地炸彈的后勤保障

紅星新聞
2025-06-20 14:37:28
這樣看程瀟,雖奶瀟奶瀟的,但也就一般般吧!

這樣看程瀟,雖奶瀟奶瀟的,但也就一般般吧!

皮蛋兒電影
2025-06-20 13:33:17
以色列首都CBD被炸,14架飛機載美軍事裝備抵達以色列 特朗普兩周內決定是否打伊朗

以色列首都CBD被炸,14架飛機載美軍事裝備抵達以色列 特朗普兩周內決定是否打伊朗

大風新聞
2025-06-20 08:48:34
狼性?網傳某OS工作群內,領導要求必須凌晨下班,誰想準時下班誰就辭職

狼性?網傳某OS工作群內,領導要求必須凌晨下班,誰想準時下班誰就辭職

可達鴨面面觀
2025-06-20 10:04:55
莫言:喜歡把家里打掃得很干凈的人,表面整潔,實則暴露了人生真相......

莫言:喜歡把家里打掃得很干凈的人,表面整潔,實則暴露了人生真相......

不二大叔
2025-06-19 21:44:53
A股:做好準備吧!最后一次提醒散戶,下周周一還有更大的考驗!

A股:做好準備吧!最后一次提醒散戶,下周周一還有更大的考驗!

悠然安晴
2025-06-20 12:11:32
拉布布崩盤!黃牛從“狂賺30倍”到“跪求接盤”,只用了24小時

拉布布崩盤!黃牛從“狂賺30倍”到“跪求接盤”,只用了24小時

溫讀史
2025-06-19 17:46:45
趙麗穎做夢也沒想到,自己拋棄的前夫馮紹峰,竟成了別人手中的寶

趙麗穎做夢也沒想到,自己拋棄的前夫馮紹峰,竟成了別人手中的寶

簡讀視覺
2025-06-20 00:30:56
地球上明明有吃塑料的蟲子,為什么沒有普及?

地球上明明有吃塑料的蟲子,為什么沒有普及?

怪羅
2025-06-18 22:17:17
網傳京東創始人劉強東視察工作時入住四季酒店,點外賣后豪氣給了騎手1000元小費!還親切地摟著騎手合影

網傳京東創始人劉強東視察工作時入住四季酒店,點外賣后豪氣給了騎手1000元小費!還親切地摟著騎手合影

和訊網
2025-06-19 18:11:44
熱搜!懷集水災后趙一鳴零食店遭哄搶?當地政府:相關單位正在核實

熱搜!懷集水災后趙一鳴零食店遭哄搶?當地政府:相關單位正在核實

極目新聞
2025-06-20 11:25:58
湖南烈犬咬人后續!狗已被打死,主人等待處置,受害者大面積植皮

湖南烈犬咬人后續!狗已被打死,主人等待處置,受害者大面積植皮

鋭娛之樂
2025-06-19 11:45:54
迎著以色列的炮聲,伊朗女性勇敢摘下頭巾

迎著以色列的炮聲,伊朗女性勇敢摘下頭巾

通往遠方的路
2025-06-20 08:49:19
中央巡視期間,70歲的江西原副省長被查,曾執掌財政廳7年

中央巡視期間,70歲的江西原副省長被查,曾執掌財政廳7年

南方都市報
2025-06-19 23:12:14
支持神棍的,不是蠢貨就是壞逼

支持神棍的,不是蠢貨就是壞逼

難得君
2025-06-20 11:34:36
2025-06-20 16:19:00
NVIDIA英偉達中國 incentive-icons
NVIDIA英偉達中國
英偉達(中國)官方賬號
3098文章數 1379關注度
往期回顧 全部

科技要聞

余承東:HarmonyOS 6啟動開發者Beta

頭條要聞

伊朗10名核科學家被"特殊武器"暗殺 以高官披露細節

頭條要聞

伊朗10名核科學家被"特殊武器"暗殺 以高官披露細節

體育要聞

印城最穩之人!西卡雙手隔扣杰威霸氣側漏

娛樂要聞

“小鞏俐”周顯欣,如今49歲模樣大變

財經要聞

寶能汽車接盤威馬?“正交接資產”

汽車要聞

五項訂車禮/四款車型 一汽奧迪A5L正式開啟預售

態度原創

本地
游戲
教育
藝術
時尚

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

《劍星》聯動《妮姬》新官方圖:伊芙大雷翹臀太吸睛!

教育要聞

小學幾何競賽題:求面積,燕尾模型

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

等你到了50歲,夏季穿衣服牢記這3個原則,輕松告別油膩感

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 邵东县| 兴安盟| 那曲县| 鲁山县| 台南市| 黔南| 丹东市| 安义县| 武城县| 大足县| 镇康县| 黄陵县| 安庆市| 高安市| 茂名市| 甘洛县| 旬邑县| 吴堡县| 焦作市| 曲阜市| 四川省| 宾阳县| 兴山县| 昌黎县| 基隆市| 青川县| 柳州市| 东阳市| 大洼县| 商洛市| 维西| 新泰市| 文化| 乡宁县| 浦北县| 峨眉山市| 历史| 灌阳县| 肃宁县| 清苑县| 乐至县|