99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

面對雜亂場景也能從容應對,DexSinGrasp基于強化學習實現物體分離與抓取統一策略

0
分享至

本研究提出DexSinGrasp,一種基于強化學習的統一框架,整合物體分離與抓取任務,實現靈巧手在雜亂環境中的高效操作。該方法通過推移、滑動等動作動態調整障礙物布局,結合課程學習與策略蒸餾提升策略泛化能力,并顯著增強仿真到現實的遷移效果。實驗驗證其在多場景下均優于傳統方法,未來將拓展至更復雜動態環境下的多形態物體操作。


論文標題: DexSinGrasp: Learning a Unified Policy for Dexterous Object Singulation and Grasping in Cluttered Environments 論文鏈接: https://arxiv.org/abs/2504.04516 代碼鏈接: https://github.com/davidlxu/DexSinGrasp 項目主頁: https://nus-lins-lab.github.io/dexsingweb/

在物流倉庫、生產線或家庭場景中,機器人常常需要在大量雜亂擺放的物體中高效地抓取目標。

在這些場景中,如果使用機械夾爪,由于其自由度有限、靈活性不足,需要多次對場景進行操作;而高自由度的靈巧手雖然具有潛在優勢,但因控制復雜和訓練難度大,在密集遮擋與復雜排列場景下往往表現不佳。

現有方法常采用先分離、后抓取的策略,存在策略切換不夠靈活,執行效率低下的問題。 為解決這一挑戰,來自新加坡國立大學的邵林團隊提出了 DexSinGrasp——一種基于強化學習的統一策略,通過整合物體分離與抓取任務,令靈巧手在雜亂環境中能夠自適應調整分離與抓取策略,顯著提高抓取成功率和操作效率。該項研究已投稿至 IROS 2025。

為了讓機器人在多變的雜亂環境中高效分離物體并抓取目標,DexSinGrasp 提出了「統一策略」的設計。該方法通過強化學習構建了一體化的策略框架,實現了「分離—抓取」動作的無縫銜接。該項研究的主要貢獻有:

  • 統一強化學習策略:提出一種統一的強化學習策略,實現靈巧手在雜亂環境中對物體的有效分離和抓取。

  • 課程學習與策略蒸餾:融入雜亂環境課程學習以提升不同場景下的策略性能,并通過策略蒸餾獲得適用于實際部署的視覺抓取策略。

  • 多難度抓取任務設計:設計一系列不同難度與排列的雜亂抓取任務,通過大量實驗驗證所提方法的高效性與有效性。


一、方法 1.1 統一強化學習策略

DexSinGrasp 的核心在于構建一個統一的策略框架,引入分離獎勵項,將「分離障礙」、「抓取目標」整合為一個連續的動作決策過程,充分利用了分離與抓取融合的優勢,避免傳統多階段方法中各模塊間效率低下和動作銜接不暢的問題。為此,我們設計了一個分段式獎勵函數,其關鍵組成包括:


  • 接近獎勵:獎勵項 引導手掌和手指在初始階段向目標物體靠近,從而確保機器人迅速定位目標。

  • 抬升與目標對齊獎勵:在目標接觸后,獎勵項 鼓勵機器人將物體抬升至預設位置,實現準確對齊。

  • 分離獎勵:通過獎勵項 ,使機器人在抓取過程中主動推動、滑動或輕推周圍障礙物,從而為抓取創造足夠空間。

獎勵函數依據手掌與手指到目標物體的距離 來自動轉換,從「接近」階段逐步過渡到「抓取」階段,使整個過程更加平滑和高效。該統一策略不僅提升了訓練樣本的利用效率,還使機器人能根據實時場景動態選擇微調指尖、輕推障礙或直接抓取,從而在雜亂環境下實現穩定的抓取操作。

1.2 雜亂環境課程學習

在高度雜亂的場景中直接訓練機器人往往容易陷入局部最優,導致成功率低下。為此,我們引入了「雜亂環境課程學習」的機制,具體包括:

  • 任務分級設計:從最簡單的單目標抓取任務開始,逐步引入障礙物。我們設計了不同難度的任務,例如:

    • 密集排列任務:用 D-4、D-6、D-8 表示,不同數字代表環境中障礙物數量的遞增;

    • 隨機排列任務:用 R-4、R-6、R-8 表示,以驗證策略在非規則分布場景下的泛化能力。

  • 循序漸進訓練:先在障礙物較少且排列較規則的環境中訓練出初步策略,然后逐步過渡到障礙物數量更多、排列更隨機的復雜場景。這樣的訓練策略能顯著提高策略的穩定性和泛化性能,確保機器人在極端密集的環境下也能有效分離并抓取目標。


1.3 教師—學生策略蒸餾

在仿真環境中,我們能夠利用精確的物體位置、力反饋等特權信息訓練出高性能的教師策略。但在真實場景中,這些信息難以獲取,為此我們設計了教師—學生策略蒸餾方案:

  • 教師策略:利用仿真中豐富的特權信息訓練出性能優異的策略,能夠精細地控制物體的分離和抓取動作。

  • 數據采集與行為克隆:通過教師策略生成大量示范數據(包括視覺觀測、點云數據以及動作指令),并采用行為克隆的方法訓練出只依賴攝像頭采集的點云和機器人自感知數據的學生策略。這樣,在真實環境中,機器人無需額外傳感器信息也能保持高成功率,完成從仿真到實機的平滑遷移。

二、實驗結果

為了測試 DexSinGrasp 策略在分離抓取時的有效性和泛化性,以及雜亂環境課程學習的有效性,設計了三組實驗進行測試,并與兩種基線比較。

基線 1 僅訓練了一個抓取策略,沒有鼓勵對周圍物體進行分離。基線 2 將分離和抓取策略分開且分階段進行。

評價指標為抓取成功率(SR)和平均步數(AS)。抓取成功率越高,說明策略的有效性越高,平均步數越少,說明策略的效率越高。

實驗 1

對教師策略和學生策略在不同數量障礙的緊密排列進行測試,證明了 DexSinGrasp 的有效性和高效率。圖示是教師策略在密集擺放模式下障礙物數量為 4、6、8 時的仿真演示。



實驗 2

對教師策略和學生策略在不同數量障礙的隨機排列進行測試,結果證明了 DexSinGrasp 在隨機物體擺放下也可以實現成功分離抓取,對不同的場景有一定泛化性。圖示是教師策略在隨機擺放模式下障礙物數量為 4、6、8 時的仿真演示。



實驗 3

對雜亂環境課程學習的方式進行測試。我們嘗試了無課程學習、先隨機排列再緊密排列的課程學習,以及先緊密排列再隨機排列的課程學習的訓練模式。


我們發現,無課程學習訓練的各個策略中,隨機排列的任務表現不佳;先隨機排列再緊密排列的課程學習獲得的各個策略中,緊密排列的任務表現不佳;而先緊密排列再隨機排列的課程學習在不同的任務上均取得了不錯的成功率,證實了所提出的課程學習機制在不同場景下的有效性。

此外,研究團隊還在實機平臺上進行了驗證。使用 uFactory xArm6 搭載 LEAP 手,并配備兩臺 Realsense RGB-D 攝像頭以進行實時點云數據融合與濾波處理。圖示為實機實驗中對密集與隨機擺放的 4、6、8 個物體場景下成功分離與抓取的演示。實驗表明,經過教師—學生策略蒸餾后的視覺策略在實際操作中也能有效完成雜亂環境的有效分離與抓取。


三、總結

研究團隊所提出的 DexSinGrasp 是一種基于強化學習的統一框架,通過整合物體分離與抓取任務,實現了靈巧手在雜亂環境中的高效操作。

該方法突破以往直接抓取或多階段分割的策略,利用推移、滑動等動作在抓取過程中直接調整障礙物布局,結合環境復雜度遞進式的雜亂環境課程學習與教師—學生策略蒸餾技術,有效提升視覺策略的泛化能力與仿真到現實的遷移效果。

實驗表明,該方法在多種測試場景中展現出優于傳統方法的抓取成功率和操作效率。未來研究將拓展至動態復雜場景下的多形態物體操作,增強抗干擾能力,進一步提高系統在非結構化環境中的泛化性與適應性。

作者:潘銘杰、張繼耀 來源:公眾號【北京大學前沿計算研究中心】

llustration From IconScout By IconScout Store

-The End-

本周上新!

掃碼觀看!

“AI技術流”原創投稿計劃

TechBeat是由將門創投建立的AI學習社區(www.techbeat.net)。社區上線600+期talk視頻,3000+篇技術干貨文章,方向覆蓋CV/NLP/ML/Robotis等;每月定期舉辦頂會及其他線上交流活動,不定期舉辦技術人線下聚會交流活動。我們正在努力成為AI人才喜愛的高質量、知識型交流平臺,希望為AI人才打造更專業的服務和體驗,加速并陪伴其成長。

投稿內容

// 最新技術解讀/系統性知識分享 //

// 前沿資訊解說/心得經歷講述 //

投稿須知

稿件需要為原創文章,并標明作者信息。

我們會選擇部分在深度技術解析及科研心得方向,對用戶啟發更大的文章,做原創性內容獎勵

投稿方式

發送郵件到

melodybai@thejiangmen.com

或添加工作人員微信(yellowsubbj)投稿,溝通投稿詳情;還可以關注“將門創投”公眾號,后臺回復“投稿”二字,獲得投稿說明。

關于我“門”

將門是一家以專注于數智核心科技領域新型創投機構,也是北京市標桿型孵化器。 公司致力于通過連接技術與商業,發掘和培育具有全球影響力的科技創新企業,推動企業創新發展與產業升級。

將門成立于2015年底,創始團隊由微軟創投在中國的創始團隊原班人馬構建而成,曾為微軟優選和深度孵化了126家創新的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投后服務,歡迎發送或者推薦項目給我“門”:

bp@thejiangmen.com


點擊右上角,把文章分享到朋友圈

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
扁擔女孩高考成績出來了,不是網上那些分數,還是讓她自己公布吧

扁擔女孩高考成績出來了,不是網上那些分數,還是讓她自己公布吧

八斗小先生
2025-06-25 18:18:21
莆田男子花90萬娶妻后續:女主澄清,指控男方房事,逃婚緣由公布

莆田男子花90萬娶妻后續:女主澄清,指控男方房事,逃婚緣由公布

娜烏和西卡
2025-06-25 12:51:52
9.3閱兵,大陸邀請國民黨抗戰老兵觀禮,臺軍頭子顧立雄坐不住了

9.3閱兵,大陸邀請國民黨抗戰老兵觀禮,臺軍頭子顧立雄坐不住了

DS北風
2025-06-25 18:04:26
iPhone 17 Pro新機首次亮相,這設計變順眼了!

iPhone 17 Pro新機首次亮相,這設計變順眼了!

科技堡壘
2025-06-25 16:21:24
592分"扁擔女孩"分數公布?二流高中飛不出金鳳凰?起跑線就輸了

592分"扁擔女孩"分數公布?二流高中飛不出金鳳凰?起跑線就輸了

深析古今
2025-06-25 14:38:26
河南人注意!多地強降水集中在今夜

河南人注意!多地強降水集中在今夜

極目新聞
2025-06-25 19:13:07
無錫太強了!網傳江蘇高考理科狀元又在無錫,數據遙遙領先全省…

無錫太強了!網傳江蘇高考理科狀元又在無錫,數據遙遙領先全省…

火山詩話
2025-06-25 13:41:36
又一個經濟奇跡——孟加拉國

又一個經濟奇跡——孟加拉國

古老板的老巢
2025-06-24 23:41:45
曝小米前總監馮德兵出軌!200份“包養合同”,親密照曝光太炸裂

曝小米前總監馮德兵出軌!200份“包養合同”,親密照曝光太炸裂

180視角
2025-06-25 08:59:42
高考611分女生體檢不合格恐無法入學,守護她的求學夢也是守護教育初心

高考611分女生體檢不合格恐無法入學,守護她的求學夢也是守護教育初心

極目新聞
2025-06-25 11:56:48
42歲快遞員陪女兒高考,順手考了680分,北大:24年前就聯系過他

42歲快遞員陪女兒高考,順手考了680分,北大:24年前就聯系過他

五元講堂
2025-06-24 10:14:04
人民日報痛批懶政!嚴查違規吃喝,不該連“下班約飯”都成罪?

人民日報痛批懶政!嚴查違規吃喝,不該連“下班約飯”都成罪?

宏哥談商道
2025-06-24 19:00:02
顧客自取吸管,茶顏悅色店員直接扔掉整桶吸管。。

顧客自取吸管,茶顏悅色店員直接扔掉整桶吸管。。

4A廣告網
2025-06-24 09:59:01
從南京到烏魯木齊:日本留學生30天搭車游中國,遇17位司機僅1人拒絕

從南京到烏魯木齊:日本留學生30天搭車游中國,遇17位司機僅1人拒絕

互聯網大觀
2025-06-25 11:09:02
如何操縱價值21億美元的B-2轟炸機?美退役中將揭秘:吃飯無鹽無味,憑記憶加油

如何操縱價值21億美元的B-2轟炸機?美退役中將揭秘:吃飯無鹽無味,憑記憶加油

紅星新聞
2025-06-25 13:06:12
霍啟仁曼谷大婚,郭晶晶攜20萬愛馬仕出席,并直言終于有妯娌了

霍啟仁曼谷大婚,郭晶晶攜20萬愛馬仕出席,并直言終于有妯娌了

史書無明
2025-06-25 08:26:46
伊朗稱該國核設施在美國空襲中“嚴重受損”

伊朗稱該國核設施在美國空襲中“嚴重受損”

環球網資訊
2025-06-25 20:15:26
打虎!海南省委常委、秘書長倪強任上落馬!

打虎!海南省委常委、秘書長倪強任上落馬!

上觀新聞
2025-06-25 16:18:25
小米前總監被曝200份包養協議,舔、口、喝都有,陪72小時給100萬

小米前總監被曝200份包養協議,舔、口、喝都有,陪72小時給100萬

社會醬
2025-06-25 17:13:35
突傳噩耗!香港知名導演墜樓身亡,身首異處,和妻子恩愛半世紀

突傳噩耗!香港知名導演墜樓身亡,身首異處,和妻子恩愛半世紀

晉哥說電影
2025-06-25 13:49:11
2025-06-25 21:15:00
將門創投 incentive-icons
將門創投
加速及投資技術驅動型初創企業
2156文章數 591關注度
往期回顧 全部

科技要聞

小米YU7已下線500輛展車 26日前運往全國

頭條要聞

與汪峰節目牽手引猜測 寧靜談擇偶標準:他不是我的菜

頭條要聞

與汪峰節目牽手引猜測 寧靜談擇偶標準:他不是我的菜

體育要聞

山西太原大媽,在NBA闖出一片天

娛樂要聞

向佐接機郭碧婷,全程無交流像陌生人

財經要聞

免除蘇寧易購5億債務的神秘人是誰?

汽車要聞

售14.99萬/限量200臺 別克昂科威S新增丹霞紅內飾

態度原創

藝術
教育
親子
手機
數碼

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

暑假趕緊讓孩子讀這些范文

親子要聞

終于見面啦!!!!原創dy:@辣炒年糕

手機要聞

首銷價 299 元,vivo X Fold5 折疊屏手機行業首發單內屏寶

數碼要聞

打開京東搜“小米新品0626” 有機會搶先體驗小米AI眼鏡

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 淳安县| 成武县| 广丰县| 连城县| 涟水县| 吉木萨尔县| 安顺市| 建湖县| 五河县| 庄河市| 鹰潭市| 乐东| 鸡东县| 垦利县| 兴隆县| 新乡市| 镇雄县| 台北县| 泗水县| 禹州市| 虞城县| 汕尾市| 忻城县| 固阳县| 霍林郭勒市| 若羌县| 天津市| 阿鲁科尔沁旗| 郎溪县| 漳浦县| 都昌县| 抚顺县| 阿图什市| 柏乡县| 玛曲县| 道孚县| 大关县| 古丈县| 淄博市| 同心县| 贺州市|