99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

面向科學(xué)任務(wù)、自動(dòng)評(píng)估多模態(tài)智能體評(píng)測(cè)環(huán)境ScienceBoard來(lái)了

0
分享至



近年來(lái),隨著人工智能從感知智能向決策智能演進(jìn),世界模型 (World Models)逐漸成為機(jī)器人領(lǐng)域的重要研究方向。世界模型旨在讓智能體對(duì)環(huán)境進(jìn)行建模并預(yù)測(cè)未來(lái)狀態(tài),從而實(shí)現(xiàn)更高效的規(guī)劃與決策。

與此同時(shí),具身數(shù)據(jù)也迎來(lái)了爆發(fā)式關(guān)注。因?yàn)槟壳熬呱硭惴ǜ叨纫蕾囉诖笠?guī)模的真實(shí)機(jī)器人演示數(shù)據(jù),而這些數(shù)據(jù)的采集過(guò)程往往成本高昂、耗時(shí)費(fèi)力,嚴(yán)重限制了其可擴(kuò)展性和泛化能力。盡管仿真平臺(tái)提供了一種相對(duì)低成本的數(shù)據(jù)生成方式,但由于仿真環(huán)境與真實(shí)世界之間存在顯著的視覺(jué)和動(dòng)力學(xué)差異(即sim-to-realgap),導(dǎo)致在仿真中訓(xùn)練的策略難以直接遷移到真實(shí)機(jī)器人上,從而限制了其實(shí)際應(yīng)用效果。因此如何高效獲取、生成和利用高質(zhì)量的具身數(shù)據(jù),已成為當(dāng)前機(jī)器人學(xué)習(xí)領(lǐng)域的核心挑戰(zhàn)之一。

近日,地平線、極佳科技與中國(guó)科學(xué)院自動(dòng)化研究所等單位提出RoboTransfer,基于擴(kuò)散模型的視頻生成框架,可以用于擴(kuò)充機(jī)器人策略模型的訓(xùn)練數(shù)據(jù)。得益于合成數(shù)據(jù)的多樣性,下游策略模型能夠在新場(chǎng)景下取得 251% 的顯著提升,大幅提升策略模型的泛化性,為具身智能的通用性與泛化性奠定了堅(jiān)實(shí)的基礎(chǔ)。



  • 論文題目:
  • RoboTransfer:Geometry-Consistent Video Diffusionfor Robotic Visual Policy Transfer
  • 論文鏈接:
  • https://arxiv.org/pdf/2505.23171
  • 項(xiàng)目主頁(yè):
  • https://horizonrobotics.github.io/robot_lab/robotransfer/

模仿學(xué)習(xí)(Imitation Learning)已成為機(jī)器人操作領(lǐng)域的重要方法之一。通過(guò)讓機(jī)器人 “模仿” 專家示教的行為,可以在復(fù)雜任務(wù)中快速構(gòu)建有效的策略模型。然而,這類方法通常依賴大量高質(zhì)量的真實(shí)機(jī)器人演示數(shù)據(jù),而數(shù)據(jù)采集過(guò)程成本高、周期長(zhǎng),嚴(yán)重制約了其擴(kuò)展性和泛化能力。

為了解決上述問(wèn)題,本項(xiàng)工作提出了 RoboTransfer ,一種基于擴(kuò)散模型(diffusion model)的視頻生成框架,旨在實(shí)現(xiàn)高質(zhì)量的機(jī)器人操作場(chǎng)景數(shù)據(jù)合成。不同于傳統(tǒng)的仿真方法或現(xiàn)有生成模型,RoboTransfer 融合了多視角幾何信息,并對(duì)場(chǎng)景中的關(guān)鍵組成成分(如背景、物體屬性等)實(shí)現(xiàn)了顯式控制。具體而言,RoboTransfer 通過(guò)引入跨視角特征交互機(jī)制以及全局深度圖與法向圖作為條件輸入,確保生成視頻在多個(gè)視角下的幾何一致性。此外,該框架支持細(xì)粒度的編輯控制,例如更換背景、替換目標(biāo)物體等,從而能夠靈活地生成多樣化、結(jié)構(gòu)合理的視覺(jué)數(shù)據(jù)。

實(shí)驗(yàn)結(jié)果表明,RoboTransfer 能夠生成具有高幾何一致性和視覺(jué)質(zhì)量的多視角視頻序列。此外,使用 RoboTransfer 合成數(shù)據(jù)訓(xùn)練的機(jī)器人視覺(jué)策略模型,在標(biāo)準(zhǔn)測(cè)試任務(wù)中表現(xiàn)出顯著提升的性能:在更換前景物體的場(chǎng)景下取得了 33.3% 的成功率相對(duì)提升,在更具挑戰(zhàn)性的場(chǎng)景下(同時(shí)更換前景背景)更是達(dá)到了 251% 的顯著提升。



RoboTransfer 的整體框圖如下,為了在視頻生成過(guò)程中保證多視角之間的一致性,RoboTransfer 引入了多視角一致性建模機(jī)制,使得生成過(guò)程能夠聯(lián)合不同視角的信息進(jìn)行推理,從而提升生成結(jié)果的空間連貫性與視覺(jué)合理性。

此外,在控制條件的設(shè)計(jì)方面,RoboTransfer 通過(guò)將控制信號(hào)解耦為幾何信息與外觀(紋理)信息兩個(gè)部分,實(shí)現(xiàn)了對(duì)生成內(nèi)容的細(xì)粒度控制。具體來(lái)說(shuō),在幾何控制方面,采用深度圖(depth map)和表面法向圖(surface normal map)等具有強(qiáng)結(jié)構(gòu)約束的表示方式,來(lái)引導(dǎo)生成視頻中物體的三維空間結(jié)構(gòu),確保在不同視角下生成內(nèi)容的幾何一致性。而在外觀控制方面,模型利用參考背景圖像和目標(biāo)物體的參考圖像作為輸入條件,這些圖像經(jīng)過(guò)編碼后能夠有效保留原始場(chǎng)景的色彩、紋理以及上下文信息,從而在生成過(guò)程中維持物體外觀的細(xì)節(jié)還原能力。



在實(shí)驗(yàn)部分,RoboTransfer 證明可以通過(guò) real-to-real,以及 sim-to-real 兩種方式實(shí)現(xiàn)數(shù)據(jù)增廣,并訓(xùn)練下游的策略模型提升其性能。

  • real-to-real 數(shù)據(jù)增廣
  • 基于真機(jī)采集的真實(shí)視頻數(shù)據(jù),可從中提取結(jié)構(gòu)化信息作為控制條件,通過(guò)調(diào)整背景桌面與前景物體的控制參數(shù),實(shí)現(xiàn)新場(chǎng)景數(shù)據(jù)的合成。如下圖所示,左側(cè)為真實(shí)采集的數(shù)據(jù)及其對(duì)應(yīng)的結(jié)構(gòu)化信息,右側(cè)為合成結(jié)果,實(shí)驗(yàn)表明 RoboTransfer 能夠靈活地實(shí)現(xiàn)背景桌布的替換。







改變前景:下圖所示第一行為真機(jī)采集數(shù)據(jù),第二行為深度圖,第三行為法向圖,第四行為前景物體的控制條件,第五行為合成數(shù)據(jù),第六行為背景桌布控制條件。以下實(shí)驗(yàn)結(jié)果表明 RoboTransfer 可以實(shí)現(xiàn)對(duì)前景物體外表編輯的功能,豐富生成數(shù)據(jù)的多樣性,提升策略模型的訓(xùn)練質(zhì)量。





sim-to-real 數(shù)據(jù)增廣

RoboTransfer 不僅可以改變真機(jī)數(shù)據(jù)的前景和背景,還可以實(shí)現(xiàn)對(duì)仿真數(shù)據(jù)的重新渲染。利用仿真數(shù)據(jù)中的結(jié)構(gòu)化信息以及真實(shí)場(chǎng)景的物體和背景作為控制條件,RoboTransfer 可以將仿真數(shù)據(jù)的轉(zhuǎn)化為逼真的真實(shí)數(shù)據(jù),極大地降低 sim-to-real 之間的 gap,為通用機(jī)器人的訓(xùn)練提供了一個(gè)新的范式。以下是兩個(gè)不同的仿真場(chǎng)景重新渲染的實(shí)驗(yàn)結(jié)果,左側(cè)是疊碗,右側(cè)是放置杯子,其中第一行為仿真采集數(shù)據(jù),第二行為深度圖,第三行為法向圖,第四行為合成數(shù)據(jù),第五行為背景參考圖。





對(duì)比實(shí)驗(yàn)結(jié)果

與其他 SOTA 方法的對(duì)比可以發(fā)現(xiàn),RoboTransfer 在時(shí)序一致性以及多視角之間的一致性上都要顯著優(yōu)于其他方法。





定量實(shí)驗(yàn)的實(shí)驗(yàn)結(jié)果如下表所示,實(shí)驗(yàn)表明對(duì)于生成數(shù)據(jù)的前背景增廣可以顯著提升策略模型在新場(chǎng)景下的成功率,其中對(duì)于前背景完全改變的新場(chǎng)景,前背景的數(shù)據(jù)增廣能夠讓策略模型獲得 251% 的性能提升。



表 1 數(shù)據(jù)增廣對(duì)于策略模型在不同 setting 下的提升

總體來(lái)說(shuō),該方法構(gòu)建了數(shù)據(jù)處理流程,可以生成包含幾何和外觀控制條件的三元組數(shù)據(jù),以訓(xùn)練基于擴(kuò)散模型的機(jī)器人數(shù)據(jù)合成框架 RoboTransfer。實(shí)驗(yàn)和評(píng)估結(jié)果顯示,RoboTransfer 能夠生成具有多視角一致、幾何一致的數(shù)據(jù),并且可以根據(jù)參考圖像修改前景和背景紋理。生成的數(shù)據(jù)用于訓(xùn)練機(jī)器人操作策略,從而顯著提升了策略模型的泛化能力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
非法收受巨額財(cái)物!山西省長(zhǎng)治市人大常委會(huì)原副主任馬先明被決定逮捕

非法收受巨額財(cái)物!山西省長(zhǎng)治市人大常委會(huì)原副主任馬先明被決定逮捕

魯中晨報(bào)
2025-06-26 16:24:06
錯(cuò)換人生28年案開(kāi)庭!許敏身穿黑衣現(xiàn)身,姚策妻子被質(zhì)疑霸占房產(chǎn)

錯(cuò)換人生28年案開(kāi)庭!許敏身穿黑衣現(xiàn)身,姚策妻子被質(zhì)疑霸占房產(chǎn)

180視角
2025-06-26 12:48:47
崔永熙祝賀楊瀚森:你小子真長(zhǎng)臉,我全力恢復(fù)爭(zhēng)取與你賽場(chǎng)見(jiàn)

崔永熙祝賀楊瀚森:你小子真長(zhǎng)臉,我全力恢復(fù)爭(zhēng)取與你賽場(chǎng)見(jiàn)

雷速體育
2025-06-26 12:24:30
史可瑞士近照曝光!60歲住豪宅氣質(zhì)驚艷,混血兒子帥到炸裂

史可瑞士近照曝光!60歲住豪宅氣質(zhì)驚艷,混血兒子帥到炸裂

橙星文娛
2025-06-24 08:37:36
驚喜!外媒爆凱特病情反轉(zhuǎn)后,肯辛頓宮發(fā)布威爾士王妃最新消息!

驚喜!外媒爆凱特病情反轉(zhuǎn)后,肯辛頓宮發(fā)布威爾士王妃最新消息!

小嵩
2025-06-26 15:41:01
78年中央為張聞天、彭德懷一起舉行追悼會(huì),陳云:請(qǐng)推遲其中一人

78年中央為張聞天、彭德懷一起舉行追悼會(huì),陳云:請(qǐng)推遲其中一人

紅色先驅(qū)
2025-06-25 19:16:54
曼晚:在接近簽下姆貝烏莫后,曼聯(lián)還差兩筆引援打造理想陣容

曼晚:在接近簽下姆貝烏莫后,曼聯(lián)還差兩筆引援打造理想陣容

懂球帝
2025-06-26 20:07:15
小米營(yíng)銷能力太強(qiáng)了!強(qiáng)到令人恐懼

小米營(yíng)銷能力太強(qiáng)了!強(qiáng)到令人恐懼

牛斯克
2025-06-26 19:47:59
楊瀚森第16順位被選中!NBA高管:這是我見(jiàn)過(guò)的最瘋狂的選秀

楊瀚森第16順位被選中!NBA高管:這是我見(jiàn)過(guò)的最瘋狂的選秀

雷速體育
2025-06-26 10:25:29
掘記:除非楊瀚森真是年輕版約基奇 否則我搞不懂開(kāi)拓者在干嘛

掘記:除非楊瀚森真是年輕版約基奇 否則我搞不懂開(kāi)拓者在干嘛

直播吧
2025-06-26 10:36:32
冠心病去世的人越來(lái)越多?醫(yī)生勸告:天熱寧可喝冰水,也別吃6物

冠心病去世的人越來(lái)越多?醫(yī)生勸告:天熱寧可喝冰水,也別吃6物

泠泠說(shuō)史
2025-06-25 14:59:41
國(guó)家出手!大批醫(yī)院將退出醫(yī)保

國(guó)家出手!大批醫(yī)院將退出醫(yī)保

賽柏藍(lán)
2025-06-25 20:29:49
《長(zhǎng)安的荔枝》撤檔

《長(zhǎng)安的荔枝》撤檔

浙江之聲
2025-06-26 08:26:18
拒付52萬(wàn)酒席錢后續(xù),攤主女兒曬出每桌賬目,丟人丟到全國(guó)了

拒付52萬(wàn)酒席錢后續(xù),攤主女兒曬出每桌賬目,丟人丟到全國(guó)了

大魚(yú)簡(jiǎn)科
2025-06-17 08:55:03
淮安通過(guò)一批人事任免,張笑辭去副市長(zhǎng)職務(wù)

淮安通過(guò)一批人事任免,張笑辭去副市長(zhǎng)職務(wù)

魯中晨報(bào)
2025-06-26 18:40:01
巴黎航展盛況:空客拿下大批訂單,波音顆粒無(wú)收,中國(guó)C929成黑馬

巴黎航展盛況:空客拿下大批訂單,波音顆粒無(wú)收,中國(guó)C929成黑馬

小lu侃侃而談
2025-06-26 19:17:57
福建一男子彩禮花了90.8萬(wàn),老婆卻不見(jiàn)了,當(dāng)?shù)刈钚禄貞?yīng):組織十多次調(diào)解,男方已走司法途徑

福建一男子彩禮花了90.8萬(wàn),老婆卻不見(jiàn)了,當(dāng)?shù)刈钚禄貞?yīng):組織十多次調(diào)解,男方已走司法途徑

三湘都市報(bào)
2025-06-26 16:17:05
68歲王秉清,搞權(quán)色交易,退休后收受禮品

68歲王秉清,搞權(quán)色交易,退休后收受禮品

政知新媒體
2025-06-26 10:59:29
中國(guó)雄安集團(tuán)成立建設(shè)發(fā)展公司

中國(guó)雄安集團(tuán)成立建設(shè)發(fā)展公司

證券時(shí)報(bào)
2025-06-26 14:45:29
杜特爾特家族沒(méi)讓中國(guó)失望,大聲質(zhì)問(wèn)馬科斯,菲律賓為什么親美?

杜特爾特家族沒(méi)讓中國(guó)失望,大聲質(zhì)問(wèn)馬科斯,菲律賓為什么親美?

起喜電影
2025-06-26 18:47:05
2025-06-26 20:31:00
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
10725文章數(shù) 142346關(guān)注度
往期回顧 全部

科技要聞

奧特曼剛警告完 Meta就挖走OpenAI三名大將

頭條要聞

哈梅內(nèi)伊:伊朗給了美國(guó)一記耳光

頭條要聞

哈梅內(nèi)伊:伊朗給了美國(guó)一記耳光

體育要聞

蓄謀已久的開(kāi)拓者,就是最適合楊瀚森的球隊(duì)

娛樂(lè)要聞

倪妮,怎么突然下桌了?

財(cái)經(jīng)要聞

免除蘇寧易購(gòu)5億債務(wù)的神秘人是誰(shuí)?

汽車要聞

智界全系2萬(wàn)元現(xiàn)金減免 豪華智能限時(shí)普惠

態(tài)度原創(chuàng)

健康
藝術(shù)
旅游
教育
房產(chǎn)

呼吸科專家破解呼吸道九大謠言!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

旅游要聞

熱聞|清明假期將至,熱門(mén)目的地有哪些?

教育要聞

@人民日?qǐng)?bào)評(píng)論 微博賬號(hào)發(fā)布評(píng)論《怎么看待教育焦慮?》

房產(chǎn)要聞

最強(qiáng)黑馬殺出!海南這些區(qū)域,教育正悄悄崛起!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 德兴市| 株洲县| 峨眉山市| 临夏县| 河西区| 永丰县| 蓝田县| 柏乡县| 武胜县| 平潭县| 台山市| 通城县| 弥渡县| 德江县| 阿克苏市| 滕州市| 馆陶县| 蛟河市| 乳山市| 长岛县| 新巴尔虎右旗| 密山市| 铜山县| 方正县| 安徽省| 淮北市| 高陵县| 栖霞市| 博湖县| 札达县| 五莲县| 吉木萨尔县| 扎兰屯市| 光山县| 新巴尔虎左旗| 金塔县| 株洲市| 开原市| 治多县| 来宾市| 瓦房店市|