99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

MIT團隊讓機器人“自學成才”,僅用攝像頭實現機器人精準控制

0
分享至

近日,由三位美國麻省理工學院(MIT)華人博士為主力完成的一項具身智能研究論文登上了Nature主刊。論文前三位作者分別是:李思哲、張安南和陳博遠。資料顯示,陳博遠已于 2025 年 6 月獲得博士學位,并已入職 OpenAI 擔任研究科學家(這可能也側面證實了 OpenAI 確實正在研發硬件產品)。


圖 | 從左到右:李思哲、張安南和陳博遠(來源:資料圖)



僅通過視覺就能控制機器人

對于這篇論文,李思哲在社交媒體上介紹稱:“我們的核心信息很簡單,即一個有能力的具身智能必須了解自己的身體在哪里,并能充分利用自己的身體。”

在這項研究中,他們提出一種基于視覺的深度學習方法,該方法僅通過視覺就能實現對機器人的控制,只需利用一個 RGB 相機就能高精度地執行預定運動軌跡。

而他們之所以開展這項研究是因為:傳統機器人可以輕易地建模為由關節連接的剛性連桿。但是,仿生機器人往往柔軟或由多種材料制成,因此非常缺乏感知能力,而且其材料特性可能會在使用過程中發生變化,所以如何對其建模和控制仍是一項未解難題。

為此,他們提出了上述這種利用深度神經網絡將機器人的視頻流映射到其視覺運動雅可比場的方法。

據介紹,本次方法僅通過單個攝像頭就能實現對機器人的控制,無需針對機器人的材料、驅動方式或傳感能力做出任何假設,并且只需通過觀察隨機指令的執行過程即可完成訓練,完全無需專家干預。

在不同的機器人操縱器上,他們針對本次方法進行了驗證,這些操縱器均由前人團隊打造,在驅動方式、材料、制造工藝和成本方面各不相同。

第一款操縱器是 UR5 機器人手臂,其于此前由丹麥 Universal Robots 公司開發。第二款操縱器是 Allegro Hand,其于此前由韓國 Wonik Robotics 公司開發。第三款操縱器是 Poppy 機器人手臂,其于此前由法國波爾多大學 Flowers AI & CogSci 實驗室開發。

在基于上述操縱器的實驗中:

首先,本次方法實現了平滑的軌跡控制,成功控制了安裝在 UR5 上的氣動手臂,讓其從玻璃杯中取出工具并能使用工具推動蘋果。


(來源:Nature)

其次,對于 Allegro Hand 本次方法能夠讓其握成一個拳頭。基于此前由美國西北大學團隊打造的手性剪切輔助材料(HSAs,Handed Shearing Auxetics)平臺上,Allegro Hand 能夠執行各種伸展指令和旋轉指令。


(來源:Nature)

再次,對于 Poppy 機器人手臂,本次方法讓其描繪出 MIT 這三個字母。


(來源:Nature)

總而言之,在一系列不同的機器人上,本次系統無需任何專家建模或定制,就能控制這些系統執行各種長期技能。這意味著該方法實現了精確的閉環控制,并還原了每個機器人的因果動態結構。

由于本次方法僅使用普通攝像頭作為唯一傳感器就能實現機器人控制,因此研究團隊預計這項研究將拓寬機器人系統的設計空間,并能為降低機器人的自動化門檻奠定基礎。



視覺運動雅可比場

據介紹,本次方法的框架由兩個關鍵部分組成:

首先,是一個基于深度學習的狀態估計模型,該模型僅從單一流式視頻中即可推斷出機器人的三維表征,這種表征既編碼了機器人的三維幾何結構,也編碼了其微分運動學特性——即三維空間中的任意一點在任意可能的機器人指令下將如何運動;

其次,是一個逆動力學控制器,該控制器在二維圖像空間或三維空間中對期望運動進行密集參數化,并能以交互速度生成機器人指令。

研究團隊發現,將演示軌跡參數化為密集的點運動,是控制各種機器人系統的關鍵,這是因為可變形機器人和靈巧機器人的運動無法通過單一三維坐標系上指定的剛性變換得到良好約束。同時,他們的參數化方法使得各種系統能夠模仿基于視頻的演示。


圖 | 此次使用的系統(來源:Nature)

狀態估計模型是一種深度學習架構,它能將機器人的單張圖像映射到三維神經場景表征。該三維表征可將任意的空間坐標,映射到對應位置的機器人幾何特征與機器人運動學特征。

研究中,研究團隊重建了一個神經輻射場和一個創新的視覺-運動雅可比場。神經輻射場編碼了機器人在每個三維坐標處的三維形狀和外觀,而視覺-運動雅可比場則將三維中的每個點映射到一個線性算子,該算子將該點的三維運動表示為機器人執行器命令的函數。神經輻射場將三維坐標映射到其密度和輻射度,以此作為機器人幾何結構的一種表征。

為了重建視覺運動雅可比場和輻射場,研究團隊使用了一個神經單視圖轉三維模塊。通過直接從攝像機觀測中重建機器人的幾何結構和運動學特性,使得狀態估計模型無需依賴機器人內置的傳感器。

據介紹,本次系統并非由人類專家針對電機、傳感器讀數與機器人的三維幾何結構及運動學特性之間的關系進行建模,而是直接從數據中學習并回歸這種關系。

與此同時,研究團隊所使用的狀態估計模型采用自監督方式訓練,訓練數據來自 12 臺 RGB-D 攝像機拍攝的視頻流,這些攝像機從不同視角記錄了機器人執行隨機指令的過程。對于每個攝像頭流,他們使用光流法和點跟蹤方法提取了二維運動。

在每個訓練步驟中,他們會從 12 臺攝像機中選擇一臺,將其作為重建方法的輸入。從這張單一的輸入圖像中,他們重建出了視覺運動雅可比場和輻射場,從而能對機器人的三維幾何結構和外觀進行編碼。只需給定一個機器人指令,即可使用雅可比場來預測由此產生的三維運動場。

另據悉,研究團隊通過采用體繪制技術,將三維運動場渲染到其余 12 臺攝像機中某一臺的二維光流上,并將其與觀測到的光流進行比較。這一過程訓練了雅可比場,使其能夠準確預測機器人的運動。



在閉環控制中仍然擁有高性能

評估本次方法在閉環控制中的性能,是必不可少的一個環節。其中,對于 Allegro Hand,研究團隊為控制器預設了一條二維軌跡,該軌跡能夠追蹤相關的姿態。

軌跡完成后,他們利用內置的高精度關節傳感器和手部精確的三維正向運動學模型對誤差進行了量化。這時,只需依靠視覺系統就能控制 Allegro Hand 完成每根手指的完全屈伸,每個關節的誤差小于 3 度,每個指尖的誤差小于 4 毫米。

研究團隊還在 HSA 平臺上進行了驗證,結果表明本次系統無需重新訓練,就能在動態特性發生顯著變化的情況下成功控制機器人。他們還有意地針對 HSA 平臺進行了干擾:將總質量為 350 克的校準重物固定在一根木棒上,并將木棒粘在 HSA 平臺的頂部。利用重物在平臺頂部施加了一個垂直力和一個扭矩,這使得平臺在靜止狀態下出現了明顯的傾斜。此外,木棒和重物還構成了視覺干擾。這時,研究團隊使用測量誤差小于 0.2 毫米的 OptiTrack 運動捕捉系統,并在 HSA 平臺表面粘貼了標記點,以便能夠量化目標姿態跟蹤中的位置誤差。結果發現,基于視覺的框架能夠控制機器人完成復雜的旋轉運動并達到目標配置,誤差僅為 7.303 毫米,有效克服了系統動力學上的外部擾動。

對于三維打印的 Poppy 機械臂,研究團隊設計了目標軌跡,要求機器人在空中繪制一個正方形以及字母“MIT”。這些運動序列不在分布范圍內,也未包含在研究團隊的訓練數據中。實驗中,他們在機械臂的末端執行器上安裝了 OptiTrack 標記點,以便測量三維位置誤差。在目標位姿跟蹤任務中,本次系統的平均誤差小于 6 毫米。

研究團隊還評估了其所使用的模型在實現不同視角間演示遷移上的能力。具體來說,其將模型通過將每個二維視頻幀提升到三維粒子狀態,將視頻轉換為三維軌跡,從而實現了這一目標。從定量角度來看,本次方法取得了 2.2° 的較低中位誤差。

總的來說,本次方法能對三維打印的柔性系統進行建模和控制,全程無需任何人工建模,即便這些系統的動力學特性發生顯著變化也能適用。這一系統取代了原本需要長達一個月的人類專家建模流程,而且即便人類專家建模耗時如此之長,也無法應對材料、動力學特性或制造公差的變化。因此,研究團隊預計本次方法將有助于仿生型軟硬混合機器人的部署,并有望降低機器人自動化技術的入門門檻。

參考資料:

https://www.linkedin.com/in/lester-sizhe-li/

https://www.linkedin.com/in/annan-zhang/

https://www.linkedin.com/in/boyuan99/

Li, S.L., Zhang, A., Chen, B. et al. Controlling diverse robots by inferring Jacobian fields with deep networks.Nature643, 89–95 (2025). https://doi.org/10.1038/s41586-025-09170-0

運營/排版:何晨龍

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
《以法之名》結局:張文菁再成萬海律師,才知,王華山害慘江旭東

《以法之名》結局:張文菁再成萬海律師,才知,王華山害慘江旭東

阿訊說天下
2025-07-08 00:13:52
新郎接親被堵在門外2小時,給錢也不讓進,他的舉動讓女方懵了

新郎接親被堵在門外2小時,給錢也不讓進,他的舉動讓女方懵了

櫻桃講堂
2025-06-26 15:25:28
日乒教練證實王楚欽說法,美國大滿貫球臺很滑!對球員影響很大

日乒教練證實王楚欽說法,美國大滿貫球臺很滑!對球員影響很大

十點街球體育
2025-07-08 00:15:03
王晶曝張國榮跳樓3個內幕!受內地大佬牽連,被人噓,絕筆信淚目

王晶曝張國榮跳樓3個內幕!受內地大佬牽連,被人噓,絕筆信淚目

悠閑歷史
2025-07-07 07:57:05
國足0-3韓國,球員表現評分:無人高分!僅6將及格,揪出罪魁禍首

國足0-3韓國,球員表現評分:無人高分!僅6將及格,揪出罪魁禍首

侃球熊弟
2025-07-07 20:55:47
誰在暗中支援俄羅斯,俄軍彈藥為何永遠用不完?美西方察覺不對勁

誰在暗中支援俄羅斯,俄軍彈藥為何永遠用不完?美西方察覺不對勁

智觀科技
2025-07-06 11:44:13
世事如棋局,相逢笑語中。洪森徹底傻眼了

世事如棋局,相逢笑語中。洪森徹底傻眼了

草莓解說體育
2025-07-06 19:07:36
再看1936年江青的結婚照,你看出了什么?

再看1936年江青的結婚照,你看出了什么?

霹靂炮
2025-07-07 22:10:38
紀委強調:公務員醉駕不一定被開除,3類情節可不追刑責

紀委強調:公務員醉駕不一定被開除,3類情節可不追刑責

細說職場
2025-07-07 07:18:03
貴州失聯女大學生已找到!死狀慘烈,更多細節曝光,死因很蹊蹺

貴州失聯女大學生已找到!死狀慘烈,更多細節曝光,死因很蹊蹺

阿燕姐說育兒
2025-07-07 18:45:13
中國不承認雙國籍,被美國遣返的華人會被送到什么地方?

中國不承認雙國籍,被美國遣返的華人會被送到什么地方?

科技虎虎
2025-07-01 10:50:51
重大資產重組,突然終止!

重大資產重組,突然終止!

中國基金報
2025-07-07 23:27:20
殺瘋了!1400萬外國人涌入中國,重慶大街上,擠滿了老外

殺瘋了!1400萬外國人涌入中國,重慶大街上,擠滿了老外

毒sir財經
2025-07-07 06:07:15
馬斯克將首開黨代會!賭上特斯拉、SpaceX,能成氣候么?

馬斯克將首開黨代會!賭上特斯拉、SpaceX,能成氣候么?

爾東陳譚
2025-07-08 00:03:43
形勢到底有多嚴峻?報社57歲老編輯不要社保也想再工作幾年…

形勢到底有多嚴峻?報社57歲老編輯不要社保也想再工作幾年…

慧翔百科
2025-07-07 15:39:35
德約談費德勒觀戰:可能是第一次他來看我比賽,我最后還贏了

德約談費德勒觀戰:可能是第一次他來看我比賽,我最后還贏了

懂球帝
2025-07-08 00:37:42
腐肉堆積,滿地蛆蟲!廣西“毒”煉油廠被曝光,多方介入警方立案

腐肉堆積,滿地蛆蟲!廣西“毒”煉油廠被曝光,多方介入警方立案

云景侃記
2025-07-07 19:30:25
韋韜講授黨課:最大限度減少藍天立案對全區經濟社會發展的影響

韋韜講授黨課:最大限度減少藍天立案對全區經濟社會發展的影響

政知新媒體
2025-07-07 21:20:09
《鏢人》不換臉也不補拍,強行用那爾那茜,且看廣大網友是否妥協

《鏢人》不換臉也不補拍,強行用那爾那茜,且看廣大網友是否妥協

芊手若
2025-07-07 06:05:29
Here We Go!羅馬諾:那不勒斯即將以2800萬歐元簽下諾阿-朗

Here We Go!羅馬諾:那不勒斯即將以2800萬歐元簽下諾阿-朗

懂球帝
2025-07-07 14:17:16
2025-07-08 02:23:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
15380文章數 513867關注度
往期回顧 全部

科技要聞

投資大佬一語扎心:中國機器人"可悲"現狀

頭條要聞

專家稱鉛中毒幼兒智商很難恢復 有家長傷心過度被搶救

頭條要聞

專家稱鉛中毒幼兒智商很難恢復 有家長傷心過度被搶救

體育要聞

不會再有第二個,快樂又偉大的托馬斯-穆勒

娛樂要聞

鹿晗狀態回升賬號恢復 演唱會公開表白

財經要聞

特朗普要發關稅函 美國貿易談判進展如何

汽車要聞

預售10.58萬起/6秒級加速 零跑B01將于7月下旬上市

態度原創

藝術
時尚
本地
家居
公開課

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

夏天別總穿黑色長褲,試試這幾款過膝長裙,輕盈舒適還優雅

本地新聞

建筑地標如何成為城市人才匯聚的 “強磁場”?

家居要聞

醺光伴讀 品質兼顧實用

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 衡水市| 龙门县| 老河口市| 建平县| 钟山县| 台东县| 望谟县| 卢龙县| 二连浩特市| 阜新市| 邳州市| 樟树市| 宜章县| 汕尾市| 万年县| 沂源县| 黑水县| 东丽区| 宜章县| 东台市| 鹰潭市| 利辛县| 林口县| 武安市| 甘洛县| 新邵县| 乾安县| 塔城市| 广南县| 巩义市| 金坛市| 高陵县| 崇阳县| 乌海市| 乌鲁木齐市| 申扎县| 鹤峰县| 河西区| 灵宝市| 正镶白旗| 新竹县|