99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

谷歌Gemini Robotics,物理智能覬覦人形機器人安卓系統

0
分享至

大模型正從語言、視覺向行動延伸。人形機器人還會現場寫代碼,出手解決問題。

谷歌DeepMind發布了兩款新的具身智能模型,Gemini Robotics-ER與Gemini Robotics,正式宣告對物理智能的探索,從以往的RT模型系列,切換到了Gemini模型系列。用該公司高級研究科學家Ted Xiao的話說,這是前沿大模型與機器人的第一次接觸。

無論是OpenAI、Anthropic,還是Meta,還都沒有做到這一步。即使馬斯克如此喜歡夸下海口,也還沒讓特斯拉的擎天柱用上xAI最新的Grok3。國內的DeepSeek或者Qwen,都沒有直接讓前沿開源大模型端到端地驅動人形機器人的記錄。

遇到麻煩自己寫代碼

谷歌DeepMind先訓練出具身推理模型Gemini Robotics-ER,基于Gemini 2.0 Flash模型,將多模態模型的語義理解能力擴展至物理幾何(3D結構、物體位姿)、動態場景(運動軌跡、接觸效應)等等,讓身處復雜而動態的現實世界的具身智能,強化了推理能力。從中蒸餾出物理智能,就是Gemini Robotics,它能對現實世界做出反應。

比如,如果一個機器人遇到一個咖啡杯,Gemini Robotics可以識別出來,“指向”可以與自己互動的部分(比如把手),并識別出在拿起它時需要避開的物體。


機器人還會自己寫代碼去解決遇到的新問題(Zero-Shot Via Code Generation),就是個活生生的智能體。具體來說,就是模型接收輸入,包括系統提示、機器人API的描述、任務指令以及環境的實時圖像,然后基于這些輸入,模型分析場景,理解任務需求,并生成與機器人API交互的代碼。

這一過程是動態的,模型會根據環境變化與接觸后的反饋,來調整代碼,確保任務順利完成。


(概覽圖:感知和控制API,以及在任務執行過程中對智能體的協調和管理。該系統用于零樣本控制。)

不過,這項技術還處于早期階段,面對折疊衣服這樣的精細任務,谷歌發現,還是通過少量人類示范的上下文學習(Few-shot in-context learning),成功率要更高一點。

或許這就是從RT系列模型轉向Gemini系列模型的意義之一。以后,可能誰家的基礎模型編碼能力更強,誰家的機器人就是更靈巧的智能體。

但是,完成所有這些現場智能體推理和動作,需要強大的本地算力,目前仍然是個大問題。Gemini Robotics的視覺語言動作模型主干(VLA Backbone)就放到了云端,其物理世界的理解能力適用于不同形態的機器人,可以通過日常對話與人類親切交互。

Gemini Robotics還有一個動作解碼器,負責將VLA主干的輸出轉化為低級控制信號,部署于本地,可以完成精細動作。

人形機器人的安卓

谷歌把Gemini Robotics用于自己投資的Apptronik人形機器人開發,還開放給受信任的機器人企業使用,包括德國的Agile Robots, 法國的Enchanted Tools,美國的Agility Robotics,以及被韓國現代收購的Boston Dynamics。

看起來,谷歌想做出一個人形機器人的安卓系統,初步實現了適配不同機器人。


巨頭們毫不懷疑,未來,人形機器人的數量將比智能手機還多。它正在走向通用化,關鍵就在于通用的物理智能。谷歌、特斯拉、Meta與OpenAI等巨頭,對此充滿野心。

特斯拉的擎天柱是垂直自研的方式。Meta已經展露出類似的企圖。而OpenAI在自己投資的Physical Intelligence與FigureAI紛紛垂直自研后,親自下場可能性同樣大增。

上個月,Meta旗下的Reality Labs新設立了人形機器人部門。Reality Labs最為知名的就是它的元宇宙、可穿戴設備Quest,以及AI眼鏡,累計虧損超600億美元。Meta首席技術官Andrew Bosworth說,公司砸錢搞出來的核心技術,可用于開發機器人,通過Llama覆蓋消費者。

去年底,OpenAI在公司內部重啟了人形機器人團隊,并從Meta處挖來了Orion眼鏡負責人,今年已經公開開始招兵買馬,點名要那些精通傳感器與系統集成的硬件工程師,“專注于解鎖通用機器人技術,并在動態的現實環境中推動AGI級智能”。

讓前沿模型與機器人接觸,可以讓機器人從多模態環境的經驗中汲取智能,也可以在不斷嘗試中摸索數字世界的智能如何觸及物理世界。谷歌CEO桑達爾·皮查伊(Sundar Pichai)介紹新發布的兩個模型時稱,機器人技術是將人工智能的進步轉化為現實世界的有益試驗場。

難以做題評估

谷歌承認,Gemini Robotics對具身智能的探索,仍然處于非常早期的階段。谷歌在官方介紹中,放出了制作精美的視頻。但隨后,團隊成員通過自己的X賬號,放出了幾段未經刪節的視頻。

如何評估具身智能模型實際水平,是該團隊在發布Gemini Robotics前,一直思考的問題。在去年底的一次演講中,團隊提出三大瓶頸:機器人擴展定律,機器人上下文帶寬,以及可擴展的評估體系。這是具身智能當前的短板,還將影響未來幾年的研究方向。其中,評估體系的發展程度最低。


機器人擴展定律的核心,聽起來與大模型擴展定律類似,數據越多,規模越大,理應效果越好。但是,谷歌DeepMind團隊發現,在機器人領域,目前它并不每次都成立。

面對物理世界,擴展定律更像一門藝術,而不是科學(盡管本來也并非真正的物理定律)。機器人數據的質量、分布、多樣性和覆蓋范圍,比數據數量本身更重要,研究者需要找到機器人擴展定律的那條曲線,預測投入和產出的關系。在機器人領域,擴展往往意味著比大型語言模型更高的成本,尤其是后者的邊際效應已經開始降低。

還有“上下文帶寬”問題,這是指機器人能接收和理解的動作指令的信息量。多模態或世界模型存在豐富細節與物理維度,作為大模型,已經擁有越來越大的上下文窗口,但是機器人動作相關的低層次指令往往相對簡單,接受的token數量相對較少、模態豐富程度較低。如何在這種低帶寬的輸入方式下執行更精細的動作,或拓展其上下文窗口,是具身智能亟待解決的瓶頸之一。

最大的問題是驗證。這次,谷歌DeepMind團隊提出了ERQA基準,即包含 400 道多選的視覺問答(VQA)風格問題,涵蓋包括空間推理、軌跡推理、動作推理、狀態估計、指向、多視角推理和任務推理。語言模型可以用考試題測試,但機器人還得在真實世界里跑來跑去,才能試出它的真實性能;受限環境下的真機測試,在開放環境下不一定管用。

狀況會在機器人越來越通用后變得更為復雜,因為評估它們的能力的難度與成本也隨之暴漲。很多測試費時費力,還不夠全面,難以覆蓋極端案例。如果評估系統跟不上,機器人再聰明,也沒法證明自己行不行。

一種方法是改進模擬環境,讓它更接近現實,甚至期待用“世界模型”去代替部分實測。但是,這意味著后者可能必須學會建模出比機器人基礎模型更多的信息。

我們周圍會充斥著大量精心編輯的書面測評與視頻演示,但現實世界的表現,仍將是具身智能領域的黃金標準。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
熊磊要搬出許敏萬達的房子了!這還不是結尾, 許敏還將繼續上告

熊磊要搬出許敏萬達的房子了!這還不是結尾, 許敏還將繼續上告

魔都姐姐雜談
2025-06-27 11:32:04
開播第一晚熱度破22000!好評如潮,觀眾放話:“一集就淪陷!”

開播第一晚熱度破22000!好評如潮,觀眾放話:“一集就淪陷!”

夢涵說體育
2025-06-27 08:50:49
離譜!北京男子自曝500萬娶坐臺小姐被綠,膚白貌美婚后死性不改

離譜!北京男子自曝500萬娶坐臺小姐被綠,膚白貌美婚后死性不改

壹月情感
2025-06-25 23:23:29
一口氣拿下3人,勇士連做兩筆交易!曾計劃撿漏楊瀚森+兜售庫明加

一口氣拿下3人,勇士連做兩筆交易!曾計劃撿漏楊瀚森+兜售庫明加

鍋子籃球
2025-06-27 12:20:02
驚險!新疆2名小學生在鐵軌擺石頭逼停高鐵

驚險!新疆2名小學生在鐵軌擺石頭逼停高鐵

極目新聞
2025-06-27 14:24:01
中國最大沙漠到底有多深?如果把沙子全挖光,地下會是什么?

中國最大沙漠到底有多深?如果把沙子全挖光,地下會是什么?

半解智士
2025-06-17 17:07:54
傅首爾與兒子合拍,瘦了有20斤狀態真好,15歲多樂180個頭高又帥

傅首爾與兒子合拍,瘦了有20斤狀態真好,15歲多樂180個頭高又帥

八怪娛
2025-06-27 09:55:06
女研究生公然侮辱四川人后續,正臉曝光,身份被扒,難怪這么囂張

女研究生公然侮辱四川人后續,正臉曝光,身份被扒,難怪這么囂張

寒士之言本尊
2025-06-26 12:11:10
馬英九:我不希望臺灣成為第2個香港!

馬英九:我不希望臺灣成為第2個香港!

老范談史
2025-06-24 21:07:05
ESPN7月11日直播獨行俠vs湖人 新科狀元弗拉格預計首秀對決布朗尼

ESPN7月11日直播獨行俠vs湖人 新科狀元弗拉格預計首秀對決布朗尼

直播吧
2025-06-27 09:12:24
媽呀!范曉萱也胖成張惠妹了!這是要退出歌壇?

媽呀!范曉萱也胖成張惠妹了!這是要退出歌壇?

動物奇奇怪怪
2025-06-27 11:37:30
阿拉法特遺孀蘇哈:巴政府每月給3.5萬美元,當最富裕的風流寡婦

阿拉法特遺孀蘇哈:巴政府每月給3.5萬美元,當最富裕的風流寡婦

普覽
2025-06-18 20:33:08
伊朗裝備了從中國引進的先進防空系統,為何這次沒能擊落一架戰機

伊朗裝備了從中國引進的先進防空系統,為何這次沒能擊落一架戰機

小院之觀
2025-06-25 05:30:05
一個急救員眼中,民營長途轉運救護車的“利”與“亂”

一個急救員眼中,民營長途轉運救護車的“利”與“亂”

澎湃新聞
2025-06-27 07:04:27
“以伊沖突”的3個贏家,兩個輸家

“以伊沖突”的3個贏家,兩個輸家

史政先鋒
2025-06-24 16:45:07
清朝的嬪妃為什么要戴長指甲?除了方便皇上,還有一個重要的作用

清朝的嬪妃為什么要戴長指甲?除了方便皇上,還有一個重要的作用

大千世界觀
2025-06-04 21:00:07
韓國人仇視中國,不僅因為經濟被超越,最大原因是對宿命的不甘

韓國人仇視中國,不僅因為經濟被超越,最大原因是對宿命的不甘

大道無形我有型
2025-06-27 12:24:40
中央紀委國家監委通報!5月全國查處違反中央八項規定精神問題21843起

中央紀委國家監委通報!5月全國查處違反中央八項規定精神問題21843起

每日經濟新聞
2025-06-27 11:30:21
當年越南為何非要跟中國過不去?越軍說出實情,3點原因令人心寒

當年越南為何非要跟中國過不去?越軍說出實情,3點原因令人心寒

大千世界觀
2025-05-14 10:30:08
吹捧美國空氣香甜的楊舒平,已被驅逐出境,如今回國下場大快人心

吹捧美國空氣香甜的楊舒平,已被驅逐出境,如今回國下場大快人心

跳跳歷史
2025-06-06 16:41:00
2025-06-27 16:07:00
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
134文章數 38關注度
往期回顧 全部

科技要聞

雷軍:小米汽車成功沒靠營銷,靠的是能力

頭條要聞

27歲"李福貴"賣貨吸粉600多萬 面對流量哭稱壓力太大

頭條要聞

27歲"李福貴"賣貨吸粉600多萬 面對流量哭稱壓力太大

體育要聞

曼城“庫里”連線,送尤文晚安好夢

娛樂要聞

網傳白玉蘭最佳男女主獎將“爆冷”

財經要聞

1萬就能刪行政處罰?信用修復江湖起底

汽車要聞

配置升級/貴賓座椅 全新GL8陸上公務艙售22.99萬

態度原創

本地
健康
手機
藝術
時尚

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

呼吸科專家破解呼吸道九大謠言!

手機要聞

W25周排名出爐,vivo、OPPO持續霸占前二

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

到了夏天,中年女人穿過膝裙不配運動鞋,才能美得優雅又得體

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 彰武县| 文山县| 南投市| 安丘市| 朔州市| 肇州县| 武安市| 鸡泽县| 通州区| 乌审旗| 兴国县| 安顺市| 临泽县| 宣化县| 嫩江县| 辉县市| 莱州市| 封开县| 新龙县| 蓝田县| 甘肃省| 屏东市| 伊吾县| 鹰潭市| 武城县| 长岛县| 怀仁县| 丹棱县| 北碚区| 林口县| 旬阳县| 鲁甸县| 中山市| 栖霞市| 阿荣旗| 红原县| 牡丹江市| 同仁县| 浦县| 嘉荫县| 威远县|