谷歌DeepMind CEO展示Genie 2：機器人訓(xùn)練新時代

2025-04-22 10:22:13　來源: 智東西

北京舉報

分享至

機器人前瞻（公眾號：robot_pro）
編譯江宇
編輯漠影

機器人前瞻4月21日消息，谷歌DeepMind迎來突破性進展，其世界構(gòu)建AI模型Genie 2展現(xiàn)了在機器人訓(xùn)練領(lǐng)域的巨大潛力。

DeepMind CEO兼聯(lián)合創(chuàng)始人Demis Hassabis向《60分鐘》節(jié)目展示了這一創(chuàng)新技術(shù)，強調(diào)其在創(chuàng)建可交互3D環(huán)境及加速機器人學(xué)習(xí)方面的應(yīng)用前景。

Genie 2能夠從單一靜態(tài)圖像生成可探索的3D虛擬世界，為AI代理和機器人提供逼真的模擬環(huán)境。

在演示中，DeepMind研究科學(xué)家Jack Parker-Holder展示了一張加州瀑布頂部照片，Genie 2將其轉(zhuǎn)化為類似第一人稱視角的視頻游戲場景。用戶或AI代理可以在虛擬環(huán)境中自由移動，例如在瀑布頂部的水池周圍行走，甚至探索原始圖像中不存在的景觀。

▲實機演示：Genie 2將加州瀑布頂部的照片轉(zhuǎn)化為類似視頻游戲場景

Hassabis表示，Genie 2的“世界模型”能夠動態(tài)生成環(huán)境，模擬現(xiàn)實世界的物理特性。這種能力使其不僅適用于娛樂領(lǐng)域（如生成游戲和視頻），更重要的是為AI和機器人提供高效的訓(xùn)練平臺。

Hassabis強調(diào)，Genie 2的核心目標(biāo)是構(gòu)建理解現(xiàn)實世界的模型，為機器人訓(xùn)練提供低成本、高效率的解決方案。傳統(tǒng)的機器人數(shù)據(jù)采集受限于現(xiàn)實世界的復(fù)雜性和高成本，數(shù)據(jù)量有限且收集速度慢。

而Genie 2的模擬環(huán)境可以生成近乎無限的數(shù)據(jù)量，允許機器人在虛擬世界中進行初步學(xué)習(xí)，隨后通過少量現(xiàn)實世界數(shù)據(jù)進行微調(diào)。

在一個演示中，AI控制的騎士角色在一個由Genie 2生成的3D環(huán)境中自主完成任務(wù)，例如從三個門廊中選擇正確路徑并爬上樓梯。Hassabis指出，這種技術(shù)可以讓機器人在模擬環(huán)境中學(xué)習(xí)復(fù)雜任務(wù)，如導(dǎo)航、物體交互和決策制定，從而大幅減少對現(xiàn)實世界數(shù)據(jù)的依賴。

▲實機演示：AI騎士角色在由Genie 2生成的3D環(huán)境中自主完成任務(wù)

Hassabis透露，DeepMind正在探索利用谷歌地圖、谷歌地球和街景視圖等地理數(shù)據(jù)，進一步增強AI的世界理解能力。這些數(shù)據(jù)可以為AI提供豐富的現(xiàn)實世界背景，幫助機器人更好地適應(yīng)真實環(huán)境。

同時，Genie 2還能將靜態(tài)圖像（如街景或個人度假照片）轉(zhuǎn)化為交互式3D場景，為機器人訓(xùn)練和用戶體驗開辟新可能性。

Hassabis還表示，未來版本的Genie模型將能夠創(chuàng)建更多樣化、復(fù)雜的虛擬世界，為機器人學(xué)習(xí)新技能、執(zhí)行任務(wù)以及與人類和物體交互提供支持。這一技術(shù)不僅有望革新機器人開發(fā)，還可能在工業(yè)、醫(yī)療和探索等領(lǐng)域推動智能化應(yīng)用的廣泛普及。

來源：CBS NEWS

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.