光輪智能成功將 NVIDIA GR00T N1 人形機(jī)器人基礎(chǔ)模型部署至汽車制造生產(chǎn)線,這一成果標(biāo)志著具身智能在工業(yè)自動(dòng)化領(lǐng)域的重大突破以及應(yīng)用潛力。
此次部署,是 GR00T N1 人形機(jī)器人基礎(chǔ)模型在行業(yè)場(chǎng)景的首次應(yīng)用實(shí)例。光輪智能合成數(shù)據(jù)技術(shù)在應(yīng)用中發(fā)揮了關(guān)鍵作用,有效解決了具身智能訓(xùn)練中的數(shù)據(jù)稀缺挑戰(zhàn)。兩者合作為具身智能進(jìn)入智能制造樹(shù)立了新范式。
NVIDIA GR00T N1:
通用人形機(jī)器人技術(shù)的核心引擎
作為全球首個(gè)通用人形機(jī)器人開(kāi)源基礎(chǔ)模型,GR00T N1 是此次合作的技術(shù)基礎(chǔ)。該模型能夠流暢處理文本指令與圖像等多模態(tài)輸入,輸出機(jī)器人動(dòng)作指令,展現(xiàn)出跨實(shí)體、跨任務(wù)泛化能力。
GR00T N1 的獨(dú)特優(yōu)勢(shì)源于其創(chuàng)新的雙系統(tǒng)架構(gòu):視覺(jué)-語(yǔ)言模型系統(tǒng)負(fù)責(zé)環(huán)境理解和動(dòng)作規(guī)劃,而 Diffusion Transformer 系統(tǒng)則將這些規(guī)劃無(wú)縫轉(zhuǎn)化為具體的機(jī)器人動(dòng)作指令。這種受人類認(rèn)知原理啟發(fā)的架構(gòu)設(shè)計(jì),使模型在后訓(xùn)練階段實(shí)現(xiàn)協(xié)同優(yōu)化,提升整體性能表現(xiàn)。
在訓(xùn)練數(shù)據(jù)策略方面,GR00T N1 整合了海量互聯(lián)網(wǎng)視頻數(shù)據(jù)、真實(shí)機(jī)器人操作數(shù)據(jù)以及高質(zhì)量合成數(shù)據(jù),確保其在多樣化場(chǎng)景中的適應(yīng)性與可靠性。其中,由光輪智能基于 Isaac Sim 與 Omniverse 平臺(tái)制作的仿真合成數(shù)據(jù)扮演著關(guān)鍵角色,通過(guò)高效并行方式調(diào)整場(chǎng)景材質(zhì)、顏色、位置、角度、光照和環(huán)境參數(shù),同時(shí)實(shí)現(xiàn)動(dòng)作數(shù)據(jù)的有效泛化,從而使得模型在廣泛應(yīng)用場(chǎng)景中展現(xiàn)適應(yīng)性。
在實(shí)際應(yīng)用中,GR00T N1 不僅能夠執(zhí)行簡(jiǎn)單的物體操作,還能勝任需要持續(xù)上下文理解和多技能整合的復(fù)雜任務(wù),如多步驟玩具組裝、使用咖啡機(jī)、雙手使用托盤(pán)等任務(wù)。相較于傳統(tǒng)基線模型,GR00T N1 在仿真和現(xiàn)實(shí)基準(zhǔn)測(cè)試中均表現(xiàn)出更高的成功率和更穩(wěn)定的運(yùn)動(dòng)軌跡。
光輪智能基于合成數(shù)據(jù)技術(shù),
加速 GR00T N1 落地汽車工廠
對(duì)于 GR00T N1 模型而言,核心挑戰(zhàn)體現(xiàn)在兩個(gè)方面:需同時(shí)支持多樣化任務(wù)類型,并適配不同機(jī)器人本體結(jié)構(gòu)。單純依賴互聯(lián)網(wǎng)數(shù)據(jù)僅能獲取環(huán)境與任務(wù)的上下文信息,卻無(wú)法有效習(xí)得不同機(jī)器人本體的精確動(dòng)作知識(shí),這主要受限于互聯(lián)網(wǎng)數(shù)據(jù)中機(jī)器人本體多樣性不足且缺乏專業(yè)動(dòng)作標(biāo)注。另一方面,純粹使用真實(shí)機(jī)器人數(shù)據(jù)同樣存在局限性,因其在環(huán)境泛化方面表現(xiàn)不佳,無(wú)法像合成數(shù)據(jù)那樣輕松實(shí)現(xiàn)場(chǎng)景多樣化變換,難以從根本上解決模型泛化難題。
相比之下,仿真合成數(shù)據(jù)優(yōu)勢(shì)顯著:不僅能夠借助 MimicGen 技術(shù)對(duì)動(dòng)作軌跡數(shù)據(jù)進(jìn)行有效泛化,還能在單位時(shí)間內(nèi)實(shí)現(xiàn)更高效率的數(shù)據(jù)采集流程,因此這兩大挑戰(zhàn)需借助仿真合成數(shù)據(jù)的獨(dú)特優(yōu)勢(shì)來(lái)克服。
光輪智能成功構(gòu)建了物理交互真實(shí)、場(chǎng)景多樣化的仿真環(huán)境,模擬了汽車工廠中的復(fù)雜任務(wù)場(chǎng)景。基于“人在環(huán)”的仿真遙操作,生成了覆蓋各類任務(wù)的大規(guī)模遙操作合成數(shù)據(jù),并將這些遙操數(shù)據(jù)遷移至不同機(jī)器人本體上,確保模型在各種機(jī)器人平臺(tái)上均能表現(xiàn)優(yōu)秀。這些高質(zhì)量合成數(shù)據(jù)不僅加速了 GR00T N1 基礎(chǔ)模型的訓(xùn)練過(guò)程,還通過(guò)“Real2Sim2Real + Realism Validation”技術(shù)架構(gòu),有效縮小了仿真環(huán)境與物理現(xiàn)實(shí)世界的差距,確保訓(xùn)練成果能夠順利遷移至真實(shí)應(yīng)用場(chǎng)景,從而大幅提升模型在實(shí)際環(huán)境中的表現(xiàn)水平。
在汽車工廠中,搭載 GR00T N1 模型的人形機(jī)器人裝載通過(guò)質(zhì)檢的零部件并批量搬運(yùn)放置到精確位置的動(dòng)作,展現(xiàn)了其在工業(yè)場(chǎng)景中的巨大潛力。
經(jīng)訓(xùn)練后的機(jī)器人能夠通過(guò)視覺(jué)精確識(shí)別裝載框中的零部件以及質(zhì)檢臺(tái)上的指定位置,完成抓取、搬運(yùn)和放置的動(dòng)作。其左右手協(xié)同操作能力不僅顯著提升了批量處理的工作效率和承重能力,更在整個(gè)搬運(yùn)過(guò)程中保持穩(wěn)定性,確保零部件安全、完整地抵達(dá)質(zhì)檢臺(tái)。
這種高精度自動(dòng)化操作優(yōu)化了零部件質(zhì)檢流程,提升了生產(chǎn)效率,有望降低質(zhì)檢環(huán)節(jié)的運(yùn)營(yíng)成本。更為重要的是,機(jī)器人能夠替代人類在生產(chǎn)線上承擔(dān)的高重復(fù)性、高強(qiáng)度體力勞動(dòng)任務(wù),減輕了工人的工作負(fù)擔(dān),創(chuàng)造了更為人性化的工作環(huán)境。
這些復(fù)雜工業(yè)任務(wù)的成功實(shí)施,有力證明了 GR00T N1 模型在多元化工業(yè)環(huán)境中的可靠性與適應(yīng)性,而光輪智能提供的前沿合成數(shù)據(jù)解決方案無(wú)疑是推動(dòng)這一突破的關(guān)鍵力量。
光輪智能:以合成數(shù)據(jù)技術(shù),
破解具身智能基礎(chǔ)模型數(shù)據(jù)瓶頸
在具身智能領(lǐng)域,高質(zhì)量訓(xùn)練數(shù)據(jù)的稀缺性一直是制約技術(shù)突破的關(guān)鍵瓶頸。傳統(tǒng)數(shù)據(jù)采集方法不僅成本高昂,還耗時(shí)漫長(zhǎng),難以滿足現(xiàn)代人形機(jī)器人快速迭代優(yōu)化的需求?;?Isaac Sim,光輪智能采用創(chuàng)新的“Real2Sim2Real + Realism Validation”技術(shù)架構(gòu),構(gòu)建物理特性精確、3D 視覺(jué)效果真實(shí)且高度可交互的數(shù)字資產(chǎn)與場(chǎng)景,涵蓋柔性資產(chǎn)、帶觸覺(jué)反饋的剛體資產(chǎn)、具備液體屬性的動(dòng)態(tài)資產(chǎn)等,以及物理可交互工廠環(huán)境模擬。通過(guò)自動(dòng)質(zhì)檢、真實(shí)性評(píng)測(cè)標(biāo)準(zhǔn)和效用性評(píng)估流程,光輪智能對(duì)生成的訓(xùn)練數(shù)據(jù)實(shí)施全方位質(zhì)量管控。
光輪智能的合成數(shù)據(jù)解決方案還融入了真實(shí)人類專家示范,通過(guò)在高度真實(shí)的仿真場(chǎng)景中實(shí)施遙操作,系統(tǒng)采集包含真實(shí)人類示范的任務(wù)執(zhí)行軌跡?;?NVIDIA 強(qiáng)大的 Isaac Sim 仿真平臺(tái),結(jié)合 MimicGen 和 Cosmos 技術(shù),光輪智能成功生成了海量物理真實(shí)的訓(xùn)練數(shù)據(jù)集,為 GR00T N1 模型的深度訓(xùn)練提供了堅(jiān)實(shí)的技術(shù)支撐。
這一突破性創(chuàng)新不僅在效果上超越純真實(shí)數(shù)據(jù)訓(xùn)練方案,顯著提升了模型的智能水平和決策能力,更為下一代人形機(jī)器人在復(fù)雜多變的工業(yè)應(yīng)用場(chǎng)景中發(fā)揮潛力奠定了扎實(shí)基礎(chǔ)。
未來(lái)展望:
進(jìn)入具身智能場(chǎng)景落地時(shí)代
此次,NVIDIA 與光輪智能合作,成功實(shí)現(xiàn) GR00T N1 在汽車工廠成功落地,僅是人形機(jī)器人技術(shù)廣泛應(yīng)用的一個(gè)開(kāi)端。隨著合成數(shù)據(jù)技術(shù)的不斷進(jìn)步和 GR00T N1 模型的持續(xù)優(yōu)化,人形機(jī)器人將在汽車制造、物流管理、質(zhì)量檢測(cè)等領(lǐng)域發(fā)揮更大作用,推動(dòng)全球產(chǎn)業(yè)智能化升級(jí)。
汽車工廠的成功首發(fā)只是起點(diǎn)。光輪智能將持續(xù)利用其合成數(shù)據(jù)技術(shù)優(yōu)勢(shì),借助 NVIDIA 技術(shù)生態(tài),推動(dòng)人形機(jī)器人技術(shù)的創(chuàng)新與家居、商超、物流等多樣場(chǎng)景落地,為全球產(chǎn)業(yè)智能化注入新的動(dòng)力。
*本文視頻均由光輪智能制作,如果您有任何疑問(wèn)或需要使用視頻,請(qǐng)聯(lián)系光輪智能。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.