網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

光輪智能利用 NVIDIA GR00T N1 人形機(jī)器人模型落地汽車工廠生產(chǎn)應(yīng)用

2025-05-13 18:30:02　來(lái)源: NVIDIA英偉達(dá)中國(guó)

北京舉報(bào)

分享至

光輪智能成功將 NVIDIA GR00T N1 人形機(jī)器人基礎(chǔ)模型部署至汽車制造生產(chǎn)線，這一成果標(biāo)志著具身智能在工業(yè)自動(dòng)化領(lǐng)域的重大突破以及應(yīng)用潛力。

此次部署，是 GR00T N1 人形機(jī)器人基礎(chǔ)模型在行業(yè)場(chǎng)景的首次應(yīng)用實(shí)例。光輪智能合成數(shù)據(jù)技術(shù)在應(yīng)用中發(fā)揮了關(guān)鍵作用，有效解決了具身智能訓(xùn)練中的數(shù)據(jù)稀缺挑戰(zhàn)。兩者合作為具身智能進(jìn)入智能制造樹(shù)立了新范式。

NVIDIA GR00T N1：

通用人形機(jī)器人技術(shù)的核心引擎

作為全球首個(gè)通用人形機(jī)器人開(kāi)源基礎(chǔ)模型，GR00T N1 是此次合作的技術(shù)基礎(chǔ)。該模型能夠流暢處理文本指令與圖像等多模態(tài)輸入，輸出機(jī)器人動(dòng)作指令，展現(xiàn)出跨實(shí)體、跨任務(wù)泛化能力。

GR00T N1 的獨(dú)特優(yōu)勢(shì)源于其創(chuàng)新的雙系統(tǒng)架構(gòu)：視覺(jué)-語(yǔ)言模型系統(tǒng)負(fù)責(zé)環(huán)境理解和動(dòng)作規(guī)劃，而 Diffusion Transformer 系統(tǒng)則將這些規(guī)劃無(wú)縫轉(zhuǎn)化為具體的機(jī)器人動(dòng)作指令。這種受人類認(rèn)知原理啟發(fā)的架構(gòu)設(shè)計(jì)，使模型在后訓(xùn)練階段實(shí)現(xiàn)協(xié)同優(yōu)化，提升整體性能表現(xiàn)。

在訓(xùn)練數(shù)據(jù)策略方面，GR00T N1 整合了海量互聯(lián)網(wǎng)視頻數(shù)據(jù)、真實(shí)機(jī)器人操作數(shù)據(jù)以及高質(zhì)量合成數(shù)據(jù)，確保其在多樣化場(chǎng)景中的適應(yīng)性與可靠性。其中，由光輪智能基于 Isaac Sim 與 Omniverse 平臺(tái)制作的仿真合成數(shù)據(jù)扮演著關(guān)鍵角色，通過(guò)高效并行方式調(diào)整場(chǎng)景材質(zhì)、顏色、位置、角度、光照和環(huán)境參數(shù)，同時(shí)實(shí)現(xiàn)動(dòng)作數(shù)據(jù)的有效泛化，從而使得模型在廣泛應(yīng)用場(chǎng)景中展現(xiàn)適應(yīng)性。

在實(shí)際應(yīng)用中，GR00T N1 不僅能夠執(zhí)行簡(jiǎn)單的物體操作，還能勝任需要持續(xù)上下文理解和多技能整合的復(fù)雜任務(wù)，如多步驟玩具組裝、使用咖啡機(jī)、雙手使用托盤(pán)等任務(wù)。相較于傳統(tǒng)基線模型，GR00T N1 在仿真和現(xiàn)實(shí)基準(zhǔn)測(cè)試中均表現(xiàn)出更高的成功率和更穩(wěn)定的運(yùn)動(dòng)軌跡。

光輪智能基于合成數(shù)據(jù)技術(shù)，

加速 GR00T N1 落地汽車工廠

對(duì)于 GR00T N1 模型而言，核心挑戰(zhàn)體現(xiàn)在兩個(gè)方面：需同時(shí)支持多樣化任務(wù)類型，并適配不同機(jī)器人本體結(jié)構(gòu)。單純依賴互聯(lián)網(wǎng)數(shù)據(jù)僅能獲取環(huán)境與任務(wù)的上下文信息，卻無(wú)法有效習(xí)得不同機(jī)器人本體的精確動(dòng)作知識(shí)，這主要受限于互聯(lián)網(wǎng)數(shù)據(jù)中機(jī)器人本體多樣性不足且缺乏專業(yè)動(dòng)作標(biāo)注。另一方面，純粹使用真實(shí)機(jī)器人數(shù)據(jù)同樣存在局限性，因其在環(huán)境泛化方面表現(xiàn)不佳，無(wú)法像合成數(shù)據(jù)那樣輕松實(shí)現(xiàn)場(chǎng)景多樣化變換，難以從根本上解決模型泛化難題。

相比之下，仿真合成數(shù)據(jù)優(yōu)勢(shì)顯著：不僅能夠借助 MimicGen 技術(shù)對(duì)動(dòng)作軌跡數(shù)據(jù)進(jìn)行有效泛化，還能在單位時(shí)間內(nèi)實(shí)現(xiàn)更高效率的數(shù)據(jù)采集流程，因此這兩大挑戰(zhàn)需借助仿真合成數(shù)據(jù)的獨(dú)特優(yōu)勢(shì)來(lái)克服。

光輪智能成功構(gòu)建了物理交互真實(shí)、場(chǎng)景多樣化的仿真環(huán)境，模擬了汽車工廠中的復(fù)雜任務(wù)場(chǎng)景。基于“人在環(huán)”的仿真遙操作，生成了覆蓋各類任務(wù)的大規(guī)模遙操作合成數(shù)據(jù)，并將這些遙操數(shù)據(jù)遷移至不同機(jī)器人本體上，確保模型在各種機(jī)器人平臺(tái)上均能表現(xiàn)優(yōu)秀。這些高質(zhì)量合成數(shù)據(jù)不僅加速了 GR00T N1 基礎(chǔ)模型的訓(xùn)練過(guò)程，還通過(guò)“Real2Sim2Real + Realism Validation”技術(shù)架構(gòu)，有效縮小了仿真環(huán)境與物理現(xiàn)實(shí)世界的差距，確保訓(xùn)練成果能夠順利遷移至真實(shí)應(yīng)用場(chǎng)景，從而大幅提升模型在實(shí)際環(huán)境中的表現(xiàn)水平。

在汽車工廠中，搭載 GR00T N1 模型的人形機(jī)器人裝載通過(guò)質(zhì)檢的零部件并批量搬運(yùn)放置到精確位置的動(dòng)作，展現(xiàn)了其在工業(yè)場(chǎng)景中的巨大潛力。

經(jīng)訓(xùn)練后的機(jī)器人能夠通過(guò)視覺(jué)精確識(shí)別裝載框中的零部件以及質(zhì)檢臺(tái)上的指定位置，完成抓取、搬運(yùn)和放置的動(dòng)作。其左右手協(xié)同操作能力不僅顯著提升了批量處理的工作效率和承重能力，更在整個(gè)搬運(yùn)過(guò)程中保持穩(wěn)定性，確保零部件安全、完整地抵達(dá)質(zhì)檢臺(tái)。

這種高精度自動(dòng)化操作優(yōu)化了零部件質(zhì)檢流程，提升了生產(chǎn)效率，有望降低質(zhì)檢環(huán)節(jié)的運(yùn)營(yíng)成本。更為重要的是，機(jī)器人能夠替代人類在生產(chǎn)線上承擔(dān)的高重復(fù)性、高強(qiáng)度體力勞動(dòng)任務(wù)，減輕了工人的工作負(fù)擔(dān)，創(chuàng)造了更為人性化的工作環(huán)境。

這些復(fù)雜工業(yè)任務(wù)的成功實(shí)施，有力證明了 GR00T N1 模型在多元化工業(yè)環(huán)境中的可靠性與適應(yīng)性，而光輪智能提供的前沿合成數(shù)據(jù)解決方案無(wú)疑是推動(dòng)這一突破的關(guān)鍵力量。

光輪智能：以合成數(shù)據(jù)技術(shù)，

破解具身智能基礎(chǔ)模型數(shù)據(jù)瓶頸

在具身智能領(lǐng)域，高質(zhì)量訓(xùn)練數(shù)據(jù)的稀缺性一直是制約技術(shù)突破的關(guān)鍵瓶頸。傳統(tǒng)數(shù)據(jù)采集方法不僅成本高昂，還耗時(shí)漫長(zhǎng)，難以滿足現(xiàn)代人形機(jī)器人快速迭代優(yōu)化的需求?；?Isaac Sim，光輪智能采用創(chuàng)新的“Real2Sim2Real + Realism Validation”技術(shù)架構(gòu)，構(gòu)建物理特性精確、3D 視覺(jué)效果真實(shí)且高度可交互的數(shù)字資產(chǎn)與場(chǎng)景，涵蓋柔性資產(chǎn)、帶觸覺(jué)反饋的剛體資產(chǎn)、具備液體屬性的動(dòng)態(tài)資產(chǎn)等，以及物理可交互工廠環(huán)境模擬。通過(guò)自動(dòng)質(zhì)檢、真實(shí)性評(píng)測(cè)標(biāo)準(zhǔn)和效用性評(píng)估流程，光輪智能對(duì)生成的訓(xùn)練數(shù)據(jù)實(shí)施全方位質(zhì)量管控。

光輪智能的合成數(shù)據(jù)解決方案還融入了真實(shí)人類專家示范，通過(guò)在高度真實(shí)的仿真場(chǎng)景中實(shí)施遙操作，系統(tǒng)采集包含真實(shí)人類示范的任務(wù)執(zhí)行軌跡?；?NVIDIA 強(qiáng)大的 Isaac Sim 仿真平臺(tái)，結(jié)合 MimicGen 和 Cosmos 技術(shù)，光輪智能成功生成了海量物理真實(shí)的訓(xùn)練數(shù)據(jù)集，為 GR00T N1 模型的深度訓(xùn)練提供了堅(jiān)實(shí)的技術(shù)支撐。

這一突破性創(chuàng)新不僅在效果上超越純真實(shí)數(shù)據(jù)訓(xùn)練方案，顯著提升了模型的智能水平和決策能力，更為下一代人形機(jī)器人在復(fù)雜多變的工業(yè)應(yīng)用場(chǎng)景中發(fā)揮潛力奠定了扎實(shí)基礎(chǔ)。

未來(lái)展望：

進(jìn)入具身智能場(chǎng)景落地時(shí)代

此次，NVIDIA 與光輪智能合作，成功實(shí)現(xiàn) GR00T N1 在汽車工廠成功落地，僅是人形機(jī)器人技術(shù)廣泛應(yīng)用的一個(gè)開(kāi)端。隨著合成數(shù)據(jù)技術(shù)的不斷進(jìn)步和 GR00T N1 模型的持續(xù)優(yōu)化，人形機(jī)器人將在汽車制造、物流管理、質(zhì)量檢測(cè)等領(lǐng)域發(fā)揮更大作用，推動(dòng)全球產(chǎn)業(yè)智能化升級(jí)。

汽車工廠的成功首發(fā)只是起點(diǎn)。光輪智能將持續(xù)利用其合成數(shù)據(jù)技術(shù)優(yōu)勢(shì)，借助 NVIDIA 技術(shù)生態(tài)，推動(dòng)人形機(jī)器人技術(shù)的創(chuàng)新與家居、商超、物流等多樣場(chǎng)景落地，為全球產(chǎn)業(yè)智能化注入新的動(dòng)力。

*本文視頻均由光輪智能制作，如果您有任何疑問(wèn)或需要使用視頻，請(qǐng)聯(lián)系光輪智能。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.