99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

首個(gè)通用具身基座大模型發(fā)布,智元機(jī)器人的“稚暉君”有點(diǎn)興奮

0
分享至

“對(duì)機(jī)器人公司,你如果不做大模型,那是屬于沒有未來的機(jī)器人,沒有智能化,沒有作業(yè)能力只是一個(gè)硬件。他能做的事情非常有限,所以我們投入非常大的。”智元新創(chuàng)技術(shù)有限公司研究院執(zhí)行院長(zhǎng)、具身業(yè)務(wù)部總裁姚卯青在2025年3月10日的線上媒體溝通會(huì)上如是說。

這一天,智元機(jī)器人正式發(fā)布了全球首個(gè)通用具身基座大模型——智元啟元大模型(Genie Operator-1,簡(jiǎn)稱GO-1),這標(biāo)志著具身智能向通用化、開放化、智能化方向快速邁進(jìn)。


智元機(jī)器人聯(lián)合創(chuàng)始人&CTO、曾是華為“天才少年”、B站知名UP“稚暉君”(本名:彭志輝)3月7日就在社交媒體表示要有“好東西發(fā)布”,3月10日在發(fā)布智元啟元大模型(GO-1)后,依然稱:“明天還有驚喜”。看起來,智元機(jī)器人正全力開啟加速度,網(wǎng)友在“稚暉君”的微博下還留言,熱度不夠,還要加大熱度。


ViLLA架構(gòu):從數(shù)字金字塔到具身智能的飛躍

GO-1的核心在于其開創(chuàng)性的Vision-Language-Latent-Action(ViLLA)架構(gòu)。這一架構(gòu)由多模態(tài)大模型(VLM)與混合專家模型(MoE)組成,試圖彌合視覺、語(yǔ)言與動(dòng)作之間的鴻溝。

任廣輝詳細(xì)闡述了這一設(shè)計(jì)的初衷:“現(xiàn)有的VLA(Vision-Language-Action)架構(gòu)沒有充分利用大規(guī)模人類和跨本體操作視頻數(shù)據(jù),缺少一個(gè)重要的來源,導(dǎo)致迭代成本高、進(jìn)化速度慢。我們提出的ViLLA通過預(yù)測(cè)Latent Action Tokens(隱式動(dòng)作標(biāo)記),有效利用了互聯(lián)網(wǎng)異構(gòu)視頻和高質(zhì)量的AgiBot World數(shù)據(jù)集,增強(qiáng)了策略的泛化能力。”


ViLLA的底層邏輯源于智元提出的“數(shù)字金字塔”概念。任廣輝將其比作人類學(xué)習(xí)的過程:“以打乒乓球?yàn)槔阆韧ㄟ^課本和視頻理解理論,知道球的上旋、下旋是怎么回事;然后看世界冠軍的比賽視頻,學(xué)習(xí)動(dòng)作模式;再通過發(fā)球機(jī)模擬練習(xí),最后找教練手把手教。數(shù)據(jù)金字塔也是如此——底層是互聯(lián)網(wǎng)海量圖文數(shù)據(jù),賦予模型通用知識(shí);中間是人類和跨本體操作視頻,提供動(dòng)作理解;再往上是仿真數(shù)據(jù)增強(qiáng)泛化性;頂層則是真機(jī)示教數(shù)據(jù),確保動(dòng)作精準(zhǔn)。”

具體而言,VLM繼承了開源多模態(tài)模型InternVL2.5-2B的權(quán)重,負(fù)責(zé)場(chǎng)景感知和語(yǔ)言理解;MoE中的Latent Planner(隱式規(guī)劃器)基于人類和跨本體視頻數(shù)據(jù)抽象出動(dòng)作序列;Action Expert(動(dòng)作專家)則利用百萬真機(jī)數(shù)據(jù)將動(dòng)作映射到機(jī)器人本體上。


任廣輝說:“比如‘掛衣服’,VLM理解指令和場(chǎng)景,Latent Planner推演出提衣、掛桿的步驟,Action Expert將其轉(zhuǎn)化為機(jī)器人的精確執(zhí)行。這是一個(gè)全鏈路的閉環(huán)。”


在評(píng)測(cè)中,GO-1的表現(xiàn)令人矚目。智元機(jī)器人在五種不同復(fù)雜度任務(wù)上針對(duì)GO-1的測(cè)試顯示,相比已有的最優(yōu)模型,GO-1的任務(wù)成功率領(lǐng)先,平均成功率提高了32%(46%->78%),其中在“Pour Water”(倒水)、“Table Bussing”(清理桌面)和“Restock Beverage”(補(bǔ)充飲料)的任務(wù)中表現(xiàn)尤為突出。任廣輝透露:“單獨(dú)驗(yàn)證Latent Planner的作用時(shí),成功率也提升了10多個(gè)百分點(diǎn)。這證明了ViLLA架構(gòu)的有效性。”

四大特性,從實(shí)驗(yàn)室通向真實(shí)世界

GO-1并非實(shí)驗(yàn)室中的概念驗(yàn)證,而是旨在解決具身智能落地困境的實(shí)用方案。任廣輝總結(jié)了當(dāng)前行業(yè)的四大痛點(diǎn):“泛化性差、擴(kuò)展新任務(wù)成本高、不同本體數(shù)據(jù)無法共享、缺乏持續(xù)進(jìn)化機(jī)制。”GO-1通過四大特性直面這些挑戰(zhàn)。


一是人類視頻學(xué)習(xí):GO-1大模型可以結(jié)合互聯(lián)網(wǎng)視頻和真實(shí)人類示范進(jìn)行學(xué)習(xí),增強(qiáng)模型對(duì)人類行為的理解。

二是小樣本快速泛化:該大模型具有泛化能力,能夠在極少數(shù)據(jù)甚至零樣本下泛化到新場(chǎng)景、新任務(wù),降低了具身模型的使用門檻,使得后訓(xùn)練成本非常低。

任廣輝舉例:“擦拭桌子上的污漬,我們只用了150條數(shù)據(jù),一天采集完成;倒水需要1000條。相比傳統(tǒng)方法動(dòng)輒上萬條,我們降低了1-2個(gè)數(shù)量級(jí)的成本。”

三是一腦多形:該大模型是通用機(jī)器人策略模型,能夠在不同機(jī)器人形態(tài)之間遷移,快速適配到不同本體。

任廣輝解釋:“GO-1抽象出了跨本體的動(dòng)作概念,能快速適配輪式或人形機(jī)器人,實(shí)現(xiàn)群體升智。”

四是持續(xù)進(jìn)化:該大模型搭配一整套數(shù)據(jù)回流系統(tǒng),可以從實(shí)際執(zhí)行中遇到的問題數(shù)據(jù)中持續(xù)進(jìn)化學(xué)習(xí)。

任廣輝強(qiáng)調(diào):“我們有一套完整的數(shù)據(jù)回流系統(tǒng)。比如機(jī)器人放咖啡時(shí)抖落了杯子,這些異常數(shù)據(jù)會(huì)回傳,經(jīng)過人工審核后優(yōu)化模型,越用越聰明。”

這四大特性讓GO-1從單一任務(wù)走向多任務(wù),從封閉環(huán)境邁向開放世界,從預(yù)設(shè)程序進(jìn)化到指令泛化。任廣輝總結(jié):“GO-1就像給機(jī)器人提供了‘基礎(chǔ)教育’和‘職業(yè)教育’,讓它天然適應(yīng)新場(chǎng)景和新任務(wù)。”

數(shù)據(jù)飛輪,開源的力量

GO-1的成功離不開智元在數(shù)據(jù)端的深耕。2023年9月,智元建成全球首個(gè)數(shù)采超級(jí)工廠;同年12月,開源了AgiBot World數(shù)據(jù)集,包含百萬條真機(jī)數(shù)據(jù)。

這一數(shù)據(jù)集在HuggingFace上連續(xù)多周位居下載榜首,GitHub上發(fā)布一周獲1200星,遠(yuǎn)超谷歌Open X-Embodiment一年的900星。截至2025年3月,下載量已超2萬次。

姚卯青回顧道:“我們?cè)谟布慨a(chǎn)的基礎(chǔ)上,用千臺(tái)機(jī)器人編隊(duì)采集數(shù)據(jù),再用這些數(shù)據(jù)自研大模型,最后部署回本體,形成了閉環(huán)迭代。這是全球首創(chuàng)。”任廣輝補(bǔ)充:“AgiBot World的質(zhì)量和規(guī)模遠(yuǎn)超同行,每條數(shù)據(jù)都有人工審核,確保工業(yè)級(jí)標(biāo)準(zhǔn)。用戶反饋這是他們能接觸到的唯一高質(zhì)量大規(guī)模數(shù)據(jù)集。”


數(shù)據(jù)回流系統(tǒng)則是GO-1持續(xù)進(jìn)化的關(guān)鍵。任廣輝舉例:“機(jī)器人執(zhí)行任務(wù)時(shí)發(fā)現(xiàn)問題,比如放咖啡失敗,這些數(shù)據(jù)會(huì)回傳,經(jīng)過審核后加入訓(xùn)練集,推動(dòng)模型迭代。”

機(jī)器人領(lǐng)域,數(shù)據(jù)采集的成本是很高的,未來數(shù)據(jù)采集里有沒有可能單獨(dú)剝離出來,形成一個(gè)產(chǎn)業(yè)?姚卯青認(rèn)為,這是有可能的,“上一代AI 的發(fā)展是有明確的產(chǎn)業(yè)分工的,像數(shù)據(jù)的采集標(biāo)注、審核甚至是數(shù)據(jù)的交易都是有一些平臺(tái)性的機(jī)構(gòu)出現(xiàn)的,那么在機(jī)器人領(lǐng)域,我認(rèn)為這也是有機(jī)會(huì)的。”

姚卯青說,因?yàn)槊恳患叶紒碜约航ㄔO(shè)場(chǎng)地,投入設(shè)備,是一個(gè)重復(fù)造輪子、重復(fù)投資的行為。長(zhǎng)期來看的話,可以由個(gè)別的幾家企業(yè)來集中承擔(dān)公共平臺(tái)的職責(zé)。”

姚卯青透露:“我們?cè)谏虾!Ф忌烧Z(yǔ)料普惠計(jì)劃’中,與多家企業(yè)統(tǒng)一數(shù)據(jù)接口,推動(dòng)數(shù)據(jù)匯聚。Q1末可能會(huì)有數(shù)據(jù)交易模式的政策發(fā)布。”這將為具身智能行業(yè)注入新的活力。

同時(shí),關(guān)于數(shù)據(jù)的標(biāo)準(zhǔn)方面,“理想狀態(tài)是統(tǒng)一標(biāo)準(zhǔn),共享互聯(lián)網(wǎng)圖文、動(dòng)作視頻和真機(jī)數(shù)據(jù),推動(dòng)具身智能量級(jí)躍升。”任廣輝說。

工業(yè)、服務(wù)業(yè)、商業(yè),5年內(nèi)走入家庭

“機(jī)器人如果沒有自主作業(yè)能力,價(jià)值非常有限。AI能力將是未來競(jìng)爭(zhēng)的核心,就像新能源車和手機(jī)行業(yè)一樣,硬件會(huì)收斂,供應(yīng)鏈會(huì)整合,最后拼的是智能化。”姚卯青接受采訪時(shí)說。


在應(yīng)用場(chǎng)景上,智元采取漸進(jìn)式策略。姚卯青表示:“短期內(nèi),我們聚焦工業(yè)、服務(wù)業(yè)和商業(yè)場(chǎng)景,比如POC項(xiàng)目已在工廠落地。長(zhǎng)期目標(biāo)是走進(jìn)家庭,五年左右可能實(shí)現(xiàn)。工業(yè)場(chǎng)景對(duì)成功率要求高,我們會(huì)實(shí)地采集幾萬條數(shù)據(jù),但比傳統(tǒng)方法仍更高效。家用場(chǎng)景如倒茶、做早餐,萬元內(nèi)能夠?qū)崿F(xiàn)。

價(jià)格方面,姚卯青認(rèn)為,定價(jià)9.9萬元的機(jī)器人確實(shí)在市場(chǎng)上受到了很大的關(guān)注,但硬件的基礎(chǔ)也決定了機(jī)器人能力的上限。

“在這個(gè)階段的話,我們還是堅(jiān)定的認(rèn)為需要以價(jià)值為導(dǎo)向,真正能夠讓機(jī)器人的硬件軟件協(xié)同做協(xié)同配合,產(chǎn)生一個(gè)好的效果,才是給用戶的價(jià)值,而不只是說買一個(gè)大號(hào)的電動(dòng)玩具,這個(gè)長(zhǎng)期來講是不具備很大的商業(yè)價(jià)值的。”姚卯青說。“當(dāng)前量產(chǎn)規(guī)模在千臺(tái)以上,但供應(yīng)鏈尚未完全成熟,機(jī)器人定價(jià)可能在30萬元以上。隨著今年規(guī)模化的生產(chǎn)和交付,AI研發(fā)成本會(huì)被分?jǐn)偅粫?huì)顯著推高售價(jià)。”

商業(yè)計(jì)劃上,他透露:“今年出貨量將達(dá)數(shù)千臺(tái),營(yíng)收比去年增長(zhǎng)數(shù)倍,覆蓋科研、教育、工業(yè)和服務(wù)業(yè)。”

GO-1還將在Q1末對(duì)核心用戶開源模型。任廣輝說:“我們已公開技術(shù)博客和論文,未來用戶可將GO-1部署到自家機(jī)器人上。”這不僅加速了技術(shù)普及,也為智元構(gòu)筑了數(shù)據(jù)與模型的雙重護(hù)城河。

關(guān)于DeepSeek是否帶來啟發(fā)或技術(shù)路線方面的影響時(shí),姚卯青回應(yīng):“DeepSeek等優(yōu)秀工作給我們很大啟發(fā)。我們參考了通用能力預(yù)訓(xùn)練加垂類數(shù)據(jù)后訓(xùn)練的思路,但在機(jī)器人領(lǐng)域增加了Latent Planner和Action Expert的創(chuàng)新。而且機(jī)器人是物理應(yīng)用,與數(shù)字模型不同,我們的定制化創(chuàng)新讓GO-1通用具身基座大模型更貼合具身需求。”

近期火熱的Manus智能體也引發(fā)討論。姚卯青也表示:“Agent智能體在任務(wù)規(guī)劃上有借鑒意義,但機(jī)器人更復(fù)雜,涉及小腦控制和物理交互。短期內(nèi),我們靠數(shù)據(jù)到模型的閉環(huán),長(zhǎng)期可能融合Agent理念。”

在技術(shù)路線上,姚卯青判斷:“機(jī)器人模型尚未收斂,未來會(huì)結(jié)合模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。我們已有布局,幾個(gè)月后將發(fā)布基于強(qiáng)化學(xué)習(xí)的Foundation Model。”

面對(duì)當(dāng)前市場(chǎng)上大量的具身智能公司,包括有八九年歷史的“老公司”,也有僅2年歷史的智元科技,新公司的優(yōu)勢(shì)在哪里?姚卯青認(rèn)為:“‘老牌公司’可能有歷史包袱,戰(zhàn)略調(diào)整難且保守。智元平均研發(fā)年齡30歲以下,勢(shì)頭正猛,兩年走完別人八年的路,今年有望成為國(guó)內(nèi)龍頭。

“中國(guó)的人才儲(chǔ)備強(qiáng)于國(guó)外,當(dāng)然競(jìng)爭(zhēng)也比較激烈。”姚卯青在采訪現(xiàn)場(chǎng)還打起了廣告,他還說公司正在持續(xù)招聘,打造全球第一梯隊(duì)。

本文首發(fā):新聞晨報(bào)官方網(wǎng)站

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中國(guó)女籃不敵日本,球員哭成淚人!宮魯鳴拒絕辭職,跟韓國(guó)爭(zhēng)季軍

中國(guó)女籃不敵日本,球員哭成淚人!宮魯鳴拒絕辭職,跟韓國(guó)爭(zhēng)季軍

侃球熊弟
2025-07-19 23:15:49
恩愛10年,相差30歲的王石田樸珺夫婦,終究還是沒抵過殘酷現(xiàn)實(shí)!

恩愛10年,相差30歲的王石田樸珺夫婦,終究還是沒抵過殘酷現(xiàn)實(shí)!

三公子娛樂丫
2025-07-10 16:38:51
中美法航母對(duì)比一天跑多遠(yuǎn):美國(guó)1335公里,法國(guó)1200公里,中國(guó)呢

中美法航母對(duì)比一天跑多遠(yuǎn):美國(guó)1335公里,法國(guó)1200公里,中國(guó)呢

混沌錄
2025-07-19 17:25:44
2025年養(yǎng)老金漲2%,廣東省調(diào)整方案會(huì)咋變?上漲100元,算高嗎?

2025年養(yǎng)老金漲2%,廣東省調(diào)整方案會(huì)咋變?上漲100元,算高嗎?

阿燕姐說育兒
2025-07-20 17:31:33
第十二代本田雅閣曝光,外觀很漂亮,內(nèi)飾上檔次,你會(huì)喜歡嗎?

第十二代本田雅閣曝光,外觀很漂亮,內(nèi)飾上檔次,你會(huì)喜歡嗎?

紅濤說車
2025-07-20 12:39:54
日本人始終想不明白:為何美軍打得下硫磺島,但就是拿不下上甘嶺

日本人始終想不明白:為何美軍打得下硫磺島,但就是拿不下上甘嶺

顧史
2025-07-20 14:48:40
外賣員送餐發(fā)現(xiàn)是自己地址,接下單:我倒要看看誰在我家!

外賣員送餐發(fā)現(xiàn)是自己地址,接下單:我倒要看看誰在我家!

曉艾故事匯
2025-07-14 17:13:00
葉珂復(fù)播了,自曝產(chǎn)女后與黃曉明劃清界限,沒給黃曉明留一絲體面

葉珂復(fù)播了,自曝產(chǎn)女后與黃曉明劃清界限,沒給黃曉明留一絲體面

大笑江湖史
2025-07-19 16:14:17
你變了!利物浦9500萬歐簽23歲神鋒+詹俊提質(zhì)疑 今夏支出超3億歐

你變了!利物浦9500萬歐簽23歲神鋒+詹俊提質(zhì)疑 今夏支出超3億歐

風(fēng)過鄉(xiāng)
2025-07-20 18:42:24
“性自由”正在席卷中國(guó),第四性取向?qū)⒊蔀槲磥碇髁?>
    </a>
        <h3>
      <a href=第一心理
2023-09-01 18:10:33
搞笑自助餐經(jīng)典笑話,有一個(gè)新開業(yè)的自助素食餐廳,每人只要18元就可以隨意吃最近有個(gè)大胃王

搞笑自助餐經(jīng)典笑話,有一個(gè)新開業(yè)的自助素食餐廳,每人只要18元就可以隨意吃最近有個(gè)大胃王

天天明星
2025-07-19 14:52:57
“無法接受!”中方重拳反擊,全部飛機(jī)禁飛,日本提要求被拒

“無法接受!”中方重拳反擊,全部飛機(jī)禁飛,日本提要求被拒

一個(gè)有靈魂的作者
2025-07-19 09:56:29
為什么上海人寧愿去日本?

為什么上海人寧愿去日本?

旅界Pro
2025-07-20 08:34:36
“香港不是中國(guó)的”,港獨(dú)議員叫囂反華言論,馬化騰要求滾出中國(guó)

“香港不是中國(guó)的”,港獨(dú)議員叫囂反華言論,馬化騰要求滾出中國(guó)

霽寒飄雪
2025-07-19 09:20:27
男孩被塞后備箱后續(xù)!親媽曝光與前公公聊天記錄,毀三觀

男孩被塞后備箱后續(xù)!親媽曝光與前公公聊天記錄,毀三觀

魔都姐姐雜談
2025-07-19 11:41:24
山海關(guān)之戰(zhàn)多慘烈?李自成十八萬精銳幾乎被團(tuán)滅,十五員大將陣亡

山海關(guān)之戰(zhàn)多慘烈?李自成十八萬精銳幾乎被團(tuán)滅,十五員大將陣亡

聞識(shí)
2025-07-18 11:40:02
特別時(shí)髦的母女裝組合

特別時(shí)髦的母女裝組合

美女穿搭分享
2025-07-17 18:30:09
鄭大世:以前說日本隊(duì)目標(biāo)世界杯奪冠那只是激勵(lì),現(xiàn)在沒人會(huì)質(zhì)疑

鄭大世:以前說日本隊(duì)目標(biāo)世界杯奪冠那只是激勵(lì),現(xiàn)在沒人會(huì)質(zhì)疑

直播吧
2025-07-20 19:18:30
寧夏警方通報(bào)一女子和小孩被洪水沖走失聯(lián)

寧夏警方通報(bào)一女子和小孩被洪水沖走失聯(lián)

上觀新聞
2025-07-20 18:48:10
高樓層視野好?住進(jìn)25樓后我才發(fā)現(xiàn),什么叫“風(fēng)口上的生活”!

高樓層視野好?住進(jìn)25樓后我才發(fā)現(xiàn),什么叫“風(fēng)口上的生活”!

裝修秀
2025-07-19 10:50:03
2025-07-20 21:20:49
犀利財(cái)經(jīng) incentive-icons
犀利財(cái)經(jīng)
關(guān)注科技,關(guān)注人文
332文章數(shù) 835關(guān)注度
往期回顧 全部

科技要聞

Manus"跑路新加坡"后,創(chuàng)始人首次復(fù)盤

頭條要聞

深圳自建房業(yè)主私裝電梯二手承重木斷裂 3名工人墜亡

頭條要聞

深圳自建房業(yè)主私裝電梯二手承重木斷裂 3名工人墜亡

體育要聞

中國(guó)女籃輸日本,天賦完敗給努力和戰(zhàn)術(shù)

娛樂要聞

肖戰(zhàn)改名官宣!徹底不裝了,要自由

財(cái)經(jīng)要聞

夾縫中的芯片之王:黃仁勛能守住4萬億嗎?

汽車要聞

輔助駕駛五維測(cè)評(píng) 蔚來世界模型:大智小糙

態(tài)度原創(chuàng)

數(shù)碼
本地
藝術(shù)
親子
公開課

數(shù)碼要聞

電池供電運(yùn)行《賽博朋克2077》:蘋果M4 Max能效比才略高于RTX 5090

本地新聞

換個(gè)城市過夏天 | 誰打翻了濰坊的調(diào)色盤?

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

親子要聞

長(zhǎng)沙才待幾天,雙胞胎小哥倆已經(jīng)念起媽媽了

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 甘谷县| 东港市| 双峰县| 临沧市| 新余市| 甘孜| 晋中市| 陕西省| 博客| 新乐市| 石屏县| 博罗县| 绍兴市| 陵水| 阳东县| 淮南市| 清苑县| 武宣县| 五常市| 兴仁县| 东乌珠穆沁旗| 深州市| 京山县| 西藏| 上栗县| 玛纳斯县| 航空| 会同县| 晋城| 安化县| 左云县| 双柏县| 环江| 宜丰县| 皋兰县| 望奎县| 太白县| 乌海市| 宜阳县| 泌阳县| 咸宁市|