近日,逐際動(dòng)力創(chuàng)始人張巍久違地露面,在公開(kāi)場(chǎng)合首次發(fā)表了一場(chǎng)演講。除了明確逐際動(dòng)力的定位和產(chǎn)品方向外,他對(duì)當(dāng)下機(jī)器人、無(wú)人駕駛行業(yè)的主流技術(shù)、商業(yè)化路徑也進(jìn)行了分析。
RoboX對(duì)其演講內(nèi)容進(jìn)行了如下摘要整理:
“機(jī)器人永不會(huì)代替人”
張巍認(rèn)為,具身智能是當(dāng)下最火的一條賽道,盡管它目前仍面臨很多問(wèn)題和質(zhì)疑,但背后還是有一個(gè)共識(shí)——具身智能是未來(lái)十年人類最重要的科技革命。
如果機(jī)器人的定位是「代替人完成可以改變物理世界的任務(wù)」,這其中就有兩個(gè)關(guān)鍵詞——「代替人」和「任務(wù)」,它們看似簡(jiǎn)單,其實(shí)往往是巨大的陷阱——如果不理解透這兩個(gè)詞,具身智能落地就會(huì)變得異常復(fù)雜。
他表示,逐際動(dòng)力(以下簡(jiǎn)稱「逐際」)的觀點(diǎn)和定位,并非是讓機(jī)器人去代替人,而是Empower人——“機(jī)器人永遠(yuǎn)都不會(huì)代替人,它背后的邏輯是很復(fù)雜的。”
首先,張巍用兩個(gè)具身智能類型,分析了其背后的商業(yè)化難點(diǎn)。
1、機(jī)器人+AI:他表示,上一代的機(jī)器人+AI模式已經(jīng)做很長(zhǎng)一段時(shí)間,這是商業(yè)化最難的方向,它其實(shí)可能只是「海市蜃樓」。
此類機(jī)器人能在工廠里能完成非常復(fù)雜的分揀任務(wù),或者快遞包裹分揀。但是它們?cè)谡嬲纳虡I(yè)閉環(huán)上,還是有很多挑戰(zhàn)的:“沒(méi)準(zhǔn)賣出去的那一剎那,就是賠錢的開(kāi)始。”
2、無(wú)人駕駛:在張巍看來(lái),從2016-2024年,無(wú)人駕駛已經(jīng)發(fā)展了很長(zhǎng)時(shí)間,卻仍難以評(píng)判其成熟度——“當(dāng)感覺(jué)找到「技術(shù)開(kāi)關(guān)」時(shí),卻還是有「最后的10%」的難度是無(wú)法估計(jì)的,恰恰就是這10%,是影響整體發(fā)展的關(guān)鍵。
”同時(shí),其商業(yè)價(jià)值也很難判斷。因?yàn)榇嫒耍蛥f(xié)助人,這兩件事是有本質(zhì)區(qū)別的,它們有著不同的商業(yè)模式,也會(huì)帶來(lái)不同的產(chǎn)品,這兩種產(chǎn)品所經(jīng)受的打擊是完全不一樣的。
讓機(jī)器人「用起來(lái)」其實(shí)非常簡(jiǎn)單,可是形成商業(yè)閉環(huán)卻非常難。現(xiàn)在上路的無(wú)人車,或者配送車的本體,都不是主角,在整個(gè)商業(yè)價(jià)值鏈條里占比不到10%。
同樣的,機(jī)器人產(chǎn)品本身也只占商業(yè)鏈條的不到10%,剩下的部署維護(hù)、改造場(chǎng)景,協(xié)作關(guān)系等部分才是最大的開(kāi)銷。所以機(jī)器人不光有好的本體,還一定要有數(shù)據(jù)工具、訓(xùn)練工具、部署工具,以及維護(hù)工具,這一整套的效率體系才是競(jìng)爭(zhēng)力,而非本體。
同理,如果想讓機(jī)器人代替人,并非改變本體的問(wèn)題,而是要改變一整套協(xié)作關(guān)系。
大語(yǔ)言模型,能做的仍很有限
現(xiàn)在提到具身智能,都會(huì)聯(lián)想到與大語(yǔ)言模型的結(jié)合。
例如,要想將人類的意圖告訴機(jī)器,就需要task encoding或者embedding(任務(wù)編碼或嵌入),大腦要先對(duì)task進(jìn)行處理和決策,再由小腦去執(zhí)行運(yùn)動(dòng)。
對(duì)比起來(lái)看的話,無(wú)人車是非常簡(jiǎn)單的具身智能任務(wù),因?yàn)槠淙蝿?wù)定義很明確,唯一目標(biāo)就是到達(dá)目的地,在結(jié)構(gòu)化的道路上移動(dòng)。而且,無(wú)人車的「小腦」就是底盤和域控制器,如今也已經(jīng)非常成熟。
即便如此,張巍也不認(rèn)為目前的無(wú)人駕駛可算作「完全替代人」:“它本質(zhì)上還是AI+人。我不覺(jué)得目前有完全交給AI的無(wú)人駕駛,只是用技術(shù)改變了人開(kāi)車的方式。”
而對(duì)于具身智能來(lái)說(shuō),完全代替人類更加困難。
張巍用一個(gè)很簡(jiǎn)單的任務(wù)舉例:給我收拾一下桌子。可這樣的任務(wù)卻很難被拆解和執(zhí)行。
“如果沒(méi)有大語(yǔ)言模型,大家甚至都不太敢想這樣的任務(wù)。但現(xiàn)在只是敢想,具體怎么做還不清楚。”
應(yīng)當(dāng)「押寶」哪種本體?
理想化的想法,是用數(shù)據(jù)堆出一個(gè)「具身大腦」,同時(shí)也有通用小腦+通用本體,就能完成各種任務(wù)。
但是張巍認(rèn)為,采用一致的通用本體形態(tài),是沒(méi)有必要的。對(duì)此,他總結(jié)出現(xiàn)有的四大本體類型:
- 1、機(jī)械臂,它的控制器小腦極其成熟。
- 2、輪式底盤+雙臂,它的控制器也相對(duì)成熟。
- 3、人形+人形特有的小腦。
- 4、人形的下半身,只有雙腿或四腿,主要完成locomotion(移動(dòng)能力)的任務(wù)。
(逐際動(dòng)力 - 人形機(jī)器人CL)
本質(zhì)上機(jī)器人就在做兩件事:代替雙手、代替雙腿。他認(rèn)為,在行業(yè)發(fā)展過(guò)程中,創(chuàng)造最大價(jià)值的應(yīng)該是這兩類本體,所以逐際也是選擇做這兩類。
“押寶押哪一個(gè),去做哪種本體?我認(rèn)為這不是一個(gè)好問(wèn)題,好的問(wèn)題是‘這個(gè)行業(yè)還需要發(fā)展哪一種本體’。”
在他看來(lái),要想做高價(jià)值的本體,需要3個(gè)條件:1、目前在物理世界中尚不存在;2、原理上可支持被做出來(lái);3、未來(lái)一定是機(jī)器人形態(tài)中的一種。
模型就像牛頓定律
只是歷史數(shù)據(jù)的壓縮
“大家希望用一個(gè)大模型,就做成整個(gè)大腦。其實(shí)這是個(gè)不切實(shí)際的想法,其實(shí)要好多大腦。而且現(xiàn)在我們不缺某個(gè)領(lǐng)域里的大腦,我們?nèi)钡氖菍W(xué)習(xí)的能力,也就是對(duì)數(shù)據(jù)高效處理的能力。”張巍說(shuō)道。
不可否認(rèn)的是,仿真是一種對(duì)模型的使用方式,且仿真和模型對(duì)數(shù)據(jù)的發(fā)生和產(chǎn)生都有巨大幫助。但是模型是歷史數(shù)據(jù)的壓縮,就像牛頓定律是對(duì)所有運(yùn)動(dòng)物體的數(shù)據(jù)的一個(gè)壓縮,只不過(guò)壓縮得比較好。
“牛頓定律和大語(yǔ)言模型沒(méi)有任何本質(zhì)的區(qū)別,它只是這一類數(shù)據(jù)中最好的壓縮方式。所有壓縮好的數(shù)據(jù),都可以用來(lái)作為數(shù)據(jù)的生成,產(chǎn)生新的數(shù)據(jù),幫助推進(jìn)泛化。”
他指出,操作的泛化性有好多種,有分模塊的,有端到端的,它們本質(zhì)是對(duì)數(shù)據(jù)的利用和假設(shè)的不同方式。
“但是當(dāng)前,我們的所有數(shù)據(jù)處理方法都難以達(dá)到理想中的功能需求。所以現(xiàn)在不能盲目地要追求在一種方法上去堆數(shù)據(jù)提升性能,而是要找到我們認(rèn)為的‘曲線D’,也就是我稱之為‘性能數(shù)據(jù)比’或者‘?dāng)?shù)據(jù)性能轉(zhuǎn)化率’的一條曲線,現(xiàn)在還不是一個(gè)堆數(shù)據(jù)的時(shí)候。”
那么,怎樣才能找到更好的數(shù)據(jù)利用率?張巍表示,其實(shí)從容易獲得的規(guī)則數(shù)據(jù)中,還是有很多信息能幫助我們指導(dǎo)操作的泛化性的。
他展示了一個(gè)逐際動(dòng)力的案例——不利用數(shù)據(jù),完全通過(guò)text prompt,讓大模型生成人類操作的視頻,就能指導(dǎo)協(xié)作機(jī)械臂完成操作任務(wù)。
“我們的數(shù)據(jù)利用率,可達(dá)當(dāng)前算法的100倍。”張巍說(shuō)道。
他表示,逐際之所以做人形本體加全控小腦,是希望將「未來(lái)一定有用,現(xiàn)在還沒(méi)有做得很好」的這一類東西做好。
同時(shí),逐際也在研發(fā)低成本的具身大腦工業(yè)母機(jī),探索一種新型的學(xué)習(xí)訓(xùn)練方式,以求可以在任意領(lǐng)域中以更高的效率去完成可泛化的任務(wù)。
張巍強(qiáng)調(diào)稱,逐際動(dòng)力的核心的定位一直都是Empower innovators:“我們不直接進(jìn)工廠,我們的定位是希望做具身智能的英偉達(dá),將具身智能創(chuàng)新、落地的效率提升百倍千倍。”
據(jù)他透露,目前逐際的人形機(jī)器人(大負(fù)載全身搬運(yùn))已經(jīng)用最低成本的方式完成了原理驗(yàn)證,而且是在驗(yàn)證目標(biāo)沒(méi)有被取舍掉的前提下。
同時(shí),逐際還即將發(fā)布第一款全尺寸人形機(jī)器人,能夠原地起立、直膝行走。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.