主要觀點(diǎn):
1.雙足雙臂的人形機(jī)器人不是具身智能的唯一形態(tài)。在工信部的定義中,人形機(jī)器人應(yīng)該擁有大腦、小腦和四肢,但在實(shí)際應(yīng)用中,雙足機(jī)器人并不是人形機(jī)器人的最佳形態(tài)。嚴(yán)格來(lái)說(shuō),除了強(qiáng)陪伴的場(chǎng)景(比如家庭服務(wù)、養(yǎng)老等),輪式注定比雙足式效率更高,輪臂式或者三頭六臂式可能是更有效的。
2.目前人形機(jī)器人大腦的技術(shù)路線仍有分歧,存在VLA和ViLLA兩大陣營(yíng)。VLA(Visual Language Action Model,視覺(jué)語(yǔ)言行動(dòng)模型)主要以O(shè)penAI和FigureAI為代表,VLA模型能夠讓機(jī)器人通過(guò)理解環(huán)境和語(yǔ)言指令,并通過(guò)執(zhí)行模塊輸出為動(dòng)作。ViLLA(Vision-Language-Latent-Action, 視覺(jué)-語(yǔ)言-隱式動(dòng)作架構(gòu))架構(gòu)則是由智元機(jī)器人發(fā)布,該架構(gòu)由多模態(tài)大模型(VLM)和混合專家模型(MoE)組成,相較于傳統(tǒng)VLA架構(gòu),它能夠通過(guò)預(yù)測(cè)隱式動(dòng)作標(biāo)記將感知與執(zhí)行環(huán)節(jié)深度耦合,從而顯著提升了任務(wù)理解的連貫性和動(dòng)作規(guī)劃的效率。
成都人形機(jī)器人創(chuàng)新中心目前采用的是世界模型架構(gòu),這種后臺(tái)架構(gòu)能夠把模型壓縮到0.2GB,可以直接在一張3090顯卡上運(yùn)行,通過(guò)各種垂直模型來(lái)完成整個(gè)任務(wù)。人工智能未來(lái)一定有兩個(gè)大的方向,一個(gè)是模型小型化,未來(lái)大參數(shù)量的模型一定會(huì)越來(lái)越小,第二就是AI物理化,由具象的東西代替人去做事,人形機(jī)器人未來(lái)一定是一個(gè)非常大的方向。
3.人形機(jī)器人“跨空間”和“跨場(chǎng)景”操作能力是智能化提升的關(guān)鍵。目前人形機(jī)器人演示場(chǎng)景仍然局限在一個(gè)固定的空間,比如一張桌子,一個(gè)房間,從一張桌子到另一張桌子、一個(gè)房間到另一個(gè)房間的這種跨場(chǎng)景的應(yīng)用還相對(duì)較少。深圳近期出臺(tái)了《深圳市具身智能機(jī)器人技術(shù)創(chuàng)新與產(chǎn)業(yè)發(fā)展行動(dòng)計(jì)劃(2025-2027年)》,重點(diǎn)提到了“形成長(zhǎng)序列推理(COT)和自主學(xué)習(xí)能力,支持跨場(chǎng)景任務(wù)處理”和“世界模型”。未來(lái)人形機(jī)器人跨空間跨場(chǎng)景的應(yīng)用將成為重點(diǎn)。
4.政府開(kāi)展場(chǎng)景開(kāi)放,更需要探索場(chǎng)景形成的市場(chǎng)化、商業(yè)化機(jī)制。沒(méi)有商業(yè)模式的場(chǎng)景是不能持續(xù)的。成都商業(yè)和消費(fèi)全國(guó)領(lǐng)先,更具備這方面的優(yōu)勢(shì)。
5.人形機(jī)器距離產(chǎn)業(yè)化還面臨效率與安全性問(wèn)題,99.9%是性能分水嶺。目前,智元機(jī)器人GO-1(基于ViLLA模型)在復(fù)雜任務(wù)中的成功率已經(jīng)超過(guò)60%,比現(xiàn)有技術(shù)超出32%。然而對(duì)于真正的產(chǎn)業(yè)應(yīng)用來(lái)說(shuō),60%是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)橛嘞碌?0%,一旦出現(xiàn)錯(cuò)誤只能企業(yè)來(lái)買單。傳統(tǒng)的工業(yè)機(jī)器人功能單一,但成功率能夠達(dá)到99.99%,成本可控和達(dá)到一定成功率是產(chǎn)品入門的及格線,這個(gè)是硬性指標(biāo)。
6.普惠性的人才政策有利于激發(fā)創(chuàng)新氛圍。吸引人才的關(guān)鍵還是在于房?jī)r(jià)、生活成本、城市氛圍,成都相較于深圳等一線城市最大的優(yōu)勢(shì)就在于生活節(jié)奏和氛圍,抓住這一點(diǎn),用普惠性的政策吸引人才,長(zhǎng)期形成聚集效應(yīng),創(chuàng)新的爆發(fā)只是早晚的事。
7.機(jī)器人產(chǎn)業(yè)也需要形成像蘋果一樣的開(kāi)發(fā)生態(tài)。機(jī)器人的研發(fā)涵蓋復(fù)雜的軟件、硬件,如果有一個(gè)共建服務(wù)平臺(tái)把所有的供應(yīng)鏈企業(yè)匯集起來(lái),由政府去搭建共享的研發(fā)設(shè)計(jì)平臺(tái)、開(kāi)發(fā)工具庫(kù)等基礎(chǔ)設(shè)施,企業(yè)可以在平臺(tái)上注冊(cè)發(fā)起項(xiàng)目開(kāi)展聯(lián)合研發(fā),一是共同開(kāi)展前沿技術(shù)的攻關(guān),二是可以縮短從樣品到產(chǎn)品的市場(chǎng)周期,大幅節(jié)約時(shí)間和成本。
? Copyright
雨前顧問(wèn)原創(chuàng)作品 | 未經(jīng)授權(quán)請(qǐng)勿轉(zhuǎn)載 | 歡迎分享朋友圈
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.