“如今‘出街’的人形機(jī)器人,大部分都是遙控控制的?!?/p>
“即使能夠跳舞、練武的人形機(jī)器人,也僅僅是執(zhí)行了預(yù)編程動(dòng)作程序而已……”
這是目前網(wǎng)民對(duì)人形機(jī)器人的看法。
已有相關(guān)視頻對(duì)網(wǎng)民的看法進(jìn)行佐證。
譬如,春晚表演的人形機(jī)器人下臺(tái)后,每個(gè)機(jī)器人身邊都有一位工作人員,時(shí)刻關(guān)注機(jī)器人的狀態(tài),而且手上似乎拿了“遙控器”。
春晚機(jī)器人視頻截圖,工作人員可能手拿“遙控器”
對(duì)此,宇視科技創(chuàng)始人王興興坦言,“你能讓他(人形機(jī)器人)倒立、空翻,或者做一些避障,這些都是針對(duì)固定任務(wù)做了專門的AI訓(xùn)練”,是單一功能的AI,而“泛用性的AI還是不太夠。”
簡(jiǎn)而言之,全球整個(gè)機(jī)器人的AI還不夠先進(jìn),尚沒有具有突破性的機(jī)器人AI大模型(具身智能大模型),即缺乏“大腦”。
王興興表示,全球都還在等待真正的機(jī)器人大腦的誕生,他對(duì)此表示樂觀。
這不,號(hào)稱“全球首個(gè)通用型智能體”Manus橫空出世,已于3月6日開始全球內(nèi)測(cè)。
“刃辛機(jī)器人”認(rèn)為,Manus通過技術(shù)架構(gòu)創(chuàng)新、場(chǎng)景驗(yàn)證與生態(tài)開放,為具身智能大模型提供了從算法設(shè)計(jì)到工程落地的完整參考系,其“自主規(guī)劃+精準(zhǔn)執(zhí)行”的能力鏈,正在推動(dòng)具身智能從實(shí)驗(yàn)室研究向產(chǎn)業(yè)應(yīng)用加速轉(zhuǎn)化。
機(jī)器人“缺腦”
人形機(jī)器人發(fā)展,似乎慢于預(yù)期。
近期,高盛發(fā)布了一個(gè)研報(bào),認(rèn)為人形機(jī)器人技術(shù)拐點(diǎn)仍不明朗。
研報(bào)認(rèn)為,2027/2032年全球人形機(jī)器人出貨量為7.6萬(wàn)/50.2萬(wàn)臺(tái),步伐慢于市場(chǎng)預(yù)期。至于原因,則是人形機(jī)器人的能力尚不足以處理多種通用任務(wù)。
高盛研報(bào)截圖
高盛研報(bào)的結(jié)論,印證了王興興的話,即目前的人形機(jī)器人沒有具有突破性的機(jī)器人AI大模型,即缺乏“大腦”、“靈魂”。
“沒有靈魂的軀體是一具行尸走肉?!比诵螜C(jī)器人作為重要的具身智能,具身和智能缺一不可。
人形機(jī)器人的“大腦”,不同于一般的AI大模型。
AI大模型是推動(dòng)人形機(jī)器人邁向AGI(通用人工智能)的關(guān)鍵因素。Chat GPT,尤其是Deepseek爆火,已經(jīng)展示了AI大模型的強(qiáng)大能力。大模型與機(jī)器人深度融合后,將爆發(fā)出巨大潛力的可能性。
但是,人形機(jī)器人要通往AGI,需要專門針對(duì)具身智能領(lǐng)域的多模態(tài)大模型 —— 具身智能大模型,來(lái)提升機(jī)器人在感知、決策、控制、交互等方面的能力。
具身智能大模型是基于AI技術(shù)打造,專門賦能人形機(jī)器人,幫助人形機(jī)器人實(shí)現(xiàn)在通用應(yīng)用場(chǎng)景下的落的專用大模型。
非具身智能大模型服務(wù)的對(duì)象是人類,輸出的內(nèi)容是給人看或者給人讀,更多還是在人機(jī)交互、內(nèi)容生成等方面展現(xiàn)價(jià)值。
具身智能大模型的服務(wù)對(duì)象是機(jī)器人,其輸出的內(nèi)容是需要機(jī)器人能夠理解,并最終要轉(zhuǎn)化為具體可執(zhí)行動(dòng)作的控制指令,以機(jī)械臂為例,最終輸出可能就是對(duì)電機(jī)的控制信號(hào)。
具身智能大模型賦予人形機(jī)器人“最強(qiáng)大腦”,已成為人形機(jī)器人發(fā)展的必然趨勢(shì)。
目前,國(guó)內(nèi)一些初創(chuàng)企業(yè)已經(jīng)開始推出自己的具身智能大模型。
譬如,有鹿機(jī)器人的Master 2000、若愚科技的九天大模型、千訣科技的千訣.機(jī)器人大模型、穹徹智能的Noematrix Brain、X square(自變量機(jī)器人)的Great Wall系列的WALL-A模型以及千尋智能的具身智能大模型。
尤其是近期巨元機(jī)器人推出的通用具身基座模型——智元啟元大模型(Genie Operator-1)備受關(guān)注。
而Manus橫空出世,作為具備自主決策與執(zhí)行能力的通用AI Agent,對(duì)具身智能大模型的影響更為深遠(yuǎn)。
Manus是參考
Manus是一個(gè)由中國(guó)團(tuán)隊(duì)開發(fā)的通用AI Agent,具備自主任務(wù)處理、多模型架構(gòu)、手腦協(xié)同等技術(shù)特點(diǎn)。
Manus目前處于內(nèi)測(cè)階段,但是,作為具備自主決策與執(zhí)行能力的通用AI Agent,其技術(shù)架構(gòu)和實(shí)際應(yīng)用場(chǎng)景顯示,或許能夠承擔(dān)人形機(jī)器人核心控制系統(tǒng)(“大腦”)的角色。
Manus在測(cè)試中的優(yōu)異表現(xiàn),已為具身智能模型提供性能標(biāo)桿。
Manus采用多模型架構(gòu),即總控模型拆解任務(wù)+子模型執(zhí)行,可獨(dú)立完成從數(shù)據(jù)解析到成果交付的全流程操作?。
例如解壓簡(jiǎn)歷→分析數(shù)據(jù)→生成報(bào)告等復(fù)雜任務(wù)鏈,展現(xiàn)類人類的工作邏輯與閉環(huán)執(zhí)行能力?。這為具身智能提供了可復(fù)用的“感知-決策-控制”閉環(huán)范式。
Manus展示了從數(shù)據(jù)處理到成果交付的全流程自主操作能力,證明AI Agent與物理執(zhí)行系統(tǒng)融合的可行性,為具身智能的落地提供實(shí)踐參考。?
?Manus在GAIA基準(zhǔn)測(cè)試中超越同類產(chǎn)品,其任務(wù)拆解粒度,如將購(gòu)房需求分解為社區(qū)分析、預(yù)算計(jì)算、報(bào)告生成等步驟,為具身智能大模型處理跨模態(tài)任務(wù),如機(jī)器人抓取+環(huán)境感知,提供技術(shù)路徑。
Manus支持云端異步操作,可同時(shí)調(diào)用代碼工具、數(shù)據(jù)分析模塊等多類資源,這種能力可遷移至具身智能領(lǐng)域,優(yōu)化機(jī)器人任務(wù)調(diào)度效率?。
另外,Manus通過持續(xù)學(xué)習(xí)機(jī)制記憶用戶偏好。這種個(gè)性化適配能力可為具身智能大模型提供情感化交互優(yōu)化方向,例如根據(jù)人類操作習(xí)慣調(diào)整機(jī)器人動(dòng)作幅度。
目前特斯拉等已將Manus應(yīng)用于人形機(jī)器人AI神經(jīng)網(wǎng)絡(luò)訓(xùn)練,通過動(dòng)作捕捉系統(tǒng)引導(dǎo)機(jī)器人完成動(dòng)作模仿與技能學(xué)習(xí)?。其C++ SDK和ROS兼容性支持開發(fā)者將實(shí)時(shí)數(shù)據(jù)直接接入機(jī)器人操作系統(tǒng),實(shí)現(xiàn)高效控制?。
更關(guān)鍵的是,Manus計(jì)劃2025年開源核心推理框架,降低開發(fā)者接入門檻。
此舉將吸引更多開發(fā)者參與具身智能大模型的工具鏈開發(fā),促進(jìn)技術(shù)迭代?。
總之,Manus推動(dòng)AI從“被動(dòng)響應(yīng)”向“主動(dòng)服務(wù)”躍遷?,體現(xiàn)了行業(yè)向自主任務(wù)執(zhí)行方向的演進(jìn),反映出行業(yè)對(duì)復(fù)雜環(huán)境交互能力的重視?,將推動(dòng)具身智能大模型發(fā)展,使得真正能落地應(yīng)用的“機(jī)器人大腦”很快出現(xiàn)。(文/刃辛機(jī)器人 陳重山)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.