網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Manus出現(xiàn)，人形機(jī)器人或?qū)⒉辉傩枰b控器控制

2025-03-11 14:14:24　來(lái)源: 刃辛機(jī)器人

河北舉報(bào)

分享至

“如今‘出街’的人形機(jī)器人，大部分都是遙控控制的?！?/p>

“即使能夠跳舞、練武的人形機(jī)器人，也僅僅是執(zhí)行了預(yù)編程動(dòng)作程序而已……”

這是目前網(wǎng)民對(duì)人形機(jī)器人的看法。

已有相關(guān)視頻對(duì)網(wǎng)民的看法進(jìn)行佐證。

譬如，春晚表演的人形機(jī)器人下臺(tái)后，每個(gè)機(jī)器人身邊都有一位工作人員，時(shí)刻關(guān)注機(jī)器人的狀態(tài)，而且手上似乎拿了“遙控器”。

春晚機(jī)器人視頻截圖，工作人員可能手拿“遙控器”

對(duì)此，宇視科技創(chuàng)始人王興興坦言，“你能讓他（人形機(jī)器人）倒立、空翻，或者做一些避障，這些都是針對(duì)固定任務(wù)做了專門的AI訓(xùn)練”，是單一功能的AI，而“泛用性的AI還是不太夠。”

簡(jiǎn)而言之，全球整個(gè)機(jī)器人的AI還不夠先進(jìn)，尚沒有具有突破性的機(jī)器人AI大模型（具身智能大模型），即缺乏“大腦”。

王興興表示，全球都還在等待真正的機(jī)器人大腦的誕生，他對(duì)此表示樂觀。

這不，號(hào)稱“全球首個(gè)通用型智能體”Manus橫空出世，已于3月6日開始全球內(nèi)測(cè)。

“刃辛機(jī)器人”認(rèn)為，Manus通過技術(shù)架構(gòu)創(chuàng)新、場(chǎng)景驗(yàn)證與生態(tài)開放，為具身智能大模型提供了從算法設(shè)計(jì)到工程落地的完整參考系，其“自主規(guī)劃+精準(zhǔn)執(zhí)行”的能力鏈，正在推動(dòng)具身智能從實(shí)驗(yàn)室研究向產(chǎn)業(yè)應(yīng)用加速轉(zhuǎn)化。

機(jī)器人“缺腦”

人形機(jī)器人發(fā)展，似乎慢于預(yù)期。

近期，高盛發(fā)布了一個(gè)研報(bào)，認(rèn)為人形機(jī)器人技術(shù)拐點(diǎn)仍不明朗。

研報(bào)認(rèn)為，2027/2032年全球人形機(jī)器人出貨量為7.6萬(wàn)/50.2萬(wàn)臺(tái)，步伐慢于市場(chǎng)預(yù)期。至于原因，則是人形機(jī)器人的能力尚不足以處理多種通用任務(wù)。

高盛研報(bào)截圖

高盛研報(bào)的結(jié)論，印證了王興興的話，即目前的人形機(jī)器人沒有具有突破性的機(jī)器人AI大模型，即缺乏“大腦”、“靈魂”。

“沒有靈魂的軀體是一具行尸走肉?！比诵螜C(jī)器人作為重要的具身智能，具身和智能缺一不可。

人形機(jī)器人的“大腦”，不同于一般的AI大模型。

AI大模型是推動(dòng)人形機(jī)器人邁向AGI（通用人工智能）的關(guān)鍵因素。Chat GPT，尤其是Deepseek爆火，已經(jīng)展示了AI大模型的強(qiáng)大能力。大模型與機(jī)器人深度融合后，將爆發(fā)出巨大潛力的可能性。

但是，人形機(jī)器人要通往AGI，需要專門針對(duì)具身智能領(lǐng)域的多模態(tài)大模型 —— 具身智能大模型，來(lái)提升機(jī)器人在感知、決策、控制、交互等方面的能力。

具身智能大模型是基于AI技術(shù)打造，專門賦能人形機(jī)器人，幫助人形機(jī)器人實(shí)現(xiàn)在通用應(yīng)用場(chǎng)景下的落的專用大模型。

非具身智能大模型服務(wù)的對(duì)象是人類，輸出的內(nèi)容是給人看或者給人讀，更多還是在人機(jī)交互、內(nèi)容生成等方面展現(xiàn)價(jià)值。

具身智能大模型的服務(wù)對(duì)象是機(jī)器人，其輸出的內(nèi)容是需要機(jī)器人能夠理解，并最終要轉(zhuǎn)化為具體可執(zhí)行動(dòng)作的控制指令，以機(jī)械臂為例，最終輸出可能就是對(duì)電機(jī)的控制信號(hào)。

具身智能大模型賦予人形機(jī)器人“最強(qiáng)大腦”，已成為人形機(jī)器人發(fā)展的必然趨勢(shì)。

目前，國(guó)內(nèi)一些初創(chuàng)企業(yè)已經(jīng)開始推出自己的具身智能大模型。

譬如，有鹿機(jī)器人的Master 2000、若愚科技的九天大模型、千訣科技的千訣.機(jī)器人大模型、穹徹智能的Noematrix Brain、X square（自變量機(jī)器人）的Great Wall系列的WALL-A模型以及千尋智能的具身智能大模型。

尤其是近期巨元機(jī)器人推出的通用具身基座模型——智元啟元大模型（Genie Operator-1）備受關(guān)注。

而Manus橫空出世，作為具備自主決策與執(zhí)行能力的通用AI Agent，對(duì)具身智能大模型的影響更為深遠(yuǎn)。

Manus是參考

Manus是一個(gè)由中國(guó)團(tuán)隊(duì)開發(fā)的通用AI Agent，具備自主任務(wù)處理、多模型架構(gòu)、手腦協(xié)同等技術(shù)特點(diǎn)。

Manus目前處于內(nèi)測(cè)階段，但是，作為具備自主決策與執(zhí)行能力的通用AI Agent，其技術(shù)架構(gòu)和實(shí)際應(yīng)用場(chǎng)景顯示，或許能夠承擔(dān)人形機(jī)器人核心控制系統(tǒng)（“大腦”）的角色。

Manus在測(cè)試中的優(yōu)異表現(xiàn)，已為具身智能模型提供性能標(biāo)桿。

Manus采用多模型架構(gòu)，即總控模型拆解任務(wù)+子模型執(zhí)行，可獨(dú)立完成從數(shù)據(jù)解析到成果交付的全流程操作?。

例如解壓簡(jiǎn)歷→分析數(shù)據(jù)→生成報(bào)告等復(fù)雜任務(wù)鏈，展現(xiàn)類人類的工作邏輯與閉環(huán)執(zhí)行能力?。這為具身智能提供了可復(fù)用的“感知-決策-控制”閉環(huán)范式。

Manus展示了從數(shù)據(jù)處理到成果交付的全流程自主操作能力，證明AI Agent與物理執(zhí)行系統(tǒng)融合的可行性，為具身智能的落地提供實(shí)踐參考。?

?Manus在GAIA基準(zhǔn)測(cè)試中超越同類產(chǎn)品，其任務(wù)拆解粒度，如將購(gòu)房需求分解為社區(qū)分析、預(yù)算計(jì)算、報(bào)告生成等步驟，為具身智能大模型處理跨模態(tài)任務(wù)，如機(jī)器人抓取+環(huán)境感知，提供技術(shù)路徑。

Manus支持云端異步操作，可同時(shí)調(diào)用代碼工具、數(shù)據(jù)分析模塊等多類資源，這種能力可遷移至具身智能領(lǐng)域，優(yōu)化機(jī)器人任務(wù)調(diào)度效率?。

另外，Manus通過持續(xù)學(xué)習(xí)機(jī)制記憶用戶偏好。這種個(gè)性化適配能力可為具身智能大模型提供情感化交互優(yōu)化方向，例如根據(jù)人類操作習(xí)慣調(diào)整機(jī)器人動(dòng)作幅度。

目前特斯拉等已將Manus應(yīng)用于人形機(jī)器人AI神經(jīng)網(wǎng)絡(luò)訓(xùn)練，通過動(dòng)作捕捉系統(tǒng)引導(dǎo)機(jī)器人完成動(dòng)作模仿與技能學(xué)習(xí)?。其C++ SDK和ROS兼容性支持開發(fā)者將實(shí)時(shí)數(shù)據(jù)直接接入機(jī)器人操作系統(tǒng)，實(shí)現(xiàn)高效控制?。

更關(guān)鍵的是，Manus計(jì)劃2025年開源核心推理框架，降低開發(fā)者接入門檻。

此舉將吸引更多開發(fā)者參與具身智能大模型的工具鏈開發(fā)，促進(jìn)技術(shù)迭代?。

總之，Manus推動(dòng)AI從“被動(dòng)響應(yīng)”向“主動(dòng)服務(wù)”躍遷?，體現(xiàn)了行業(yè)向自主任務(wù)執(zhí)行方向的演進(jìn)，反映出行業(yè)對(duì)復(fù)雜環(huán)境交互能力的重視?，將推動(dòng)具身智能大模型發(fā)展，使得真正能落地應(yīng)用的“機(jī)器人大腦”很快出現(xiàn)。（文/刃辛機(jī)器人陳重山）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.