機(jī)器之心報道
編輯:杜偉
一年一度的世界人工智能大會現(xiàn)場探展,我們被這個「閑不住」的人形機(jī)器人圈粉了。
2025 年行至過半,人工智能領(lǐng)域的前沿?zé)狳c屢屢破圈,其中具身智能(Embodied AI)及其載體在國內(nèi)格外受到了關(guān)注,尤其是人形機(jī)器人。
從年初春晚舞臺上的扭秧歌轉(zhuǎn)手絹、到四五月先后舉辦全球首屆人形機(jī)器人馬拉松比賽、全球首個人形機(jī)器人格斗大賽,得益于 AI 算法和機(jī)器學(xué)習(xí)等技術(shù)的進(jìn)步,具身機(jī)器人展現(xiàn)出了越來越強(qiáng)的靈活性以及環(huán)境適應(yīng)、感知決策行動能力。
在 2025 年世界人工智能大會(WAIC)現(xiàn)場,包括人形機(jī)器人在內(nèi)的具身智能展區(qū)無疑是全場焦點。形態(tài)各異、「張牙舞爪」的各式機(jī)器人被現(xiàn)場觀眾圍得水泄不通,它們樂此不疲,秀起看家本領(lǐng)。
其中,一家「忙碌中」的展臺吸引了我們駐足,里面的人形機(jī)器人正像人類服務(wù)生一樣,接受下單之后,從冰箱里取出飲料,并遞給觀眾。
我們觀察到,從識別到用戶指令、到定位目標(biāo)、再到抓取、遞送飲料,全程一氣呵成,完全由 VLA 模型自主推理實現(xiàn),智能化程度令人嘆為觀止。
深入了解之后,我們發(fā)現(xiàn),這是一家去年 2 月成立的具身智能創(chuàng)業(yè)公司「千尋智能」。該公司致力于研發(fā)通用人形機(jī)器人和下一代具身大模型,締造新一代智慧勞動力。
千尋智能展臺上的這款人形機(jī)器人正是該公司六月正式發(fā)布的「Moz1」,它是國內(nèi)首個高精度全身力控的具身智能機(jī)器人,擁有 26 個自由度(不含靈巧手),一體化關(guān)節(jié)的功率密度比特斯拉人形機(jī)器人 Optimus 還高 15%,在速度、精度、安全性和仿生力控方面都達(dá)到了行業(yè)最高水平。
紙面實力如此強(qiáng)悍,Moz1 還能帶來哪些驚喜?在千尋智能展臺,我們見識到了它更多驚艷的技能。
人形機(jī)器人 Moz1「秀翻」WAIC 全場
在 WAIC 現(xiàn)場,機(jī)器人帶來的震撼幾乎時時都在上演。
我們首先來到了千尋智能 Moz1 的運動控制區(qū)
在這里,Moz1 正在展示其卓越的整機(jī)協(xié)調(diào)性、動態(tài)平衡性、動作穩(wěn)定性、智能規(guī)劃等多個關(guān)鍵維度的核心能力。
看,Moz1 秀起了太空步,全身隨意動作但手臂拿水不撒:
智能 S 型極限壓彎也不在話下:
由此可見,人形機(jī)器人在動態(tài)環(huán)境中的適應(yīng)能力有了質(zhì)的提升。
接下來走向遙操作區(qū),Moz1 的人機(jī)協(xié)作能力一覽無余。
在現(xiàn)場技術(shù)人員的指揮下大顯身手,Moz1 玩起了掌上迷宮走珠:
還能搭積木:
秀起舞姿:
這意味著,Moz1 在精細(xì)任務(wù)操作過程中的靈活性與精準(zhǔn)度拉滿了。
最后是機(jī)械臂疊衣區(qū),柔性物體操作顯然難不住它。
抓取、折疊、堆高, 亂衣秒變豆腐塊:
一番體驗下來,最大的感受是:
如今的機(jī)器人不再滿足只完成預(yù)設(shè)任務(wù),還能根據(jù)環(huán)境變化做出智能決策,進(jìn)行自我優(yōu)化和調(diào)整,提升自身在真實環(huán)境與任務(wù)中的靈活性和應(yīng)對效率。
一句話,人形機(jī)器人的進(jìn)化速度正在超出我們的想象。對于千尋智能來說,支撐起這一切的背后是其全棧自研具身機(jī)器人技術(shù)以及軟硬協(xié)同推進(jìn)的體系化積累。
打造「腦體并進(jìn)」通用機(jī)器人框架
從創(chuàng)立之初,千尋智能便以同時打造「下一代具身大模型與通用人形機(jī)器人」為目標(biāo),機(jī)器人大腦與本體并舉。大模型負(fù)責(zé)學(xué)習(xí)與決策,機(jī)器人本體承擔(dān)感知與執(zhí)行,兩者協(xié)同進(jìn)化,打破軟硬件脫節(jié)的行業(yè)通病,開發(fā)真正可泛化、落地的通用機(jī)器人。
其中,在模型層面采用端到端 VLA(視覺 - 語言 - 動作)技術(shù)路線,這也是近年來具身大模型領(lǐng)域的主流架構(gòu),如 Figure 的 Helix、1X 的 Redwood AI。通過打通感知、理解和執(zhí)行三大關(guān)鍵環(huán)節(jié),這一路線加速實現(xiàn)從理解世界到高效行動的「通才具身智能體」,顯著提升機(jī)器人在真實世界的泛化與任務(wù)完成能力。
千尋智能瞄準(zhǔn)了通用機(jī)器人的這一現(xiàn)實可行落地框架,并于今年 3 月發(fā)布了自研的 VLA 模型 Spirit v1,在適應(yīng)復(fù)雜多變環(huán)境和多樣化任務(wù)連續(xù)操作方面實現(xiàn)了代際躍升。如 WAIC 現(xiàn)場展示的那樣,該 AI 模型賦能的機(jī)械臂在國內(nèi)首次實現(xiàn)疊衣服的全流程順暢操作,一舉攻克柔性物體長程操作這一行業(yè)難題。
此后,Spirit v1 持續(xù)迭代升級,探索并驗證在更多真實任務(wù)場景中的實用性與魯棒性。上個月發(fā)布的全力控人形機(jī)器人 Moz1便搭載了該自研模型,這也是其在機(jī)器人本體層面的重要落地成果,標(biāo)志著從「腦」到「體」的閉環(huán)系統(tǒng)已具備實戰(zhàn)部署能力。
在強(qiáng)大泛化能力的加持下,Moz1 可以精準(zhǔn)完成桌面整理、扔垃圾、座椅歸位、擦黑板等辦公室多場景任務(wù),適應(yīng)性越來越強(qiáng),儼然一副「打雜小能手」的樣子。
整理桌面
扔垃圾
座椅歸位
擦黑板
可以預(yù)見,隨著 Moz1 積累更多真實世界的交互經(jīng)驗,可以為后續(xù)承擔(dān)更高復(fù)雜度的協(xié)作任務(wù)打下基礎(chǔ)。未來,Moz1 有望從「能干活」進(jìn)化到「會思考」,成為辦公環(huán)境中的全能助理將不再只是夢想。
Moz1「集多能力于一身」
當(dāng)然,除了軟件層面高度智能化、自主化的大腦之外,Moz1 同樣在硬件領(lǐng)域?qū)崿F(xiàn)了多項突破性進(jìn)展,為其「行為像人」做足了工程落地上的準(zhǔn)備。包括如下:
- 全身配置 26 個自由度,賦予 Moz1 更強(qiáng)的靈活性和操作范圍,勝任精細(xì)化、多姿態(tài)任務(wù);
- 搭載全球功率密度最高的一體化力控關(guān)節(jié),實現(xiàn)高輸出、高響應(yīng)動力表現(xiàn),并兼顧輕量化與緊湊結(jié)構(gòu);
- 國內(nèi)領(lǐng)先的高精高速 WBC(全身運動控制)系統(tǒng),優(yōu)化手腳聯(lián)動、軀干配合等復(fù)雜動作規(guī)劃;
- 負(fù)載自重比達(dá) 1:1,與自身重量相當(dāng)?shù)呢?fù)載能力使其在實際任務(wù)中具備更強(qiáng)實用性。
配合性能強(qiáng)大且深度融合的大小腦,Moz1 實現(xiàn)了多模態(tài)感知交互與全身協(xié)同。此外,Moz1 還做到了全身零延時遙操作,配合自研的多維度數(shù)采設(shè)備,能夠高效完成數(shù)據(jù)采集,并支撐模型小時級迭代。這樣一來,Moz1 從一臺單純的執(zhí)行機(jī)器化身為「邊干邊學(xué)」的數(shù)據(jù)閉環(huán)系統(tǒng)。
種種軟硬件突破,貫穿從算法模型到本體設(shè)計、從運動控制到任務(wù)執(zhí)行的全棧式優(yōu)化,使得 Moz1 具備了第一梯隊實力。這種「AI 模型進(jìn)化 + 硬件性能突破」的深度協(xié)同模式,構(gòu)筑起了千尋智能在具身智能賽道的核心技術(shù)壁壘和差異化優(yōu)勢
Spirit v1 以及 Moz1,是千尋智能成立一年多來交出的一份優(yōu)秀答卷。未來,千尋智能一方面繼續(xù)探索 VLA 模型與機(jī)器人本體在更多復(fù)雜環(huán)境與真實任務(wù)中的深度耦合與協(xié)同演進(jìn),進(jìn)一步提升系統(tǒng)的泛化能力與執(zhí)行穩(wěn)定性。
另一方面,在商業(yè)化布局上以需求為導(dǎo)向,深入制造業(yè)、服務(wù)業(yè)等上百個核心場景(如辦公場景、家庭場景)展開調(diào)研,瞄準(zhǔn)真實產(chǎn)業(yè)痛點并轉(zhuǎn)化為產(chǎn)品定義的核心參數(shù),形成「場景需求 — 技術(shù)攻關(guān) — 產(chǎn)品落地 — 市場反饋」的閉環(huán)開發(fā)邏輯,推動具身智能從技術(shù)驗證走向大規(guī)模商業(yè)應(yīng)用。
而作為行業(yè)少有的兼?zhèn)洹缸匝写竽P汀C(jī)器人本體、場景落地」全鏈路能力的創(chuàng)企,千尋智能的這種前瞻性布局,既契合了行業(yè)對機(jī)器人高度靈活性、通用性和自適應(yīng)性的需求,并朝著更智能、跨場景應(yīng)用方向演進(jìn)。
資本持續(xù)加碼,押注的不只是技術(shù)
ChatGPT 推出以來,除了大模型,資本也在尋找下一個爆點,其中能夠理解世界、進(jìn)行推理并執(zhí)行任務(wù)的具身機(jī)器人被認(rèn)為有望掀起下一波 AI 浪潮。
最后一兩年,在國內(nèi),無論是宇樹機(jī)器人這樣的頂流明星,還是千尋智能、智元機(jī)器人、星動紀(jì)元等具身智能新勢力,都受到了資本的高度青睞與追捧,進(jìn)入到一個融資集中爆發(fā)期。
就以千尋智能來說,成立不到一年半的時間,這家具身智能新秀憑借行業(yè)領(lǐng)先的 AI + 機(jī)器人全棧技術(shù)實力,先后完成了多輪融資,包括這周官宣的近 6 億元 PreA + 輪融資,由京東領(lǐng)投,中網(wǎng)投、浙江省科創(chuàng)母基金、華泰紫金、復(fù)星銳正等知名機(jī)構(gòu)跟投。同時順為資本、華控基金等老股東追加了投資。
一眾資本對千尋智能的高度認(rèn)可,靠的不單單是其領(lǐng)先的大模型技術(shù)和成熟的機(jī)器人產(chǎn)品,具身智能的賽道紅利以及創(chuàng)始團(tuán)隊的影響同樣不可忽視。
據(jù)此前高盛預(yù)測,到 2035 年,全球人形機(jī)器人市場規(guī)模有望達(dá)到 1540 億美元。這意味著巨大的增量市場空間等著包括中國在內(nèi)全球機(jī)器人玩家挖掘,資本持續(xù)看漲在意料之中。
不久前,英偉達(dá) CEO 黃仁勛在參加第三屆鏈博會期間,表示他對中國機(jī)器人發(fā)展非常樂觀,「中國擁有三大獨特優(yōu)勢,包括卓越的人工智能技術(shù)、擅長機(jī)電一體化、大規(guī)模制造業(yè)基地提供龐大的潛在市場」。老黃的這番言論一定程度上道出了中國在具身智能領(lǐng)域迅速崛起的原因。
隨著大模型與機(jī)器人深度融合,像千尋智能這樣的本土機(jī)器人企業(yè)憑借 AI 技術(shù)的積累、強(qiáng)大的硬件制造能力和豐富的應(yīng)用場景,正在形成從底層技術(shù)到終端產(chǎn)品的完整生態(tài)閉環(huán)。加上創(chuàng)始人兼 CEO 韓峰濤、聯(lián)合創(chuàng)始人高陽與鄭靈茵擁有的豐富全球市場實踐經(jīng)驗,形成「技術(shù)研發(fā) — 產(chǎn)品量產(chǎn) — 市場驗證」全鏈路,在具身智能賽道的激烈競爭中走出一條高效的成長路徑。
屆時,人形機(jī)器人在形態(tài)和技能上又會玩出什么新花樣,我們拭目以待。
文中視頻鏈接:https://mp.weixin.qq.com/s/htBN5Md4ISGkp7-GtgNFxA
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.