新智元報道
編輯:桃子 Aeneas
【新智元導讀】剛剛,繼4月初獲得5.28億融資后,短短2個月,國內頂尖具身智能玩家又斬獲近6億元融資!不久前,其首款商用級人形機器人Moz1震撼發布,可單手精準抽紙,具備超強感知與執行力。憑借三維核心競爭力,他們正向萬億級賽道加速沖刺。
2025年,具身智能賽道風起云涌,迎來爆發式增長。
從硅谷到中國,多家科技巨頭與初創黑馬同臺競技,掀起了AI從虛擬世界走向物理世界的熱潮。
谷歌AI模型Gemini Robotics,在推理和靈巧操作上,都展現出超強的類人實力;
Figure AI自研的端到端VLA模型——Helix,讓機器人從語言理解到動作執行一氣呵成;
還有UC伯克利系出身的Physical Intelligence,多次迭代π系列模型,通過多平臺訓練,攻克了洗衣、收納等復雜任務。
可見,在這片巨大紅海中,從不缺少重量級玩家。在技術迭代與資本助推下,全球的目光都聚焦于這場通往「通用機器人」的終極競賽。
在中國,這條賽道同樣如火如荼。眾多機器人公司競相涌入,試圖在這萬億級市場中搶占先機。
然而,真正能坐上牌桌,躋身第一梯隊的玩家,卻屈指可數。
成立僅一年多的具身智能公司——千尋智能,正是這場競賽中的關鍵突圍者。
具身智能引領者
頂級資本競逐
就在剛剛,千尋智能完成了近6億元PreA+新一輪融資,投資陣容星光熠熠。
本輪融資由京東領投,中國互聯網投資基金(簡稱「中網投」)、浙江省科創母基金、華泰紫金、復星銳正等知名機構跟投。
此次融資的順利完成,將為千尋智能帶來「資金+產業」資源的雙重賦能。
堪稱傳奇的是,從2024年2月成立至今,這家公司便以驚人速度完成了多輪融資,成為資本市場的寵兒。
更值得關注的是,上一輪領投的P7在本輪持續超額加碼;除此之外,順為資本、華控基金、華發集團、千乘資本、靖亞資本、弘暉基金等老股東的繼續下注,則是對千尋發展潛力的持續背書。
這一次,京東的領投,尤其引人注目。
作為中國電商與物流巨擘,京東的投資邏輯清晰且務實:聚焦核心業務效率、優化用戶體驗,并推動產業升級的技術創新。
可以說,千尋技術與硬件能力與倉儲等多樣化場景深度協同。
京東集團出手,不僅彰顯了千尋在物流等高價值場景的潛力,也折射出其在具身智能賽道中的獨特價值。
千尋創始人兼CEO韓峰濤表示,「重量級產投方的齊聚,不僅是對千尋智能的認可,更折射出產業界對具身智能賽道未來價值的高度共識」。
在具身智能這片紅海,千尋智能究竟做對了什么,引得全明星產投方紛紛下注?
千尋Moz1霸氣登場
辦公室雜活全包了
就在不久前,千尋智能的首款商用級人形機器人——Moz 1重磅登場了!
可以說,Moz1的首秀,直接一舉刷新了具身智能新高度。
首先,作為國內首個高精度全身力控的具身智能機器人,它擁有26個自由度(不含靈巧手)。
因為基于全球功率密度最高的一體化力控關節打造,它在速度、精度、安全性和仿生力控方面,都達到了行業的頭部水平。
據悉,Moz1一體化關節的功率密度直接比特斯拉Optimus高出了15%,充分展示了千尋智能在機器人硬件上的強大實力
由于搭載了頂級的運控系統和VLA模型,它具有超凡的感知決策能力,性能全面躍升。
比如現在,它可以輕松駕馭各種復雜任務,包括家里和公司中的各種雜活。
開完會議,Moz 1就可以幫我們收拾會場,把桌上的雜物一件件撿進收納盒。
國內領先的高精高速WBC全身運動系統,甚至能讓它完成更換紙巾這樣精密度極高的動作。
這個任務中,Moz1充分體現了自己的多模態感知交互能力,和全身協同的控制能力。
甚至能精確到抽出單張抽紙
因為具備深度融合的大小腦,Moz1的性能極其強大。
自主完成擦黑板、關燈這些任務后,它就乖乖待在會議室里,等待人類的下一次召喚了。
同時,因為還內置了自研的多維度數采設備(比如VR/動捕/同構形等),Moz 1能夠實現模型的小時級迭代,以極其硬核的硬件,充分支撐技術落地。
它的全身都可以實現零延時遙操,整個過程絲滑柔順。
看著它在公司內部來回穿梭、充分融入大家工作流的樣子,我們就知道——如今,是時候重新定義「勞動力」了!
網友銳評道:沒想到,上次那個最會疊衣服的機器人,現在又升級了,簡直讓保潔阿姨瑟瑟發抖。
在商用場景,它可以絲滑完成整理、接待、導覽等任務,那么家庭場景的陪伴、互動和服務,當然也不在話下了。
自研端到端VLA,「邊想邊做」神同步
眾所周知,具身智能的核心,在于賦予機器人感知、理解和行動的能力。
千尋首款商用級Moz1人形機器人之所以具備強大理解泛化能力,離不開具身智能「大腦」VLA(視覺-語言-動作)模型的加持。
為此,千尋自研了一款端到端具身模型——Spirit v1,通過數據融合與訓練策略,實現了視覺感知、語言理解、動作執行的無縫銜接。
Spirit系模型在短短半年的時間迭代了三版,實現了從單一基礎任務到高難度長程+數十個任務完成的階躍式進步
舉個栗子,疊衣服這一看似簡單的任務,實則對機器人提出了極高挑戰:每件衣服的褶皺、形狀各異,要比抓糖豆、倒水等任務高出百倍。
Spirit v1通過動態場景感知和精確動作控制,完成了從抓取、鋪平、折疊到堆疊的全流程,成功率達70%-80%。
而且,它同時完成任務的能力,已從過去的5個擴展到10個,逼近國際領先π系模型。
Spirit v1的成功,源于其獨特的三層訓練架構,通過融合視頻預訓練、遙操模仿學習和RL,構建了高效、泛化的技術壁壘。
這款VLA模型共有70億參數,基于13000小時數據訓練。其中,70%來自海量的互聯網視頻。
通過端到端學習,Spirit v1直接從視頻中提取視覺和動作信息,掌握物體的形態變化、動作邏輯,以及場景動態性。
這種方法,能夠賦予模型廣泛的真實世界先驗知識,顯著提升泛化能力,使其快速適應多種場景。
在預訓練基礎上,20%的遙操數據通過千尋自研的EfficientImitate算法進行精調。
在端到端框架下,遙操作模仿學習進一步優化了Spirit v1性能,實現了從示范到自助操作的平滑過渡。
剩余10%的強化學習數據,則采用全球樣本效率最高的EfficientZero強化學習算法,讓機器人通過自主探索優化行為策略。
論文地址:https://arxiv.org/pdf/2111.00210
論文地址:https://arxiv.org/pdf/2403.00564
以上三層架構,不僅解決了訓練「數據荒」的瓶頸,還讓Spirit v1在動態環境中展現出強大的自主性和適應性。
更令人矚目的是,今年5月,千尋首席科學家高陽帶領團隊提出了OneTwoVLA模型,實現了全新的突破。
這一創新架構將傳統機器人系統中,分離的「推理大腦」和「動作四肢」熔煉為單一Transformer模型,真正實現了「邊想邊做」。
論文地址:https://arxiv.org/pdf/2505.11917
在長程任務實驗中,OneTwoVLA加持的機器人能順利流暢完成涮火鍋、炒菜、調雞尾酒等復雜任務,成功率比純動作VLA提升30%。
如下示例中,當你要求「幫我涮牛肉」,OneTwoVLA會在每一步預測開始推理,還是開始執行。
它還能實現錯誤檢測與恢復,實時察覺抓偏/失手,并能快速調整。
OneTwoVLA的通用視覺定位,還能準確識別未見過的雪碧罐,或是星巴克杯子,展現了超強的開放世界理解能力。
OneTwoVLA的代碼與數據已全部開源,標志著千尋在通用機器人技術路線上的新里程碑,也為行業提供了更簡潔、可擴展的具身智能路徑。
商業戰略
精準布局,贏取先機
這家具身智能實力派的成功不僅在于技術突破,更在于其以市場需求為導向的商業化邏輯。
從創立之初,千尋便組建了專門產品團隊,深入能源電池、物流、餐飲、康養等上百個場景進行調研。
他們基于成熟的商業化經驗,精準切入高價值場景,大規模部署高效收集的海量數據,持續反哺模型優化。
最終,形成了一個「場景需求—技術攻關—產品落地—市場反饋」獨特且有效的商業閉環模式。
這種策略確保了技術研發與實際應用無縫銜接,顯著降低落地的風險,更是贏得產投方的極大認可。
在辦公場景中,千尋機器人展現出了強大的靈活性。我們看到了,Moz1能自主完成會議室清潔任務,收納筆、擦拭白板等等。
據判斷,在物流場景中,智能倉儲體系對高效、靈活機器人的需求將極其旺盛,正好千尋機器人也能適配貨物分揀、動態搬運等復雜任務。
放眼未來,千尋還計劃從辦公場景逐步向制造、服務業、醫療、康養等高附加值場景滲透,目標直指萬億級市場。
尤其在海外市場,歐美高人工的成本地區,付費意愿強。而創始團隊的國際化經驗,恰恰為其提供了堅實支撐。
他們曾帶領機器人海外事業部實現了從0到1的商業化落地成果,為千尋的全球化戰略奠定了基礎。
這種清晰的市場拓展途徑,不僅展現了千尋的商業前瞻性,也成為吸引頂級投資方的關鍵因素。
差異化,打贏市場之路
深挖之后可以發現,在如今競爭激烈的具身賽道,最終突出重圍的之所以是千尋智能,還是因為它走了一條「少有人走的路」。
在技術上,VLA模型與硬件協同的獨特技術路線,讓它在一眾競家中走出了自己的特色。
快速的迭代能力,更是把許多同行甩在身后。
團隊上,它擁有如今機器人領域的全球頂尖人才,技術背景過硬,行業眼光高瞻遠矚。
在商業上,它靠精準的場景調研和市場布局,打出了自己獨特的一片生態位。
從高附加值場景切入,在此基礎上進行多場景的拓展策略,更是獨具慧眼。
因此,在瞬息萬變的市場競爭中,它始終能占據有利地位,充分獲得了產投方的信任和投資。
可以說,在技術、商業、團隊和市場上,千尋智能幾乎沒有短板。
因此,才得以造就這位具身智能賽道的領軍者。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.