白交 一凡 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
這也太驚人了吧?!
注意看,這是一個機器人在跳舞,動作流暢,還是Breaking這種力量協(xié)調(diào)性要求很高的類型。
但它不光能動,靜下來“干活”也有模有樣:
無論是疊衣服、撕紙巾、拉窗簾、用筷子這種日常生活的精細化操作,還是工廠里的搬運、分揀、掃碼等工業(yè)任務(wù),都跟科幻電影里的一模一樣,甚至實現(xiàn)了機器人的群體協(xié)作。
而且這還是個大尺寸雙足人形機器人,它身高足足有171cm、體重65kg。在具身智能機器人領(lǐng)域,直接就是全尺寸里一步到位標(biāo)準(zhǔn)。
四肢發(fā)達,卻還能粗中有細,能動能靜。
放在機器人領(lǐng)域,背后一定還有個聰明大腦。
這就是來自星動L7機器人秀出的最新能力,打造者是清華叉院背景的明星團隊——星動紀(jì)元。在不久前,他們還以近5億新融資引發(fā)行業(yè)內(nèi)外熱議,沒想到烈火烹油,隨即就甩出上述驚艷新進展。
這些能力也直接創(chuàng)下多項紀(jì)錄:
- 首個完成360°旋轉(zhuǎn)跳的;首個會跳街舞breaking的;首個跑得比人快的,也是首個同時具備精細化操作的全尺寸人形機器人。
如此紀(jì)錄和能力背后,除了可以推測的AI大腦,也離不開機器人運動控制上的領(lǐng)先,據(jù)說它全身多達55個自由度——遠超特斯拉擎天柱等人形機器人標(biāo)桿。
國產(chǎn)具身TOP,果然亮相就是新高度。
中國首個!全尺寸人形機器人“既能整活,又能干活”
具體來說,星動L7是一款全尺寸人形機器人,身高171cm,體重65公斤,全身自由度達到了55個,然后僅依靠一個端到端具身大模型ERA-42,就能驅(qū)動全身靈活運動,這也是這次亮相里最令人驚嘆的地方。
機器人領(lǐng)域的專家,則重點從幾個“大動作”來看門道。
首先是360°旋轉(zhuǎn)跳躍,默默起勢,穩(wěn)穩(wěn)站住。
跑速同樣刷新了行業(yè)紀(jì)錄,可達4m/s。
而它除了能上舞臺表演,還能下車間干活,而且“粗中有細”。
比如能干重活累活,雙臂負重可達40斤。
同樣也能展現(xiàn)出輕輕撕下一片紙巾的控制感。
最后還可以進一步走進工廠擰螺絲,手持工具槍、食指控制開關(guān)鍵,精細作業(yè):
甚至之前代表硅谷機器人最前沿技術(shù)水準(zhǔn)的“疊衣服”,也不在話下:
當(dāng)然,你可能發(fā)現(xiàn)了,視頻有“bug”……因為不同場景下,星動紀(jì)元的產(chǎn)品形態(tài)并不一致。
這是因為,星動紀(jì)元首創(chuàng)了全尺寸和半身形態(tài)可選,用戶可以根據(jù)場景需求靈活選擇方案,降低綜合使用成本,解鎖更多更廣闊的市場。
總的來看,星動L7既有大個頭的力量與爆發(fā),也有小個子的靈活。相比自身過去的產(chǎn)品,手臂更纖細,手腕靈活度更高,結(jié)合大臂展,操作范圍更有優(yōu)勢。
對比行業(yè)來看,此前能打拳和跳舞的產(chǎn)品屢見不鮮,進車間打螺絲的機器人也并非沒有。
但能做到干活整活兩相宜的,少之又少。
這也是為什么星動L7一經(jīng)亮相,就引發(fā)了行業(yè)熱議。
為什么值得關(guān)注?
具身智能,作為技術(shù)發(fā)展自然衍生出的新概念,本質(zhì)上就是以模型為大腦、以機器人為本體,通過本體與環(huán)境的交互來實現(xiàn)智能行為。
雖然大思路是通的,但具體如何做?怎么做?大家就各有各的解法。
此次星動L7之所以值得關(guān)注,不僅在于它打破了那么多行業(yè)紀(jì)錄,更在于打破這些紀(jì)錄背后所展現(xiàn)的技術(shù)方案,值得參考。
為什么這么說?得從具身智能的發(fā)展來衡量,以終為始來看,應(yīng)該有這三個維度:
動態(tài)能力,任務(wù)執(zhí)行能力以及場景泛化能力。
動態(tài)能力:高爆發(fā)力動作如何實現(xiàn)?
機器人的動態(tài)能力是其穩(wěn)定性和可靠性的基礎(chǔ)。而像空翻、旋轉(zhuǎn)跳、舞蹈這樣的高爆發(fā)力動作,對機器人關(guān)節(jié)響應(yīng)速度和平衡控制算法提出了極高要求,已成為衡量行業(yè)玩家技術(shù)實力的重要標(biāo)桿。一旦成功實現(xiàn),就說明實力還不賴。
以往這些案例已經(jīng)有過不少,但要么是聚焦于小尺寸人形機器人,要么就是實時響應(yīng)不夠,連貫性跟不上來。
此次星動L7所展現(xiàn)的動態(tài)性能之所以驚艷眾人,核心在于其作為一款大尺寸人形機器人,成功攻克了高動態(tài)運動中的幾個關(guān)鍵難題,包括動力系統(tǒng)不足和平衡控制復(fù)雜等問題。
比如像360°旋轉(zhuǎn)跳這個動作,小尺寸機器人因體重輕,關(guān)節(jié)電機只需提供幾十N·m扭矩即可完成旋轉(zhuǎn)動作。
但是試想一下,一個130斤的大尺寸機器人,在旋轉(zhuǎn)起跳瞬間可能需要承受其本體2-3倍體重的沖擊,扭矩稍微不足就會失敗、響應(yīng)滯后一點就會失去平衡。
目前業(yè)內(nèi)知名玩家的峰值扭矩一般為360N·m、20rad/s的響應(yīng)水平,而星動L7配置的400N·m扭矩,直接打破了紀(jì)錄,它能夠支撐起瞬間爆發(fā)力量并完成動作;25rad/s毫秒級響應(yīng)能讓關(guān)節(jié)在0.1秒內(nèi)完成姿態(tài)調(diào)整,避免失衡,就解決了這個問題。
而連續(xù)跳舞更考驗機器人的平衡控制問題,當(dāng)重心持續(xù)發(fā)生劇烈偏移,就需要全身關(guān)節(jié)實時協(xié)同來實現(xiàn)平衡控制。小尺寸機器人實現(xiàn)就比較容易,個頭矮重心低,但大尺寸難度就比較高了。
據(jù)介紹,星動L7是通過兩項技術(shù)創(chuàng)新來解決這一難題的。
首先,是高達55個自由度的超冗余設(shè)計。值得說明的是,自由度數(shù)量越多,機器人活動就越靈活,能執(zhí)行的動作也就越復(fù)雜,但同時控制難度也顯著增加。
通常,人形機器人的自由度在40-50個之間,而星動L7將這一數(shù)字提升到了55個,這些自由度構(gòu)成一個高效的協(xié)同網(wǎng)絡(luò),借助先進算法實現(xiàn)毫秒級的關(guān)節(jié)實時聯(lián)動。
另一項技術(shù)創(chuàng)新則是基于運動數(shù)據(jù)訓(xùn)練的端到端強化學(xué)習(xí)。這種方法直接在傳感器數(shù)據(jù)與關(guān)節(jié)動作之間建立映射關(guān)系,無需依賴人工設(shè)計的平衡規(guī)則。它能根據(jù)實時動作要求,動態(tài)調(diào)整55個關(guān)節(jié)的輸出力度與角度,并通過持續(xù)與環(huán)境交互來優(yōu)化動作策略,從而實現(xiàn)精準(zhǔn)的實時平衡姿態(tài)控制。
除此之外,它采用關(guān)節(jié)準(zhǔn)直驅(qū)方案配合全棧自研模塊化骨架,以保證長尺寸機器人足夠輕量化并抗沖擊。
任務(wù)執(zhí)行能力:手速堪比電競選手,看視頻學(xué)習(xí)百種技能
其次,就是任務(wù)執(zhí)行的能力,換句話說,這就是干活的能力。如果干活能力不強,更何談應(yīng)用落地。
一言以蔽之,這不僅要看本體是否夠靈活,還得看大腦聰不聰明。
在本體側(cè),手部能力其實是重要的一環(huán)。星動L7的手部自由度已經(jīng)達到了12個,并且每只手指獨立驅(qū)動。相比于特斯拉擎天柱的11個自由度,星動L7能復(fù)現(xiàn)人類90%的手部動作,從而適配更多細分領(lǐng)域的工作場景。
而且每根手指能夠?qū)崿F(xiàn)10次/秒的點擊響應(yīng),堪比電競選手的操作速度。這樣一來,像電子裝配中“擰螺絲-掃碼-貼標(biāo)”這種連貫性高的工序也能順利完成。
除此之外,還有十軸手腕的設(shè)計(側(cè)擺±45°、前后±90°),這樣在裝配一些非標(biāo)零件時候,可以靈活調(diào)整姿態(tài),不需要頻繁轉(zhuǎn)動機身。
再來看大腦側(cè)。以往關(guān)于大腦如何訓(xùn)練,也有很多思路。比如在虛擬環(huán)境中進行強化學(xué)習(xí),這種方式雖有效,但會導(dǎo)致計算成本大幅增加,而落地到真實環(huán)境還需要做大量的適配工作;
還有像動作捕捉(通過人類手把手教學(xué)完成高精度任務(wù))也存在局限性——既依賴專業(yè)動捕設(shè)備,又需要針對每項任務(wù)執(zhí)行大量重復(fù)示范教學(xué),過程費時費力,且難以實現(xiàn)能力泛化。
目前行業(yè)公認最理想的方式之一是視頻訓(xùn)練,但僅有少數(shù)企業(yè)真正將其應(yīng)用落地,星動紀(jì)元就是其中之一。
星動L7背后的具身大模型ERA-42,其“世界模型”能力能讓機器人觀看人類操作視頻,直接學(xué)習(xí)技能。
這種基于視頻學(xué)習(xí)的方式具有高度擴展性,它依賴處理海量視頻數(shù)據(jù)來推斷動作執(zhí)行邏輯。從某種意義上說,機器人必須發(fā)展出“自我意識”。這樣一來,其顯著優(yōu)勢在于大幅降低數(shù)據(jù)采集成本,并能快速部署至各類新場景。
此外,支撐復(fù)雜場景適應(yīng)的另一關(guān)鍵,是其“長序列任務(wù)預(yù)判與抗干擾”能力:
- 高頻實時抗干擾:依靠ERA-42(30Hz以上)高頻的模型推理,機器人完成實時反饋來抗干擾;
- 前瞻性動作規(guī)劃:利用視頻預(yù)測能力,提前規(guī)劃最優(yōu)動作序列,確保操作“穩(wěn)準(zhǔn)狠”。
再配合靈活的四肢,感覺任一領(lǐng)域、任一場景都給包圓了。
場景泛化能力:全尺寸/半身形態(tài)隨意選
最后也是對于商業(yè)化來說最關(guān)鍵的:場景泛化能力。“既能整活,又能干活”就已經(jīng)囊括了廣泛的應(yīng)用場景。
除了大腦本身帶來的泛化性,它的本體也進行了模塊化設(shè)計的適配。
星動紀(jì)元首創(chuàng)了「全尺寸和半身形態(tài)」可選方案,機器人能根據(jù)場景靈活切換,進一步擴大了可適用的場景。
比如在工廠里,物流分揀、電子裝配選用半身形態(tài),可以減少空間占用,提升作業(yè)效率;而在商場、展會等需要全身動態(tài)表現(xiàn)的場景,就能切換至全尺寸形態(tài)。
也就是說,以后你在工廠里看到的,跟在商場里看到的,雖然形態(tài)各異,但可能都出自于同一個機器人。
星動L7極大地拓展了人形機器人的應(yīng)用邊界,其靈活的四肢和聰明的大腦,正在勾勒出真正意義上通用人形機器人的雛形。
支撐這一能力持續(xù)進化與邊界拓展的,是星動紀(jì)元在行業(yè)率先跑通的“模型-本體-場景數(shù)據(jù)”閉環(huán)飛輪。
問題是,為什么一定是星動紀(jì)元?
率先跑通物理AI閉環(huán)飛輪的玩家
如果了解星動紀(jì)元的創(chuàng)辦背景和獲得的行業(yè)認可,或許就會很意外。
星動紀(jì)元成立于2023年8月,是清華大學(xué)唯一持股的具身智能企業(yè),創(chuàng)始人兼CEO陳建宇是清華大學(xué)學(xué)士,加州大學(xué)伯克利大學(xué)博士,現(xiàn)任清華大學(xué)交叉信息研究院助理教授博士生導(dǎo)師,擁有10+年機器人和AI研發(fā)經(jīng)驗。
硬核團隊深耕底層技術(shù)研發(fā),引發(fā)資本看好,成立兩年不到就完成多輪融資,投資者包括聯(lián)想創(chuàng)投、阿里巴巴、海爾資本等。
充足的彈藥能夠持續(xù)不斷支撐星動紀(jì)元的技術(shù)研發(fā)。其產(chǎn)品在科研和商用等場景落地,商業(yè)化成果顯著。
星動紀(jì)元今年已交付超200臺產(chǎn)品,另有上百訂單還在交付中。全球TOP10市值科技巨頭里,已有9家是星動紀(jì)元的客戶。在科研方面,星動紀(jì)元產(chǎn)品已成為全球開發(fā)者市場首選,包括字節(jié)跳動機器人實驗室、麻省理工大學(xué)、斯坦福、加州大學(xué)伯克利分校的頂尖人才都在用。
所以說星動紀(jì)元不僅在國內(nèi)知名,而且海外馳名。出海業(yè)務(wù)發(fā)展迅猛,年初布局僅半年,海外市場收入占比已超過50%。今年的CES上,老黃曬出的14款人形機器人,里面就有星動L7的前身星動STAR 1。
輔助科研,落地商用,走出國門,這也為星動紀(jì)元提供了豐富的場景數(shù)據(jù),成為其先發(fā)優(yōu)勢之一。
一家創(chuàng)新企業(yè),為何能迅速出圈?歸根結(jié)底,是源自于星動紀(jì)元的技術(shù)實力。從成立之日起,星動紀(jì)元便決定走一條難而正確的道路——軟硬結(jié)合,打造物理世界的通用機器人。
通用機器人包括兩個層面:通用大腦和通用本體。
星動紀(jì)元在通用大腦的最新成果是端到端原生機器人大模型ERA-42,這是業(yè)界首次:僅通過同一個具身大模型驅(qū)動全身靈巧——不但能做大動作,還實現(xiàn)了五指靈巧手的類人手操作能力,可靈活運用多種多樣、形態(tài)各異的工具完成上百種復(fù)雜任務(wù)。
ERA-42主要有三大亮點,首先是架構(gòu)創(chuàng)新,降低了數(shù)據(jù)成本和真機數(shù)據(jù)依賴。
對比此前Figure AI出品的VLA模型Helix,ERA-42的優(yōu)勢很大。對比來看,Helix利用500個小時的遠程操作數(shù)據(jù),學(xué)會的任務(wù)數(shù)尚且還不到100個;而星動紀(jì)元的ERA-42,只需要約10個小時的真機數(shù)據(jù),就能學(xué)會上百種任務(wù),堪稱業(yè)內(nèi)領(lǐng)先。
背后的秘訣在于,星動紀(jì)元是從第一性原理出發(fā),其人形機器人學(xué)習(xí)數(shù)據(jù)時,并非直接模仿行為,而是學(xué)習(xí)行為背后的因果關(guān)系——即做出該行為后,會導(dǎo)致什么樣的結(jié)果。這樣就能理解背后統(tǒng)一的物理規(guī)律,實現(xiàn)完全泛化。
第二是可跨任務(wù)學(xué)習(xí),因為ERA-42的泛化能力很強,通過單一策略就能執(zhí)行新的操作任務(wù)。只要輸入一句文本或語音,加上感知硬件數(shù)據(jù),就能直接端到端輸出操作,泛化到從未見過的環(huán)境或任務(wù)。
比如此前星動紀(jì)元曾采集簡單的紅黃藍方塊抓取數(shù)據(jù),就能抓取任務(wù)泛化到從未見過的多樣化物體,比如胡蘿卜和茄子等,相比其他模型算法在泛化任務(wù)上顯著提升了成功率。
最后是跨本體遷移,一個VLA大模型,打通單機械臂、雙機械臂、上半身。這意味著L7能實行形態(tài)定制,背后依靠的不僅僅是硬件優(yōu)勢,還體現(xiàn)了其模型的泛化能力。
這同時也體現(xiàn)了星動紀(jì)元的硬件能力,實現(xiàn)了通用化和模塊化,就像搭建樂高一樣打造通用本體。自研五款關(guān)節(jié)模組,包括無框力矩電機、高性能空心杯電機、高功率驅(qū)動器及控制單元和低減速比減速器。因為自身掌握著關(guān)鍵技術(shù),所以本體能快速更新,2年迭8代。
實現(xiàn)通用模型和通用本體后,這兩大核心部件還面臨著一個共同的問題——數(shù)據(jù)瓶頸。高質(zhì)量數(shù)據(jù)的缺乏,長期困擾著行業(yè),但獲取真機數(shù)據(jù)成本高,選擇仿真模擬難度又大,數(shù)據(jù)類型比較單一。
星動紀(jì)元解決的策略是,采用海量無標(biāo)注互聯(lián)網(wǎng)視頻數(shù)據(jù),結(jié)合少量獨家真機數(shù)據(jù),全量提取,無損傳輸,讓機器人更高效且低成本地理解物理世界。
低成本獲取場景數(shù)據(jù),強化模型大腦,驅(qū)動硬核本體。總結(jié)來看,星動紀(jì)元在具身智能行業(yè),率先跑通了「物理AI時代的閉環(huán)飛輪」,即“模型-本體-場景數(shù)據(jù)”,就像跑通了AI模型時代的“算力、算法、數(shù)據(jù)”三要素。
這樣的玩家在其他賽道并非沒有先例,比如上一波物理AI浪潮中,最火熱的創(chuàng)業(yè)賽道Robotaxi。特斯拉自研FSD模型,打造Model系列為本體,為FSD獲取了海量的場景數(shù)據(jù),如今已成為Robotaxi賽道的超級明星。
現(xiàn)在,具身智能取Robotaxi而代之,成為物理AI最性感、最前沿的賽道,而星動紀(jì)元率先跑通物理AI的閉環(huán)飛輪,成為具身智能領(lǐng)域,代表國產(chǎn)最先進水平、乃至全球最先進水平的新明星。
果然,江山代有才人出。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.