起猛了,好像看見狗騎自行車了!還跳上了比自己還高的桌子:
還有大家熟悉的波士頓動力Spot機器狗,展現出了前所未有的狂野一面——以5.2米/秒的速度狂奔,相當于時速11.6英里。
要知道,Spot的出廠版本最高速度是1.6米/秒。這意味著,它的速度提升了超過3倍!和以前簡直判若兩狗。
這些來自RAI研究所(前波士頓動力AI研究所)昨天夜里曝光的視頻。
▍解放天性:從被動控制到自主探索
不過細心的觀眾可能已經發現,這只"狂飆版"Spot的奔跑姿態看起來有點怪異,完全不像真實的狗。
RAI研究所的機器人專家Farbod Farshidian解釋說:"沒錯,這種步態確實不像生物,但別忘了Spot本身就不是生物。它的驅動器不是肌肉,運動結構也和真狗不同,所以最適合它的奔跑方式自然也會不一樣。"
Farshidian能對Spot的運動方式做出的最好描述是:它有點類似于小跑步態,但增加了一個"飛行相"(四只腳同時離地),這在技術上使其變成了真正的奔跑。
Farshidian說,這個飛行相是必需的,因為機器人需要這段時間來連續向前收回腳步,以維持速度。
最神奇的是,這種奔跑方式不是研究人員刻意設計的,而是機器狗自己"悟"出來的。
研究人員只給了一個簡單的目標:盡可能快地移動。至于怎么跑,完全由機器狗自己探索。最終它找到了這種看似怪異但效率最高的方式。
▍找到真正瓶頸:從MPC到強化學習
為什么原版Spot跑不快?問題出在控制系統上。
波士頓動力出廠的Spot使用的是模型預測控制(MPC)。簡單說,就是先在軟件里建立一個機器人的近似模型,然后實時計算最優控制方案。
這種方法很可靠,但太過保守。因為模型越精確,計算量就越大。為了保證實時性,只能用簡化模型,自然就放不開手腳。
RAI研究所采用了完全不同的思路:強化學習。
這種方法的好處是可以離線訓練。你可以用超精確的模型,在仿真環境中慢慢訓練,最后得到一個高效的控制策略。
更厲害的是,通過這種方法,研究人員發現了一個意外的瓶頸:限制Spot速度的不是驅動器本身,也不是機器人的運動學特性:僅僅是電池無法提供足夠的功率!
"這真是個驚喜,"Farshidian說,"我們原以為會先碰到驅動器的極限。"
如果能接入更強勁的電池,Spot或許能跑得更快。但目前研究團隊無法訪問電池電壓數據,所以還沒法把這部分納入強化學習模型。
重點是,這種技術不只是為了讓機器狗跑快。它可以用來提高效率、降低噪音,或者實現其他各種性能優化。這是一個通用工具,可以幫助任何機器人發掘潛力。
▍無需陀螺儀的平衡:會跳躍的自行車表現驚人
如果說讓機器狗跑快還在意料之中,RAI研究所的下一個"黑科技"可能會讓你大吃一驚:他們造了一輛會跳躍的自行車機器人!咋一看很像機器狗騎自行車!
這臺被命名為"超級機動載具"(Ultra Mobility Vehicle,簡稱UMV)的機器人,看起來就是一輛小型自行車,但它能完成讓人驚嘆的動作:自主平衡、前后行駛,甚至能跳上比自己還高的桌子!
更神奇的是,這輛自行車沒有任何陀螺儀之類的物理穩定系統。它就是一輛普通的自行車,只能前后移動和轉動前輪。秘密在于車身上方集中了大量質量,通過特殊的驅動器可以快速上下運動。
"這個項目展示了兩個關鍵突破,"RAI研究所蘇黎世辦公室主任Marco Hutter解釋道,"首先是強化學習如何幫助UMV在各種復雜環境下保持穩定駕駛。其次是通過深入理解機器人的動態特性,讓它完成跳上高臺這樣的高難度動作。"
看似簡單的后退對UMV來說都是一項挑戰。"后退時系統極不穩定,"Hutter說,"用傳統的控制方法幾乎不可能在崎嶇地形或有干擾的情況下完成這個動作。"
在模擬環境中教UMV自主下樓梯,最終使真實機器人能夠應對任意角度的樓梯:
RAI研究所表示,讓這個機器人走出實驗室到地形上進行真正的自行車跑酷還在進行中,他們將在不久的將來展示。
▍數據驅動進化:模擬與現實的良性互動
讓機器人從模擬世界學到的技能遷移到現實一直是個難題。原因很簡單:模擬環境對機器人太友好了。
"只要花夠時間,你總能設計出讓機器人完成任務的獎勵函數,"Farshidian解釋說,"但問題在于把模擬中的行為遷移到硬件上。因為強化學習太擅長發現模擬器的漏洞并利用它們完成任務了。"
不過,隨著新工具的出現、動力學模型的完善和計算能力的提升,模擬正變得越來越強大。"我們現在幾乎可以免費生成海量數據,這是一個巨大的優勢,"Hutter說。
但數據的價值在于它與現實的聯系。確保模擬足夠準確,讓強化學習真正解決現實問題,這才是關鍵。
RAI研究所的方案是:把真實硬件收集的物理數據反饋到模擬中。無論是奔跑的四足機器人,還是會跳躍的自行車,甚至是人形機器人,這種模擬與現實結合的方法都顯示出巨大潛力。
就在幾周前,RAI研究所宣布與波士頓動力合作,致力于通過強化學習推進人形機器人的發展。雖然人形機器人有更多自由度,建模和模擬都更復雜,但在傳統控制方法面臨瓶頸的情況下,強化學習似乎是一個必然的選擇。
"作為一個研究所,我們的目標是開發適用于各種平臺的通用解決方案,"Hutter說,"這不僅是關于構建工具和基礎設施,更是為了在更廣泛的背景下應用這些技術。在模擬環境中做強化學習研究并展示概念驗證是一回事,但要讓它在各種條件下都能在現實世界中可靠工作,同時突破性能極限,這是另一個層次的挑戰。"
看來,無論是奔跑的機器狗,還是會跳躍的自行車,或許都只是RAI研究所野心的開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.