特斯拉擎天柱機器人最新訓(xùn)練成果,更多進(jìn)展即將公布!
特斯拉團隊展示了最新成果:
早期視頻中,擎天柱旁邊有根纜繩,據(jù)特斯拉機器人團隊解釋,這是預(yù)防意外跌倒的安全措施,并非實際支撐。畢竟是初期成果,穩(wěn)定性能,快速迭代是關(guān)鍵
后續(xù)更新的視頻里,Optimus就沒有纜繩了,動作是實時速度、無任何CGI特效,完全是模擬訓(xùn)練后零樣本遷移到現(xiàn)實的結(jié)果
核心看點
這次的核心看點,是擎天柱機器人完全通過強化學(xué)習(xí)(RL)在模擬環(huán)境中訓(xùn)練,并成功實現(xiàn)了到真實世界的“零樣本遷移”(Zero-shot transfer)
啥是“零樣本遷移”?簡單說,就像機器人先在虛擬世界(比如一個高級視頻游戲)里把一套復(fù)雜動作,比如跳舞、行走,練得滾瓜爛熟,然后直接拉到現(xiàn)實世界,第一次就能成功復(fù)現(xiàn),中間無需針對現(xiàn)實環(huán)境進(jìn)行額外調(diào)整或訓(xùn)練。你可以想象成一個學(xué)生在模擬器上把車練好了,一上真車就能直接開上路(當(dāng)然,現(xiàn)實駕考沒這么簡單哈)
技術(shù)優(yōu)勢:
1.高效:省去了大量真實世界調(diào)試的時間。
2.安全:早期探索可以在模擬器里“隨便作”,不用擔(dān)心損壞昂貴的機器人。
3.經(jīng)濟:降低了物理測試的成本。
為了實現(xiàn)這種“絲滑”的虛實轉(zhuǎn)換,團隊下了不少功夫:
大幅改進(jìn)了模擬器中的機器人模型,運用了領(lǐng)域隨機化(domain randomization)等技術(shù),增強模型對現(xiàn)實環(huán)境變化的適應(yīng)性。這些優(yōu)化不僅為了“炫技”,更會直接應(yīng)用于提升機器人行走穩(wěn)健性、全身敏捷控制等實用場景,同時,團隊也從硬件層面吸取了經(jīng)驗,并對電源配置進(jìn)行了調(diào)優(yōu)
模擬與現(xiàn)實的差距(sim-to-real gap)始終是難題。現(xiàn)實世界的光照變化、物體顏色差異、未曾遇見的地面材質(zhì)等,都可能讓在模擬器里“全能”的機器人到了現(xiàn)實就“水土不服”
也有網(wǎng)友評論,特斯拉可能存在夸大其自主性的情況,部分演示或許有人為干預(yù)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.