近日,蘋(píng)果發(fā)布了關(guān)于機(jī)器人及其訓(xùn)練方法的最新研究成果。此前,蘋(píng)果在機(jī)器人領(lǐng)域已有過(guò)探索,像研發(fā)過(guò)機(jī)器人臺(tái)燈等產(chǎn)品,而此次研究則聚焦于人形機(jī)器人這一更具挑戰(zhàn)性的方向。
名為《Humanoid Policy ~ Human Policy》的研究報(bào)告,深入剖析了傳統(tǒng)人形機(jī)器人培訓(xùn)方法的弊端。傳統(tǒng)方法過(guò)度依賴(lài)機(jī)器人演示者,不僅過(guò)程“勞動(dòng)密集型”,還需要投入大量資金用于“昂貴的遠(yuǎn)程操作數(shù)據(jù)收集”。針對(duì)這些問(wèn)題,蘋(píng)果提出了一種可擴(kuò)展且經(jīng)濟(jì)高效的新型解決方案。
蘋(píng)果建議采用綜合訓(xùn)練方法,將人類(lèi)教練與機(jī)器人演示者相結(jié)合應(yīng)用于訓(xùn)練過(guò)程。這種做法的優(yōu)勢(shì)在于能夠有效降低培訓(xùn)成本。蘋(píng)果利用改進(jìn)的消費(fèi)產(chǎn)品來(lái)制作人形機(jī)器人培訓(xùn)材料。
例如,對(duì) Apple Vision Pro 進(jìn)行改裝,使其僅通過(guò)左下方攝像頭進(jìn)行視覺(jué)觀察,同時(shí)借助 Apple ARKit 獲取 3D 頭部和手部姿勢(shì)信息。此外,還使用了配備迷你 ZED 立體攝像頭的改裝 Meta Quest 頭顯,打造出低成本的培訓(xùn)方案。
在具體訓(xùn)練操作中,這些改裝后的頭顯主要用于訓(xùn)練人形機(jī)器人的手部動(dòng)作。人類(lèi)教練按照要求坐直,雙手執(zhí)行抓取、舉起特定物體以及倒出液體等一系列動(dòng)作。在錄制動(dòng)作過(guò)程中,頭顯會(huì)同步提供語(yǔ)音指令。錄制完成后,將畫(huà)面放慢,以便用于人形機(jī)器人的訓(xùn)練。
蘋(píng)果還構(gòu)建了一個(gè)處理培訓(xùn)材料的模型,即“物理人機(jī)數(shù)據(jù)(PH2D)”。與之配套的“人機(jī)動(dòng)作轉(zhuǎn)換器(HAT)”模型,能夠同時(shí)處理人類(lèi)和機(jī)器人創(chuàng)造的輸入數(shù)據(jù)。蘋(píng)果研究人員成功將人類(lèi)和機(jī)器人演示源整合到一個(gè)“可泛化的策略框架”中。
研究報(bào)告顯示,蘋(píng)果這種獨(dú)特方法相較于僅使用真實(shí)機(jī)器人數(shù)據(jù)訓(xùn)練的方法,在策略魯棒性和泛化性方面有了顯著提升。
從實(shí)際效果來(lái)看,使用這種綜合訓(xùn)練策略?xún)?yōu)勢(shì)明顯。不僅具有成本效益,而且訓(xùn)練出的機(jī)器人在特定任務(wù),如垂直物體抓取上,表現(xiàn)優(yōu)于僅使用機(jī)器人演示器的機(jī)器人。不過(guò),目前這種優(yōu)勢(shì)僅體現(xiàn)在特定任務(wù)領(lǐng)域。
展望未來(lái),蘋(píng)果很可能會(huì)在后續(xù)產(chǎn)品中應(yīng)用這種訓(xùn)練方法。盡管目前蘋(píng)果僅展示了機(jī)器人燈的原型,但有消息稱(chēng),蘋(píng)果正在為終端消費(fèi)者開(kāi)發(fā)一款能夠執(zhí)行家務(wù)和簡(jiǎn)單任務(wù)的移動(dòng)機(jī)器人,這無(wú)疑讓人對(duì)蘋(píng)果在機(jī)器人領(lǐng)域的未來(lái)發(fā)展充滿(mǎn)期待。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.