在物理人機(jī)協(xié)作(physical Human-Robot Collaboration,簡(jiǎn)稱pHRC)領(lǐng)域,實(shí)現(xiàn)安全且高效的協(xié)作,精準(zhǔn)的人類意圖估計(jì)以及合理的人機(jī)角色分配是關(guān)鍵要素。這兩者相互關(guān)聯(lián)、缺一不可,直接影響到人機(jī)協(xié)作的整體效果與安全性。
從技術(shù)實(shí)現(xiàn)層面來看,目前行業(yè)內(nèi)普遍采用的意圖估計(jì)方法,主要依賴于短期運(yùn)動(dòng)數(shù)據(jù)。然而,這種方法存在明顯的局限性。由于缺乏多步預(yù)測(cè)能力,機(jī)器人難以對(duì)人類意圖的長(zhǎng)期變化趨勢(shì)進(jìn)行感知。在復(fù)雜多變的人機(jī)協(xié)作場(chǎng)景中,人類意圖并非一成不變,而是會(huì)隨著任務(wù)進(jìn)展、環(huán)境變化等多種因素動(dòng)態(tài)調(diào)整。但基于短期運(yùn)動(dòng)數(shù)據(jù)的意圖估計(jì)方法,無法提前預(yù)判這些潛在變化,進(jìn)而導(dǎo)致機(jī)器人難以自主、合理地調(diào)整人機(jī)角色分配。
這種技術(shù)缺陷帶來的直接后果,便是潛在的人機(jī)分歧,嚴(yán)重時(shí)甚至可能對(duì)協(xié)作任務(wù)的安全性和效率造成不利影響。因此,如何突破現(xiàn)有方法的局限,提升人機(jī)協(xié)作中的意圖估計(jì)與角色分配能力,成為當(dāng)前物理人機(jī)協(xié)作領(lǐng)域亟待解決的重要問題。
▍提出全新框架DTRT,破局物理人機(jī)協(xié)作難題
針對(duì)上述挑戰(zhàn),來自中國科學(xué)院自動(dòng)化研究所與靈寶CASBOT的研究人員攜手合作進(jìn)行了深入研究,并共同提出了一種基于對(duì)偶Transformer的物理人機(jī)協(xié)作框架Dual Transformer-based Robot Trajectron,(以下簡(jiǎn)稱“DTRT”)。
從技術(shù)實(shí)現(xiàn)角度來看,針對(duì)協(xié)作中“意圖估計(jì)不準(zhǔn)確、角色切換不靈活”的核心問題,DTRT通過采用分層結(jié)構(gòu),利用人類引導(dǎo)的運(yùn)動(dòng)和力數(shù)據(jù)來快速捕獲人類意圖變化,從而實(shí)現(xiàn)準(zhǔn)確的軌跡預(yù)測(cè)和動(dòng)態(tài)機(jī)器人行為調(diào)整,并最終實(shí)現(xiàn)有效的物理人機(jī)協(xié)作。
基于雙變壓器的機(jī)器人軌跡器,用于人類意圖估計(jì)和角色分配
值得關(guān)注的是,其相關(guān)研究成果“增強(qiáng)物理人機(jī)協(xié)作中的人類意圖估計(jì)和人機(jī)角色分配”方法(DTRT: Enhancing Human Intent Estimation and Role Allocation for Physical Human-Robot Collaboration)已獲得機(jī)器人與自動(dòng)化領(lǐng)域全球頂級(jí)會(huì)議ICRA 2025的錄用。
▍面向物理人機(jī)協(xié)作關(guān)鍵挑戰(zhàn),革新意圖估計(jì)與角色分配
物理人機(jī)協(xié)作(pHRC)在制造、醫(yī)療保健和服務(wù)等多個(gè)領(lǐng)域都發(fā)揮著重要作用,但要實(shí)現(xiàn)機(jī)器人與人類之間的無縫協(xié)作,就需要制定有效的策略確保機(jī)器人能夠準(zhǔn)確估計(jì)人類意圖,并能夠根據(jù)實(shí)際情況動(dòng)態(tài)調(diào)整自身行為,以更好地協(xié)助人類開展工作。因此,精確的人類意圖估計(jì)和合理的人機(jī)角色分配,成為提高pHRC性能的關(guān)鍵挑戰(zhàn)。
從技術(shù)層面來看,基于人類意圖對(duì)未來軌跡的準(zhǔn)確預(yù)測(cè),對(duì)于機(jī)器人輔助的有效性和pHRC的安全性而言意義重大。在存在潛在危險(xiǎn)的復(fù)雜環(huán)境中,例如當(dāng)機(jī)器人遇到未知障礙物時(shí),人類意圖可能會(huì)迅速發(fā)生變化,這給意圖估計(jì)工作帶來了巨大的挑戰(zhàn)。目前,主流的方法主要依賴于短期運(yùn)動(dòng)數(shù)據(jù),如位置和速度等信息。然而,這些短期數(shù)據(jù)在檢測(cè)人類意圖變化方面存在明顯局限,進(jìn)而影響了預(yù)測(cè)的準(zhǔn)確性和安全性。此外,短期數(shù)據(jù)還會(huì)降低長(zhǎng)期協(xié)作中意圖估計(jì)的有效性。因此,研究如何將人類施加的力量整合到pHRC的長(zhǎng)期預(yù)測(cè)方法中,對(duì)于實(shí)現(xiàn)準(zhǔn)確的意圖估計(jì)至關(guān)重要。
與此同時(shí),人機(jī)角色分配涉及一種復(fù)雜的機(jī)制,該機(jī)制負(fù)責(zé)在人類和機(jī)器人之間分配任務(wù)控制權(quán)。這一過程需要實(shí)時(shí)協(xié)調(diào)人機(jī)關(guān)系,以減少分歧,提高機(jī)器人的輔助水平。現(xiàn)有的人機(jī)角色分配方法主要依賴阻抗/柔順性控制,通過修改模型參數(shù)來確定角色。在各種方法中,基于博弈論的角色分配模擬了多參與者之間的協(xié)作過程,將目標(biāo)設(shè)定為最小化成本函數(shù),以實(shí)現(xiàn)最優(yōu)的人機(jī)協(xié)同關(guān)系。但即便如此,確保機(jī)器人行為與人類意圖保持一致,同時(shí)又能維持機(jī)器人的自主性和靈活性,仍然是一個(gè)亟待解決的重大挑戰(zhàn)。
就如何在物理人機(jī)協(xié)作領(lǐng)域提升人類意圖估計(jì)和人機(jī)角色分配的準(zhǔn)確性這一關(guān)鍵目標(biāo),DTRT框架做出了創(chuàng)新性的探索。其人類意圖估計(jì)模塊利用了兩個(gè)基于Transformer的條件變分自編碼器(Conditional Variational Autoencoder, CVAE)。具體而言,該模塊將機(jī)器人在無障礙物情況下的運(yùn)動(dòng)數(shù)據(jù)與避障時(shí)人類引導(dǎo)的軌跡和力進(jìn)行了有機(jī)結(jié)合。
為了確保機(jī)器人的行為與人類意圖一致,研究團(tuán)隊(duì)還采用了基于人類施加力的微分合作博弈論(Differential Cooperative Game Theory,簡(jiǎn)稱DCGT)與現(xiàn)有方法相比,DTRT將人類動(dòng)態(tài)納入長(zhǎng)期預(yù)測(cè),提供更準(zhǔn)確的意圖理解,進(jìn)而實(shí)現(xiàn)合理的人機(jī)角色分配,提升機(jī)器人的自主性和可操作性。
綜合來看,DTRT框架的核心優(yōu)勢(shì)主要體現(xiàn)在以下三個(gè)方面:
其一,DTRT框架將人類意圖估計(jì)與人機(jī)角色分配緊密結(jié)合。這種結(jié)合方式能夠敏銳地檢測(cè)人類意圖的變化,并及時(shí)采取措施減少人機(jī)分歧,從而有效提升了在復(fù)雜且危險(xiǎn)易發(fā)環(huán)境中的人機(jī)協(xié)作性能。
其二,DTRT框架中的基于分層結(jié)構(gòu)的人類意圖估計(jì)模塊,能夠同時(shí)處理人機(jī)協(xié)作過程中的運(yùn)動(dòng)和力數(shù)據(jù)。通過這種方式,該模塊提高了人類意圖的預(yù)測(cè)精度,使系統(tǒng)能夠?qū)θ祟愐鈭D有更為準(zhǔn)確的理解。
其三,基于微分合作博弈論的人機(jī)角色分配機(jī)制,實(shí)現(xiàn)了基于人類施加力的自適應(yīng)領(lǐng)導(dǎo)者切換。這一機(jī)制確保了機(jī)器人的行為與人類意圖高度一致,在保持機(jī)器人自主性的同時(shí),最大程度地減少了人機(jī)之間的分歧。
▍進(jìn)行實(shí)驗(yàn)對(duì)比,驗(yàn)證DTRT框架有效性
為驗(yàn)證所提出的DTRT框架的有效性,研究團(tuán)隊(duì)開展了一系列對(duì)比實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了深入分析。
在實(shí)驗(yàn)過程中,研究團(tuán)隊(duì)對(duì)障礙物進(jìn)行了替換和隨機(jī)定位操作。在評(píng)估物理人機(jī)協(xié)作性能時(shí),研究團(tuán)隊(duì)采用了以下關(guān)鍵指標(biāo):
實(shí)驗(yàn)結(jié)果表明,DTRT框架在預(yù)測(cè)精度與協(xié)作表現(xiàn)方面展現(xiàn)出顯著優(yōu)勢(shì),在多個(gè)物理人機(jī)協(xié)作關(guān)鍵指標(biāo)上均呈現(xiàn)出卓越性能。具體而言,DTRT框架下的平均人機(jī)協(xié)作角度達(dá)到76.4°,平均機(jī)器人輔助水平指數(shù)為1.5,且人機(jī)系統(tǒng)在61.8%的時(shí)間內(nèi)處于良好的協(xié)作狀態(tài)。此外,DTRT框架下的人機(jī)角色分配機(jī)制有效地平衡了機(jī)器人的自主性和人類引導(dǎo),使得人類機(jī)械功僅為3.5 J。
DTRT與現(xiàn)有方法在指標(biāo)上的定量對(duì)比
總體來看,DTRT框架能夠準(zhǔn)確估計(jì)人類意圖的變化,合理分配領(lǐng)導(dǎo)者和追隨者的角色,不僅有效降低了人機(jī)之間的分歧,還顯著提高了機(jī)器人的輔助水平,有力地推動(dòng)了安全高效的物理人機(jī)協(xié)作,具備巨大的應(yīng)用潛力。
▍結(jié)語
DTRT的提出,其意義遠(yuǎn)不止于算法層面的突破,更是一次“人機(jī)關(guān)系”重構(gòu)的嘗試,為人形機(jī)器人的發(fā)展提供了一條兼具通用性與工程價(jià)值的技術(shù)路徑。
展望未來,DTRT的研究思路及其核心機(jī)制,有望在靈寶CASBOT所聚焦的工業(yè)制造、復(fù)雜作業(yè)、服務(wù)協(xié)同等多個(gè)實(shí)際應(yīng)用場(chǎng)景中得到進(jìn)一步拓展與深化,從而為物理人機(jī)協(xié)作領(lǐng)域帶來更多的創(chuàng)新與發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.