想象一下,你正在享受著悠閑的午后時光,家里的機器人則在廚房中忙碌地洗刷餐具。當你需要某個杯子并發出“請遞給我水槽左邊的那個碟子”指令時,機器人卻似乎誤解了你的意思,轉向水槽右側準備去拿碗。
這樣的小插曲看似只是個小失誤,實際上揭示了當前機器人技術面臨的一個核心挑戰:理解和準確響應人類意圖的能力不足,以及缺乏迅速糾正錯誤的能力。這不僅是技術上的難題,也直接影響到機器人在日常生活中能否真正成為我們的得力助手。
對此,麻省理工學院和英偉達的研究人員聯合開發出一種新的智能交互框架,有望從根本上解決這一問題。借助這種智能交互框架可以通過簡單互動更為直觀地指導機器人糾正其操作中的錯誤。
就拿剛才洗餐具的例子來說,當機器人誤解你的意思選錯目標時,你可以簡單地用手指向你想要的那個碟子,或者把機器人的手臂推向正確的位置。
(來源:MIT News)
這種“手把手”教學模式的精妙之處在于它的直觀性和易用性。從本質上來說,它其實是模仿了人類教導孩子學習新技能的互動方式,借助實際的接觸和視覺示范來幫助理解,讓機器人通過物理接觸和視覺指引實時修正行為。
研究人員通過實測發現,采用這種教學方法,機器人完成任務的成功率比未使用人工干預的方法有了大幅提升。
相較于傳統的糾錯方案,這種智能交互框架還帶來了幾點創新:一方面,它不需要重新收集大量的數據,這對于家庭環境下的個性化配置尤為重要;另一方面,避免了耗時的模型再訓練過程,即便是不具備專業知識的普通用戶也能輕松上手。
更為關鍵的一點,系統能夠即時處理來自不同維度的反饋(包括觸覺信息和視覺信息),并以此動態調整行動策略,確保執行的動作最符合用戶的期望。換句話說,它能讓機器人利用直觀、實時的人類反饋選擇最貼合用戶意圖的動作。
從長遠來看,這一智能交互框架將讓機器人能更好地適應多樣化的家庭環境:經過工廠訓練的機器人在不同的家庭環境中高效工作,即便它們從未見過用戶家中這些特定的家庭布置或物品。
“我們不能指望普通用戶具備收集數據或微調神經網絡模型的專業技能。消費者希望購買的機器人能夠‘開箱即用’,如果這一點無法實現,那么至少需要提供一種簡便且直觀的方式來讓用戶根據自己的需求定制機器人。”這篇研究論文的主要作者、麻省理工學院電氣工程與計算機科學研究生 Felix Yanwei Wang 說道,“我們的研究正是為了解決這一挑戰,消除人與機器之間最后的一道交互障礙。”
他進一步指出,不僅要在技術上取得突破,還要確保這些技術進步能夠被廣泛接受和使用。這意味著需要設計出更加用戶友好的解決方案,使非專業人士也能輕松地與高科技產品互動。“通過簡化定制過程,我們希望能夠讓每個人都能充分利用機器人的潛力,無論他們的技術背景如何。”他表示。
這項研究成果將在國際機器人與自動化會議上發表。論文合作者還包括麻省理工學院航空航天學教授、計算機科學與人工智能實驗室交互機器人組主任 Julie Shah(通訊作者),Lirui Wang、Yilun Du,以及來自英偉達的研究人員。
這項研究的關鍵在于找到了一種方法,讓不具備專業知識的用戶也能夠有效地指導機器人完成特定任務。通過開發直觀的交互界面,可以通過簡單的操作(如手勢或語音指令)來即時調整機器人的行為,從而實現更高效的人機協作。
進一步減少偏差
圍繞機器人開發,研究人員目前開始利用預訓練的生成式 AI 模型來學習機器人完成任務時所遵循的一套“策略”,也就是一組規則。畢竟,生成式 AI 模型擅長處理多種復雜任務,因此非常適合這種應用場景。
在訓練過程中,模型只會接觸到可行的機器人動作,從而學會生成讓機器人能夠有效執行的任務序列。這意味著,機器人可以根據這些預先學習到的動作序列準確地完成一系列任務。
然而,盡管這些動作序列是有效的,它們并不總是完全符合用戶在實際生活中的真實意圖。例如,機器人經過訓練能夠從貨架上抓取盒子而不碰倒其他物品,但如果貨架的擺放方向與它訓練時看到的不同,那它可能會無法拿到貨架頂部的盒子。
為解決這些問題,工程師通常需要收集新的數據并重新訓練生成模型,以適應新環境或新任務的要求。這一過程不僅耗時,而且成本高昂,還需要具備機器學習的專業知識。
與傳統的重新訓練方法不同,麻省理工學院研究人員此次提出了一種更為用戶友好和高效的解決方案:他們希望用戶能夠在使用機器人的過程中,發現機器人出錯時能夠直接引導其行為進行糾正。
通過這種方式,當機器人出現錯誤操作時用戶可以立即介入并指導機器人做出正確的調整。例如,在上述拿盒子的例子中,如果機器人試圖拿取盒子但不小心碰掉了架上的書,用戶可以直接干預,幫助機器人找到更好的路徑或方法來完成任務。
這種方法的優勢在于,它不需要復雜的重新訓練過程,也不要求用戶具備專業的技術背景,通過簡單的互動方式,讓用戶能夠即時糾正機器人的行為,從而提高機器人在實際應用中的靈活性和準確性。
“我們希望用戶能在不引入其他錯誤操作的前提下與機器人互動,從而在實際操作中實現更符合用戶意圖的行為,同時確保這種行為也是有效且可行的。”Wang 說道。
(來源:MIT News)
在這項研究中,他們開發的框架為用戶提供了三種直觀的糾錯方式來引導機器人行為,每種方式都有獨特的優勢和適用場景。
1、指向目標:用戶可以在顯示機器人攝像頭視角的界面上直接點擊或指出希望機器人操作的對象。這種方式簡單易用,適合那些需要快速指示機器人選擇特定物品的任務。例如,在廚房里,你可以輕松地點擊屏幕上的某個碗,并告訴機器人去取。
2、繪制路徑:用戶可以通過界面繪制一條具體的軌跡,明確指定希望機器人如何接近目標對象。這種方式不僅讓用戶可以精確控制機器人的運動路徑,還能幫助機器人避開障礙物。比如,當機器人需要從一個狹窄的空間中取出物品時,用戶可以繪制一條繞過障礙物的安全路徑。
3、“手把手”教學:用戶可以直接用手移動機器人的手臂到期望的位置。這種方式最為直接且有效,適用于將二維圖像映射到三維空間時可能出現的信息丟失問題。通過物理接觸,用戶能夠準確傳達他們的意圖,并確保機器人按照預期的方式執行任務。例如,在處理復雜的三維環境時,用戶直接用手去調整機器人的位置可以避免因圖像信息不足而導致的誤差。
“在將環境的二維圖像映射到三維空間中的動作時可能會丟失一些信息。”Wang 說道,“直接輕推機器人手臂是最為直觀的交互方式,可以準確傳達用戶的意圖而不會丟失任何細節信息。這不僅提高了任務的成功率,還增強了用戶體驗,即使是非專業人士也能輕松指導機器人完成各種復雜任務。”
采樣程序確保有效動作
為了避免用戶互動導致機器人選擇無效或不安全的動作(如與其他物體發生碰撞),研究人員采用了一種特定的采樣程序。這種技術能夠使模型從最符合用戶目標的有效動作集中選擇一個最優動作,從而確保機器人執行的任務既安全又高效。
“我們并不是簡單地讓機器人盲目執行用戶的指令,而是讓機器人理解用戶的真實意圖,并根據它已學習到的行為集進行調整。”Wang 解釋道,“通過這種方式,機器人不僅能夠按照用戶的意圖行動,還能在不偏離其訓練基礎的前提下靈活應對新的情況。”
在廚房環境中使用機械臂進行模擬和實驗時,他們基于這種采樣方法開發的框架比其他方法表現更為出色。研究人員發現,與不借助人工干預的方法相比,這種方法的成功率提高了 21%。這表明,在實際操作中,該框架不僅能提高任務完成的準確性,還能顯著提升效率。
盡管這種方法可能并不總能立即完成任務,但它有個明顯的優勢:一旦發現機器人做錯了,用戶能馬上進行介入和糾正,而不是等機器人完成整個動作后再重新下達新指令,在提高操作效率的同時還減少了不必要的重復操作
值得一提的是,當用戶幾次輕推機器人直到它拿起正確的目標物品后,它可以記錄這種糾正行為,并在未來的學習過程中將其納入自己的行為模式。這意味著,隨著用戶不斷指導,機器人將逐漸學會如何更好地執行任務。例如,經過幾次糾正后,第二天機器人無需任何幫助就能準確地拿起正確的物品。
“持續改進的關鍵在于讓用戶能與機器人互動,這正是我們這項研究的核心成果。”Wang 補充說。通過這種人機協作的方式,不僅可以提升機器人的性能,還能使用戶體驗更加流暢和自然。
未來,研究人員希望在保持或提升采樣程序性能的同時,進一步加快其運行速度,畢竟更快的響應時間將使機器人在動態環境中也能迅速做出反應,適應更多復雜場景的需求。
他們還計劃在全新的場景環境中測試這種機器人的策略生成表現。通過在不同環境中的應用,研究人員希望能夠驗證并優化這一框架的通用性和靈活性,使其能夠在更廣泛的領域中發揮作用。
通過這些努力,他們期望推動家用和服務型機器人的智能化發展,讓它們真正成為人們生活中的得力助手,無論是日常家務還是特殊任務,未來的機器人將更加智能、可靠,為用戶帶來更好的支持和幫助。
https://news.mit.edu/2025/robotic-helper-mistakes-nudging-in-right-direction-0307
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.