99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

VLA 推理新范式!一致性模型 CEED-VLA 實現四倍加速!

0
分享至



本文第一作者為香港科技大學(廣州)機器人系一年級博士生宋文軒,主要研究方向為VLA模型,共同第一作者是來自香港科技大學廣州的研究助理陳家毅,項目leader為浙江大學和西湖大學聯合培養博士生丁鵬翔,他們也是具身智能領域開源項目OpenHelix以及LLaVA-VLA的研究團隊。通訊作者為香港科技大學廣州的李昊昂教授,他是今年的CVPR2025 Best PaperCandidate的獲得者。


https://mp.weixin.qq.com/s/oJJQmq0dSQ9c7zMWLrgnLw

近年來,視覺 - 語言 - 動作(Vision-Language-Action, VLA)模型因其出色的多模態理解與泛化能力,已成為機器人領域的重要研究方向。盡管相關技術取得了顯著進展,但在實際部署中,尤其是在高頻率和精細操作等任務中,VLA 模型仍受到推理速度瓶頸的嚴重制約。

針對這一問題,部分研究提出采用 Jacobi 解碼替代傳統的自回歸解碼,以期提升推理效率。然而,由于 Jacobi 解碼往往需要較多迭代次數,其加速效果在實踐中較為有限。

為此,我們提出了一種一致性蒸餾訓練(consistency distillation training)策略,使模型在每次迭代中能夠同時預測多個正確的動作 token,從而實現解碼加速。同時,我們設計了混合標簽監督機制(mixed-label supervision),用于緩解蒸餾過程中可能產生的誤差積累問題。

盡管上述方法帶來了可接受的加速效果,我們進一步觀察到:Jacobi 解碼中仍存在若干低效迭代步驟,成為限制整體效率的關鍵瓶頸。為徹底解決該問題,本文提出一種提前退出(early-exit)解碼策略,通過適度放寬收斂條件,進一步提升平均推理效率。



  • 論文題目:
  • CEED-VLA : Consistency Vision-Language-Action Model with Early-Exit Decoding
  • 項目主頁:
  • https://irpn-eai.github.io/CEED-VLA/
  • 論文鏈接:
  • https://arxiv.org/pdf/2506.13725
  • 代碼鏈接:
  • https://github.com/OpenHelix-Team/CEED-VLA

實驗結果表明,我們所提出的方法在多個基線模型上實現了超過4 倍的推理加速,同時在仿真與真實機器人任務中均保持了較高的任務成功率。這些實驗驗證了本方法在加速機器人多模態決策過程中的高效性與通用性,展現出良好的應用前景。總的來說,我們做出以下三大貢獻:

(1)我們提出了一種通用的加速方法CEED-VLA,在保持操控性能的前提下顯著提升了推理速度。

(2)我們引入了一種一致性蒸餾機制,并在自回歸損失中結合混合標簽監督,以有效保留高質量的動作序列。

(3)我們發現 Jacobi 解碼存在低效迭代的瓶頸問題,進一步提出了早期退出(early-exit)解碼策略,實現了4.1 倍的推理加速與 超過 4.3 倍的解碼頻率提升。



圖 1:不同解碼方法加速效果對比

Method



圖 2:CEED-VLA 模型架構示意圖

我們提出的框架首先通過預訓練的 VLA 模型(例如 LLaVA-VLA和OpenVLA)進行Jacobi Decoding生成訓練Jacobi Trajectory數據集。隨后,我們設計了一種高效的一致性蒸餾方式,并引入了一種新穎的混合標簽監督方法,在同時保證精度和提高速度的前提下訓練學生模型。最后,我們提出了Early-exit Decoding技術,以進一步提升推理速度。模擬環境與現實世界中的實驗表明,在幾乎不損失任務成功率的前提下,該方法顯著提升了模型的推理速度和靈巧任務的成功率。

Consistency Training

對于目標 VLA 模型 ,為了捕捉 Jacobi 軌跡中的內在一致性以進行一致性訓練,我們首先通過在機器人數據集C上使用 Jacobi Decoding對模型 進行動作預測,來采集完整的Jacobi軌跡。

一致性訓練包含兩個優化目標:一致性損失(Consistency Loss):引導模型能夠在單次forward過程中預測多個正確的 token,為了確保模型在軌跡中的任意一步都能生成與最終目標一致的動作,這里引入了 KL 散度作為一致性損失。簡而言之,它要求模型在每一個中間步驟的預測,和最終預測結果之間保持一致,從而提高模型收斂效率。

混合標簽的自回歸監督損失(Mixed-label AR Supervision):為了保留模型常規的自回歸生成能力,CEED-VLA混合使用教師模型的數據以及Ground-truth數據進行監督,以保證動作精確性。最終的訓練目標是兩種損失的加權和。訓練過程如下所示:



圖4 一致性訓練算法

Early-exit Decoding



圖 5:四種解碼方式迭代流程

Jacobi 解碼允許并行輸出動作token,在一定程度上提高了推理速度,但嚴格的收斂條件影響解碼效率進一步提升。為此我們提出Early-exit Decoding策略:模型通過提前退出的方式輸出中間預測結果,無需滿足Jacobi iteration的收斂條件。得益于manipulation任務獨特的結構,Early-exit Decoding顯著提升了推理速度,同時保持了成功率,使得模型能夠以更高頻率控制機器人,滿足實時任務需求。

仿真環境基準實驗(Simulation Benchmark)



圖 6:仿真環境主要實驗結果

在最具挑戰的長程任務CALVIN ABC-D和LIBERO-Long基準上的實驗結果表明,CEED-VLA在幾乎不損失任務成功率的前提下實現了4倍以上的推理速度和執行頻率。

真實世界實驗(Real World)



圖 9:真機實驗部署設置



圖 10:疊毛巾任務上的對比

上圖展示了 LLaVA-VLA 模型的真實表現。機械臂操作頻率較低,難以完成如疊毛巾等靈巧操作任務,經常出現抓取失敗或只抓到一邊的情況,導致任務失敗。下圖展示了 CEED-VLA 模型的實驗效果。得益于推理頻率的提高,機械臂動作更加順暢,成功完成了靈巧操作任務。



圖 11:CEED-VLA 在真實世界中的實驗結果。

CEED-VLA 顯著提升了推理速度和控制頻率,使模型能夠學習并執行高頻動作,因此相比基線在靈巧任務上的成功率大幅提升,超過 70%。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
無錫市市長調整

無錫市市長調整

新京報政事兒
2025-07-17 13:17:01
陜西一網紅老板西藏自駕游途中不幸去世,陵園:葬禮來了數百人

陜西一網紅老板西藏自駕游途中不幸去世,陵園:葬禮來了數百人

極目新聞
2025-07-17 12:50:08
男嬰醫院離世家長獲賠88萬,律師拿走55萬代理費是否合規?家長認為上當,廣州律協立案一年無果

男嬰醫院離世家長獲賠88萬,律師拿走55萬代理費是否合規?家長認為上當,廣州律協立案一年無果

大風新聞
2025-07-16 21:37:18
曝宗馥莉多次絕食險暈倒,虛弱畫面曝光,比59歲的杜建英還憔悴!

曝宗馥莉多次絕食險暈倒,虛弱畫面曝光,比59歲的杜建英還憔悴!

古希臘掌管松餅的神
2025-07-17 10:07:37
短時暴雨,9級大風!杭州這波太猛!還有2個臺風...

短時暴雨,9級大風!杭州這波太猛!還有2個臺風...

魯中晨報
2025-07-17 14:16:37
社保好消息!2025年7月起,不繳、少繳、斷繳社保,將成為過去式

社保好消息!2025年7月起,不繳、少繳、斷繳社保,將成為過去式

社保小達人
2025-07-16 09:30:08
催生失敗后,國家徹底換路子了!專家的 “新思路” 得到認可?

催生失敗后,國家徹底換路子了!專家的 “新思路” 得到認可?

詩意世界
2025-07-16 09:47:05
河北20歲女大學生嫌奶奶做敷衍菜,網友看不下去:這么熱你自己做

河北20歲女大學生嫌奶奶做敷衍菜,網友看不下去:這么熱你自己做

阿龍美食記
2025-07-16 14:58:26
韓媒:王鈺棟是中國隊東亞杯最大失敗者,憑聯賽數據想留洋是幻想

韓媒:王鈺棟是中國隊東亞杯最大失敗者,憑聯賽數據想留洋是幻想

雷速體育
2025-07-17 11:03:49
尹錫悅堅守牢房,竟讓特檢束手無策惱羞成怒,韓國警方坐山觀虎斗

尹錫悅堅守牢房,竟讓特檢束手無策惱羞成怒,韓國警方坐山觀虎斗

真實星球
2025-07-16 23:40:58
剛剛確認:開始影響上海!暴雨+大風+雷電+高溫,四預警齊發,全市應急響應啟動,這些區域加強防范

剛剛確認:開始影響上海!暴雨+大風+雷電+高溫,四預警齊發,全市應急響應啟動,這些區域加強防范

上觀新聞
2025-07-17 14:51:45
霍汶希53歲生日,首度與女兒合拍時尚大片,Hanni顏值絕美超養眼

霍汶希53歲生日,首度與女兒合拍時尚大片,Hanni顏值絕美超養眼

娛圈小愚
2025-07-17 11:14:55
女律師稱在愛康國賓體檢10年沒預警,在國外確診癌癥晚期

女律師稱在愛康國賓體檢10年沒預警,在國外確診癌癥晚期

大風新聞
2025-07-17 11:44:30
曝30歲銀行女高管出軌,兩人運動畫面曝光,又親又抱,丈夫發聲

曝30歲銀行女高管出軌,兩人運動畫面曝光,又親又抱,丈夫發聲

180視角
2025-07-17 13:04:26
工資單被瘋傳,月薪最高13.5萬元、年終獎610萬元?基金公司:已報警

工資單被瘋傳,月薪最高13.5萬元、年終獎610萬元?基金公司:已報警

北京商報
2025-07-16 16:30:07
娃哈哈豪門暗戰!“布鞋首富”宗慶后6名隱秘子女曝光,宗馥莉曾以絕食相逼,職工持股會成博弈關鍵點

娃哈哈豪門暗戰!“布鞋首富”宗慶后6名隱秘子女曝光,宗馥莉曾以絕食相逼,職工持股會成博弈關鍵點

金融界
2025-07-17 09:50:01
董璇二婚也不含糊!圈內明星出席,連換兩套禮服,伴郎團全喜劇人

董璇二婚也不含糊!圈內明星出席,連換兩套禮服,伴郎團全喜劇人

萌神木木
2025-07-17 12:23:21
宗慶后再添猛料!曝一共7個孩子,施幼珍非第一任,知情者透更多

宗慶后再添猛料!曝一共7個孩子,施幼珍非第一任,知情者透更多

鋭娛之樂
2025-07-16 23:58:42
知情人曝宗慶后有3個情人,72歲色心不改,小情人曾大鬧總部

知情人曝宗慶后有3個情人,72歲色心不改,小情人曾大鬧總部

葉公子
2025-07-17 11:23:24
娃哈哈變葫蘆娃!宗慶后再被曝出5妻7子女,被宗馥莉絕食相逼!

娃哈哈變葫蘆娃!宗慶后再被曝出5妻7子女,被宗馥莉絕食相逼!

烏娛子醬
2025-07-17 13:13:41
2025-07-17 15:31:00
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10884文章數 142382關注度
往期回顧 全部

科技要聞

沒有老黃不夸的中國公司了吧??

頭條要聞

女律師在愛康國賓體檢10年沒預警 在國外確診癌癥晚期

頭條要聞

女律師在愛康國賓體檢10年沒預警 在國外確診癌癥晚期

體育要聞

過去一年的頭號贏家,他說偶像永遠是媽媽

娛樂要聞

黃楊鈿甜星途被毀 戴假貨沒人找她代言

財經要聞

宗氏三兄妹在港起訴宗馥莉文書曝光

汽車要聞

8月初上市 長安第三代UNI-V勁擎型嘗鮮價11.49萬

態度原創

房產
手機
本地
時尚
公開課

房產要聞

三亞又有好地要賣,起拍樓面價飆到了1.6萬/㎡!

手機要聞

S26 Ultra轉投索尼傳感器!三星手機影像終于有救了?

本地新聞

換個城市過夏天 | 誰打翻了濰坊的調色盤?

“渣女上衣”火了?巨洋氣巨顯瘦!誰穿誰好看!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 七台河市| 潢川县| 嘉峪关市| 杭州市| 翁源县| 大方县| 阿克| 会东县| 姚安县| 兴安县| 重庆市| 六盘水市| 蛟河市| 马边| 成安县| 靖远县| 巴塘县| 米林县| 连山| 横山县| 抚顺市| 长岭县| 凭祥市| 德江县| 吴桥县| 广平县| 得荣县| 东辽县| 东乡族自治县| 育儿| 宜城市| 七台河市| 晋江市| 青川县| 嘉鱼县| 安徽省| 华蓥市| 辉南县| 伽师县| 桦甸市| 瓮安县|