當開車遇到變道、加塞等場景時,駕駛員往往會下意識地激活自己的“安全駕駛思維”,從而做出激進的規(guī)避行為。與之類似,自動駕駛汽車在上述場景中,更會表現(xiàn)得像個謹小慎微的"新手司機",這是因為模型的決策往往依賴于工程師預設(shè)的固定規(guī)則,進而導致“不求無功,但求無過”的駕駛風格,但過多的無故急剎、過度避讓反而會引發(fā)額外的安全隱患。
針對上述問題,來自香港大學、英偉達和德國圖賓根大學的聯(lián)合團隊提出Centaur(ClusterEntropy forTest-time trAining usingUncertainty) 方法,能夠動態(tài)地改善駕駛策略,通過在線的數(shù)據(jù)驅(qū)動,擺脫了對預設(shè)規(guī)則的依賴,大幅提高了自動駕駛汽車在不確定性場景中的適應性與安全性。
Centaur 在測試推理過程中動態(tài)地調(diào)整模型權(quán)重,適應OOD 場景,提升泛化能力。模型利用 Cluster Entropy 作為自監(jiān)督信號,并首次將 Test-Time Training (TTT) 應用于端到端自動駕駛,避免手動規(guī)則和成本函數(shù),實時減少不確定性并改進預測,借由在線數(shù)據(jù)驅(qū)動實現(xiàn)了軌跡預測的可擴展性。
arXiv鏈接:https://arxiv.org/abs/2503.11650
代碼、checkpoint等即將開源
駕馭不確定性
通常來說,模型是如何衡量自己輸出不確定性的?一種直觀的方法是觀察模型輸出的分布狀態(tài),并基于“固定采樣下,模型的輸出方向越集中,越逼近模型的最高置信度”的假設(shè),來計算模型輸出的聚類程度,從而側(cè)面衡量出模型輸出的不確定性。
Cluster Entropy 通過軌跡采樣、聚類和熵計算來評估自動駕駛模型的不確定性。相比傳統(tǒng)的方法,它結(jié)合了直行、輕微右轉(zhuǎn)、劇烈右轉(zhuǎn)、輕微左轉(zhuǎn)和劇烈右轉(zhuǎn)的行為聚類,使得不確定性估計更具可解釋性。例如,當模型面對復雜的交叉路口時,Cluster Entropy 能直觀反映不同駕駛決策的不確定性,從而幫助優(yōu)化自動駕駛系統(tǒng)的安全性。
邊行駛邊進化
TTT 在推理過程中利用 Cluster Entropy 作為自監(jiān)督目標,通過梯度優(yōu)化讓模型自適應地調(diào)整特征表征,從而提升對 OOD 場景的適應能力。
具體而言,模型通過計算 Cluster Entropy ,判斷當前環(huán)境的 OOD 級別。如果模型對當前環(huán)境的理解較差,則觸發(fā) TTT 訓練過程,通過梯度下降對特征提取網(wǎng)絡(luò)進行小幅度更新,使其更適應當前環(huán)境特征分布。這一方法使得 Centaur能夠在推理時自適應地優(yōu)化自身,在 OOD 場景中保持穩(wěn)定的感知和駕駛能力,而無需依賴固定規(guī)則或人工設(shè)計的成本函數(shù)。
實測接近人類駕駛水平,安全性能全面提升
在 navtest 基準測試中,Centaur 的綜合規(guī)劃與駕駛指標得分(PDMS)取得了92.6%的成績,遠遠超過了基于回退的方法,并接近人類駕駛水平。此外,Centaur 在碰撞避免和碰撞時間等關(guān)鍵指標上亦表現(xiàn)出卓越的性能。
為了更好地評估自動駕駛系統(tǒng)在安全關(guān)鍵場景中的表現(xiàn),我們提出了navsafe 數(shù)據(jù)集,專門用于測試端到端駕駛方法的安全性和魯棒性。它基于 navtest,并結(jié)合了真實的事故數(shù)據(jù),通過細粒度的評分機制,量化了自動駕駛模型的不同駕駛能力,而不像 navtest 只提供整體分數(shù)。
此外,Cluster Entropy 作為不確定性度量工具,實現(xiàn)了 PDMS 的顯著提升,并在失敗檢測任務中, 取得了最佳結(jié)果。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.