NVIDIA 在本周美國田納西州舉辦的國際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(CVPR)上榮獲“端到端輔助駕駛”賽道冠軍。這一消息是在“自主系統(tǒng)具身智能研討會(huì)”上宣布的。
這標(biāo)志著 NVIDIA 連續(xù)第二年在“大規(guī)模端到端駕駛”類別中榮登榜首,也是連續(xù)第三年在 CVPR 上獲得挑戰(zhàn)賽大獎(jiǎng)。
今年挑戰(zhàn)賽的主題是“實(shí)現(xiàn)通用的具身系統(tǒng)”——基于數(shù)據(jù)驅(qū)動(dòng)的非反應(yīng)式輔助駕駛仿真框架 NAVSIM v2。
本次挑戰(zhàn)賽為研究人員提供了一個(gè)探索應(yīng)對(duì)突發(fā)情況方法的機(jī)會(huì),使他們不再局限于僅使用真實(shí)的人類駕駛數(shù)據(jù),從而加速開發(fā)更智能、更安全的智能汽車。
生成安全、自適應(yīng)的駕駛軌跡
本次挑戰(zhàn)賽參賽者的任務(wù)是在半反應(yīng)堆仿真中根據(jù)多傳感器數(shù)據(jù)生成駕駛軌跡,測試車輛的計(jì)劃在開始時(shí)是固定不變的,但交通背景會(huì)動(dòng)態(tài)變化。
參賽作品采用擴(kuò)展預(yù)測駕駛員模型評(píng)分進(jìn)行評(píng)估,該評(píng)分可衡量現(xiàn)實(shí)世界和合成場景中的安全性、舒適性、合規(guī)性和泛化性,從而突破穩(wěn)健且可泛化的輔助駕駛研究界限。
NVIDIA 輔助駕駛應(yīng)用研究團(tuán)隊(duì)的關(guān)鍵創(chuàng)新是泛化軌跡評(píng)分(GTRS)方法,該方法可生成各種軌跡,并逐步篩選出最佳軌跡。
GTRS 模型架構(gòu)展示了一個(gè)統(tǒng)一的系統(tǒng),可利用擴(kuò)散和基于詞匯的軌跡生成不同的駕駛軌跡并評(píng)分。
GTRS 引入了涵蓋各種情況的粗略軌跡集和適用于安全關(guān)鍵情況的細(xì)粒度軌跡集的組合,這些軌跡集使用基于環(huán)境的擴(kuò)散策略創(chuàng)建。GTRS 使用從依賴感知的指標(biāo)中提煉出來的 Transformer 解碼器,重點(diǎn)關(guān)注安全性、舒適性和交通規(guī)則合規(guī)性。該解碼器通過捕捉相似軌跡之間細(xì)微但關(guān)鍵的差異,逐漸篩選出最具可能性的候選軌跡。
事實(shí)證明,該系統(tǒng)能夠很好地適用于各種場景,在具有挑戰(zhàn)性的基準(zhǔn)測試中獲得了優(yōu)異的結(jié)果,并能夠在各種富有挑戰(zhàn)性的駕駛條件下實(shí)現(xiàn)可靠的自適應(yīng)軌跡選擇。
[視頻請(qǐng)至微信公眾號(hào)觀看]
NVIDIA 在 CVPR 會(huì)議中的汽車領(lǐng)域研究成果
NVIDIA 在 CVPR 2025 上提交了 60 多篇論文,涵蓋汽車、醫(yī)療、機(jī)器人等領(lǐng)域。
在汽車領(lǐng)域,NVIDIA 研究人員正在通過感知、規(guī)劃和數(shù)據(jù)生成方面的創(chuàng)新來推動(dòng)物理 AI 的發(fā)展。今年,有三篇 NVIDIA 論文獲得了最佳論文獎(jiǎng)提名:FoundationStereo、Zero-Shot Monocular Scene Flow 和 Difix3D+。
以下 NVIDIA 論文展示了在立體深度估計(jì)、單目運(yùn)動(dòng)理解、3D 重建、閉環(huán)規(guī)劃、視覺語言建模和生成式仿真方面取得的突破性進(jìn)展,所有這些對(duì)于構(gòu)建更安全、更泛化的輔助駕駛都非常重要:
- DiffusionRenderer:基于視頻擴(kuò)散模型的神經(jīng)逆向渲染和正向渲染(可在官網(wǎng)博客中閱讀更多內(nèi)容。)
- FoundationStereo:零樣本立體匹配(獲得最佳論文提名)
- 實(shí)際場景零樣本單目場景流預(yù)測(獲得最佳論文提名)
- Diffix3D+:使用單步擴(kuò)散模型改進(jìn) 3D 重建(獲得最佳論文提名)
- 3DGUT:在高斯分裂中啟用失真攝像頭和二次光線
- 標(biāo)記化交通模型的閉環(huán)監(jiān)督式微調(diào)
- 零樣本 4D 激光雷達(dá)全景分割
- NVILA:高效前沿視覺語言模型
- RADIO Amplified:改進(jìn)聚合視覺基礎(chǔ)模型的基準(zhǔn)
- OmniDrive:借助反事實(shí)推理實(shí)現(xiàn)輔助駕駛的整體視覺語言數(shù)據(jù)集
探索 CVPR 上的汽車研討會(huì)和教程,包括:
- 數(shù)據(jù)驅(qū)動(dòng)型輔助駕駛仿真研討會(huì),由 NVIDIA 輔助駕駛研究高級(jí)總監(jiān) Marco Pavone 和 NVIDIA AI 研究副總裁 Sanja Fidler 主講
- 輔助駕駛研討會(huì),由 NVIDIA 高級(jí)研究經(jīng)理 Laura Leal-Taixe 主講
- 利用基礎(chǔ)模型理解開放世界 3D 場景研討會(huì),由 Leal-Taixe 主講
- 面向所有領(lǐng)域的安全 AI,由 NVIDIA 輔助駕駛應(yīng)用研究總監(jiān) Jose Alvarez 主講
- 基于 V2X 的協(xié)作式輔助駕駛基礎(chǔ)模型研討會(huì),由 Pavone 和 Leal-Taixe 主講
- 多智能體具身智能系統(tǒng)迎接生成式 AI 時(shí)代研討會(huì),由 Pavone 主講
- 計(jì)算機(jī)視覺中的 LatinX 研討會(huì),由 Leal-Taixe 主講
- 探索新一代數(shù)據(jù)研討會(huì),由 Alvarez 主講
- 基于 GPU 的全棧深度學(xué)習(xí)和基礎(chǔ)模型加速,由 NVIDIA 主導(dǎo)
- 通過基礎(chǔ)模型實(shí)現(xiàn)連續(xù)數(shù)據(jù)循環(huán),由 NVIDIA 主導(dǎo)
- 輔助駕駛基礎(chǔ)模型蒸餾,由 NVIDIA 主導(dǎo)
詳細(xì)了解 NVIDIA Research,NVIDIA Research 團(tuán)隊(duì)在全球擁有數(shù)百名科學(xué)家和工程師,專注于 AI、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺、輔助駕駛和機(jī)器人等領(lǐng)域的研究:
https://www.nvidia.cn/research/
注:上面的精選圖片展示了智能汽車如何使用 GTRS 模型調(diào)整其軌跡,以在動(dòng)態(tài)交通的城市環(huán)境中導(dǎo)航。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.