近日,由汽車評價研究院及地平線主辦的「地平線杯」世界十佳智能汽車、世界智能汽車品牌論壇如期舉辦。在大會現場,長城汽車技術中心副總經理——耿偉峰圍繞端到端智駕方案的優缺點及解決方案,進行了詳細介紹。
耿偉峰表示,長城也曾經歷傳統的CNN多相機感知+高精地圖的高速NOA方案,但依賴地圖并非長遠之計。
“在整個行業剛開始推城市NOA的時候,還是基于高精地圖的。這導致只能逐個城市地進行開城。長城認為,這樣的路線是走不通的。”
由此,藍山的智駕系統從一開始,就未采用高精地圖,只用導航地圖。而下一階段,長城希望實現全場景的「車位到車位自動駕駛」。
他介紹稱,高精地圖能夠彌補很多算法問題,的確能夠提升體驗,但是覆蓋性很差。
“根據所有圖商的并集統計,全國雙向車道地圖大概是1000萬公里,真正的高速和高架只有3.6%。而在城市也只有10%左右有高精地圖的覆蓋。”
耿偉峰表示,一旦智駕進城,道路復雜度會指數級增加,面臨的場景是無限的,其中也包括一些異常突發場景:違規自行車、違規行人、非機動車等等。如此看來,基于規則的開發難度是無法想象的。
因此,長城的智駕系統并未像其他車企那樣,從分段式架構開始做,而是利用SEE一體化智駕技術架構。
“端到端架構是現階段實現城市無圖NOA的最優解。基于數據驅動,可減少約75%的人工編碼。同時,算法能力會更強,迭代速度也會更快,極大提升了場景解決速度。”
不過他也指出,雖然目前最先進的端到端技術適用于大多數場景,但并非所有場景,這還是因為其下限問題。
“端到端的優勢是能夠處理復雜場景,更加絲滑擬人,而且不卡頓;劣勢則是有時在一些莫名其妙的場景下,會犯一些低級錯誤,尤其是簡單的場景。例如遵守交通規則,或者簡單的壓線、變道等問題,而且出現問題后定位非常困難。”
基于這些問題,長城設計的端到端智駕模型,思路是基于模型概率性的算法,加上確定性的算法,利用安全規則對端到端結果進行篩選。
同時,長城也會針對預測結果,以及端到端輸出參考線,做傳統的運動規劃。其算法架構是兩個銜接緊密的大模型:一個是負責統一的感知,一個是負責預測、決策和規劃輸出,多參考線和目標的意圖規劃信息,然后進行安全規則檢查,基于時空聯合規劃生成最終的行車軌跡,然后再進行橫縱向的車輛控制。
另一方面,藍山智駕采用的基礎數據,是基于長城多年積累所得,現已累計到數十PB,包括真實用戶的回傳數據和專業數采數據。
耿偉峰稱,僅藍山車型,每個月就會產生大概6000臺的增量,上市幾個月回傳數據已經超過2PB。
但是,對以后的高階智駕來說,數據的量并非關鍵問題,關鍵還是如何將這些數據有效利用好。
為此,長城針對數據治理做了詳細設計。首先通過多維度精細的標簽體系把數據進行拆分,每個精細場景我們都要保證數據的均衡,并且測試、驗證也精細化細分場景。
另外,長城針對數據采用VLM視覺語言模型,提取向量特征;同時基于精細標簽+AI向量特征,精準挖掘出稀有的數據,以及實車表現不太好的關鍵場景。
“這些手段能夠保證我們數據分布的合理,而不是簡單的靠猛堆數據的方法進行學習。”
他表示,傳統數據標簽的挖掘方案中,篩選效率不足,針對場景挖掘數據也需要耗費大量的人力和時間。而采用智能標簽體系+AI特征的方法,可以最大程度縮減挖掘時間,節省人力。
“目前,人工只需要對數據進行確認,就可以針對感知、預測、決策進行一些標注處理。”
除此之外,長城的九州超算中心可動用的總算力超過3 EFLOPS,并且正在持續指數級增長。
“基于大模型、數據和算力資源,我們會將原計劃上市4個月的開城時間(原計劃在12月底開城),縮短到2.5個月,在11月份實現了所有城市公開道路都可以行駛。”
耿偉峰表示,上次OTA版本已可支持掉頭等復雜場景,下次的OTA將會實現待轉區、環島通行等場景支持。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.