在新能源汽車領域,智能駕駛技術正以前所未有的速度蓬勃發展,一系列令人矚目的新技術不斷涌現,徹底顛覆了人們對傳統駕駛的認知,同時也引發了關于智能駕駛能否替代人工駕駛的激烈討論。
世界模型:開啟智能駕駛新視野
世界模型在智能駕駛技術體系中扮演著關鍵角色。以華為為例,其發布的 ADS4 引入了 WE - WA 架構,其中的 WE 即云端世界引擎(World Engine),WA 代表車端的世界行為模型(World Action Model)。世界引擎堪稱智能駕駛的 “超級大腦訓練師”,它利用 AI 技術生成海量且復雜的困難場景,涵蓋極端天氣下的道路狀況以及罕見障礙物的出現等情況,其生成困難場景的密度甚至比真實世界高出 1000 倍,這一創舉成功突破了傳統訓練數據不足的瓶頸。車端的世界行為模型則像一位聰明且敏銳的 “副駕駛”,它作為原生多模態的車端大模型,能夠同時接收視覺、聽覺、觸覺等多方面的輸入信息,并迅速、精準地輸出控車軌跡以及對周邊環境的深度理解,為車輛的安全行駛提供全方位支持。
小鵬汽車也不甘示弱,在 MPV 車型 X9 香港上市發布會上透露,其已經搭建了高達 10 EFlops 的萬卡集群,全力訓練一個參數達 720B 的超大 “世界基座模型”,并基于此蒸餾壓縮得到小模型 XVLA。小鵬計劃以 “世界模型 + XVLA + 圖靈芯片” 的組合方式,構建下一代智駕技術體系,這將極大提升車輛對復雜交通環境的感知與應對能力,讓駕駛變得更加智能、安全。
VLA 模型:重塑智能駕駛決策邏輯
VLA(Vision - Language - Action)模型最早由 Google DeepMind 在 2023 年 7 月提出,原本應用于機器人控制領域,如今已在智能駕駛領域嶄露頭角,成為眾多主流自動駕駛玩家關注的焦點。小米從 Wayve 招聘主任科學家專門負責帶領 VLA 團隊,國內 Tier 1 龍頭德賽西威的自研智駕團隊也在積極探索 VLA 技術,小鵬的 XVLA 模型同樣是 VLA 的衍生版本。
VLA 模型以大語言模型為基石,具備諸多獨特優勢。從模型開發角度來看,語言在模型的 “對齊” 操作中具有天然優勢,是 AI 開發不可或缺的重要手段,同時也是用戶對智能駕駛系統建立信任和安全感的有效途徑。在實際駕駛場景中,應用 VLA 模型的系統能夠精準習得特殊車道的駕駛方式,對路況擁有更長時序的理解能力,從而有效避免基礎錯誤,在處理復雜路況時表現得更加得心應手。例如,在車展期間體驗元戎最新軟件版本時發現,其在面對大量密集的 VRU(道路使用者,如行人、非機動車等)時,展現出相當穩定的感知與博弈能力;在廣州密集城區的環島、銜接路等復雜道路結構的識別處理上,也表現得十分出色,讓人印象深刻。
智能駕駛:替代人工尚需時日
盡管這些新技術為智能駕駛帶來了質的飛躍,但要讓智能駕駛完全替代人工駕駛,目前仍面臨諸多挑戰。在復雜多變的現實交通環境中,存在著大量難以預測的情況,如突發的交通事故、道路臨時施工、動物突然闖入等,這些場景對于智能駕駛系統的應變能力提出了極高要求。雖然智能駕駛技術在不斷進步,但人類駕駛員憑借長期積累的經驗和靈活的應變能力,在處理某些特殊情況時仍具有不可替代的優勢。此外,智能駕駛系統的安全性和可靠性也是人們關注的重點,一旦系統出現故障或受到黑客攻擊,可能會引發嚴重的后果。
不過,隨著技術的持續創新與完善,智能駕駛在特定場景下已經能夠發揮重要作用,并且正逐步向更廣泛的應用領域拓展。在一些相對封閉、規則明確的場景,如工業園區、港口、礦區等,智能駕駛車輛已經開始投入使用,實現了貨物的自動運輸,提高了工作效率,降低了人力成本。
新能源汽車智能駕駛領域的世界模型、VLA 等新技術的出現,為行業發展注入了強大動力,讓我們看到了智能駕駛未來的無限可能。雖然目前智能駕駛還無法完全替代人工駕駛,但在技術的推動下,智能駕駛與人工駕駛相互協作、優勢互補的模式,將在未來的交通出行中發揮重要作用,共同為人們創造更加安全、高效、便捷的出行體驗。
作者聲明:內容由AI生成
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.