吵架、斗嘴、互懟是國內車圈的常態,尤其在智能輔助駕駛領域,大家更是習慣了自我吹捧、拉高踩低。
最近,理想和小鵬又雙叒叕地在VLA技術路線上展開了一次新的交鋒。
借著這次機會,給大家縷一下理想和小鵬汽車過去幾年中的智駕營銷戰,再談一談對這次交鋒的觀點。
自動駕駛向來是一個浮夸風吹得很猛烈的行業,這股歪風的始作俑者恐怕要追究到馬斯克的頭上,多少年了,馬斯克一次又一次地將FSD吹上了天。
比起大洋彼岸的特斯拉,國內車企在自動駕駛上的宣傳可謂有過之而無不及。
遠的不提了,我們可以從2023年的開城大戰說起。
由于在智能輔助駕駛方面自研較晚,理想汽車在自動駕駛方面的進度實際上是一度落后于華為、小鵬和蔚來的。
但在相關宣傳方面,理想汽車一向是輸人不輸陣,口頭上從來沒有輸過。
2023年,國內廠商剛剛開啟向無圖NOA的轉型,理想汽車就早早地表示自己是國內第一家率先實現無圖城區NOA的車企,看得小鵬和華為一臉懵逼。
小鵬汽車剛剛宣布要在2023年開城45座城市的城區NOA,理想汽車就放大炮宣布要在2023年開通100座城市的城區NOA。
或許正是從那個時間開始,這兩家就結下了梁子。
到了2024年,雙方又針對端到端展開了一波營銷戰。
雙方都在聲稱,自己才是第一個全球唯二率先量產落地端到端大模型的本土車企。
“世界唯二/全球唯二”是國內車圈常見的技術傳播術語,唯二里的兩家,一家當然是自己,另一家多數指的是特斯拉。
以吹特斯拉為名,行捧自己之實,本土車企們深諳這種營銷口號能夠在用戶的心中引起怎樣的效果。
理想汽車在24年7月6號宣布推送端到端無圖NOA方案,到了7月底,何小鵬直接宣布“小鵬是全球唯二實現端到端大模型量產落地的車企”。
后來,雙方又針對實車數量能不能決定端到端方案的性能,以及誰率先部署一段式端到端展開了一波交鋒,讓喜歡看熱鬧也喜歡看門道的我很是服氣。
滿滿的情緒,像極了小兩口耍嘴皮!
在中國自動駕駛產業發展的編年史里,應該有小鵬和理想的一席之地。
2024年,這兩家新勢力車企率先落地一段式端到端方案,進入2025年,他們又爭先恐后地開始訓練和部署基于生成式AI的VLA智駕大模型。
不過,正如因架構設計、訓練方法、數據配比等各個方面的原因,導致不同廠家的一段式端到端方案存在千差萬別一樣,小鵬和理想汽車的VLA大模型也存在一定的差別。
根據這段時間小鵬高管及KOC和理想KOC之間的爭論來看,在實車部署時有有沒有走端云結合路線是這兩家方案的首要差別。
小鵬汽車自動駕駛產品高級總監表示,所有跟控車相關的VLA都必須放到車端。
那句“通過云端交互的VLA可以演示,但不建議拿來真物理世界真實使用”,簡直就是對理想汽車貼臉開大了,因為,理想VLA司機Agent走的就是端云一體路線。
“端云結合”體現在對復雜任務語音指令的處理上,如圖所示,簡單語音指令直接送入車端4B VLA司機大模型。
但是需要更大的模型才能處理的復雜任務語音指令,要先經過云端的32B VL基座模型做長任務拆解,然后再以文本指令的形式將拆解出來的多個短指令送入車端的4B VLA司機大模型。
先來看小鵬高管的邏輯:“因為網絡延遲和網絡丟失,導致用戶語音控車無法及時響應,別說是1到2秒的延遲,超過300毫秒的延遲就會導致控車的風險。
”安全大于天,小鵬將VLA完全放在車端的做法,似乎能夠杜絕網絡延遲導致的安全風險。
但是,對于那些即便存在1-2秒延遲也無傷大雅的復雜任務語音指令,只有幾B參數的車端VLA模型就愛莫能助了。
這里的核心邏輯在于,大模型的能力和其參數規模存在正相關關系。幾B參數的模型,你真能信得過它的語言理解能力?
英雄所見略同,小鵬汽車將訓練和部署VLA模型的工廠劃分成了四個車間,理想汽車也將VLA模型的訓練和推理劃分成了四個階段。
小鵬汽車云端模型工廠第一車間負責基座模型的預訓練和后訓練,第二車間負責模型蒸餾,第三車間對蒸餾出的模型繼續做預訓練,第四車間將 XVLA部署到車端。
由此可見,小鵬的做法是,先在基座模型的后訓練階段通過世界模型進行強化學習,然后再進行模型蒸餾。
理想汽車先進行視覺語言基座模型的預訓練,蒸餾出3.6B的小模型之后,再通過駕駛場景數據進行后訓練和強化學習。
最后,在第四階段將最終的司機Agent進行端云部署。由此可見,理想汽車的做法是先對基座模型進行蒸餾,再對蒸餾后的模型做強化學習。
很顯然,小鵬和理想在VLA訓練上的區別在于強化學習的時機和對象不同。
小鵬對云端基座模型做強化學習,先做強化學習再蒸餾,理想則是先蒸餾基座模型再做強化學習,對車端蒸餾模型做強化學習。
哪個路線有更高的天花板目前很難判斷,我只能講一下各自的優缺點。
小鵬路線的優點在于吻合智能涌現的規律,模型的參數規模越大,強化學習的效果越好,更大規模的神經網絡能夠全面吸納駕駛數據,不遺漏重點信息細節,大幅提高云端大模型上限。
缺點在于,即便云端大模型智能涌現,經過蒸餾之后,模型的能力也會大幅度縮水。
而且,在遇到長尾問題后需要重新訓練云端基座模型,更大參數的模型訓練需要消耗更多算力資源和訓練時間。
理想路線的優點在于對車端VLA做強化學習,能夠彌補蒸餾過程造成的能力損失。
而且,利用新長尾場景重新做強化訓練,因其模型規模小,訓練成本低、效率高。但它的缺點是可能不會觸發智能涌現。
2022年底,OpenAI揭示了預訓練的威力,2024年底,DeepSeek展示了強化學習的能力。
小鵬和理想結合預訓練和強化學習,雙雙率先對VLA發起攻堅,給友商打了個樣板。
至于誰是行業第一,哪個是更好的技術路線,其實沒必要爭來爭去,等大家都實車部署VLA之后,再騎驢看唱本,走著瞧吧!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.