網易首頁 > 網易號 > 正文申請入駐

理想汽車VLA司機大模型動物進化至人類成長破行業難題

2025-05-08 10:17:08　來源: 嘻哈車

安徽舉報

分享至

2025年5月7日，理想汽車開啟“理想AI Talk第二季——理想VLA司機大模型，從動物進化到人類”活動，理想汽車董事長兼CEO李想分享了諸多關于人工智能及VLA司機大模型的見解，為智能駕駛領域帶來了新的思考與方向。

AI工具三階進化：從信息到生產

李想將AI工具劃分為信息工具、輔助工具和生產工具三個層級。當下，多數人把AI當作信息工具，可它常充斥著大量無效信息，僅能提供參考。而輔助工具雖能提升效率，像現在的輔助駕駛，但仍離不開人類的參與。真正的變革在于AI成為生產工具，那時它將獨立完成專業任務，大幅提升效率與質量。

李想認為，判斷Agent（智能體）是否智能，關鍵看其是否成為生產工具。就像人類會雇傭司機，人工智能技術最終也會承擔類似職責，成為真正的生產工具。這一觀點為AI的發展指明了方向，讓我們看到了AI在專業領域發揮巨大潛力的可能。

VLA進化之路：從“昆蟲”到“人類”

VLA（Vision-Language-Action Model，視覺語言行動模型）的出現，讓AI有望真正成為司機，成為交通領域的專業生產工具。但VLA的實現并非一蹴而就，而是經歷了三個階段的進化，對應著理想汽車輔助駕駛的昨天、今天和明天。

第一階段，理想汽車自2021年起自研依賴規則算法和高精地圖的輔助駕駛，類似“昆蟲動物智能”，能力相對有限。第二階段，從2023年起研究并于2024年正式推送端到端+VLM輔助駕駛，接近“哺乳動物智能”，不過端到端模型處理復雜問題有局限，VLM使用開源模型在交通領域能力有限，且難以與人類溝通。于是，2024年起理想汽車開展VLA研究，在多項頂級學術會議上發表論文，夯實理論基礎。

到第三階段，VLA將開啟“人類智能”階段。它能通過3D和2D視覺組合完整看到物理世界，擁有完整腦系統，具備語言、CoT推理能力，能看、能理解還能執行行動，完全符合人類運作方式。這一進化過程，體現了理想汽車在智能駕駛領域不斷探索、逐步突破的決心和能力。

VLA訓練與安全保障：模擬人類與超級對齊

VLA的訓練過程模擬人類學習駕駛技能，分為預訓練、后訓練和強化訓練三個環節。預訓練相當于學習物理世界和交通領域常識，訓練出云端的VL基座模型并轉化為端側模型。后訓練類似去駕校學開車，加入Action數據后VL基座變為VLA司機大模型，具備實時性和博弈能力。強化訓練則類似實際開車練習，通過RLHF和純強化學習模型放入世界模型中訓練，讓VLA司機大模型更安全、舒適，對齊人類價值觀，甚至超越人類駕駛水平。

除了提升專業能力，VLA司機大模型還需解決安全性和模型黑盒問題。理想汽車在強化訓練環節投入大量資源，組建超級對齊團隊，為司機Agent注入職業素養。同時，結合重建和生成兩種路徑打造世界模型，覆蓋所有交通參與者和要素，讓VLA能在世界模型中低成本、準確驗證現實問題，有效應對模型黑盒挑戰。判斷司機Agent好壞有三個關鍵標準，VLA司機大模型在專業能力、職業能力和構建信任的能力方面都表現出色。

理想汽車發展啟示：基本功與正能量

理想汽車實現技術快速躍遷，離不開從研究、研發到能力表達，再到業務價值的基本功積累。研究是關鍵，突破后研發效率大幅提升，注重價值轉化實現業務落地。理想汽車堅持自研，通過技術賦能用戶價值，在輔助駕駛等方面取得顯著成果。

李想在創業路上也有著積極樂觀的心態，他認為創業雖苦，但沒必要苦哈哈的，應保留有價值的美好片段激勵自己。成為更有能量的人，關鍵在于關注自我，用成長替代改變，同時重視親密關系，家人和同事能相互支撐。

理想汽車在智能駕駛領域的探索和突破令人欽佩。它不僅在技術上不斷創新，從AI工具層級劃分到VLA司機大模型的進化，再到訓練和安全保障，都展現出了強大的研發實力和前瞻性的思維。而且，理想汽車堅持自研、注重基本功積累以及積極樂觀的創業心態，都值得其他企業學習。在AI時代，理想汽車有望憑借這些優勢，在智能駕駛領域持續引領潮流，為用戶帶來更安全、更便捷的出行體驗。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.