2025 年 5 月 7 日,理想汽車舉辦 “理想 AI Talk 第二季 —— 理想 VLA 司機大模型,從動物進化到人類” 活動。理想汽車董事長兼 CEO 李想在活動中分享了人工智能的前沿思考,詳細介紹了 VLA 司機大模型的創新突破、訓練方法,以及理想汽車在技術研發與企業成長方面的戰略布局,展現出理想汽車在智能駕駛領域的領先探索。
李想對 AI 工具進行了創新性分層,即信息工具、輔助工具和生產工具。當前多數人僅將 AI 當作獲取信息的工具,其存在大量無效內容,價值有限。輔助駕駛雖提升了效率,但仍需人類參與。而李想認為,只有當 AI 進化為生產工具,能獨立完成專業任務時,才會迎來真正的爆發。VLA 司機大模型便是理想汽車在交通領域打造的專業生產工具,致力于讓 AI 成為像人類司機一樣可靠的 “駕駛伙伴”。
VLA 的發展歷經三個階段,模擬了生物智能進化的過程。早期,理想汽車依賴規則算法和高精地圖的輔助駕駛技術,如同 “昆蟲動物智能”,按既定規則行事。2023 - 2024 年,端到端 + VLM 輔助駕駛技術出現,接近 “哺乳動物智能”,能處理更復雜情況,但端到端模型在復雜問題處理和與人類溝通上存在局限,VLM 基于開源模型,在交通領域的能力也受限。2024 年起,理想汽車開啟 VLA 研究,它融合 3D 和 2D 視覺,擁有完整的 “腦系統”,具備語言和思維鏈推理能力,真正踏入 “人類智能” 階段,能像人類司機一樣理解并執行駕駛任務。
VLA 的訓練過程模擬人類學習駕駛的步驟,分為預訓練、后訓練和強化訓練。預訓練階段,通過海量高清 2D 和 3D 視覺數據、交通語言語料及聯合數據,訓練出云端 VL 基座模型,再轉化為車端高效運行的端側模型,如同人類學習駕駛常識。后訓練加入動作數據,讓 VL 基座模型進化為 VLA 司機大模型,憑借短鏈條思維鏈和擴散模型預測能力,在復雜交通環境中具備實時博弈能力,類似人類在駕校學習實際駕駛技巧。強化訓練旨在讓模型更安全、舒適,通過基于人類反饋的強化學習實現安全對齊,在世界模型中訓練提升舒適性,使模型最終符合人類駕駛習慣和價值觀。
在實際應用中,VLA 司機大模型以 “司機 Agent(智能體)” 形態與用戶交互,用戶可通過自然語言與其溝通,簡單指令由端側 VLA 直接處理,復雜指令經云端 VL 基座模型解析后再處理,極大提升了交互的便捷性和智能化程度。
安全性和模型黑盒問題一直是 AI 發展的難題,理想汽車為此采取了有力措施。組建超 100 人的超級對齊團隊,在強化訓練中注入職業素養,確保模型像職業司機一樣安全、規范駕駛。同時,打造真實、符合物理規律的世界模型,結合重建和生成路徑,覆蓋所有交通要素,利用仿真能力低成本、準確驗證現實問題,有效破解模型黑盒難題。
理想汽車在技術研發上的深厚積累是 VLA 司機大模型成功的關鍵。從研究、研發到能力表達,再到業務價值轉化,理想汽車扎實推進每個環節,尤其注重研究投入。例如,面對英偉達 Orin - X 芯片無法直接運行語言模型的難題,理想汽車自研底層推理引擎,實現芯片通過 INT4 量化運行 VLM,還憑借綜合技術能力,讓不同芯片運行同等規模的 VLA 司機大模型。此外,DeepSeek 的開源助力 VLA 語言能力研發提速,節省大量時間和成本,但理想汽車仍加大投入打造自研模型。同時,理想汽車開源自研的汽車操作系統 —— 理想星環 OS,回饋行業。
在企業成長與個人發展方面,李想分享了深刻見解。理想汽車即將迎來成立十周年,創業過程雖充滿艱辛,但李想保持積極心態,將挑戰視為成長機遇,使企業成長為行業領軍者。他認為個人成長關鍵在于關注自我,接納自身優缺點,用成長替代改變,同時強調親密關系的重要性,家人和同事間的互補支撐能匯聚強大力量。
理想汽車憑借 VLA 司機大模型在智能駕駛領域邁出堅實步伐。在輔助駕駛發展的關鍵節點,理想汽車將繼續以技術創新為驅動,挑戰成長極限,為行業發展和用戶體驗創造更多價值,推動智能駕駛行業邁向新高度。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.