網易首頁 > 網易號 > 正文申請入駐

理想汽車VLA司機大模型：從動物智能到人類智能的跨越

2025-05-08 10:28:27　來源: 速度計

上海舉報

分享至

在人工智能技術飛速發展的今天，理想汽車推出了其革命性的VLA（Vision-Language-Action Model）司機大模型，標志著自動駕駛技術從“昆蟲動物智能”向“人類智能”的重大進化。理想汽車董事長兼CEO李想在“理想AI Talk第二季”中，深入闡述了VLA司機大模型的作用、訓練方法及其對行業的影響。

李想將AI工具分為信息工具、輔助工具和生產工具三個層級。他指出，當前大多數人僅將AI作為信息工具使用，而理想汽車則致力于將AI發展為能夠獨立完成專業任務的生產工具。VLA司機大模型正是這一愿景的具體實現，它將成為交通領域的專業生產工具，為自動駕駛技術帶來質的飛躍。

VLA司機大模型的進化之路經歷了三個階段。初期，理想汽車依賴規則算法和高精地圖，類似于“昆蟲動物智能”。隨后，通過端到端+VLM輔助駕駛技術，實現了接近“哺乳動物智能”的水平。然而，這些技術仍存在局限，難以與人類有效溝通，也無法全面理解物理世界。為此，理想汽車自2024年起開展VLA研究，通過3D和2D視覺的組合，使VLA能夠完整地看到物理世界，并具備語言和思維鏈推理能力，真正實現了“人類智能”的階段。

VLA司機大模型的訓練過程模擬了人類學習駕駛的過程，分為預訓練、后訓練和強化訓練三個環節。預訓練階段，通過大量高清視覺數據、交通相關語料和VL聯合數據，訓練出云端的VL基座模型。后訓練階段，加入動作數據，使VL基座變為VLA司機大模型。強化訓練階段，通過RLHF和純強化學習模型，使VLA司機大模型更加安全、舒適，并對齊人類價值觀。

除了提升專業能力，VLA司機大模型還解決了安全性和模型黑盒的問題。理想汽車組建了超級對齊團隊，確保VLA司機大模型具備職業司機的安全和舒適性。同時，打造了真實、符合物理世界規律的世界模型，破解了AI黑盒難題，提升了解決問題的效率。

理想汽車在VLA司機大模型的研發上取得了顯著成果，不僅得益于DeepSeek的開源助力，更在于其扎實的基本功積累。理想汽車堅持自研，通過技術賦能用戶價值，實現了讓雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。同時，理想汽車還選擇開源自研的汽車操作系統——理想星環OS，回饋社會。

面對AI的發展，李想認為，所有的人性都應被保留，因為人性是文化、生命、性格、能力的特質，也是人類真正的生命力所在。理想汽車將繼續以技術創新解決行業無法解決的問題，不斷挑戰成長的極限，持續為行業和用戶創造價值。VLA司機大模型的推出，不僅是理想汽車技術實力的體現，更是自動駕駛技術向“人類智能”邁進的重要里程碑。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.