在人工智能技術飛速發展的今天,理想汽車推出了其革命性的VLA(Vision-Language-Action Model)司機大模型,標志著自動駕駛技術從“昆蟲動物智能”向“人類智能”的重大進化。理想汽車董事長兼CEO李想在“理想AI Talk第二季”中,深入闡述了VLA司機大模型的作用、訓練方法及其對行業的影響。
李想將AI工具分為信息工具、輔助工具和生產工具三個層級。他指出,當前大多數人僅將AI作為信息工具使用,而理想汽車則致力于將AI發展為能夠獨立完成專業任務的生產工具。VLA司機大模型正是這一愿景的具體實現,它將成為交通領域的專業生產工具,為自動駕駛技術帶來質的飛躍。
VLA司機大模型的進化之路經歷了三個階段。初期,理想汽車依賴規則算法和高精地圖,類似于“昆蟲動物智能”。隨后,通過端到端+VLM輔助駕駛技術,實現了接近“哺乳動物智能”的水平。然而,這些技術仍存在局限,難以與人類有效溝通,也無法全面理解物理世界。為此,理想汽車自2024年起開展VLA研究,通過3D和2D視覺的組合,使VLA能夠完整地看到物理世界,并具備語言和思維鏈推理能力,真正實現了“人類智能”的階段。
VLA司機大模型的訓練過程模擬了人類學習駕駛的過程,分為預訓練、后訓練和強化訓練三個環節。預訓練階段,通過大量高清視覺數據、交通相關語料和VL聯合數據,訓練出云端的VL基座模型。后訓練階段,加入動作數據,使VL基座變為VLA司機大模型。強化訓練階段,通過RLHF和純強化學習模型,使VLA司機大模型更加安全、舒適,并對齊人類價值觀。
除了提升專業能力,VLA司機大模型還解決了安全性和模型黑盒的問題。理想汽車組建了超級對齊團隊,確保VLA司機大模型具備職業司機的安全和舒適性。同時,打造了真實、符合物理世界規律的世界模型,破解了AI黑盒難題,提升了解決問題的效率。
理想汽車在VLA司機大模型的研發上取得了顯著成果,不僅得益于DeepSeek的開源助力,更在于其扎實的基本功積累。理想汽車堅持自研,通過技術賦能用戶價值,實現了讓雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。同時,理想汽車還選擇開源自研的汽車操作系統——理想星環OS,回饋社會。
面對AI的發展,李想認為,所有的人性都應被保留,因為人性是文化、生命、性格、能力的特質,也是人類真正的生命力所在。理想汽車將繼續以技術創新解決行業無法解決的問題,不斷挑戰成長的極限,持續為行業和用戶創造價值。VLA司機大模型的推出,不僅是理想汽車技術實力的體現,更是自動駕駛技術向“人類智能”邁進的重要里程碑。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.