2025年5月7日,理想汽車開啟“理想AI Talk第二季——理想VLA司機大模型,從動物進化到人類”活動,理想汽車董事長兼CEO李想分享了諸多關于人工智能及VLA司機大模型的見解,為智能駕駛領域帶來了新的思考與方向。
AI工具三階進化:從信息到生產
李想將AI工具劃分為信息工具、輔助工具和生產工具三個層級。當下,多數人把AI當作信息工具,可它常充斥著大量無效信息,僅能提供參考。而輔助工具雖能提升效率,像現在的輔助駕駛,但仍離不開人類的參與。真正的變革在于AI成為生產工具,那時它將獨立完成專業任務,大幅提升效率與質量。
李想認為,判斷Agent(智能體)是否智能,關鍵看其是否成為生產工具。就像人類會雇傭司機,人工智能技術最終也會承擔類似職責,成為真正的生產工具。這一觀點為AI的發展指明了方向,讓我們看到了AI在專業領域發揮巨大潛力的可能。
VLA進化之路:從“昆蟲”到“人類”
VLA(Vision-Language-Action Model,視覺語言行動模型)的出現,讓AI有望真正成為司機,成為交通領域的專業生產工具。但VLA的實現并非一蹴而就,而是經歷了三個階段的進化,對應著理想汽車輔助駕駛的昨天、今天和明天。
第一階段,理想汽車自2021年起自研依賴規則算法和高精地圖的輔助駕駛,類似“昆蟲動物智能”,能力相對有限。第二階段,從2023年起研究并于2024年正式推送端到端+VLM輔助駕駛,接近“哺乳動物智能”,不過端到端模型處理復雜問題有局限,VLM使用開源模型在交通領域能力有限,且難以與人類溝通。于是,2024年起理想汽車開展VLA研究,在多項頂級學術會議上發表論文,夯實理論基礎。
到第三階段,VLA將開啟“人類智能”階段。它能通過3D和2D視覺組合完整看到物理世界,擁有完整腦系統,具備語言、CoT推理能力,能看、能理解還能執行行動,完全符合人類運作方式。這一進化過程,體現了理想汽車在智能駕駛領域不斷探索、逐步突破的決心和能力。
VLA訓練與安全保障:模擬人類與超級對齊
VLA的訓練過程模擬人類學習駕駛技能,分為預訓練、后訓練和強化訓練三個環節。預訓練相當于學習物理世界和交通領域常識,訓練出云端的VL基座模型并轉化為端側模型。后訓練類似去駕校學開車,加入Action數據后VL基座變為VLA司機大模型,具備實時性和博弈能力。強化訓練則類似實際開車練習,通過RLHF和純強化學習模型放入世界模型中訓練,讓VLA司機大模型更安全、舒適,對齊人類價值觀,甚至超越人類駕駛水平。
除了提升專業能力,VLA司機大模型還需解決安全性和模型黑盒問題。理想汽車在強化訓練環節投入大量資源,組建超級對齊團隊,為司機Agent注入職業素養。同時,結合重建和生成兩種路徑打造世界模型,覆蓋所有交通參與者和要素,讓VLA能在世界模型中低成本、準確驗證現實問題,有效應對模型黑盒挑戰。判斷司機Agent好壞有三個關鍵標準,VLA司機大模型在專業能力、職業能力和構建信任的能力方面都表現出色。
理想汽車發展啟示:基本功與正能量
理想汽車實現技術快速躍遷,離不開從研究、研發到能力表達,再到業務價值的基本功積累。研究是關鍵,突破后研發效率大幅提升,注重價值轉化實現業務落地。理想汽車堅持自研,通過技術賦能用戶價值,在輔助駕駛等方面取得顯著成果。
李想在創業路上也有著積極樂觀的心態,他認為創業雖苦,但沒必要苦哈哈的,應保留有價值的美好片段激勵自己。成為更有能量的人,關鍵在于關注自我,用成長替代改變,同時重視親密關系,家人和同事能相互支撐。
理想汽車在智能駕駛領域的探索和突破令人欽佩。它不僅在技術上不斷創新,從AI工具層級劃分到VLA司機大模型的進化,再到訓練和安全保障,都展現出了強大的研發實力和前瞻性的思維。而且,理想汽車堅持自研、注重基本功積累以及積極樂觀的創業心態,都值得其他企業學習。在AI時代,理想汽車有望憑借這些優勢,在智能駕駛領域持續引領潮流,為用戶帶來更安全、更便捷的出行體驗。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.