5月7日,理想汽車推出“理想AI Talk第二季——理想VLA(視覺語言行動模型)司機大模型,從動物進化到人類”,理想汽車董事長兼CEO李想分享了他對人工智能的最新思考,以及VLA司機大模型的作用、訓練方法和挑戰。
李想表示:“判斷智能體是否真正智能,關鍵在于它是否成為生產工具。只有當人工智能變成生產工具,才是其真正爆發的時刻。就像人類會雇傭司機,人工智能技術最終也會承擔類似職責,成為真正的生產工具。”
在李想看來,目前市面上的L2、L2+組合駕駛輔助仍屬于輔助工具階段,而VLA能夠讓AI真正成為司機,成為交通領域的專業生產工具。“對理想汽車而言,未來的VLA就是一個像人類司機一樣工作的司機大模型”。
據介紹,VLA的訓練分為預訓練、后訓練和強化訓練三個環節,類似于人類學習駕駛技能的過程。
“預訓練相當于人類學習物理世界和交通領域的常識,后訓練相當于人類去駕校學習開車的過程,強化訓練類似于人類在社會中實際開車練習。”李想表示,“經過預訓練、后訓練和強化訓練后,VLA司機大模型即可部署至車端運行。”
除了提升專業能力,VLA司機大模型還需解決安全性和模型黑盒的問題。
為了保障VLA司機大模型能夠實現職業司機般的安全和舒適,避免學習加塞等違規行為,理想汽車在強化訓練環節投入大量資源,并于2024年底組建超過100人的超級對齊團隊。
為解決模型的黑盒問題,理想汽車結合重建和生成兩種路徑,打造了真實、符合物理世界規律的世界模型,覆蓋所有交通參與者和要素。
得益于DeepSeek的開源,理想汽車在VLA司機大模型的語言能力研發上提速顯著,節省了近9個月的時間和數億元成本。盡管如此,理想汽車仍選擇加大投入,在基座模型上投入超預期3倍的訓練卡,專注打造適配多場景的自研模型。
“自研VLA時,理想汽車踏入了人工智能的無人區。”李想表示,當前,輔助駕駛走到了新的十字路口上,理想汽車將不斷挑戰成長的極限,持續為行業和用戶創造價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.