網易首頁 > 網易號 > 正文申請入駐

理想汽車舉辦“理想AI Talk第二季”

2025-05-15 10:59:28　來源: 金臺資訊

北京舉報

分享至

“判斷Agent(智能體)是否真正智能，關鍵在于它是否成為生產工具。只有當人工智能變成生產工具，才是其真正爆發的時刻。就像人類會雇傭司機，人工智能技術最終也會承擔類似職責，成為真正的生產工具。”日前，理想汽車舉辦“理想AI Talk第二季”，理想汽車董事長兼CEO李想重點分享了對于人工智能的最新思考，VLA司機大模型的作用、訓練方法和挑戰，以及對于創業和個人成長的見解。

李想將AI工具分為三個層級，分別是信息工具、輔助工具和生產工具。目前，大多數人將AI作為信息工具使用，但信息工具常伴隨大量無效信息、無效結果和無效結論，僅具參考價值。成為輔助工具后，AI可以提升效率，例如現在的輔助駕駛，但仍需人類參與。未來，AI發展為生產工具后，將能獨立完成專業任務，顯著提升效率與質量。

目前的L2、L2+組合駕駛輔助仍屬于輔助工具階段，而VLA(Vision-Language-Action Model，視覺語言行動模型)能夠讓AI真正成為司機，成為交通領域的專業生產工具。對理想汽車而言，未來的VLA就是一個像人類司機一樣工作的司機大模型。

據介紹，VLA的實現不是一個突變的過程，是進化的過程，經歷了三個階段，對應理想汽車輔助駕駛的昨天、今天和明天。第一階段，理想汽車自2021年起自研依賴規則算法和高精地圖的輔助駕駛，類似“昆蟲動物智能”。第二階段，理想汽車自2023年起研究，并于2024年正式推送的端到端+VLM(Vision Language Model，視覺語言模型)輔助駕駛，接近“哺乳動物智能”。第三階段，VLA將開啟“人類智能”的階段。它能通過3D和2D視覺的組合，完整地看到物理世界，而不像VLM僅能解析2D圖像。同時，VLA擁有完整的腦系統，具備語言、CoT(Chain of Thought，思維鏈)推理能力。

VLA的訓練分為預訓練、后訓練和強化訓練三個環節，類似于人類學習駕駛技能的過程。預訓練相當于人類學習物理世界和交通領域的常識；后訓練相當于人類去駕校學習開車的過程；強化訓練類似于人類在社會中實際開車練習，目標是讓VLA司機大模型更加安全、舒適，對齊人類價值觀，甚至超越人類駕駛水平。

據悉，VLA司機大模型以“司機Agent(智能體)”的產品形態呈現，用戶可通過自然語言與司機Agent溝通，跟人類司機怎么說，就跟司機Agent怎么說。簡單通用的短指令由端側的VLA直接處理，復雜指令則先由云端的VL基座模型解析，再交由VLA處理。

除了提升專業能力，VLA司機大模型還需解決安全性和模型黑盒的問題。理想汽車在強化訓練環節投入大量資源，并于2024年底組建超過100人的超級對齊團隊，相當于為司機Agent注入職業素養。

值得一提的是，今年7月，理想汽車將迎來成立十周年。李想表示，創業路上苦多于甜，他選擇保留那些有價值的美好片段，用來激勵自己保持正能量。面對AI的發展，李想認為，在AI面前所有的人性都應被保留，無論好壞，因為一切人性都是文化、生命、性格、能力的特質，也是人類真正的生命力所在。(記者張懿)

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.