經觀汽車
2025年5月8日,距離“AI Talk”第一季播出已有130天,面對鏡頭,理想汽車創始人李想坦言:“人工智能發展得這么快,但我每天的工作時間并沒有減少。”這一句話,道出了他對AI技術落地路徑的冷靜思考,也預示著理想汽車在智能化道路上的階段躍遷。
在這場持續數小時的訪談中,李想系統性地闡述了他對AI工具分級的理解——從信息工具、輔助工具,到生產工具。而在理想的語境中,生產工具意味著AI真正進入價值創造的核心。這場技術演化的關鍵,正在從模型的堆疊走向具象能力的整合與釋放。
過去四個月,中國本土大模型迎來了突飛猛進的發展。李想在談話中頻頻提及DeepSeek——這一國產大模型體系,在技術架構、推理能力和工程效率上的表現,讓理想汽車決策層重新評估了其VLA(視覺-語言-行動)戰略的實施路徑。
“DeepSeek給了我們一個巨大的推動力。”李想坦承,原本計劃在年底完成的基座模型,因DeepSeek的開源提前了九個月完成基礎設施建設。
也正是出于這種“被幫助之后的反饋機制”,理想汽車選擇開源自研四年的星環OS整車操作系統。“我們受到了那么大的幫助,應該給社會做一些貢獻。”李想說。
他提到,在過去的春節期間,理想團隊圍繞DeepSeek展開了全面研究,從模型的MoE(混合專家)結構、訓練效率、到部署難度,進行了詳盡評估。“這不是簡單的‘借用’,而是站在巨人的肩膀上再進一層。”他說。
從規則到端到端,再到VLA
李想認為,人工智能走向生產力的關鍵在于Agent能力的釋放,即AI不再只是輔助人類思考和判斷,而是能夠獨立完成專業工作,承擔“替代性”的角色。理想汽車當前的VLA戰略,正是對這一目標的路徑設計。
VLA,即“視覺-語言-行動”模型,是理想汽車提出的輔助駕駛大模型方案。李想將VLA的發展劃分為三個階段:
第一階段是以規則算法為主的“昆蟲智能”,高度依賴地圖和預設規則,類似螞蟻在路徑上的機械執行。
第二階段是當前正在推進的端到端模型,通過大數據學習形成對行為的模仿,類似“哺乳動物式”的感知和反應,雖不完全理解物理世界,但能完成一定泛化任務。
第三階段,即VLA階段,則是李想眼中“類人智能”的起點。它不僅能夠看懂導航界面、識別3D場景,還能進行語義推理(Chain of Thought),具備主動判斷和行動的能力。“這是我們的‘司機大模型’。”李想說。
為了達成這一目標,理想汽車正在訓練一個32B規模(即320億參數規模)的VL(視覺-語言)基座模型。李想詳細介紹了訓練的三個關鍵部分:
首先,是視覺方面的token和語料。理想在模型中納入了大量3D視覺數據,即來自物理世界的三維信息,同時還引入了高清2D圖像數據,分辨率相比開源多模態模型提升了10倍,以解決當前2D視覺模態清晰度不足、識別距離有限的問題。
其次,是語言部分的輸入。模型訓練加入了大量與交通、駕駛行為相關的語言語料,以強化其在實際場景中的語義理解能力。
第三個關鍵點,是視覺與語言的聯合語料(VL語料)。李想強調,這一部分極易被忽視,但對VLA至關重要。聯合語料指的是圖像信息與語言語義同時存在于一個數據單元中,比如導航地圖與車輛對其的語義理解共同輸入模型,幫助模型建立起從視覺到語言再到行動之間的深度聯結能力。
“過去的VLM(視覺-語言模型)大多只是能看圖說話,但理解不了世界。我們要的是一個能看懂真實世界、理解物理規則、具備行動意圖的大模型。”李想指出。
在談及基座模型的研發投入時,李想表示:“我們今年的訓練卡采購量,是原定計劃的三倍。”這一擴張級別,反映出理想汽車在自研基礎模型上的戰略押注。
盡管DeepSeek的開源帶來了加速效應,李想并未對自研路徑抱有任何僥幸心理。他反復強調:“沒有任何捷徑。如果規則算法做不好,根本不知道怎么走端到端。端到端不做到極致,就沒法訓練好VLA。”
這也解釋了為什么理想汽車仍然堅持構建自己的基座模型,而不是完全依賴第三方平臺。“我們的任務不僅僅是對話生成。我們要的是對多模態世界的理解,是真正為汽車場景服務的智能體。”李想說。
談及行業格局,李想將DeepSeek比作“Linux時刻”,而理想追逐的,則是“安卓時刻”。
“語言模型只是底座,真正的爆發在于將其部署于特定領域,釋放出完整的應用能力。”他表示,在交通領域,理想希望借由VLA構建出具備認知、推理和行動能力的類人駕駛模型。
這一愿景背后,是理想汽車從底層操作系統到多模態大模型全面自研的技術鏈閉環。而在產業層面,這也意味著一場從傳統規則驅動到智能體驅動的范式躍遷正在發生。
李想認為,輔助駕駛行業當前正處于“黎明前的黑暗”。爭議與困境并存,但這正是新范式到來的前夜。“我最愿意解決的就是別人解決不了的問題。”他說。
在理想汽車的路徑圖中,AI不再是一個效率工具,而是一個系統性、可擴展、可以承擔主角的“生產工具”。在這個定義之下,VLA不僅是技術躍遷的起點,更是理想汽車試圖重塑人車關系、重塑交通智能產業的路徑嘗試。
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.