最近理想汽車的動作有點猛,在 AI Talk 第二季上直接拋出了 VLA 司機大模型這個 "王炸"。作為深入新能源賽道的老司機,我得好好扒一扒這個讓李想興奮到不行的技術突破。
一、VLA:從動物到人類的進化史
理想這次玩的不是簡單的技術迭代,而是把自動駕駛的進化史比作了一部生物演化史。2021 年他們搞的規則算法 + 高精地圖,像極了昆蟲的本能反應,只能在預設好的環境里爬行。到了 2023 年端到端 + VLM 階段,雖然能處理復雜路況,但就像哺乳動物的條件反射,缺乏深度思考能力。
真正讓我眼睛一亮的是第三階段的 VLA,這貨直接開啟了人類級別的智能。它通過 3D+2D 視覺融合,能像人類一樣 "看" 到完整的物理世界,而不是像之前那樣只盯著平面圖像發呆。更絕的是,VLA 還具備了思維鏈(CoT)能力,遇到加塞這種突發情況,會像老司機一樣在腦子里推演應對策略,而不是像個新手一樣急剎車。
二、訓練過程:比人類學車還卷
理想為了訓練這個 "老司機",簡直把人類學習的套路摸透了。預訓練階段就像我們考駕照前背交規,用海量的 2D/3D 視覺數據 + 交通語料喂給模型,光這一步就用了超過 3 倍預期的訓練卡。后訓練階段更狠,直接把車輛的駕駛行為編碼成數據,讓模型在虛擬駕校里瘋狂刷題。
最讓人佩服的是強化訓練環節,理想專門組建了 100 多人的 "超級對齊團隊",就像駕校教練一樣盯著模型的每一個動作。他們用 RLHF 技術讓模型學會遵守交規,還開發了世界模型讓它在虛擬環境里模擬各種極端路況。聽說這個世界模型能把 AEB 剎停距離縮短 7 米,車身控制精度提升 73%,這數據比某些車企的 PPT 可實在多了。
三、三大能力:重新定義人車關系
VLA 最吸引人的地方,在于它重新定義了汽車的角色。首先是專業能力,通過 Diffusion 模型預測他車軌跡,在復雜路口的博弈能力比人類司機還穩。其次是職業能力,100 多人的對齊團隊專門訓練它不做 "路怒癥患者",遇到加塞能禮貌讓行,不像某些車企的輔助駕駛只會硬剛。
最讓我感興趣的是構建信任的能力。VLA 能理解自然語言指令,你說 "開慢點" 它就會降速,說 "找個車位" 它就能在地庫里自主漫游。這種交互方式就像有個真正的司機坐在車里,而不是冷冰冰的機器。更貼心的是,它還能記住你的駕駛習慣,比如每次經過學校都會自動減速,這種潤物細無聲的關懷才是真正的智能。
四、技術背后的 "笨功夫"
理想這次的技術突破,其實藏著很多不為人知的 "笨功夫"。為了讓 Orin-X 芯片跑語言模型,他們自研了底層推理引擎,把模型量化到 INT4 精度,這就像給老電腦升級系統一樣,愣是榨干了硬件的每一滴性能。還有那個理想星環 OS,投入 10 億研發費用,4 周就能完成芯片適配,比傳統方案快了 6 倍。
在開源這件事上,理想也玩得很聰明。他們用 DeepSeek 的開源模型節省了 9 個月時間,但轉頭就開源自研的星環 OS 回饋社區。這種 "站在巨人肩膀上還搭梯子" 的做法,讓我想起李想那句 "基本功永遠無法被逾越"。
五、行業啟示:AI 時代的生存法則
VLA 的發布,其實揭示了智能汽車競爭的底層邏輯。當某些車企還在堆激光雷達的時候,理想已經在思考如何讓 AI 真正理解人類。這種 "從工具到伙伴" 的轉變,才是未來的決勝點。
不過這里面也有個值得深思的問題:當 AI 越來越像人類,我們該如何保留自己的價值?李想的回答很有意思,他說 "人性的弱點也是生命力的體現"。這讓我想起前幾天試駕搭載 VLA 的理想 L9,當它在暴雨天穩穩剎停時,我突然意識到:或許真正的智能,不是取代人類,而是讓我們更安心地做回自己。
理想這次的 VLA 大模型,就像往輔助駕駛的池塘里扔下了一顆深水炸彈。它帶來的不僅是技術的突破,更是對人車關系的重新定義。當汽車開始思考,人類反而更需要保持那份對駕駛的熱愛 —— 畢竟,有些風景,還是得自己握著方向盤才能看到。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.