AI技術、駕駛輔助快速發展,但相關爭議從未停歇。因輔助駕駛引發的事故頻發,多家車企的輔助駕駛功能被質疑“華而不實”,消費者對智能駕駛的信任度始終搖擺不定。在這樣的背景下,理想汽車卻選擇了一條“死磕智能化”的道路——All in“VLA司機大模型”,試圖將AI從輔助工具升級為真正的“生產工具”,讓AI輔助駕駛完成從動物到“人類”的進化。
那么理想汽車這一舉動究竟是“頭硬”,還是預示著真正的AI智能駕駛黎明即將到來?5月7日,“理想AI Talk“第二季開播,理想汽車掌門人李想,就向全網分享了其個人以及理想汽車對人工智能的最新思考、VLA司機大模型的作用、訓練方法和挑戰,以及對于創業和個人成長的見解。
爭議中的駕駛輔助:技術瓶頸與用戶疑慮
按照行業共識,智能駕駛技術主要分為L2級輔助駕駛和更高級別的自動駕駛。盡管L2級功能(如自適應巡航、車道保持)已逐漸普及,但其局限性也十分明顯:依賴高精地圖、規則算法僵硬、復雜場景下仍需人工干預。更高級別的智能駕駛則因技術不成熟、法規滯后等問題,始終難以大規模落地。此外,頻發的安全事故和“黑盒”問題(即AI決策過程不透明)進一步加劇了用戶對智能駕駛的擔憂。
面對這些爭議,許多車企選擇保守策略,專注于優化現有功能。但理想汽車卻反其道而行之,提出了VLA司機大模型的概念,試圖通過模擬人類司機的學習過程,打造一個能夠獨立完成駕駛任務的“AI司機”。這一大膽的嘗試,無疑將理想汽車推向了行業的風口浪尖。
VLA司機大模型:從“昆蟲”到“人類”的進化
理想汽車董事長兼CEO李想將AI的發展分為三個階段:規則算法的“昆蟲動物智能”、端到端模型的“哺乳動物智能”,以及VLA司機大模型的“人類智能”。他認為,只有AI成為真正的“生產工具”,才能實現技術爆發的臨界點。
其實VLA,就是Vision、Language、Action的首字母縮寫,翻譯過來就是視覺、語言、行動,VLA大模型,就是要模擬人類司機駕駛的方式。所以VLA司機大模型的訓練過程,也就模擬了人類學習駕駛的路徑,即預訓練、后訓練和強化訓練三個階段。
其中預訓練,就是通過海量視覺和語言數據,讓AI掌握物理世界和交通常識;后訓練則會加入動作數據,使AI具備實際駕駛能力;而強化訓練,是通過人類反饋和世界模型仿真,確保AI的安全性、舒適性和職業性。
這種分階段、漸進式的訓練方法,不僅解決了傳統端到端模型的“黑盒”問題,還通過“超級對齊”技術約束AI的行為,避免其學習不良駕駛習慣(如加塞)。此外,用戶可以通過自然語言與VLA司機Agent交互,使其更貼近人類司機的服務體驗。
是“頭硬”還是“迎接黎明”?
理想汽車選擇在智能駕駛爭議最大的時刻加碼VLA司機大模型,看似冒險,實則有其深層邏輯。對此,李想也針對用戶需求、企業動向和行業發展方面進行了深刻的剖析。
簡言之就是隨著智能駕駛普及,用戶對“真正解放雙手”的需求日益強烈,VLA的“生產工具”屬性恰好契合這一趨勢;理想汽車自研了從芯片到操作系統的全棧技術,解決了行業普遍面臨的算力瓶頸和開發效率問題;當前智能駕駛陷入“輔助工具”的瓶頸,VLA的“人類智能”定位可能成為打破僵局的關鍵。
然而,挑戰依然存在。AI的倫理問題、法規限制、用戶接受度以及技術落地的成本,都是理想汽車必須面對的“硬骨頭”。但李想的態度十分明確:“創業路上苦多于甜,但沒必要苦哈哈的。”他將挑戰視為成長的機會,并堅信當前關于智能駕駛的爭議只是黎明前的黑暗,打好扎實的基本功,打消走捷徑的念頭一步一個腳印地走下去,曙光終會照進現實。
結語:爭議中的曙光
理想汽車的VLA司機大模型,或許是一場豪賭。但在智能駕駛的爭議聲中,或許也只有這種“頭硬”的精神,才有可能推動行業跨越技術鴻溝,迎來真正的黎明。正如李想所說:“在AI面前,所有的人性都應被保留,因為這才是人類真正的生命力所在。”
無論結果如何,理想汽車的嘗試至少為行業提供了一個新的方向:智能駕駛、AI汽車的未來,或許不在于“替代人類”,而在于“成為人類”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.