嚴選好車163的第1161次推送
2025年的中國智駕技術市場,速度在變快,方向卻不算清晰。
一邊是量產(chǎn)車型不斷增加,高階輔助駕駛開始普及到十萬元以內(nèi)的入門車型;另一邊,關于安全、責任和監(jiān)管的討論也從未停下。技術公司和車企在交付、用戶教育和系統(tǒng)穩(wěn)定性之間反復拉扯,一些舊有路徑正在失效,一些新方法開始被試探。
就在這樣的背景下,商湯絕影選擇把生成式AI引入車上。它嘗試用世界模型和強化學習來重新訓練一輛車的駕駛策略,也開始在座艙層重寫操作系統(tǒng)邏輯,從AI內(nèi)核到交互框架都自己構建。
“我們希望打造智能輔助駕駛的通用大腦。”商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛表述他們的目標。
這聽上去有些激進。但在通用模型的技術機會和輔助駕駛尚未收斂的節(jié)點上,或許也不是一種過早的設想。
一、進入深水區(qū):輔助駕駛的機會與挑戰(zhàn)
2024年下半年,輔助駕駛系統(tǒng)正快速下沉到更多車型與價格區(qū)間。數(shù)據(jù)顯示,中國市場搭載L2級輔助駕駛的車型數(shù)量持續(xù)走高,甚至出現(xiàn)在十萬元級別的家用轎車上。技術在普及的同時,系統(tǒng)能力、安全爭議、監(jiān)管標準等問題也被一并放大。
王曉剛對這個階段的判斷是“市場爆發(fā)”,他認為,用戶對于智駕系統(tǒng)的感知和理解還遠未成熟,這一輪普及更像是一個教育過程。“很多人其實不知道怎么去用智駕。”在他看來,這種信息差帶來的風險并非個案,“如果在這個階段不進行正確引導和認知,出現(xiàn)大量事故,整個行業(yè)會受到很大的打擊。”
輔助駕駛不是新事物,但從過去強調“能不能跑起來”,到如今關注“跑得穩(wěn)不穩(wěn)”,行業(yè)的核心衡量標準發(fā)生了變化。王曉剛認為,評判一個智駕方案的水平,主要看兩點:安全性和場景覆蓋度。尤其在城市復雜交通環(huán)境下,連續(xù)性的決策能力成了分水嶺。
從技術路徑來看,行業(yè)過去幾年熱衷端到端模型訓練,但如今正在逐步暴露出訓練數(shù)據(jù)依賴重、泛化能力弱的瓶頸。“哪怕是百萬級數(shù)據(jù),也很難遇到真正的極端情況。”王曉剛提到,“端到端模型很大程度是在模仿人類駕駛,但它對沒有見過的場景,處理就會很不確定。”這也意味著,在能力上,端到端方案往往難以超越人類司機的決策極限。
與此同時,監(jiān)管態(tài)度也發(fā)生了變化。近期,工信部提出對智能駕駛系統(tǒng)實施更加審慎的監(jiān)管策略。這在技術圈被看作是對行業(yè)節(jié)奏的一次“勒馬”。但王曉剛并不認為這是壞事,“我們正好可以用這個窗口期,加強測試和系統(tǒng)的安全策略建設。”
對供應商而言,這輪行業(yè)進入深水區(qū)不僅是交付壓力,也是技術價值的檢驗期。沒有什么比“車端上的表現(xiàn)”更具說服力。接下來的問題是:如何做得更好?以及,是否還有機會做得不同?
二、世界模型的作用不只是“仿真”
2025年,商湯絕影將生成式AI引入輔助駕駛系統(tǒng),推出端到端技術方案R-UniAD,目標是突破目前技術路線的瓶頸,重建一套能夠動態(tài)學習、自我進化的智能駕駛系統(tǒng)。
核心思路在于“世界模型+強化學習”的組合。傳統(tǒng)的端到端系統(tǒng)依賴真實路況數(shù)據(jù)進行訓練,但極端場景的數(shù)據(jù)本身極為稀缺,哪怕是百萬輛車的運行日志,其中真正能用于訓練高風險應對的片段不到1%。世界模型的引入,試圖重構這個限制。
在商湯定義中,“世界模型”不僅是仿真環(huán)境,更是一個具備動態(tài)重構、可控生成能力的數(shù)據(jù)生產(chǎn)系統(tǒng)。通過“絕影開悟2.0”世界模型,工程師可以將路測視頻解耦、建模、重建,構建出帶有空間結構與物理邏輯的4D場景。接著,再以強化學習算法訓練AI駕駛模型在這些場景中反復試錯,逐步形成“高反饋-高優(yōu)化”的閉環(huán)。
R- UniAD架構也做了層級分段。首先通過模仿學習完成冷啟動訓練,其次是世界模型中的仿真環(huán)境訓練強化學習模型,最后將云端大模型蒸餾為可部署在車端的小模型。這意味著算法在安全邊界內(nèi)可以充分訓練、打磨,然后被移植到資源受限的硬件上,完成最終落地。
在上海車展上,絕影團隊展示了“施工占道剎停”這樣一個典型難場景的演練流程。在傳統(tǒng)的端到端方案中,這類復雜場景由于缺乏真實數(shù)據(jù),很難被有效覆蓋。“這些特殊場景往往是數(shù)據(jù)訓練的難點,我們通過真實采集也很難遇到,更別說反復驗證了。”王曉剛表示。R-UniAD不僅能完成幾何場景重建,還能模擬車輛軌跡,并通過評分機制反復優(yōu)化駕駛策略。“我們能讓模型在這個場景里跑幾千遍,通過反饋系統(tǒng)找出最優(yōu)的應對策略。”王曉剛說。
相比傳統(tǒng)方案的工程耗時,R-UniAD的優(yōu)勢是效率和場景控制力。“我們可以在幾小時內(nèi)完成一個場景的訓練流程,而且這些訓練可以是結構化的、有方向的。”
在行業(yè)對“確定性安全”的呼聲越來越高的當下,這種方式的出現(xiàn),意味著安全不再只是依賴經(jīng)驗和測試樣本的累積,而可以主動生成與泛化。
三、AIOS不是助手,而是操作系統(tǒng)
與生成式智駕并行推進的,是商湯絕影在車載AI操作系統(tǒng)上的探索。
在商湯看來,過去的智能座艙仍是“指令-響應”的交互范式,本質是把語音助手嵌入車機UI,沒有系統(tǒng)性重構。而所謂AIOS,應該是一套以AI為內(nèi)核,從感知到記憶、從決策到交互都能自我進化的智能體系統(tǒng)。
2024年11月,商湯發(fā)布車載AIOS內(nèi)核“絕影千機”,結合MOE多模態(tài)模型、類人記憶架構與原生智能體框架,構建了AI操作系統(tǒng)的底層邏輯。它不僅重寫了操作系統(tǒng)的數(shù)據(jù)流路徑,也提出了開發(fā)層級的統(tǒng)一接口標準,支持智能體開發(fā)者進行快速適配。
“我們把車當成一個智能體系統(tǒng)來看待,它有自己的感知、記憶、規(guī)劃和動作。”王曉剛說。類人記憶模塊將用戶的偏好、交互、環(huán)境等信息在“瞬時-情境-長期”中進行分類沉淀,為智能體的行為提供上下文。這種系統(tǒng)也強調隱私性,私密數(shù)據(jù)在端側封閉運行。
在交互界面上,New Member則是“絕影千機”最直觀的產(chǎn)品體現(xiàn)。在多個演示場景中,它不再是被動問答的助手,而能夠識別場景中的用戶狀態(tài)、語義暗示、甚至情緒波動。例如,在車主討論雨崩徒步路線時,它能自動插話提醒羽絨服;在情侶爭執(zhí)出行方式時,它嘗試緩解情緒、提供選擇。
此外,New Member首次實現(xiàn)免喚醒的多人多輪交互,在座艙多人環(huán)境中自動感知對話并參與。“我們不是在做一個更智能的語音助手,而是在搭建一個面向未來的AI中臺。”商湯絕影團隊成員表示。
對車企來說,“重寫操作系統(tǒng)”意味著系統(tǒng)主導權、數(shù)據(jù)閉環(huán)能力與生態(tài)控制力的變化。在合作層面,商湯正在將“絕影千機”與車企現(xiàn)有的OS進行適配整合,試圖打造統(tǒng)一的AIOS生態(tài)。
四、向量產(chǎn)駛去:數(shù)據(jù)閉環(huán)之外的落地問題
技術之外,量產(chǎn)是更嚴峻的考題。
截至2025年第一季度,商湯絕影的輔助駕駛方案已合作超30家車企,覆蓋130余款車型,累計交付超360萬輛。年初與廣汽合作的基于地平線征程?6M平臺的輔助駕駛系統(tǒng)正式上市;與奇瑞合作的地平線征程?6E平臺方案、與東風合作基于英偉達Thor平臺的一段式端到端方案也計劃在今年完成交付。
與絕影的高端Thor平臺方案并行推進的,還有中低端市場的J6E/J6M平臺。這些多層次的產(chǎn)品線背后,是對車企多樣化成本結構和需求的回應。
但交付規(guī)模并不意味著風險結束。目前行業(yè)內(nèi)尚未形成統(tǒng)一的安全評估標準,大模型在車端的更新機制和責任歸屬依然模糊。
此外,智能駕駛系統(tǒng)的成本壓縮空間已相當有限。王曉剛在采訪中坦言,“車的價格戰(zhàn)已經(jīng)是極限狀態(tài),價格繼續(xù)壓縮并不利于行業(yè)發(fā)展。最終我們還是要做到可盈利,才是可持續(xù)的。”
在被問到中國產(chǎn)智駕能否追上特斯拉時,他給出的回答是,“特斯拉靠的是700萬輛車的數(shù)據(jù)閉環(huán)。我們需要靠生成式AI和世界模型去縮短這個差距。”他進一步解釋說:“你很難在真實世界中采集足夠多的極端場景,不僅成本高,而且存在風險。世界模型讓我們可以用仿真來還原這些場景,強化學習則是通過數(shù)千次的試錯,讓系統(tǒng)學會如何應對,而不是單純模仿人類駕駛。”
智能駕駛的未來充滿不確定性,但對于商湯絕影而言,重構能力邊界與工程交付能力,兩者缺一不可。眼下,他們正試圖在這場比拼中同時發(fā)力。
走的人多了 也便成了路
絕影的系統(tǒng),已經(jīng)出現(xiàn)在了幾百萬輛車上。但這并不意味著挑戰(zhàn)結束,可能恰恰是剛剛開始。
技術上,它還在和傳統(tǒng)端到端方法拉開差異,需要靠世界模型和強化學習真正跑通訓練閉環(huán);工程上,它要面對不同平臺、不同成本預期下的交付要求;系統(tǒng)上,它還要證明自己不是一個“語音助手Plus”,而是一套可以運行的智能體系。
在中國智駕產(chǎn)業(yè)進入深水區(qū)的當口,每家公司都在尋找自己的穩(wěn)定支點。有的選擇沿用既有方案,在成本和效率中博弈;也有的像商湯絕影這樣,從底層邏輯重做,希望把大模型帶來的能力變成新的系統(tǒng)能力。
沒人能確認下一階段會是誰主導,但至少現(xiàn)在,這條路徑是清晰的:
如果智能駕駛真要走到“超越人類”的階段,它首先要自己知道在看什么、怎么想、該不該動。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.