版權聲明:本文版權為網易汽車所有,轉載請注明出處。
網易汽車4月30日報道
2025年的中國智駕技術市場,速度在變快,方向卻不算清晰。
一邊是量產車型不斷增加,高階輔助駕駛開始普及到十萬元以內的入門車型;另一邊,關于安全、責任和監管的討論也從未停下。技術公司和車企在交付、用戶教育和系統穩定性之間反復拉扯,一些舊有路徑正在失效,一些新方法開始被試探。
就在這樣的背景下,商湯絕影選擇把生成式AI引入車上。它嘗試用世界模型和強化學習來重新訓練一輛車的駕駛策略,也開始在座艙層重寫操作系統邏輯,從AI內核到交互框架都自己構建。
“我們希望打造智能輔助駕駛的通用大腦。”商湯絕影CEO、商湯科技聯合創始人、首席科學家王曉剛表述他們的目標。
這聽上去有些激進。但在通用模型的技術機會和輔助駕駛尚未收斂的節點上,或許也不是一種過早的設想。
2024年下半年,輔助駕駛系統正快速下沉到更多車型與價格區間。數據顯示,中國市場搭載L2級輔助駕駛的車型數量持續走高,甚至出現在十萬元級別的家用轎車上。技術在普及的同時,系統能力、安全爭議、監管標準等問題也被一并放大。
王曉剛對這個階段的判斷是“市場爆發”,他認為,用戶對于智駕系統的感知和理解還遠未成熟,這一輪普及更像是一個教育過程。“很多人其實不知道怎么去用智駕。”在他看來,這種信息差帶來的風險并非個案,“如果在這個階段不進行正確引導和認知,出現大量事故,整個行業會受到很大的打擊。”
輔助駕駛不是新事物,但從過去強調“能不能跑起來”,到如今關注“跑得穩不穩”,行業的核心衡量標準發生了變化。王曉剛認為,評判一個智駕方案的水平,主要看兩點:安全性和場景覆蓋度。尤其在城市復雜交通環境下,連續性的決策能力成了分水嶺。
從技術路徑來看,行業過去幾年熱衷端到端模型訓練,但如今正在逐步暴露出訓練數據依賴重、泛化能力弱的瓶頸。“哪怕是百萬級數據,也很難遇到真正的極端情況。”王曉剛提到,“端到端模型很大程度是在模仿人類駕駛,但它對沒有見過的場景,處理就會很不確定。”這也意味著,在能力上,端到端方案往往難以超越人類司機的決策極限。
與此同時,監管態度也發生了變化。近期,工信部提出對智能駕駛系統實施更加審慎的監管策略。這在技術圈被看作是對行業節奏的一次“勒馬”。但王曉剛并不認為這是壞事,“我們正好可以用這個窗口期,加強測試和系統的安全策略建設。”
對供應商而言,這輪行業進入深水區不僅是交付壓力,也是技術價值的檢驗期。沒有什么比“車端上的表現”更具說服力。接下來的問題是:如何做得更好?以及,是否還有機會做得不同?
2025年,商湯絕影將生成式AI引入輔助駕駛系統,推出端到端技術方案R-UniAD,目標是突破目前技術路線的瓶頸,重建一套能夠動態學習、自我進化的智能駕駛系統。
核心思路在于“世界模型+強化學習”的組合。傳統的端到端系統依賴真實路況數據進行訓練,但極端場景的數據本身極為稀缺,哪怕是百萬輛車的運行日志,其中真正能用于訓練高風險應對的片段不到1%。世界模型的引入,試圖重構這個限制。
在商湯定義中,“世界模型”不僅是仿真環境,更是一個具備動態重構、可控生成能力的數據生產系統。通過“絕影開悟2.0”世界模型,工程師可以將路測視頻解耦、建模、重建,構建出帶有空間結構與物理邏輯的4D場景。接著,再以強化學習算法訓練AI駕駛模型在這些場景中反復試錯,逐步形成“高反饋-高優化”的閉環。
R- UniAD架構也做了層級分段。首先通過模仿學習完成冷啟動訓練,其次是世界模型中的仿真環境訓練強化學習模型,最后將云端大模型蒸餾為可部署在車端的小模型。這意味著算法在安全邊界內可以充分訓練、打磨,然后被移植到資源受限的硬件上,完成最終落地。
在上海車展上,絕影團隊展示了“施工占道剎停”這樣一個典型難場景的演練流程。在傳統的端到端方案中,這類復雜場景由于缺乏真實數據,很難被有效覆蓋。“這些特殊場景往往是數據訓練的難點,我們通過真實采集也很難遇到,更別說反復驗證了。”王曉剛表示。R-UniAD不僅能完成幾何場景重建,還能模擬車輛軌跡,并通過評分機制反復優化駕駛策略。“我們能讓模型在這個場景里跑幾千遍,通過反饋系統找出最優的應對策略。”王曉剛說。
相比傳統方案的工程耗時,R-UniAD的優勢是效率和場景控制力。“我們可以在幾小時內完成一個場景的訓練流程,而且這些訓練可以是結構化的、有方向的。”
在行業對“確定性安全”的呼聲越來越高的當下,這種方式的出現,意味著安全不再只是依賴經驗和測試樣本的累積,而可以主動生成與泛化。
與生成式智駕并行推進的,是商湯絕影在車載AI操作系統上的探索。
在商湯看來,過去的智能座艙仍是“指令-響應”的交互范式,本質是把語音助手嵌入車機UI,沒有系統性重構。而所謂AIOS,應該是一套以AI為內核,從感知到記憶、從決策到交互都能自我進化的智能體系統。
2024年11月,商湯發布車載AIOS內核“絕影千機”,結合MOE多模態模型、類人記憶架構與原生智能體框架,構建了AI操作系統的底層邏輯。它不僅重寫了操作系統的數據流路徑,也提出了開發層級的統一接口標準,支持智能體開發者進行快速適配。
“我們把車當成一個智能體系統來看待,它有自己的感知、記憶、規劃和動作。”王曉剛說。類人記憶模塊將用戶的偏好、交互、環境等信息在“瞬時-情境-長期”中進行分類沉淀,為智能體的行為提供上下文。這種系統也強調隱私性,私密數據在端側封閉運行。
在交互界面上,New Member則是“絕影千機”最直觀的產品體現。在多個演示場景中,它不再是被動問答的助手,而能夠識別場景中的用戶狀態、語義暗示、甚至情緒波動。例如,在車主討論雨崩徒步路線時,它能自動插話提醒羽絨服;在情侶爭執出行方式時,它嘗試緩解情緒、提供選擇。
此外,New Member首次實現免喚醒的多人多輪交互,在座艙多人環境中自動感知對話并參與。“我們不是在做一個更智能的語音助手,而是在搭建一個面向未來的AI中臺。”商湯絕影團隊成員表示。
對車企來說,“重寫操作系統”意味著系統主導權、數據閉環能力與生態控制力的變化。在合作層面,商湯正在將“絕影千機”與車企現有的OS進行適配整合,試圖打造統一的AIOS生態。
技術之外,量產是更嚴峻的考題。
截至2025年第一季度,商湯絕影的輔助駕駛方案已合作超30家車企,覆蓋130余款車型,累計交付超360萬輛。年初與廣汽合作的基于地平線征程?6M平臺的輔助駕駛系統正式上市;與奇瑞合作的地平線征程?6E平臺方案、與東風合作基于英偉達Thor平臺的一段式端到端方案也計劃在今年完成交付。
與絕影的高端Thor平臺方案并行推進的,還有中低端市場的J6E/J6M平臺。這些多層次的產品線背后,是對車企多樣化成本結構和需求的回應。
但交付規模并不意味著風險結束。目前行業內尚未形成統一的安全評估標準,大模型在車端的更新機制和責任歸屬依然模糊。
此外,智能駕駛系統的成本壓縮空間已相當有限。王曉剛在采訪中坦言,“車的價格戰已經是極限狀態,價格繼續壓縮并不利于行業發展。最終我們還是要做到可盈利,才是可持續的。”
在被問到中國產智駕能否追上特斯拉時,他給出的回答是,“特斯拉靠的是700萬輛車的數據閉環。我們需要靠生成式AI和世界模型去縮短這個差距。”他進一步解釋說:“你很難在真實世界中采集足夠多的極端場景,不僅成本高,而且存在風險。世界模型讓我們可以用仿真來還原這些場景,強化學習則是通過數千次的試錯,讓系統學會如何應對,而不是單純模仿人類駕駛。”
智能駕駛的未來充滿不確定性,但對于商湯絕影而言,重構能力邊界與工程交付能力,兩者缺一不可。眼下,他們正試圖在這場比拼中同時發力。
絕影的系統,已經出現在了幾百萬輛車上。但這并不意味著挑戰結束,可能恰恰是剛剛開始。
技術上,它還在和傳統端到端方法拉開差異,需要靠世界模型和強化學習真正跑通訓練閉環;工程上,它要面對不同平臺、不同成本預期下的交付要求;系統上,它還要證明自己不是一個“語音助手Plus”,而是一套可以運行的智能體系。
在中國智駕產業進入深水區的當口,每家公司都在尋找自己的穩定支點。有的選擇沿用既有方案,在成本和效率中博弈;也有的像商湯絕影這樣,從底層邏輯重做,希望把大模型帶來的能力變成新的系統能力。
沒人能確認下一階段會是誰主導,但至少現在,這條路徑是清晰的:
如果智能駕駛真要走到“超越人類”的階段,它首先要自己知道在看什么、怎么想、該不該動。