商湯絕影，如何打造智能輔助駕駛的“通用大腦”？

2025-04-30 20:16:20　來源: 嚴選好車163

北京舉報

分享至

嚴選好車163的第1161次推送

2025年的中國智駕技術市場，速度在變快，方向卻不算清晰。

一邊是量產(chǎn)車型不斷增加，高階輔助駕駛開始普及到十萬元以內(nèi)的入門車型；另一邊，關于安全、責任和監(jiān)管的討論也從未停下。技術公司和車企在交付、用戶教育和系統(tǒng)穩(wěn)定性之間反復拉扯，一些舊有路徑正在失效，一些新方法開始被試探。

就在這樣的背景下，商湯絕影選擇把生成式AI引入車上。它嘗試用世界模型和強化學習來重新訓練一輛車的駕駛策略，也開始在座艙層重寫操作系統(tǒng)邏輯，從AI內(nèi)核到交互框架都自己構建。

“我們希望打造智能輔助駕駛的通用大腦。”商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛表述他們的目標。

這聽上去有些激進。但在通用模型的技術機會和輔助駕駛尚未收斂的節(jié)點上，或許也不是一種過早的設想。

一、進入深水區(qū)：輔助駕駛的機會與挑戰(zhàn)

2024年下半年，輔助駕駛系統(tǒng)正快速下沉到更多車型與價格區(qū)間。數(shù)據(jù)顯示，中國市場搭載L2級輔助駕駛的車型數(shù)量持續(xù)走高，甚至出現(xiàn)在十萬元級別的家用轎車上。技術在普及的同時，系統(tǒng)能力、安全爭議、監(jiān)管標準等問題也被一并放大。

王曉剛對這個階段的判斷是“市場爆發(fā)”，他認為，用戶對于智駕系統(tǒng)的感知和理解還遠未成熟，這一輪普及更像是一個教育過程。“很多人其實不知道怎么去用智駕。”在他看來，這種信息差帶來的風險并非個案，“如果在這個階段不進行正確引導和認知，出現(xiàn)大量事故，整個行業(yè)會受到很大的打擊。”

輔助駕駛不是新事物，但從過去強調“能不能跑起來”，到如今關注“跑得穩(wěn)不穩(wěn)”，行業(yè)的核心衡量標準發(fā)生了變化。王曉剛認為，評判一個智駕方案的水平，主要看兩點：安全性和場景覆蓋度。尤其在城市復雜交通環(huán)境下，連續(xù)性的決策能力成了分水嶺。

從技術路徑來看，行業(yè)過去幾年熱衷端到端模型訓練，但如今正在逐步暴露出訓練數(shù)據(jù)依賴重、泛化能力弱的瓶頸。“哪怕是百萬級數(shù)據(jù)，也很難遇到真正的極端情況。”王曉剛提到，“端到端模型很大程度是在模仿人類駕駛，但它對沒有見過的場景，處理就會很不確定。”這也意味著，在能力上，端到端方案往往難以超越人類司機的決策極限。

與此同時，監(jiān)管態(tài)度也發(fā)生了變化。近期，工信部提出對智能駕駛系統(tǒng)實施更加審慎的監(jiān)管策略。這在技術圈被看作是對行業(yè)節(jié)奏的一次“勒馬”。但王曉剛并不認為這是壞事，“我們正好可以用這個窗口期，加強測試和系統(tǒng)的安全策略建設。”

對供應商而言，這輪行業(yè)進入深水區(qū)不僅是交付壓力，也是技術價值的檢驗期。沒有什么比“車端上的表現(xiàn)”更具說服力。接下來的問題是：如何做得更好？以及，是否還有機會做得不同？

二、世界模型的作用不只是“仿真”

2025年，商湯絕影將生成式AI引入輔助駕駛系統(tǒng)，推出端到端技術方案R-UniAD，目標是突破目前技術路線的瓶頸，重建一套能夠動態(tài)學習、自我進化的智能駕駛系統(tǒng)。

核心思路在于“世界模型+強化學習”的組合。傳統(tǒng)的端到端系統(tǒng)依賴真實路況數(shù)據(jù)進行訓練，但極端場景的數(shù)據(jù)本身極為稀缺，哪怕是百萬輛車的運行日志，其中真正能用于訓練高風險應對的片段不到1%。世界模型的引入，試圖重構這個限制。

在商湯定義中，“世界模型”不僅是仿真環(huán)境，更是一個具備動態(tài)重構、可控生成能力的數(shù)據(jù)生產(chǎn)系統(tǒng)。通過“絕影開悟2.0”世界模型，工程師可以將路測視頻解耦、建模、重建，構建出帶有空間結構與物理邏輯的4D場景。接著，再以強化學習算法訓練AI駕駛模型在這些場景中反復試錯，逐步形成“高反饋-高優(yōu)化”的閉環(huán)。

R- UniAD架構也做了層級分段。首先通過模仿學習完成冷啟動訓練，其次是世界模型中的仿真環(huán)境訓練強化學習模型，最后將云端大模型蒸餾為可部署在車端的小模型。這意味著算法在安全邊界內(nèi)可以充分訓練、打磨，然后被移植到資源受限的硬件上，完成最終落地。

在上海車展上，絕影團隊展示了“施工占道剎停”這樣一個典型難場景的演練流程。在傳統(tǒng)的端到端方案中，這類復雜場景由于缺乏真實數(shù)據(jù)，很難被有效覆蓋。“這些特殊場景往往是數(shù)據(jù)訓練的難點，我們通過真實采集也很難遇到，更別說反復驗證了。”王曉剛表示。R-UniAD不僅能完成幾何場景重建，還能模擬車輛軌跡，并通過評分機制反復優(yōu)化駕駛策略。“我們能讓模型在這個場景里跑幾千遍，通過反饋系統(tǒng)找出最優(yōu)的應對策略。”王曉剛說。

相比傳統(tǒng)方案的工程耗時，R-UniAD的優(yōu)勢是效率和場景控制力。“我們可以在幾小時內(nèi)完成一個場景的訓練流程，而且這些訓練可以是結構化的、有方向的。”

在行業(yè)對“確定性安全”的呼聲越來越高的當下，這種方式的出現(xiàn)，意味著安全不再只是依賴經(jīng)驗和測試樣本的累積，而可以主動生成與泛化。

三、AIOS不是助手，而是操作系統(tǒng)

與生成式智駕并行推進的，是商湯絕影在車載AI操作系統(tǒng)上的探索。

在商湯看來，過去的智能座艙仍是“指令-響應”的交互范式，本質是把語音助手嵌入車機UI，沒有系統(tǒng)性重構。而所謂AIOS，應該是一套以AI為內(nèi)核，從感知到記憶、從決策到交互都能自我進化的智能體系統(tǒng)。

2024年11月，商湯發(fā)布車載AIOS內(nèi)核“絕影千機”，結合MOE多模態(tài)模型、類人記憶架構與原生智能體框架，構建了AI操作系統(tǒng)的底層邏輯。它不僅重寫了操作系統(tǒng)的數(shù)據(jù)流路徑，也提出了開發(fā)層級的統(tǒng)一接口標準，支持智能體開發(fā)者進行快速適配。

“我們把車當成一個智能體系統(tǒng)來看待，它有自己的感知、記憶、規(guī)劃和動作。”王曉剛說。類人記憶模塊將用戶的偏好、交互、環(huán)境等信息在“瞬時-情境-長期”中進行分類沉淀，為智能體的行為提供上下文。這種系統(tǒng)也強調隱私性，私密數(shù)據(jù)在端側封閉運行。

在交互界面上，New Member則是“絕影千機”最直觀的產(chǎn)品體現(xiàn)。在多個演示場景中，它不再是被動問答的助手，而能夠識別場景中的用戶狀態(tài)、語義暗示、甚至情緒波動。例如，在車主討論雨崩徒步路線時，它能自動插話提醒羽絨服；在情侶爭執(zhí)出行方式時，它嘗試緩解情緒、提供選擇。

此外，New Member首次實現(xiàn)免喚醒的多人多輪交互，在座艙多人環(huán)境中自動感知對話并參與。“我們不是在做一個更智能的語音助手，而是在搭建一個面向未來的AI中臺。”商湯絕影團隊成員表示。

對車企來說，“重寫操作系統(tǒng)”意味著系統(tǒng)主導權、數(shù)據(jù)閉環(huán)能力與生態(tài)控制力的變化。在合作層面，商湯正在將“絕影千機”與車企現(xiàn)有的OS進行適配整合，試圖打造統(tǒng)一的AIOS生態(tài)。

四、向量產(chǎn)駛去：數(shù)據(jù)閉環(huán)之外的落地問題

技術之外，量產(chǎn)是更嚴峻的考題。

截至2025年第一季度，商湯絕影的輔助駕駛方案已合作超30家車企，覆蓋130余款車型，累計交付超360萬輛。年初與廣汽合作的基于地平線征程?6M平臺的輔助駕駛系統(tǒng)正式上市；與奇瑞合作的地平線征程?6E平臺方案、與東風合作基于英偉達Thor平臺的一段式端到端方案也計劃在今年完成交付。

與絕影的高端Thor平臺方案并行推進的，還有中低端市場的J6E/J6M平臺。這些多層次的產(chǎn)品線背后，是對車企多樣化成本結構和需求的回應。

但交付規(guī)模并不意味著風險結束。目前行業(yè)內(nèi)尚未形成統(tǒng)一的安全評估標準，大模型在車端的更新機制和責任歸屬依然模糊。

此外，智能駕駛系統(tǒng)的成本壓縮空間已相當有限。王曉剛在采訪中坦言，“車的價格戰(zhàn)已經(jīng)是極限狀態(tài)，價格繼續(xù)壓縮并不利于行業(yè)發(fā)展。最終我們還是要做到可盈利，才是可持續(xù)的。”

在被問到中國產(chǎn)智駕能否追上特斯拉時，他給出的回答是，“特斯拉靠的是700萬輛車的數(shù)據(jù)閉環(huán)。我們需要靠生成式AI和世界模型去縮短這個差距。”他進一步解釋說：“你很難在真實世界中采集足夠多的極端場景，不僅成本高，而且存在風險。世界模型讓我們可以用仿真來還原這些場景，強化學習則是通過數(shù)千次的試錯，讓系統(tǒng)學會如何應對，而不是單純模仿人類駕駛。”

智能駕駛的未來充滿不確定性，但對于商湯絕影而言，重構能力邊界與工程交付能力，兩者缺一不可。眼下，他們正試圖在這場比拼中同時發(fā)力。

走的人多了也便成了路

絕影的系統(tǒng)，已經(jīng)出現(xiàn)在了幾百萬輛車上。但這并不意味著挑戰(zhàn)結束，可能恰恰是剛剛開始。

技術上，它還在和傳統(tǒng)端到端方法拉開差異，需要靠世界模型和強化學習真正跑通訓練閉環(huán)；工程上，它要面對不同平臺、不同成本預期下的交付要求；系統(tǒng)上，它還要證明自己不是一個“語音助手Plus”，而是一套可以運行的智能體系。

在中國智駕產(chǎn)業(yè)進入深水區(qū)的當口，每家公司都在尋找自己的穩(wěn)定支點。有的選擇沿用既有方案，在成本和效率中博弈；也有的像商湯絕影這樣，從底層邏輯重做，希望把大模型帶來的能力變成新的系統(tǒng)能力。

沒人能確認下一階段會是誰主導，但至少現(xiàn)在，這條路徑是清晰的：

如果智能駕駛真要走到“超越人類”的階段，它首先要自己知道在看什么、怎么想、該不該動。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.