網易首頁 > 網易號 > 正文申請入駐

對話商湯絕影王曉剛：關于DeepSeek、端到端瓶頸、以及FSD

2025-02-26 20:41:29　來源: RoboX

北京舉報

分享至

去年，Scaling law和端到端自動駕駛，都遇到了瓶頸。

隨著互聯網的數據價值被榨干，自動駕駛模型千萬級clips的「數據黑洞」難以被填補。

此時，DeepSeek出現了。它采用的強化學習，帶來了長思維鏈的涌現，大幅降低數據需求。隨之，商湯絕影也推出了R-UniAD，同樣應用了強化學習，以此突破數據瓶頸，并有望優于人類駕駛水平。

昨日（2月25日）,商湯絕影CEO、商湯科技聯合創始人、首席科學家——王曉剛，對RoboX進一步解釋了R-UniAD誕生的背景和思路，以及該公司下一步的規劃。

什么是R-UniAD？

“從中國的實際情況來看，我們很難像特斯拉那樣，擁有700萬臺量產車的數據回流，而且高質量數據占比極少...目前端到端只是模仿學習，難以突破人類上限。”

王曉剛介紹稱，DeepSeek通過強化學習的框架，可以生成多條的思維鏈，讓模型產生更多的解法，突破了人類知識庫的限制，也產生了更多的數據，以此大幅降低數據門檻。

在這一啟發下，商湯絕影在UniAD的基礎上，推出了強化學習的新范式——Reinforced-UniAD（R- UniAD）。

其具體訓練方法如下：

1、基于冷啟動數據，讓端到端自動駕駛大模型達到基礎水平，通過模仿學習進行云端訓練；

2、再基于強化學習，讓該模型與世界模型協同交互，持續提升其性能；

3、從云端大模型通過高效蒸餾的方式，實現端到端小模型的車端部署。

王曉剛表示，在初始階段，通過千臺規模量產車形成的數據，即可讓端到端模型達到較好的水準，之后就不再需要這些「冷啟動數據」了。

“端到端的模型可以預測很多種軌跡，世界模型也可以模擬仿真出各種周邊環境的這樣的變化。同時，仿真器可通過Reward的方式，為這些軌跡和環境變化打分，找到最佳的駕駛行為。”

DeepSeek帶來的「利好」

在王曉剛看來，DeepSeek的長思維鏈、慢推理方式，能夠產生更高層次的認知，達到情感上的支持。這對于絕影的「New Member」產品來說，是很大的利好。

王曉剛認為，商湯絕影去年推出的「A New Member For U」產品，同樣是端云協同的方案。從前，此類方案落地時，對端側芯片有一定要求。而DeepSeek的MoE（混合專家模型）的架構，使其能部署在低成本芯片上，該方式也有利于「A New Member For U」的推廣。

“以蒸餾手段，可以通過強大的云端模型，產生高性能的端側模型，這是給端側模型的一個機會。同時，MoE只需要激活部分參數，使用部分算力，肯定要比傳統模型更加節省算力。”

不過他也表示，目前各車企接入的DeepSeek應用，還是比較簡單的。而且，DeepSeek能支撐的訪問量是有限的，延時也較長，現在還不能算是好的體驗。

“如果只是進行DeepSeek原始模型的接入，這在汽車產品上的體驗還是有差距的。這對于商湯絕影來說，也是一個利好。”

王曉剛用「做幾何題」來描述自動駕駛仿真：在解題過程中，每解一步都需要加一些輔助線，幾何圖像本身也在演變，這就類似于自動駕駛的世界模型仿真——不但要預測物體軌跡，還要讓環境里的視頻圖像得到演進，能夠預見出來，這是DeepSeek所欠缺的。

“DeepSeek一直致力于語言模型，對于圖像、視頻的精準生成還是比較欠缺的，但這正是我們的強項。”

視頻生成的嚴格標準

“「開悟」世界模型的視頻生成，其實和Sora等標準還是有區別的。我們需要更加精準的可控性，要符合物理規律，還有交通法則。我們生成的視頻輸入，實際上是物體的運動軌跡和3D的框，由這些輸入精準地控制視頻的生成。”

為了準確模擬各種極端場景，「開悟」必須做到結合11個攝像頭輸入的時空一致性。同時，絕影本身也儲備了大量真值數據測試集，可以通過視頻反向提取其中的物體位置，進行軌跡驗證，保障視頻的真實和有效性。

“其實從去年開始，就已經有20%的生成視頻，應用在了模型訓練中。希望將來這一數字能超過50%，乃至80%。”

通俗一點來比喻的話，「強化學習」就是針對一個復雜場景，通過模擬仿真反復測試，并給出多條不同的駕駛行為和路徑。

接下來，就像DeepSeek一樣，可以針對一個問題找到10條乃至100條的思維鏈，去解決問題。

“我們之前所說的高質量數據，指的是人類的高質量駕駛行為。而如今高質量數據的生成，不一定再需要人類的駕駛行為，而是將圖片或者視頻片段作為一個場景起點，接下來由世界模型通過強化學習去生成即可。”王曉剛說道。

R-UniAD的3大挑戰

為實現云端大模型和世界模型的在線交互，絕影克服了3個關鍵難題：

1、模擬仿真能力：必須精準、可控。

2、預測能力：對于周圍環境視頻的生成，除了準確，還要有多樣性。“如果生成的東西都是單一的，就沒法模擬出不同的場景和駕駛行為。”

3、Reward：也就是評價出哪些視頻和軌跡的序列，它是一個好的駕駛行為，那么有的產生了碰撞，那么有的給人家不舒適的這樣的一些這樣的一些感覺。

R- UniAD的重要一環，在于世界模型的環境生成，以及對其的精準控制，達成這一能力，才能體現強化學習的效果。

王曉剛指出，未來的發展，一定是基礎設施和云端研發占的比重越來越高，而端側則變得更加簡單：各種數據蒸餾、工程優化，能夠使得越來越多的功能被部署在更加便宜的低算力芯片上，但這一前提都依賴于強悍的云端模型。

被高估的激光雷達魯棒性

近期，「純視覺」風頭漸弱，多家車企都表示，會在高階智駕上繼續使用激光雷達。

但王曉剛認為，激光雷達有著自己的天花板，其本身具有的信息量是偏少的，達不到非常魯棒的狀態。只不過，當下由于沒有海量數據支撐，智駕的視覺能力偏弱，因此還需要用激光雷達作為輔助。

從成本層面考慮，「全民智駕」的趨勢下，智駕需要下探到10萬元級別以下，硬件成本也需要進一步降低。

“視覺能力的上限更高。在硬件固定的前提下，通過大數據去更新的模型，會不斷提升軟件的性能。”他說道。

先布局中低算力平臺

從去年開始，商湯已開始在智駕市場中布局：“從市場份額上考慮，要先下探到價格較低的中低算力車型，所以我們去年主要布局了地平線J6E、J6M等平臺的方案，也與廣汽、奇瑞還有東風形成了戰略合作。”

王曉剛透露稱，到今年3月，商湯絕影和車企合作開發的基于J6M的自動駕駛產品，就能實現量產，4月還會在上海車展發布。

除了智駕產品本身，絕影還在大模型、數據基礎設施等方面，協同車企進行規劃和布局，包括建設數據的生產管線，共建研發體系等等。

需要注意的是，即便有了強化學習的世界模型，要想覆蓋更多的復雜場景，真值數據還是非常重要的，而這些數據還是在車企，這也是絕影與車企形成深度合作的意義之一。

特斯拉FSD的挑戰

訪問當天，正值特斯拉FSD突然在華推送，王曉剛對此也發表了自己的看法。

他認為，特斯拉FSD在中國的應用，還是會受到數據的限制。首先，中國的交通場景與美國存在很大差異；其次，特斯拉在在中國采集的數據也會受到管控，無法跨境。

“如果是做端到端的話，FSD會面臨這些自動駕駛場景數據方面的問題。它也不太可能用它在美國所擁有的數據在本地訓練，因為數據不能夠跨境，也沒有強大的基礎設施。所以絕影R-UniAD的新型技術路線，即便對于特斯拉的FSD，也有著現實意義。”

同時他表示，特斯拉FSD目前還是模仿學習的范式，而R-UniAD技術路線訓練出來的端到端智駕模型，很有希望超越人類駕駛表現，實現彎道超車。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

DeepSeek對“王一博案”道歉？假新聞！

虎嗅APP 2025-07-04 08:50:06
19 跟貼 19
馬斯克欲重寫人類知識庫，Grok 4雙版本提前曝光

量子位 2025-07-03 21:02:03
0 跟貼 0

DeepSeek降本秘訣曝光：2招極致壓榨推理部署，算力全留給內部AGI研究

36氪 2025-07-05 10:35:07
0 跟貼 0

“DeepSeek向王一博道歉”揭示AI污染產業鏈：“內容農場”大批量生產信息垃圾，1.38萬元就能買通大模型推薦

每日經濟新聞 2025-07-04 21:26:47
53 跟貼 53
商湯絕影CEO王曉剛：自動駕駛未來的研發

每日經濟新聞 2025-05-07 21:21:34
0 跟貼 0

自動駕駛是這樣用的嗎，還用塑料瓶騙過車機，出問題又得找車廠賠

美妙一籮筐 2025-07-03 14:39:57
0 跟貼 0

街訪：侵占我國領土最多的國家是哪個？大多數說美國，這是為何？

偵姐有料 2025-07-04 16:15:39
15120 跟貼 15120
DeepSeek流量暴跌？AI大模型全球霸主離奇遇冷，外媒曝出真相

新智元 2025-07-04 18:58:26
294 跟貼 294

為什么特斯拉全球銷量下滑，國內銷量卻創下新高？解讀一下

極客小冷 2025-07-04 15:40:14
1 跟貼 1
烏方官員：幾乎所有美武器供應均已停止

央視新聞客戶端 2025-07-04 14:27:00
31205 跟貼 31205
文遠知行：W5無人物流車獲批在廣州黃埔全域開展道路測試

界面新聞 2025-07-02 20:19:13
0 跟貼 0
技術怪獸僅19.58萬起售，小鵬G7實現本地端大模型上車！

炎龍說數碼 2025-07-04 22:50:58
0 跟貼 0
外國車評人來到武漢，感受無人駕駛，懸浮空軌，完全顛覆認知！

娜塔莎一家 2025-07-04 12:10:49
22 跟貼 22
新加坡將迎自動駕駛，榜鵝年底上路

新加坡眼 2025-07-04 22:03:44
0 跟貼 0
AI輔助編碼帶來思維方式轉變：從人寫代碼到人審代碼

量子位 2025-04-18 17:04:43
0 跟貼 0
太打臉啦，L3這就來啦？l3級自動駕駛

品茶悟浮沉 2025-07-04 13:35:24
0 跟貼 0
標配激光雷達、車機再升級，理想L6或成煥新后最具性價比車型？

車叫獸 2025-07-03 16:28:17
0 跟貼 0
游客河邊游玩被攔工作人員持鐮刀連續扎破多艘皮劃艇

征垣之路 2025-07-04 22:00:01
13503 跟貼 13503
我們用難哭考生的2025北京中考測了7款大模型的真實水平

快科技 2025-07-05 10:44:21
0 跟貼 0
大模型正在打破教育領域的“不可能三角〞

量子位 2025-04-17 19:02:09
0 跟貼 0
物流業deepseek時刻，中國無人車火爆全球

華商韜略 2025-06-17 10:58:23
0 跟貼 0
特斯拉最好的廣告，撞成這樣也沒自燃，不愧是新能源的領路人

韻熙說生活 2025-07-05 09:11:09
1 跟貼 1
一鍵規劃行程！珠海發布文旅大模型推122項暑期文旅活動

南方都市報 2025-07-04 23:12:07
2 跟貼 2
DeepSeek就AI模型關聯王一博李愛慶道歉

板扎在線NEWS 2025-07-04 10:45:17
0 跟貼 0
特斯拉高速起火，連車主安全都無法保障，馬斯克看了連夜想對策！

演說者搞笑 2025-07-05 09:22:44
1 跟貼 1
全球首個兒童罕見病AI大模型“哪吒·靈童”問世

極目新聞 2025-07-05 14:28:22
0 跟貼 0
王一博相關謠言被DeepSeek永久撤回

陶衣柜 2025-07-04 08:00:09
0 跟貼 0
晨意幫忙丨1樓業主在客廳開鑿地洞通往自家地下室，鄰居擔心安全！回應：正在做檢測

瀟湘晨報 2025-07-04 19:14:48
7030 跟貼 7030
@賽力斯汽車法務部因違反相關法律法規，被禁言

魯中晨報 2025-07-04 22:51:09
984 跟貼 984
一句話讓DeepSeek控制你的電腦！微軟開源神器OmniParser V2

量子位 2025-02-18 20:48:36
0 跟貼 0
誰是開源界的杠把子？

虎嗅APP 2025-04-11 23:29:08
3 跟貼 3
合金模型玩具

制造科技 2025-07-03 14:46:16
0 跟貼 0
價比拉滿，價格卷低，小鵬G7要拿下油車用戶

每人Auto 2025-07-05 10:38:24
1 跟貼 1
副部級程福波，5年內第五次調整

魯中晨報 2025-07-05 11:43:13
69 跟貼 69
小象路過小攤順走一水果，網友：像極了小時候嘴饞的我

新華社 2025-07-04 15:09:07
6337 跟貼 6337
騰訊混元圖像2.0一手實測，毫秒級響應

量子位 2025-05-18 12:49:08
2 跟貼 2
廣州一高鐵站女子邊走邊拋撒大量現金，目擊人稱撒了好幾次，工作人員最新回應

大象新聞 2025-07-05 12:28:21
37 跟貼 37
羅馬仕內部人士：員工心都散了

南方都市報 2025-07-04 22:44:10
1421 跟貼 1421
全國用電負荷超14億千瓦創歷史新高

財聯社 2025-07-04 18:53:09
3891 跟貼 3891
AI的母語是什么？人類進化花了200萬年，AI只需一個晚上

量子位 2025-05-23 19:24:56
0 跟貼 0

RoboX

關注智能汽車、機器人在內的具身智能前沿科技

151文章數 1關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

家居

房產

健康

教育

李若彤、鄭秀文低能量時期的“處方”！停滯時不妨試試它

家居要聞

手機 / 數碼

房產 / 家居

對話商湯絕影王曉剛：關于DeepSeek、端到端瓶頸、以及FSD

馬斯克吹上天的Cybertruck 為何"徹底失敗"

問界車主開智駕致碰擦要求逾百萬賠償 售后：訴求過高

問界車主開智駕致碰擦要求逾百萬賠償 售后：訴求過高

史上最真實的F1電影，是怎么拍出來的？

汪小菲反擊！曝向具俊曄提出財產追回

特朗普簽署 美國萬億減稅支出法來了

31.6萬元起售 蔚來新ET5/ET5T/EC6冠軍紀念版上市

態度原創

李若彤、鄭秀文低能量時期的“處方”！停滯時不妨試試它

合理布局 三口之家的溫馨空間

重磅發布！海南樓市2025上半年Top10榜單出爐！

呼吸科專家破解呼吸道九大謠言！

華羅庚競賽題，三階幻方，難倒上萬考生

問界車主開智駕致碰擦要求逾百萬賠償售后：訴求過高

問界車主開智駕致碰擦要求逾百萬賠償售后：訴求過高

特朗普簽署美國萬億減稅支出法來了

31.6萬元起售蔚來新ET5/ET5T/EC6冠軍紀念版上市

合理布局三口之家的溫馨空間