99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話商湯絕影王曉剛:關(guān)于DeepSeek、端到端瓶頸、以及FSD

0
分享至

去年,Scaling law和端到端自動駕駛,都遇到了瓶頸。

隨著互聯(lián)網(wǎng)的數(shù)據(jù)價值被榨干,自動駕駛模型千萬級clips的「數(shù)據(jù)黑洞」難以被填補。

此時,DeepSeek出現(xiàn)了。它采用的強化學(xué)習(xí),帶來了長思維鏈的涌現(xiàn),大幅降低數(shù)據(jù)需求。隨之,商湯絕影也推出了R-UniAD,同樣應(yīng)用了強化學(xué)習(xí),以此突破數(shù)據(jù)瓶頸,并有望優(yōu)于人類駕駛水平。

昨日(2月25日),商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家——王曉剛,對RoboX進一步解釋了R-UniAD誕生的背景和思路,以及該公司下一步的規(guī)劃。



什么是R-UniAD?

“從中國的實際情況來看,我們很難像特斯拉那樣,擁有700萬臺量產(chǎn)車的數(shù)據(jù)回流,而且高質(zhì)量數(shù)據(jù)占比極少...目前端到端只是模仿學(xué)習(xí),難以突破人類上限。”

王曉剛介紹稱,DeepSeek通過強化學(xué)習(xí)的框架,可以生成多條的思維鏈,讓模型產(chǎn)生更多的解法,突破了人類知識庫的限制,也產(chǎn)生了更多的數(shù)據(jù),以此大幅降低數(shù)據(jù)門檻。

在這一啟發(fā)下,商湯絕影在UniAD的基礎(chǔ)上,推出了強化學(xué)習(xí)的新范式——Reinforced-UniAD(R- UniAD)。

其具體訓(xùn)練方法如下:

1、基于冷啟動數(shù)據(jù),讓端到端自動駕駛大模型達到基礎(chǔ)水平,通過模仿學(xué)習(xí)進行云端訓(xùn)練;

2、再基于強化學(xué)習(xí),讓該模型與世界模型協(xié)同交互,持續(xù)提升其性能;

3、從云端大模型通過高效蒸餾的方式,實現(xiàn)端到端小模型的車端部署。



王曉剛表示,在初始階段,通過千臺規(guī)模量產(chǎn)車形成的數(shù)據(jù),即可讓端到端模型達到較好的水準(zhǔn),之后就不再需要這些「冷啟動數(shù)據(jù)」了。

“端到端的模型可以預(yù)測很多種軌跡,世界模型也可以模擬仿真出各種周邊環(huán)境的這樣的變化。同時,仿真器可通過Reward的方式,為這些軌跡和環(huán)境變化打分,找到最佳的駕駛行為。”

DeepSeek帶來的「利好」

在王曉剛看來,DeepSeek的長思維鏈、慢推理方式,能夠產(chǎn)生更高層次的認(rèn)知,達到情感上的支持。這對于絕影的「New Member」產(chǎn)品來說,是很大的利好。

王曉剛認(rèn)為,商湯絕影去年推出的「A New Member For U」產(chǎn)品,同樣是端云協(xié)同的方案。從前,此類方案落地時,對端側(cè)芯片有一定要求。而DeepSeek的MoE(混合專家模型)的架構(gòu),使其能部署在低成本芯片上,該方式也有利于「A New Member For U」的推廣。

“以蒸餾手段,可以通過強大的云端模型,產(chǎn)生高性能的端側(cè)模型,這是給端側(cè)模型的一個機會。同時,MoE只需要激活部分參數(shù),使用部分算力,肯定要比傳統(tǒng)模型更加節(jié)省算力。”

不過他也表示,目前各車企接入的DeepSeek應(yīng)用,還是比較簡單的。而且,DeepSeek能支撐的訪問量是有限的,延時也較長,現(xiàn)在還不能算是好的體驗。

“如果只是進行DeepSeek原始模型的接入,這在汽車產(chǎn)品上的體驗還是有差距的。這對于商湯絕影來說,也是一個利好。”

王曉剛用「做幾何題」來描述自動駕駛仿真:在解題過程中,每解一步都需要加一些輔助線,幾何圖像本身也在演變,這就類似于自動駕駛的世界模型仿真——不但要預(yù)測物體軌跡,還要讓環(huán)境里的視頻圖像得到演進,能夠預(yù)見出來,這是DeepSeek所欠缺的。

“DeepSeek一直致力于語言模型,對于圖像、視頻的精準(zhǔn)生成還是比較欠缺的,但這正是我們的強項。”

視頻生成的嚴(yán)格標(biāo)準(zhǔn)

“「開悟」世界模型的視頻生成,其實和Sora等標(biāo)準(zhǔn)還是有區(qū)別的。我們需要更加精準(zhǔn)的可控性,要符合物理規(guī)律,還有交通法則。我們生成的視頻輸入,實際上是物體的運動軌跡和3D的框,由這些輸入精準(zhǔn)地控制視頻的生成。”

為了準(zhǔn)確模擬各種極端場景,「開悟」必須做到結(jié)合11個攝像頭輸入的時空一致性。同時,絕影本身也儲備了大量真值數(shù)據(jù)測試集,可以通過視頻反向提取其中的物體位置,進行軌跡驗證,保障視頻的真實和有效性。



“其實從去年開始,就已經(jīng)有20%的生成視頻,應(yīng)用在了模型訓(xùn)練中。希望將來這一數(shù)字能超過50%,乃至80%。”

通俗一點來比喻的話,「強化學(xué)習(xí)」就是針對一個復(fù)雜場景,通過模擬仿真反復(fù)測試,并給出多條不同的駕駛行為和路徑。

接下來,就像DeepSeek一樣,可以針對一個問題找到10條乃至100條的思維鏈,去解決問題。

“我們之前所說的高質(zhì)量數(shù)據(jù),指的是人類的高質(zhì)量駕駛行為。而如今高質(zhì)量數(shù)據(jù)的生成,不一定再需要人類的駕駛行為,而是將圖片或者視頻片段作為一個場景起點,接下來由世界模型通過強化學(xué)習(xí)去生成即可。”王曉剛說道。

R-UniAD的3大挑戰(zhàn)

為實現(xiàn)云端大模型和世界模型的在線交互,絕影克服了3個關(guān)鍵難題:

1、模擬仿真能力:必須精準(zhǔn)、可控。

2、預(yù)測能力:對于周圍環(huán)境視頻的生成,除了準(zhǔn)確,還要有多樣性。“如果生成的東西都是單一的,就沒法模擬出不同的場景和駕駛行為。”

3、Reward:也就是評價出哪些視頻和軌跡的序列,它是一個好的駕駛行為,那么有的產(chǎn)生了碰撞,那么有的給人家不舒適的這樣的一些這樣的一些感覺。



R- UniAD的重要一環(huán),在于世界模型的環(huán)境生成,以及對其的精準(zhǔn)控制,達成這一能力,才能體現(xiàn)強化學(xué)習(xí)的效果。

王曉剛指出,未來的發(fā)展,一定是基礎(chǔ)設(shè)施和云端研發(fā)占的比重越來越高,而端側(cè)則變得更加簡單:各種數(shù)據(jù)蒸餾、工程優(yōu)化,能夠使得越來越多的功能被部署在更加便宜的低算力芯片上,但這一前提都依賴于強悍的云端模型。

被高估的激光雷達魯棒性

近期,「純視覺」風(fēng)頭漸弱,多家車企都表示,會在高階智駕上繼續(xù)使用激光雷達。

但王曉剛認(rèn)為,激光雷達有著自己的天花板,其本身具有的信息量是偏少的,達不到非常魯棒的狀態(tài)。只不過,當(dāng)下由于沒有海量數(shù)據(jù)支撐,智駕的視覺能力偏弱,因此還需要用激光雷達作為輔助。

從成本層面考慮,「全民智駕」的趨勢下,智駕需要下探到10萬元級別以下,硬件成本也需要進一步降低。

“視覺能力的上限更高。在硬件固定的前提下,通過大數(shù)據(jù)去更新的模型,會不斷提升軟件的性能。”他說道。

先布局中低算力平臺

從去年開始,商湯已開始在智駕市場中布局:“從市場份額上考慮,要先下探到價格較低的中低算力車型,所以我們?nèi)ツ?strong>主要布局了地平線J6E、J6M等平臺的方案,也與廣汽、奇瑞還有東風(fēng)形成了戰(zhàn)略合作。”

王曉剛透露稱,到今年3月,商湯絕影和車企合作開發(fā)的基于J6M的自動駕駛產(chǎn)品,就能實現(xiàn)量產(chǎn),4月還會在上海車展發(fā)布。



除了智駕產(chǎn)品本身,絕影還在大模型、數(shù)據(jù)基礎(chǔ)設(shè)施等方面,協(xié)同車企進行規(guī)劃和布局,包括建設(shè)數(shù)據(jù)的生產(chǎn)管線,共建研發(fā)體系等等。

需要注意的是,即便有了強化學(xué)習(xí)的世界模型,要想覆蓋更多的復(fù)雜場景,真值數(shù)據(jù)還是非常重要的,而這些數(shù)據(jù)還是在車企,這也是絕影與車企形成深度合作的意義之一。

特斯拉FSD的挑戰(zhàn)

訪問當(dāng)天,正值特斯拉FSD突然在華推送,王曉剛對此也發(fā)表了自己的看法。

他認(rèn)為,特斯拉FSD在中國的應(yīng)用,還是會受到數(shù)據(jù)的限制。首先,中國的交通場景與美國存在很大差異;其次,特斯拉在在中國采集的數(shù)據(jù)也會受到管控,無法跨境。

“如果是做端到端的話,F(xiàn)SD會面臨這些自動駕駛場景數(shù)據(jù)方面的問題。它也不太可能用它在美國所擁有的數(shù)據(jù)在本地訓(xùn)練,因為數(shù)據(jù)不能夠跨境,也沒有強大的基礎(chǔ)設(shè)施。所以絕影R-UniAD的新型技術(shù)路線,即便對于特斯拉的FSD,也有著現(xiàn)實意義。”

同時他表示,特斯拉FSD目前還是模仿學(xué)習(xí)的范式,而R-UniAD技術(shù)路線訓(xùn)練出來的端到端智駕模型,很有希望超越人類駕駛表現(xiàn),實現(xiàn)彎道超車。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
歐冠決賽:朱婷獲最佳主攻,哈克榮膺MVP,最佳陣容揭曉!

歐冠決賽:朱婷獲最佳主攻,哈克榮膺MVP,最佳陣容揭曉!

格斗聯(lián)盟有話說
2025-05-05 03:10:05
又是蘋果率先降價迎戰(zhàn)618,低至2699元,國產(chǎn)手機遠離性價比

又是蘋果率先降價迎戰(zhàn)618,低至2699元,國產(chǎn)手機遠離性價比

柏銘銳談
2025-05-04 23:42:53
烏克蘭失蹤女記者羅什奇娜遺體被發(fā)現(xiàn),生前遭俄軍酷刑折磨致死

烏克蘭失蹤女記者羅什奇娜遺體被發(fā)現(xiàn),生前遭俄軍酷刑折磨致死

國際情爆猿
2025-05-01 10:01:17
“上午立夏梅雨多,下午立夏旱斷河”,今年立夏幾點?有啥說法?

“上午立夏梅雨多,下午立夏旱斷河”,今年立夏幾點?有啥說法?

糖逗在娛樂
2025-05-03 15:02:59
于東來事件大結(jié)局?官方表態(tài)!才被疑偷漏稅,胖東來總算不用關(guān)了

于東來事件大結(jié)局?官方表態(tài)!才被疑偷漏稅,胖東來總算不用關(guān)了

小陸搞笑日常
2025-05-04 18:04:58
如果沒老外報道,多少人都被蒙在鼓里!英偉達臺積電的心態(tài)要崩!

如果沒老外報道,多少人都被蒙在鼓里!英偉達臺積電的心態(tài)要崩!

青青子衿
2025-05-05 02:03:06
2025養(yǎng)老金補發(fā)提前到賬!中低收入每月多200元,工齡調(diào)整新變化

2025養(yǎng)老金補發(fā)提前到賬!中低收入每月多200元,工齡調(diào)整新變化

山藥蛋TV
2025-05-04 10:52:03
“跪族”出現(xiàn)了:關(guān)稅大戰(zhàn)為什么要與美國硬剛?句句都是茍且之流

“跪族”出現(xiàn)了:關(guān)稅大戰(zhàn)為什么要與美國硬剛?句句都是茍且之流

硬核Deeper
2025-04-13 21:10:21
沈月曬與劉詩詩、張云龍聚餐合照,表示會一直盯著這個秉竹業(yè)游

沈月曬與劉詩詩、張云龍聚餐合照,表示會一直盯著這個秉竹業(yè)游

娛樂寡姐
2025-05-04 23:09:06
黃一鳴再曬聊天記錄討說法,王思聰對私生女態(tài)度曝光:要生隨便你

黃一鳴再曬聊天記錄討說法,王思聰對私生女態(tài)度曝光:要生隨便你

素衣讀史
2025-04-22 18:08:14
小特:馬叔保持半決賽水平將會奪冠,他的綜合實力比趙心童更強

小特:馬叔保持半決賽水平將會奪冠,他的綜合實力比趙心童更強

直播吧
2025-05-04 10:26:27
王雷把李小萌養(yǎng)得真好,狀態(tài)就能看出來, 還跟小女孩似的!

王雷把李小萌養(yǎng)得真好,狀態(tài)就能看出來, 還跟小女孩似的!

鄉(xiāng)野小珥
2025-05-05 00:05:13
起風(fēng)了,藍營八要員今被捕,臺媒一語道破真相,盧秀燕自食其果!

起風(fēng)了,藍營八要員今被捕,臺媒一語道破真相,盧秀燕自食其果!

阿策聊實事
2025-05-04 12:26:51
投資四百多億的廣州白云站,為何在人氣上難敵廣州南站?

投資四百多億的廣州白云站,為何在人氣上難敵廣州南站?

小宇宙雙色球
2025-05-04 15:35:09
汪峰試探問:你跟幾個男人回過家?章子怡一句話,讓他瞬間紅了臉

汪峰試探問:你跟幾個男人回過家?章子怡一句話,讓他瞬間紅了臉

火之文
2025-02-04 13:22:59
威少42%三分命中率全拜快船所賜?數(shù)據(jù)顯示他投籃時2.8米內(nèi)無防守人

威少42%三分命中率全拜快船所賜?數(shù)據(jù)顯示他投籃時2.8米內(nèi)無防守人

雷速體育
2025-05-04 22:38:13
楊麗萍上臺沒穿衣服?服裝都是彩繪的,鏡頭放大時太“搶眼”!

楊麗萍上臺沒穿衣服?服裝都是彩繪的,鏡頭放大時太“搶眼”!

星辰生肖館
2025-04-27 04:40:04
敏銳而透徹的人,會在書寫時嗅到自由的味道| 五月非虛構(gòu)短故事招募

敏銳而透徹的人,會在書寫時嗅到自由的味道| 五月非虛構(gòu)短故事招募

三明治
2025-05-03 10:49:37
25歲機車網(wǎng)紅“小陳”車禍去世!山路飆到124,生前調(diào)侃一語成讖

25歲機車網(wǎng)紅“小陳”車禍去世!山路飆到124,生前調(diào)侃一語成讖

裕豐娛間說
2025-05-03 22:11:26
油價大降1.2元/升,92號汽油跌破地板線后重新下跌,5月19日調(diào)價

油價大降1.2元/升,92號汽油跌破地板線后重新下跌,5月19日調(diào)價

豬友巴巴
2025-05-03 15:30:03
2025-05-05 07:11:00
RoboX
RoboX
關(guān)注智能汽車、機器人在內(nèi)的具身智能前沿科技
132文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

巴菲特:理性看待AI炒作 耐心是關(guān)鍵

頭條要聞

貴州游船側(cè)翻游客:看見船翻了 當(dāng)時就哭了

頭條要聞

貴州游船側(cè)翻游客:看見船翻了 當(dāng)時就哭了

體育要聞

聯(lián)盟30隊首發(fā)得分后衛(wèi),他只能排第29位?

娛樂要聞

55歲王菲跟“李亞鵬時期”完全不同!

財經(jīng)要聞

一個時代的結(jié)束!巴菲特年底將卸任

汽車要聞

小米SU7大優(yōu)惠!5月限時購車權(quán)益送輔助駕駛

態(tài)度原創(chuàng)

健康
數(shù)碼
家居
手機
軍事航空

唇皰疹和口腔潰瘍是"同伙"嗎?

數(shù)碼要聞

多年來首次設(shè)計重構(gòu):微軟13英寸Surface Laptop曝光,5月6日發(fā)布

家居要聞

黑白紋理 簡約低調(diào)空間

手機要聞

曝蘋果正在開發(fā)20周年紀(jì)念版iPhone

軍事要聞

媒體:美俄兩場閱兵 都有新看頭

無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 罗山县| 桐乡市| 锡林浩特市| 永仁县| 马鞍山市| 花垣县| 平罗县| 彰武县| 天峨县| 河源市| 大冶市| 婺源县| 满城县| 贺兰县| 平顶山市| 桐庐县| 临江市| 交城县| 高尔夫| 加查县| 望城县| 铜陵市| 石楼县| 黑水县| 长子县| 宁陕县| 方城县| 清水河县| 山阳县| 洪泽县| 班戈县| 云梦县| 延寿县| 安西县| 平远县| 松桃| 永川市| 海城市| 龙里县| 庆安县| 六枝特区|