網易首頁 > 網易號 > 正文申請入駐

5年內實現自動駕駛，世界模型是唯一解

2024-12-20 17:05:17　來源: 圓周智行

四川舉報

分享至

之前的文章我們提到，端到端讓行業看到了通往自動駕駛的捷徑，但光有端到端還不夠。蔚小理華VS地絕元魔，誰是端到端大模型執牛耳者。端到端的“黑盒”特性使得它無法直接約束系統的安全邊界；并且無法復現復雜的、偶發的corner case，考驗可解釋性和泛用性能力，把上限提高的同時拉低了下限，存在“蹺蹺板效應”。

如何解決這些問題？

于是，世界模型被引入自動駕駛。圓周智行粗略統計，目前已經有超過10個車企和自動駕駛公司提出了世界模型。包括特斯拉，英偉達，蔚來，理想，地平線，商湯，元戎啟行，Momenta。還有很多企業雖然并未對外傳播世界模型，但其實內部也一直在推進此事。

那么，到底什么是世界模型？它是如何生成的？又是如何工作的？

在回答這些問題之前，我們先看一個案例，蔚來汽車是如何思考世界模型的？

2023年NIO day上，蔚來就公布了其正在自研世界模型的計劃。2024年7月的科技日上，蔚來智駕負責人任少卿釋放了更多技術細節。

在蔚來的理解里，人類大腦具備兩個能力。首先是空間理解能力，也叫想象重建能力。大白話說就是憑空想象能力，你可能沒有見過一棵長了100年的大樹，但是你可以通過大腦想象它的樣子。其次是時間理解能力，或者叫想象推演能力。大白話說就是在大腦里進行時空推演，想象一棵樹春夏秋冬的樣子。二者共同組成的能力就叫時空認知能力。這是人在三維世界生存的基本技能。這就是人腦構建的世界模型。

這個理解和權威機構對世界模型的定義完全吻合?！癢orld Models”（世界模型）最早出現在機器學習領域。2018年，機器學習頂會NeurIPS收錄了一篇《Recurrent World Models Facilitate Policy Evolution》論文，以認知科學中人腦mental model來類比世界模型，認為mental model參與了人類的認知、推理、決策過程，其中最核心的能力在于反事實推理（Counterfactual reasoning），這是一種人類天然具備的能力。

回到自動駕駛，蔚來提出了一個很核心的觀點，自動駕駛如果實現也必須具備這樣的能力。自動駕駛有很多不常見長尾場景，也就是大家常說的corner case，這樣的長尾場景數據獲取非常艱難。業內比較常規的做法有兩個：一個是3D重建，但是這樣的做法成本高，效率低，并不實用；另一個就是仿真，但是仿真的數據根本無法“還原”真實數據，對自動駕駛的幫助有限。于是，自動駕駛的“大殺招”世界模型出現了，它可以根據視頻，圖片，甚至文本描述自動生成視頻數據，給自動駕駛提供源源不斷的“燃料”。

在自動駕駛里，世界模型如何發揮作用，地平線對此給出了更細致的解釋，世界模型的作用：一是通過生成式大模型生成帶有預測性質的視頻數據，實現corner case多樣化訓練；二是采用強化學習的方法認識復雜駕駛環境，從視頻輸出駕駛決策。

那么，如何來構建世界模型，辦法有兩個：一個是憑空想象，“無中生有”；另一個是根據現有信息完善信息，比如輸入文本，圖片，視頻，生成更多更豐富的視頻。

對于第一個環節，我們需要插入一個容易混淆的概念。很多人認為世界模型就是仿真，二者確實有相似之處，世界模型包含了仿真的部分內容，但是又完全高于仿真。

任少卿提出了一個很有意思的觀點，自動駕駛發展了這么多年，本質上都是在做空間理解的升級，就是讓系統更理解周圍的世界。最早是通過提升傳感器硬件能力，后來是算法升級，BEV視角轉換，OCC 2D變3D，到現在軟硬件能力都已經出現瓶頸，但是極端場景數據的獲取卻成了大難題。于是，技術人員就想到了自己“造數據”的方式。

當然，必須承認的是，這項技術的發展并不始于自動駕駛領域，世界模型的概念最早在2018年被引入人工智能領域。2022年，Yann LeCun在機器智能里提出了雙系統的概念，其中的系統二就提到了要用世界模型構建未來場景的辦法。但是真正讓這項技術被更多人熟知的時間要推到2024年，其中的最大功臣自然是Open AI。

2024年2月16日清晨，Open AI公司發布了一款震驚全世界的視頻生成大模型Sora，它可以根據文本自動生成一段60秒的視頻。這是世界模型的一個具象體現。

在人工智能領域，世界模型的影響力遠遠超過自動駕駛，包括李飛飛的world Labs，谷歌DeepMind等企業都發布了世界模型。Yann LeCun的Mate FAIR團隊還發布了導航世界模型，根據前一秒的導航信息實時生成下一秒的軌跡。想象一下這個技術一旦成熟，將會給自動駕駛帶來多大的幫助。

這里插一句題外話，如果我們梳理自動駕駛技術的發展路線會發現一個非常有意思的事情。這幾年所有對自動駕駛發展產生推動的技術都不源于自動駕駛，而是人工智能，包括transformer，BEV，OCC，到今天的端到端，世界模型。正應了那句話，自動駕駛本質上是人工智能的一個具身智能體現。所以技術人員很喜歡說一句話，搞自動駕駛不能只盯著自動駕駛，這樣永遠搞不好自動駕駛。

在自動駕駛，特斯拉毫無疑問是那個探路者。就像喬布斯帶領蘋果科技惠民一樣，雖然蘋果并不是技術發明者，但它確實是將技術融入產品的最佳實踐者。

世界模型幫助所有智駕玩家打開了一個全新的世界。2023 年，特斯拉自動駕駛負責人在 CVPR 上介紹了其正在打造的 “通用世界模型”。該模型可以通過過往的視頻片段和行動提示，生成 “可能的未來” 的全新視頻，其基礎架構由多臺攝像機的視頻流輸入，匯集到一個大型 Transformer 塊中，通過空間注意力和幾何模型等形成特征并進行預測，可用于預測占用率、體素未來的流動情況以及車道等駕駛所需的任務。

與此同時，Wayve也在2023 年發布了 GAIA-1 模型，它可以依靠視頻、文本和動作的輸入生成逼真的視頻，能夠生成分鐘級的視頻以及多種合理的未來場景，幫助自動駕駛模型的訓練和仿真。

2024 年 GTC 大會上，英偉達也展示了其在世界模型領域的新進展，通過將多模態數據輸入模型訓練并讓模型預測未來駕駛場景，自動駕駛基礎模型可以穩定生成多個攝像頭拍攝到的逼真的駕駛場景演變，并且通過語言提示詞也可以使得模型呈現的場景靈活變化。

在國內傳播層面，蔚來汽車是國內最早提世界模型的車企。其在2023就表示正在研發世界模型，2024 年 7 月 27 日，蔚來發布了中國首個智能駕駛世界模型 NWM 。

華為則是把自動駕駛的視頻生成板塊放在了盤古大模型中，叫做場景生產大模型。華為在2020年開始啟動盤古大模型研發，并于2021年4月正式發布，到2022年聚焦行業應用落地。

華為對世界模型的使用更加多元。它從實車數據學習如何生成新視頻，同時處理重建和渲染，生成數據可用于感知算法訓練；重建各類障礙物構建素材庫，根據需要構造corner case，增強數據完備性；針對天氣、晝夜、季節等環節因素對已有場景進行變換，構造corner case。它基于神經網絡做實車場景，并進行重建跟渲染。

有意思的是，在自動駕駛上一直以先鋒自居的小鵬汽車在世界模型上并沒有任何資料流出，不知是在憋大招還是覺得不重要。推測來看，前者的可能性居多。

世界模型的價值如何評估

就在世界模型被瘋狂追捧的同時，一個更深的問題擺在行業面前：世界模型到底應該凌駕于真實數據之上，還是僅僅作為真實數據的補充。

特斯拉和元戎啟行的思路是用一套系統覆蓋兩種商業模型，輔助駕駛和Robotaxi。然后用數據訓練的方式不斷提升系統的能力上限，這種邏輯下世界模型更像是現實世界數據的補充。但這似乎低估了世界模型的價值。

“世界模型是最重要的事情，沒有之一。”

小馬智行CTO樓天城給了世界模型極高的評價，他認為世界模型是自動駕駛當前最重要的事情。依靠現有的真實數據只能讓智駕系統無限接近人，只有世界模型數據才能構建出更復雜的世界，最終讓訓練出來的系統超越人。理由很簡單，自動駕駛是對人類駕駛行為的學習，因為人的駕駛能力有上限，所有自動駕駛的安全邊界也有上限，但樓天城認為，自動駕駛的安全必須高于人類才有意義，尤其是L4級自動駕駛。所以必須要有高于人類駕駛行為的世界模型數據訓練出來的系統才能優于人類。按照這個表述，世界模型應該凌駕于真實數據之上。

這里我們來看看地平線的實踐案例，傳統基于規則的CNN（卷積神經網絡）學習方式，沒有泛化和理解能力。地平線提出了“交互式博弈”，核心在于通過生成數據驅動實現模擬學習和強化學習。為了避免機器對數據的重復模仿，它必須要學會主動理解數據。這時候世界模型就承擔了「駕駛世界觀」的作用。這里我的理解是，地平線已經實現了樓天城說的，讓世界模型擔當系統教練的角色，指導系統到底該怎么開。

此外，世界模型還可以作為額外的信息源，為預測環節服務。當地圖信息和傳感器信息輸入World Model，機器經過處理輸出仿真、想象、演繹甚至腦補過程，支撐系統的交互博弈，為系統兜底。

那么，世界模型的好壞又該如何評估。如果單純從理論層面，很難。世界模型的能力就好像語文作文，很難通過一個量化的指標去評估好壞。目前雖然很多車企發布了世界模型，但是對具體細節數據展示的不多。這里我們來看看蔚來和商湯的案例。

蔚來對其世界模型的介紹如下：

“能夠在 100 毫秒內推演出 216 種可能發生的場景，并可基于 3 秒的駕駛視頻生成 120 秒的想象視頻，還具備閉環仿真測試能力?！?/em>

商湯絕影對 “開悟”世界模型的介紹如下：

“（視頻生成）時間最長為150秒、分辨率可達1080P、視角可以實現11V”。

絕影認為這個難度很大，行業普遍都是生成1V或6V視角的視頻，開悟直接干到11V，而且同時生成的視角畫面越多，要保持時空一致性就更難，還要克服魚眼視角的畸變。

雖然沒有準確的評估辦法，但是他們都強調了世界模型的幾項能力：準確性，多樣性，可控性和泛化能力。

目前看來，世界模型的能力還遠遠沒有開發出來。

樓天城提出了一個設想，世界模型還可以充當一個評分體系，對自動駕駛系統的表現做出評價，不斷提升系統的能力。

地平線提出了世界模型的兩個長遠價值：首先是更準確的世界理解，幫助減少智駕系統的代碼量，延遲，網絡負載，錯誤率等；然后是泛化能力，世界模型可以讓高階智駕形成對復雜駕駛環境的通用理解，而非對輸入的重復依賴。大白話說就是舉一反三。

最近地平線創始人余凱在接受采訪時表示，大規模L4、L5將會在5年左右實現。而目前行業形成的一個共識是，自動駕駛實現的一個大前提不僅僅是像人，而是要超越人。真實世界的數據只能是無限接近人，要超越人，世界模型是目前技術人員探索出來的通往自動駕駛的唯一解。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網易首頁下載網易新聞客戶端

相關推薦

熱點推薦

牛彈琴：俄烏談判草草結束俄提的12項狠條件遭烏痛批

現代快報 2025-06-03 08:23:15
10025 跟貼 10025

河南一水庫水位下降現千佛石窟，有1043尊石佛幾乎全部被敲掉頭部，水庫管理人員：汛期將至，禁止參觀

魯中晨報 2025-06-02 10:19:03
3881 跟貼 3881

只要40分鐘！上海?舟山，高鐵要來了

新民晚報 2025-06-02 21:27:21
68 跟貼 68

太惡劣！確認系擺拍！官方通報

蓬勃新聞 2025-06-02 12:55:17
2675 跟貼 2675

20個月空調費一萬八，老板說要爭“一口氣”

瀟湘晨報 2025-06-02 12:24:14
604 跟貼 604

端午節后4個月不再有法定節假日，國慶中秋合并放假8天

現代快報 2025-06-02 12:24:03
3330 跟貼 3330

“13**0000000”的手機號，賣了61.2萬

大象新聞 2025-06-02 14:15:05
1381 跟貼 1381

新華社消息｜俄稱挫敗一起破壞遠東鐵路設施圖謀

新華社 2025-06-02 14:20:51
2234 跟貼 2234

哈佛蔣雨融再發聲：沒有任何海外國家綠卡

大象新聞 2025-06-03 09:15:28
818 跟貼 818

許其亮同志遺像

新華社 2025-06-02 19:14:24
462 跟貼 462

入戶調查已開始，請積極配合！

閃電新聞 2025-06-02 22:25:34
0 跟貼 0

德國前外長貝爾伯克當選第80屆聯大主席

新華社 2025-06-03 00:13:33
176 跟貼 176

iPhone，又行了？

中國新聞周刊 2025-06-01 14:25:13
1375 跟貼 1375

今日17時再迎“熟人局”！鄭欽文和薩巴倫卡隔空喊話說了啥

大象新聞 2025-06-03 06:44:04
91 跟貼 91

機票價格“跳水”突現1.1折網友：抓緊時間抄底

環球網資訊 2025-06-02 14:38:03
678 跟貼 678

10元門票炒到500元，場均上座率超職業聯賽！“比賽第一，友誼第十四”的“蘇超”突然火了！

每日經濟新聞 2025-06-02 21:08:15
20 跟貼 20

新建核潛艇、升級核武英軍事戰略轉向全面"備戰"

央視新聞客戶端 2025-06-02 07:18:49
1406 跟貼 1406

瀝青剛鋪好，怎么又挖開？居民不解：小區里也會“反復掘路”？

上觀新聞 2025-06-03 06:54:58
106 跟貼 106

烏克蘭到底摧毀了多少俄戰略轟炸機？是否俄“珍珠港時刻”？

新民晚報 2025-06-03 09:15:01
0 跟貼 0

鴻蒙智行：尊界S800上市三天大定達2600臺

界面新聞 2025-06-03 07:05:32
1 跟貼 1

河北女司機與騎手沖突后續：女司機氣到流產，公布完整行車記錄儀

體制內老陳 2025-06-03 11:51:27
0 跟貼 0

南寧一女子花460多萬元購買大平層，要買第二套時竟發現土地使用權僅剩47年

環球網資訊 2025-06-02 12:36:42
0 跟貼 0

平潭一駱駝瘦成“紙片”引發關注！部門已介入

環球網資訊 2025-06-03 11:47:56
0 跟貼 0

車輛失控撞入店內,11歲姐姐沖去一把抱起救回1歲妹妹

大象新聞 2025-06-03 11:59:48
0 跟貼 0

停業整改！廣西一景區有游客從高空墜落

環球網資訊 2025-06-03 11:47:58
0 跟貼 0

這么重要的比賽，王哲林怎么不在上海男籃？

新民晚報 2025-06-03 09:20:44
0 跟貼 0

為什么西方科技似乎停滯了？原因其實很簡單：
現代春秋
2025-05-28 18:09:14

用對黃芪，百病不敵！這樣喝，瘀血散了，氣血通了、人也精神了
荷蘭豆愛健康
2025-06-02 12:36:08

剛剛！卡皮巴拉“豆包”回家了！不但沒瘦，還胖了一斤多
魯中晨報
2025-06-03 11:38:03

“蘇超”爆火，被CCTV1報道，CCTV5不播國足生死戰，魯媒預測首發
體育大學僧
2025-06-02 20:46:28

楊瀚森6月3日表現優異，排名有望提升
墨史軒
2025-06-03 10:47:35

等了10多年，蒙古國終于想通了！
傲骨真心
2025-06-02 14:00:05

事發上海！男子頻頻對路邊自行車下手，原因令人震驚！被抓時稱，“就等著你們來找我了”
新民晚報
2025-06-03 10:04:09

張雪峰淚灑直播間告別，董宇輝不能做文旅，他們到底動了誰的奶酪
小嵩
2025-06-02 10:02:44

國民黨主席選舉：張亞中出局，盧秀燕可能落選，蔣萬安成黑馬
大嘴愛嗶嗶
2025-06-02 19:51:59

清華最新研究：跑步讓人年輕十歲！專家揭穿“顯老”騙局
健身狂人
2025-06-02 15:25:32

118個邊境哨所直接被摧毀 20個雷達站遭毀滅性打擊：徹底陷入困境
聚峰軍評
2025-05-31 09:25:52

亞洲最大的垃圾焚燒廠建在家門口，長沙黑麋峰人是怎么接受的
混沌錄
2025-05-31 16:47:42

吃點維生素就出現了肝昏迷？隱形傷肝“黑名單”來了！
四川食藥監
2025-05-30 17:14:01

突發！西安當地撤回拆遷文件，又有一地拆遷工作被叫停，產權歸還
火山詩話
2025-06-03 09:57:23

林葳19分遭3連敗引熱議！媒體人：這個身高選秀打2是沒什么前途
狼叔評論
2025-06-02 23:37:06

55歲“淫僧”黃連奎兩年染指128名少婦，連18歲的少女都不放過
民間精選故事匯
2025-03-10 08:10:19

5月30凌晨，一大早多家官媒都在轉發J-20打掉“敵機”的事！
小企鵝侃世界
2025-05-30 22:38:56

2025城市魅力排行榜：廣東城市分級不均衡，從一線到五線，全都有
叮當當科技
2025-06-03 11:30:57

1億賣核心，2500萬送主帥，國際米蘭踢完決賽就不過了？
風風拒絕焦慮
2025-06-02 03:14:35

日本暴徒沖進展廳，把兵馬俑打碎，中方的回應令人折服
星辰生肖館
2025-04-22 03:55:04

2025-06-03 12:23:00

圓周智行

智能出行產業科技研究院

125文章數 1關注度

往期回顧全部

科技要聞

李斌：樂道一線減員40% 銷量反要大漲40%

馬斯克怒斥媒體“撒謊”，卻震驚自家高管

算力受限之下，DeepSeek如何為中國AI“續命”

下周的WWDC，蘋果AI依舊不會有“驚喜”

新造車5月再洗牌：問界回前三，小米守第五

頭條要聞

學者:韓國大選李在明真正的對手是"影子候選人"尹錫悅

俄高層暫未回應烏方突襲外界猜測俄可能發動夏季攻勢

老人參加免費旅游被推銷高息儲值卡有人當場下單40萬

經銷商因銷量慘淡關店 80多輛電動車被廠家遠程鎖死

被問若當選將如何處理對華關系李在明最新表態

頭條要聞

學者:韓國大選李在明真正的對手是"影子候選人"尹錫悅

俄高層暫未回應烏方突襲外界猜測俄可能發動夏季攻勢

老人參加免費旅游被推銷高息儲值卡有人當場下單40萬

經銷商因銷量慘淡關店 80多輛電動車被廠家遠程鎖死

被問若當選將如何處理對華關系李在明最新表態

體育要聞

傲了一輩子的恩里克，心中永遠住著一個小天使

國足出征印尼25人大名單：王鈺棟、楊明洋在列

法網100勝！德約3-0進8強刷爆紀錄將戰茲維列夫

68年不敗印尼！國足2天后生死戰：唯有贏球才有希望

法網超級大冷：佩古拉1-2遭世界第361名逆轉

娛樂要聞

李小璐賈乃亮首合體！陪甜馨過六一

多人爆料孫儷全家移民國外，十年前就開始鋪路？

小沈陽演唱會遭質疑，觀眾：這不是你們家庭聚會

李連杰入駐抖音粉絲量不及預期，武打巨星落幕？

馮小剛19歲小女兒曬美國高中畢業照，文案引爭議

財經要聞

霸王交卷，單店失蹄

"資產稅"引發新憂慮

又一電商巨頭突然“休克” 一個時代結束了

一筆漂亮的退出：93億賣始祖鳥股份

白天當醫生，晚上做游戲，80后首款游戲月入千萬

汽車要聞

吉利汽車5月銷量23.52萬輛同比增長46%

小米高管回應口水仗小米華為都很優秀

電動時代打情懷牌？大眾ID.2或回歸Polo命名

實拍小米YU7，19.9萬不可能了，你看多少行？

首搭鴻蒙座艙5 粵港澳車展嵐圖FREE+首次開放亮相

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

游戲

旅游

家居

房產

數碼要聞

聯想拯救者《黑神話：悟空》定制 Y9000P、刃 9000K 規格信息公布

AIDA64 發布 8 世代首個測試版本，初步支持 AMD 下一代處理器

全面升級，OMEN暗影精靈 11 游戲筆記本重新定義游戲本

質價比王炸！OMEN暗影精靈 11 游戲筆記本輕松暢玩3A大作

《劍星》伊芙MOD來咯！性感緊身衣盡顯絕妙身材

Switch2后天發售！已有玩家提前入手你的啥時候到？

超三成玩家認可《神鬼語言4》成外網最期待Xbox游戲

《上古卷軸4重制版》迎來傳奇玩家天際奶奶重出江湖

旅游要聞

熱聞|清明假期將至，熱門目的地有哪些?

北京推薦春日10大賞花勝景地

清明假期，蘇州機關企事業單位停車場免費開放

清明流行“下江南”，揚州民宿訂單同比上漲4倍

家居要聞

北歐氛圍清新活潑趣味

原木純白邂逅自然本真

暖色復古溫馨小資情調

開闊實用技術控的大平層

房產要聞

金地華南落子海南自貿港22萬㎡標桿項目，夯實代建行業領軍者地位

買配售型保障房，還是商品房？這個坑，千萬別踩！

一座門的啟幕，一座城的開場！未來方洲實景亮相！

清盤倒計時！這個天河芯紅盤，贏的不止多一點！

手機 / 數碼

房產 / 家居

5年內實現自動駕駛，世界模型是唯一解

李斌：樂道一線減員40% 銷量反要大漲40%

學者:韓國大選李在明真正的對手是"影子候選人"尹錫悅

學者:韓國大選李在明真正的對手是"影子候選人"尹錫悅

傲了一輩子的恩里克，心中永遠住著一個小天使

李小璐賈乃亮首合體！陪甜馨過六一

霸王交卷，單店失蹄

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

聯想拯救者《黑神話：悟空》定制 Y9000P、刃 9000K 規格信息公布

《劍星》伊芙MOD來咯！性感緊身衣盡顯絕妙身材

熱聞|清明假期將至，熱門目的地有哪些?

北歐氛圍 清新活潑趣味

金地華南落子海南自貿港22萬㎡標桿項目，夯實代建行業領軍者地位

5年內實現自動駕駛，世界模型是唯一解

傲了一輩子的恩里克，心中永遠住著一個小天使

霸王交卷，單店失蹄

吉利汽車5月銷量23.52萬輛同比增長46%

聯想拯救者《黑神話：悟空》定制 Y9000P、刃 9000K 規格信息公布

《劍星》伊芙MOD來咯！性感緊身衣盡顯絕妙身材

熱聞|清明假期將至，熱門目的地有哪些?

北歐氛圍清新活潑趣味