99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

一文帶你厘清自動駕駛端到端架構差異

0
分享至

[首發于智駕最前沿微信公眾號]隨著自動駕駛技術飛速發展,智能駕駛系統的設計思路也經歷了從傳統模塊化架構到端到端大模型轉變。傳統模塊化架構將感知、預測、規劃和控制等子任務拆分開,分別由不同模塊完成;而端到端大模型則嘗試直接將傳感器輸入映射到車輛控制指令上,實現聯合優化。雖同為端到端,在各車企在設計時卻提出了模塊化端到端、雙系統端到端、單模型端到端等各種技術架構,這些端到端架構到底有何區別,相較于基于模塊化的架構,他們又有何優勢?

傳統模塊化系統架構與決策機制

在聊端到端大模型前,我們還是要先了解下基于模塊化的自動駕駛架構,到底是如何實現智駕的。基于模塊化的自動駕駛架構通常采用模塊化的流水線結構,將環境感知、行為決策和運動控制等功能串聯起來。在感知階段,系統通過攝像頭、雷達、激光雷達等傳感器進行目標檢測、分割和跟蹤;在決策規劃階段,基于感知結果和高精度地圖進行路徑規劃與行為決策;最后在控制階段生成具體的加減速、轉向等控制指令。



自動駕駛系統架構

基于模塊化的自動駕駛架構優勢在于各部分職責明確,可利用豐富的先驗知識和規則進行設計,且易于逐一調試和驗證。這一技術方案會先利用地圖和規則規劃期望路徑,再基于動態窗口法或采樣優化等技術生成軌跡,最后由PID或模型預測控制算法輸出執行指令,以實現高速NOA等功能。但這一技術對環境建模和規則依賴較強,在應對復雜多變的交通場景和長尾異常情況時容易出現性能瓶頸。

端到端系統架構與決策機制

與模塊化方法不同,端到端(End-to-End, E2E)架構是將傳感器數據直接映射到車輛操控輸出,從而實現聯合優化。其實端到端概念并不是近幾年才出現的,如1989年的ALVINN和2016年的NVIDIA DAVE-2等,使用前置攝像頭圖像輸入,通過神經網絡直接輸出轉向角,以驗證了端到端架構的可行性。



端到端架構

近年來,隨著大規模數據集和深度學習技術的發展,端到端自動駕駛方法不斷涌現。典型的端到端決策機制包括基于模仿學習(將駕駛員操作作為監督信號)以及強化學習(以安全舒適為目標優化獎勵)等策略,驅動模型直接學習從傳感器到規劃軌跡或控制命令的映射。端到端系統可以簡化結構,將感知、預測和規劃任務合并到一個聯合可訓練的模型中,從而能對駕駛性能進行直接優化。

端到端架構看似極具優勢,但由于缺乏明確的中間輸出,端到端系統往往被視為“黑箱”,難以解釋其決策過程,且在極端或罕見場景下的可靠性尚未充分驗證。此外,端到端模型需要海量多樣化的訓練數據和強大的計算資源,訓練優化難度較大。為了兼顧性能與安全,有些方法在端到端架構中仍保留了一定的模塊化結構(如使用語義分割或目標檢測作為中間表示)。近年來,還出現了將視覺數據與語言模型(如大規模視覺語言模型)結合的嘗試,以提升對場景語義和因果關系的理解能力,但這也進一步增加了系統復雜度和實時性的挑戰。智駕最前沿曾簡單圖解了模塊化架構到端到端大模型,以故事的方式將這兩個技術給大家厘清楚了(相關閱讀:自動駕駛中基于規則的決策和端到端大模型有何區別?)。

三種端到端架構詳細解析

3.1 模塊化端到端架構

模塊化端到端架構(Modular End-to-End)將整體規劃任務分解為可微分的子模塊,但在訓練和推理時聯合優化以最終規劃目標為準。該架構既保留了模塊化結構的可解釋性,又能享受端到端訓練的優勢。近年來已有不少研究和工業解決方案采用類似思路,如Wayve等公司訓練多任務神經網絡實現端到端規劃,并在CARLA等仿真平臺上取得優異成績。特斯拉最新的FSD V12方案也采用了這種模塊化端到端理念,使用鳥瞰(BEV)空間的占據網格(Occupancy Grid)網絡進行路徑規劃。特斯拉將多目攝像頭的特征映射到俯視圖空間,通過端到端學習得到占據概率圖,然后從中生成安全可行的行駛軌跡。該方法弱化了對高精度地圖的依賴,使車輛能更靈活地應對多傳感器融合后的環境感知。簡單理解,模塊化端到端架構在設計上仍保留了感知、預測、規劃等模塊,只是各模塊參數可以聯合訓練,因此能夠在一定程度上兼顧模型的可解釋性和任務級優化性能。

3.2 雙系統端到端架構(端到端+視覺語言模型)

雙系統端到端架構在單一的端到端模型之外,增加了一個視覺語言輔助系統,以提升對復雜場景的理解和推理能力。這一架構采用了“快慢雙系統”理念,快速系統(Fast System)采用端到端學習處理即時的軌跡規劃與控制,慢速系統(Slow System)則借助大規模視覺語言模型(VLM)進行高層次的語義推理和決策支持,雙系統相互協同,保障了智駕系統的安全性。

理想汽車的最新研發方案就采用了這一思路,一個端到端神經網絡負責實時駕駛控制,另一個視覺語言模型則對當前場景進行語義化解析,提供補充信息和決策建議。長安汽車的“天樞”大模型架構也采用了“大腦小腦”結構,其中“大腦”部分即是基于大模型的慢速系統,用于復雜推理,而“小腦”則負責具體規劃和控制。雙系統架構的決策機制通常是端到端模型快速生成初步路徑,而視覺語言模型則分析環境上下文(如交通標志含義、行人意圖等),在必要時修正或豐富規劃結果。但這種方案需要同時運行兩個大模型,占用大量算力,而且模型間的協同效率和一致性需要專門設計和優化。



3.3 單模型端到端架構

單模型端到端架構(One Model E2E)旨在用一個統一的多模態大模型完成所有自動駕駛任務,包括感知、預測與規劃。這一思路受到大規模語言模型和視覺語言模型的啟發,力圖構建一個“駕駛領域的通用基礎模型”。近期行業內就有相關嘗試,比如DriveMM是一種全新的大規模多模態模型,可以處理圖像和多視角視頻等多種輸入,并執行感知、預測和規劃等廣泛的駕駛任務。該模型先在各類視覺和語言數據上進行預訓練,再利用駕駛數據集微調,在多個公開數據集上實現了全任務的最先進性能。

在決策機制上,單模型架構可以將駕駛問題轉化為類似語言問答或生成的形式,由模型直接給出安全規劃或控制輸出,甚至可以通過自然語言交互進行意圖控制。這種“全能型”模型的優勢在于統一了數據表示和優化目標,可挖掘跨任務協同效應;但代價是模型規模巨大,對算力和數據的需求極高,而且目前缺乏實車部署的成熟方案。除了DriveMM之外,還有如DriveGPT4等嘗試將駕駛任務映射為文本問題,利用大型語言模型直接生成軌跡或控制指令。這些單模型方法代表著未來自動駕駛大模型的發展方向,但在安全可控性和實時性上仍需突破。

模塊化與端到端方案的優劣勢分析

4.1 系統復雜度

模塊化架構涉及眾多專業模塊,系統設計和集成相對復雜,需要人工調試和維護多個組件(感知、定位、規劃、控制等)。相比之下,純粹的單模型端到端方案將整體流程壓縮為一個網絡,減少了傳統模塊的數量,從架構上更加簡潔。但模塊化端到端架構需要設計多個可微分的子網絡,并管理它們之間的數據流;雙系統架構則需同步運行兩個大模型,協調“快速端到端模型”和“慢速語言模型”的輸出,反而增添了額外的子模塊或并行網絡,系統層次稍顯復雜。總體來看,純粹的單一大模型在系統構成上最為簡單,但模型本身規模龐大;傳統模塊化則模塊眾多但各自相對簡單。

4.2 訓練與優化難度

模塊化方案可分別針對各個子任務訓練(如目標檢測、車道線分割、軌跡規劃),每個模塊使用結構化標注數據,通過監督學習容易收斂。但這也需要針對每個模塊收集和標注大量數據。端到端模型則需要更大規模的駕駛數據(包括傳感器輸入與人類駕駛輸出)來進行聯合訓練。由于決策輸出高度依賴真實駕駛表現,端到端系統往往需要大量路測和仿真數據來覆蓋各類場景。雙系統架構在此基礎上還需準備適配視覺語言模型的數據集以及專門的對話或問答訓練。單一大模型的訓練難度最高,它不僅需要融合多模態(視覺、地圖、語言等)數據,還要在單一模型中學習多任務,因此訓練過程極其復雜,對算力和數據的需求遠超其他方案。總的來說,端到端方案在優化時缺少顯式的中間監督信號,容易陷入收斂困難或性能不穩定的問題,需要更多的探索和調參。

4.3 決策透明性

模塊化系統的一個重要優勢是可解釋性強,每個模塊有明確的功能邊界,設計者可以查看感知輸出、中間地圖和規劃軌跡等結果,清楚地定位問題所在。相比之下,全端到端模型由于決策過程高度融合,往往是“黑箱”式的,難以直接解釋為何做出某個操控決策。不過端到端范式并不一定完全封閉黑箱,采用模塊化端到端策略的系統可以保留如目標檢測或語義分割等中間輸出,使得系統仍然可以獲得部分透明度。如特斯拉的BEV占據圖在一定程度上提供了環境語義信息,而Wayve等系統也會輸出熱力圖供可視化。

雙系統架構引入的視覺語言模型本質上也作為輔助推理,但這種模型自身通常缺乏明確的決策解釋性。單模型架構盡管功能最強大,但幾乎沒有可見中間層供審查,其決策過程難以監督或理解,反而需要依賴后續的解釋性AI技術去分析網絡關注區域。因此,就透明性而言,傳統模塊化和模塊化端到端方案較優;而純端到端或大規模大模型系統的決策往往更不透明。

4.4 靈活性

在功能拓展和算法迭代方面,模塊化架構具有較好的靈活性,當需要應對新場景或添加新功能時,可以針對性地替換或升級某個模塊(如換用更好的感知算法或優化規劃策略),而無需重訓整個系統。

端到端方案則不易插入外部知識或規則,任何改變往往要通過重新訓練網絡來實現。雙系統架構在這方面介于兩者之間,雖然端到端模型需要重訓,但通過語義模塊(VLM)可以靈活地添加解釋層面能力,如通過修改提示詞或微調語言模型來適應新需求。單模型架構的拓展性最弱,因為其內部結構緊耦合,任何微調都會影響整個模型性能。此外,外部策略調整(如應急接管邏輯)也更難融入端到端模型。綜合來看,模塊化設計在靈活性上占優,而高度集成的端到端模型需要付出更大代價才能適應變化。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
為什么中國突然大力整治“內卷”?這背后,藏著更大的戰略調整!

為什么中國突然大力整治“內卷”?這背后,藏著更大的戰略調整!

李昕言溫度空間
2025-06-24 15:06:51
張學友澳門開唱會被要求講普通話,手指腦袋回懟我不能講普通話

張學友澳門開唱會被要求講普通話,手指腦袋回懟我不能講普通話

界史
2025-06-24 14:33:30
剛剛大漲!熔斷!史詩級利好

剛剛大漲!熔斷!史詩級利好

業翔民安
2025-06-24 21:23:01
外媒:特朗普怒批以伊都違反停火協議,一度“爆粗”

外媒:特朗普怒批以伊都違反停火協議,一度“爆粗”

環球網資訊
2025-06-24 20:31:43
央視曝光!又一款陳年老酒暴雷,酒精勾兌、年份造假,溢價超40倍

央視曝光!又一款陳年老酒暴雷,酒精勾兌、年份造假,溢價超40倍

寒士之言本尊
2025-06-24 16:08:29
驚了!華人廚師娶泰國母女,過上一夫二妻的日子,靠的是這個特長!

驚了!華人廚師娶泰國母女,過上一夫二妻的日子,靠的是這個特長!

閑侃閑侃
2025-06-24 07:39:31
瓊海通報女生溺亡,拆掉的房門、最差的小孩,揭露多少家教隱痛?

瓊海通報女生溺亡,拆掉的房門、最差的小孩,揭露多少家教隱痛?

教育人看世界
2025-06-24 19:52:51
炸裂!北京男子自曝500萬娶坐臺小姐,婚后她死性不改,長得一般

炸裂!北京男子自曝500萬娶坐臺小姐,婚后她死性不改,長得一般

深析古今
2025-06-24 22:03:24
當地回應貴州一高架大橋垮塌!

當地回應貴州一高架大橋垮塌!

MC洋洋拍客
2025-06-24 11:57:11
已確認!中國首富換人

已確認!中國首富換人

深圳晚報
2025-06-24 19:21:39
4-4!世俱杯神劇情:4分鐘3球 四度落后 89分鐘絕平 歐洲豪門出局

4-4!世俱杯神劇情:4分鐘3球 四度落后 89分鐘絕平 歐洲豪門出局

狍子歪解體壇
2025-06-24 11:07:56
美伊涉停火說法不一:特朗普稱雙方同時“求和”,伊媒稱美總統“近乎乞求”德黑蘭停火

美伊涉停火說法不一:特朗普稱雙方同時“求和”,伊媒稱美總統“近乎乞求”德黑蘭停火

環球網資訊
2025-06-24 15:43:33
無張子宇第2敗!中國U19女籃丟絕平三分遭雙殺 無緣22分大逆轉

無張子宇第2敗!中國U19女籃丟絕平三分遭雙殺 無緣22分大逆轉

醉臥浮生
2025-06-24 21:26:10
別再逼孩子努力了!中高考再次證明:上了中學回頭看,父母最該狠抓這件事

別再逼孩子努力了!中高考再次證明:上了中學回頭看,父母最該狠抓這件事

十點讀書
2025-06-24 19:38:27
我們為啥要閱兵

我們為啥要閱兵

阿亮評論
2025-06-24 13:58:35
41歲程序員住車里3年,周末開600公里回家,被質疑蹭深圳公共資源

41歲程序員住車里3年,周末開600公里回家,被質疑蹭深圳公共資源

小人物看盡人間百態
2025-06-24 06:20:03
泰國柬埔寨沖突再升級,兩國到底在爭什么?

泰國柬埔寨沖突再升級,兩國到底在爭什么?

iWeekly周末畫報
2025-06-24 13:35:56
72歲“唐僧”開始賣房!和陳麗華33年感情成笑話,百億財產成空?

72歲“唐僧”開始賣房!和陳麗華33年感情成笑話,百億財產成空?

山河月明史
2025-06-24 16:12:58
央視曝光!4架外機迫近中方航母,殲15緊急升空,雙方都帶了實彈

央視曝光!4架外機迫近中方航母,殲15緊急升空,雙方都帶了實彈

掌青說歷史
2025-06-24 13:47:21
美國倉促宣布伊朗和以色列停戰的真正原因?

美國倉促宣布伊朗和以色列停戰的真正原因?

解筱文
2025-06-24 20:07:46
2025-06-25 05:31:00
智駕最前沿
智駕最前沿
自動駕駛領域專業的技術、資訊分享平臺。我們的slogan是:聚焦智能駕駛 ,緊盯行業前沿。
126文章數 12關注度
往期回顧 全部

科技要聞

從十輛到幾百萬輛,中間隔著什么?

頭條要聞

媒體:伊以停火"剛實施就破裂" 特朗普的憤怒不難想象

頭條要聞

媒體:伊以停火"剛實施就破裂" 特朗普的憤怒不難想象

體育要聞

如果你喜歡籃球,你沒理由不喜歡步行者

娛樂要聞

范瑋琪淘汰!全網熱議她的演唱失誤

財經要聞

6部門:支持居民就業增收 增強消費信心

汽車要聞

7.98萬起 firefly螢火蟲推出電池租用購車方案

態度原創

教育
游戲
時尚
親子
房產

教育要聞

河南高考錄取分數線新鮮出爐:歷史類本科批471分,物理類427分

戰術競技的頭牌大哥,一年就帶出日活 3700 萬的“摸金”排頭兵"/> 主站 商城 論壇 自運營 登錄 注冊 戰術競技的頭牌大哥,一年就帶出日活 370...

楊冪《醬園弄》封神!女囚角色成演技巔峰

親子要聞

人生第一個100分,當然要記錄啊

房產要聞

三亞頂豪!內部資料曝光!

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 图片| 时尚| 徐州市| 武山县| 秭归县| 桂阳县| 盱眙县| 科技| 台湾省| 香河县| 红安县| 德江县| 大埔县| 广灵县| 海阳市| 平舆县| 漠河县| 五常市| 大田县| 新化县| 蓬莱市| 饶河县| 东丰县| 射阳县| 汉阴县| 罗甸县| 资中县| 桐梓县| 自治县| 呼玛县| 伊金霍洛旗| 高邮市| 双鸭山市| 庄浪县| 修武县| 夏河县| 江口县| 东辽县| 刚察县| 大田县| 大同县|