自動駕駛技術通常被認為是通過于先進的傳感器(如雷達、激光雷達、攝像頭等)、人工智能算法以及控制系統,使車輛在無需人工干預的情況下自主完成駕駛任務的技術。2022年,在數據、算法、算力等數字基礎要素賦能之下,ChatGPT大語言模型以及Sora文生視頻模型的相繼發布成為AI創新的重大里程碑事件,引爆了人工智能領域的重大變化,并重塑了自動駕駛與汽車工業的代際發展。大語言模型、文生視頻模型等大模型技術與自動駕駛技術深度融合,促生了通用泛在、創造生成的端到端自動駕駛大模型技術快速發展。智能化已成為汽車工業技術變革的重要方向之一,成為未來汽車行業發展的新的方向。
2023年6月,上海人工智能實驗室提出的UniAD(Unified Autonomous Driving)獲CVPR 2023最佳論文,代表了學術領域對于端到端自動駕駛技術的重視與關注。2023年12月特斯拉發布FSD Beta V12.1,2024年3月特斯拉開始在北美地區大范圍推送FSD v12,該版全面升級端到端技術架構,可以實現從攝像頭數據輸入到最終決策控制信號的輸出,支持智能駕駛端到端的控制。特斯拉的發布加速推進了端到端自動駕駛技術在全球范圍內的商業化進程。國內以鴻蒙智行、小鵬、蔚來、理想和零一汽車為代表的主機廠以及華為、百度、元戎啟行、商湯絕影等為代表的智能駕駛技術公司紛紛投入端到端系統研發。此外,我國相繼出臺關于開展智能網聯汽車準入和上路通行試點工作的通知》《智能汽車創新發展戰略》等政策文件,支持L3級和L4級自動駕駛汽車的準入和上路試點。
可以說,隨著中國新能源汽車和智能汽車的不斷崛起,在國家及地方政策推動下,在學術與產業的積極參與下,端到端技術創新正在開啟新一輪的自動駕駛產業革命,端到端自動駕駛技術的科技創新正在推動產業創新進入新的發展階段。在此背景下,工信部電子知識產權中心基于歷年對人工智能、智能網聯汽車等領域專利技術的研究積累,從專利視角闡析端到端自動駕駛技術創新、生態重構的發展現狀、發展趨勢,以期支撐自動駕駛技術的高質量發展。
一、自動駕駛步入端到端技術創新發展的新階段
“端到端”源自人工智能領域有關“深度學習”這一概念,英文為“End-to-End(E2E)”,通常是指通過AI模型,輸入原始數據就可以直接輸出最終結果,而不需要中間其他步驟或人工設計。隨著深度學習等AI技術的快速發展,端到端技術應用到自動駕駛領域,即意味著整合傳統的感知、預測、規劃等多個模塊,實現端到端自動駕駛指的是從原始傳感器數據輸入直接到控制指令輸出的連續學習與決策過程,且過程中不涉及任何顯式的中間表示或人為設計的模塊。
在端到端技術出現之前,傳統的自動駕駛系統采用分治式架構,將自動駕駛任務拆分為感知、預測、規劃等多個模塊進行獨立的開發和管理。這樣雖然可以降低系統開發難度,便于解釋和追蹤設計問題,但也存在信息傳遞損耗、誤差累積影響安全、多任務多模型導致計算延時等諸多局限。
以ChatGPT為代表的生成式人工智能的飛躍發展,大型語言模型、視覺大模型(如世界模型)、以及多模態大模型等基礎模型不斷突破,大模型的泛在能力、推理能力持續增強,為自動駕駛智能進一步突破提供了潛在解決方案。相比傳統的“感知、決策、控制”智駕系統,由于中間沒有規則介入,端到端把原本感知、預測、規劃等多個模型組合的架構,變成了“感知決策一體化”的單模型架構,在信息傳遞、推理計算、模型迭代上更有優勢,可以擁有更強大的通用障礙物理解能力、超視距導航能力、道路結構理解能力,以及更擬人的路徑規劃能力。
二、端到端自動駕駛總體專利態勢
基于生成式AI對于端到端自動駕駛技術的創新推動作用,以及主要技術組成,制定專利檢索策略。在時間范圍選擇上,我們以Transformer論文發表的2017年1月1日為檢索起始時間,2024年12月31日為截止時間,構建檢索策略。在技術譜系構建上,主要圍繞數據輸入與感知技術、端到端模型架構、控制與執行技術、訓練與優化、車云協同,共5項端到端自動駕駛技術的主要技術分支進行專利檢索。
檢索中國端到端自動駕駛技術專利13320項(注:由于專利申請延遲公開、數據庫收錄滯后等原因,近兩年的圖示數據低于實際數據),其中授權專利5443項,處于在審狀態的專利6158項,授權和在審占比分別為40.9%和46.2%。
圖1 中國端到端自動駕駛技術專利申請趨勢
總體來看,2017年至2024年,伴隨大模型技術崛起,端到端自動駕駛技術展現了從創新積累到快速發展的創新趨勢。
創新起步期(2019年以前)
2019年以前,端到端自動駕駛技術處于初始探索階段,專利申請數量逐年穩步增長,2017年專利申請僅為441項,而2019年申請突破至1201項。在這一階段,感知端到端和決策規劃模型化技術是主流的創新方向。前者通過多傳感器融合技術(如BEV鳥瞰圖視角融合)實現感知模塊的端到端化,借以提升感知精度和穩定性;后者將預測、決策和規劃功能集成到同一個神經網絡中,但仍基于人類定義的接口進行模塊間的交互。全球有代表性的創新產品主要是:2016年,NVIDIA推出DAVE-2系統,通過卷積神經網絡(CNN)實現端到端自動駕駛,直接從攝像頭圖像輸出轉向控制;2017年,特斯拉推出Autopilot 2.0,標志著端到端自動駕駛技術的商業化嘗試。國內在2019年,百度Apollo平臺發布端到端的自動駕駛解決方案,促進了相關技術的快速發展。
在這一階段,2017年4月工信部、發改委、科技部聯合發布《汽車產業中長期發展規劃》加大智能網聯汽車關鍵技術攻關,重點開展環境感知、智能決策、協同控制等核心關鍵技術攻關。2018年12月工信部發布《車聯網(智能網聯汽車)產業發展行動計劃》明確提出2020年要實現車聯網用戶滲透率達到30%以上,新車駕駛輔助系統(L2)搭載率達到30%以上,聯網車載信息服務終端的新車裝配率達到60%以上。2019年9月,中共中央、國務院聯合發布《交通強國建設綱要》提出在交通裝備方面要加強加強智能網聯汽車(智能汽車、自動駕駛、車路協同)研發,形成自主可控完整的產業鏈。系列政策與舉措的出臺,加速了感知、決策和控制等端到端自動駕駛關鍵領域的技術創新步伐,推動了產業應用發展。
快速發展期(2020年至2024年)
這一階段端到端自動駕駛技術專利申請數量大幅增加,技術進入快速發展和應用階段。2023年專利申請達到2598項,達到目前申請量峰值。這一階段的突出標志是,Transformer等大模型技術的引入,提升了自動駕駛系統的泛化能力和復雜場景處理能力,推動了端到端駕駛技術的創新升級。而這一時期,國家政策從技術研發、測試環境建設、商業化試點、基礎設施建設、技術標準化等多個方面,系統推進了端到端自動駕駛技術的創新和產業應用,為自動駕駛技術的發展提供了堅實的政策支持和良好的產業環境。2023年,國家發布《關于開展智能網聯汽車準入和上路通行試點工作的通知》,支持有條件自動駕駛(L3)和高度自動駕駛(L4)車輛的上路通行試點;發布《國家車聯網產業標準體系建設指南(智能網聯汽車)(2023版)》明確了智能網聯汽車的標準體系,推動了技術的標準化和產業化發展。2024年發布《汽車整車信息安全技術要求》,作為國內智能網聯汽車領域的首批強制性國家標準,提升了自動駕駛系統的安全性;發布《關于開展智能網聯汽車“車路云一體化”應用試點工作的通知》推動智能化路側基礎設施和云控基礎平臺建設等。通過強制性國家標準,推動自動駕駛技術的標準化和安全性提升,為技術的廣泛應用奠定了基礎。
這一階段的代表性創新方向主要有:
1.模塊化端到端技術快速發展。該技術是通過感知模塊輸出特征向量,決策規劃模塊基于特征向量進行運動規劃,支持跨模塊的梯度傳導訓練。例如,蘿卜快跑在2024年風靡一時,并在武漢、北京、上海等多個城市開展商業化運營。蘿卜快跑是百度旗下自動駕駛出行服務平臺,截至2024年10月其累計提供的自動駕駛出行服務訂單已超過800萬單。蘿卜快跑的成功運營為自動駕駛技術的商業化落地提供了示范,推動了行業從技術研發向規?;瘧玫霓D變。從技術端看,蘿卜快跑采用了百度的Apollo ADFM(Autonomous Driving Foundation Model)大模型,該模型將感知、決策、規劃等模塊整合在一個神經網絡中,通過聯合訓練實現感知端和決策端無人駕駛。此外,商湯科技于2022年推出UniAD(Unified Autonomous Driving Model),實現感知與決策的一體化,獲得CVPR 2023最佳論文。小鵬汽車開發并部署了基于BEV感知架構的XNet系統,顯著提升了復雜場景的端到端自動駕駛能力。
2.One Model端到端技術出現。One Model端到端技術即采用單一深度學習模型,直接從原始傳感器數據生成控制指令,實現全局優化和高效信息傳遞。例如,理想汽車和清華大學于2024年智能駕駛夏季發布會上,首次公開了OneModel端到端+VLM智駕系統,其架構主要由端到端模型、VLM視覺語言模型、世界模型三部分共同構成,具備全場景端到端能力,并首創AI推理可視化功能。
三、端到端自動駕駛技術分布態勢
通過對專利數據進行聚類分析,從而研判端到端自動駕駛技術專利的專利布局和發展態勢。
圖2 中國端到端自動駕駛技術專利聚類分析
根據對主要IPC小組歸類,模型技術專利的IPC布局主要集中在機器學習、神經網絡、傳感器融合、路徑規劃、交通檢測等關鍵技術分支,表明端到端自動駕駛是一個高度跨學科的領域,需要多種技術的協同發展。其技術專利重點布局在以下三個領域:
1.以機器學習和神經網絡為核心的技術分支是布局數量最多的領域。專利數量最多的分類號集中在機器學習和神經網絡領域(如G06N3/08、G06V10/82、G06N3/0464等)。機器學習(尤其是深度學習)是端到端自動駕駛的核心技術,用于感知、決策和控制的端到端優化。例如,強化學習(G06N3/092)用于復雜場景下的決策優化;卷積神經網絡(G06N3/0464)用于圖像和視頻數據的感知任務;自動編碼器與編碼器-解碼器網絡(G06N3/0455)用于特征提取和數據壓縮。上述領域的重點研發與專利布局,說明了這些技術是端到端自動駕駛的核心驅動力。
2.多模態感知與傳感器融合技術占比較高。涉及傳感器融合、多模態數據處理的專利數量較多,例如多模態數據融合(G06V10/80)主要是在傳感器級別、特征級別或決策級別進行數據融合,當前在該領域布局專利516項;G06V20/58主要是用于檢測車輛、行人、交通標志等動態目標,當前布局專利473項;G06V10/44主要是通過邊緣檢測、輪廓分析等技術提取關鍵特征,當前布局專利264項。在上述技術分支布局了較多的技術專利,說明其對實現端到端自動駕駛效能,提升感知精度和魯棒性具有關鍵作用。
3.路徑規劃與控制技術逐步成熟。根據專利數據,與路徑規劃(G01C21/34)和車輛控制(B60W60/00)相關的專利數量較多,例如G01C21/34主要是路徑搜索,用于生成最優行駛路徑,布局專利341項;B60W60/00主要用于實現車輛的自主驅動和控制,布局專利1024項、B60W30/095主要用于預測潛在碰撞并采取避障措施,布局專利175項,說明上述技術分支對于自動駕駛的重要價值。
此外,交通檢測與環境感知技術分支也布局了較多專利,如G08G1/01(交通檢測,986項)、G06V20/56(車輛外觀識別,456項)、G08G1/08(車輛數或速度檢測,183項)等。
進一步對專利IPC申請趨勢分析,如下表所示:
表1 主要IPC小組分類號申請趨勢分析
IPC分類號
2017
2018
2019
2020
2021
2022
2023
2024
G06N3/08
21
29
93
208
296
328
295
195
G06V10/82
2
11
35
76
122
245
342
293
B60W60/00
0
3
17
63
148
283
253
262
G08G1/01
16
45
64
122
147
185
214
195
G06N3/0464
0
3
26
63
87
117
352
319
G06V10/764
4
17
22
43
59
137
178
149
G05D1/02
41
73
108
70
68
120
102
0
G06N3/092
0
1
1
19
22
71
158
251
G06V10/80
1
2
12
15
36
99
181
171
G06N3/0442
0
3
7
22
31
59
182
181
G06V20/58
3
14
23
52
56
125
99
103
G06V10/774
2
7
12
30
64
129
141
80
G06V20/56
1
6
23
48
40
114
115
109
G06F30/27
0
5
5
41
83
88
102
115
G01C21/34
10
22
37
39
29
60
82
62
G06N3/0455
0
0
3
8
10
27
114
168
G06N3/084
1
0
5
16
27
38
90
130
G06N20/00
5
5
15
24
53
68
72
57
G05B13/04
12
12
14
27
25
46
64
68
G06V10/44
0
2
10
17
24
38
81
93
H04L67/12
1
2
6
24
31
71
55
67
G06F18/214
1
0
4
7
15
30
94
88
G08G1/08
7
7
19
20
32
32
37
30
G06F18/25
1
1
2
2
6
22
51
96
B60W30/095
6
4
16
19
20
40
33
38
G06V10/74
3
6
22
53
51
58
71
63
B60W20/11
2
2
4
18
19
28
36
31
G06V20/52
0
1
4
24
15
20
22
22
G06N3/096
0
1
0
0
5
11
32
53
G06N3/0499
0
0
1
5
9
7
33
47
根據專利數據,端到端自動駕駛領域的專利申請趨勢主要有如下特征:
1.機器學習與神經網絡領域。G06N3/08(學習方法)專利申請量從2017年的21項增長到2022年的328項,2023年和2024年略有下降,但仍保持高位(295項和195項)。這表明學習方法在自動駕駛中的應用經歷了快速增長。G06N3/0464(卷積網絡)專利申請量從2017年的空白增長到2023年的352項,2024年略有下降(319項)。卷積網絡在圖像和視頻數據處理中的應用持續增長,是感知技術的核心。
2感知技術領域。G06V10/82(使用神經網絡)專利申請量從2017年的2項增長到2023年的342項,2024年略有下降(293項)。這表明基于神經網絡的感知技術在自動駕駛中的應用經歷了快速增長。G06V20/58(移動物體識別)專利申請量從2017年的3項增長到2022年的125項,2023年和2024年保持穩定(99項和103項)。移動物體識別技術在復雜環境中的應用逐漸成熟。
3.路徑規劃與控制領域。B60W60/00(車輛控制)專利申請量從2017年的空白增長到2022年的283項,2023年和2024年保持高位(253項和262項)。這表明車輛控制技術在自動駕駛中的應用經歷了快速增長。G01C21/34(路徑搜索)專利申請量從2017年的10項增長到2023年的82項,2024年略有下降(62項),說明該技術在自動駕駛中的應用正逐漸成熟。
4.其他關鍵技術。例如G06N3/092(強化學習)、G06V10/80(多模態融合)兩項技術分支的專利申請量強勁增長,表明強化學習在復雜決策場景中的應用正逐漸受到重視,特別是多模態融合技術在提升感知精度方面的應用正快速發展,逐漸成熟。
綜合來看,端到端自動駕駛技術的專利布局呈現出以下特征:機器學習和神經網絡是當前驅動自動駕駛技術發展的核心,多模態感知、路徑規劃、車輛控制和交通檢測等技術分支緊密關聯,形成了一個完整的技術鏈條,是當前研發的重點。一是感知、決策、控制三大環節緊密銜接。感知端,通過多模態感知技術(G06V10/80、G06V20/58)獲取環境信息;決策端,基于機器學習(G06N3/08)和強化學習(G06N3/092)進行路徑規劃和行為決策;控制端,通過車輛控制系統(B60W60/00)實現具體的駕駛操作。二是數據融合、特征提取和模型訓練相互支撐。數據融合技術將多傳感器數據(G06V10/80)進行融合,提升感知精度,特征提取技術通過卷積網絡(G06N3/0464)和局部特征提取技術(G06V10/44)提取關鍵特征,模型訓練技術利用生成訓練模式(G06V10/774)和強化學習(G06N3/092)優化模型性能。
四、端到端自動駕駛創新主體態勢
檢索端到端自動駕駛技術領域企業及高校類創新主體,專利申請數量如下表所示:
表2 中國端到端自動駕駛領域主要創新主體專利申請數量(企業)
序號
申請人
專利申請數量
1
百度(阿波羅)
744
2
267
3
華為
213
4
中國一汽
196
5
東風集團(嵐圖)
188
6
小鵬
153
7
蔚來
142
8
商湯
139
9
浙江吉利(極氪)
124
10
上汽集團
107
11
廣汽集團
81
12
賽力斯
69
13
小米汽車
68
14
通用
61
15
本田
56
16
比亞迪
52
17
元戎啟行
50
18
奇瑞
49
19
豐田
47
20
理想(新石器慧通)
36
表3 中國端到端自動駕駛領域主要創新主體專利申請數量(高校)
序號
申請人
專利申請數量
1
吉林大學
249
2
同濟大學
195
3
北京理工大學
187
4
清華大學
182
5
東南大學
177
6
江蘇大學
152
7
重慶大學
133
8
南京航空航天大學
123
9
北京航空航天大學
99
10
武漢理工大學
93
根據創新主體在端到端自動駕駛領域的專利申請數量檢索結果,當前形成傳統車企、新勢力廠商和智能駕駛方案供應商“三足鼎立”相互融合的發展模式。傳統車企普遍采用“自研+供應商合作+高校聯合開發”模式,積極通過戰略投資、聯合研發深度合作智能駕駛供應商,孵化自有技術公司。例如,長安、廣汽推動自研體系與華為技術融合,長安與華為在自動駕駛領域協同合作阿維塔品牌;上汽集團與同濟大學聯合研發《自動駕駛汽車虛實融合測評關鍵技術與系列裝備》并獲2023年度上海市技術發明獎一等獎;廣汽集團與騰訊、滴滴、科大訊飛等聯合推進智能生態合作,積極開發自動駕駛技術等。此外,如百度、華為、商湯、元戎啟行等智能駕駛方案供應商依托其在人工智能大模型領域的深厚積累,成為自動駕駛端到端技術創新的重要力量。
本研究旨在從專利視角,探索分析端到端自動駕駛技術的創新發展態勢,歡迎學術探討或提出寶貴意見(作者聯系電話:010-88685828)。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.