編輯:Mark
出品:紅色星際(ID:redplanx)
頭圖:毫末智行四位創(chuàng)始人圖片
毫末智行為什么最有可能成為中國第一個踏入自動駕駛3.0時代的公司?
1. 毫末的“勇氣”:“以終為始”選擇技術路線
在最近的一次毫末智行技術分享會上,一個朋友問道,“僅僅三年的發(fā)展,是什么因素促使毫末成為中國量產(chǎn)自動駕駛公司的第一名?”
技術分享人思考了片刻,答道,如果用一個詞總結,就是“勇氣”。這個詞可能說起來比較簡單,但對我們的挑戰(zhàn)很大,特別是幾位老板壓力很大。老板最大的壓力是量產(chǎn)交付,是商業(yè),我們作為技術人員雖然也會受到挑戰(zhàn),但相對而言,主要是在技術上和自己較勁。
自毫末成立之后,整個公司逐漸地將高效的數(shù)據(jù)閉環(huán)作為首要任務,先把數(shù)據(jù)能力建立起來,然后再考慮盈利的問題。
如果你一開始就做小模型,或者使用高精地圖,在城市中面對一些特殊的場景,可能很快就能上車,但是這不符合終局思想。毫末選擇了一條“以終為始”的道路,從大模型出發(fā),站在以終為始的角度,思考最終的技術架構到底是什么。
這個可能和毫末智行的管理團隊有關,管理團隊并不想把毫末做成一個短期利益公司,而是從終局的角度考慮公司的技術架構和商業(yè)模式,大家都是想做成一個真正的對這個社會有價值的公司。
于是毫末在2021年12月,基于國際最先進的AI技術理念發(fā)布了國內(nèi)首個自動駕駛數(shù)據(jù)智能體系MANA,目前階段,這個基于大數(shù)據(jù)驅(qū)動的智能體系已基本搭建完畢。
(毫末智行數(shù)據(jù)智能體系MANA)
截止到2022年9月,毫末MANA體系學習時長已經(jīng)超過31萬小時,虛擬駕齡相當于人類司機4萬年。在數(shù)據(jù)積累方面已經(jīng)完成數(shù)十萬全要素、多模態(tài)CLIPS 的標注。在場景庫積累方面,已經(jīng)建設完成300 萬小時中國道路駕駛認知場景庫。
這個也可以解釋,為什么毫末在短短3年時間,就得到了投資人的認可,躋身自動駕駛獨角獸公司,相信投資人更懂這個團隊。
在傳統(tǒng)計算機視覺領域的二維信息的處理上,CNN是絕對的主流選擇,但是CNN最大的問題是面對巨量數(shù)據(jù)時有很大局限性,而基于Attention機制的Transfomer大模型,在處理海量數(shù)據(jù)和復雜場景方面優(yōu)勢更明顯。
所以毫末整個技術團隊,從2021年7月開始就啟動了對Transformer的研究和落地嘗試,因為它非常適合于多模態(tài)數(shù)據(jù)處理,特別是大數(shù)據(jù)的處理。
經(jīng)過一年多的時間,毫末完成了訓練平臺的改造升級,完成了數(shù)據(jù)規(guī)格和標注方法的切換準備,完成了針對感知、認知具體任務的模型細節(jié)探索,終于應用在毫末城市NOH功能中。
并在今年8月份的成都車展,毫末智行聯(lián)合魏牌摩卡、高通聯(lián)合推出了中國第一個量產(chǎn)的城市導航輔助駕駛,這套最新的智能駕駛系統(tǒng)HPilot3.0已經(jīng)搭載在魏牌摩卡DHT-PHEV激光雷達版上,將于今年9月底量產(chǎn),年內(nèi)交付使用,相信大家應該能很快感受到這套系統(tǒng)的威力了。
毫不客氣地說,毫末是中國第一個大規(guī)模投入基于Attention機制的Transfomer大模型架構的公司,這個架構不僅為毫末在各條自動駕駛產(chǎn)品線上的視覺算法落地帶來成倍的效率提升,還可以大幅提升后續(xù)的規(guī)劃和控制等相關技術,最后可以使駕駛行為像老司機一樣,順滑舒適。
單純從模型結構來看,Attention機制最大的特點就是結構簡潔,可以無限堆疊基本單元得到巨大參數(shù)模型。而且多方數(shù)據(jù)顯示,隨著數(shù)據(jù)參數(shù)量的增加和訓練方法的提升,Attention大模型很多方面的人工智能水平都超過了人類。
(AI模型發(fā)展變化圖片)
對于一般的公司而言,我相信他們在面對量產(chǎn)交付和新的技術架構選擇方面,肯定會猶猶豫豫,或者說并沒有毫末這么有勇氣(因為毫末堅持“以終為始”選擇技術路線)。
當然,新架構雖然好,但是也會帶來一系列的問題,我們稱之為,牽一發(fā)而動全身。一般Transformer所需算力是CNN的100 倍,但是存在很大的算力浪費,平均6.9%的算力貢獻了94%的價值,很多弱關聯(lián)、低價值的運算產(chǎn)生了很多浪費。
而且,基于Attention的大模型對算力的需求遠遠超出了摩爾定律,這導致大模型的訓練成本非常高、落地很難、尤其是在終端設備上的落地尤其困難。
如何改進車端模型和芯片的設計,實現(xiàn)大模型的車端落地;如何通過低碳超算平臺,降低自動駕駛成本,這些都變成了新的課題。
在大模型時代,巨量的模型參數(shù)給模型訓練帶來很大的難度。在當前主流配置的服務器上,用數(shù)據(jù)并行方式訓練所花的時間是近百個小時。所以毫末正在通過建設低碳超算中心來降低自動駕駛成本,通過改進車端模型和芯片的設計來實現(xiàn)大模型的車端落地,通過數(shù)據(jù)的組織讓大模型發(fā)揮更大效力。對于低碳超算中心,毫末的目標是滿足千億參數(shù)大模型,訓練數(shù)據(jù)規(guī)模100萬clips,整體訓練成本降低200倍。
之所以毫末選擇不斷地折磨自己,主要是和公司的戰(zhàn)略有關,毫末在很早的時候,管理團隊就認為,在選擇技術路線時,一定要以第一性原理作為判斷基礎,能將數(shù)據(jù)規(guī)模優(yōu)勢快速轉(zhuǎn)化為能力優(yōu)勢的技術路線就是好路線,否則我們就重新推倒,再構建一套數(shù)據(jù)系統(tǒng)。
正是由于毫末智行團隊的堅持和持續(xù)攻堅,毫末在自動駕駛量產(chǎn)方面,穩(wěn)居中國第一。
而且隨著測試的深入,數(shù)據(jù)的累積,毫末發(fā)現(xiàn)當初自己的決定越來越正確。過去用的分場景小模型方法漸漸顯露弊端,有的時候運動起來太機械,舒適感不足;有時候太依賴一些傳感器,導致成本降不下來。
特別是高精地圖的使用,毫末認為它也是一個傳感器,一個很重要的傳感器,雖然在某些場景這個傳感器很管用,但是因為成本和更新的問題,高精地圖的置信度并不能得到保證,你永遠不知道什么時候什么地方它就會失效。
所以毫末成為中國第一個在大規(guī)模量產(chǎn)城市NOH時,提出“重感知、輕地圖、大算力”的技術路線,擺脫高精地圖這個不確定的傳感器。
不過話說回來,所有的這些選擇都和毫末公司的戰(zhàn)略有關。如果大家關注過毫末的成長歷程,就會發(fā)現(xiàn),毫末在感知、認知、模式建設上,都是按照數(shù)據(jù)驅(qū)動的方式建設的,這就是毫末穩(wěn)當中國量產(chǎn)自動駕駛公司第一的法寶。
2. 戰(zhàn)略思想指導,堅定走漸進式路線
對于毫末智行而言,先進的技術是底層框架,優(yōu)秀的工程化能力是執(zhí)行層,而公司戰(zhàn)略則是整個架構的大腦。
公司從成立之初,毫末就確定了走漸進性線路的戰(zhàn)略思想。一直以來,自動駕駛行業(yè)都有“漸進式”和“躍進式”的路線之爭。毫末認為,漸進式發(fā)展路線可以以更低的成本來獲得更大規(guī)模、更多場景覆蓋的優(yōu)質(zhì)數(shù)據(jù),會成為推動人類實現(xiàn)自動駕駛的最佳路徑。
在公司堅定走漸進性戰(zhàn)略的指導下,毫末智行通過研究數(shù)據(jù)驅(qū)動的各個環(huán)節(jié),于2021年9月,提出了毫末制勝法則:毫末制勝法則=(數(shù)據(jù)智能*全面安全*穩(wěn)定量產(chǎn))^生態(tài),它也成了公司最高的指導思想。
(毫末智行制勝公式)
在這個思想下,毫末始終將安全作為自動駕駛的底線,不斷地擴展自己的生態(tài)合作,在乘用車自動駕駛領域,毫末將繼續(xù)堅持“6P 開放合作原則”,與客戶伙伴進行各種類型開放式的合作探索,持續(xù)賦能行業(yè)伙伴;在末端物流自動配送領域,毫末正通過“5S 服務體系”,與客戶伙伴一起,共同推動末端物流自動配送車規(guī)模化商用的行業(yè)進程。
關于漸進性路線,董事長張凱把它分為三個階段:第一個階段是自動駕駛能力的實現(xiàn),這個階段,大多數(shù)在自動駕駛這個賽道創(chuàng)業(yè)的公司都已經(jīng)實現(xiàn)了。
第二個階段是自動駕駛系統(tǒng)的規(guī)模化部署。只有將自動駕駛系統(tǒng)大規(guī)模的部署到車上,投入市場,才能弄清楚市場真正的需求,才能驗證產(chǎn)品的市場競爭力。
2022年,對于一個在自動駕駛賽道創(chuàng)業(yè)的公司而言,如果沒能夠解決自動駕駛規(guī)?;渴饐栴},將是一件非常致命的事。而橫亙在Demo與規(guī)模化部署之間的一道障礙,就是技術的工程化能力。
目前很多公司大量的時間和精力要花費在解決技術工程化的問題。用毫末管理層的講話,我們接觸自動駕駛之后深刻感覺到,只有多工種協(xié)同才能夠做好這件事情。有的做域控制器,有的做車輛適配,有的搞軟件,對于毫末而言,因為自身團隊的多元化特性,天生就具備這種能力。毫末的研發(fā)團隊匯集了眾多十年以上經(jīng)驗汽車研發(fā)高級工程師,同時得到長城汽車開放的所有的車型平臺和零部件資源支持,技術工程化能力自毫末成立以來,就像血液一樣流淌在身體里。
通過團隊基因和MANA體系的加持,毫末智行內(nèi)部已經(jīng)形成一整套高效的智能駕駛產(chǎn)品開發(fā)流程。目前,云端工程化基本搭建完成,車端工程化也已經(jīng)在大規(guī)模落地,截至目前,毫末已推出三代乘用車輔助駕駛產(chǎn)品HPilot,兩年6 次OTA 升級,實現(xiàn)搭載超過十款乘用車型量產(chǎn)落地,同時并行30 個項目異步開發(fā)。
目前正在陸續(xù)交付中的車型有摩卡DHT-PHEV 激光雷達版、歐拉閃電貓、歐拉芭蕾貓、全新一代長城炮等。截止到2022年9月,毫末用戶輔助駕駛行駛里程突破1700萬公里,位列中國自動駕駛公司第一名。截止到2022年底,HPilot預計搭載車型近30款,未來搭載車型達到百萬量級。
(毫末智行產(chǎn)品落地圖片)
第三個階段是自動駕駛能力的逐步完善。這個階段,數(shù)據(jù)積累的成本和質(zhì)量直接決定這個過程的周期。
通過大規(guī)模的自然語言領域的應用實踐,毫末發(fā)現(xiàn)數(shù)據(jù)規(guī)模不但要足夠大,數(shù)據(jù)的多樣性也要足夠充分,各種傳感器的數(shù)據(jù),包括不同類型、不同像素、不同角度對于大模型訓練都有非常大的價值,包括毫末末端物流自動配送車的運行數(shù)據(jù)。
2022年4月,毫末推出了行業(yè)首款十萬元級末端物流自動配送車“毫末小魔駝2.0”,正在面向商超、物流行業(yè)客戶,提供穩(wěn)定、高效地無人化投遞服務。截至2022 年9 月,小魔駝訂單量已突破9萬單,切實推進了末端物流自動配送車規(guī)模化商用的行業(yè)進程。
毫末預計無人配送行業(yè)將在2023年,2024年之間迎來爆發(fā)。目前階段,“毫末小魔駝2.0”已經(jīng)具備L4級自動駕駛、遠程駕駛、低成本部署、車輛管理平臺、遠程監(jiān)控平臺、訂單管理平臺、微信小程序等七大核心功能,在業(yè)界處于領先水平。
結合海量數(shù)據(jù)和實踐,無論從數(shù)據(jù)成本還是數(shù)據(jù)量的處理上,數(shù)據(jù)智能體系MANA正在發(fā)揮決定性作用,特別是現(xiàn)在很多公司都走上了這條路,側(cè)面也說明毫末的道路是正確的,這也是為什么毫末能做到中國量產(chǎn)自動駕駛公司第一很重要的一個原因。
在毫末制勝法則的指引下,MANA數(shù)據(jù)智能體系和強悍的工程化能力雙管齊下,毫末在大規(guī)模、多車型自動駕駛量產(chǎn)戰(zhàn)役,末端物流自動配送車技術成本戰(zhàn)役,大規(guī)模數(shù)據(jù)處理及大模型應用戰(zhàn)役都取得了突破性的進展。
3. 如何打贏自動駕駛3.0時代
何為自動駕駛3.0時代?用毫末智行CEO顧維灝的說法,自動駕駛分為3個階段:
自動駕駛1.0 時代主要是硬件驅(qū)動。硬件數(shù)量決定能力高低,自動駕駛車輛依靠激光雷達等硬件進行“全副武裝”,整車成本高、數(shù)量少、技術效果一般,自動駕駛里程僅在100 萬公里左右。
自動駕駛2.0時代主要是軟件驅(qū)動。AI 技術,大算力計算芯片亮相,車規(guī)級傳感器個數(shù)在快速增加,整車成本下降、效果提升,自動駕駛里程快速增加至上千萬公里。
但這個時代還是寫規(guī)則的階段,我們現(xiàn)在正處于第二和第三階段之間。
自動駕駛3.0時代是真正的數(shù)據(jù)驅(qū)動。大模型+海量數(shù)據(jù)“雙劍合璧”,數(shù)據(jù)開啟自訓練模式,自動駕駛里程飆升至1 億公里以上。
這個階段以數(shù)據(jù)的自訓練為主,我們所做的一切,都是為了能夠做出數(shù)據(jù)通道和計算中心,以便可以更高效的獲取數(shù)據(jù),并把數(shù)據(jù)轉(zhuǎn)化為知識。
(自動駕駛發(fā)展的3個階段)
自動駕駛3.0時代,我們擺脫了寫規(guī)則的年代,數(shù)據(jù)真正成為驅(qū)動自動駕駛能力的核心。為此毫末結合自身的發(fā)展,制定了毫末智能駕駛產(chǎn)品能力迭代鐵三角:“場景化用戶體驗設計、AI 人工智能技術、技術工程化能力”。
首先是場景化用戶體驗設計,這個是入口,是產(chǎn)生數(shù)據(jù)的第一步。
張凱表示:“如果用戶一開始就不喜歡用,認為輔助駕駛不好用,那我們就連學習的機會都沒有,更不要說形成數(shù)據(jù)閉環(huán),持續(xù)迭代產(chǎn)品能力了。因此,持續(xù)優(yōu)化的用戶體驗是自動駕駛商業(yè)化落地的重中之重,也可以說漸進式發(fā)展路線的關鍵環(huán)節(jié)就是用戶體驗。”
在場景化用戶體驗設計方面,毫末有大量的用戶交互體驗和產(chǎn)品開發(fā)的一體化設計經(jīng)驗,并在2年時間里完成了6次產(chǎn)品OTA 升級。同時通過將感性的用戶體驗細化成為可衡量的指標,在各個細化的成本上不斷做功。
為了提高用戶體驗,毫末此次又點亮了城市NOH六大功能,包括智能識別交通燈、智能左右轉(zhuǎn)、智能躲避障礙物、智能變道和基于真實世界的智慧交通流處理。
為此,毫末聯(lián)合阿里云、浙江德清發(fā)布了“中國首個基于車路協(xié)同云服務的大規(guī)模自動駕駛場景庫”,這是中國第一個使用真實交通數(shù)據(jù)生成的自動駕駛場景庫,讓自動駕駛更像人類的駕駛方式。
其次,人工智能技術是靈魂,只有擁有支持大規(guī)模數(shù)據(jù)的處理能力,自動駕駛才能真正進入自我循環(huán),自我迭代階段。
毫末過去近2年打造的基于自動駕駛的數(shù)據(jù)智能體系MANA,就是在為此做準備,通過超算中心的建設,真正的讓數(shù)據(jù)在大模型中完成自我訓練和系統(tǒng)迭代升級。
過去我們都是用傳感器感知和算法預測周圍交通參與者的意圖,當我們進入城市環(huán)境,發(fā)現(xiàn)交通參與者的活動變得更復雜了,預測的難度也更大了。此時如果每個傳感器都獨自工作,用一些小模型來做預測,顯然是不能適應更復雜的城市交通的。
所以需要從大架構出發(fā),在BEV 框架下的3D 空間重建一致性目標。和一般的Mask重建圖片或者視頻的訓練目標相比,這種基于3D空間一致性的自監(jiān)督訓練能夠更有效迫使模型理解道路場景的三維結構,從而更好的適應自動駕駛的各種感知任務需求。
最后,技術工程化能力是保障。
目前,毫末智行在過去的兩年時間里,實現(xiàn)10余款不同平臺車輛量產(chǎn)落地,成為國內(nèi)智能駕駛技術落地經(jīng)驗最豐富的公司,也是中國唯一一個具備異步并行開發(fā)超過30 個智能駕駛項目能力的公司。
(毫末智行智能駕駛產(chǎn)品能力迭代鐵三角)
有入口、有靈魂、有保障,智能駕駛的產(chǎn)品能力才能夠快速迭代。毫末判斷,全球自動駕駛正在進入以特斯拉為代表的,數(shù)據(jù)驅(qū)動為核心的自動駕駛3.0時代,隨著思想鋼印和MANA能力的進化,加上獨有的智能駕駛產(chǎn)品能力迭代鐵三角,讓毫末最有可能成為中國第一個進入自動駕駛3.0時代的自動駕駛公司。
面對即將到來的3.0時代,毫末已經(jīng)在幾個核心難點上,包括數(shù)據(jù)處理成本,數(shù)據(jù)效率,大模型架構,自動駕駛可解釋性和仿真等幾方面更新了MANA體系。
在數(shù)據(jù)處理過程中,樣本標注是一個時間成本和金錢成本都很高的環(huán)節(jié)。MANA通過使用大規(guī)模量產(chǎn)車無標注數(shù)據(jù)的自監(jiān)督學習方法打造模型效果,相比只用少量標注樣本訓練,訓練效果提升3 倍以上,可以讓數(shù)據(jù)優(yōu)勢快速高效轉(zhuǎn)化為模型效果。
同時為了應對巨大數(shù)據(jù)規(guī)模下的“數(shù)據(jù)效率”難題,MANA構建了增量式學習訓練平臺,抽取部分存量數(shù)據(jù)加上新數(shù)據(jù)組合成一個混合數(shù)據(jù)集。相比常規(guī)做法,整體算力節(jié)省80%,響應速度提升6 倍。
面對高精地圖覆蓋范圍小的問題,MANA建立強感知的時空理解能力,通過使用時序的Transformer模型在BEV 空間上做了虛擬實時建圖,讓感知車道線的輸出更加準確和穩(wěn)定,可以在不依賴業(yè)界常用的高精地圖的情況下,只依靠普通導航地圖就可以準確感知道路環(huán)境。
自動駕駛算法可解釋性也一直是個難點,毫末基于典型場景挖掘海量司機的實際駕駛行為,構建Task Prompt,訓練一個基于時空Attention的駕駛決策預訓練大模型,使得自動駕駛決策更像人類實際駕駛行為,以保證實現(xiàn)自動駕駛決策的可控、可解釋。
為了解決仿真不夠真的問題,MANA在仿真系統(tǒng)中引入了高價值的真實交通流場景,與阿里、德清政府合作,將路口這一城市最復雜場景引入仿真引擎,構建自動駕駛場景庫,通過自動駕駛的真實仿真驗證,快速提升自動駕駛系統(tǒng)的城市路口通過能力。
目前毫末的三大戰(zhàn)役已經(jīng)到了決戰(zhàn)時刻,而先前的準備工作都已經(jīng)做完,無論是大規(guī)模數(shù)據(jù)處理及大模型應用戰(zhàn)役,還是大規(guī)模、多車型自動駕駛量產(chǎn)戰(zhàn)役,末端物流自動配送車技術成本戰(zhàn)役,毫末都已經(jīng)萬事具備,只等未來1-2年時間,毫末將他們?nèi)孟?,成為中國自動駕駛行業(yè)的領頭羊。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.