作者:張葉子
編輯:Mark
出品:紅色星際(ID:redplanx)
頭圖:自動駕駛數(shù)據(jù)智能體系 “MANA(雪湖)”
12月24日,毫末發(fā)布Q4最新進展,其中的亮點是:
——A輪融資近10億,晉升獨角獸俱樂部;
——在乘用車方向,這個季度增加了三款車型,瑪奇朵、拿鐵、哈弗神獸,至此,毫末成立2年的時間里,搭載毫末產(chǎn)品的乘用車車型達到5款;
——小魔盒輔助駕駛里程已經(jīng)突破400萬公里,再次刷新前一季度的百萬里程成績單;
——發(fā)布數(shù)據(jù)智能系統(tǒng)MANA,真正意義上完成智能數(shù)據(jù)的閉環(huán),城市NOH 34分鐘無接管“一鏡到底”曝光。
毫末常規(guī)的技術(shù)日也和特斯拉一樣,改名為AI DAY,顯示了自己在人工智能和自動駕駛方面的雄心,實力能否撐得起雄心,我們以Q4最新發(fā)布為線頭來具體扒一扒。
1. 數(shù)據(jù)智能系統(tǒng)“MANA(雪湖)”
冬天是適合思考的季節(jié)。
在三體中,羅輯被選為面壁人之后,遁世到一片只有森林、雪山、湖泊、木屋、壁爐、紅酒的世外桃源,在那里,它和莊嚴(yán)度過了夢幻的五年。
五年之后,當(dāng)所有面壁者都被破壁之后,莊嚴(yán)和孩子被“人質(zhì)”,羅輯不得不直面人類危機,寒冬深夜,羅輯一人在結(jié)冰的湖面上散步,掉入冰窟,窒息中,他看到旋轉(zhuǎn)的黑暗星空,頓悟宇宙社會學(xué)真相,總結(jié)出黑暗森林法則,發(fā)出恒星咒語,為地球人扳回一局。
這個湖是天才思想、戰(zhàn)略轉(zhuǎn)機橫空出世的地方,然而在三體中,這是一個沒有名字的地方,因為女神莊嚴(yán)的一句話,不需要知道它在世界上的具體地點,知道了,感覺離世俗的距離就近了。
在中國西藏,有這樣一個地方,叫Mana(雪湖)。毫末用這個名字命名數(shù)據(jù)智能系統(tǒng),用意十分明顯,希望在這里,數(shù)據(jù)能真正變成知識和智慧,長成“破壁”自動駕駛的戰(zhàn)略武器。
智能系統(tǒng)是一家人工智能公司的核心競爭力,恰如一個學(xué)霸天才的大腦,拿到信息數(shù)據(jù)的原材料,學(xué)得又快又深,還可以舉一反三,不斷進步。
而且這種數(shù)據(jù)對毫末來講,早已不是實驗室級別的訓(xùn)練集、也不是你知道它去哪也知道做了什么事情的采集車數(shù)據(jù),而是真正量產(chǎn)后來自真實世界千奇百怪的數(shù)據(jù)。
毫末的MANA系統(tǒng)在這個時間節(jié)點推出,完全基于企業(yè)面對的現(xiàn)實需求,而非口號。這個現(xiàn)實是什么?
四百萬公里的現(xiàn)實里程帶來令工程師興奮的數(shù)據(jù)洋流,讓算法和架構(gòu)迅速迭代,豐富餌料投喂之下,自動駕駛快魚迅速調(diào)整底層架構(gòu)。
與此同時,未來可預(yù)期的海量數(shù)據(jù)(長城爸爸的掌上明珠,沒有猜忌鏈,沒有懸念,穩(wěn)穩(wěn)地上車)帶來的挑戰(zhàn)也要求底層構(gòu)架能Hold住這種變化,存儲、傳輸、計算訓(xùn)練、驗證、仿真、標(biāo)注等等,各個方面都對系統(tǒng)提出更高要求(就在發(fā)布日前一天官宣融資10億,錢也有了,PK特斯拉超算中心也安排上了)。
MANA架構(gòu)
下面我們來了解一下MANA的具體構(gòu)架。
(毫末智行數(shù)據(jù)智能體系 “MANA(雪湖)”)
MANA是毫末體系完善的研發(fā)體系,由四個大部分組成,分別是:數(shù)據(jù)看板系統(tǒng)(VENUS)、車端系統(tǒng)(TARS)、大規(guī)模不間斷學(xué)習(xí)系統(tǒng) LUCAS(Large Scale Autonomous Continuous Learning System)、底層系統(tǒng)(BASE)。
VENUS是數(shù)據(jù)看板,我們?nèi)フ故尽彶椤⒍聪?shù)據(jù)可視化的能力。
TARS是車端能力,包括TrasView(感知),TrasGo(認(rèn)知),規(guī)劃決策控制、Map(地圖定位),Meta(仿真引擎),它們更多為車端算法服務(wù)。
LUCAS是基于數(shù)據(jù)學(xué)習(xí)研發(fā)的一套系統(tǒng),主要有診斷、分析、檢索三個模塊。核心是數(shù)據(jù)驅(qū)動,通過迭代數(shù)據(jù)來自動化地迭代模型。目前業(yè)內(nèi)普遍迭代模型的思路是利用工程師來人工分析錯誤,將錯誤進行提煉總結(jié),然后設(shè)計出合適的方案。這種方法在錯誤數(shù)據(jù)頻次高、共性多的時候能夠較好地解決問題,但面對海量數(shù)據(jù)和長尾,就會無能為力,LUCAS解決了這個問題。
BASE是中間件、數(shù)據(jù)存儲、數(shù)據(jù)計算相關(guān)的服務(wù)。
四部分的功能分別是:
TARS解決的是從0到1的問題。
LUCAS里主要解決大規(guī)模泛化問題,從0到1之后如何從1到N,包括感知泛化、認(rèn)知泛化、車型泛化、芯片間泛化,標(biāo)注、訓(xùn)練,云端自動問題的分揀、診斷,以及一些云端和離線在線的評測。
BASE表達一種通用性,不管是車端做從0到1的原型研發(fā),還是做大規(guī)模量產(chǎn)之后從1到N的泛化,都依賴于BASE。
MANA意義
表面上看,似乎每個自動駕駛公司的智能系統(tǒng)構(gòu)架都大同小異,在之前也有一套數(shù)據(jù)系統(tǒng)運作,那Q4大力推出全新系統(tǒng),與之前一直存在的有何不同呢?
據(jù)技術(shù)Leader介紹,不同主要在兩個方面:首先,之前的各個子單元雖然存在并運作著,但存在很多配合不好的環(huán)節(jié),新系統(tǒng)對這些地方做了重新的整理和規(guī)劃。
(毫末智行MANA(雪湖)系統(tǒng)與特斯拉對比圖)
比如說LUCAS和TARS之間的配合。核心在于LUCAS和TARS之間的交互和配合,感知和認(rèn)知是完全兩套不同的LUCAS和TARS的配合方法,感知比較常見的是TARS提供模型,LUCAS提供數(shù)據(jù),1+1最后達到N的效果。在認(rèn)知上不一樣,相當(dāng)于LUCAS提供數(shù)據(jù)里學(xué)到的毫末想要達到的目標(biāo),TARS通過強化學(xué)習(xí)、模仿學(xué)習(xí)把它再學(xué)習(xí)過來,最后部署到車端。
第二,梳理出了清晰完善的理論框架,相當(dāng)于公司技術(shù)研發(fā)的一套頂層設(shè)計。在任何一個組織里,頂層設(shè)計的重要性不言而喻,沒有頂層設(shè)計,公司的長短期目標(biāo)、部門任務(wù)、業(yè)務(wù)權(quán)責(zé)無法有序展開,大家都不知道怎么思考。有了MANA,數(shù)據(jù)智能處理能有序循環(huán)起來,組織也能更好分工協(xié)作,培育出自我生長的力量。
2. 技術(shù)亮點
感知:從后融合到前融合
感知方面,業(yè)界和毫末的通用做法是:拿到一張圖片,通過一個骨干學(xué)到不同的特征層,再基于不同的Head區(qū)隔不同任務(wù),比如說一些分割,比如說一些道路元素,比如說一些障礙位等等。包括點云也一樣,像小鵬和毫末的下一代車,搭載有激光雷達,多個激光雷達之間拼到一起,完成分割和障礙物檢測功能。
一張圖片描繪相關(guān)的東西,但是前視相機不會和側(cè)前相機、激光雷達有什么互動,更多是在后融合的階段把目標(biāo)結(jié)果進行融合。這樣的做法存在很多問題,最大的問題是——它沒有很好地利用好多個傳感器之間的配合和交互。
既然后融合弊端這么大,為何還能成為業(yè)內(nèi)主流呢?
原因是之前大家都跑高速,前面有一個攝像頭,一個Mobileye,很多主機廠做PNC相關(guān)的事情就夠了。
這些量產(chǎn)產(chǎn)品大多就前面有一個攝像頭,它所謂的融合是這個相機和毫米波雷達的融合,這種融合相對比較簡單的。
但到了復(fù)雜的城市,光看前面一個攝像機肯定不夠,360度都要視覺和點云。以毫末的車為例,硬件里有12個攝像頭,還有激光雷達和毫米波雷達,那就是12個攝像頭之間的融合,難點會變很多。
那么,如何把這些傳感器的信息有效融合到一起?
毫末采用的方法是前融合的Tensor map思路。先是不同的相機、點云提取特征,提取到張量的層次,在這個環(huán)節(jié)下再進行拼接,拼到俯視圖的視角,3D的維度,在3D維度上再去檢測相關(guān)的障礙物、車道線等等,形成一個Tensor map新的模式。
通過這種方式就可以有效解決后融合所引發(fā)的跨相機的追蹤,跨相機障礙物的分裂等等這種問題,可以提高復(fù)雜場景下對于障礙物和車道線感知能力。
此外,還有一個和其他的一些國內(nèi)公司稍微不太一樣的點是——毫末會直接預(yù)測深度信息(和特斯拉一樣)。很多公司采用的技術(shù)方案是——模型只預(yù)測2D的信息(比如說圖像上像素點上的信息),再通過后處理的方法(比如說IPM),通過一些幾何關(guān)系去倒推計算深度信息。
這個方法毫末之前嘗試過,在高速上面沒有什么問題,在城市場景里面效果不太好,因為高速上車少,也比較簡單,車也沒有什么特別詭異的、逆行的,而在城市里面這種效果就會很差,它的測距精度不太高,深度信息回歸的不好。
和特斯拉不一樣的是,毫末在預(yù)測之前先把特征維度就做了一次融合,基于這個融合之后的特征,再去預(yù)測這個東西是障礙物還是車道線,相當(dāng)于是一個后融合。
那么,兩者的效果如何呢?
公司每隔一段時間都會做競品測試,目前來看,兩者都很不錯,但也都是剛剛開始(特斯拉最近才將前視和前玻璃融合),可以相互借鑒,取長補短。
(毫末智行Transformer與CNN深度融合理念)
正如公司CEO顧維灝所說,Transformer技術(shù)可以幫助自動駕駛感知系統(tǒng)更深刻地理解環(huán)境語義,與CNN技術(shù)的深度融合將會解決AI大模型量產(chǎn)部署的難題,Transformer與CNN深度融合將會成為自動駕駛行業(yè)下半場競爭的關(guān)鍵技術(shù)。
而這個融合也是MANA(雪湖)系統(tǒng)的精華之處。
認(rèn)知智能:讓人工智能更像人
認(rèn)知智能,這又是今年的一個熱門提法,但究竟是什么,大部分人還是一頭霧水,為什么呢?和感知一比較就知道了。
感知要解決的是從傳感器信號中重建客觀世界的問題,感知當(dāng)前相對成熟,雖然大家感知做的程度不太一樣,有些人做得好,有些人做得一般。但是感知它有最重要的特點,它有清晰標(biāo)準(zhǔn)。客觀世界什么樣的,你看到的感知出來的結(jié)果就是什么樣的,完全白盒的,沒有歧義,剩下的就是用巨量的數(shù)據(jù)去保證覆蓋掉所有的Corner Case。
而認(rèn)知要解決的是從客觀世界到駕駛動作的映射問題,它本身就沒有這種共識性的衡量標(biāo)準(zhǔn)。比如說一個人現(xiàn)在要左轉(zhuǎn),對向正好來車,老司機一腳油就過去了,而對于剛拿本的司機可能就選擇讓行。那在安全的前提下,究竟哪種是更好的駕駛策略呢?
(MANA認(rèn)知智能數(shù)據(jù)圖片)
認(rèn)知智能的核心是通過大量數(shù)據(jù)在復(fù)雜場景里學(xué)習(xí)人開車的規(guī)律和人開車的方法,用這個數(shù)據(jù)來指導(dǎo)算法和迭代。
他要解決的問題是讓機器達到像人一樣開車的體驗,而非充滿機械化痕跡。
雖然目前不少公司也都在朝這個方向做,但發(fā)展階段存在差異,大部分公司還停留在從傳統(tǒng)機器人理論衍生出來偏幾何學(xué)、偏機器人運動學(xué)的階段,通過規(guī)則式的、求解的方式來進行軌跡規(guī)劃。比如精確測量出來這個車距離我20.5米,那個車距離我16.8米,所以我就要這么走。
而顯然人在開車時并非如此,而是在一些基本的社會常識和駕駛規(guī)范的基礎(chǔ)上,按照自己的目的更智能地去選擇自己的駕駛行為,而不是通過純粹的數(shù)學(xué)計算來駕駛車輛。
通過復(fù)雜的認(rèn)知算法體系,毫末想要實現(xiàn)的第一步是,讓自動駕駛符合大眾的口味,第二步則是通過用戶畫像,實現(xiàn)自動駕駛司機的千人千面。這點很容易理解,先要達到平均分,讓大部分人感覺OK,然后讓各種人都滿意。因為高級白領(lǐng)林妹妹、肌肉達人李逵、霸道總裁周瑜開車、小鮮肉唐僧的駕駛風(fēng)格和對駕駛體驗的要求肯定是非常不同的。
所以毫末專門建立了一套體系。這套系統(tǒng)包括三個向量,安全、舒適、高效。
以安全為基礎(chǔ),通過將場景和動作被數(shù)字化后,從大量的數(shù)據(jù)中提煉出舒適和高效的量化標(biāo)準(zhǔn),這樣就可以避免純機械的操作,讓用戶感覺是老司機在開。
3.進階之路
從原始社會進入封建社會,看天吃飯的原始人不懂,面對同一片土地,為什么有的部落冬天也能吃到糧食了。
從封建社會進入資本社會,地主們不明白,為什么土地、勞動力、生產(chǎn)工具都在我手里,還是被資本家干翻了。
一如以后新一茬的Old Money不懂,資源都在我手里,怎么就被革命了呢?
原因高中課本說得很清楚,新的生產(chǎn)要素出現(xiàn),帶來生產(chǎn)力和文明形態(tài)的大變革。
而數(shù)據(jù)就是讓人類文明產(chǎn)生第四次大變革的那個新生產(chǎn)要素。
為了表達對數(shù)據(jù)信仰的重視程度,毫末用“思想鋼印”來表達它,每個三體讀者都知道思想鋼印的威力,它代表深入骨髓的堅信,不需要再去接受任何理性判斷的審視。
但在通往L5的路上,信仰需要正確的戰(zhàn)略思想,風(fēng)車戰(zhàn)略和漸進路線是毫末的選擇。
風(fēng)車戰(zhàn)略
什么樣的公司能成功?一定是掌握規(guī)律并最領(lǐng)先于對手的,Why?
在這里,黑暗森林兩條基本公理同樣適用:
第一,生存是文明的第一需要。
第二,文明不斷增長和擴張,但宇宙中的物質(zhì)總量保持不變。
毫末對自動駕駛實現(xiàn)的判斷是自動駕駛商業(yè)化三定律:
第一,從低速到高速;
第二,從載物到載人;
第三,從商用到民用。
從目前來看,封閉場景的餐廳酒店服務(wù)機器人、倉庫倉儲機器人、家庭的掃地機器人都已經(jīng)被商業(yè)化。開放場景的無人物流也在今年快速走向商業(yè)化。
先從最快商業(yè)化的無人物流小車、乘用車輔助駕駛、智能硬件三個戰(zhàn)略主戰(zhàn)場入手,取得造血能力和數(shù)據(jù)能力。但核心是打造自己的核心——數(shù)據(jù)智能,在總量有限的市場上,爭取領(lǐng)先優(yōu)勢,形成對資金、人才、數(shù)據(jù)迭代的馬太效應(yīng)。
董事長張凱對自動駕駛的另一個判斷是:對于賽道參與者而言,在2022年沒有形成自己相對穩(wěn)定的商業(yè)模式是致命的。
從外部環(huán)境來看:
第一,與前幾年智能手機市場比較類似,行業(yè)將會從最初的倒三角型形態(tài)向呈現(xiàn)T字形態(tài)轉(zhuǎn)變,頭部效應(yīng)越發(fā)明顯。2022年,有高效、低成本的數(shù)據(jù)智能體系,實現(xiàn)規(guī)模量產(chǎn)的企業(yè)與其他企業(yè)的差距將有顯著拉開。
第二,數(shù)據(jù)安全與數(shù)據(jù)合規(guī)將進一步增加自動駕駛數(shù)據(jù)智能體系的閉環(huán)難度和成本,對于沒有在此之前打好基礎(chǔ)的企業(yè),隨著2022年國家層面將會出臺細(xì)則強制執(zhí)行數(shù)據(jù)安全上位法,完成同樣的體系建設(shè),難度和成本驟增。對于新進入者,更是相當(dāng)與加高了行業(yè)進入壁壘,機會窗口幾乎已經(jīng)關(guān)閉。
(毫末智行董事長張凱)
從各個方面看,2022年將是毫末拉開與友商差距的一年。張凱提到的要打贏“無人物流車”、“城市場景輔助駕駛”和“數(shù)據(jù)智能”三場戰(zhàn)役,都有比較堅實的基礎(chǔ)。且公司目前已經(jīng)準(zhǔn)備好了充足的技術(shù)彈藥和資金,營業(yè)額已達數(shù)億元,加上剛?cè)谫Y的近10億人民幣。
整個毫末團隊都在摩拳擦掌準(zhǔn)備2022年的三大戰(zhàn)役。
“無人物流車”方面,實際上智能硬件核心就是智能底盤,而毫末只是把這個智能底盤用在無人物流車上,其實最早公司有一個產(chǎn)品做Mini bus,但當(dāng)時的判斷,Mini bus的商業(yè)機會來的更晚一些,因此暫時封存了Mini bus的很多技術(shù),直接把底盤拿出來更多的去拓展無人物流。
市場上現(xiàn)在很多初創(chuàng)項目做自動駕駛底盤,而究竟做得好不好,取決于團隊基礎(chǔ)能力:第一,是不是真的能設(shè)計出來,第二,取決于它的供應(yīng)鏈能力,是不是真的能夠做低成本。本質(zhì)上,汽車硬件拼的就是規(guī)模效應(yīng)。而長城的背景讓毫末能迅速推出十多款相關(guān)硬件產(chǎn)品。
正如美團的李達總所說,市場上找了一圈,最后發(fā)現(xiàn)毫末的底盤最好。
12月份,毫末智行迎來第1000輛末端無人物流車的量產(chǎn)下線,2022年,毫末智行團隊打算將無人物流車項目擴大3倍,達到3000輛(這些計劃都是根據(jù)合作伙伴的2022年規(guī)劃)。
這些并不是拍腦袋拍出來的數(shù)據(jù),而是通過團隊沙盤推演推出來的。
(毫末智行智能駕駛產(chǎn)品路線圖)
其次是城市輔助駕駛場景之戰(zhàn)。2022年,乘用車輔助駕駛的競爭將會進入下半場,下半場的競爭主要集中在城市開放場景的領(lǐng)航自動駕駛。毫末智行為此儲備了小魔盒3.0計算平臺、新一代AI自動駕駛技術(shù)、MANA數(shù)據(jù)智能體系,以及其最強的技術(shù)工程化經(jīng)驗。
最后是數(shù)據(jù)智能MANA(雪湖)系統(tǒng),MANA的推出將幫助毫末在數(shù)據(jù)處理和智能分析上建立更大的優(yōu)勢。
打破自動駕駛分級思維
長期以來,自動駕駛分級是各種迷思和爭論的重災(zāi)區(qū)。
比如宣傳中的PK,你說L2、L2+、L3、L3+,和孔乙己寫茴香豆似的。再比如行業(yè)中L2搜集的數(shù)據(jù)L4到底能不能用的問題。
那L2到L4,對毫末來說,數(shù)據(jù)到底能否通用呢?
公司技術(shù)Leader告訴筆者,一方面,從硬件和軟件開發(fā)上來看,并沒有看到L4和所謂的L2之間有什么區(qū)別,唯一的區(qū)別可能在于用戶接管策略的不同。比如說用戶不扶方向盤,所謂的L4不扶就不扶,無所謂,可能所謂的L2來說,你不扶我就提醒提醒你等等。這些簡單來說是一些軟件的開關(guān),區(qū)別不在硬件和算法上。
另外,不管L幾都有自己的數(shù)據(jù)價值,問題的本質(zhì)不在于數(shù)據(jù)本身的質(zhì)量和結(jié)構(gòu),而在于怎么能夠更好地應(yīng)用。
所以毫末選擇先要盯著更多功能、更好的用戶體驗去做。在之前的技術(shù)日上,CEO 顧維灝也曾經(jīng)說過,做L2的,包括特斯拉在內(nèi),無論是硬件設(shè)計、軟件開發(fā)、還是產(chǎn)品策略,都是瞄著更高級別的,對用戶帶來更好體驗的,往更好的目標(biāo)去做的。
在目前來看,用戶并不關(guān)心L幾,而是更關(guān)心安不安全、體驗好不好、接管率高不高這些指標(biāo),所以,這個分級的概念也正在淡化。
(毫末數(shù)據(jù)智能思想鋼印)
得益于毫末開放透明的文化,無論是行業(yè)小白還是小紅,都能從每季度的AI DAY上了解到公司技術(shù)、組織、戰(zhàn)略、思想、合作伙伴方面的變化。
自動駕駛是一場全社會的馬拉松,需要更高效的協(xié)作,開放有益進步,希望,在這場比拼中,毫末能用自己的聲音喊出一聲:
自動駕駛,我是你的破壁人!
另外,整個公司從辦公室到系統(tǒng),每個毛孔都充斥著濃濃的三體味,發(fā)布會都要發(fā)書,下次AI Day,咱們能不能憑這份狂熱,感動劉慈欣,把他拽到車上,和這次融資十億一樣,再上個國際頭條。
-END-
紅色星際
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.