10月29日,小米在發布會上表示10月30日在全國范圍內部署城區NOA。而“端到端”將在11月底內測,12月底推送先鋒版。其實,今年夏天開始,“端到端”智駕就成了業內最火的概念。就在小米發聲前一周,理想汽車也剛剛宣布了自己的端到端進程。
小米還在瘋狂趕工中的“端到端”,是“一段式”(感知和規控合為一體),還是“兩段式”(感知和規控模塊分開,中間嵌入人工接口),目前沒有公開信息。不過,9月份小米將原來“感知”和“規控”兩個二級部門合并為“端到端算法與功能部”。組織架構的變化,暗示小米至少將“一段式”作為目標。
截至目前,已經有十幾家主機廠和供應商,聲稱上馬或者即將上馬“端到端”,以至于這個概念,從新鮮到濫俗,只花了不到1年時間。不管有沒有,都得說有。看如今的流量打法,嘴上輸了就等于“輸陣”。閩南人說“輸人不輸陣,輸陣歹看面”。對潛在受眾和自家團隊構成士氣打擊,不是小事。
圖:一段式端到端示意圖
“一段式”和“兩段式”,雙方旗鼓相當
目前,聲稱已部署“一段式”端到端的供應商,只有Momenta。智己、廣豐、埃安,作為Momenta的客戶,宣布同期部署。就在10月28日舉辦的品牌智能駕駛技術日上,智己汽車宣布IM AD 3.0完成從“最像人”到“有直覺”的進化,邁入“直覺”智駕新時代。
而表示“即將”部署“一段式”的品牌,則包括理想、小米、商湯科技、元戎啟行等。“兩段式”主機廠和供應商似乎數量更多,目前有小鵬、極氪、極越、魏牌藍山、鴻蒙智行等。
而寶駿作為大疆的用戶,不但部署了卓馭+寶駿云海(參數丨圖片),還特意標明為“中算力兩段式端到端”。
至于華為的鴻蒙系,客戶包括問界、享界、智界、嵐圖、阿維塔、方程豹、廣汽傳祺。東風猛士、尊界也宣布了與華為合作的信息,但迄今尚無“端到端”部署規劃。華為的態度,暫時未將“一段式”作為目標。而且,華為也不認為“兩段式”是通往“一段式”的過渡形式。
除此之外,奇瑞、長安啟源、地平線、輕舟智航等,雖然規劃了端到端,但未說明形式。
到現在為止,端到端領域,看似支持“兩段式”品牌略多于“一段式”。如果將同一供應商技術來源的,都視為一個品牌,兩者幾乎旗鼓相當。
在實現高等級自動駕駛諸多技術路徑當中,端到端值得嘗試,很可能不是唯一路徑,甚至不是最優路徑。
我們曾提到過,“兩段式”的優勢在于,人工接口信息可觀測,但感知輸出的白盒狀態,就意味著信息過濾后存在損失。
而“一段式”和“兩段式”相比,理論上前者信息丟失少,上限應該比較高。但鑒于“一段式”可解釋性更差,到底突破什么下限,大家都沒底。因此所有廠商,不管做的是“一段式”還是“兩段式”,無一例外都設置了兜底規則(rule-based)。這也意味著“兩段式”同樣存在不可解釋的部分。
數據需求決定部署規模
雖然“端到端”的參數量只相當于中模型,在一枚英偉達Orin-X上就能跑起來,貌似消耗算力不多。但背后必須有大數據和大模型支持。數據的門檻不僅是對絕對數量的要求,對于數據的分布和多樣性要求也極高,而且還要求是100%的好數據(合規最優操作)。
主機廠自研,和由供應商推動,最大的區別不是技術本身,而是數據獲取能力。后者理論上能獲得多個品牌的產品數據,數據量更大。
有人表示,“一段式”端到端應部署在20萬元以上中高端車上。現在沒有跡象表明,“一段式”就比”兩段式“需要更大的車端算力和更強的感知能力(比如有無激光雷達)。將端到端能力作為入門級和高配區分的一個維度,有可操作性,但同時其演化規律又要求更大的數據量,即盡量擴大部署規模。兩者要求背離。
何去何從,需要掂量一下。當前端到端的競爭主軸并非現實商業利益,而是盡快迭代起來,形成明顯的使用價值。由此可見,即便實地部署了“一段式”端到端,迭代到可用、好用,群眾滿意的地步,也需要長期投入。
算力大比拼
不可否認,“一段式”模型,設計源頭就比“兩段式”難度更大,調參回路更長、落地流程也更艱難一些。
圖:AlexNet多層神經網絡
設計一個可工作的神經網絡(模型)需要很多人類智力資源,訓練它更復雜。神經網絡的每一個子網絡,都涉及歸一化、偏差、非線性輸出,校正回歸等一堆問題。而且多層網絡讓這些問題的復雜度上升了維度。
訓練促使模型從出生到成熟,訓練的本質是定量分析。如果用5000萬個clips(視頻片段)訓練模型20輪,相當于分析1B個clips。訓練中心算力直接決定系統迭代速度。
圖:訓練系統
而算力還用于推理計算,可以將其理解為自動化標注。以前人工標注的速度慢,但精度高。推理計算的標注精度低,需要反復刷標提高精度。特斯拉計劃將后臺算力推高至100E(1EFOLPs=10^18次浮點計算)。根據ChatGPT的經驗,訓練量達到一定量級,也許會出現大語言模型的“涌現”現象。是否需要與其相當的狂野算力,任何人都沒有經驗,也沒人宣稱,多少后臺算力就夠了,包括特斯拉自己。
只要想自己搭建訓練和推理系統,買算力卡的費用絕對省不了。考慮到英偉達H100,甚至閹割版H800/A800,包括同樣能力的AMD,對中國禁售措施越來越嚴格,各家如何搭建算力,是一個很有意思的問題。
4月份的時候,特斯拉在Q1財報會議上透露將AI訓練集群擴展到35000塊H100算力卡。而同期國內能買到1000塊算力卡的廠家,都是鳳毛麟角。
華為的昇騰910B(按照性能最強的910 Pro B),性能據說和H100的算力差不多。但最緊要的并非峰值算力,而是FLOP利用率。英偉達的算力卡FLOP利用率出了名的低(FP8模型35%左右)。而昇騰系列的問題是產能供不應求,一塊昇騰910 ProB一度炒至28萬元。
假設國內企業的模型設計水平,與特斯拉相當,而昇騰系列算力卡優于英偉達一倍以上(這一點存疑),那么想達到特斯拉FSD V12的水平,至少也需要1萬塊以上910B算力卡。
江湖傳聞,910B的2023年出貨量大概50萬塊,這些卡被誰買走了,缺乏信源。基于眾所周知的原因,華為對高制程芯片的生產細節諱莫如深。
圖:算力中心
種種跡象表明,能夠攢起萬塊以上算力卡的主機廠和供應商,國內一只手就能數過來。遠不像場面上人手一份“端到端”那么花團錦簇……
如果這是一場看不見上限的軍備競賽,不考慮成本的話顯然越高越好。顯然,國內廠商中間,華為確定有能力跟一下,其他主機廠和模型供應商都需要買卡。如果訓練相當于挖礦,英偉達被定位“賣鏟子的”,那么華為一面賣鏟子,一面也自己動手挖礦,因此獲得了額外的算力供應鏈優勢。
算力比拼正在演化為各家投資力度競賽,沒有取巧之機。
插混香餑餑,跨國車企必須得與自己和解時髦的“端到端”智駕,走到哪一步了馬斯克兜售的夢,圓在中國
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.