撰文 | 張祥威 編輯|馬青竹
6月中,在一場沙龍上,地平線創(chuàng)始人余凱被問及L3落地時間點。
他回復,“對用戶有價值、有體感的L3,可能也就2-3年之內,產品就會出來。”
卓馭科技CEO沈劭劼同樣認為,兩三年內L3有望落地。
但更早前,余凱在2023年曾預測,“十年以后連L3都不會真正實現(xiàn)”。
沈劭劼則說,“如果這個問題您在一年之前問我,根本沒辦法給出時間。但是最近這一年,非常酷炫的技術,成功把接管率以10倍往下降,包括基于(深度)學習的端到端,基于正向學習進行后訓練,以及VLA場景理解,這些技術讓我們看到了希望。”
同月,小鵬G7全球首秀,號稱“全球首款L3級算力AI汽車”,該車搭載的智駕芯片方案,耐人尋味。
三顆自研圖靈AI芯片,兩顆芯片用于智駕,一顆用于座艙大模型。
官方數據顯示,三顆圖靈AI芯片有效算力2200TOPS,單顆算力700+TOPS。兩顆用于智駕,也就是1400+TOPS。
同樣走大算力路線的還有:極氪千里浩瀚智駕H9方案,采用兩顆英偉達Thor-U芯片,算力1400TOPS。蔚來ET9(參數丨圖片)搭載了兩顆自研神璣NX9031芯片,算力2000TOPS。
也有沒這么激進的。
理想智能煥新版車型的AD MAX版方案,搭載單顆Thor-U,算力700TOPS。《出行百人會/AutocarMax》從另一本土智駕供應商處獲悉,其為車企的頂配版車型準備的新一代方案,將基于單Thor-U研發(fā)。
這就留下了探討空間。
當下的頂配智駕方案,單顆700TOPS算力的芯片是否足夠?以小鵬為代表的兩顆芯片方案,要做什么?又會面臨哪些挑戰(zhàn)?更堆算力的三芯片,真的有必要嗎?
700TOPS,難治算力焦慮
Thor-U量產上車前,兩顆英偉達Orin-X成為行業(yè)主流高配算力方案,號稱算力共508TOPS。
智駕算力是否真等于兩顆芯片加總,暫且不談。名義上,基于兩顆Orin-X,多家做到了基于無圖的城市領航功能。
也有供應商稱,基于單顆Orin-X實現(xiàn)了無圖城市領航。
實際上,Orin-X并非天生支持Tranformer大模型,而且,端到端模型主要運行在單顆芯片上。
以理想為例,一顆芯片跑端到端,另一顆跑VLM模型。如果深究,比單顆Orin-X算力更小的方案,號稱端到端也沒問題。
因為,單顆英偉達Orin-X 理論參數規(guī)模是10億級別。不考慮內存寬帶限制和算力利用率,將參數規(guī)模蒸餾到這一程度,理論上就能把端到端做上車。
更多的算力,可以做長時序推理,決策會更優(yōu)秀。這與小鵬提的Scaling Law法則類似,參數規(guī)模越大,模型能力越強。有追求的智駕研發(fā)者,都在等待更高算力的芯片。
基于兩顆Orin-X的可開發(fā)空間,越來越少了。
現(xiàn)在有了700TOPS的Thor-U,自研芯片小鵬圖靈AI芯片、蔚來神璣NX9031、地平線J6P,提升空間打開。
小鵬圖靈AI芯片,最高可運行30B大模型參數,號稱有效算力一顆頂主流芯片三顆。更大規(guī)模參數,意味著車端模型具備更多能力空間。
當然,模型參數的規(guī)模的大小與能力之間的關系,要放在同一網絡結構中對比。不同的網絡結構之間,模型規(guī)模大的,能力并非一定就強。比如,Deepseek對比Llama,前者參數更小,但效果卻能做到更強。
一位本土智駕供應商人士告訴我們:
“分布式肯定沒有單一大芯片好,單Thor-U基本能展現(xiàn)推理能力。Thor-U初期基本支持的就是理想3.2B這個量級的參數規(guī)模。對于VLA來說,700TOPS算力短期內夠了。”
可支持參數規(guī)模更大,再加上,圖靈AI芯片屬于ASIC專用芯片,理論上對算法的匹配會比通用芯片更好,所以小鵬的三芯片,拿出其中一顆,用700TOPS左右的算力跑自動駕駛,本身已經足夠。
但小鵬沒止步于此,擺出了芯片方案的“更大陣仗”。
小鵬G7全球首秀發(fā)布會上,宣布搭載VLA和VLM模型。媒體溝通會上,何小鵬將VLA比作掌管運動的大腦和運動的小腦,而將VLM比作整車大腦,并稱兩個模型之間不會是一個完整的端到端的數據流。
從這一點看,小鵬的VLA和VLM模型,應該與理想之前的做法類似,一顆圖靈AI芯片跑VLA,另一顆跑VLM。
何小鵬還說,“我們正在做一些非常有趣的能力,就是來提供2顆,甚至多顆算力能夠合并跑一個VLA巨大模型的可能性。”
在兩顆高算力芯片上跑大模型,業(yè)界也有可參考案例。
一位國內智駕供應商人士告訴我們,其為Robotaxi提供的基于兩顆Thor-X的方案,“車端的模型跑在兩顆Thor-X上,都運行模型,只是分不同的任務。兩顆Thor-X之間是通過PCIe 5.0互聯(lián),四鏈的PCIe5.0,每個鏈傳輸速率32G/s。”
小鵬的兩顆圖靈AI芯片,最終能運行何種“模型巨物”,還要等時間最終揭曉答案。
至于為何要單獨另供一顆芯片,何小鵬如此解釋:
“行業(yè)L2的高階算力基本上都是500T,現(xiàn)在還有700T,某種角度700T和500T是一樣的,我認為要數倍算力的提高,模型才有可能數倍的提高。我們已經看到友商會放2000T甚至4000T的算力,我相信這個算力會是L3,甚至L4重要的基礎起點。”
特斯拉下一代方案AI5將搭載更大規(guī)模算力芯片,此前已有傳聞。一種說法是,特斯拉的下一代智駕芯片方案或將與英偉達合作。
三芯片的“陽謀”:L3,抑或降本?
兩顆已顯得不同,但是小鵬一下用掉3顆,也許還有別的用意。
華為打出了中國首個商用高速L3方案,小鵬為搭載芯片的車型取名——“全球首款L3級算力AI汽車”。
小鵬G6、G9經歷可謂坎坷,中型和中大型SUV市場,小鵬不僅要為G7提供與市面上拉開一檔的算力,甚至想為L3做好準備。
“車端搭載1顆該芯片,可代表當下的最高水平,2顆可代表未來,3顆則會帶來巨大的想象空間。”何小鵬說。
上述本土智駕供應商人士稱,“L3要看國家標準,也許需要加點冗余。多顆芯片,發(fā)揮類似熱備份的作用。”
我們了解到,一些L4公司的方案,主要通過多顆芯片實現(xiàn)安全冗余。
以上述雙Thor-X方案為例,客戶的可選擇方案通常有兩種:“一種基于雙Thor-X的自動駕駛域控制平臺,客戶放兩套互相做冗余;另一種,用基于雙Thor-X的自動駕駛域控平臺,再加上一顆Orin-X組成冗余方案。”
三芯片,也許是何小鵬的陽謀,通過算力占據用戶心智。
需要注意,三芯片上車對于整車BOM成本。
李斌曾稱,蔚來自研的神璣NX9031芯片可實現(xiàn)單車1萬元降本。蔚來搭載四顆Orin-X芯片,小鵬自研圖靈AI芯片能節(jié)省多少成本,可做一參考。
本來能節(jié)省成本,如今推出“堆算力”的三芯片方案,取決于市場是否認可了。
研發(fā)芯片前,何小鵬曾問業(yè)內人士,一年賣多少臺車能賺錢?對方說10萬臺。但是賣了10萬臺車后,他發(fā)現(xiàn)還沒賺錢。后來他又問要賣多少顆芯片能賺錢,對方說100萬顆。他留了心眼,現(xiàn)在認為最起碼要賣到100萬顆。
近日,接受英國《金融時報》采訪時,何小鵬稱正致力于將圖靈AI芯片集成到大眾汽車明年在中國推出的特定車型中。
他還透露,正洽談向其他車企供應AI芯片。如能達成合作,意味著小鵬將更大規(guī)模攤平芯片成本。
—THE END—
出行百人會 | AutocarMax
追蹤汽?出行產業(yè)鏈進化,關注新產品、新科技、商業(yè)邏輯與商業(yè)人物,影響圈層中有影響力的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.