撰文 | 張祥威 編輯|馬青竹
幾個(gè)月前,黑芝麻(參數(shù)丨圖片)智能上市,創(chuàng)始人兼CEO單記章告訴投資人,那天相當(dāng)于“抵達(dá)延安”。
他還有更長(zhǎng)遠(yuǎn)的行軍計(jì)劃,“2030年在中國(guó)做到市場(chǎng)占有率領(lǐng)先,2040年在端側(cè)做到全球第一。”
聽(tīng)起來(lái)很難,英偉達(dá)就像大山擋在前面。單記章也認(rèn)同,英偉達(dá)最厲害的是訓(xùn)練。但他希望,在端側(cè),黑芝麻智能是更有優(yōu)勢(shì)。
眼下,黑芝麻智能和英偉達(dá)的下一次交鋒就要開(kāi)始,華山A2000家族對(duì)決Thor系列。
交鋒的背景,是一場(chǎng)新的芯片戰(zhàn)將要到來(lái)。
智駕人的2024年非常熱鬧。“無(wú)圖NOA”“全國(guó)都能開(kāi)”“端到端”“大模型”“去激光雷達(dá)”“車(chē)位到車(chē)位”……隔一陣兒,就搞點(diǎn)兒新名詞。
熱鬧中,高階智駕下探到15萬(wàn)元級(jí)新車(chē),全系標(biāo)配漸成趨勢(shì)。
即將告別2024,明年智駕人大概率仍不會(huì)放松,另一場(chǎng)AI大模型之戰(zhàn)要來(lái)了。
智駕芯片供應(yīng)商更不會(huì)放松,英偉達(dá)那款熱門(mén)芯片Thor要解決設(shè)計(jì)缺陷盡快量產(chǎn),幾家國(guó)產(chǎn)智駕芯片廠的新一代產(chǎn)品,也來(lái)到上車(chē)關(guān)鍵期。更好地支持大模型,是智駕芯片接下來(lái)的重頭戲。
黑芝麻智能入局大模型之戰(zhàn)的船票A2000家族,在年底剛正式推出。這一專為AI模型設(shè)計(jì)的芯片平臺(tái),包含A2000 Lite、A2000、A2000 Pro三款產(chǎn)品,最高算力相當(dāng)于4顆行業(yè)旗艦芯片,意味著達(dá)到上千TOPS的水平。
能否順利通過(guò)大模型考驗(yàn),黑芝麻智能相比對(duì)手又有哪些底牌?從A2000家族芯片上能窺得一斑。
自研NPU和ISP,原生支持大模型
黑芝麻智能數(shù)據(jù)顯示,A2000家族的三款芯片,算力分別相當(dāng)于1顆、2顆和4顆行業(yè)旗艦芯片,不難看出,行業(yè)旗艦芯片應(yīng)該指的是Orin X。
作為對(duì)比,蔚來(lái)神璣NX9031相當(dāng)于4顆,小鵬圖靈AI芯片相當(dāng)于3顆。
這意味著,A2000家族的算力分別約為250TOPS、500TOPS和1000TOPS。最高算力與英偉達(dá)Thor一致。
三款芯片,除面向智駕,支持實(shí)現(xiàn)NOA,且可以應(yīng)用于Robotaxi,A2000家族還支持機(jī)器人和通用推理計(jì)算等多個(gè)領(lǐng)域。
賬面算力上,黑芝麻智能A2000家族是夠的。挑戰(zhàn)在于,能否適配最新的算法模型。
據(jù)《出行百人會(huì)/AutocarMax》了解,部分上一代國(guó)產(chǎn)智駕芯片在支持BEV算法時(shí)存在問(wèn)題。主要由于芯片設(shè)計(jì)階段,BEV算法尚未提出。導(dǎo)致在適配BEV算法時(shí),拖慢上車(chē)進(jìn)度,讓部分車(chē)企對(duì)國(guó)產(chǎn)智駕芯片產(chǎn)生顧慮。
此次推出A2000家族,黑芝麻智能表示,芯片多合一集成了CPU、DSP、GPU、NPU、MCU、ISP和CV等,單芯片能多任務(wù)處理。最重要的是,架構(gòu)設(shè)計(jì)原生支持Transformer大模型。
拆開(kāi)看,A2000家族的CPU為16核,采用ARM Cortex-A78處理器。MCU為6顆ARM Cortex R52。
而核心部件NPU和ISP,均為黑芝麻智能自主設(shè)計(jì)。NPU又稱神經(jīng)網(wǎng)絡(luò)處理加速器,支持卷積、矩陣乘、非線性計(jì)算等。自上一代華山A1000芯片,黑芝麻智能便自主設(shè)計(jì)。
此次,黑芝麻智能推出自研NPU新架構(gòu)——“九韶”,采用獨(dú)立大核架構(gòu),而非傳統(tǒng)的小核心堆疊。
小核心堆疊是將大量小計(jì)算核集成,軟件看到的是多個(gè)核。優(yōu)勢(shì)是容易實(shí)現(xiàn),也容易獲得理論算力的提升,比如單個(gè)核的算力去乘以核數(shù)量。但事實(shí)上軟件要調(diào)度好這些小核的使用,達(dá)到線性的多核性能表現(xiàn),幾乎是不可能的,所以說(shuō)只是“紙面”的理論性能提升。除了導(dǎo)致軟件復(fù)雜外,還有額外開(kāi)銷大、延遲、不穩(wěn)定等問(wèn)題。
基于大核架構(gòu),軟件只看到一個(gè)核,省去了大量核間調(diào)度的工作,開(kāi)發(fā)重心可以放在算法本身,而非硬件使用上,同時(shí),還具有實(shí)際性能高、低延時(shí),能效高2倍以上等優(yōu)勢(shì)。缺點(diǎn)是芯片實(shí)現(xiàn)難度高。
黑芝麻智能表示,大核架構(gòu)能簡(jiǎn)化算法多任務(wù)并行處理的難度,支持智駕大模型的實(shí)時(shí)推理,降低計(jì)算延遲,支持優(yōu)先級(jí)搶占機(jī)制,滿足復(fù)雜計(jì)算任務(wù)需求。
于智駕芯片而言,這相當(dāng)重要。
當(dāng)下,基于英偉達(dá)Orin X,智駕芯片支持的VLM模型參數(shù)可達(dá)到2B規(guī)模。基于下一芯片,參數(shù)規(guī)模將大幅提升。以小鵬圖靈AI芯片為例,可支持30B大模型參數(shù)規(guī)模,為提升神經(jīng)網(wǎng)絡(luò)處理效率,小鵬還自研設(shè)計(jì)了2個(gè)NPU。
何小鵬甚至判斷,“當(dāng)前量產(chǎn)車(chē)的算力水平在500TOPS,未來(lái)需求水平則要達(dá)到1萬(wàn)TOPS。”
“1萬(wàn)TOPS有些不太現(xiàn)實(shí),要考慮功耗、成本等。幾千TOPS應(yīng)該是有的,”另一智駕人士判斷。
綜合算力、CPU核、NPU架構(gòu)等信息,合理推測(cè)A2000家族采用了制程工藝更高的5nm,與蔚來(lái)、小鵬的自研芯片處于同一檔。
不過(guò),決定芯片水平高低的遠(yuǎn)不止賬面算力等指標(biāo),還涉及開(kāi)發(fā)部署便利性、安全等級(jí)等。
據(jù)悉,九韶架構(gòu)支持包括INT8/FP8/FP16在內(nèi)的混合精度計(jì)算,既可針對(duì)高精度進(jìn)行精細(xì)量化,又可節(jié)省資源,提高速度,實(shí)現(xiàn)Transformer的硬加速,簡(jiǎn)化開(kāi)發(fā)者的量化和部署。
九韶架構(gòu)還具備高安全等級(jí),能避免模型推理過(guò)程中的隨機(jī)錯(cuò)誤和失效,實(shí)現(xiàn)訓(xùn)練與部署一致性,確保自動(dòng)駕駛系統(tǒng)的高安全性和確定性。
此外,九韶架構(gòu)采用低延時(shí)和高吞吐的三層內(nèi)存架構(gòu),包括大容量高帶寬的NPU專用緩存、核心模塊片內(nèi)共享緩存,以及對(duì)稱的雙數(shù)據(jù)通路和專用DMA引擎,提升了性能和有效帶寬。
通過(guò)以上設(shè)計(jì),黑芝麻智能A2000在迎戰(zhàn)大模型時(shí),或?qū)⒛芘c智駕算法供應(yīng)商更順利地協(xié)同,完成量產(chǎn)上車(chē)。
芯片制勝的其它因素:ISP、量產(chǎn)經(jīng)驗(yàn)與成本
除了計(jì)算能力,其它因素同樣影響著車(chē)企的判斷。
其一,ISP圖像處理能力。
即便800萬(wàn)像素前視攝像頭已經(jīng)上車(chē),采集回來(lái)更清晰的圖片,但車(chē)企仍對(duì)智駕芯片的ISP有著強(qiáng)烈需求。
蔚來(lái)神璣NX9031、小鵬圖靈AI芯片,均圍繞ISP能力進(jìn)行了布局。蔚來(lái)自研ISP技術(shù),小鵬采用2個(gè)獨(dú)立圖像ISP,通過(guò)AI降噪算法,以及更高的處理位寬,讓芯片在黑夜、逆光、雨天等暗光場(chǎng)景下,獲得更清晰的圖片數(shù)據(jù)。
自研ISP是華山系列研發(fā)歷代產(chǎn)品的慣例。單記章認(rèn)為,新一代ISP技術(shù)基于自研,讓車(chē)輛看得更清更遠(yuǎn)。
據(jù)悉,A2000家族的ISP具備4幀曝光和150dB HDR,提升了隧道、夜間等場(chǎng)景的圖像處理能力。能夠在暗光及明暗變化環(huán)境下,更好的對(duì)鏡頭中的小目標(biāo)物體進(jìn)行探測(cè),以及檢測(cè)道路障礙物、交通標(biāo)志和行人。
其二,量產(chǎn)經(jīng)驗(yàn)。
“智駕方案上車(chē)不是憑空出現(xiàn)的能力,一定有車(chē)企前期為其買(mǎi)單。部分智駕供應(yīng)商之所以發(fā)展不順,還是在于缺少量產(chǎn)落地經(jīng)驗(yàn)。”一位新勢(shì)力智駕研發(fā)人士告訴《出行百人會(huì)/AutocarMax》。
量產(chǎn)驗(yàn)證,考驗(yàn)算法供應(yīng)商,也考驗(yàn)芯片供應(yīng)商。
黑芝麻智能的A1000芯片,在智駕上車(chē)一戰(zhàn)中完成了量產(chǎn)驗(yàn)證,分別在領(lǐng)克08 EM-P、東風(fēng)奕派eπ007、合創(chuàng)V09等車(chē)型實(shí)現(xiàn)量產(chǎn)搭載。
這些案例,將讓黑芝麻智能積累了豐富的量產(chǎn)經(jīng)驗(yàn),跑通量產(chǎn)后,同時(shí)搭建成熟生態(tài),有助于后續(xù)芯片,收縮上車(chē)適配周期。
其三,成本控制能力。
蔚來(lái)、小鵬之所以自研芯片,一方面由于市面上通用芯片的算力無(wú)法最大化利用,另一方面,也因成本過(guò)高。
“新勢(shì)力自研芯片并不是特別難的事情。很多公司都是去買(mǎi)芯片的IP,自己主要做軟件工具鏈的配套。總體上,要比打造一顆通用芯片的成本少很多。”一位智駕供應(yīng)商人士說(shuō)。
他告訴我們,單顆英偉達(dá)Orin X芯片售價(jià)約500美金,成本約100美金,“賣(mài)500美金不是成本就那么貴,而是因?yàn)樗鼪](méi)有對(duì)手。”
A2000的NPU存算架構(gòu),不僅提升性能和有效帶寬,還降低對(duì)外部存儲(chǔ)帶寬的依賴,在性能、帶寬和成本間取得平衡。
黑芝麻智能提出“極限成本”,稱A2000家族將實(shí)現(xiàn)BOM成本、導(dǎo)入成本和迭代成本的多重目標(biāo)。
在成本維度,國(guó)產(chǎn)智駕芯片通常低于海外芯片,這是它們搶客戶的一大優(yōu)勢(shì)。接下來(lái)就看黑芝麻智能們,能否贏得智駕算法研發(fā)團(tuán)隊(duì)的關(guān)鍵一票。
結(jié)語(yǔ)
回顧黑芝麻智能芯片歷程,從華山A500到A1000系列,再到主打艙駕融合的武當(dāng)C1200,以及今天面向大模型的A2000家族,基本上緊貼智駕技術(shù)趨勢(shì)。這相當(dāng)不易。
時(shí)下,造車(chē)新勢(shì)力已經(jīng)上車(chē)VLM,VLA也很快被頭部確定為下一方向。新勢(shì)力自研芯片、英偉達(dá)Thor、國(guó)產(chǎn)智駕芯片,明年又是一場(chǎng)硬仗。
—THE END—
出行百人會(huì) | AutocarMax
追蹤汽?出行產(chǎn)業(yè)鏈進(jìn)化,關(guān)注新產(chǎn)品、新科技、商業(yè)邏輯與商業(yè)人物,影響圈層中有影響力的人。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.