隨著英偉達(dá)H20芯片重新獲批在中國(guó)銷售,整個(gè)AI圈再次聚焦芯片之爭(zhēng)。
而與此同時(shí),業(yè)內(nèi)傳出華為將從昇騰專用的ASIC路線回歸通用GPGPU架構(gòu)的消息。結(jié)合此前盤(pán)古員工自曝基于昇騰的AI模型訓(xùn)練不力,甚至小模型仍然在使用英偉達(dá)芯片。以上種種,反映出的不僅是兩大硬件技術(shù)路線之爭(zhēng),更是對(duì)中國(guó)AI芯片自主化路徑的一次重新審視。
昇騰已至臨界點(diǎn):新老架構(gòu)之分,形似神不似
提及英偉達(dá)CEO黃仁勛此次來(lái)華,恐怕給業(yè)內(nèi)印象最為深刻的就是其對(duì)于中國(guó)相關(guān)企業(yè)(例如華為、小米等)的贊賞有加。而這之中,華為因其昇騰是與英偉達(dá)H20在AI領(lǐng)域最直接的競(jìng)爭(zhēng)對(duì)手,黃仁勛的夸獎(jiǎng)更是意味深長(zhǎng),發(fā)人深思。
那么事實(shí)究竟如何?
從底層架構(gòu)來(lái)看,華為昇騰系列芯片采用的是專用ASIC設(shè)計(jì),其在某些高并發(fā)推理任務(wù)中具備一定能效優(yōu)勢(shì)。但這條路注定與GPU的“通用路線”不同,限制也異常明顯。
以訓(xùn)練大模型為例,昇騰面臨明顯的適配瓶頸。由于ASIC設(shè)計(jì)天然依賴特定算子、調(diào)度機(jī)制與任務(wù)模式,昇騰難以快速響應(yīng)算法迭代,導(dǎo)致其在應(yīng)對(duì)像基于Transformer這類快速演進(jìn)的大模型時(shí)表現(xiàn)不佳。而在模型移植時(shí),開(kāi)發(fā)者還需要耗費(fèi)大量精力進(jìn)行算子替換、流程重構(gòu)等,從而延長(zhǎng)開(kāi)發(fā)周期,增加成本和團(tuán)隊(duì)負(fù)擔(dān)。
更致命的是,昇騰在生態(tài)上的短板。
盡管華為一直在努力構(gòu)建MindSpore、CANN等生態(tài)組件,但目前仍與英偉達(dá)的CUDA體系差距巨大。而從框架兼容性、工具鏈完整性,到社區(qū)活躍度和第三方資源,昇騰都處于“非標(biāo)平臺(tái)”的尷尬境地,具體表現(xiàn)在實(shí)際應(yīng)用中,來(lái)自字節(jié)跳動(dòng)和阿里巴巴等中國(guó)主要科技公司的報(bào)告稱,與英偉達(dá)行業(yè)標(biāo)準(zhǔn)的CUDA相比,其神經(jīng)網(wǎng)絡(luò)計(jì)算架構(gòu)(CANN)軟件平臺(tái)存在局限性。此外,CANN框架被指仍然不穩(wěn)定,需要華為現(xiàn)場(chǎng)工程師進(jìn)行代碼故障排除等。
基于此,我們認(rèn)為,H20一旦重返市場(chǎng),對(duì)于AI芯片客戶而言無(wú)疑是“實(shí)用與可選”的明確信號(hào),而在GPU已經(jīng)形成事實(shí)標(biāo)準(zhǔn)的背景下,堅(jiān)持選用昇騰平臺(tái),無(wú)異于選擇一條更窄、更貴、更慢的路徑。
重啟GPGPU:疑似對(duì)舊路線的現(xiàn)實(shí)否定
正是在上述背景下,華為傳出正嘗試將AI芯片轉(zhuǎn)向GPGPU架構(gòu),并可能支持CUDA指令的中間件兼容。這一消息在業(yè)內(nèi)被廣泛解讀為,昇騰原有ASIC架構(gòu)的發(fā)展邏輯已接近瓶頸,重啟GPGPU路線,實(shí)屬無(wú)奈中的戰(zhàn)略轉(zhuǎn)向。
然而,轉(zhuǎn)向GPGPU架構(gòu)的新路線并不比原來(lái)更輕松。事實(shí)上,從專用芯片(ASIC)切換至通用芯片(GPGPU),本質(zhì)上是一次從硬件設(shè)計(jì)邏輯到軟件工具棧的全鏈條重構(gòu),挑戰(zhàn)重重,短期內(nèi)難以形成可商用的成熟體系。
眾所周知,從硬件架構(gòu)設(shè)計(jì)到生態(tài)構(gòu)建,GPGPU的難度遠(yuǎn)高于ASIC。原因在于,GPU要實(shí)現(xiàn)通用并行處理能力,需要構(gòu)建復(fù)雜的指令集、調(diào)度系統(tǒng)、內(nèi)存一致性機(jī)制等,設(shè)計(jì)難度高、IP依賴強(qiáng),技術(shù)壁壘大。而從零起步構(gòu)建一套與CUDA功能媲美的工具鏈,更是一項(xiàng)長(zhǎng)期投入,極難在短期內(nèi)落地商用。
更關(guān)鍵的是,即便實(shí)現(xiàn)了兼容CUDA指令,也仍面臨兼容但不穩(wěn)定、性能損耗大、適配Bug頻出等工程現(xiàn)實(shí)。而在AI芯片市場(chǎng)競(jìng)爭(zhēng)中,生態(tài)不是“有”就行,而是要“穩(wěn)”、“廣”、“快”。
但現(xiàn)實(shí)是,昇騰原有生態(tài)還未站穩(wěn),新生態(tài)又面臨難產(chǎn),極可能陷入“雙生態(tài)空轉(zhuǎn)”的尷尬,從而給用戶帶來(lái)選擇和應(yīng)用遷移的極大挑戰(zhàn)。
對(duì)手早已跑遠(yuǎn):兼容為先的生態(tài)戰(zhàn)略方為破局之道
如果說(shuō)上述是華為轉(zhuǎn)向GPGPU架構(gòu)其自身面臨的挑戰(zhàn),那么當(dāng)我們站在整個(gè)GPU產(chǎn)業(yè)生態(tài)的視角去橫向比較,華為此時(shí)轉(zhuǎn)向GPGPU,在象征其國(guó)內(nèi)AI芯片路線“回到原點(diǎn)再出發(fā)”的同時(shí),還面臨GPU生態(tài)的主流們?cè)缫雅苓h(yuǎn)的尷尬。
首先是英偉達(dá),其CUDA生態(tài)。不僅在全球AI開(kāi)發(fā)者中已成事實(shí)標(biāo)準(zhǔn),更在產(chǎn)業(yè)層面形成“平臺(tái)鎖定效應(yīng)”。從HuggingFace到Meta、從清華智源到阿里、字節(jié),大模型訓(xùn)練,幾乎都是基于英偉達(dá)GPU及其工具鏈展開(kāi),PyTorch更成為國(guó)內(nèi)外主流科研與產(chǎn)業(yè)并行使用的平臺(tái)。
其次是國(guó)內(nèi)已有多家廠商(例如摩爾線程、沐曦、海光等)從一開(kāi)始就選擇走“兼容主流生態(tài)”的路線,分別支持PyTorch、ONNX、ROCm、甚至部分CUDA語(yǔ)義,通過(guò)中間件降低開(kāi)發(fā)遷移門(mén)檻。
需要說(shuō)明的是,這些廠商起步雖晚于英偉達(dá),但正因?yàn)椤捌鸩郊醇嫒荨保虼松鷳B(tài)構(gòu)建更具現(xiàn)實(shí)性與工程效率。反觀華為,若從頭開(kāi)發(fā)GPGPU,即便是實(shí)現(xiàn)指令級(jí)兼容CUDA,也仍需面對(duì)性能差距、驅(qū)動(dòng)優(yōu)化、算子庫(kù)重構(gòu)等漫長(zhǎng)周期,更何況GPU芯片自身研發(fā)復(fù)雜度遠(yuǎn)高于ASIC。
與此同時(shí),GPU芯片自身的制造環(huán)節(jié)高度依賴先進(jìn)工藝與供應(yīng)鏈保障。但當(dāng)前華為依舊面臨國(guó)際制裁,其是否具備全鏈條的能力仍是未知數(shù)。
因此,我們認(rèn)為,此時(shí)用戶繼續(xù)投入使用當(dāng)前昇騰平臺(tái),已不再是“支持國(guó)產(chǎn)”的合理選擇,而是一種面對(duì)現(xiàn)實(shí)路徑的遲疑與搖擺。面對(duì)未來(lái)注定屬于“開(kāi)放、兼容、共建”的路線,而不是單一廠商封閉推進(jìn)的孤島生態(tài),何去何從?
寫(xiě)在最后:所謂透過(guò)現(xiàn)象看本質(zhì)。當(dāng)業(yè)內(nèi)為H20回歸中國(guó)市場(chǎng)和幾乎與此同時(shí)華為欲開(kāi)辟GPGPU新賽道而或喜或憂之時(shí),我們更應(yīng)看到的是其背后中國(guó)AI芯片自主路徑面臨的再選擇。是“自研、封閉、重構(gòu)”的老路,還是轉(zhuǎn)向“兼容、開(kāi)放、共建”的新路徑?
事實(shí)上,更現(xiàn)實(shí)的一個(gè)問(wèn)題已經(jīng)擺在眼前,作為昇騰的用戶、開(kāi)發(fā)者與合作伙伴,當(dāng)原有的AISC架構(gòu)路線抵臨瓶頸,新架構(gòu)又尚未成熟,而搭上開(kāi)放式生態(tài)快車(chē)道的對(duì)手們?cè)缫堰h(yuǎn)去,前期已深度捆綁昇騰的他們又該如何抉擇?
一切不言自明。
而種種事實(shí),讓我們可以肯定的是,“兼容并蓄、百花齊放”的生態(tài)才是中國(guó)AI芯片實(shí)現(xiàn)自主化的更佳路徑。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.