原創(chuàng)?科技新知前沿科技組
作者:木易 編輯:賽柯,九黎
月內(nèi),摩爾線程與沐曦兩大國(guó)產(chǎn)GPU后起之秀,聯(lián)袂向科創(chuàng)板遞交招股說明書,拉開"國(guó)產(chǎn)GPU四小龍"上市序幕。值得玩味的是,兩家公司產(chǎn)品都采用GPGPU架構(gòu)路線。而作為國(guó)產(chǎn)AISC頭部玩家的昇騰,近期竟也曝出轉(zhuǎn)戰(zhàn)GPGPU的消息,這一芯片賽度熱度愈發(fā)高漲。
結(jié)合前段時(shí)間H20芯片在國(guó)內(nèi)市場(chǎng)解禁即賣爆,GPGPU路線潛力毋庸置疑。而更讓業(yè)內(nèi)極力探究的是:昇騰向國(guó)產(chǎn)GPU新秀并道靠攏后需要重新起步,接下來還能否延續(xù)其“遙遙領(lǐng)先”的高光?尤其相較于更老辣的GPGPU路線主導(dǎo)者英偉達(dá),昇騰能否快速觸其項(xiàng)背?
01
未展開的新老交鋒,未完成的昇騰愿景
華為在軟硬件技術(shù)領(lǐng)域的研發(fā)實(shí)力毋庸置疑,芯片產(chǎn)品布局更幾乎覆蓋所有終端場(chǎng)景。然而,從AISC重回GPGPU起跑線,無(wú)論是英偉達(dá)抑或國(guó)產(chǎn)GPU新秀,都遠(yuǎn)遠(yuǎn)跑在昇騰前列。
這場(chǎng)尚未展開的新老交鋒,仍充滿懸念。
根據(jù)業(yè)內(nèi)調(diào)研結(jié)果,摩爾線程以“全功能GPU”為核心,業(yè)務(wù)涵蓋AI智算、圖形渲染、多媒體處理和物理仿真領(lǐng)域,公司GPU產(chǎn)品已更新至第四代,并在國(guó)內(nèi)市場(chǎng)得到廣泛應(yīng)用。
沐曦則更側(cè)重于高性能通用GPU芯片及計(jì)算平臺(tái),產(chǎn)品主要應(yīng)用于AI訓(xùn)練和推理、通用計(jì)算與圖形渲染,產(chǎn)品成功應(yīng)用于國(guó)家人工智能公共算力平臺(tái)、運(yùn)營(yíng)商智算平臺(tái)等。
值得注意的是,上述兩大公司產(chǎn)品的主要優(yōu)勢(shì),恰恰命中昇騰芯片的“高通用”短板。而這也折射出華為昇騰系列至今未競(jìng)的產(chǎn)品愿景。
曾幾何時(shí),華為拋出“昇騰萬(wàn)里,讓智能無(wú)所不及”的亮眼概念,甚至一度豪言“讓中國(guó)算力訓(xùn)練出全球一流模型”。
可惜受限于AISC狹窄的應(yīng)用場(chǎng)景,昇騰規(guī)模化落地能力有限,所謂的“用得起、用得好、用得放心”,也因其高昂的應(yīng)用成本變得空泛。
而黃仁勛對(duì)華為的評(píng)價(jià)也頗為耐人尋味,一方面肯定其是一家優(yōu)秀的公司,另一方面又?jǐn)嘌匀虮姸郃SIC項(xiàng)目90%會(huì)失敗。“即便那些未失敗的項(xiàng)目,也很難長(zhǎng)期維持競(jìng)爭(zhēng)力。”
顯然,作為競(jìng)爭(zhēng)對(duì)手,昇騰無(wú)奈應(yīng)驗(yàn)了英偉達(dá)方面的預(yù)言。那么如今對(duì)標(biāo)國(guó)產(chǎn)GPU新秀轉(zhuǎn)向新賽道,GPGPU就一定是昇騰的應(yīng)許之地?答案可能沒那么簡(jiǎn)單。
02
買定離手難回頭,改道GPGPU需過三關(guān)
AISC與GPGPU的算力差異,本質(zhì)上源于底層技術(shù)架構(gòu)乃至生態(tài)層面的路線之別。此路不通掉轉(zhuǎn)車頭固然能重回正軌,但其間需要付出的代價(jià)遠(yuǎn)超外界預(yù)期。
業(yè)內(nèi)有觀點(diǎn)認(rèn)為,在芯片架構(gòu)屬性擇定之初,其算力精度、兼容能力、擴(kuò)展能力及適用場(chǎng)景已基本鎖死。從產(chǎn)品迭進(jìn)角度來看,跨架構(gòu)發(fā)展的難度無(wú)異于在各個(gè)細(xì)分領(lǐng)域從頭來過。而這種異構(gòu)技術(shù)間的隔閡,對(duì)昇騰的換道趕超形成三道現(xiàn)實(shí)關(guān)卡。
最直觀可見的就是時(shí)間代差問題。當(dāng)前,一些國(guó)產(chǎn)GPU已經(jīng)更新了4-6代產(chǎn)品,英偉達(dá)更在H20基礎(chǔ)上最新推出可合規(guī)銷售的新款RTX Pro芯片,目光投向更前沿的人形機(jī)器人領(lǐng)域。在此背景下,市場(chǎng)上很難保障昇騰仍有足夠的趕超窗口期。
其次,NPU在硬件指令集、流水線、存儲(chǔ)層次架構(gòu)等方面,同樣與GPGPU差異明顯。尤其軟件棧可能存在無(wú)法繼承復(fù)用的問題,進(jìn)而導(dǎo)致上層生態(tài)難以兼容。而昇騰投身GPGPU的目的,很大程度也在于兼容CUDA,生態(tài)問題顯然繞不過去。
對(duì)算法層和應(yīng)用層伙伴來說,不同架構(gòu)體系的GPU需要重新適配,這一過程會(huì)產(chǎn)生大量調(diào)優(yōu)接駁工作,無(wú)異于剛裝修好的房子就要推倒重建。大家的生態(tài)參與積極性猶未可知。
最后也是最關(guān)鍵的一點(diǎn),隨著昇騰改弦更張,原有NPU芯片架構(gòu)下的用戶該如何自處?
即便華為愿意折本維保原技術(shù)路線產(chǎn)品,昇騰芯片的更新迭代也是個(gè)難題。而更大的可能是,昇騰團(tuán)隊(duì)投入新架構(gòu)研發(fā)后,NPU軟件棧將停止更新,導(dǎo)致已售的昇騰芯片價(jià)值大打折扣。利益攸關(guān)之下,公司能否在客群質(zhì)疑聲中實(shí)現(xiàn)平穩(wěn)過渡,也要畫一個(gè)問號(hào)。
03
前車之鑒不遠(yuǎn),國(guó)產(chǎn)ARM CPU劇情重演?
歷史總是驚人的相似。很難想象,昇騰觸頂變道的一幕,也曾發(fā)生在鯤鵬、麒麟芯片行列。
國(guó)產(chǎn)CPU發(fā)展初期,本土廠商紛紛引入海外技術(shù)進(jìn)行本土化研發(fā)。彼時(shí),ARM架構(gòu)憑借“有錢就能買”、“低功耗高效率”等優(yōu)勢(shì),迅速引起國(guó)內(nèi)廠商注意。考慮到ARM賽道門檻較低,且在移動(dòng)端市場(chǎng)極具商業(yè)化潛力,華為投入巨資購(gòu)購(gòu)買了ARM V8版本架構(gòu)。
果然,華為后來在手機(jī)市場(chǎng)賺得盆滿缽滿。殊不知,ARM公司也在授權(quán)協(xié)議中埋下引線。
直到2020年,ARM公司為響應(yīng)美國(guó)“芯片禁令”,突然停止了對(duì)華為的后續(xù)授權(quán)許可,鯤鵬、麒麟CPU竟雙雙陷入斷代危機(jī)。外界恍然發(fā)覺,華為與ARM公司簽署的協(xié)議中,嚴(yán)格限制了被授權(quán)方的自研空間,即便在已購(gòu)版本基礎(chǔ)上進(jìn)行自主迭代,也可能涉及侵權(quán)。
公開數(shù)據(jù)顯示,鯤鵬CPU已有近6年時(shí)間未能進(jìn)行代際更新。尤其ARM路線相對(duì)封閉,難以兼容主流生態(tài),隨著公版架構(gòu)持續(xù)更新,鯤鵬越發(fā)難以應(yīng)對(duì)用戶場(chǎng)景的新需求。這與當(dāng)前昇騰面臨的困境簡(jiǎn)直如出一轍,而華為上一次轉(zhuǎn)戰(zhàn)RISC-V的策略至今未見成效。
一方面,華為在ARM賽道投入的資源堪稱海量,沉沒成本難以割舍;另一方面,國(guó)產(chǎn)ARM生態(tài)遷移工作龐雜,即便伙伴愿意跟隨其戰(zhàn)略轉(zhuǎn)移,華為也很難擔(dān)負(fù)起用戶的適配成本。再加之阿里玄鐵等RISC-V先行者已經(jīng)形成規(guī)模優(yōu)勢(shì),中途變道的華為無(wú)形中被已逼至夾角
前車之鑒不遠(yuǎn),今天昇騰的動(dòng)作,很難不讓人聯(lián)想到國(guó)產(chǎn)ARM的戰(zhàn)略失措。相較于追趕摩爾線程、沐曦乃至英偉達(dá),華為在AI芯片賽道的可持續(xù)發(fā)展能力,無(wú)疑更值得考量。畢竟時(shí)間線拉長(zhǎng),“芯片戰(zhàn)爭(zhēng)”不僅是一場(chǎng)淘汰賽,更是一場(chǎng)考驗(yàn)長(zhǎng)跑能力的持久戰(zhàn)。
失速遠(yuǎn)遠(yuǎn)不如失去方向來得可怕。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.