GPU的發(fā)展史上存在一個很難繞開的名字那就是英偉達(dá)。英偉達(dá)之所以能夠占據(jù)GPU領(lǐng)域的絕對霸主地位是因?yàn)樗鼡碛袕?qiáng)大的GPU算力、CUDA生態(tài)、以及高速互聯(lián)技術(shù)三板斧。英偉達(dá)不僅重新定義了圖形處理技術(shù),也為自己構(gòu)筑了足夠強(qiáng)大的護(hù)城河。
大模型的火爆,GPU已成為科技賽道炙手可熱的“硬通貨”。美國不斷擴(kuò)大的芯片禁令,讓原本就前途未知的中國半導(dǎo)體市場前景更加撲朔迷離。在這種卡脖子的尷尬處境下中國半導(dǎo)體行業(yè)廠家如何翻越英偉達(dá)這座高山實(shí)現(xiàn)突圍是當(dāng)下橫在每個半導(dǎo)體行業(yè)人眼前的難題。
面對歐美的科技鐵幕,群雄逐鹿成為國內(nèi)AI芯片產(chǎn)業(yè)的主基調(diào)。國產(chǎn)自研GPU,換皮GPU,一時之間亂象叢生。GPGPU、通用GPU、全功能GPU、圖形GPU、渲染GPU、GPU+……在國內(nèi),GPU命名上的文字游戲已經(jīng)被玩出花來。
目前國內(nèi)GPU芯片就功能來說大致分為三類,AI、HPC、渲染。AI就是英偉達(dá)近年推出的一系列用于深度學(xué)習(xí)的加速卡。HPC則是那些用在超算上的加速卡,支持雙精度的浮點(diǎn)數(shù)運(yùn)算,可以做科學(xué)計算。渲染就是比較傳統(tǒng)的做游戲、做桌面,做各種圖形化應(yīng)用。
·而對標(biāo)的國內(nèi)GPU廠家分類大致可分為,通用型全功能GPU:兼顧通用計算、AI加速計算和圖形渲染功能的GPU,如摩爾線程。
·GPGPU:去掉圖形渲染模塊、專注在加速計算的GPU,典型產(chǎn)品包括了壁仞B(yǎng)R100、天數(shù)智芯、瀚博、沐曦等。
·DSA芯片:專注于解決某一特定領(lǐng)域或應(yīng)用的需求,有著定制化的硬件和軟件。這里的代表是百度昆侖、燧原、寒武紀(jì)、阿里含光等。
那么后來者如何迎頭趕上?目前國產(chǎn)GPU與英偉達(dá)之間是否還存在天塹一般的差距?致力于成為”平替“的國產(chǎn)GPU算力困境集中在哪里?
首先,任何的GPU算力卡,拋開需求去談性能都是在耍流氓。浮點(diǎn)計算能力通常用來衡量GPU在執(zhí)行浮點(diǎn)運(yùn)算時的性能。而衡量浮點(diǎn)計算性能通常會考慮其單精度和雙精度浮點(diǎn)計算能力。
單精度和雙精度是指浮點(diǎn)數(shù)在計算機(jī)中的存儲方式和精度。單精度通常使用32位(4字節(jié))來存儲一個浮點(diǎn)數(shù),而雙精度則使用64位(8字節(jié))來存儲。由于雙精度使用了更多的更多的位數(shù)來存儲數(shù)值,因此它可以表示更大范圍的數(shù)值,并在計算過程中具有更高的精度。英偉達(dá)的A100同時具備上述兩類能力。
大模型訓(xùn)練需要處理高顆粒度的信息,因此對于用于大模型訓(xùn)練的GPU芯片處理信息的精細(xì)度和算力速度要求更高,然而現(xiàn)階段國產(chǎn)的GPU多為單精度,在支撐大模型訓(xùn)練方面能力稍差。
其次在于軟件工具鏈的完善。眾所周知,芯片需要適配硬件系統(tǒng)、工具鏈、編譯器等多個層級,否則會出現(xiàn)這款芯片在某個場景能跑出90%的算力,在另一場景只能跑出80%效能的情景。而目前國內(nèi)的GPU廠家還不具備這樣繁榮的生態(tài)鏈,來支持開發(fā)人員進(jìn)行GPU程序地開發(fā)、調(diào)試和優(yōu)化。時至今日,英偉達(dá)的CUDA已成為全球AI基礎(chǔ)設(shè)施工具,主流的AI框架、庫、工具都以CUDA為基礎(chǔ)進(jìn)行開發(fā)。
還有一個更為重要的點(diǎn)在于目前英偉達(dá)還在不斷地縮減用戶成本。從單卡的價格來看,英偉達(dá)現(xiàn)在一卡難求,價格也隨之水漲船高,但從后續(xù)的大模型訓(xùn)練效率來審視就會發(fā)現(xiàn)英偉達(dá)的卡雖貴但效率絕無非議,就Blackwell架構(gòu)的GB100芯片而言,相比于H100,將成本和能源消耗降至1/25,在參數(shù)為1750億的GPT-3 LLM基準(zhǔn)測試中,GB200的性能達(dá)到了H100的7倍,因此黃老板有句著名發(fā)言:“買的越多,省的越多”,在一定的層面上是正確的。
暴雨深耕服務(wù)器領(lǐng)域9年,是AI產(chǎn)業(yè)鏈中的基礎(chǔ)算力設(shè)施的提供商,為了滿足客戶智能化轉(zhuǎn)型需求,暴雨打造了堅實(shí)的人工智能算力底座以及AI私有化解決方案。除此之外,暴雨通過生態(tài)系統(tǒng)的深度融合與多方資源的協(xié)同合作,打造市場差異化能力,目前暴雨的AI服務(wù)器適配市面上絕大多數(shù)的國產(chǎn)GPU算力卡,且能根據(jù)客戶需求進(jìn)行提供定制化服務(wù),助力加速實(shí)現(xiàn)國內(nèi)智算資源供給自主可控。
短時間超越英偉達(dá)幾乎是一件不可能完成的事情。蚍蜉尚能撼樹,英偉達(dá)并非毫無裂縫,科技巨頭圍堵,控告技術(shù)壟斷等等。當(dāng)前國家政策的大力扶持,從安全性以及自主可控的角度來考慮,GPU自研賽道都是長坡厚雪。但不管如何,國產(chǎn)算力化的大門正在徐徐打開。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.