近日,華為創(chuàng)始人任正非在深圳接受《人民日?qǐng)?bào)》專訪時(shí),談到了芯片技術(shù)差距上的問題。
對(duì)于芯片技術(shù),任正非明確表示“華為單芯片還是落后美國(guó)一代”,但緊接著話鋒一轉(zhuǎn)說(shuō):“我們用數(shù)學(xué)補(bǔ)物理、非摩爾補(bǔ)摩爾,用群計(jì)算補(bǔ)單芯片,在結(jié)果上也能達(dá)到實(shí)用狀況。 ”
是的,這幾年華為技術(shù)團(tuán)隊(duì)提出了“用數(shù)學(xué)補(bǔ)物理”、“非摩爾定律補(bǔ)摩爾定律”、“用系統(tǒng)補(bǔ)單點(diǎn)” 三大創(chuàng)新思想,成功打造出了“超節(jié)點(diǎn)+集群”系統(tǒng)算力解決方案。
而這個(gè)“超節(jié)點(diǎn)+集群”系統(tǒng),就是華為的昇騰CloudMatrix 384超節(jié)點(diǎn),這是華為全棧100%國(guó)產(chǎn)化自研的全球最大AI超節(jié)點(diǎn),它的出現(xiàn)成功撕開了被英偉達(dá)壟斷的缺口。
華為CloudMatrix 384實(shí)現(xiàn)彎道超車。
2025年4月,在安徽蕪湖舉行的華為云生態(tài)大會(huì)上,華為常務(wù)董事、云計(jì)算CEO張平安揭開了CloudMatrix 384的神秘面紗。
這個(gè)由384張昇騰算力卡組成的超節(jié)點(diǎn)集群,單集群算力高達(dá)300PFlops,較英偉達(dá)NVL72的180PFlops高出67%,內(nèi)存帶寬達(dá)到后者的2.1倍,互聯(lián)帶寬提升至2.8Tbps,斷點(diǎn)恢復(fù)時(shí)間縮短至10秒級(jí),多項(xiàng)指標(biāo)創(chuàng)下全球商用AI算力集群的新紀(jì)錄。
在單顆昇騰芯片性能約為英偉達(dá)Blackwell架構(gòu)GPU三分之一的情況下,華為選擇了截然不同的技術(shù)路徑,通過(guò)超大規(guī)模集群設(shè)計(jì)實(shí)現(xiàn)系統(tǒng)級(jí)突破。
華為依托6812個(gè)400G光模塊構(gòu)建的超高速互聯(lián)網(wǎng)絡(luò),使數(shù)據(jù)在384張卡間近乎無(wú)損流動(dòng),訓(xùn)練效率逼近單卡性能的90%,遠(yuǎn)高于傳統(tǒng)架構(gòu)60%-70%的水平。
據(jù)SemiAnalysis披露,華為云CM384基于384顆昇騰芯片構(gòu)建,可提供高達(dá)300 PFLOPs的密集BF16算力,接近達(dá)到英偉達(dá)GB200 NVL72系統(tǒng)的兩倍。
而這一技術(shù),便是在美國(guó)持續(xù)技術(shù)封鎖的背景下取得的突破,硅基流動(dòng)基于該平臺(tái)部署的DeepSeek-R1模型實(shí)現(xiàn)了單卡解碼吞吐1920Tokens/s,與英偉達(dá)H100部署性能相當(dāng)。
英偉達(dá)霸主地位將遭遇最強(qiáng)挑戰(zhàn)。
華為的迅猛崛起已經(jīng)引起英偉達(dá)高層的高度警覺,今年以來(lái),英偉達(dá)CEO黃仁勛已數(shù)次提起華為,并將華為視作最大的競(jìng)爭(zhēng)對(duì)手之一。
黃仁勛近日還明確表示:“從技術(shù)參數(shù)看,華為的CloudMatrix 384超節(jié)點(diǎn),性能上甚至超越了英偉達(dá),比英偉達(dá)的尖端技術(shù)更具優(yōu)勢(shì),因此我們必須高度重視這家實(shí)力雄厚的公司,全力以赴應(yīng)對(duì)挑戰(zhàn)。”
黃仁勛的這番表態(tài),被業(yè)界視為美國(guó)AI芯片巨頭對(duì)中國(guó)競(jìng)爭(zhēng)對(duì)手技術(shù)實(shí)力的首次公開認(rèn)可。
全球算力市場(chǎng)格局有望被重構(gòu)!
對(duì)于華為來(lái)說(shuō),CloudMatrix 384的野心遠(yuǎn)不止于技術(shù)對(duì)標(biāo),而是規(guī)劃著中國(guó)科技產(chǎn)業(yè)參與全球規(guī)則制定的深層戰(zhàn)略,正如華為在5G通信領(lǐng)域制定標(biāo)準(zhǔn)一樣。
接下來(lái)華為將通過(guò)超節(jié)點(diǎn)架構(gòu)倒逼行業(yè)放棄“單卡性能競(jìng)賽”,將競(jìng)爭(zhēng)焦點(diǎn)轉(zhuǎn)向集群效率、TCO(總擁有成本)和生態(tài)協(xié)同度。
這就意味著,過(guò)去緊盯制程工藝、單卡算力、顯存容量的方向接下來(lái)要發(fā)生變化了,算力集群的有效利用率、斷點(diǎn)恢復(fù)速度和生態(tài)協(xié)同度才是未來(lái)關(guān)注的方向,先進(jìn)工藝真不重要了。
同時(shí)華為還要以集群優(yōu)勢(shì)吸引AI企業(yè)加入昇騰體系,形成硬件-軟件-模型閉環(huán),目前華為開發(fā)者規(guī)模超1200萬(wàn),伙伴數(shù)量4.5萬(wàn),云商店應(yīng)用1.2萬(wàn),正在打造可與CUDA抗衡的替代方案。
很顯然,在華為等中國(guó)科技公司的努力下,接下來(lái)的算力世界大戰(zhàn),中國(guó)廠商將首次站到制定規(guī)則的位置上,隨著CloudMatrix 384的上線計(jì)劃推進(jìn),全球AI產(chǎn)業(yè)壟斷將徹底被打破
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.