網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

華為甩出“算力核彈”，國(guó)產(chǎn)AI崛起，英偉達(dá)慌了？

2025-07-27 18:47:33　來源: 呼呼歷史論

遼寧舉報(bào)

分享至

7月26號(hào)上海WAIC大會(huì)，華為干了件讓全球AI圈集體"掉下巴"的事：把傳說中的"算力核彈"——昇騰384超節(jié)點(diǎn)真機(jī)搬出來了，當(dāng)場(chǎng)被組委會(huì)按了個(gè)"鎮(zhèn)館之寶"的戳。別以為這是展會(huì)常規(guī)操作，這玩意兒往那一站，等于給全球AI算力行業(yè)扔了顆"規(guī)則炸彈"：以前英偉達(dá)NVL72是行業(yè)標(biāo)桿，現(xiàn)在華為直接把標(biāo)桿砍了，立了個(gè)更高的——算力是你1.7倍，帶寬比你高107%，內(nèi)存速度快113%，最狠的是，它把老美玩了幾十年的"馮諾依曼架構(gòu)"給掀了桌子，搞出個(gè)"全對(duì)等架構(gòu)"，讓CPU、NPU這些零件直接"手拉手"干活，中間商（傳統(tǒng)中轉(zhuǎn)環(huán)節(jié)）全給踹了。這哪是參展？這是華為帶著國(guó)產(chǎn)AI，站在世界舞臺(tái)中央喊："以前你們定規(guī)矩，現(xiàn)在該我們了！"

一、傳統(tǒng)AI算力：CPU當(dāng)"管家"，NPU干活得"打報(bào)告"

要理解華為這波操作多狠，得先說說以前AI算力是怎么"憋屈"干活的。咱們普通人用電腦，CPU（中央處理器）是大腦，管著內(nèi)存、硬盤、顯卡這些"小弟"，啥活兒都得它點(diǎn)頭。這就是馮諾依曼架構(gòu)，也叫"主從架構(gòu)"——CPU當(dāng)"總管家"，其他零件都是"打工人"。

但AI大模型訓(xùn)練可不是普通辦公，數(shù)據(jù)量跟洪水似的。比如訓(xùn)練個(gè)千億參數(shù)大模型，得喂進(jìn)去幾百萬本書的數(shù)據(jù)，NPU（AI芯片）是干苦力的主力，可它每次從內(nèi)存拿數(shù)據(jù)、算完再存回去，都得先跟CPU"打報(bào)告"："管家，我要數(shù)據(jù)A""管家，算完了存B區(qū)"。CPU本來就忙，還得處理這些"申請(qǐng)"，一來一回，時(shí)間全耗在"等審批"上了。就像你家小區(qū)只有一個(gè)大門，所有人上班上學(xué)都得從這過，保安（CPU）還得挨個(gè)查通行證，哪怕你家住門口（NPU），也得排半小時(shí)隊(duì)——這效率能高嗎？

英偉達(dá)以前的NVL72超節(jié)點(diǎn)方案，說白了就是"多開幾個(gè)小門"：多塞點(diǎn)CPU和NPU，用更快的總線連起來，但"主從架構(gòu)"的根子沒動(dòng)。就像小區(qū)堵車，它不修新路，只加幾個(gè)保安，結(jié)果還是堵，頂多從堵1小時(shí)變成堵40分鐘。行業(yè)里都知道這是"治標(biāo)不治本"，但沒辦法，老美技術(shù)壟斷，大家只能捏著鼻子用。

二、華為"全對(duì)等架構(gòu)"：拆了"管家"辦公室，零件們直接"串門"

華為昇騰384超節(jié)點(diǎn)最狠的，就是把這"管家制度"給廢了——CPU、NPU、DPU、內(nèi)存、存儲(chǔ)，大家全是"平級(jí)同事"，誰也不用給誰打報(bào)告，直接"串門"溝通。

這靠的是個(gè)叫MatrixLink的高速互聯(lián)總線，你可以理解成給每個(gè)零件裝了"直達(dá)電梯"。以前數(shù)據(jù)從NPU到內(nèi)存，得走"CPU審批通道"，現(xiàn)在直接坐電梯直達(dá)，中間沒有任何中轉(zhuǎn)環(huán)節(jié)。就像小區(qū)拆了圍墻和大門，每家每戶陽臺(tái)之間架個(gè)滑索，你想借瓶醬油直接滑到鄰居家，不用繞路，不用打招呼，效率直接拉滿。

具體咋實(shí)現(xiàn)的？昇騰384超節(jié)點(diǎn)由12個(gè)計(jì)算柜和4個(gè)總線柜組成，384張NPU卡通過MatrixLink連在一起，形成一臺(tái)超級(jí)"AI服務(wù)器"。傳統(tǒng)超節(jié)點(diǎn)是"一堆服務(wù)器湊一起"，華為這是"把一堆服務(wù)器焊成一個(gè)整體"。打個(gè)比方，英偉達(dá)的NVL72是"拼樂高"，零件能拆能裝但有縫隙；華為這是"澆筑混凝土"，所有零件長(zhǎng)在一起，強(qiáng)度和效率根本不是一個(gè)量級(jí)。

三、數(shù)據(jù)說話：算力1.7倍、帶寬翻倍，英偉達(dá)方案直接"過時(shí)"

光說架構(gòu)創(chuàng)新太空泛，咱們看干貨數(shù)據(jù)——這才是華為敢叫板英偉達(dá)的底氣。

昇騰384超節(jié)點(diǎn)算力總規(guī)模300Pflops（每秒300億億次浮點(diǎn)運(yùn)算），英偉達(dá)NVL72是多少？176Pflops。1.7倍是什么概念？別人跑100米，華為跑170米，還比你先到終點(diǎn)。要是用這算力訓(xùn)練大模型，以前練個(gè)千億參數(shù)模型得半年，現(xiàn)在可能3個(gè)月就搞定，效率直接翻倍。

網(wǎng)絡(luò)互聯(lián)總帶寬269TB/s，比NVL72高107%——相當(dāng)于別人水管直徑10厘米，華為直接上20厘米，還帶渦輪增壓。數(shù)據(jù)傳輸速度快到啥程度？全球70億人同時(shí)給你發(fā)微信，你手機(jī)一秒鐘全收完，還不卡。

內(nèi)存總帶寬1229TB/s，比NVL72高113%。內(nèi)存是NPU的"工作臺(tái)"，帶寬越高，NPU拿數(shù)據(jù)越方便。以前NPU算到一半發(fā)現(xiàn)"數(shù)據(jù)沒拿夠"，得等內(nèi)存慢吞吞送過來；現(xiàn)在內(nèi)存像長(zhǎng)在NPU身上，伸手就有，干活不中斷。

最絕的是單卡推理吞吐量：2300 Tokens/s。啥意思？你用AI寫報(bào)告，以前打100字得等2秒，現(xiàn)在剛打完字，AI已經(jīng)把300字的回復(fù)甩你臉上了，比你對(duì)象回微信還快。

更狠的是擴(kuò)展性——這單個(gè)超節(jié)點(diǎn)只是個(gè)"樂高積木"，能拼起來變成更大的"超級(jí)集群"。華為說，通過最佳負(fù)載均衡組網(wǎng)，能擴(kuò)展到包含數(shù)萬張卡的Atlas 900 SuperCluster，以后訓(xùn)練萬億、百萬億參數(shù)大模型，不用再求著英偉達(dá)租算力，國(guó)產(chǎn)自己就能搞定。

四、不止快，還"省料"：硬件沒變，靠系統(tǒng)優(yōu)化彌補(bǔ)"芯片制程差"

可能有人問："華為芯片制程是7納米吧？英偉達(dá)都5納米、3納米了，為啥算力還能反超？"

這就說到華為的"系統(tǒng)工程魔法"了。華為專家說得實(shí)在："單芯片制程從7納米到2納米，每代性能提升不超過20%，總體也就50%。但通過系統(tǒng)工程優(yōu)化，提升芯片算力利用率，硬件沒變，效率能翻好幾倍。"

這話翻譯成人話：別人用同樣的食材（芯片制程），只能做家常菜，華為能做成滿漢全席。比如傳統(tǒng)集群NPU算力利用率可能只有50%（一半算力浪費(fèi)在等數(shù)據(jù)、等CPU審批上），華為通過"全對(duì)等架構(gòu)"和資源池化，把利用率提到90%以上——相當(dāng)于100張卡當(dāng)180張用。

這才是真·降維打擊！老美卡我們芯片制程？沒關(guān)系，我們通過架構(gòu)創(chuàng)新，把同樣硬件的潛力榨干，照樣比你強(qiáng)。就像兩個(gè)人跑步，你穿名牌跑鞋（先進(jìn)制程），我穿普通鞋，但我掌握了"博爾特式"跑步技巧（架構(gòu)優(yōu)化），照樣跑得比你快。

五、生態(tài)才是王炸：80個(gè)大模型、6000個(gè)方案，帶著"兄弟們"一起干

光自己技術(shù)牛不算本事，能帶著整個(gè)行業(yè)一起牛才是真大佬。華為昇騰這幾年沒光搞硬件，生態(tài)鋪得飛起。

現(xiàn)在基于昇騰適配的大模型超過80個(gè)，訊飛星火、DeepSeek、Qwen、鵬城這些咱們聽過的AI，背后都有昇騰的影子。基礎(chǔ)大模型、多模態(tài)模型、行業(yè)垂類模型，啥都有，相當(dāng)于華為開了個(gè)"大模型菜市場(chǎng)"，你想要啥菜（模型）都能買到，不用自己費(fèi)勁開荒。

合作伙伴2700多家，行業(yè)解決方案6000多個(gè)，覆蓋互聯(lián)網(wǎng)、金融、醫(yī)療、交通等11大行業(yè)。比如醫(yī)院用昇騰搞AI影像識(shí)別，以前醫(yī)生看CT片得半小時(shí)，現(xiàn)在AI 5分鐘標(biāo)出病灶；油氣公司用它搞勘探，以前得鉆10口井才找到油田，現(xiàn)在AI算一算，3口井就搞定，成本直接砍半。

這就是華為聰明的地方：不搞"技術(shù)孤島"，而是搭個(gè)平臺(tái)，讓大家都能上車。就像當(dāng)年安卓系統(tǒng)帶著全球手機(jī)廠商干翻諾基亞，現(xiàn)在昇騰也在帶著國(guó)產(chǎn)AI廠商，從"單打獨(dú)斗"變成"集團(tuán)作戰(zhàn)"——英偉達(dá)想再靠技術(shù)壟斷卡脖子？難了，咱們?nèi)硕鄤?shì)眾，還都用著華為的"武器"（算力底座），組隊(duì)跟你干！

六、普通人能感受到啥？AI服務(wù)更便宜、更智能，"算力自由"不遠(yuǎn)了

可能有人說："這玩意兒這么高端，跟我有啥關(guān)系？"關(guān)系大了去了！

首先，AI服務(wù)會(huì)更便宜。以前算力貴，AI公司訓(xùn)練大模型成本高，服務(wù)自然收費(fèi)貴（比如AI繪畫按張收錢、AI寫報(bào)告按次收費(fèi)）。現(xiàn)在華為把算力成本打下來了，以后咱們用AI翻譯、AI剪輯視頻、AI輔導(dǎo)作業(yè)，可能跟現(xiàn)在用微信一樣免費(fèi)——就像十幾年前上網(wǎng)費(fèi)貴得要死，現(xiàn)在光纖入戶隨便用，一個(gè)道理。

其次，AI會(huì)更智能。算力上去了，大模型參數(shù)能做得更大，訓(xùn)練數(shù)據(jù)能喂得更多。比如現(xiàn)在AI聊天偶爾"答非所問"，以后可能比你對(duì)象還懂你；現(xiàn)在AI看病只能輔助診斷，以后可能直接給你開藥方（當(dāng)然得醫(yī)生審核，但效率會(huì)高N倍）。

最后，國(guó)產(chǎn)技術(shù)自信。以前說起AI算力，咱們總覺得"老美第一，我們追趕"，現(xiàn)在華為直接把"追趕"變成"領(lǐng)跑"。這背后是中國(guó)科技企業(yè)從"技術(shù)跟隨"到"技術(shù)定義"的跨越——以前別人定規(guī)則，我們跟著玩；現(xiàn)在我們自己定規(guī)則，別人得跟著學(xué)。這種自信，會(huì)滲透到各行各業(yè)：從芯片到軟件，從手機(jī)到汽車，咱們會(huì)越來越少聽到"卡脖子"，越來越多聽到"中國(guó)方案"。

結(jié)語：不是"彎道超車"，是"換道領(lǐng)跑"

華為昇騰384超節(jié)點(diǎn)的出現(xiàn)，本質(zhì)上不是"彎道超車"，而是"換道領(lǐng)跑"。老美在"主從架構(gòu)"賽道上跑了幾十年，以為自己是永遠(yuǎn)的第一，華為偏不跟著跑，直接開了條"全對(duì)等架構(gòu)"的新路，然后告訴世界："這條路更快，你們趕緊跟上。"

這才是真正的創(chuàng)新——不被既有規(guī)則捆住手腳，敢想敢干。從被制裁時(shí)"把寒氣傳遞給每個(gè)人"，到現(xiàn)在甩出"算力核彈"讓全球側(cè)目，華為用行動(dòng)證明：技術(shù)封鎖打不垮中國(guó)企業(yè)，反而會(huì)逼出更強(qiáng)的創(chuàng)新。

以后再有人說"國(guó)產(chǎn)AI不行"，你可以把昇騰384的數(shù)據(jù)甩他臉上：算力1.7倍、帶寬翻倍、架構(gòu)領(lǐng)先，這還不行？那啥叫行？

最后說句掏心窩子的話：咱們普通人可能看不懂那些技術(shù)參數(shù)，但得明白一個(gè)道理——國(guó)家科技強(qiáng)大了，咱們腰桿才能更硬，生活才能更好。華為這次沒讓我們失望，下次，還會(huì)有更多"華為"讓世界驚艷。這，就是中國(guó)科技的底氣。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.