7月26號(hào)上海WAIC大會(huì),華為干了件讓全球AI圈集體"掉下巴"的事:把傳說中的"算力核彈"——昇騰384超節(jié)點(diǎn)真機(jī)搬出來了,當(dāng)場(chǎng)被組委會(huì)按了個(gè)"鎮(zhèn)館之寶"的戳。別以為這是展會(huì)常規(guī)操作,這玩意兒往那一站,等于給全球AI算力行業(yè)扔了顆"規(guī)則炸彈":以前英偉達(dá)NVL72是行業(yè)標(biāo)桿,現(xiàn)在華為直接把標(biāo)桿砍了,立了個(gè)更高的——算力是你1.7倍,帶寬比你高107%,內(nèi)存速度快113%,最狠的是,它把老美玩了幾十年的"馮諾依曼架構(gòu)"給掀了桌子,搞出個(gè)"全對(duì)等架構(gòu)",讓CPU、NPU這些零件直接"手拉手"干活,中間商(傳統(tǒng)中轉(zhuǎn)環(huán)節(jié))全給踹了。這哪是參展?這是華為帶著國(guó)產(chǎn)AI,站在世界舞臺(tái)中央喊:"以前你們定規(guī)矩,現(xiàn)在該我們了!"
一、傳統(tǒng)AI算力:CPU當(dāng)"管家",NPU干活得"打報(bào)告"
要理解華為這波操作多狠,得先說說以前AI算力是怎么"憋屈"干活的。咱們普通人用電腦,CPU(中央處理器)是大腦,管著內(nèi)存、硬盤、顯卡這些"小弟",啥活兒都得它點(diǎn)頭。這就是馮諾依曼架構(gòu),也叫"主從架構(gòu)"——CPU當(dāng)"總管家",其他零件都是"打工人"。
但AI大模型訓(xùn)練可不是普通辦公,數(shù)據(jù)量跟洪水似的。比如訓(xùn)練個(gè)千億參數(shù)大模型,得喂進(jìn)去幾百萬本書的數(shù)據(jù),NPU(AI芯片)是干苦力的主力,可它每次從內(nèi)存拿數(shù)據(jù)、算完再存回去,都得先跟CPU"打報(bào)告":"管家,我要數(shù)據(jù)A""管家,算完了存B區(qū)"。CPU本來就忙,還得處理這些"申請(qǐng)",一來一回,時(shí)間全耗在"等審批"上了。就像你家小區(qū)只有一個(gè)大門,所有人上班上學(xué)都得從這過,保安(CPU)還得挨個(gè)查通行證,哪怕你家住門口(NPU),也得排半小時(shí)隊(duì)——這效率能高嗎?
英偉達(dá)以前的NVL72超節(jié)點(diǎn)方案,說白了就是"多開幾個(gè)小門":多塞點(diǎn)CPU和NPU,用更快的總線連起來,但"主從架構(gòu)"的根子沒動(dòng)。就像小區(qū)堵車,它不修新路,只加幾個(gè)保安,結(jié)果還是堵,頂多從堵1小時(shí)變成堵40分鐘。行業(yè)里都知道這是"治標(biāo)不治本",但沒辦法,老美技術(shù)壟斷,大家只能捏著鼻子用。
二、華為"全對(duì)等架構(gòu)":拆了"管家"辦公室,零件們直接"串門"
華為昇騰384超節(jié)點(diǎn)最狠的,就是把這"管家制度"給廢了——CPU、NPU、DPU、內(nèi)存、存儲(chǔ),大家全是"平級(jí)同事",誰也不用給誰打報(bào)告,直接"串門"溝通。
這靠的是個(gè)叫MatrixLink的高速互聯(lián)總線,你可以理解成給每個(gè)零件裝了"直達(dá)電梯"。以前數(shù)據(jù)從NPU到內(nèi)存,得走"CPU審批通道",現(xiàn)在直接坐電梯直達(dá),中間沒有任何中轉(zhuǎn)環(huán)節(jié)。就像小區(qū)拆了圍墻和大門,每家每戶陽臺(tái)之間架個(gè)滑索,你想借瓶醬油直接滑到鄰居家,不用繞路,不用打招呼,效率直接拉滿。
具體咋實(shí)現(xiàn)的?昇騰384超節(jié)點(diǎn)由12個(gè)計(jì)算柜和4個(gè)總線柜組成,384張NPU卡通過MatrixLink連在一起,形成一臺(tái)超級(jí)"AI服務(wù)器"。傳統(tǒng)超節(jié)點(diǎn)是"一堆服務(wù)器湊一起",華為這是"把一堆服務(wù)器焊成一個(gè)整體"。打個(gè)比方,英偉達(dá)的NVL72是"拼樂高",零件能拆能裝但有縫隙;華為這是"澆筑混凝土",所有零件長(zhǎng)在一起,強(qiáng)度和效率根本不是一個(gè)量級(jí)。
三、數(shù)據(jù)說話:算力1.7倍、帶寬翻倍,英偉達(dá)方案直接"過時(shí)"
光說架構(gòu)創(chuàng)新太空泛,咱們看干貨數(shù)據(jù)——這才是華為敢叫板英偉達(dá)的底氣。
昇騰384超節(jié)點(diǎn)算力總規(guī)模300Pflops(每秒300億億次浮點(diǎn)運(yùn)算),英偉達(dá)NVL72是多少?176Pflops。1.7倍是什么概念?別人跑100米,華為跑170米,還比你先到終點(diǎn)。要是用這算力訓(xùn)練大模型,以前練個(gè)千億參數(shù)模型得半年,現(xiàn)在可能3個(gè)月就搞定,效率直接翻倍。
網(wǎng)絡(luò)互聯(lián)總帶寬269TB/s,比NVL72高107%——相當(dāng)于別人水管直徑10厘米,華為直接上20厘米,還帶渦輪增壓。數(shù)據(jù)傳輸速度快到啥程度?全球70億人同時(shí)給你發(fā)微信,你手機(jī)一秒鐘全收完,還不卡。
內(nèi)存總帶寬1229TB/s,比NVL72高113%。內(nèi)存是NPU的"工作臺(tái)",帶寬越高,NPU拿數(shù)據(jù)越方便。以前NPU算到一半發(fā)現(xiàn)"數(shù)據(jù)沒拿夠",得等內(nèi)存慢吞吞送過來;現(xiàn)在內(nèi)存像長(zhǎng)在NPU身上,伸手就有,干活不中斷。
最絕的是單卡推理吞吐量:2300 Tokens/s。啥意思?你用AI寫報(bào)告,以前打100字得等2秒,現(xiàn)在剛打完字,AI已經(jīng)把300字的回復(fù)甩你臉上了,比你對(duì)象回微信還快。
更狠的是擴(kuò)展性——這單個(gè)超節(jié)點(diǎn)只是個(gè)"樂高積木",能拼起來變成更大的"超級(jí)集群"。華為說,通過最佳負(fù)載均衡組網(wǎng),能擴(kuò)展到包含數(shù)萬張卡的Atlas 900 SuperCluster,以后訓(xùn)練萬億、百萬億參數(shù)大模型,不用再求著英偉達(dá)租算力,國(guó)產(chǎn)自己就能搞定。
四、不止快,還"省料":硬件沒變,靠系統(tǒng)優(yōu)化彌補(bǔ)"芯片制程差"
可能有人問:"華為芯片制程是7納米吧?英偉達(dá)都5納米、3納米了,為啥算力還能反超?"
這就說到華為的"系統(tǒng)工程魔法"了。華為專家說得實(shí)在:"單芯片制程從7納米到2納米,每代性能提升不超過20%,總體也就50%。但通過系統(tǒng)工程優(yōu)化,提升芯片算力利用率,硬件沒變,效率能翻好幾倍。"
這話翻譯成人話:別人用同樣的食材(芯片制程),只能做家常菜,華為能做成滿漢全席。比如傳統(tǒng)集群NPU算力利用率可能只有50%(一半算力浪費(fèi)在等數(shù)據(jù)、等CPU審批上),華為通過"全對(duì)等架構(gòu)"和資源池化,把利用率提到90%以上——相當(dāng)于100張卡當(dāng)180張用。
這才是真·降維打擊!老美卡我們芯片制程?沒關(guān)系,我們通過架構(gòu)創(chuàng)新,把同樣硬件的潛力榨干,照樣比你強(qiáng)。就像兩個(gè)人跑步,你穿名牌跑鞋(先進(jìn)制程),我穿普通鞋,但我掌握了"博爾特式"跑步技巧(架構(gòu)優(yōu)化),照樣跑得比你快。
五、生態(tài)才是王炸:80個(gè)大模型、6000個(gè)方案,帶著"兄弟們"一起干
光自己技術(shù)牛不算本事,能帶著整個(gè)行業(yè)一起牛才是真大佬。華為昇騰這幾年沒光搞硬件,生態(tài)鋪得飛起。
現(xiàn)在基于昇騰適配的大模型超過80個(gè),訊飛星火、DeepSeek、Qwen、鵬城這些咱們聽過的AI,背后都有昇騰的影子。基礎(chǔ)大模型、多模態(tài)模型、行業(yè)垂類模型,啥都有,相當(dāng)于華為開了個(gè)"大模型菜市場(chǎng)",你想要啥菜(模型)都能買到,不用自己費(fèi)勁開荒。
合作伙伴2700多家,行業(yè)解決方案6000多個(gè),覆蓋互聯(lián)網(wǎng)、金融、醫(yī)療、交通等11大行業(yè)。比如醫(yī)院用昇騰搞AI影像識(shí)別,以前醫(yī)生看CT片得半小時(shí),現(xiàn)在AI 5分鐘標(biāo)出病灶;油氣公司用它搞勘探,以前得鉆10口井才找到油田,現(xiàn)在AI算一算,3口井就搞定,成本直接砍半。
這就是華為聰明的地方:不搞"技術(shù)孤島",而是搭個(gè)平臺(tái),讓大家都能上車。就像當(dāng)年安卓系統(tǒng)帶著全球手機(jī)廠商干翻諾基亞,現(xiàn)在昇騰也在帶著國(guó)產(chǎn)AI廠商,從"單打獨(dú)斗"變成"集團(tuán)作戰(zhàn)"——英偉達(dá)想再靠技術(shù)壟斷卡脖子?難了,咱們?nèi)硕鄤?shì)眾,還都用著華為的"武器"(算力底座),組隊(duì)跟你干!
六、普通人能感受到啥?AI服務(wù)更便宜、更智能,"算力自由"不遠(yuǎn)了
可能有人說:"這玩意兒這么高端,跟我有啥關(guān)系?"關(guān)系大了去了!
首先,AI服務(wù)會(huì)更便宜。以前算力貴,AI公司訓(xùn)練大模型成本高,服務(wù)自然收費(fèi)貴(比如AI繪畫按張收錢、AI寫報(bào)告按次收費(fèi))。現(xiàn)在華為把算力成本打下來了,以后咱們用AI翻譯、AI剪輯視頻、AI輔導(dǎo)作業(yè),可能跟現(xiàn)在用微信一樣免費(fèi)——就像十幾年前上網(wǎng)費(fèi)貴得要死,現(xiàn)在光纖入戶隨便用,一個(gè)道理。
其次,AI會(huì)更智能。算力上去了,大模型參數(shù)能做得更大,訓(xùn)練數(shù)據(jù)能喂得更多。比如現(xiàn)在AI聊天偶爾"答非所問",以后可能比你對(duì)象還懂你;現(xiàn)在AI看病只能輔助診斷,以后可能直接給你開藥方(當(dāng)然得醫(yī)生審核,但效率會(huì)高N倍)。
最后,國(guó)產(chǎn)技術(shù)自信。以前說起AI算力,咱們總覺得"老美第一,我們追趕",現(xiàn)在華為直接把"追趕"變成"領(lǐng)跑"。這背后是中國(guó)科技企業(yè)從"技術(shù)跟隨"到"技術(shù)定義"的跨越——以前別人定規(guī)則,我們跟著玩;現(xiàn)在我們自己定規(guī)則,別人得跟著學(xué)。這種自信,會(huì)滲透到各行各業(yè):從芯片到軟件,從手機(jī)到汽車,咱們會(huì)越來越少聽到"卡脖子",越來越多聽到"中國(guó)方案"。
結(jié)語:不是"彎道超車",是"換道領(lǐng)跑"
華為昇騰384超節(jié)點(diǎn)的出現(xiàn),本質(zhì)上不是"彎道超車",而是"換道領(lǐng)跑"。老美在"主從架構(gòu)"賽道上跑了幾十年,以為自己是永遠(yuǎn)的第一,華為偏不跟著跑,直接開了條"全對(duì)等架構(gòu)"的新路,然后告訴世界:"這條路更快,你們趕緊跟上。"
這才是真正的創(chuàng)新——不被既有規(guī)則捆住手腳,敢想敢干。從被制裁時(shí)"把寒氣傳遞給每個(gè)人",到現(xiàn)在甩出"算力核彈"讓全球側(cè)目,華為用行動(dòng)證明:技術(shù)封鎖打不垮中國(guó)企業(yè),反而會(huì)逼出更強(qiáng)的創(chuàng)新。
以后再有人說"國(guó)產(chǎn)AI不行",你可以把昇騰384的數(shù)據(jù)甩他臉上:算力1.7倍、帶寬翻倍、架構(gòu)領(lǐng)先,這還不行?那啥叫行?
最后說句掏心窩子的話:咱們普通人可能看不懂那些技術(shù)參數(shù),但得明白一個(gè)道理——國(guó)家科技強(qiáng)大了,咱們腰桿才能更硬,生活才能更好。華為這次沒讓我們失望,下次,還會(huì)有更多"華為"讓世界驚艷。這,就是中國(guó)科技的底氣。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.