當(dāng)有些科技巨頭還在為“千卡級(jí)”AI集群爭(zhēng)得頭破血流時(shí),5月25日,華為正式推出“昇騰超節(jié)點(diǎn)技術(shù)”,單集群384張AI加速卡互聯(lián),通信帶寬暴漲15倍,時(shí)延驟降10倍。
這組數(shù)據(jù)放在任何科技媒體頭條都足夠炸裂。
384張卡“擰成一股繩”,華為在造什么“怪物”?
想象一下,384臺(tái)高性能AI加速卡同時(shí)工作是什么概念?傳統(tǒng)數(shù)據(jù)中心里,這些芯片往往分散在不同機(jī)柜,靠網(wǎng)線“隔空喊話”,數(shù)據(jù)跑個(gè)來(lái)回堪比跨省快遞。
而華為的解決方案堪稱暴力美學(xué):把12個(gè)計(jì)算柜、4個(gè)總線柜拼成一臺(tái)“超級(jí)計(jì)算機(jī)”——計(jì)算柜是流水線上的車(chē)間,總線柜是傳送帶,數(shù)據(jù)不用出廠房就能完成全流程加工。
更恐怖的是,這還只是起點(diǎn)。華為工程師輕描淡寫(xiě)地透露:這套架構(gòu)能擴(kuò)展到“數(shù)萬(wàn)卡”規(guī)模。按這個(gè)路線,未來(lái)訓(xùn)練GPT-5級(jí)大模型,就能開(kāi)機(jī)即用,根本不用糾結(jié)“算力夠不夠”。
昇騰超節(jié)點(diǎn)技術(shù)干掉“CPU霸權(quán)”,華為在顛覆70年老傳統(tǒng)?
傳統(tǒng)架構(gòu)里,CPU是霸道總裁,GPU、內(nèi)存等部件想溝通?先寫(xiě)郵件等審批(數(shù)據(jù)經(jīng)總線中轉(zhuǎn)),效率很低。而華為的對(duì)等計(jì)算架構(gòu),相當(dāng)于給每個(gè)部門(mén)(計(jì)算單元)發(fā)了工作群:數(shù)據(jù)直接點(diǎn)對(duì)點(diǎn)傳輸,CPU靠邊站。
這種設(shè)計(jì)有多反常識(shí)?舉個(gè)例子:原本AI訓(xùn)練時(shí),GPU算完數(shù)據(jù)要等CPU調(diào)度才能傳給下一張卡,現(xiàn)在GPU們自己拉了個(gè)群聊,帶寬從自行車(chē)道(以太網(wǎng))升級(jí)成高鐵(高速總線),時(shí)延從2微秒降到200納秒——這速度,比你眨一下眼皮(300毫秒)快了一百萬(wàn)倍。
所以這項(xiàng)技術(shù)背后,是干掉“CPU霸權(quán)”的節(jié)奏。
首先是打破英偉達(dá)壟斷:當(dāng)老黃用NVLink和InfiniBand捆住高端AI算力市場(chǎng)時(shí),華為直接用自研總線技術(shù)撕開(kāi)缺口——“你們的互聯(lián)方案,該升級(jí)了”。
其次是給國(guó)產(chǎn)AI生態(tài)喂“興奮劑”:大模型訓(xùn)練最大的痛點(diǎn)不是單卡算力,而是萬(wàn)卡協(xié)作效率。昇騰超節(jié)點(diǎn)等于給國(guó)產(chǎn)AI公司發(fā)了外掛:同樣的算法,在我這兒跑得更快。
最后則是為6G時(shí)代埋彩蛋:未來(lái)AR眼鏡、自動(dòng)駕駛需要的實(shí)時(shí)AI,拼的就是低時(shí)延。華為這套架構(gòu),簡(jiǎn)直是為下一代終端量身定制。
因此綜合來(lái)說(shuō),華為這次亮劍,推出昇騰超節(jié)點(diǎn)技術(shù)說(shuō)明,AI競(jìng)賽不再是“堆芯片數(shù)量”,而是“拼系統(tǒng)級(jí)創(chuàng)新”。當(dāng)別人還在琢磨怎么多塞幾張卡進(jìn)機(jī)柜時(shí),華為已經(jīng)用高速總線把整個(gè)機(jī)房變成了一臺(tái)“計(jì)算機(jī)”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.