公眾號記得加星標(biāo)??,第一時間看推送不會錯過。
來源:內(nèi)容編譯自theregister。
像 AMD 這樣的芯片供應(yīng)商可能正在縮小與 Nvidia 在 GPU FLOPS、內(nèi)存帶寬和 HBM 容量方面的差距,但如果沒有 NVLink 和 NVSwitch 等高速互連和交換機,他們擴展性能的能力仍然有限。
這些技術(shù)使 Nvidia 能夠構(gòu)建擁有 72 個 GPU 的機架級系統(tǒng),而英特爾和 AMD 仍停留在 8 個 GPU 的水平。為了突破這一限制,許多業(yè)內(nèi)人士紛紛支持新興的 Ultra Accelerator Link (UALink)協(xié)議,這是 Nvidia NVLink 的開放替代方案。
但并非所有人都認(rèn)同新協(xié)議的必要性,也并非所有人都愿意等待首款 UALink 硬件的流片。作為 UALink 聯(lián)盟的創(chuàng)始成員,博通如今認(rèn)為以太網(wǎng)完全有能力更快地完成這項工作。
博通Tomahawk產(chǎn)品線經(jīng)理Pete Del Vecchio告訴El Reg : “在網(wǎng)絡(luò)的各個部分采用相同的技術(shù)會帶來巨大的好處。在監(jiān)控、遙測和調(diào)試工具方面,使用以太網(wǎng)有很多好處。這就是為什么我們認(rèn)為UALink不會消失。”
博通目前還沒有交出UALink的會員卡。它在談判桌上仍然有發(fā)言權(quán),而德爾·維基奧也不排除未來轉(zhuǎn)用UALink的可能性。但他表示,就目前情況而言,這還不在路線圖上。
“我們的立場是,你不需要擁有一些正在開發(fā)的規(guī)格,也許幾年后你就會擁有一款芯片,”德爾維奇奧說。
相反,博通正在推進(jìn)一項名為“擴展以太網(wǎng)”(Scale-upEthernet,簡稱SUE)的競爭技術(shù)。博通聲稱,該技術(shù)將支持在任何以太網(wǎng)平臺上至少擁有1024個加速器的擴展系統(tǒng)。相比之下,英偉達(dá)表示其NVLink交換機技術(shù)可以支持576個加速器,但迄今為止,我們尚未發(fā)現(xiàn)任何超過72個GPU插槽的部署。
Tomahawk Ultra
Broadcom 為 SUE 推出的頭條芯片是新發(fā)布的 Tomahawk Ultra,這是一款 51.2 Tbps 交換機 ASIC,經(jīng)過專門調(diào)整,可與傳統(tǒng)超級計算機和 HPC 集群中的 Nvidia InfiniBand 以及類似于 Nvidia 的 GB200 NVL72 或 AMD 的 Helios 的機架規(guī)模部署中的 NVLink 競爭。
如果你感到好奇,雖然 Tomahawk Ultra 確實共享相同的封裝并且與 Broadcom 的 Tomahawk 5(TH5)引腳兼容,但其內(nèi)部的硅片卻完全不同。
該芯片組不僅具有 512 x 100 Gbps 串行器反序列化器 (SerDes) 的相對較大的基數(shù),還專門針對高性能網(wǎng)絡(luò)進(jìn)行了調(diào)整,據(jù)稱可提供低至 250 納秒的延遲,同時每秒推送約 770 億次 64 字節(jié)數(shù)據(jù)包。
這一點至關(guān)重要,因為這些較小的數(shù)據(jù)包在高性能計算 (HPC) 系統(tǒng)中很常見,并且對于無法支持隨之而來的更高消息速率的網(wǎng)絡(luò)設(shè)備來說,可能會造成問題。Tomahawk Ultra 通過實施優(yōu)化的以太網(wǎng)報頭解決了這個問題,即使在處理較小的數(shù)據(jù)包時也能承載更大的有效載荷。
該芯片還具有全套擁塞控制機制,包括前向糾錯和基于信用的流量控制,以減輕數(shù)據(jù)包丟失,同時保持與現(xiàn)有以太網(wǎng) NIC 和 DPU 的兼容性。
該交換機還提供對網(wǎng)絡(luò)內(nèi)集體的支持,Nvidia 在其 NVLink 交換機中將其稱為 SHARP,并允許將 all-reduce 等操作卸載到網(wǎng)絡(luò)上,這有利于通過減少完成這些操作所需的帶寬來提高網(wǎng)絡(luò)效率。
說到縱向擴展交換機架構(gòu),與英偉達(dá)第五代 NVLink 交換機相比,Tomahawk Ultra 提供的帶寬略高于后者,分別為 51.2 Tbps 和 28.8 Tbps。這意味著,使用與英偉達(dá) 72-GPU NVL 系統(tǒng)相同數(shù)量的交換機,博通可以支持包含 128 個加速器的縱向擴展架構(gòu)。
與 UALink 相比,Del Vecchio 聲稱 Tomahawk Ultra 已經(jīng)提供了更好的延遲,盡管在第一臺硬件實際發(fā)貨之前很難評估這一說法。
正如 AMD 架構(gòu)與戰(zhàn)略總監(jiān)兼 UALink 聯(lián)盟主席 Kutis Bowman 最近告訴我們的姊妹網(wǎng)站The Next Platform那樣,該聯(lián)盟預(yù)計交換機延遲將在 100-150 納秒范圍內(nèi),如果他們能夠?qū)崿F(xiàn)這一目標(biāo),這可能會使該協(xié)議在某些應(yīng)用中占據(jù)優(yōu)勢。
話雖如此,我們?nèi)孕枋媚恳源纯床┩ㄗ钚碌男酒趯嶋H應(yīng)用中與 NVLink 以及最終的 UALink 究竟有何差距。值得慶幸的是,我們不必等待太久。博通表示,Tomahawk Ultra ASIC 已開始向客戶發(fā)貨,而且由于它們與 TH5 引腳兼容,因此重新利用現(xiàn)有的交換機機箱應(yīng)該相對簡單。
兩全其美?
當(dāng)然,UALink 硬件尚未上市并不意味著 AMD 或英特爾無法使用該協(xié)議。早在 4 月份,UALink 聯(lián)盟就發(fā)布了其首個規(guī)范;而在今年 6 月份的 Advancing AI 大會上,AMD發(fā)布了Helios 機架系統(tǒng),該系統(tǒng)將同時使用 UALink 和以太網(wǎng)作為其擴展架構(gòu)。
沒錯,對于其首批機架式系統(tǒng),AMD 將通過傳統(tǒng)以太網(wǎng)交換機傳輸 UALink 協(xié)議,這意味著當(dāng)其網(wǎng)絡(luò)合作伙伴仍在將其首款 UALink 硅片推向市場時,AMD 將開始解決 v1.0 規(guī)范中任何潛在的問題。
“其他傳輸協(xié)議,例如 UALink 或 Infinity Fabric,也可以通過以太網(wǎng)傳輸。如果你已經(jīng)擁有能夠?qū)崿F(xiàn)低延遲、高可靠性的芯片,那么你就可以進(jìn)行任何你想進(jìn)行的操作,只需通過以太網(wǎng)即可。”博通首席產(chǎn)品線經(jīng)理 Robin Grindley 告訴我們。
然而,通過以太網(wǎng)隧道傳輸 UALink 并非理想之選。最值得注意的是,你根本無法接近 UALink 100-150 納秒的目標(biāo)。另一方面,你無法交付你沒有的東西,如果 AMD 等到 2027 年才將其 Helios 機架推向市場,它將不得不與 Nvidia 600 千瓦、144 個 GPU 插槽的 Kyber 系統(tǒng)競爭。
https://www.theregister.com/2025/07/15/broadcom_ethernet_scale_up/
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點,不代表半導(dǎo)體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4096期內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時間看推送,小號防走丟
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.