去年AMD、博通(Broadcom)、思科(Cisco)、谷歌(Google)、Hewlett Packard Enterprise (HPE)、英特爾(Intel)、Meta和微軟(Microsoft)宣布成立Ultra Accelerator Link (UALink)聯(lián)盟,共同制定一項新的行業(yè)標準,致力于推進數(shù)據(jù)中心中擴展AI系統(tǒng)的高速和低延遲通信。隨后蘋果、阿里云、以及Synopsys加入,被選為UALink聯(lián)盟董事會新成員。
UALink聯(lián)盟宣布,正式發(fā)布UALink 1.0規(guī)范,意味著小組成員現(xiàn)在可以對支持新技術的芯片進行流片。其允許在一個計算集群(Pod)內(nèi),讓接入的GPU等加速器附帶的內(nèi)存之間實現(xiàn)直接加載和存儲,提升共同完成大規(guī)模計算任務的效率。
UALink協(xié)議棧包括四個硬件優(yōu)化層,分別是物理層、數(shù)據(jù)鏈路層、事務層和協(xié)議層。其中物理層使用標準以太網(wǎng)組件(例如200GBASE-KR1/CR1),并包括使用FEC減少延遲的修改;數(shù)據(jù)鏈路層將事務層的64字節(jié)的數(shù)據(jù)打包成640字節(jié)的單位,應用CRC和可選的重試邏輯,另外還負責處理設備間的消息傳遞;事務層實現(xiàn)壓縮尋址,在實際工作負載下以高達95%的協(xié)議效率簡化數(shù)據(jù)傳輸。針對現(xiàn)代數(shù)據(jù)中心使用,還集成了安全和管理功能,計算集群將通過專用控制軟件和固件代理,使用PCIe和以太網(wǎng)等標準接口進行管理。
UALink 1.0規(guī)范支持每通道200 GT/s的雙向數(shù)據(jù)速率,信號速率為212.5 GT/s,以適應前向糾錯和編碼開銷。UALink可以配置為x1、x2或x4通道,其中四通道鏈路在發(fā)送和接收方向的速度最高可達800 GT/s。
單個UALink 1.0系統(tǒng)支持連接多達1024個AI加速器,通過UALink交換機連接,每個AI加速器分配一個端口和一個10-bit唯一標識符,以實現(xiàn)精確路由。UALink 電纜長度經(jīng)過優(yōu)化,長度小于4米,在64B/640B有效載荷下實現(xiàn)小于1μs的往返延遲。此外,這些鏈路支持跨一到四個機架的確定性性能。
在外界看來,UALink聯(lián)盟的創(chuàng)立就是為了改變英偉達在人工智能芯片領域一家獨大的格局,競爭目標是稱為“NVLink”的互連通信協(xié)議。UALink 1.0規(guī)范允許在連接到處理器的內(nèi)存之間直接傳輸數(shù)據(jù),這對于AI訓練工作負載尤其重要。
UALink 1.0規(guī)范發(fā)布對行業(yè)的影響解讀
打破NVIDIA的生態(tài)壟斷,推動行業(yè)多元化
NVIDIA憑借NVLink+InfiniBand的封閉生態(tài),在AI加速器市場占據(jù)主導地位。UALink的推出標志著頭部廠商聯(lián)合“去NVIDIA化”,通過開放標準降低對單一供應商的依賴。為AMD、英特爾等GPU廠商提供跨品牌互聯(lián)方案,加速其AI芯片(如AMD Instinct、Intel Gaudi)的市場滲透。 可能迫使NVIDIA調(diào)整策略,如開放部分技術或降低NVLink授權成本。
技術優(yōu)勢:更高帶寬與擴展性
單鏈路帶寬達1.5TB/s(雙向),超越NVLink 4.0的900GB/s。
拓撲靈活性:支持直接GPU-GPU連接或通過UALink Switch擴展至數(shù)千節(jié)點,媲美InfiniBand的集群能力。
低延遲:針對AI訓練/推理優(yōu)化,減少數(shù)據(jù)同步開銷。
應用場景:
大規(guī)模AI模型訓練(如LLM、多模態(tài)模型)。
高性能計算(HPC)中的GPU密集型任務。
重構數(shù)據(jù)中心硬件生態(tài)
設備層:
加速專用交換芯片(如博通、思科)的研發(fā),替代部分InfiniBand交換機市場。
推動PCIe 6.0+UALink的混合架構,提升服務器內(nèi)/間互聯(lián)效率。
軟件層:
需配套開發(fā)統(tǒng)一驅動和通信庫(類似NVIDIA的NCCL),兼容PyTorch、TensorFlow等框架。
可能催生新的RDMA協(xié)議優(yōu)化方案。
對云計算與超算的影響
云服務商如Google Cloud、Azure):
可通過UALink構建異構加速器集群,靈活搭配AMD/Intel/自研芯片,降低TCO(總擁有成本)。
提供更細粒度的AI算力租賃服務(如單GPU到超大規(guī)模集群)。
替代傳統(tǒng)InfiniBand方案,降低部署成本,同時滿足AI與科學計算的雙重需求。UALink 1.0的發(fā)布是AI基礎設施領域的一次重要變革,其核心價值在于打破封閉、促進競爭。盡管面臨生態(tài)建設挑戰(zhàn),但憑借聯(lián)盟成員的行業(yè)影響力,有望重塑AI算力底層架構,最終受益的將是需要高性能、低成本互聯(lián)方案的廣大企業(yè)與研究機構。
平臺近期組織的活動
*若有意向成為本次盛會的合作伙伴,請盡快聯(lián)系我們預定*
加”GPMI接口供應鏈溝通群“加客服申請
工程參考學習資訊
更多關于最新的線纜行業(yè)發(fā)展訊息,請關注我們的微信公眾號!我們將第一時間搜尋到行業(yè)前沿訊息和您一起分享!不做盈利用途,文中觀點都是基于公開數(shù)據(jù)及信息,僅供交流,不構成投資建議!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.