IT之家 5 月 24 日消息,Tom's Hardware 發(fā)現(xiàn),和碩在臺(tái)北國(guó)際電腦展上展示了一款獨(dú)特的 AI 機(jī)架解決方案。
▲ 圖源:Tom's Hardware,下同
據(jù)介紹,該系統(tǒng)配備了 128 顆 AMD 新一代 Instinct MI350X GPU,專為高性能 AI 推理與訓(xùn)練設(shè)計(jì),其架構(gòu)比 AMD 官方開(kāi)發(fā)的機(jī)架方案領(lǐng)先一代。
該平臺(tái)將成為和碩研發(fā)下一代 AMD Instinct MI450X 處理器 IF64 / IF128 系統(tǒng)的技術(shù)驗(yàn)證平臺(tái),相關(guān)產(chǎn)品預(yù)計(jì)一年后量產(chǎn),IT之家后續(xù)將保持關(guān)注。
和碩 AS501-4A1 / AS500-4A1 系統(tǒng)采用了 8 組 5U 計(jì)算單元,每組包含 1 顆 AMD EPYC 9005 處理器和 4 顆 Instinct MI350X 加速器,采用液冷散熱方案以保障高負(fù)載下的穩(wěn)定性能。整機(jī)采用 51OU ORV3 規(guī)格設(shè)計(jì),適配遵循 OCP 開(kāi)放計(jì)算標(biāo)準(zhǔn)的云數(shù)據(jù)中心(例如 Meta)。
由于 AMD 尚未推出 Infinity Fabric 專用交換機(jī),該系統(tǒng)只是通過(guò) 400GbE 網(wǎng)絡(luò)連接不同 GPU(目前 AMD 加速器最大集群規(guī)模為 8 顆)。這與英偉達(dá) GB200 / GB300 NVL72 平臺(tái)形成對(duì)比 —— 后者通過(guò) NVLink 實(shí)現(xiàn) 72 顆 GPU 直連。因此,MI350X 系統(tǒng)在擴(kuò)展性方面尚無(wú)法與英偉達(dá)方案抗衡。
該系統(tǒng)的核心價(jià)值在于:可為 OCP 用戶提供即用型 AI 算力平臺(tái),同時(shí)幫助開(kāi)發(fā)者從軟硬件層面掌握多 GPU 系統(tǒng)搭建技術(shù);并為挑戰(zhàn)英偉達(dá)在機(jī)架級(jí) AI 解決方案的壟斷地位奠定基礎(chǔ)。
根據(jù) AMD 官方參數(shù),和碩 128-GPU 系統(tǒng)的理論峰值性能可達(dá) 1,177 PFLOPS(FP4 精度)。每顆 MI350X 搭載 288GB HBM3E 顯存,系統(tǒng)總顯存達(dá) 36.8TB,可支持超越英偉達(dá) Blackwell 架構(gòu) GPU 容量上限的巨型 AI 模型。
該系統(tǒng)的主要限制在于依賴以太網(wǎng)的 GPU 間通信方案。由于最大單集群規(guī)模為 8 顆 GPU,其更適合 AI 推理或多實(shí)例訓(xùn)練場(chǎng)景,而非需要高度同步的大語(yǔ)言模型訓(xùn)練 —— 這正是英偉達(dá) NVL72 系統(tǒng)的優(yōu)勢(shì)領(lǐng)域。盡管如此,這仍是當(dāng)前高性能、大內(nèi)存 AI 解決方案的重要突破,也為 AMD 下一代 Instinct MI400 系列產(chǎn)品鋪平了道路。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.