在近期舉行的 Advancing AI 2025 大會上,AMD不僅推出了備受矚目的 Instinct MI350 系列 AI 加速卡和 ROCm 7 開發平臺,更詳細解讀了其基于全新 Zen 5 架構的銳龍線程撕裂者 9000 系列處理器及Radeon AI PRO 專業顯卡的技術細節。
此次發布旨在進一步鞏固 AMD 在高性能工作站市場的領導地位,并獲得了四大 OEM 合作伙伴的鼎力支持,共同展示了搭載新平臺的領先產品。
工作站市場:穩健增長的專業高地
工作站市場作為介于服務器與個人 PC 之間的專業計算領域,以其對高性能、高可靠性的嚴苛要求而著稱。IDC 數據顯示,全球工作站市場規模預計將從 2024 年的近 700 萬臺增長至 2029 年的約 900 萬臺,展現出持續穩健的增長態勢。
AMD 在該領域擁有完善且強大的產品線,從移動端的銳龍 AI PRO 系列到桌面級的銳龍 PRO、銳龍線程撕裂者 PRO 系列,以及 Radeon PRO、Radeon AI PRO 系列顯卡,構建了完整的平臺解決方案。
自 2017 年誕生以來,AMD 線程撕裂者處理器一直以其卓越性能主導市場。例如,上一代旗艦線程撕裂者 PRO 7995WX在多線程性能上相較英特爾至強 W9-3595X 領先高達 80%。值得強調的是,線程撕裂者系列始終保持高速迭代,僅用六年時間,其架構已進化四代,制造工藝從 14nm 躍升至 5nm,核心數增長 6 倍(從 16 核至 96 核),緩存容量擴大 12 倍,內存與 PCIe 帶寬均實現了 4 倍提升,展現了 AMD 在技術創新上的不懈追求。
Zen 5 架構賦能:性能與能效的雙重飛躍
線程撕裂者 9000 系列的核心亮點在于全面升級至最新的Zen 5 架構。
此架構帶來了多項關鍵改進,包括:
?顯著提升的單線程與多線程性能:通過優化計算負載的全流水線處理能力,實現性能的質的飛躍。
?512 位數據路徑 AVX-512 指令集支持:提升了在高性能計算和 AI 工作負載中的處理效率。
?增強的 ISA 指令能力:進一步優化了指令集架構,提升了代碼執行效率。
?DDR5-6400 內存支持:提供高達 410GB/s 的理論峰值帶寬,并支持 EXPO 一鍵超頻至 DDR5-7000+。
?更高能效:通過改進分支預測精度、同步多線程效率和功耗管理,實現同等功耗下更高的性能輸出。
Zen 5 架構在 10 個工作站基準測試中,平均 IPC(每時鐘周期指令數)提升達 16%,在 SPEC AI/ML 基準測試中平均 IPC 提升更是達到 25%。
線程撕裂者 9000 系列處理器延續了 Chiplets 整合封裝設計,最多集成 12 個 4nm 工藝的 CCD 和 1 個 IOD,最高可實現 96 核心 192 線程。每個核心配備 1MB 二級緩存,每個 CCD 包含 8MB 二級緩存,所有核心共享 32MB 三級緩存,合計高達 480MB 緩存。
所有 PRO 9000WX 系列型號(9995WX、9985WX、9975WX、9965WX、9955WX、9945WX)和 9000 系列型號(9980X、9970X、9960X)的加速頻率均提升至 5.4GHz,熱設計功耗保持 350W。新系列繼續兼容 sTR5 平臺,為現有用戶提供了便捷的升級路徑。
性能實測:碾壓級領先競爭對手
在實際應用負載中,旗艦型號PRO 9995WX相較于上一代 PRO 7955WX,性能提升幅度在 13% 到 26% 之間。
與競品英特爾至強 W9-3595X (60 核心 120 線程) 相比,PRO 9995WX 展現出全面碾壓態勢。在 CPU 密集型應用中,其領先優勢可輕松超過 100%。即使在需要 CPU 和 GPU 協同工作的負載下,PRO 9995WX 依然全面大幅領先。
面對最新的 AI 工作負載,無論是大模型 Tokens 生成速度、文生圖速度,還是內容創作,PRO 9995WX 均表現出壓倒性優勢。即便是 64 核心的非專業級 9980X,也能夠輕松領先至強 W9-3595X 至少 20%,最高甚至達到 108%。
Radeon AI PRO 顯卡:AI 時代的專業圖形利器
隨著 AI 時代的到來,專業顯卡在工作站中的作用愈發關鍵。AMD 將其專業顯卡系列更名為Radeon AI PRO,以突出其在 AI 領域的強大實力。Radeon AI PRO 顯卡與銳龍 AI 處理器、內存等組件共同構成了完整的 AI 解決方案,并通過 ROCm 軟件平臺如虎添翼。
Radeon AI PRO 顯卡基于RDNA 4 架構,采用臺積電 4nm 工藝,集成 539 億個晶體管。新架構優化了指令處理器和緩存系統,并升級了第二代 AI 加速器,顯著提升了 Tensor 計算能力,新增 8 位浮點數據格式并支持結構化稀疏性。
首款產品Radeon AI PRO R9700配備 64 個 CU 計算單元(4096 個流處理器)、64 個光追加速器和 128 個 AI 加速器,搭載 256-bit 32GB GDDR6 顯存。其峰值性能在 FP16 半精度浮點下可達 96 TFLOPS,INT4 稀疏精度下為 1531 TOPS。整卡功耗 300W。值得一提的是,Radeon AI PRO R9700 將提供 AMD 公版及眾多 AIB 品牌產品。
Radeon AI PRO R9700 相較于上一代 Radeon PRO W7800,在核心數更少的情況下,實現了 FP32 性能持平,FP16/BF16 性能翻倍,INT8/INT4 性能更是達到 4 倍,并新增了 FP8 和結構化稀疏性支持。
在 DeepSeek-R1 大模型輸出 Tokens 速度測試中,R9700 可輕松碾壓 W7800,尤其在 70-80 億參數規模時優勢顯著,甚至領先一倍有余。32GB 顯存配置能夠滿足流行大模型的典型顯存占用需求,并預留未來擴展空間。
Radeon AI PRO R9700 還支持靈活的多卡并行,目前最多可實現四卡并行,后續將升級至八卡,以更好地滿足并發實例應用。
OEM 伙伴:強強聯合,共筑工作站生態
AMD 線程撕裂者系列憑借其卓越性能和完善的軟件生態,已獲得行業廣泛認可。戴爾、惠普、聯想、超微等全球領先的 OEM 伙伴持續為 AMD 提供大力支持。
?戴爾 Precision 7875 工作站:支持撕裂者 PRO 7000WX/9000WX 系列,最高 96 核心,提供高達 2TB DDR5 內存和豐富的擴展插槽。
?惠普 Z6 G5 A 工作站:已加入撕裂者 PRO W9000X 系列,同時支持最新的 NVIDIA Blackwell 專業顯卡,最多三卡并行。
?聯想 ThinkStation P620、P8:聯想作為 AMD 工作站的頭號伙伴,其 P8 系列已升級支持撕裂者 PRO 9000WX,最高 96 核心。
?超微工作站:提供多樣化產品,包括標準塔式(可選風冷、液冷)及獨特的 2U 機架式,可支持最多四塊全高全長雙插槽專業顯卡并行。
結語:撕裂者神話續寫,AMD YES 精神永存
自 2017 年誕生以來,銳龍線程撕裂者處理器一直是高性能計算領域的標桿,甚至迫使競爭對手放棄了高端桌面市場,創造了微處理器歷史上的一個“神話”。盡管缺乏直接競爭威脅,線程撕裂者系列卻打破了“擠牙膏”的慣例,每一代都在超越自我。
最新的線程撕裂者 9000 系列秉持初心,以全新的 Zen 5 架構再次詮釋了“AMD YES”的精髓。其無與倫比的性能再次飛躍,全方位碾壓競品;更豐富的 I/O 接口,輕松實現各種擴展;更高超的能效,有效降低客戶部署成本;以及第一時間推出的豐富 OEM 產品,靈活滿足用戶不同需求。
搭配全新的 Radeon AI PRO 專業顯卡和 ROCm 7 開發軟件,線程撕裂者 9000 系列組成了迄今為止最為強大的專業工作站解決方案,無論是圖形渲染還是高強度 AI 負載,都能輕松應對,為專業人士提供無與倫比的計算體驗。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.