AMD在COMPUTEX 2025上正式宣布了Zen5架構的AMD銳龍Threadripper PRO 9000WX/9000系列處理器和RDNA 4架構的Radeon AI PRO R9700專業顯卡。而在當地時間6月10日,AMD在美國加州圣何塞又舉辦了一場深入的Workshop技術溝通會,分享了更多相關的技術細節與性能數據。
Zen5架構加持,新一代線程撕裂者再創性能巔峰
在工作站領域,AMD可以說做到了全面覆蓋,提供了全平臺的解決方案支持。包括搭載銳龍AI MAX PRO/AI PRO系列處理器的工作站筆記本、搭載銳龍線程撕裂者PRO的桌面工作站與搭載Radeon AI PRO系列顯卡的工作站。
Threadripper(線程撕裂者)系列可以說是AMD歷代處理器產品中的傳奇,從初代的Ryzen Threadripper 1950X到上代Ryzen Threadripper PRO 7995WX,核心數量增長了5倍;內存帶寬增長了3倍;PCIe帶寬也提升了3倍。
而現在,Ryzen Threadripper 9000系列將與Radeon 9000系列打造出強大的新一代AI工作站解決方案。
Ryzen Threadripper 9000系列采用了Zen5架構,同時在SoC部分也進行了升級。之前我們在銳龍9000系列處理器首發時已經詳細介紹過Zen5架構,簡單來講就是大幅提升了IPC和能效表現,同時得益于新的制程,可以做到更高的加速頻率。Ryzen Threadripper 9000系列擁有最多96個Zen5核心、192線程,為高負載計算進行了全面優化,支持512bit數據通道的“滿血版”AVX512,增強了ISA性能。SoC部分,將內存頻率支持提升到了DDR5 6400水平,支持最多12個4nm CCX芯片,同時還改進了能效表現。
Zen5架構的改進我們之前詳細介紹過,這里簡單提一下重點。Zen5架構增加到了6個ALU,提升了執行性能,使用了新一代的分支預測,大幅提升了緩存效率,同時還具備4條管道支持雙倍的512bit/AVX512加載。
Zen5架構還大幅增強了L2緩存,包括將L2緩存連接性能翻倍、L2緩存到L1緩存的數據路徑加倍、L2緩存帶寬加倍等等。同時,還大幅降低了L3緩存的延遲。
經過一系列的改進,Zen5在頻率相同的情況下相對Zen4帶來了16%的工作站性能提升,在AI&ML應用中更是獲得了高達25%的性能提升。
從平臺來看的話,Ryzen Threadripper 9000系列的重要改進包含幾大方面。內存部分,它支持最高8通道DDR5 6400內存,總帶寬可達410GB/s,甚至還能支持內存超頻到DDR5 7000+水平;主板部分,依然兼容現有sTR5平臺,支持AMD PRO技術;I/O部分,同樣最多提供128條PCIe 5.0通道,但得益于SoC的改進,PCIe帶寬也得到了提升。
綜合來講,Ryzen Threadripper 9000系列的重要賣點就是IPC相對上代提升16%、支持512bit數據通道滿血AVX512、支持8通道DDR5 6400內存。
得益于一系列的改進和升級,Ryzen Threadripper 9000系列堪稱世界上最強的工作站處理器。它在設計與制造、建筑工程與施工、多媒體與娛樂、軟件與科學計算方面都能提供極為強大的性能支持。
AMD放出了Ryzen Threadripper PRO 9995WX與上代Ryzen Threadripper PRO 7995WX的性能對比數據。從圖中可以看到,在多媒體和娛樂方面,PRO 9995WX領先PRO 7995WX的幅度大約在17%~26%;在設計與制造方面,領先幅度也是17%~26%;在建筑工程與施工方面,領先幅度為13%~15%;在軟件和科學計算方面,大約領先22%~23%。
如果拿Ryzen Threadripper PRO 9995WX和競品的Xeon W9-3595X對比的話,純CPU建模速度大約快70%、渲染速度大約快119%;如果搭載GPU進行對比,建模速度和渲染速度也分別快出56%和22%。因此,AMD也宣稱Ryzen Threadripper PRO 9000是最好的設計與制造處理器。
在多媒體和娛樂方面,Ryzen Threadripper PRO 9995WX和競品的Xeon W9-3595X對比,純CPU渲染速度大約快118%~145%;如果搭載GPU進行對比,渲染速度快出78%~83%。毫無懸念,Ryzen Threadripper PRO 9000也是最好的多媒體與娛樂內容創作的高效利器。
在建筑工程和施工方面,Ryzen Threadripper PRO 9995WX和競品的Xeon W9-3595X對比,純CPU建模速度最高提升40%、渲染速度大約快118%;如果搭載GPU進行對比,創作速度快出40%、剪輯速度快出34%。因此,在這個領域Ryzen Threadripper PRO 9000也是最強大的存在。
在軟件和科學計算方面,Ryzen Threadripper PRO 9995WX和競品的Xeon W9-3595X對比,純CPU編譯,在Chromium中領先52%、UE5.5中領先73%;MATLAB中領先75%。對于這方面的用戶來講,Ryzen Threadripper PRO 9000同樣是最高效的選擇。
在AI方面,Ryzen Threadripper PRO 9995WX和競品的Xeon W9-3595X對比,在DeepSeek R1 32B LLM中Toks/s領先49%,在ComfyUI中文生圖領先34%、Pugetbench Davinci Resolve Studio AI Extend Tests中領先28%,更多的核心/線程數量和更高的內存帶寬功不可沒。
具體產品規格部分,我們之前也介紹過。本次首發的銳龍Threadripper新品分為PRO 9000WX系列和9000系列,其中銳龍Threadripper PRO 9000WX系列針對專業高性能工作站,最高規格方面相對9000系列更高,一共擁有6款型號。
頂級旗艦AMD銳龍Threadripper Pro 9995WX擁有96核192線程,基礎頻率2.5 GHz,最高加速頻率5.4 GHz,384MB三級緩存。
AMD銳龍Threadripper Pro 9985WX擁有64核128線程,基礎頻率3.2 GHz,最高加速頻率5.4 GHz,256MB三級緩存。
AMD銳龍Threadripper Pro 9975WX擁有32核64線程,基礎頻率4.0 GHz,最高加速頻率5.4 GHz,128MB三級緩存。
AMD銳龍Threadripper Pro 9965WX擁有24核48線程,基礎頻率4.2 GHz,最高加速頻率5.4 GHz,128MB三級緩存。
AMD銳龍Threadripper Pro 9955WX擁有16核32線程,基礎頻率4.5 GHz,最高加速頻率5.4 GHz,64MB三級緩存。
AMD銳龍Threadripper Pro 9945WX擁有12核24線程,基礎頻率4.7 GHz,最高加速頻率5.4 GHz,64MB三級緩存。
所有型號的TDP都是350W,與上代保持了一致,但細心的朋友可能已經發現了,和上代核心越多加速頻率越低不一樣的是銳龍Threadripper Pro 9000WX系列的最高加速頻率都是5.4 GHz,可見4nm Zen5架構在體質和電氣性能方面確實更為強悍。
接口方面,銳龍Threadripper Pro 9000WX依然使用了sTR5,因此可以兼容WRX90和TRX50主板,上代線程撕裂者用戶可以無縫升級。值得注意的是,WRX90只支持PRO 9000WX系列,而TRX50可以同時支持PRO 9000WX和HEDT的9000X系列。當然,如果把銳龍Threadripper Pro 9000WX裝到TRX50主板上,那么它也只能支持4通道DDR5 6400和80條PCIe 5.0通道。
接下來就是針對HEDT平臺的銳龍Threadripper 9000X系列,這個系列面向HEDT用戶,用來打造頂級的高性能PC。
從AMD給出的9項測試數據來看,銳龍Threadripper 9980X相對競品Xeon W9-3595X在內容創作方面領先22%~92%;在3D制圖和可視化處理方面領先41%~108%;在軟件和科學計算方面領先41%~68%,可以說優勢非常夸張了。
銳龍Threadripper 9000系列目前包含3款產品,分別是64核128線程的AMD銳龍Threadripper 9980X、32核64線程的AMD銳龍Threadripper 9970X與24核48線程的AMD銳龍Threadripper 9960X。這3款型號與核心數量相同的AMD銳龍Threadripper Pro 9000WX系列擁有同樣的頻率、緩存、PCIe版本、TDP設定與主板接口標準,只是精簡了針對企業用戶的AMD PRO安全技術。此外,由于只能搭配TRX50主板使用,它們也只能最多支持到4通道DDR5內存。
Radeon AI PRO R9700顯存量大管飽,跑超大模型更給力
目前AMD針對不同規模的AI應用都有對應的AI生態解決方案。對于個人用戶和中小型LLM,可以使用搭載統一內存的Ryzen AI MAX平臺;針對多GPU邊緣計算用戶和中小型LLM,可以使用搭載超大顯存的Radeon AI PRO平臺;而對于機架擴展級別、需要訓練超大LLM模型的用戶,則可以選擇AMD Instinct解決方案。
所以這次Radeon AI PRO R9700顯卡就配備了更加高效的RDNA 4架構。主要帶來了幾大改進:優化的單片設計,使用4nm工藝、支持PCIe 5.0接口;改進了命令處理器,增強了包加速器;搭載高速GDDR6顯存,最高提供256bit/20Gbps/32GB的規格,并增強了內存壓縮;優化了緩存系統,內置64MB第三代無限緩存,配備8MB L2緩存,擁有2MB CU緩存;配備第二代AI加速器,提升了Tensor頻率,支持新的FP8數據類型和結構化稀疏。
而在RDNA 4的CU單元方面,也帶來了幾大改進。包括:增強了矩陣操作;升級了標量單元;升級了調度器;提升了光線加速單元。
具體顯卡部分,Radeon AI PRO R9700擁有128個AI加速器,搭載256bit/20Gbps/32GB GDDR6顯存,最高FP16稠算力可達191 TFLOPS、INT4稀疏算力可達1531 TOPS。整板功率為300W。
綜合來看,Radeon AI PRO R9700算力最高可達上代Radeon PRO W7800的4倍,從圖中可以看到,對比每時鐘/每CU的算力,Radeon AI PRO R9700在FP16/BF16方面領先一倍;在INT8方面領先三倍;在INT4方面也領先三倍,并且新增了對FP8以及結構化稀疏的支持。
我們知道,現在流行的AI大模型由于參數的增加,對顯存的需求越來越大,譬如DeepSeek R1 Distill Qwen 32B Q6,就需要高達28GB顯存。這就意味著顯存低于32GB的顯卡在運行它時就會爆顯存。而具備32GB顯存的Radeon AI PRO R9700自然就毫無壓力了。
此外,更大的模型也意味著更高的精度和更好的計算結果。從圖中可以看到,使用8B參數和1B參數實現的文生圖完全不是一個檔次的效果,參數越多越真實。同時,參數越多,最終得到的結果準確度也越高,8B的時候只有4/20的準確度,而32B可以達到20/20。
在單GPU配置下比較稀疏化AI性能,Radeon AI PRO R9700在DeepSeek R1 Distill Qwen的1.5B、7B、14B和Llama 8B模型中分別領先Radeon PRO W7800大約34%、74%、63%和105%,升級幅度巨大。
Radeon AI PRO R9700還支持4卡并聯,最高支持180個并發實例。從圖中可以看到,在使用DeepSeeK R1 Distill Qwen 32B模型/180個并發實例時,4塊Radeon AI PRO R9700的Tokens/s可達1780,性能是非常搶眼的。
AMD的合作伙伴已經推出了搭載銳龍Threadripper PRO 9000WX和Radeon AI PRO R9700的工作站和服務器產品。例如Supermicro的WS 2115HV-TNRT,就搭載了單顆銳龍Threadripper PRO 9000WX處理器、8通道DDR5 ECC RDIMM內存和最多4塊Radeon AI PRO R9700。特別值得一提的是,這款2U機型還支持內存超頻。
從Supermicro展示的數據來看,這顆64核128線程的銳龍Threadripper PRO 9000WX工程版在搭載4通道DDR5的情況下,已經將內存超頻到了7200MT/s。可見銳龍Threadripper PRO 9000WX這一代的SoC確實相當給力。
總結:AMD在AI和高性能計算方面繼續創造巔峰
最后簡單總結一下AMD本次Workshop技術溝通會的內容重點。首先是AMD銳龍Threadripper PRO 9000WX/9000系列將架構升級到了Zen5,IPC和能效方面都得到了大幅提升,同時還加強了SoC,支持最多8通道DDR5 6400內存,因此在各種專業應用領域都繼續保持了絕對領先的地位;然后是Radeon AI PRO R9700專業顯卡,它采用全面增強的RDNA 4架構,擁有32GB大顯存和支持多卡并聯,用它和AMD銳龍Threadripper PRO 9000WX/9000系列搭配打造的工作站/服務器,能夠更好地面對更多參數的AI大模型、提供更高的推理準確度,為用戶提供了強大而高效的AI硬件平臺解決方案,對于高端內容創建者來說堪稱無論如何都必須擁有的高效裝備。搭載AMD銳龍Threadripper PRO 9000WX/9000系列和Radeon AI PRO R9700專業顯卡的具體產品將在接下來的時間陸續上市,有需求的專業用戶一定不要錯過。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.