隨著AI推理對內存需求的不斷增加和模型復雜度的持續提升,開發者們尋求能夠本地處理這些需求的硬件,同時不犧牲性能和靈活性。從大型語言模型到生成式工作流,現代 AI 負載需要具備強大計算能力和充足顯存的 GPU。
AMD Radeon AI PRO R9700這款產品其實在今年臺北電腦展的時候就公布了,它是其面向本地 AI 開發和高吞吐推理的新型專業顯卡,而AMD公布該顯卡將于 2025年7月23日上市,它將通過專注于定制高性能計算解決方案的精選AMD硬件合作伙伴,提供預裝的工作站系統。
這塊Radeon AI PRO R9700擁有64組CU單元共128個第二帶AI加速單元,可提供1531 TOPS的INT4算力,支持FP8、FP16和INT8等各種精度的計算,顯卡TDP 300W,采用PCIe 5.0 x16接口,配備256bit/32GB GDDR6顯存,為本地推理、模型微調和復雜的創意工作負載加速。
配備32GB大容量顯存的好處就是單卡就能夠運行參數量更大,精度更高的模型,上圖已經列出了部分大語言模型和文生圖模型所需的顯存容量,配備32GB大顯存Radeon AI PRO R9700能夠很好的運行這些AI模型。
AMD Radeon AI PRO R9700針對對硬件性能有極高要求的AI專業用戶設計,特別擅長自然語言處理、文本生成圖像、生成式設計等需要大型模型或高顯存流水線的復雜任務。無論是進行大規模推理、本地微調,還是支持多模態工作流,Radeon AI PRO R9700均能提供充足的容量和速度,實現全程本地運算,提升性能、降低延遲,并增強數據安全性。
Radeon AI PRO R9700完全兼容AMD ROCm開源軟件平臺,為開發者提供了強大且可擴展的AI與高性能計算環境。支持PyTorch、ONNX Runtime和TensorFlow等主流框架,ROCm使用戶能夠高效構建、測試和部署基于R9700的本地AI模型。32GB顯存、RDNA 4架構和ROCm 6.4.1的結合,實現推理、微調及定制模型工作流的加速表現,使Radeon AI PRO R9700成為追求性能、靈活性和開放標準的AI專業人士的理想選擇。
憑借緊湊的雙槽設計、PCIe 5.0接口及鼓風式散熱方案,Radeon AI PRO R9700支持多GPU工作站部署。不同于采用軸流風扇設計、通常難適配高密度系統的消費級顯卡,R9700的鼓風設計確保高效的前至后氣流,允許多張顯卡在高性能緊湊環境中穩定運行,方便部署并行推理流水線、擴展多卡顯存容量及支持更大規模并發模型負載,助力企業構建可靠、高吞吐的本地AI基礎設施。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.