接下來的兩周,AMD Ryzen AI 300筆記本與Ryzen 9000臺式機CPU會相繼發(fā)售,為了狙擊Intel Lunar Lake,AMD特意將筆記本端的命名修改成300起步,以此暗示要比9月初發(fā)布的Core Ultra 200系列強一點。
從參數(shù)來看,Ryzen AI 300(代號Strix Point)已經(jīng)表現(xiàn)出了強勁的開局,Zen 5 微架構(gòu)、圖形、AI性能表現(xiàn)都將定義未來近一年的臺式機和筆記本競爭格局,50 TOPS的XDNA 2 NPU和RDNA 3.5 iGPU也將幫助Ryzen AI 300進(jìn)一步搶占市場,對英特爾造成更大的壓力。
那么Ryzen AI 300和Ryzen 9000應(yīng)該有什么值得期待的,未來一年臺式機、筆記本、Windows掌機還會發(fā)生什么變化,不妨讓我們稍微進(jìn)行展開。
提升的IPC
每周期指令數(shù)IPC(Instructions Per Cycle)是衡量CPU性能的重要指標(biāo)之一,IPC越高,意味著CPU可以在每個時鐘周期內(nèi)執(zhí)行更多指令,尤其是在比較不同架構(gòu)、型號處理器時,IPC可以作為很好的參考。
提升IPC的方式有很多,包括改進(jìn)微架構(gòu)、增加流水線、提升指令集并行度等。Zen 5微架構(gòu)中使用了雙管取指(Dual-pipe Fetch)的方式,即使用兩個取指管道并行從內(nèi)存中獲取指令,并行執(zhí)行,以提高執(zhí)行效率。與此同時,這項技術(shù)與AMD的高階分支預(yù)測結(jié)合,以減少延遲并提升準(zhǔn)確性和吞吐量。這樣通過降低指令緩存延遲和帶寬優(yōu)化的方式,可以在不犧牲準(zhǔn)確性的情況下進(jìn)一步提高數(shù)據(jù)流和數(shù)據(jù)處理速度。
Zen 5整數(shù)執(zhí)行能力在Zen 4的基礎(chǔ)上也進(jìn)行了提升,Zen 5使用了8寬的調(diào)度與退役系統(tǒng),(8-wide Dispatch/Retire),即可以同時調(diào)度和退役最多8個整數(shù)指令。在邏輯單元部分,提供了6個計算邏輯單元ALU和3個乘法器,均通過ALU調(diào)度器進(jìn)行控制,以此來適應(yīng)更復(fù)雜的工作負(fù)載。
與此同時,Zen 5相對Zen 4提供了更多數(shù)據(jù)帶寬,包括48KB的12路 L1數(shù)據(jù)緩存,可以滿足4個周期的負(fù)載,可看到的是L1緩存的帶寬增加了一倍,浮點單元也相當(dāng)于Zen 4增加了一倍,Zen 5還改進(jìn)了數(shù)據(jù)預(yù)取器,以保證更快、更可靠的數(shù)據(jù)訪問和處理。
在Zen 4時代,AVX-512指令集使用的是兩個256bit的數(shù)據(jù)路徑(data paths),可以同時處理兩個 256 位的數(shù)據(jù),但每個數(shù)據(jù)路徑只有256bit寬度,在處理 AVX-512指令時,需要使用兩個數(shù)據(jù)路徑來完成。而Zen 5還引入了完整的512bit AI數(shù)據(jù)路徑,這個數(shù)據(jù)路徑包含了6個流水線,并且在FADD(浮點加法)操作上具有兩個周期的延遲。因此Zen 5能夠一次性處理AVX-512指令所需的全部數(shù)據(jù),是一個很明顯的進(jìn)步。
而對于玩家而言,IPC的直觀提升更為重要。AMD表示Zen 5相對Zen 4的IPC平均提升達(dá)到了16%,在對比的數(shù)據(jù)中包括《孤島驚魂6》提升了10%,《英雄聯(lián)盟》提升了21%,Geekbench 5.4 AES-XTS提升了35%。
落實到具體產(chǎn)品上,基于Zen 5的Ryzen AI 300頂配是Ryzen AI 9 HX 370,配備12個Zen 5核心,最高頻率5.1GHz,擁有24MB L3緩存。向下一級是Ryzen AI 9 365,配備10個Zen 5核心,5.0GHz頻率,具備和HX 370相同的24MB L3緩存,僅僅在核心數(shù)量上有所減少。
AMD還會再晚些時候公布更多的SKU,但基本上已經(jīng)定局HX和標(biāo)準(zhǔn)版兩個產(chǎn)品線,具備TDP 15W到54W的性能釋放,可以應(yīng)用在輕薄本乃至游戲本中。基本上通過調(diào)整全尺寸Zen 5核心與緊湊Zen 5c核心數(shù)量,達(dá)到性能釋放與續(xù)航的目的。
在iGPU上,兩款產(chǎn)品都會推出基于RDNA 3.5的Radeon 890M的集成顯卡,其中Ryzen AI 9 HX 370最高配置16個圖形計算單元,Ryzen AI 9 365配備的是12個。
近期延期的臺式機版本Ryzen 9000系列包含了4個SKU,均是不鎖倍頻的X結(jié)尾版本。旗艦Ryzen 9 9950X配備16個核心,最高增頻可達(dá)5.7GHz,緩存總量為80 MB,其中包括64 MB L3緩存和16MB L2緩存(每個核心1MB L2緩存),熱設(shè)計功耗TDP為170W。而Ryzen 9 9900X則提供了12個核心,最高頻率可達(dá)5.6 GHz,64MB L3緩存,熱設(shè)計功耗120W。
再往下還包括了8個核心的Ryzen 7 9700X和入門版的Ryzen 5 9600X。
在接口上,Ryzen 9000和Ryzen 7000沒有太大區(qū)別,都使用的是LGA1718插槽,使用的是臺積電6nm制造,不過只有Ryzen 9000使用的是Zen 5核心,Ryzen 7000依然是Zen 4。
另外針對Ryzen 9000還加入全新的超頻功能Curve Shaper,本質(zhì)上是Curve Optimizer的增強版本,允許用戶進(jìn)行3個溫度和5個頻率,共計15個方案的頻率和電壓曲線調(diào)整。
在性能上,AMD自然也不忘與Intel Core i9-14900K、Core i7-14700K以及Core i5-14600K進(jìn)行對比。AMD Ryzen 9 9900X相對Core i9-14900K在UL Procyon Office中提升了2%,但在利用AVX-512指令的HandBrake負(fù)載中擁有41%的提升。
Ryzen 7 9700X相對Core i7-14700K提升幅度相當(dāng)明顯,包括7-Zip,UL Procyon Office和HandBrake全方位的提升。同時游戲上也有4%到31%提升的收益。
Ryzen 5 9600X相對Core i5-14600K也是類似的情況,包括HandBrake性能提升94%,主要利用了AVX-512性能。游戲測試中提升達(dá)到5%到29%。
AMD表示他們提升了CPU的整體熱阻,相對Ryzen 7000系列提升了15%,并降低了Ryzen 9000系列的工作溫度。在相同TDP下,平均工作溫度降低7%。因此除了Ryzen 9 9950X,新系列所有產(chǎn)品均降低了TDP,例如Ryzen 9 7900X僅為170W TDP,Ryzen 9 9900X 120W TDP,Ryzen 7和Ryzen 5 65W TDP。
與此同時,Zen 5同樣支持AM5平臺,包括X670E、X670、B650E和B650主板,雖然新一波的AM5主板對應(yīng)X870E、X870、B850、B840蓄勢待發(fā),如果想第一時間入手,600系列仍然是第一選擇。
讓NPU達(dá)到50 TOPS
AMD Ryzen AI 300 Strix Point與之前Ryzen 8040 Hawk Point相比,最大的進(jìn)步增強了NPU。在2020年,AMD收購了賽靈思Xilinx,通過整合Xilinx技術(shù)從而啟動了NPU開發(fā),形成了最初的AMD XDNA架構(gòu)。AMD Ryzen AI 300則為XDNA 2,進(jìn)一步增強了擴(kuò)展和性能,包括引入對塊浮點16bit算法(Block FP16),通常情況下,半精度浮點數(shù)(FP16)用于減少存儲和處理需求,但可能犧牲了一定的數(shù)值精度。塊浮點16bit方法通過提升數(shù)據(jù)結(jié)構(gòu),以實現(xiàn)更好的性能和更接近完整精度的數(shù)值表現(xiàn)。同時,AMD表示這種方法結(jié)合了8bit的性能和16bit精確性。
與其他神經(jīng)網(wǎng)絡(luò)精度優(yōu)化類似,Block FP16的目的是減少所需的計算工作量,在處理INT8數(shù)據(jù)時可以通過原生的方式應(yīng)對,而非通過FP16兼容實現(xiàn),從而提升速率和優(yōu)化性能。當(dāng)然,Block FP16本身不是一項新技術(shù),只是AMD成為第一個將其納入NPU范疇的廠商,未來英特爾Lunar Lake也會使用類似的設(shè)計。
AMD XDNA架構(gòu)與多核處理器典型設(shè)計其實不太一樣,XDNA必須將靈活計算與自適應(yīng)內(nèi)存層次結(jié)構(gòu)結(jié)合,與固定計算模型或者靜態(tài)內(nèi)存層次結(jié)構(gòu)模型相比,Ryzen AI XDNA引入了AIE(AI Engine,AI引擎)網(wǎng)絡(luò)進(jìn)行互聯(lián),每個引擎都能動態(tài)適應(yīng)手頭的任務(wù),包括分配計算資源和內(nèi)存資源,從而實現(xiàn)資源分配的效率和擴(kuò)展性。
AMD將這套AIE連接方式稱為空間架構(gòu)(Spatial Architecture),它的設(shè)計具有很強的靈活性,同時將平鋪數(shù)據(jù)流結(jié)構(gòu)與可編程互聯(lián)、靈活分區(qū)想結(jié)合,平鋪數(shù)據(jù)流結(jié)構(gòu)可以實現(xiàn)確定性性能,避免了緩存未命中帶來的性能波動。這是因為每個任務(wù)的數(shù)據(jù)和計算可以在預(yù)定義的貼片(Tile)內(nèi)完全控制和處理,不依賴于緩存。
此外,空間架構(gòu)還有助于優(yōu)化內(nèi)存管理,減少對內(nèi)存帶寬需求,滿足AI推理任務(wù),包括實時視頻和音頻處理,內(nèi)容創(chuàng)作工作流的不同要求。
XDNA 2架構(gòu)可以理解為基于XDNA的升級版本,并增加了更多AI引擎以提升吞吐量。AMD Ryzen AI 300 Strix Point的XDNA 2中可包含32個AI引擎貼片Tile,必上一代多了12個,并且每個Tile的乘法累加器(Multiply-Accumulate,MAC)數(shù)量提升了一倍,片上內(nèi)存提升了1.6倍。最終讓NPU的性能達(dá)到50 TOPS,超過目前英特爾和高通的產(chǎn)品,同時符合微軟對Copilot+設(shè)定的40 TOPS的標(biāo)準(zhǔn)。
XDNA 2除了提升TOPS,在電源效率上也有顯著提升。AMD表示相對于Ryzen 7040中的NPU,XDNA 2 NPU可以用2倍的能效獲得5倍的計算性能,能夠幫助筆記本獲得更長的電池續(xù)航,也能夠在多任務(wù)處理時最多實現(xiàn)8個并發(fā)空間流。
簡單的說,Ryzen AI 300中的XDNA 2 NPU實際上是通過分配AI工作負(fù)載,以更節(jié)能的方式運行微軟Copilot+等離線AI功能,并且由于同時提供INT8和FP16的計算支持,也給了開發(fā)人員更多的調(diào)用硬件空間,從而發(fā)揮最高50 TOPS的NPU性能。從而也進(jìn)一步確保AMD作為第一家在x86上使用NPU的廠商的領(lǐng)先地位。
核顯的進(jìn)階
Ryzen AI 300的另一個進(jìn)階就是RDNA 3.5的核顯圖形架構(gòu)。RDNA 3.5相對RDNA 3有著顯著升級,一方面是AMD與ISV開發(fā)人員密切合作,以提高RDNA 3.5在游戲中的每瓦性能。其中包括改善常規(guī)圖形著色器,減少內(nèi)存訪問時間,同時也確保在離電環(huán)境下進(jìn)一步延長移動設(shè)備的續(xù)航時間。
與RDNA 3相比,RDNA 3.5著重針對了移動平臺優(yōu)化,確保了Ryzen AI 300中Radeon 890M在能效和性能上有長足的進(jìn)步,包括RDNA 3.5的插值和比較率提高了兩倍,這對于處理高質(zhì)量圖形非常重要。插值操作能夠平滑地處理圖像中的細(xì)節(jié)和過渡效果,而比較率則影響到處理復(fù)雜圖像算法時的效率和精度。同時也優(yōu)化向量指令集架構(gòu)(ISA),以獲得進(jìn)一步的圖形展現(xiàn)能力。
RDNA 3.5還優(yōu)化了LPDDR5內(nèi)存訪問的頻率,讓其在整體上更節(jié)能。在最終工作負(fù)載體現(xiàn)上,RDNA 3.5有著更強的表現(xiàn),相比Ryzen 8040核顯每瓦性能提升了32%,特別是在15W功耗下,3DMark Timespy和3DMark Night Raid提升達(dá)到了19%到32%。
目前Ryzen AI 300系列的筆記本已經(jīng)開賣,相比驍龍X Elite搭配Windows on Arm被限制應(yīng)用場景,基于x86平臺的Ryzen AI 300和即將到來的臺式機CPU Ryzen 9000系列,會幫助我們進(jìn)一步加速進(jìn)入AI PC時代。特別是對于依賴iGPU和NPU的輕薄型筆記本和游戲掌機而言,能在移動端獲得更強的的性能無疑是讓人振奮的。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.