當顯示器價格不斷下探,2K分辨率顯示器使用率的增長速度想到相當明顯。在Steam最近的硬件統計中,2560x1440分辨率占比接近30%,同樣也是所有分辨率顯示中增長幅度最大的。2K顯示器開始逐漸取代1920x1080分辨率的同時,GPU算力跟進變得順理成章。而這個責任,現在落到了NVIDIA GeForce RTX 5070身上。
在CES 2025上,NVIDIA給GeForce RTX 5070疊了很多層Buff,在體驗表現上可以比肩上一代旗艦,并且官方建議零售價4599元人民幣,一副性價比爆棚的樣子。雖然部分體驗表現限定在開啟DLSS 4的游戲場景中,但作為未來3A級游戲必然支持的新技術,誘惑力一下子就上來了。
這時候GeForce RTX 5070依然給我們留下了很多懸念,它的基礎光柵性能表現是否也讓人滿意,作為主流級GPU,它可以讓我們的PC具備什么樣的素質。隨著評測解禁,現在就讓我們奉上GeForce RTX 5070 Founders Edition首發評測。
新晉玩家:GB205
GeForce RTX 5070使用了一塊與GeForce RTX 5070 Ti不同的GPU型號,即Blackwell GB205。Blackwell針對AI超算、數據中心、服務器,以及消費端制定了多個版本,服務器和數據中心以GB100為開頭,針對游戲和消費端優化則是我們現在所看到的GB200系列。其中GeForce RTX 5070使用的型號是GB205-300-A1,屬于Blackwell架構,基于臺積電4N FinFET定制工藝制造,擁有310億個晶體管,芯片面積263mm2。
在設計理念上,Blackwell架構與Ampere和Ada Lovelace架構設計相似,即一個GPU中包含若干個GPC(Graphics Processing Clusters,圖形處理集群),每個GPC下面再包含若干個TPC(Texture Processing Clusters,紋理處理集群),每個TPC下包含2個SM(Streaming Multiprocessors,流式多處理器),同時再搭配顯存控制器等周邊電路。
SM下即為Blackwell微架構的主要體現,包括128個CUDA Core,1個第四代RT Core,4個第五代Tensor Core,4個紋理單元(Texture Units),1個512KB寄存器文件,128KB L1共享緩存,這些緩存可以根據圖形和計算工作負載需求進行重新配置。同時,SM還包含兩個FP64,FP64 TFLOP速率是FP32 TFLOP速率的1/64,對于消費端而言使用頻率不高,但可以保證FP64代碼可以被正確的執行。對應的,Tensor Core也包含了少量的FP64 Tensor來確保程序的正確執行。
完整的GB205擁有5個GPC,25個TPC,50個SM,以及6個32-bit內存控制器,用來控制12GB GDDR7 192-bit顯存。GPU中包含了6400個CUDA Core,50個第四代RT Core,200個第五代Tensor Core,200個紋理單元,以及80個ROP(Raster Operations,光柵化處理單元)。在內存子系統上,完整的GB205擁有6.25MB L1緩存,12.8MB寄存器文件,以及48MB L2緩存。
GeForce RTX 5070沒有使用完整的GB205,代號GB205-300-A1 GPU屏蔽了1組TPC,即包括5個GPC,24個TPC,48個SM。總共6144個CUDA Core,80個ROP,192個第五代Tensor Core,48個第四代RT Core,GPU Boost頻率來到2512 MHz。6MB L1緩存,48MB L2緩存。配合12GB 192-bit GDDR7顯存,顯存頻率可以來到28Gbps,帶寬達到672GB/sec,比RTX 4070提高了33%。
在編解碼能力上,GeForce RTX 5070提供了1個第九代NVENC,1個第六代NVDEC。
這里我們慣例列舉一些重要參數作為比較:
宛如藝術品的Founders Edition
如果有機會,筆者建議在選購時多考慮NVIDIA公版的Founders Edition,原因是太漂亮了。GeForce RTX 5070 Founders Edition同樣如此。
GeForce RTX 5070 Founders Edition的設計也是從外包裝開始的,簡約低調,提供易開口,撕開腰封的一刻,就能看到“Inspired by Gamers. Enhanced by Al. Built by NVIDIA.”(靈感來自玩家,性能來自AI,制造來自NVIDIA)字樣,格調拉滿。
盒子內襯包含了NVIDIA Logo以及象征著內凹散熱格柵設計的背景。
與此同時,下方型號也驗明GeForce RTX 5070 Founders Edition正身。
白色內膽盒包含了GeForce RTX 5070 Founders Edition本體。與RTX 5080設計一樣,向兩側拉開外包裝盒就可以將內膽取出。
外包裝盒還提示了內部包含顯卡本體、轉換線纜以及說明書。
轉換線纜規格為12VHPWR 16pin(12+4)轉8pin x2電源接口,主要是應對老規范電源使用,12VHPWR本身最高可以支持到600W功耗,GeForce RTX 5070的TGP為250W,應對供電沒有壓力。
拉開內膽上下紙質卡口,就可以輕松打開內膽包裝。紙質卡口使用的是復用設計,所以也能將其輕松復原。打開包裝后就能看到GeForce RTX 5070 Founders Edition本體了,正面上看,一個風扇都沒有,非常簡約,金屬質感的X設計配合圓潤的邊緣,讓顯卡看起來像是一個藝術品。
由于這一代Founders Edition對PCB進行了全新設計,讓其面積大幅縮減,給雙風扇都騰出了流通的空間,從而提升了空氣流通的效率,也進而將顯卡體積縮小。
這里奉上一張RTX 5090 PCB作為參考。
這是GeForce RTX 30系列Founders Edition采用異型PCB和單流通設計之后的全新嘗試,也是有史以來第一款全流通式冷卻架構。在實際壓力測試中,GeForce RTX 5070 Founders Edition噪音在49dBA,在機箱中的噪音幾乎可以忽略。
這時候用紅外線檢測,在室溫20℃環境中,可以看到GeForce RTX 5070 Founders Edition 最高溫度在40℃左右,電源接口34℃。此時GPU核心溫度在68℃。
由于PCB不再連接到顯卡的IO面板,設計團隊為了保證接口UHBR20 DisplayPort 2.1b 和 HDMI 2.1b性能,專門使用了注入玻璃纖維帶狀線纜作為保障。
因此在接口配置上,GeForce RTX 5070 Founders Edition包含了3個DisplayPort 2.1b接口和1個HDMI 2.1a接口。其中DisplayPort 2.1b支持DSC技術,最高可以實現480Hz條件下實現4K 12-bit HDR。HDMI 2.1a則同樣支持DSC技術,最高支持165Hz條件下8K 12-bit HDR。
不同于RTX 5080 FE,GeForce RTX 5070 Founders Edition接口右側面板沒有封死,而是繼續留了通氣口。
不同定位的Founders Edition在導熱材質上的選擇也有不同。比如GeForce RTX 5090 Founders Edition使用了液態金屬作為導熱材質。GeForce RTX 5070 Founders Edition使用相對常規的相變硅脂。
GeForce RTX 5070 Founders Edition小巧的外觀與GeForce RTX 4070 FE相比,在尺寸上變化不大,細節是電源接入方式回到了45度的斜插方式,并在外觀上看起來圓潤很多,一體感也更強。
用DLSS 4戰2K
GeForce RTX 5070 Founders Edition強力表現最大的功臣自然要算DLSS 4。DLSS 4是Blackwell提升游戲體驗的重要技術,DLSS 4可以一步到位通過人工智能提升幀率,降低延遲,改善游戲畫質。
DLSS 4引入了全新的多幀生成技術(Multi Frame Generation,MFG),提供更快的性能和更低的內存使用,并且由CNN卷積神經網絡模型更換到了Transformer模型,這讓超分辨率(Super Resolution,SR),光線重建(Ray Reconstruction,RR),深度學習抗鋸齒(Deep Learning Anti-Aliasing,DLAA)都有了更好的表現,在圖像細節質量和穩定上都有所提升。
需要注意,DLSS 4完全體需要GeForce RTX 50系列GPU才能實現,因為需要第五代Tensor Core與NVIDIA云端AI共同合力的結果。
而DLSS 4帶來的效果是立竿見影的。最大的改變就是DLSS 3上的幀生成,變成了DLSS 4上的多幀生成。重點就在一個“多”上。
DLSS 3的幀生成需要依靠Ada Lovelace中的光流加速器,配合游戲運動矢量,AI網絡,實現每個傳統渲染幀之外,單獨多生成一個幀。
而在GeForce RTX 5070 Founders Edition的Blackwell架構中,第五代Tensor Core在每個傳統渲染幀之間生成的幀數,從1個提升到了最多3個。這是Blackwell硬件和DLSS軟件共同合作的結果。
這套運算方式讓原本的硬件光流加速器也被高效的AI模型代替,使得光流場的生成速度得到提升,AI模型也顯著降低了生成額外幀的計算成本。因此新幀生成AI模型比之前幀生成方法快40%,使用的顯存減少了30%,并且每個渲染幀只需要運行一次即可生成多個幀。
按照慣例,考慮到游戲表現和內容創作表現,我們準備了兩套測試平臺。一套是針對游戲的AMD Ryzen 7 9800XD3搭配X870E,內容創作上則使用Intel Core i9-14900K搭配Z790作為補充,內存為32GB DDR5-7200,電源1250W。同時顯示器使用了ROG XG27UCG 4K與FHD雙模切換顯示器作為體驗和游戲畫質參考。
在DLSS 4的基礎測試中,UL 3Dmark DLSS Feature Test項目已經給DLSS 4提供了預覽版的支持,GeForce RTX 5070通過DLSS 4 4X將幀率提升6.4倍,實際表現幾乎是RTX 4070的2倍。并且對比RTX 4090 D DLSS 3表現,僅剩一步之遙了。
在實踐上,DLSS 4游戲和應用已經開始發力,在近段時間內,就會有超過75款應用和游戲支持DLSS 4。讓筆者體感最為深刻的就是《漫威爭鋒》從首發宣布支持DLSS 4,需要依靠NVIDIA APP實現2X到4X調整,現在只需要在游戲里就能完成無縫切換,無需重啟游戲的功能。
在實際游戲體驗中,GeForce RTX 5070表現可以做到RTX 4070的2.5倍。
《龍騰世紀4:影障守護者》中,GeForce RTX 5070表現可以做到RTX 4070的2.1倍。
另外《龍騰世紀4:影障守護者》獲得了NVIDIA APP的支持,即在游戲啟動之前,找到DLSS Override選項,就可以可以直接對分辨率超采樣,幀生成進行調整。
重點是DLSS 4帶來的畫質體驗效果也非常不錯。在2K分辨率最高畫質下,GeForce RTX 5070通過DLSS 4 4X在光影上獲得了更多穩定表現,畫質在體感上有進一步提升。
事實上,由于DLSS 4上幀數增加而導致的變動明顯,從而導致整體流暢性受影響。為了解決多幀生成帶來的不確定性,Blackwell使用了增強版的幀翻轉計量(Flip Metering)作為解決方案,它將幀節奏邏輯轉移到顯示引擎上,讓GPU可以更精確的管理顯示時序。
因此前面檢測的1% Low FPS均使用FrameView利用MsBetweenDisplayChange來計算檢測,原因是常規的檢測方式依靠CPU將幀傳遞給GPU傳遞的時差進行判斷,由于Blackwell使用了多幀生成技術,利用Flip Metering而非CPU的幀速率作為判斷,因此這套方式并不準確。通過GPU原生的翻轉計量,這可以更為精確的抓到結果。
回到游戲上。《霍格沃茨之遺》同樣加入了對DLSS 4的支持,2K分辨率最高畫質且開啟光線追蹤的前提下,GeForce RTX 5070通過DLSS 4 4X實現了將近300FPS的表現,相當于RTX 4070的2倍。
同樣在畫質上,DLSS 4 4X的畫質效果更為銳利。
《心靈殺手2》更注重游戲的氛圍感,在開啟DLSS 4 4X后,諸如鐵絲網的細節遠比DLSS 3穩定很多,不再出現抖動的情況,甚至表現比原畫質還要好上不少。
這里GeForce RTX 5070通過DLSS 4 4X實現了122FPS的表現,是RTX 4070的1.5倍。
《賽博朋克2077》表現更為突出一些,GeForce RTX 5070加持DLSS 4 4X后是RTX 4070 DLSS 3的3.5倍幀率表現。
對應的畫質也顯著提升,特別是風扇與網格之間猶豫運動產生的偽影不見了。
最后是《星球大戰:亡命之徒》,游戲中已經內置了幀生成Frame Generation和光線重建Ray Reconstruction兩個選項,其中幀生成Frame Generation可以提供2X幀生成和3X和4X的多幀生成。
實際表現中,GeForce RTX 5070搭配DLSS 4 4X可以做到189FPS平均值,是RTX 4070 DLSS 3的2倍。
然后是基礎光柵性能測試。慣例選用DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal作為參考。
GeForce RTX 5070的表現略遜于RTX 4070 Ti SUPER,但相對RTX 4070,提升幅度可以達到30%到40%。
因此在2K游戲的實戰環節。DLSS 3游戲中,GeForce RTX 5070表現與RTX 4070 Ti SUPER是持平的,部分場景相對RTX 4070 Ti SUPER略好一些,但在同一個水平。而如果相對RTX 4070,提升幅度還是非常明顯的,可以做到30%到40%左右的提升。
在DLSS 2的游戲中,GeForce RTX 5070表現也與RTX 4070 Ti SUPER相當,并且相對RTX 4070提升大概在20%到40%左右。
AI依然帶勁
在AI環節,這里先通過UL Procyon FLUX.1 AI Image Generation Demo for NVIDIA進行測試。FLUX.1是一個基于FP4模型,擁有120億個圖像生成模型參數,因此對顯存要求也非常高,必須要在16GB顯存以上才能完成。
Blackwell開始從硬件層面引入對FP4數據格式支持,則可以很好的解決這個問題。原因是FP4提供了一種較低的量化方式,類似于文件壓縮,能夠減少模型的大小。相對大多數模型默認使用的FP16精度相比,FP4所需的內存是FP16的不到一半,并且GeForce RTX 50系列可以提供相比上一代2倍以上的性能,FP4可以通過NVIDIA TensorRT模型優化器的量化方式,確保質量不會有太多損失。
GeForce RTX 5070原生支持FP4,對GeForce RTX 4070差距有3.6倍。
另外在Procyon的Stable Diffusion 1.5 FP16,以及Stable Diffusion XL FP16的測試中,RTX 5070相對RTX 4070提升在16%到21%。
同樣是UL Procyon AI的文本生成基準測試中,選取了多個大語言模型LLMs作為AI性能評估,包括Phi-3.5-mini-3.8B,Mistral-7B-v0.2 7B,Llama -3.1 8B,Llama-2 13B。RTX 5070與RTX 4070 Ti SUPER表現相當,且相對于RTX 4070提升在10%到140%,差距是很明顯的。
MLPerf-Client v0.5是由MLCommons聯盟開發的機器學習基準測試,成員來自哈佛大學、斯坦福大學、NVIDIA、谷歌的工程師和研究人員,旨在不同平臺下探討GPU的AI性能釋放,LLMs大語言模型正好是其中之一。這里MLPerf-client使用Meta的Llama2-7B模型進行。
同樣,RTX 5070與RTX 4070 Ti SUPER表現相當,且相對于RTX 4070提升在10%到20%。
順帶一提,DLSS 4也已經在D5渲染器中得到了應用,已經可以在軟件菜單中找到Super Resolution,Ray Reconstruction和Frame Generation選項。另外DLSS 4 4X多幀生成還可以通過NVIDIA APP設置來實現。
實際幀率中,RTX 5070和RTX 4070 Ti SUPER相當,通過對DLSS 4的支持,表現是RTX 4070 DLSS 3將近一倍的幀率。
在視頻編輯測試中,我們能夠看到GeForce RTX 5070在創作力上的表現。其配備了1個第九代NVENC編碼器和1個第六代NVDEC解碼器,并且在硬件上提供對YUV 4:2:2支持。在拍攝、編輯、色彩校正的過程中,YUV 4:2:2是目前獲取更多顏色信息、減少文件大小,滿足帶寬需求的合理選擇。在YUV 4:2:2視頻中,完整的亮度值被保留,同時保留了一半的原始色度信息,YUV 4:2:2壓縮視頻幀僅占YUV 4:4:4的三分之二,同時提供了YUV 4:2:0兩倍的顏色分辨率。
YUV 4:2:2相當于YUV 4:4:4與YUV 4:2:0之間的新選擇,并且已經成為高端用戶和專業視頻攝像機提供的選擇,當然這也意味著原本以來CPU處理的方式會導致效率低下,用戶體驗不足。
在DaVinci Resolve 19的輸出選項中,可以看到GeForce RTX 5070能夠順利開啟4:2:2 10bit輸出。
這里我們輸出一段由索尼A7拍攝的H.265 59.94fps 4:2:2 30秒左右的視頻素材,GeForce RTX 5070花費時間大概在19秒左右的時間。
如果你是視頻編輯的基礎用戶,GeForce RTX 5070已經比擁有32線程的Core i9-14900K更能打,當然相對于擁有更多編解碼器的RTX 5090 D而言,差距也是明顯的。
另外在V-Ray 6 Benchmark GPU RTX性能測試中,GeForce RTX 5070相對GeForce RTX 4070提升47%。
外Blender Benchmark 4.3.0引入的Moster、Junkshop、Classroom三個參考場景作為參考。GeForce RTX 5070相對GeForce RTX 4070提升幅度在4%到18%。
最后是SPECviewperf用來考驗OpenGL和Direct X API的3D圖形性能,測試場景包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。GeForce RTX 5070相對RTX 4070提升有20%到40%。
寫在最后:2K游戲好手
NVIDIA GeForce RTX 5070 Founders Edition令人印象深刻的地方在于,以4599元的定價,獲得與RTX 4070 Ti SUPER的光柵性能,而后者目前市場價格將近7000元,性價比一下子就得以體現。而一旦獲得DLSS 4加持,畫風就完全不一樣了,RTX 5070可以在2K分辨率下輕松應對所有3A大作光線追蹤最高畫質,實際游戲幀率是RTX 4070的2倍以上,這是以前這個價位不敢想象的。
游戲之外的AI與創作領域,GeForce RTX 5070表現也同樣出色。得益于對FP4原生支持,未來AIGC效率將會變得更高,即便是對比更高階的RTX 4070 Ti SUPER,表現也可圈可點。依靠NVIDIA在行業內的影響力,更多專業軟件和AI應用也會加入到針對GeForce RTX 50系列GPU的優化中,很快我們就能看到GeForce RTX 5070越來越強。
如果有機會選擇,筆者更建議大伙考慮GeForce RTX 5070 Founders Edition版本,這一代的Founders Edition使用了更前沿的設計理念,在滿足散熱效果的同時,也將顯卡尺寸做得更小,更容易裝進小型主機中,對于主流玩家而言,體驗相當友好。
顯然,如果你在等待一款主流定位的GPU,并且在未來一段時間內獲得2K最高畫質流暢體驗,以及AIGC和內容創作的酸爽,在這個價位段下,競爭對手興許會在部分領域給予更高的性價比,但如果想獲得至始至終的流暢體驗,一定是非GeForce RTX 5070莫屬的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.