寫在開頭
在顯卡市場中,主流甜品級產品始終是玩家關注的焦點。隨著 NVIDIA Blackwell 架構的推出,GeForce RTX 50 系顯卡帶來了多項革命性升級。本次評測的主角 —— 影馳 GeForce RTX 5060 圣刃 OC 8GB 顯卡,作為 RTX 50 系的重要拼圖,不僅繼承了 Blackwell 架構的核心優勢,更在性價比與性能表現上展現出強大競爭力。它搭載了第五代 Tensor 核心、第四代 RT 核心、GDDR7 顯存以及突破性的神經網絡著色器,同時首次支持 DLSS 4 多幀生成技術,力求為玩家帶來更高效的渲染效率、更逼真的光影效果與更流暢的游戲體驗。接下來,我們將從架構革新、硬件設計以及性能表現等維度,帶大家領略這張甜品卡的實力。
規格介紹
開始前,照例講講新顯卡的規格。GeForce RTX 50系顯卡采用了此前NVIDIA在AI領域推出的Blackwell架構,以大衛·布萊克威爾命名,其是一名受人尊敬的數學家和統計學家,在博弈論和統計學領域留下了不可磨滅的貢獻,NVIDIA用其名字命名這一架構反映了新平臺的開創性和先進的計算能力。Blackwell可以說是NVIDIA近年來更新幅度最大的GPU架構了,相比起之前的架構來說,劃時代的引入了神經網絡著色器,力圖為游戲開創先進、高效更有逼真的渲染方式,帶給玩家全新的游戲體驗。
相比前代Ada架構,Blackwell的升級聚焦于四大方向:分別是AI算力的爆發、光線追蹤技術的革新、顯存能效的提升以及劃時代的神經網絡渲染。
第五代Tensor核心
其中AI算力的爆發就不得不提到Blackwell架構上的第五代Tensor核心,新一代Tensor核心添加了對FP4浮點運算精度的支持。FP4是一種較低的量化方法,類似于文件壓縮,可以減小模型推理過程中數據存儲和計算量大小,提高計算效率,降低該過程對顯存的要求。與大多數模型默認使用的FP16相比,FP4使用的顯存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高達2倍。
第四代RT核心
而光線追蹤技術的革新則仰賴于第四代RT核心的加持,相較于第三代RT核心來說,Blackwell架構的第四代RT核心主要提升了檢測光線、路徑與三角形相交的效能,過往在檢測時往往只能檢測單個三角形,一旦場景復雜,檢測能力不足就容易導致渲染出錯等問題,而現在檢測能夠以簇集方式進行,檢測效率更高。同時還有三角形簇集解壓縮引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以減少渲染毛發所需的幾何圖形數量,并使用球體代替三角形以獲得更準確的毛發形狀擬合,能夠讓顯卡發揮更好的性能但只消耗較小的顯存占用。
綜合來看,Blackwell架構的光線追蹤多邊形相交效率是上一代Ada架構的2倍,是Turing架構的8倍,同時還可以節省25%的顯存使用率。
第四代RT核心的改進主要是為實現更好的光追效果。其中有兩項新技術能夠受益,第一項是RTX Mega Geometry技術。隨著光線追蹤游戲場景的幾何復雜性不斷增加,游戲畫面中幾何圖形的計算量也呈現出快速增長的趨勢。而RTX Mega Geometry技術能夠加速構建邊界體積層次結構(BVH),使得在實時渲染中可以處理多達100倍的三角形數量。
該技術的出現,也使得開發者能夠在游戲場景中使用更復雜的幾何圖形,而不會影響游戲幀率。過去需要一個個算BVH,現在RTX Mega Geometry能夠智能地在GPU上批量更新三角形簇,減少了CPU的負擔,既保證了性能,也兼顧了圖像質量。相信隨著這些技術的不斷發展和應用,未來的游戲將能夠呈現出更加逼真和細膩的視覺效果,同時保持高效的性能表現。
另外一個能夠受益的技術則是Curve Primitive,方便光追在曲面中的應用,例如一位男士的頭發可能需要多達400萬個三角形,再加上光線追蹤技術,畫面所需要的運算負載極大。NVIDIA則通過第四代RT核心中的Linear- Swept Spheres(線性掃描球體)技術有效減少了渲染頭發所需的幾何體數量,以球形代替多邊形,更貼合頭發的形狀,從而將內存占用量大幅縮減至三分之一,并進一步提升了實際幀數,讓頭發的渲染效果更加自然流暢。
GDDR7顯存
第三點改變則是顯存效率的提升,Blackwell架構中還首次加入了對GDDR7顯存的支持,此前GDDR6顯存的信號編碼為NRZ/PAM2,而RTX 40系上的GDDR6X則是PAM4編碼。最新的GDDR7顯存,信號編碼改成了PAM3,NRZ/PAM2每周期提供1位的數據傳輸,PAM4每周期提供2位的數據傳輸,而PAM3每兩個周期的數據傳輸為3位。說人話就是,新的編碼機制可以使雜訊失真比減小,信號品質更清晰,同時還能帶來更高的顯存運行頻率以及更低的電壓,根據NVIDIA的介紹,使用GDDR7顯存后,數據傳輸速率可達GDDR6時的2倍,并且功耗接近GDDR6的一半,經典加量還減價。
神經網絡著色器
接著我們再細說一下這一代架構最大變化,NVIDIA這次將Blackwell架構的SM單元直接稱為神經網絡著色器。相比較于之前的可編程著色、CUDA統一著色、通用計算著色來說,其最大的變化就是引入了AI,AI將會徹底改變GPU的著色方式。
在Blackwell架構中,NVIDIA 進一步拓展了神經網絡渲染的范疇,引入了諸多創新元素,包括神經網絡紋理壓縮(Neural Textures)、神經網絡材質(Neural Materials)、神經網絡體積(Neural Volumes)、神經網絡輻射場(Neural Radiance Fields)以及神經網絡輻射緩存(Neural Radiance Cache)等,這些元素共同構成了神經網絡渲染中神經網絡著色的重要呈現方式。
這里舉個例子讓大家能夠更簡單的理解神經網絡渲染,過去復雜的物品或大量異材質的貼圖往往會占用相當大的內存空間,如果疊加光追的話,計算量將會更大。然而,得益于神經網絡渲染技術中的神經網絡材質功能,這一問題得到了顯著改善。開發者可以先在離線渲染出物品的光照數據,然后再用這些數據訓練一個小的AI模型,游戲運行時只要實時調用這個AI模型當場推理就好了,這樣就能還原出想要的光照效果了,再配合神經網絡紋理壓縮技術,就能顯著降低實際生成的材質數據量,從而在占用更少顯示內存的同時,實現了細節更豐富的材質表現,達到了實時生成如電影般細膩素材的效果。
目前神經網絡渲染技術已經得到了微軟的大力支持,未來也將會加入到DirectX中,玩家能夠體驗到更真實的游戲世界。
而在硬件層面,由于神經網絡渲染的加入,Blackwell架構的SM單元相較于RTX 40系的Ada架構還是有不小變化的,Ada架構內的SM內,SM單元會拆分成一半的CUDA專門用于處理FP 32(單精度浮點數),另一半則依需求動態調整去處理FP32和INT32(32位整數)。而在Blackwell架構上,SM單元則改成了CUDA核心可以完全依需求動態處理FP32和INT32的形式。
另外一個改進是,過往的著色工作往往只有SM單元的Shader在處理,而Blackwell架構上引入了神經網絡渲染以后,使得Blackwell架構上的第五代Tensor核心也能共同分擔著色工作,大大提高了著色效率。
這樣改進的好處是,Blackwell架構能夠進一步針對神經網絡渲染工作進行排序,即把傳統的著色工作分配給Shader,而需要動用神經網絡渲染的工作負載則可以給到Tensor核心上,兩種核心同時運用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可編程渲染管線,現在開發者或API也能更好的調用Tensor核心,未來游戲內我們能見到的AI技術勢必越來越多。
先進的AI管理處理器
此外,AI的應用也越來越多,不僅游戲中應用AI技術,現在連可編程渲染的過程里也引入了AI,因此如何去分配顯卡內部多樣化工作就成了一個問題。如過往顯卡在開啟DLSS玩游戲時,其中應用到的語言模型和游戲引擎需要同時與GPU的不同核心交互,生成游戲幀,但是往往很難做到每一幀都有一致的生成時間,亦或者是游戲AI對話的響應不夠及時,這些情況都會造成游戲體驗不友好。
而Blackwell架構為了解決這一問題,引入了AI管理處理器(AMP)。它能夠實時調度資源,確保在神經網絡渲染、幀生成和 AI 驅動的游戲交互中實現智能化的任務分配。這種設計不僅帶來了更高效的性能輸出,還讓顯卡在游戲渲染和 AI 運算之間實現了絕佳的平衡,確保幀的間隔均勻,對話類型的AI能夠及時響應,玩家的游戲體驗一致性能夠比較好的保障。
GeForce RTX 5060 8GB規格
說了這么多,接下來給大家介紹一下GeForce RTX 5060 8GB的硬件規格,作為RTX 50系的最后一塊拼圖,核心采用了新的GB206芯片,核心代號為GB206-250-A1。在架構上擁有3個GPC,但每個GPC包含的TPC并不相同。GeForce RTX 5060 8GB上總共集成了18個TPC,30個SM單元,120個TMUs紋理單元,48個ROPs光柵化處理單元以及3840個CUDA核心。
在工藝制程方面,新的GB206芯片沿用了TSMC 4nm 4N NVIDIA Custom Process工藝。核心面積為181mm2,內部晶體管數量則有219億,雖然在芯片面積以及晶體管數量上相比上代少了一些,不過得益于更先進的架構設計,GeForce RTX 5060 8GB的CUDA核心數比上代多出了25%。基礎頻率與Boost頻率也有小幅上升,由原來的1830MHz與2460MHz提升至現在的2280MHz以及2497MHz,想必性能也有不小的長進。
除此之外,GeForce RTX 5060 8GB還配備了全新的GDDR7顯存,顯存等效頻率可達28Gbps,同時視頻輸出接口也進行了升級,能夠兼顧高分辨率與高刷新率,后續開箱顯卡時我們會詳細介紹。
最后一點區別就是售價了,全新上市的GeForce RTX 5060 8GB MSRP版本官方建議零售價為2499元,對比上代的GeForce RTX 4060 8GB稍微提升了100元左右。不過更先進的架構設計與更激進的性能釋放,還有25%的規格提升,絕對是主流玩家的甜品之選。
顯卡外觀賞析
接下來讓我們看看這款顯卡的真面目,外觀設計方面,影馳GeForce RTX 5060 圣刃 OC 8GB與之前的圣刃系列顯卡幾乎一樣,純白的導風罩,周邊配有一些符咒等符號進行點綴,具備很高的視覺辨識度。
正面還有三把全新的90mm霜環風扇坐鎮,每把風扇為7扇葉結構,環狀扇葉結構設計,扇葉表面還有三折處理,這樣子風扇即使是高轉速運行,也能夠有不錯的穩定性與噪音表現。
接著看看顯卡的背部,其背板采用全金屬打造,同時延續了白色的設計風格。尾部還加上了圣刃系列的標識,讓顯卡顏值更進一步。
顯卡背板的另一側則采用大面積開窗設計,這樣能夠讓風流自下而上吹出,減少了積熱,有效增強了散熱能力。
視線來到顯卡的一側,影馳GeForce RTX 5060 圣刃 OC 8GB顯卡所配備的影馳LOGO的燈光模塊采用了磁吸設計,用戶可以自由選擇將其安裝在顯卡的側面或尾部。
在磁吸光模塊旁邊還有一段英文,寫著“blade of chaos,hear my chant,seal thyself,power banished”,簡單翻譯下就是“混沌之刃,聽我的詠唱,封印自身,放逐力量”,滿滿的二次元氣息。
顯卡的頂部就比較常規了,中央是磁吸光模塊接口,而一側則是NVIDIA顯卡經典的“GEFORCE RTX”標識。
顯卡的供電接口也安排在顯卡頂部,不同于70級別及以上的RTX 50系顯卡,影馳 GeForce RTX 5060 圣刃 OC 8GB為單8Pin接口,應對145W的TGP完全足夠。
視頻輸出接口方面,還是經典的3個DP加1個HDMI的配置,不過規格上有了升級,為DP 2.1b與HDMI 2.1b規格。理論上,這一代顯卡的視頻輸出接口可以輕松實現4K 480Hz和8K 240Hz超高分辨率與超高刷新率的需求。
另外,從這個角度還可以看出這款顯卡非常苗條。顯卡的外觀設計符合SFF-Ready尺寸要求,其具體尺寸為,含擋板:316.5*140*40mm,不含擋板:304*125*40mm,這樣的設計更便于玩家組建緊湊型ITX/M-ATX小鋼炮。
顯卡拆解賞析
下面是顯卡拆解環節,拆解影馳GeForce RTX 5060 圣刃OC 8GB還是比較簡單的,僅需擰下背板與側邊IO面板的螺絲即可分離PCB與散熱器。
拆開后先看看顯卡的PCB設計。與之前的RTX 5060 Ti類似,影馳GeForce RTX 5060 圣刃OC 8GB的PCB完全可以用小巧玲瓏來形容。這個尺寸完全可以做成ITX顯卡!
PCB的背面就比較整潔了,幾乎都是一些控制芯片。
PCB的中央則是顯卡的核心——GB206-250-A1,影馳GeForce RTX 5060 圣刃OC 8GB就靠它驅動,規格方面,核心由TSMC 4N工藝打造,擁有3840組CUDA核心,數量上對比RTX 4060要高出約25%左右,這也就意味著它的通用圖形性能會更強,不過實際性能提升究竟有多少,還請接著往下看。
核心的四周則被4顆顯存芯片包圍,規格上是GDDR7,由三星提供,單顆2GB,共8GB。顯存型號為K4VAF325ZC-SC28,內部是512M×32的架構,根據其型號后綴“SC-28”也可以知道,這些顯存的數據頻率可達28Gbps。
供電部分,影馳GeForce RTX 5060 圣刃OC 8GB采用公版的4+2相供電設計,對于一張功耗只有145W的顯卡來說,這樣的供電規格是完全沒有任何問題的
左側是4相核心供電,每相供電均配上了固態電容、全封閉電感,以及DrMos芯片
PCB的右側則是2相顯存供電,同樣配備了獨立的DrMos芯片。
下面看看這款顯卡的散熱設計,整張顯卡的散熱系統還是相當有份量的,整個散熱系統可分為三部分,分別是散熱器主體、金屬背板以及主動散熱風扇。
率先映入眼簾的就是正中間這個大面積且非常厚實的鍍鎳銅底座。四周是影馳為顯存、電感等部件準備的高導熱系數的導熱墊。
整個顯卡散熱模組還是非常碩大的,可以分為左右兩個部分,左側是密密麻麻的散熱鰭片,配合氣流,能夠快速帶離熱量,提升整體冷卻效能。散熱鰭片之下則藏有3根核心熱管,其為GPU核心及顯存散熱提供了高效的散熱保障。
主動散熱就是外觀部分給大家介紹過的霜環散熱風扇了,搭配上面介紹的核心熱管、鍍鎳銅底座以及大面積的散熱鰭片,共同為每位玩家提供了無與倫比的散熱性能和極其安靜的使用體驗。
測試平臺介紹
開始性能測試前介紹一下本次的測試平臺, CPU使用的是目前毫無爭議的游戲神U——AMD Ryzen R7-9800X3D,主板則是來自微星的MPG X870E CARBON WIFI 暗黑主板。內存為G.Skill的幻鋒戟Z5 RGB DDR5,在這塊主板上能輕松達成DDR5-8000 C38的成績,并且我們這次選用的是24G×2的套條,確保這張顯卡能夠釋放全部性能。
完整測試平臺如下所示:
理論性能測試
開始測試前,照例還是要“認識”一下這張顯卡。從GPU-Z的信息中可以看到影馳GeForce RTX 5060 圣刃 OC 8GB的基準頻率為2280 MHz,Boost頻率為2535MHz,畢竟是帶著OC后綴的型號,其Boost頻率對比MSRP版本的RTX 5060要高出不少,由2497 MHz提升到了2535MHz,這也意味著其性能釋放更強勁一些。除此之外,這張顯卡的TDP也比前代稍高一些,為145 W。并且換裝了更高級的GDDR7顯存,能夠帶來448 GB/s的顯存帶寬,對比前代的272 GB/s提升明顯。
在理論性能測試 3DMark 中,影馳 GeForce RTX 5060 圣刃 OC 8GB 在 Fire Strike 系列測試里的表現相當出色。在 1080P 分辨率下,相比 RTX 4060 能領先大概 38%,和 RTX 4060 Ti 對比也有 20% 左右的性能提升;來到 2K 分辨率,它領先 RTX 4060 約 40%,比 RTX 4060 Ti 高出約 18%;而到了 4K 分辨率,優勢更為明顯,對比 RTX 4060 有 46% 的提升,對比 RTX 4060 Ti 也有 19% 的領先幅度。
除了 Fire Strike,該顯卡在以 DX12 為基礎的 Time Spy 測試中同樣表現出色,和 RTX 4060 相比,領先幅度達到 33% 左右,對比 RTX 4060 Ti 大約領先 5-6%,整體性能提升幅度還是比較可觀的。
另外,在光追項目測試中,影馳 GeForce RTX 5060 圣刃 OC 8GB 的得分高達 8795,這一成績比 RTX 4060 Ti 還要高出 10%,對比 RTX 4060 則高出 45%,性能提升幅度堪稱代際升級。而在最新的 Speed Way 測試中,這款顯卡對比 RTX 4060 也有超過 32% 的性能提升。
DLSS 4專項測試
看完了理論性能部分的測試,接著我們再來看看本次RTX 50系顯卡最“頂”的升級,DLSS 3在RTX 40系顯卡上引入了幀生成技術,能夠依靠AI在兩幀之間生成一幀AI幀,從而實現幀數的翻倍,用過的玩家都說好!不過由于每生成一個新的幀都需要光流加速器和 AI 模型參與,因此生成多幀的開銷相當高昂,而過高的性能開銷會帶來瓶頸,導致幀率提升受限。
而這次DLSS 4全新升級,引入了多幀生成技術,它可以利用 AI 為每個渲染幀額外生成多達3幀!相比傳統渲染的方式,能夠最多實現8倍的性能提升。無論是對性能、顯存的開銷還是延遲都比之前要好了許多。
另外,由于多幀生成技術,輸出的幀多了,要給每一幀都安排一個合理的間隔刷新才能讓觀感更好。因此NVIDIA還引入了專屬的Flip Metering來代替CPU Pacing,它將幀節奏邏輯轉移到顯示引擎,讓GPU能夠更精確地管理顯示時間,盡可能的將每一幀畫面的生成時間保持一致,從而提高整體游戲視覺的流暢感。不過由于Flip Metering是硬件級的控制器,因此DLSS 4的多幀生成目前只有RTX 50系顯卡支持。
同時DLSS 4 還引入了圖形行業首個 Transformer 模型實時應用。熟悉AI的應該對它很熟系了,它在AI生成領域已經應用多年了。基于Transformer架構的 DLSS 超分辨率和光線重建模型,相比之前DLSS使用的卷積神經網絡(CNN)模型來說,具備2倍的參數量和4倍的計算量。在游戲場景中,能夠提供更高的穩定性、更少的拖影、更高的細節和更強的抗鋸齒能力,使畫面更加清晰、流暢和逼真。
不過雖然DLSS 4的多幀生成功能是RTX 50系顯卡的獨占功能,但新的Transformer模型將會逐步下放至DLSS 3、DLSS 2等,將適用于所有GeForce RTX顯卡。并且根據NVIDIA的說法,超過75款游戲和應用將在GeForce RTX 50系列開售時支持DLSS 4的全新DLSS多幀生成功能,包括《賽博朋克2077》《戰神:諸神黃昏》《心靈殺手2》《霍格沃茲之遺》等。隨著時間的推移,支持DLSS 4的游戲和應用數量將不斷增加。
簡單介紹完,我們再看看DLSS 4的理論表現如何,在 3DMark DLSS 4 專項測試中,影馳 GeForce RTX 5060 圣刃 OC 8GB 展現出顛覆性性能提升:2K 分辨率下,開啟 DLSS 4 前后的幀數差距達到4 倍,而4K 分辨率下更是達到了夸張的7 倍性能鴻溝。
接著我們看看DLSS 4在實際游戲中的表現,率先登場的就是有著“顯卡殺手”之稱的《賽博朋克2077》,它的設置頁面是目前支持DLSS 4游戲中最為豐富一款,除了能夠設置DLSS 4的多幀生成外,還可以切換DLSS 4的另一個特性——Transfomer Mode,據說能夠讓畫質更清晰,同時還能改善此前的拖影問題,對玩家可以說是一大利好。
我們直接來一波對比,左側為Transformer模型,右側則是原本的CNN模型。從第一個場景來看,Transformer模型能夠帶來更多的細節。例如左側圖片中的欄桿倒影,這部分表現是比較清晰的,而CNN模型中則幾乎不可見。
第二個場景也是能夠一眼看出區別的,例如金屬門的紋理細節以及磚墻的接縫處,明顯是Transformer模型的優化要更好一些。
這個場景的區別主要在于地板細節刻畫以及右側鐵欄桿部分,采用Transformer模型的情況下,地板細節更接近真實世界,并且鐵欄桿的細節也能更好的還原。而CNN模型則會丟失比較多的細節,雖然不影響觀感,但總有種“失真感”。
不過Transformer模型目前也并非萬能,畢竟是由AI生成而來,因此在部分細節上還是有些錯誤的。例如下方的窗口部分,陽光照射下應該是斑駁的光影,比較正確顯示的應該是CNN模型中的樣式。整體來看,現在Transformer模型瑕不掩瑜,大幅改善的畫面細節能夠給玩家帶來更精致的游戲展現。
見識完Transformer模型的魅力以后,我們再來看DLSS 4的性能表現,畢竟是“顯卡殺手”,對顯卡的壓力確實不一般,在最高畫質+路徑追蹤的情況下,影馳GeForce RTX 5060 圣刃 OC 8GB只能跑20 FPS,果然全景光追的壓力不容小覷。開啟DLSS 3以后,游戲幀數為85 FPS,體感已經非常流暢了。開啟DLSS 4以后,影馳GeForce RTX 5060 圣刃 OC 8GB能夠做到153 FPS,對比原生分辨率,性能足足提升了7.6倍,這在以前的甜品卡身上,完全不敢相信。
DLSS 4帶來的性能提升是有目共睹的,不過也有玩家擔心DLSS 4的畫質表現如何,這里我們也在游戲中截取了部分畫面,第一個場景其實差距不大,肉眼很難分辨出區別。
第二與第三個場景還是能夠看出部分細節的,例如第二幅圖中的霓虹燈牌,DLSS開至性能檔以后,能夠看到燈牌與前面三張圖有些許差異,不過你得靠細致的對比才能看出。實際游戲過程中很難發現,基本不影響觀感。
總的來說,DLSS對畫質的影響沒有玩家想象中那么大,甚至于在紋理細節上能夠不輸或超越原生分辨率。如果你是敏感型玩家,那建議可以開至平衡檔,在畫面質量和幀率之間能夠做到很好的平衡。如果你是追求超高幀率,那性能檔也絕對可用,細節保留也不錯,不對比基本看不出,同時幀率還能進一步提高。
第二款游戲則是NVIDIA在前段時間強力推薦的《半條命2》RTX版,這款游戲不僅支持了DLSS 4,同時也在游戲中加入了RTX神經網絡輻射相關的技術,與初始版本的《半條命2》相比,畫質可以說是史詩級的進步!
實測下來,只能說《半條命2》RTX版對硬件的開銷極大,在原生1080P分辨率下,所有畫質、光追均開至最高,不開啟超分選項時,影馳GeForce RTX 5060 圣刃 OC 8GB幀數為44 FPS。在開啟DLSS 3質量檔以后,游戲幀數來到了84 FPS,幾乎快摸到高刷的門檻了,而繼續開啟DLSS 4質量檔,游戲幀數飆升至156 FPS,對比原生1080P的表現,性能提升高達3.5倍!1%Low的表現也差不多,領先幅度接近4倍。
DLSS 4的畫質也表現極佳,這里我們還是在游戲中截取了部分畫面,基本上可以說DLSS對畫質的影響沒有玩家想象中那么大,甚至于在紋理細節上能夠不輸或超越原生分辨率。
另外,游戲設置中也可以切換DLSS 4的另一個特性——Transfomer Mode,這里我們也截圖了相同的場景進行對比,從下圖可以看出Transformer模型能夠帶來更多的細節。例如左側圖片中的墻壁,這部分表現是比較清晰的,細節也更多,而CNN模型中則幾乎不可見。圖片中主體的木屋紋理也是Transformer模型下會更清晰,線條更銳利。
我們測試的第三款DLSS 4游戲是《霍格沃茲之遺》,支持DLSS 4技術以后可以在設置看到幀生成部分多了一些選擇,其中×2則是原本DLSS 3的幀生成,而×4則是RTX 50系獨有的多幀生成功能,另外你也可以選擇插2幀的方式,也就是所謂的×3選項。
實際測試過程中,我們發現《霍格沃茲之遺》這款游戲優化還是不錯的,1080P分辨率畫質光追均設置最高的情況下,影馳GeForce RTX 5060 圣刃 OC 8GB在不開任何超分的情況下,平均幀為65 FPS。如果開啟DLSS 3質量檔,此時幀數已經能夠做到108 FPS了,屬于是高刷與畫質的完美組合,體驗相當絲滑。開啟DLSS 4以后,幀數可以進一步提升至176 FPS,對比原生1080P的表現,性能提升了約3倍左右。
第四款游戲我們測試的是《星球大戰》,一樣你能在設置中看到其幀生成功能已經支持×4的選項,也就是DLSS 4多幀生成功能。
實測DLSS 4在這類優化欠佳的游戲中確實大有用處,在1080P原生分辨率下,影馳GeForce RTX 5060 圣刃 OC 8GB的平均幀僅有77 FPS,整體游玩體驗還不錯。而開啟DLSS 4質量檔以后,游戲平均幀直接暴增至250 FPS,游戲體驗如德芙般絲滑,對比原生1080P的表現,足足有2.7倍左右的提升。即便是對比DLSS 3的145 FPS,也是足足提升了100+ FPS。
接下來我們再測一下第一款國產3A大作、去年的熱門單機游戲《黑神話:悟空》,去年發售時,這款游戲也是率先支持了DLSS 3幀生成功能,如今它還支持了RTX 50系顯卡的DLSS 4多幀生成,游玩體驗將會更加順暢,開啟方式也很簡單,在游戲菜單設置中即可找到4X的選項。
我們在1080P下將畫質調整至影視級,全景光追也拉到最高,此時影馳GeForce RTX 5060 圣刃 OC 8GB在不借助任何超分技術的條件下,游戲幀數僅有35 FPS。而有DLSS 3的幫助后,游戲幀數也回到了流暢的水準87 FPS;這時如果你有RTX 50系顯卡,開啟DLSS 4多幀生成以后,游戲幀數將再度飛躍,135 FPS的表現相當夸張,對比原生分辨率提升了快4倍,直接由可玩變爽玩了。
網游方面我們測的是《漫威爭鋒》,這款游戲在RTX 50系顯卡首發之時,它還沒有完全適配DLSS 4,玩家想要體驗多幀生成功能還需要依靠NVIDIA App的DLSS 4優設功能。不過現在《漫威爭鋒》也正式支持DLSS 4了,與上面的游戲一樣,玩家在游戲設置中就能直接開啟,并且提供了2x、3x以及4x選項,玩家可以隨意選擇是插一幀、插兩幀還是插三幀。
影馳GeForce RTX 5060 圣刃 OC 8GB在1080P全高設置下,不開超分,幀數為91 FPS。開啟DLSS 3后幀數可以達到189 FPS,相比原生分辨率已經提升了一倍以上,如果再開啟DLSS 4多幀生成,性能對比原生分辨率直接提升3倍以上,315 FPS的表現應該叫極致絲滑。同時延遲以及1%Low表現也非常出色,反應在游戲中會更加跟手,體感更佳。
最后一款游戲我們測的是最近剛支持DLSS 4的《毀滅戰士:黑暗時代》,實測影馳GeForce RTX 5060 圣刃 OC 8GB在1080P分辨率、超級噩夢畫質下,表現還是非常不錯的,即便不開啟超分,也能流暢游戲;開啟DLSS 3質量檔后,游戲幀數已經能夠滿足高刷需求了,接著啟動DLSS 4質量檔后,游戲幀數更是來到了250 FPS以上,完全的爽玩水準。
當然,如果你想玩的游戲還不支持DLSS 4,那也不用擔心,NVIDIA App還提供DLSS 4優設功能,說人話就是能夠讓游戲強開DLSS 4,像此前的《漫威爭鋒》,在未更新前,玩家可以直接在NVIDIA App中簡單設置,就能將幀生成調至“4×”,一鍵實現多幀生成。目前也有不少游戲支持DLSS 4優設功能,感興趣的玩家可以前往體驗。
DLSS 4多幀生成功能的問世,毫無疑問為玩家帶來了前所未有的游戲體驗升級。過往甜品卡戰2K仿佛天方夜譚,如今影馳GeForce RTX 5060 圣刃 OC 8GB在DLSS 4的加持下,不僅能夠暢玩1080P,甚至2K乃至4K都有可能。與上一代RTX 40系的DLSS 3幀生成功能相比,它更是實現了幀數的驚人飛躍。在相同的畫質設置下,影馳GeForce RTX 5060 圣刃 OC 8GB的表現遠遠超越了前代的RTX 4060。實際測試中,在上述七款游戲里,開啟DLSS 4的影馳GeForce RTX 5060 圣刃 OC 8GB,幀數幾乎是RTX 4060的兩倍!在部分極其吃硬件的游戲如《黑神話:悟空》中,幀數甚至可以做到三倍,非常夸張!RTX 5060+DLSS 4 的組合,正在重新書寫 1080P/2K 分辨率下的游戲體驗標準。
另外,值得一提的是,與DLSS 4一起到來的還有全新的NVIDIA Reflex 2技術。延遲一直是電競中繞不開的話題,玩家的每個動作都會經過復雜的計算,再在屏幕上渲染,這其中的每一步都會增加延遲。雖然延遲往往只有幾十毫秒,但是你卻能明顯的感覺到游戲的不流暢、卡頓。
為了盡可能的降低延遲所帶來的不良游戲體驗,NVIDIA發布了NVIDIA Reflex技術,它可以使GPU和CPU同步,確保最佳響應速度和低系統延遲。目前NVIDIA Reflex已集成到超過100款游戲中,可以將PC延遲降低50%。
而GeForce RTX 50系顯卡再度升級,帶來了NVIDIA Reflex 2技術。它結合了Reflex低延遲模式與Frame Warp技術。它可以把最新的鼠標輸入指令同步給渲染幀,及時更新渲染的游戲幀并在渲染幀被發送到顯示器之前獲取最新的鼠標信息,通過刷新渲染的游戲幀以進一步減少延遲,將PC延遲進一步降低多達75%。
另外,Frame Warp的加入,能夠進一步將延遲降低。當一個幀被GPU渲染時,CPU會根據最新鼠標或手柄輸入計算工作流中下一幀的視角位置。Frame Warp從CPU采樣新的視角位置,然后將GPU剛才渲染的幀扭轉到最新的視角位置。在渲染幀被發送到顯示器之前,在盡可能最新的時間進行扭轉操作,確保屏幕上反映最新鼠標輸入。
而當Frame Warp轉移游戲像素時,圖像中可能會產生縫隙撕裂、鏡頭位置的變化會讓游戲場景中顯示新的部分。NVIDIA則開發了一種優化了延遲的預測渲染算法,該算法使用來自先前幀的視角、顏色和深度數據,對這些撕裂空白的像素進行準確的圖像修復。玩家可以通過更新的視角看到沒有撕裂的渲染幀,并降低了改變游戲內視角位置而產生的延遲。說人話就是現在NVIDIA Reflex 2還可以根據上一幀的信息去腦補一些空白的像素,有種無中生有但你又看不出來的感覺。
首發支持NVIDIA Reflex 2技術的游戲是《THE FINALS》以及《無畏契約》,后續我們也會第一時間帶給大家該技術的詳細評測。
游戲性能測試
作為RTX 50系顯卡的核心競爭力之一,DLSS 4技術憑借顛覆性的多幀生成能力,為游戲性能帶來了革命性提升。接下來我們將通過3DMark基準測試與實際游戲場景,繼續探索影馳GeForce RTX 5060 圣刃 OC 8GB的常規游戲性能。
首先是3DMark的DLSS 3性能測試。影馳GeForce RTX 5060 圣刃 OC 8GB在2K分辨率下,對比RTX 4060,性能提升幅度非常夸張,達到了82%,對比RTX 4060 Ti則是25%;4K分辨率下,開啟DLSS 3以后,對比RTX 4060性能領先也基本維持在80%以上,而對比RTX 4060 Ti同樣拉開了不小的差距,接近40%的性能提升只能說老黃確實有點東西。
實際游戲表現又如何呢?這里我們選取了10款游戲進行測試,包含光追及光柵性能方面的測試,而游戲畫質方面均全部選擇最高畫質,光追設定部分,如有則采用最高。
實測,在 1080P 分辨率下,影馳 GeForce RTX 5060 圣刃 OC 8GB 輕松應對所有測試項目,甚至展現出越級挑戰 2K 分辨率的實力:《F1 22》《光明記憶:無限》《漫威爭鋒》等優化出色的作品中,幀率穩定突破 200+ FPS;即便是硬件壓力極大的《黑神話:悟空》《賽博朋克 2077》全高設置下,仍能保持 87 FPS 的流暢表現,輕度降低畫質即可解鎖 144Hz 高刷體驗。綜合性能方面,影馳 GeForce RTX 5060 圣刃 OC 8GB 在常規游戲性能上整體超越 RTX 4060 約 20%,對比 RTX 4060 Ti 也有近 10% 的性能反超。
圖像視頻創作性能測試
接下來要進行的是圖像視頻的創作性能測試,影馳 GeForce RTX 5060 圣刃 OC 8GB 依舊延續了游戲領域的巨大提升,再度展現出顯著的代際優勢。首先通過 PCMark 10 Extended 綜合測試可見,其在游戲性能與數位內容創作場景中的表現尤為突出:相較 RTX 4060 領先幅度達 12%-31%,面對更高定位的 RTX 4060 Ti 亦實現約 10% 的性能提升。值得注意的是,其生產力項目得分暫時偏低,推測與現階段驅動優化尚未完全到位有關。
圖像編輯與視頻創作環節我們則采用 UL Procyon 進行測試:在圖像編輯任務中,影馳 GeForce RTX 5060 圣刃 OC 8GB 與 RTX 4060 Ti 表現旗鼓相當,而對比 RTX 4060 則保持 9% 的性能優勢;進入視頻剪輯場景,該顯卡的優勢進一步放大,相較 RTX 4060 和 RTX 4060 Ti 分別實現 18% 與 15% 的領先。
針對 Adobe 生態與達芬奇 Resolve 的專項 Benchmark 測試顯示,影馳 GeForce RTX 5060 圣刃 OC 8GB 在視頻編輯環節展現出碾壓級優勢 —— 依托第 9 代 NVENC 編碼器的升級,不僅編解碼效率大幅提升,更支持包括 AV1 UHQ 在內的新一代視頻格式,在 Premiere Pro 與達芬奇的實際工程測試中,對比前代兩款 60 級顯卡的性能提升均超過 20%。
3D渲染創作性能測試
在 3D 渲染創作性能測試環節,影馳 GeForce RTX 5060 圣刃 OC 8GB 繼續展現出強勁實力。首先在 Blender 與 V-Ray 兩款行業主流軟件中,其表現令人矚目:Blender 渲染測試中,該顯卡較 RTX 4060 領先約 20%,面對定位更高的 RTX 4060 Ti 也能保持勢均力敵的競爭態勢;而在 V-Ray 渲染測試中,影馳 RTX 5060 圣刃 OC 8GB 實現壓倒性優勢,對比 RTX 4060 領先幅度超過 30%,相較 RTX 4060 Ti 亦有 20% 的顯著優勢。
再看看另外一款渲染器,D5 Render是一款基于DXR和光線追蹤技術構建的GPU渲染器。正因為其有光線追蹤技術,其渲染的畫面相當出色。這款軟件在RTX 40系顯卡測試時支持了DLSS 3幀生成,而現在隨著RTX 50系顯卡的發布,它也可以通過NVIDIA App的方式支持最新的DLSS 4多幀生成功能。
實測中,搭載 DLSS 4 的影馳 RTX 5060 圣刃 OC 8GB 呈現出跨代際的性能提升 —— 渲染預覽界面流暢度達到電競級水準,幀數穩定在 136 FPS 左右,這種接近高刷新率顯示器原生幀率的實時渲染體驗,為創意工作者提供了前所未有的交互效率,徹底革新了傳統 GPU 渲染的工作流。
工業級性能測試采用 SPEC2020 基準程序,該測試覆蓋多維度工業應用場景。影馳 RTX 5060 圣刃 OC 8GB 在多項子項目中平均領先 RTX 4060 約 20%,部分復雜計算任務的領先幅度更甚;與 RTX 4060 Ti 對壘時,兩款顯卡在不同專業場景中各有優勢,展現出旗鼓相當的綜合工業性能,充分證明其不僅適用于消費級市場,也能在輕量化工業設計領域發揮重要作用。
NVIDIA編解碼測試
接下來的測試則是介紹RTX 50系顯卡的編解碼器,在視頻編解碼能力方面,影馳 GeForce RTX 5060 圣刃 OC 8GB 搭載了第 9 代 NVENC 編碼器與第 6 代 NVDEC 解碼器,首次支持 AV1 UHQ(超高畫質 AV1)和 MV-HEVC(多視角 HEVC)編解碼標準。配合升級的 DisplayPort 2.1 UHBR20 輸出接口,單通道帶寬可達 20Gbps,為用戶帶來極致 HDR 視覺體驗、超高分辨率畫質及流暢的游戲畫面輸出。
我們采用 NVIDIA 提供的 4K60 片源及工程文件,實測不同編碼格式下的導出效率:影馳 GeForce RTX 5060 圣刃 OC 8GB 處理同一段素材時,AV1、H.265、H.264 格式的導出時間分別為 16 秒、15 秒、15 秒,較前代兩款同級別顯卡效率提升 60%-80%,充分展現了新一代編解碼器的強大性能。
在畫質對比測試中,AV1 編碼視頻與 H.265、H.264 格式在文字銳度、人像膚色還原、建筑細節等方面表現近乎一致,非專業用戶難以通過肉眼分辨差異。隨著主流視頻平臺、后期軟件及硬件廠商對 AV1 格式的支持度持續提升,這一高效編碼標準正加速成為行業新寵。
值得一提的是,GeForce RTX 50系顯卡還能夠支持4:2:2色度取樣的視頻編解碼,這將節省CPU的負擔,加快創作速度。上面的圖表里也可以看到我們的測試成績,實測導出時間會比上代顯卡快不少,畢竟RTX 40系顯卡不支持該功能,僅支持4:2:0色度采樣,如果一定要4:2:2導出只能靠CPU軟解。
4:2:2色度采樣的視頻文件采用的是YUV顏色格式,與存儲紅色、綠色和藍色(RGB)值不同,顏色被存儲為亮度Y、藍差色度U和紅差色度V。在這類視頻中,視頻的完整亮度將被保留,而原始色度信息只保留一半,因此相比4:4:4的視頻,其視頻幀數據量僅有不到三分之二,而相比4:2:0的視頻又能提供兩倍的顏色分辨率,因此創作者采用這種格式拍攝,能夠在保留更多色彩信息的同時還能減少文件大小和帶寬需求。
AI性能測試
在 AI 功能測試環節,我們覆蓋了當下熱門的本地大語言模型部署及文生圖等應用場景。在深入解析影馳 GeForce RTX 5060 圣刃 OC 8GB 的 AI 性能之前,先來了解 RTX 50 系顯卡在 AI 領域的核心升級 —— 對 FP4 精度模型加速處理的支持。相較于前代 RTX 40 系采用的 FP8 精度,這一技術革新實現了更迅捷的生成速度,同時顯著降低顯存占用,為中端顯卡的 AI 運算效率帶來質的飛躍。
實測數據也印證了這一技術優勢:前代兩款 60 級顯卡受限于顯存容量,未能完成測試任務。而配備 8GB 顯存的影馳 GeForce RTX 5060 圣刃 OC 8GB,憑借 FP4 精度模型支持,不僅順利通過測試,在文生圖場景中生成單張圖片僅耗時 21.16 秒,展現出同級別產品中優異的運算效率。
而在 Stable Diffusion 圖像生成測試中,我們繼續采用 UL Procyon 基準程序,分別測試 FP16 精度下的性能表現。在壓力較小的 SD 1.5 文生圖任務中,影馳 GeForce RTX 5060 圣刃 OC 8GB 展現出碾壓級優勢,單圖生成時間僅 3.66 秒,較前代顯卡效率提升 37%。面對更高負載的 SDXL 模型,其性能優勢依然顯著,單圖生成時間 30.9 秒,相較 RTX 4060 領先幅度達 22%,充分體現了新架構在復雜 AI 任務中的優化成效。
轉向本地大模型部署場景,我們基于 meta 開源的 Llama 2 7B 大語言模型,通過 MLPerf Client v0.5 進行四項典型 AI 任務測試,涵蓋內容生成、創意寫作及不同長度文本的摘要總結。影馳 GeForce RTX 5060 圣刃 OC 8GB 在所有測試項目中均展現出壓倒性優勢:對比 RTX 4060 Ti 性能提升 20%,相較 RTX 4060 更是實現 30% 的大幅領先。
進一步通過 UL Procyon 的 AI Text Generation 測試平臺,對更多大語言模型進行性能驗證,影馳 GeForce RTX 5060 圣刃 OC 8GB 延續了強勁表現:綜合性能較 RTX 4060 提升約 27%,面對更高定位的 RTX 4060 Ti 也保持著 13% 的領先優勢,全面彰顯了 RTX 50 系顯卡在 AI 推理與生成任務中的架構優勢和優化成果。
功耗與溫度表現
評測的最后一項是烤機測試,得益于影馳 GeForce RTX 5060 圣刃 OC 8GB出色的散熱配置,整體表現非常出色。在室溫20℃下,Furmark燒機10分鐘后,整張顯卡的溫度并不高,核心與顯存溫度都低于60度,非常涼快。顯卡的最大功率則為145 W,風扇轉速則是1570 RPM,噪音與溫度控制優秀。
接著我們再橫向對比一下前代顯卡,雖然新顯卡的TDP提升了,不過整體的烤機功耗并不算高,影馳 GeForce RTX 5060 圣刃 OC 8GB整體的散熱效果極其出色,待機時溫度甚至比115W的RTX 4060還要低,屬于是非常驚喜了。
評測總結
作為一款定位甜品級的顯卡,影馳GeForce RTX 5060 圣刃OC 8GB的表現可圈可點,幾乎給主流玩家交上了一份不錯的答卷。憑借全新NVIDIA Blackwell架構和GDDR7顯存實現了跨代提升,各方面也堪稱“完美”。
要說最驚喜的肯定是它的性能釋放表現,實測數據顯示,影馳 RTX 5060 圣刃 OC 8GB 在常規游戲性能上全面超越前代 RTX 4060 約 20%,甚至對比 RTX 4060 Ti 也有近 10% 的反超。而在 DLSS 4 多幀生成技術的加持下,其性能更是有跨越式提升:在《賽博朋克 2077》《黑神話:悟空》等硬件殺手級游戲中,開啟 DLSS 4 后幀數較原生分辨率提升 3-7 倍,DLSS 4 的 Transformer 模型還能帶來畫質升級,實現 “幀數與畫質兼得” 的體驗。
外觀方面這款顯卡也很有自己的特色,影馳GeForce RTX 5060 圣刃 OC 8GB采用了全新的金屬裝甲設計,白色無光設計簡約圣潔,顏值非常高,非常適合海景房或純白主題裝機。同時,這款顯卡的供電配置與散熱堆料也不錯,能夠給玩家帶來更高的效能、更好的散熱效果和更安靜的噪音表現。
最后聊聊售價,影馳 GeForce RTX 5060 圣刃 OC 8GB定價2599元,性價比還是非常高的。其通過 AI 算力、光追效率、顯存性能與神經網絡渲染的全面升級,重新定義了 1080P/2K 分辨率下的游戲體驗。DLSS 4 的顛覆性加持,使其在幀率表現上甚至超越前代的RTX 4060 Ti,而出色的散熱設計與生產力性能,更讓其成為兼顧游戲、創作與 AI 應用的全能型選手。如果你正尋求一款能暢玩未來 3年主流游戲,同時滿足輕度創作需求的顯卡,這款 “甜品級” 顯卡無疑是不容錯過的選擇。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.