一、引言
隨著全新NVIDIA Ada Lovelace 架構的發布,從2023年開始,NVIDIA GeForce RTX 40系列顯卡按部就班的相繼發布,從4060到4090基本實現了全價位、全場景覆蓋。雖然價格并不美麗,但烏煙瘴氣的顯卡市場總算迎來了一道曙光。
在CES 2024上,NVIDIA繼續發力,推出RTX 4080 SUPER、RTX 4070 Ti SUPER和RTX 4070 SUPER三張新卡,進一步細分和完善了 40系顯卡陣營。這三張40系SUPER顯卡不僅帶來游戲娛樂、生產力創作等應用方面更強勁的性能提升,更重要的是加入了生成式 AI功能,成為NVIDIA平臺轉換的關鍵節點。
從發售價看,RTX 4070 Ti SUPER和RTX 4070 SUPER的發售價和之前發布的RTX 4070 Ti和RTX 4070相同,RTX 4080 SUPER的發售價甚至比RTX 4080低了約16.7%,妥妥的加量不加價。
目前各大PC硬件廠商相繼發布了自家RTX 40系SUPER顯卡,本文帶來的是索泰 GeForce RTX 4070 SUPER-12GB X-GAMING OC 歐泊白的深度測評。(以下簡稱:索泰 RTX 4070 SUPER 歐泊白)
二、NVIDIA Ada Lovelace 架構有要點分析
40系顯卡陣營最核心的部分當屬NVIDIA Ada Lovelace 架構,在正文開始前,我們先了解一下NVIDIA Ada Lovelace 架構有哪些先進之處。
(1)GPC-TPC-SM層級架構
從完整的架構核心圖看,Ada Lovelace依然沿用了GPC-TPC-SM層級架構,最大核心的GPC規模從Ampere架構(30系顯卡架構)的最大7個增加至12個,Ada Lovelace的二級緩存規模是Ampere的16倍,這些暴增的參數意味著性能的巨大提升。
Ada Lovelace架構的每組GPC包含6組TPC(每組TPC包含2組SM)、1個獨立光柵引擎(Raster Engine)、2個ROP分區(每個分區包含8個ROP單元)。這樣,Ada Lovelace架構的TPC和SM單元數量分別增長到最多72個和144個。
SM的結構也與Ampere架構一樣,有4個計算模塊,1個RT CORE光追核心(第三代)以及128KB L1緩存。每個計算模塊包含64KB寄存器文件、零級緩存指令、16個FP32單精度浮點CUDA核心、16個FP32/INT32單精度浮點和整數混合CUDA核心、1個Warp調度器、1個分配單元、1個Tensor Core張量核心(第四代)、4個載入存儲單元以及1個特殊功能單元(SFU)用于執行圖形差值指令。
除了在架構核心方面的提升,Ada Lovelace對游戲性能的支持主要體現在三個部分:第三代RT Core、第四代 Tensor Core、NVIDIA DLSS 3。
(2)第三代RT Core
RT Core核心在視頻、游戲中實現實時光線追蹤,專為處理性能需求密集的光線追蹤工作負載而設計。 全新的第三代RT Core不僅將光線與三角形求交性能提高了一倍,還將 RT-TFLOP 峰值性能提高了一倍之多。RT Core 還配備全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。
Opacity Micro-Map引擎將光線追蹤的Alpha-Test幾何性能提升2倍;Displaced Micro-Mesh引擎可動態生成微網格產生額外的幾何圖形,從而實現幾何復雜場景的實時光線追蹤,同時所占用的顯存只有之前的二十分之一。
(3)第四代 Tensor Core
Tensor Core可實現混合精度計算,動態調整算力,從而在保持準確性的同時提高吞吐量。第四代Tensor Core新增了Hopper FP8 Transformer Engine,可提供1400 TFLOPS的張量處理性能,性能是上一代的5倍。
(4)DLSS 3.5
DLSS 是 AI 驅動圖形領域的革命性突破,通過第四代 Tensor Core 和光流加速器提供動力支持,可利用 AI 創建更多幀并提高圖像質量,提升GPU游戲性能,其中包含DLSS幀生成、
DLSS超分辨率、深度學習抗鋸齒 (DLAA)等技術。
2023年8月底NVIDIA正式發布了DLSS 3.5,加入了全新的DLSS光線重建技術,主要功能是借助 NVIDIA 超級計算機訓練的 AI 網絡取代需要人工設計的降噪器,在被采樣的光線之間生成更高質量的像素,從而提升光線追蹤的圖像質量。
《賽博朋克2077》支持光線重建技術,在游戲中,只有開啟超級光追才會出現光線重建的選項,它最主要的功能是強化光追的效果,充分釋放光線追蹤的優勢。
第一組樹葉的對比,雖然右圖(關閉光線重建)的樹葉有高光,但畫面沒有立體感,幾乎沒有光影;仔細觀察左圖(開啟光線重建)的畫面,雖然是夜晚但依然能看到清晰的明暗陰影,細節到位,有立體感。
第二組對比應該更明顯吧,左側樹干有質感、更真實;而右側黑了一大半,基本看不到樹干的紋理細節。
三、基準性能測試與對比
先貼上本次測試平臺,以intel i5-13600KF為核心組成的,配合NZXT N7 Z790主板和1200W電源基本能確保索泰 RTX 4070 SUPER 歐泊白全力發揮。
RTX 4070 SUPER的核心參數已經在文章開始時貼出來了,這里不做過多贅述,直接開始測試,隨后會和RTX 4070進行一輪對比。
(1)基準測試
3DMARK Time Spy是針對2K分辨率 DirectX 12 游戲的基準測試,測試結果19699分,顯卡得分21436分,CPU得分13501分。
Time Spy測試預估了幾款游戲大作的幀率。
Time Spy Extreme 是針對4K分辨率 DirectX 12 游戲的性能測試,測試結果9131分,其中顯卡測試10222分,CPU測試5692分。
Port Royal實時光追性能測試,得分13289分。
NVIDIA DLSS功能測試如下:
4K分辨率:關閉DLSS幀率28.46FPS,開啟DLSS幀率提升到101.07FPS,提升約255%
2K分辨率:關閉DLSS幀率61.61FPS,開啟DLSS幀率提升到155.78FPS,提升約153%
由此可見,DLSS對游戲幀率的影響有多大。尤其開啟光線追蹤后的效果更明顯,這里先賣個關子,后面我會結合游戲表現更直觀的講解光線追蹤和DLSS的相互作用。
▼ 4K分辨率
▼ 2K分辨率
(2)對比測試
自從RTX 4070 SUPER發布以來,很多人都在查詢它的性能與RTX 4070Ti相比有多大差距,我把前文參數表格中兩者的核心參數摘出來對比,RTX 4070Ti的CUDA核心數量比RTX 4070 SUPER多了約7.1%,TGP高了約29.5%,顯存規格相同。
剛好我這里有一塊索泰RTX 4070Ti歐泊白,對比兩張顯卡的3DMARK基準測試結果,正在糾結這兩張顯卡的小伙伴可以參考一下。NVIDIA DLSS幀率高出約2%,其它基準測試高出約5%左右。
時間原因沒有對比應用場景的表現,以后有機會再寫一篇詳細的對比測評吧。
四、游戲體驗
關于光線追蹤與DLSS的技術理論在前面已經做了簡單科普,接下來通過索泰RTX 4070 SUPER看看它們會給游戲帶來怎樣的提升。
(1)光線追蹤和DLSS的關系
光線追蹤是NVDIA RTX系列顯卡的獨有技術,在40系顯卡提升到第3代,大幅提升運算能力與應用性能。光線追蹤通過模擬真實世界的光線特性渲染出更逼真的游戲畫面,創造身臨其境般的游戲體驗。《賽博朋克 2077》游戲中的一組畫面對比可以非常明顯看出光線追蹤對畫面質感、細節表現、光影效果的加成。
開啟光追后畫質和細節的表現力有非常大提升,但這也意味著占用更多顯卡資源,導致游戲幀率大幅下降,這時就輪到NVDIA DLSS出場了。DLSS的作用是在不影響畫質和響應速度的前提下,利用AI技術創造更多高質量幀,從而提升畫面流暢度。
《巫師3》中,2K分辨率開啟光追,關閉DLSS時的幀率98 FPS,開啟DLSS后幀率133 FPS,提升了約35.7%。
(2)《巫師3》
看一下《巫師3》光追的視覺效果。
從下圖對比中可以看出,未開啟光追時,雖然是超高畫質,但和開啟光追后的畫面相比,植物看著單薄,毫無立體感可言;開啟光線追蹤后,畫面質感有了非常明顯提升,近處的花草、遠處的房屋在細節豐富度和顏色的質感方面都是肉眼可見的提升。
▼ 超高畫質(未開啟光線追蹤)
▼ 開啟光線追蹤
2K分辨率:
超高畫質(關閉光追)、關閉DLSS,游戲幀率 140 FPS;
超高畫質(關閉光追)、開啟DLSS,游戲幀率210 FPS;
開啟光追、關閉DLSS,游戲幀率98 FPS;
開啟光追、開啟DLSS,游戲幀率132 FPS。
有了光追+DLSS的加持,畫質和流暢度可以魚和熊掌兼得,提升畫質的同時保證游戲的流暢度,代價是顯卡一直處于近乎滿載的工作狀態。
值得一提的是,DLSS的功能主要提升游戲幀率,對畫質的影響微乎其微,幾乎看不出來。
▼ 開啟光線追蹤、關閉DLSS
▼ 開啟光線追蹤、打開DLSS
(3)《賽博朋克2077》
4K分辨率,開啟光追+DLSS,平均幀率73FPS,最大幀率89 FPS;
2K分辨率,開啟光追+DLSS,平均幀率135 FPS,最大幀率165 FPS。
(4)《荒野大鏢客2》
4K分辨率,最高畫質:
開啟DLSS,游戲幀率125 FPS;
關閉DLSS,游戲幀率84 FPS。
2K分辨率,最高畫質:
開啟DLSS,游戲幀率119 FPS;
關閉DLSS,游戲幀率118 FPS。
(5)《GAT5》
4K分辨率高畫質幀率148 FPS,2K分辨率高畫質幀率184 FPS。
(6)《刺客信條:英靈殿》
4K分辨率高畫質平均幀率87 FPS,最高幀率196 FPS;
2K分辨率高畫質平均幀率151 FPS,最高幀率219 FPS。
五、生產力和AI創作
平時我常用的Adobe生產力三件套(PS+PR+AE)這種強度的任務對索泰 RTX 4070 SUPER 歐泊白來說小菜一碟。
以AE為例,渲染一條14s、1080P、H.264、30幀特效視頻,共耗時約1分32秒,期間顯卡資源的占用率最高60%左右,多數時間在20%-40%之間。
除了擁有出色的游戲性能外,RTX 40 系列顯卡的另一項重要任務是提升PC上的AI性能以及AI方向的應用場景,例如:AI創作、AI游戲、AI聊天、AI直播等。
Stable Diffusion是最近非常熱門的一款AI繪畫生成工具,只需要輸入一句話、一組關鍵詞即可生成一張你想要得到的圖片。RTX 40系顯卡負責渲染,性能越強、顯存容量越大,生成圖片的分辨率越高、渲染速度越快。
來看看索泰 RTX 4070 SUPER 歐泊白的AI繪圖性能:10張1080 x 1080的高清圖片(采樣方法Eular a、迭代步數為50、隨機數種子13)共耗時約168s,每分鐘約3.5張,這效率你們滿意嗎?
六、散熱與功耗表現
室溫26℃左右,FurMark 2K分辨率烤機15分鐘后各項參數趨于穩定,平均幀率222 FPS,顯卡核心溫度76.7℃左右,顯存溫度66.3℃,顯卡功耗220W,與官方TGP相符。滿載風扇轉速1289 RPM,噪音控制的相當不錯。
值得一提的是,索泰 RTX 4070 SUPER 歐泊白支持風扇智能啟動技術,通過AI管控可以在高/低溫和負載之間智能啟停,有利于降低功耗、減小噪音。
七、外觀與細節展示
最后,為大家介紹一下本文主角索泰 RTX 4070 SUPER 歐泊白的外觀設計和卡身細節。
對索泰顯卡有一定了解的小伙伴應該對“歐泊白”這個配色方案有印象, 外觀設計靈感來源于“白歐泊石”,主打年輕和個性,清新淡雅的白色導風罩,表面鍍了一層變色膜,迎著光線會看到灰色涂鴉變成了淡淡的藍色,如同歐泊變彩效應的視覺效果。
顯卡的背板是高強度合金材料一體成型而成,起到保護PCB的作用,同時,背板表面布滿了灰色涂鴉,時尚、有趣又有點張揚,比較符合年輕人的審美。
顯卡使用了全新升級的高效能冰芯散熱系統,配備三把暗影極夜風扇葉、冰鏡導熱模組、冰脈2.0符合熱管和厚重的散熱鰭片,有效提升熱效率,輕松應對嚴苛的散熱挑戰。
扇葉的弧度和傾斜角度都做了優化設計,不僅能帶來更大風壓和風量,還能有效降低風阻和噪音。
供電接口是全新的12VHPWR接口,需要使用新款ATX 3.0電源或者轉接線。
標配3個DP 1.4接口+1個HDMI 2.1接口,能滿足多數人的使用需求。
帥氣的LOGO燈,在FireStorm軟件中支持1600萬色自由調控。
索泰 RTX 4070 SUPER 歐泊白尺寸303 x 121 x 61 mm,安裝需占用3個槽位。
索泰 RTX 4070 SUPER 歐泊白的上機效果非常漂亮,穩穩的拿捏了我這枚理工男的審美。
八、總結
得益于NVIDIA Ada Lovelace架構的升級,索泰 RTX 4070 SUPER 歐泊白能輕松駕馭各種3A大作、AI創作、生產力等任務,畫質、流暢性都有非常好的表現。之前看到有小伙伴擔心RTX 4070 SUPER 4K分辨率時的游戲體驗,憑借光線追蹤和DLSS的加成,即便4K分辨率也能無壓力暢玩3A游戲,有這方面顧慮的小伙伴完全可以放心啦。
所以,如果你預算不足以讓你一步到位到RTX 4090頂配,但又想獲得暢快淋漓的游戲體驗,在顯卡的選擇上,5000元價位以內,索泰 RTX 4070 SUPER 歐泊白是個非常有性價比的選擇!
OK,以上就是本次分享的全部內容,感謝大家觀看。同時,期待您動動發財的小手幫我點點關注,這是我持續創作的動力,感謝大家!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.