在科隆游戲展2024前夕解禁的《黑神話:悟空》讓許多玩家直接變成了天命人,直接拉開了一年一度游戲盛宴的序幕。在眾神仙斗法的德國科隆,一款3A游戲發布肯定是不夠的,NVIDIA一口氣多項硬件、技術和新游戲支持連發,又將游戲體驗向前推進了一步。在開展前期,我們有幸參加了NVIDIA媒體預溝通會,現在不妨讓我們花點時間,一起了解NVIDIA在什么領域放了大招。
RTX有600款游戲和應用了
可以說大力水手DLSS是推動游戲體驗提升的因素,這是一個需要硬件、驅動、游戲設計相結合的過程,需要花費大量的時間和精力進行推廣。在科隆游戲展上,NVIDIA宣布支持RTX的游戲和應用已經超過了600款,相比這項技術剛推出僅有兩位數的游戲和軟件支持,RTX通過DLSS已經發生了質變。
在過去數年中,NVIDIA研究團隊一直在深挖利用DLSS改善游戲的實際體驗,尋找在后摩爾定律時代尋找一種仍然能保持性能高速增長的方式。DLSS 2.x進化到DLSS 3就是很好的例子。
DLSS 3運行的前提是第四代Tensor Core,第四代Tensor Core的FP16、BF16、TF32、INT8、INT4性能相對前一代提升兩倍以上,并增加了FP8 Transformer Engine,給AI加速提供了性能基礎。而DLSS本質是一種卷積自編碼器,在DLSS 3上NVIDIA團隊找到了利用光流加速器(Optical Flow Acceleration,OFA)與DLSS相結合的辦法,構建出了一個更為立體的分析方式,將卷積自編碼器的輸入源擴展到幾個部分,分別是:之前幀與當下幀,由光流加速器生成的光流場、游戲運動矢量和深度等數據。
可以這么理解,DLSS 3并非單一技術,而是軟硬件協同的打包方案,在軟件層面,DLSS 3使用AI超分辨率生成,AI生成幀,加入對NVIDIA Reflex支持。在硬件層面,DLSS 3需要在第四代Tensor Core上運行,并利用改進的光流加速器幫助DLSS 3像素級的測量場景,最后云端的NVIDIA超級計算機則夜以繼日的尋找提升高質量圖像的途徑。
DLSS 3在光流加速器的搭配下實現了脫離GPU渲染重建高分辨率方法,讓GPU渲染的部分大幅減少,以兩幀為例,DLSS 3會承擔起第一幀的3/4的工作和第二幀的所有工作,實際上GPU只需要完成其中的1/8的渲染即可,從而節省了大量的計算資源。
在科隆游戲展上宣布支持NVIDIA DLSS的游戲還包括,《龍騰世紀:影障守護者》,《沙丘:覺醒》,在未來無疑將會有更多游戲加入到NVIDIA DLSS陣營中。具體的參考如下:
《龍騰世紀:影障守護者》,支持DLSS 3、Reflex和光線追蹤
《沙丘:覺醒》,支持DLSS 3和Reflex
《最終幻想16》,支持DLSS 3、DLAA和Reflex
《黑神話:悟空》,支持DLSS 3和全景光線追蹤
《半衰期2 RTX版》,支持DLSS 3.5和全景光線追蹤
《黑神話:悟空》很帶勁
《黑神話:悟空》作為當下最熱門的游戲,同樣也是DLSS 3的受益者,特別是對于追求最高畫質的同學而言,開啟全景光線追蹤是提升體驗的重要途徑。NVIDIA展示了全景光線追蹤開啟和關閉之后的差距,比如山澗小溪波光和石頭青苔上的漫反射。
再比如光線打入水下石頭的光澤。
全景光線追蹤實際上是路徑追蹤(Path Tracing),它是光線追蹤(Ray Tracing)的擴展,可以獲得更真實的光照效果,當然也需要更強的算力甚至GeForce RTX 40專門硬件的支持。為了實現全局光照,路徑追蹤會從交點出發,隨機生成光線路徑,這些路徑可以包括反射、折射和散射等多種光照效果。每條路徑都在不斷跟蹤光線的傳播,直至光線離開場景或者被吸收。光線路徑會被進行隨機采樣,累積每條路徑的光照信息,最終生成像素的顏色值。
這樣的做法可以更自然的處理全局光照效果,包括光照、光線的多次反射和折射、漫反射等。同時也因為進行隨機采樣,光照能夠接近于真實,但代價就是需要更多的算力資源。
因此我們會看到在4K分辨率,影視級畫質,開啟最高全景光線追蹤的前提下,所有GPU運行都會感到非常大的壓力,這時候唯有依靠DLSS 3通過AI提升游戲的整體流暢度,也從而讓包括GeForce RTX 4060在內的所有GeForce RTX 40系列GPU都可以流暢運行《黑神話:悟空》。
從目前的情況來看,《黑神話:悟空》先支持的是DLSS 3,與《賽博朋克2077》類似,會在后續的升級中進而支持DLSS 3.5。
讓細節提升25倍!
另一款《星球大戰:亡命之徒》則將一步到位,支持光追和DLSS 3.5規格。在DLSS 3.5中,光線追蹤會引入一套名為光線重建技術,將AI驅動的神經渲染器變成GeForce RTX GPU光追中的一部分,原本人工調整的降噪器被替換成AI網絡實現,也就是由GPU接手游戲制作過程中,代替制作團隊的手工添加,從而獲得光線重建加速,利用全新的AI模型,實現游戲中的密集光追和應用中創建更高質量光線追蹤圖像效果。
從數據量上來看,DLSS 3.5訓練數據是DLSS 3的5倍,可以識別出不同的光線追蹤效果,并通過時間、空間數據做出更明智的決策,通過保留高頻信息實現高質量的光線追蹤圖像升級。
另外《半衰期2》也將會制作一個全景路徑追蹤搭配DLSS 3.5的版本,這也是NVIDIA RTX REMIX項目的一個部分,即利用RTX Remix替換掉了原版游戲中的低分辨率材質,轉而使用更高清、包含豐富多邊形的模型。只需要很短的制作周期,就能讓老游戲煥然一新,之前的《傳送門RTX版》就是這樣做的。
其中《半衰期2 RTX版》的Nova Prospekt卡關將在科隆游戲展上首次亮相,不僅包含了全景光線追蹤、DLSS 3.5,也替換了高分辨率模型,4K紋理提升了800%,細節是原版游戲的25倍。
NVIDIA ACE聯動《解限機》
NVIDIA ACE在科隆游戲展上也再次迎來更新,包括更新了NVIDIA Nemotron-4 4B NIM小模型在本地實現AI加速。小模型相對大模型而言對硬件和存儲要求更低,能夠在本地PC上運行,利用單個GPU實現快速響應和加速,對游戲的體驗也更為友好。
重點是這項技術開始在西山居的《解限機》付諸實踐,有西山居旗下的Amazing Seasun Games團隊實現,通過自然語音與助手進行自然交互,就能在游戲準備界面更換機甲、裝備等工作,當然,作為AI NPC,你也可以嘗試跟助手嘮嗑。
將運動清晰度提升至1000Hz
最后一項關于玩家的重要更新來自G-SYNC。NVIDIA宣布與著名的芯片廠商MTK(MediaTek)展開合作,對,就是近期開始不斷挑戰驍龍SoC的那家聯發科。NVIDIA與MTK將推出全新的G-SYNC芯片,給電競顯示器提供更豐富的G-SYNC技術。
如果你有關注這兩年的G-SYNC,會發現顯示器領域升級也非常大,比如2023年推出了ULMB2(超低動態模糊技術 2)以及今年CES2024期間推出的G-SYNC Pulsar。
G-SYNC Pulsar是目前所有顯示技術的集大成者,你可以將其看成是可變刷新率 (VRR) 技術的新一代升級技術,以往在做顯示器設置時,我們只能在可變刷新和超低動態模糊 (ULMB)中二選一,現在G-SYNC Pulsar已經可以做到全都要,并且在今年發布的ROG Swift PG27顯示器上,將運動清晰度提升至1000Hz,這是非常恐怖的。
實現G-SYNC Pulsar技術的本質是根據顯示器的刷新率,調整背光脈沖與屏幕刷新周期之間的同步關系,因此需要硬件與軟件的雙重配合,NVIDIA與MTK合作主要目的就是可以打包一個完整的解決方案,讓更多的OEM廠商可以付諸實踐。
在科隆游戲展2024上,將會有三款顯示器宣布支持,包括AOC AGON PRO AG276QSG2,Acer Predator XB273U F5和ASUS ROG Swift 360Hz PG27AQNR。在NVIDIA官網也提供了完整的顯示器選購列表,最高可達97英寸,用電視玩頂級3A大作的選擇越來越多了。
另外NVIDIA GeForce NOW流媒體游戲庫也更新到了2000款,包括《黑神話:悟空》、《星球大戰:亡命之徒》和《最終幻想16》,不過與國內關系不大,這里不做重點介紹了。
隨著AI應用的崛起,單機游戲和聯網游戲都開始更依賴于GPU算力,顯然無論AI還是GPU,這些都是NVIDIA最擅長的領域,對DLSS乃至全景光追的支持已經成為3A大作的必選項,NVIDIA不斷更新的新技術也注定影響未來的游戲體驗。對于玩家而言,準備好一張GeForce RTX 40系列的GPU,無疑是很有必要的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.