幀能贏#GeForce RTX™ 3090再戰8K分辨率3A大作
在今年9月份的發佈會上,NVIDIA首席執行官黃仁勳先生曾激動的向玩家介紹一張猛獸顯卡“GeForce RTX™ 3090”,並且表示這張卡的出現讓8K遊戲成為可能。為了在8K遊戲時提高玩家的流暢度,NVIDIA專門為GeForce RTX™ 3090定製了24GB的GDDR6X顯存,再配合上全新的DLSS超級性能模式,讓AI張量單元在遊戲中盡全力提升GeForce RTX™ 3090在8K分辨率下的表現。不過老話説得好,耳聽為虛眼見為實,這種超高分辨率的體驗能給玩家帶來多少震撼?現階段8K遊戲能有多好的體驗?8K開光追還能玩嗎?為了解答這些疑問,我決定親自體驗8K遊戲,看看遊戲畫面到底有沒有傳説中的那樣鋭不可當。
8K是什麼?高分辨率遊戲好在哪?
我們在開始今天的8K體驗之前要先了解一下8K好在哪,8K也就是“7680*4320”分辨率的簡稱,這個分辨率相當於16個1080P(1920*1080)分辨率,或者是4個顯示器標準的4K(3840*2160)分辨率的組合。我再打個比方,如果8K是一張“全開”紙的話,1080P相當於“16開”紙,而4K相就當於“4開”紙,它們能顯示的信息都沒有8K這張“全開”紙多。當然了這也就同時意味着顯卡在輸出8K信號時,承擔的計算壓力相當於16倍的1080P或者是4倍的4K分辨率,這對如今的顯卡來説都是一個不小的挑戰。
一張看起來精細的遊戲畫面,放大之後都是由像素組成的
同時由於畫面分辨率的提升,如果顯示器的尺寸不發生變化的話,那麼每英寸的像素數量就更多了,也就是PPI(Pixel Per Inch)得到了提升。這個時候我們人眼看上去就會感覺8K遊戲畫面更加的細膩、真實。同時由於8K分辨率像素爆炸式的增多,每個遊戲物體的邊緣佔用的實際像素點也越多,更接近圓形,而不是之前的正方形鋸齒,畫面看上去就更舒服了,實際觀感的畫面鋸齒也會更少,在8K分辨率下,鋸齒的影響幾乎可以忽略不計。
8K與主流分辨率遊戲截圖對比
我們選擇了兩款遊戲進行截圖對比,首先是在遊戲中默認開啓TAA的《死亡擱淺》截圖測試,這款由“小島工作室”創作的遊戲作品在PC端的優化可以説是非常出色,對於玩家們來説是一款非常友好的遊戲。我們會對1080P、1440P、4K 2160P以及8K 4320P進行截圖放大對比看看,主流分辨率與8K這種超高清分辨率的差距到底有多大。
1440P
1080P
首先再放大之後我們明顯看到屏幕左側的1080P分辨率遊戲畫面非常的模糊,這是因為TAA雖然消除了鋸齒但是帶來的模糊副作用的效果,同時低分辨率有沒有足夠多的像素去還原遊戲作者本來的意圖,遊戲結果只能是模糊。右側的1440P畫面就會好上一些,但依舊談不上清晰。
4K 2160P
8K 4320P
再來看4K與8K的對決,兩者的清晰度明顯比上方的兩個低分辨率圖像要清晰很多,這其中8K分辨率的清晰度比4K還要更上一層樓,在放大的時候依舊可以經受住考驗,畫面放大放大再放大的結果還是鋭不可當,確實讓人眼前一亮。
1080P
8K 4320P
最後是最直觀的對比,我們把1080P與8K分辨率的遊戲畫面直接放在一起進行對比,老實説這個清晰度差距已經可以讓人懷疑這是不是一個時代的遊戲了,一個像經典版,另一個則像高清重置版,兩者差距十分明顯。
邁凱倫塞納馳騁在道路上
《極限競速:地平線》是微軟旗下知名休閒賽車遊戲,如今它的第四代產品《極限競速:地平線4》來到了英國倫敦,精美的畫面以及出色的優化讓他成為8K測試的不二選擇,在8K分辨率下這款遊戲真實感爆棚,彷彿自己真的置身倫敦“極限競速”。我們同樣進行截圖放大對比,這款遊戲默認沒有開啓TAA,所以低分辨率的鋸齒是比較明顯的。
1080P
1440P
我們這裏以這輛粉紅色法拉利為例,這裏對比的是1080P與1440P的情況。我們把截圖放大一些,並將關注點移動到車尾燈處,看看各個分辨率的表現如何。上圖中從左側向右滑動的圖像為1080P分辨率,從右邊向右邊滑動的為1440P分辨率。這兩個分辨率也是現階段玩家羣體中佔用率最高的兩大分辨率,可以看到1080P下的法拉利車尾燈鋸齒非常的明顯,放大之後簡直是鋸齒滿天飛。而右側的1440P分辨率就能強不少,但鋸齒依然比較明顯。
4K 2160P
8K 4320P
我們再來看兩個高分辨率之間的對比,4K 2160P下的法拉利尾燈鋸齒情況相比上面的低分辨率有了很大的改善,但細微之處依舊可以發現鋸齒。而右側的8K分辨率就不同了,因為它擁有着4倍於4K分辨率的解析度,鋸齒基本消失,整個畫面清晰鋭利,看起來非常的舒服。
1080P
8K 4320P
再來一個最直觀的對比,1080P VS 8K 4320P,由於兩者有着16倍的差距,對比起來簡直不要太明顯,1080P下的鋸齒在8K分辨率下直接無影無蹤,這就是8K分辨率的魅力所在。
GeForce RTX™ 3090如何讓8K遊戲更流暢、更真實
我們通過上面的對比已經知道了8K分辨率的優點,這裏再來談談8K分辨率的缺點,那就是“對顯卡要求極高”。是的,之前的顯卡連4K遊戲運行起來都很吃力,更不要談什麼8K遊戲了,簡直是天方夜譚。這種情況直到GeForce RTX™ 3090的出現才有了轉機,那麼GeForce RTX™ 3090到底有什麼過人之處能讓它鶴立雞羣,脱穎而出呢?我們一起來看一下GeForce RTX™ 3090為8K遊戲做出了哪些努力。
第二代RT Core帶來光追效率的顯著提升
光線追蹤現在已經成為一個遊戲熱門技術,它可以使遊戲虛擬世界的光影更加的真實,再配合8K超高的分辨率,虛擬世界的沉浸感從未如此濃厚。追光溯影,逼近真實,在NVIDIA Turing架構上,NVIDIA首次引入了能夠針對實時光線追蹤運算進行加速的RT Core。在執行實時光線追蹤相關的計算時,現代的基於SIMD的CUDA核心在進行光線和物體表現碰撞點等計算時表現出來的效率太低,反而是基於MIMD架構的特定用途計算模塊更為高效。NVIDIA的RT Core就是這樣一種專門為實時光線追蹤計算進行加速處理的專用硬件單元。
安培GPU上的RT Core主要是增加了對動態模糊的加速運算支持。在非光追情況下的動態模糊往往只是對畫面套用後處理濾鏡,其效果並不真實。在實時光追情況下,動態模糊則是通過實時計算物體與光線的交互情況所產生的,其運算非常複雜,就算是Turing上面的RT Core也難以承載。到了英偉達安培架構,其第二代RT Core中加入了NVIDIA設計的插值算法,在保證動態模糊精確性的同時提高了該情況下的實時光線追蹤效率,官方稱最高可以實現8倍於前代的速度。另外,在基礎的BVH計算上面,新一代RT Core也能夠快上2倍。正是第二代RT Core顯著的性能提升,才讓8K光追遊戲成為可能。
第三代Tensor Core讓AI性能出現飛躍
當然,我們知道如果只靠傳統的SM運算單元,現階段解決8K光追遊戲是不現實的,從NVIDIA Volta架構開始,NVIDIA就在SM單元中引入為AI計算優化的Tensor Core,這些張量計算單元能夠提高顯卡在機器學習計算上的效率。在英偉達安培架構上,Tensor Core已經進化到了第三代,之前發佈的A100計算卡上已經用上了新的第三代Tensor Core,它能夠提供比第二代Tensor Core高出4倍的效能。不過遊戲卡上面的Tensor Core進行了一定的精簡,其FP16 FMA計算的吞吐量只有GA100核心中的Tensor Core的一半。
第三代Tensor Core除了在效能方面有提升之外,還對稀疏矩陣運算提供了支持,詳細的介紹可以看我們之前對計算卡方向的英偉達安培架構的解析:《NVIDIA新一代Ampere架構簡單解讀:一次有改良有革命的架構升級》。總的來説,即便是面向遊戲的英偉達安培架構將每SM的Tensor Core數量從8個減到了4個,它的整體效能仍然是有很大提升。AI張量單元的性能提升將直接助力RTX 3090開啓8K遊戲的大門。
又進一大步的DLSS 8K
新的Tensor Core帶來的更強勁的AI算力將會為DLSS助力,在今年早些時候,NVIDIA開始全面推廣DLSS 2.0技術,相比起初代DLSS,DLSS 2.0不管是在畫面質量還是在渲染效率上都有很大的提升,已經不再是所謂的雞肋功能,而是能夠有效地讓中端顯卡在3A大作中跑出4K60這樣的表現。安培GPU並沒有帶來更新的“DLSS 3.0”,不過仍然是將這項技術往前推了一步——DLSS 8K,顧名思義,它就是通過深度學習技術將畫面分辨率拉伸至8K的新版DLSS。
雖然NVIDIA並沒有用DLSS 3.0這樣的命名,但是DLSS 8K在技術上仍然有一定的突破,具體一點就是它將會使用1440p分辨率的實際渲染圖像,去推導8K分辨率的輸出圖像,其像素數量跨越了整整9倍(2560x1440=>7680x4320)。此前在DLSS上面,最高也就是實現4倍的畫面拉伸(1920x1080=>3840x2160),現在這一數字直接跳至9倍,顯示了AI升頻技術那巨大的潛力。
並行程度更高的渲染管線
將不同類型的計算交給不同的單元去處理是從NVIDIA Volta架構就開始採納的一種理念,當時引入的Tensor Core分流了很多AI相關的運算,而在其後引入的RT Core又將實時光線追蹤相關的計算給分流了。那麼它們可以並行執行嗎?可以,但並不是全部運算都能夠並行執行。
如上圖所示,Turing GPU在開啓實時光追和DLSS時,其RT Core和Tensor Core並不是並行工作的,Tensor Core被調用的時間點已經接近整個渲染流程的末尾,它沒有和RT Core同時運行。
在英偉達安培架構上,NVIDIA提升了GPU內部各種單元之間的並行性,現在傳統計算單元、RT Core和Tensor Core這三大單元可以同時工作,在原本基礎上繼續縮短幀渲染時間。
GDDR6X顯存讓帶寬起飛
8K分辨率下游戲的貼圖數據以及顯存佔用是非常驚人的,3A遊戲吃滿20G顯存簡直是家常便飯。同時我們也知道,現階段的旗艦GPU依舊非常依賴高速緩存,不僅僅是GPU內部的各種緩存系統,更是對外部作為“倉庫”使用的顯存系統有着非常高的要求,在渲染分辨率越來越高的如今,GPU不僅需要更大的顯存供它存放各種渲染素材,還需要帶寬更大的顯存供它實現更快的數據讀取。從最早的3D加速卡一路走來,顯存從使用與傳統DDR區別不大的GDDR2,到使用GDDR3、GDDR5,再到使用專為超高帶寬設計的HBM,其類型更換、升級的速度遠比傳統的DDR內存來的快。
NVIDIA在2018年的Turing顯卡上面首次應用了GDDR6顯存,在當時,GDDR6顯存能夠提供比疲態盡顯的GDDR5高的多的帶寬,也讓GDDR5X黯然失色。但在RTX 30系顯卡核心規模暴增的情況下,原來的GDDR6顯存已經有些不夠用了,於是NVIDIA攜手美光,推出了GDDR6的升級版——GDDR6X顯存。別看它只多了一個X的後綴,但它在底層信號傳輸方面有着非常重大的變化,並首次將GDDR系列的顯存帶寬推高到了1TB/s的高度。
GDDR6X顯存上出現重大變化的地方是它的信號傳輸機制。原本的GDDR系顯存使用的是非常原始的二進制信號,再具體一點,該系列顯存使用的是NRZ(Non-Return-to-Zero)調製,這種信號調製方式很簡單,它用高電平代表1,低電平代表0。如果要提高它的數據帶寬,那麼提高顯存的時鐘頻率即可。但現在由於受到製程工藝等各方面因素的影響,顯存的時鐘頻率在現階段已經很難再攀高,那麼該怎麼辦呢?廠商想到了用新的信號調製機制來提高信號傳輸的效率,他們選擇了已經有較為廣泛的PAM4。
PAM是一種用模擬信號脈衝編碼信息的信號調製方式,PAM4是其中較為簡單的一種。與NRZ這種僅有高和低兩種狀態的二進制信號不同的是,PAM4有4種不同的電平值,也就是它有4種不同的狀態,而每種狀態對應着一種0和1的組合,也就是説,它的每個狀態對應了2個bit的數據量,較NRZ是翻倍的。
如果這麼説還有些模糊的話,這裏可以將PAM4信號類比成MLC閃存存放數據的方式。我們知道,MLC閃存的每個單元可以存放2-bit的數據,在電信號層面上它表現為4種不同的電平,每個電平之間有固定的間隔,主控在讀取和寫入的時候都按照固定的規則將數據和電信號進行轉換。
那麼GDDR6X也是如此,根據NVIDIA公佈出來的信息,GDDR6X有四種不同的電平信號,每個電平信號之間的電壓差為250mV。另外NVIDIA還配套引入了MTA編碼,在信號傳輸層面上減少損耗,保證穩定性。GeForce RTX™ 3090擁有24GB的GDDR6X顯存,顯存帶寬為936GB/s,已經接近1000GB/s大關,高帶寬為GeForce RTX™ 3090開啓8K遊戲提供了必要的條件。
測試平台與説明
要想帶動8K,只有一張GeForce RTX™ 3090顯卡還是不夠的,我這裏專門搭建了一套現階段的旗艦遊戲平台,使用的CPU是Ryzen 9 5950X處理器,搭配的主板也是用料紮實的X570 ROG CROSSHAIR VIII Formula,其餘配件也是一應俱全。需要特別説明的是本次的顯示器是來自戴爾的Dell UltraSharp UP3218K,這是一款8K顯示器,可以完美的完成我們的8K顯示任務。
8K傳統光柵遊戲體驗:DLSS助力8K 60幀體驗
在傳統光柵化遊戲中,我們選擇了幾款優化不錯的遊戲進行了8K分辨率測試,同時對支持DLSS2.0技術的還進行了超級性能的對比測試,看看這個模式在8K模式下能給GeForce RTX™ 3090顯卡帶來多少增益。
通過上面的測試結果大家可以看到GeForce RTX™ 3090在8K分辨率下在優化較好的遊戲中可以提供60幀左右的遊戲體驗,而在一些非常吃配置的大作中幀數就只有20、30幀了。這個時候我們可以開啓遊戲中的DLSS超級性能模式進一步提升幀數,可以看到大部分3A遊戲通過DLSS超級性能的幫助可以達到60幀流暢遊玩的體驗。
只不過有玩家懷疑,開啓DLSS超級性能模式之後,遊戲的鋭度會有多少損失?為此,我專門進行了下面的對比測試:
8K原生
DLSS超級性能
在對比測試中我們看到開啓DLSS超級性能模式之後,《死亡擱淺》的遊戲畫面幾乎沒有太大的損失,可能在一些細節上會模糊一點,但我認為這點損失是可以接受的。這個時候遊戲幀數從8K原生的32幀直接增加到88幀,這個流暢度的提升是顯而易見的,可見DLSS技術在8K遊戲中的重要性,它能讓很多無法60幀的遊戲穩住甚至超過60幀,給玩家一個流暢的遊戲體驗。
8K光追遊戲體驗:追光溯影,真實感十足
光追遊戲現在已經成為一個非常熱門的話題,越來越多的玩家開始對光追感興趣了。《控制》是光追效果非常明顯的一款遊戲,我們可以通過下方的對比圖看看這款遊戲開啓與關閉光追的區別。
關閉光追
開啓光追
可以看到開啓光追之後的遊戲畫面更加真實,右側的書籍支架以及地板磚都栩栩如生,遊戲沉浸感十足。而反過來關閉光追的話,整個畫面死氣沉沉,極度的不真實,與開啓光追之後的畫面有着明顯的差距。
我又找來了幾款支持光線追蹤以及DLSS技術的大作測試一下GeForce RTX™ 3090顯卡在8K開啓光追情況下的表現,結果如下:
可以看到由於實時光線追蹤對顯卡壓力極大,在8K‘分辨率下GeForce RTX™ 3090已經不堪重負了,《控制》的幀數甚至只有10幀出頭。我們再次打開可以讓8K遊戲起死回生的DLSS超級性能模式,8K光追遊戲的幀數得到了大幅度提升。除了優化較差的《賽博朋克2077》之外,其餘遊戲均突破了60幀的及格線。8K光追遊戲成為現實,DLSS超級性能模式功不可沒。
8K原生
DLSS超級性能
再來看一下開啓光追之後的DLSS超級性能模式對比,可以看到畫面表現依舊與不開啓光追時的情景一樣,畫面細節略微有損失,但並不明顯。與之對應的遊戲幀數則是直接從PPT不能玩上升到可以60幀暢玩,所以相比之下玩家們可能更傾向於開啓DLSS超級性能模式,在幀數巨大提升的情況下,兩者的畫質差距是完全可以接受的。
總結:8K遊戲纖毫畢現,清晰鋭利新視界
我們通過上面的測試已經領略到了8K遊戲的魅力,整個遊戲畫面在8K分辨率下栩栩如生,煩人的鋸齒也消失的無影無蹤。再配合上光線追蹤技術,老實説,這種8K光追遊戲體驗真的是一種享受。
玩家們能在今天得到這種體驗當然少不了GeForce RTX™ 3090顯卡的功勞,老黃親切的稱它為“BFGPU”,這款重磅級產品在8K遊戲中的表現確實讓人印象深刻。現階段如果玩家想先人一步體驗8K遊戲,能夠選擇的顯卡就只有GeForce RTX™ 3090,海量的GDDR6X顯存容量以及帶寬,配合上第二代光追單元以及第三代AI單元,這些強大的單元讓GeForce RTX™ 3090在8K遊戲中嶄露頭角,給玩家們帶來很難用言語去形容的震撼體驗。如果大家能親自在8K顯示器上暢玩8K遊戲的時候就會發現,整個遊戲畫面真的是纖毫畢現,清晰鋭利新視界。
8K下的《命運2》門上的紋理清晰可見
同時GeForce RTX™ 3090還是一款對內容創作者非常友好的GPU,在我們之前的內容創作測試中也有着非常良好的表現,因此GeForce RTX™ 3090其實是一張非常全面的旗艦顯卡,在遊戲性能以及生產力上都能給玩家提供最強的助力,“卡皇”的實力真的不是蓋的。我們再來看兩組現在爆火的《賽博朋克2077》開啓光追與否的對比圖:
RTX OFF
RTX ON
RTX OFF
RTX ON
從畫面我們看到了,光線追蹤技術的加持讓遊戲世界光影更加真實,是次時代遊戲未來的重要發展方向。高端遊戲玩家對於遊戲畫面的極致追求是毫不妥協的,這也是旗艦卡皇存在的意義所在。從我們的測試中也可以看出,光線追蹤和超高分辨率可以顯著提升遊戲畫面質量,大幅提高玩家的遊戲體驗,而NVIDIA的RT Core和Tensor Core相得益彰,提供了目前最佳的遊戲體驗。在光追和DLSS這兩項技術面前,傳統的光柵化遊戲跑分已經有越來越大的侷限性,尤其是在旗艦產品上。綜上所述,GeForce RTX™ 3090顯卡是一個讓玩家在現階段就能體驗8K超高清分辨率光追遊戲的絕對利器。