當前位置:
首頁 > 新聞 > NVIDIA RTX顯卡就是未來高品質遊戲的賭注

NVIDIA RTX顯卡就是未來高品質遊戲的賭注

Esther| 撰文

距離2016年5月NVIDIA推出GTX 10系顯卡已經過去了兩年多,該公司的新RTX 20系顯卡終於要在9月20日發貨。據NVIDIA稱,RTX系列顯卡中加入了快速的渲染技術,即實時光線追蹤,支持這項技術對於提高遊戲畫面逼真度和亮度起到了很大作用。此外,新RTX顯卡中比支持光線追蹤更大改變在於,其性能不再只依賴功率,而是更加依靠演算法和AI。

為什麼這麼說呢?一周後將發貨的RTX 2080 Ti國行售價8199元,RTX 2080國行售價5699元,而十月份將開始發售的RTX 2070,售價為500美元(約合人民幣3435元),預計將成為三款新顯卡中銷量最好的。

從功率來看,RTX 2070與GTX 1080相當,RTX 2080與GTX 1080 Ti差不多,而RTX 2080 Ti超越了GTX 10系列所有顯卡。RTX 2070和2080的內存使用了8GB GDDR6顯存,RTX 2080 Ti使用了11GB GDDR6,此外,這三款新顯卡都使用了NVIDIA新推出的圖靈架構,也就是說其承載了支持光線追蹤的RT核心(RT Core)以及支持AI的張量核心(Tensor Core)。

在接下來,NVIDIA可能會推出RTX 2060等一系列價格更加親民的顯卡(10系曾經出到了不到100美元的GTX 1030),而且RTX 20系顯卡還有升級的空間,比如RTX 2080 Ti Founders Edition特別版可承載14.2萬億的TFLOPS(每秒浮點運算次數),而RTX 20系顯卡中使用的圖靈TU102大核心可將TFLOPS提高至16.3(TU102將提高顯卡主頻、加入更多CUDA核心,RTX 2080 Ti有4352個CUDA核心,最高配置的TU102有4608個CUDA核心)。

除此之外,RTX系列顯卡的內部性能也得到了提高,比如使用了共享內存架構的緩存系統速度更快、運用了全新的繪圖流水線(電腦圖形系統將三維模型渲染到二維屏幕上的過程)以及浮點與整數並行計算技術。這說明什麼呢,說明RTX系列顯卡的功率更大,效率也更高。

沒錯,儘管大家的關注點都在光線追蹤技術上,而且這項技術也為遊戲開發提供了無限可能,但是新RTX顯卡的高效才是本文想要闡述的重點。

RTX顯卡的渲染原理

不管是2000美元的遊戲本還是300美元的任天堂Switch掌機,這些遊戲系統的終極目標是能夠控制屏幕上每顆像素的色值。而現在常用的繪圖流水線繁雜、冗長,但是用三句話來總結的話就是:CPU不是用來渲染高清圖像的,它會將想要渲染的圖像樣式傳送給GPU(每小塊圖像都有GPU中的數百甚至數千個核心分別處理),GPU按照CPU給的樣式運行著色器來設定每顆像素的色值。

說起來容易,但是對於顯卡廠商和遊戲開發者來說,最大的挑戰是如何批量渲染。Switch掌機(解析度1280x720)在攜帶模式下,像素填充率通常為27MPixel/S,其使用的NVIDIA移動端顯卡用三年也沒什麼問題。但是如果想要達到60FPS(每秒傳輸幀數)的4K畫質(許多RTX顯卡買家期望達到的效果),那遊戲系統的像素填充率就需要達到近0.5GPixel/S,這樣系統就會承受很大負荷,尤其這些色值並不是PC憑空編出來的,而是要進行運算來實時模擬複雜的3D畫面。

不過市面上有許多技術能夠減少對遊戲系統的負荷,其中一個是將一個場景中的所有部分調整為低解析度來渲染,然後將結果應用到正常解析度的畫面中。當渲染720p解析度的遊戲放在1080p的屏幕上時,比較容易看出差別,但是如果將霧雲以四分之一解析度渲染就不太明顯,而NVIDIA的RTX顯卡的優勢就在於,其會選擇不明顯的區域來進行低解析度渲染。

NVIDIA新顯卡的繪圖流水線為了實現上述渲染捷徑,採用了幾種新的著色技巧,這些技巧依賴於MRS(多解析度著色)和LMS(透鏡匹配著色),優點是節省功率,但缺點是缺乏靈活性。上方圖片展示了GPU實時渲染的時候將一個場景用網格分解,沒有用顏色覆蓋的方塊為1:1著色的高細節度圖像,和普通遊戲場景相似。而被其他顏色覆蓋的方塊就不一樣了,比如在紅色方塊中只需要用解析度為4x4的像素塊著色,在藍色方塊將使用2x2的像素塊,因為這些方塊中的細節度並不高,即使以低解析度渲染也不是很明顯。

這種渲染技術的基本概念是,一個場景中的像素著色率並不一定全是恆定的,可以有針對性地設定,比如在賽車遊戲中,人眼主要集中在車和地平線上,因此畫面中間到上半部分可以按照1:1渲染,而畫面角落可以使用4x4像素塊渲染(2x2和2x1像素塊來渲染過渡的部分)。據NVIDIA稱,這種方法在畫面移動時幾乎是無法察覺的,同時也將減輕著色核心的負荷,提高幀速率。

目前,NVIDIA在專註開發更高級的著色技巧,未來可能會支持讓開發者在多個幀上重複使用紋理陰影或者改變人眼無法清晰捕捉的移動物體的著色質量。這些方法都是為了提高顯卡效率,目的是在不提高硬體條件下達到最佳性能。RTX在上個月發布時,NVIDIA曾用《德軍總部2:新巨像》展示過這系列顯卡的自適應著色效果, 該公司稱使用RTX顯卡可提高15-20%的幀頻,圖像損失幾乎可以忽略不計。

DLSS(深度學習超採樣)技術

但是如何才能徹底除去著色核心的負荷呢?這就要提到NVIDIA的抗鋸齒(AA)技術DLSS了,這種效果可以將遊戲畫面中的粗糙邊緣變平滑,而且它根本不需要用到CUDA核心,而是使用AI和新的張量核心。

NVIDIA使用超級計算機為DLSS開發了針對特定遊戲的演算法,簡單來講就是,在超級計算機中輸入超高解析度的遊戲圖像後,超級電腦會將數據與低解析度版本的圖像對比,在經過幾百萬次嘗試後,找出一種將低解析度圖像塑造成高解析度圖像的演算法。之後,NVIDIA會將演算法通過GeForce Experience應用發送給對應遊戲的玩家使用。

右上角:原始圖 左下角:色塊代表不同著色率 右下角:內容自適應的效果

經過實踐,DLSS渲染的效果基本上與市面上許多遊戲使用的時間性抗鋸齒技術(TAA/temperal anti aliasing)相比畫面更清晰。不過DLSS和所有抗鋸齒技術相似,都有利有弊:比如其在細節的處理上極其優秀,不過一些直的邊緣處理得並不完美。不過它比TAA技術的優勢在於,它是顯卡自帶的,與MSAA(多重採樣抗鋸齒技術)相比,使用DLSS在效果相當的情況下可節省顯卡的大量功率。

DLSS的一個主要局限是兼容性,因為NVIDIA需要為每個遊戲開發定製的演算法,如果遊戲開發者感興趣,NVIDIA願意免費開發演算法,但是有多少開發者有這個意願就不好說了。不過考慮到NVIDIA曾經推出過的HairWorks毛髮處理技術,就會發現其推出與硬體綁定的技術並沒有受到市場的廣泛應用,不過據稱DLSS技術幾乎不需要開發者做什麼工作,也許這種方便性會吸引更多人來使用吧。在RTX顯卡發貨前夕,已經有一些遊戲為其提供支持,包括《最終幻想XR》、《殺手2》、《絕地求生大逃殺》和《古墓麗影:暗影》。

動態細節渲染

NVIDIA在發布會上還演示了充滿幾何圖形的小行星帶,畫質非常令人驚艷,這次NVIDIA的CPU並沒有向GPU傳遞渲染每個小行星的命令,而是列了一個畫面中物體的清單,之後GPU中的數千個核心開始將清單中的物體進行處理、描繪和著色。這種CPU與GPU之間的交流方式大大減少了畫面過於複雜而損失幀率的情況,從而支持渲染更複雜的場景。

演示視頻中展示的技術也可以改變開發者們對LOD(細節級別)的設置,LOD的功能是定義場景中物體和紋理的間距,在遊戲機中通常是用數字來設定,而在PC中,有低、中、高等級別可選。在遊戲中選擇最高級設定時,綠草、樹、樓房等物體一直延伸到地平線都清晰可見,而在抵擋設定時,遊戲中只渲染了小部分葉子,遠處的建築可能就會消失不見或者被低多邊形組成的物體替代。

此外CPU與GPU交流時,也會傳遞細節層次的信息:開發者將製作許多高解析度的物體,然後RTX GPU將不斷掃描遊戲中的場景,根據每個物體的大小來安排其出現的時間。這樣的話,當高解析度物體體積縮小到只佔幾個像素時,便會變成模糊的幾何圖形。這種技術剛好與上面提到過的動態著色原則相似,都通過降低不重要部分的解析度,來提高GPU性能。

預示著更智能的計算方法

以上還不是NVIDIA在白皮書上提到的全部,這些提高性能的策略在接下來幾年對遊戲領域的重要性要超過光線追蹤,雖然市場對其反饋目前還未知,但很有可能以現在的硬體來講,實時光線追蹤起不到太大的視覺修飾。而若使用DLSS和各種著色技巧,便可立刻提高這三款RTX顯卡的性能,優勢甚至可能超過NVIDIA所有GPU。

NVIDIA這種從軟體入手,提高硬體性能的點子很了不起,目前人類開發的硅質晶元技術即將達到極限,即使每年顯卡的功率都在不斷提高,但是性能提高的速度已經越來越緩慢。

常常有人認為「雲端」能夠解決這一問題,誠然,在5G網路時代,將負荷從GPU轉移不失為一個辦法,但是數據中心設計師之前並沒有接觸過這麼新的平台,所以可能也會遇到性能的限制。就像顯示技術廠商渴望提高屏幕解析度(尤其是AR/VR顯示技術)一樣,人類都有擁有更好產品的慾望,為此我們還是需要找到一個更智能的方法來渲染遊戲。

如果沒有NVIDIA為宣傳新產品展示的AI技術和繪圖流水線,光靠顯卡很難實現8K遊戲畫面的實時渲染,當然這種新科技並不會只是NVIDIA的專利,未來希望AMD也能推出將AI負荷轉移的GPU,或者微軟和Khronos也可以將這些新點子與DirectX和Vulkan介面結合(NVIDIA為了實現這一點,也有將新型著色技術加入DirectX的計劃)。

在未來,致力於遊戲渲染技術的公司將推出更多節省功率的方法,屆時這些方法將造福整個遊戲領域。將RTX 2080 Ti以60FPS渲染為4K畫質的技術,也可以用來支持第二代Switch,畢竟第一代Switch已經使用了NVIDIA的GPU,下一代產品如果能使用NVIDIA的張量核心,便可以大大減少需要著色的像素,或者運行SSAA(超級採樣抗鋸齒技術)來渲染低像素圖像。另外,在幾天前蘋果在新品發布會上剛宣布新的iPhone A12 Bionic CPU將採用8個專註於運行AI的核心,可見這種越發智能的計算趨勢將越來越明顯,屆時受益者將會是遊戲。

(END)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 青亭網 的精彩文章:

這款外設讓多人AR遊戲更有趣
AI大浪來襲,人工翻譯的出路又在何方

TAG:青亭網 |