當前位置:
首頁 > 科技 > GeForce RTX 4070 Ti首發評測:力撼上代旗艦,完美適配2K高幀率遊戲

GeForce RTX 4070 Ti首發評測:力撼上代旗艦,完美適配2K高幀率遊戲

NVIDIA在去年9月發布了基於Ada Lovelace架構的GPU,此前GeForce RTX 4090和RTX 4080已相繼上市,分別搭載的是AD102和AD103。不過對於大部分遊戲玩家來說,這兩款定位高端的顯卡雖然性能強勁,但定價較高,並非是其首選的產品。進入2023年後,NVIDIA帶來了定位更低的GeForce RTX 4070 Ti,更為貼近主流。

GeForce RTX 4070 Ti搭載的是AD104 GPU,起售價格為6499元。與GeForce RTX 4080/4090不同的是,RTX 4070 Ti沒有Founders Edition產品,首批上市的都是NVIDIA合作夥伴的非公顯卡。


GeForce RTX 4070 Ti規格

NVIDIA在發布Ada Lovelace架構GPU的時候就公布了三顆GPU,分別是RTX 4090所用的AD102,RTX 4080所用的AD103,以及這次RTX 4070 Ti所用的是AD104,擁有完整的5組GPC,每個含有6個TPC,共30組TPC,每組有兩個SM單元,共60組。

與完整的AD104核心相比,RTX 4070 Ti上用的AD104-400少了兩個NVDNC和一個NVENC,完整AD104應該是三個NVENC與三個NVDNC的,估計完整規格要在專業顯卡上才會使用。

和更高一級的RTX 4080相比,RTX 4070 Ti的SM單元從76組減少至60組,CUDA Cores數量從9728個降低至7680個,Tensor Cores與RT Cores數量也有相應減少,L2緩存從65536KB降至49152KB。相對應的,晶體管數量從459億個減少到358億個,因此晶元面積也變小了。

RTX 4070 Ti的顯存位寬相比RTX 4080是有所下降,從256bit降至192bit,依然使用GDDR6X顯存,不過顯存數據速率也從22.4Gbps降低至21Gbps,整體顯存帶寬從716.8GB/s降至504GB/s,顯存容量從16GB減少到12GB。其Boost頻率為2610MHz,相比RTX 4080更高,而整卡TGP為285W,比RTX 4080低了35W,推薦電源功率也從750W降低至700W。

Ada Lovelace架構解析

SM架構圖

到了SM單元裡面,會發現其整體的結構也是與上一代Ampere架構一模一樣,分為四個一樣的主要計算模塊,一個RT光追核心,以及128KB一級數據緩存/共享內存等。每個主要的計算模塊內的結構也和Ampere架構一樣,有64KB寄存器文件、零級指令緩存、一個Warp調度器、一個分配單元、16個FP32單精度浮點CUDA核心、16個FP32/INT32單精度浮點和整數混合CUDA核心、一個Tensor Core張量核心、四個載入存儲單元、一個特殊功能單元(SFU)用於執行圖形差值指令。

差別也很明顯,那就是RT Core光追核心從之前的第二代升級到第三代,Tensor Core張量核心也從第三代升級到第四代。

第三代RT Core有效光追算力是上代3倍

全新的第三代RT Core可以提供2倍的光線與三角形求交性能,並且加入了兩個全新的重要硬體單元,即Opacity Micro-Map引擎和Displaced Micro-Mesh引擎。

Opacity Micro-Map引擎將光線追蹤的Alpha-Test幾何性能提升2倍;而全新的Displaced Micro-Mesh引擎可動態生成微網格,以產生額外的幾何圖形。Displaced Micro-Mesh引擎可在提升幾何圖形豐富度的同時,不以傳統複雜幾何圖形處理的性能和存儲成本為代價。

Displaced Micro-Mesh引擎

光線追蹤的計算是以光線射向一個平面這樣的模型來計算的,而實際的渲染中物體幾乎不會是簡單的平面型,而是各種曲面,所以就需要將曲面分解成許多個小的三角形平面,然後計算光線與三角形求交。在Ampere架構上,面對一個複雜的曲面,如果想得到逼真的光線追蹤效果,那麼分解的三角形平面是非常多的,多個三角形平面帶來非常複雜的BVH,這就非常難以計算。

Ada Lovelace架構的處理方式就不一樣,通過Displaced Micro-Mesh引擎,它將這些三角形平面僅通過一個三角形然後加上不同的位移圖來表達,顯著縮短了BVH的構建時間,同時BVH的存儲空間需求也減小了很多,而最終仍然能實現一樣的光線追蹤最終渲染效果。

實際應用中由於Displaced Micro-Mesh引擎的存在,面對複雜物體的渲染,BVH的構建速度可以超過15倍,而存儲空間的需求卻可以小20倍之多,越是複雜的物體該引擎的優勢就越能體現。

而且Displaced Micro-Mesh引擎不止可以應用在遊戲領域,對於創作領域的用戶來說,也有軟體會支持,目前Adobe、Simplygon這兩家企業已經確認得到了支持。

Opacity Micro-Map引擎

Opacity Micro-Map引擎則是可以對遊戲中常見的樹葉這類物體加速光線追蹤計算,Ampere架構面對這種場景的Alpha-Test需要多個著色器來進行計算,而Opacity Micro-Map引擎對於這種不透明的對象進行了不透明度的編碼,可以更準確的對物體邊緣進行光線追蹤計算,簡化了葉子輪廓之外完全透明和葉子輪廓之內完全不透明的區域的計算,耗費更少的著色器就可以實現真實的光線追蹤渲染。

以《傳送門》RTX版這個遊戲為例,Opacity Micro-Map引擎可以讓Gbuffer填充速度加快30%,遊戲幀率提高10%。

在這些改進下,第三代RT Core可以使完整的Ada Lovelace架構核心具有200 TFLOPS的有效光線追蹤計算能力,幾乎是上代產品的三倍。

第四代Tensor核心性能超上代5倍

第四代Tensor Core最主要的變化是新增了Hopper FP8 Transformer Engine,可提供1400 TFLOPS的張量處理性能,可以說深度學習性能得到了巨大的飛躍,這也意味著通過它可以實現新的技術想法,後面的DLSS 3我們會再次提到Tensor Core的功勞。

DLSS 3作為這次NVIDIA大力宣傳的重點,相信大家都急不可耐想深入的了解這個技術,但是為了更清楚的了解DLSS 3,還要先介紹兩個新東西,那就是著色器執行重排序(SER)和Optical Flow Accelerator光流加速器。

著色器執行重排序(SER)提高光追並行效率

著色器執行重排序技術的重大作用是可以極大的提升光線追蹤性能,這是與CPU的亂序執行一樣的重大創新。

由於光線追蹤的特性,它很難並行處理,因為光線會向各個方向反射,並與各種類型的表面相交,所以光線追蹤的工作負載需要不同的線程處理,需要不同的著色器,並且需要不同的顯存來存取中間的計算過程。

GPU的特點就是適合併行處理,只有面對並行處理的任務才可以發揮GPU的特點獲得更好的計算效率,而著色器執行重排序就是可以通過實時重新調度任務,即時重新安排著色器負載來提高執行效率,從而更好地利用GPU資源,以實現更佳的光線追蹤性能,據稱,SER可以為光線追蹤帶來最高可達3倍的性能提升,整體遊戲性能提升可高達25%。

應用了著色器執行重排序(SER)之後,《賽博朋克2077》在全景光線追蹤模式下可以提高44%的性能,《傳送門》RTX版可以提高29%的性能,《Racer RTX》可以提高20%的性能。

Ada光流加速器算力可超300 TFLOPS

回看前面的完整核心圖,可以看到左上角清晰的標出了Optical Flow Accelerator,也就是光流加速器,而儘管之前的Ampere架構中沒有提及,但同樣也是具備的。不同的是,Ada Lovelace架構中大大增加了光流加速器的運算性能,從之前Ampere架構的126 TFLOPS增加到現在的300 TFLOPS(詳細值是305 TFLOPS)。

Ada的光流加速器帶來的巨大的性能提升,具有更廣泛的實用性了,使DLSS 3能夠更準確預測場景中的運動,使神經網路能夠在保持圖像質量的同時提高幀率。前面提到的第四代Tensor Core的1400 TFLOPS的張量處理性能,加上這裡Ada Lovelace光流加速器300 TFLOPS的光流運算性能,再加上後方的NVIDIA超級計算機提供的超過1 ExaFLOPS的AI計算性能,這三者就組成了這一代DLSS 3的硬體層面基礎。

DLSS 3全方位提升流暢度、延遲和畫質

新一代的DLSS 3包括全新的幀生成技術、DLSS 2超解析度技術和NVIDIA Reflex技術,與之對應的遊戲中,這三個都啟用了才算是完整地開啟了DLSS 3。

其中幀生成必須RTX 40系列GPU才能支持,超解析度則是RTX 40/30/20系列都支持,Reflex的要求最低是GTX 900系列及以後的GPU。總得來說,DLSS 3是提升遊戲體驗的一整套解決方案,也就是說對於遊戲體驗的三要素:流暢度、延遲和畫質。DLSS 3是全方位的提升,而不是以拆東牆補西牆的方式。

DLSS 3的幀率

之前的DLSS 2,提升幀率的方式簡單說就是以低解析度渲染,然後通過AI訓練重建高解析度畫面返回輸出,比如我們將遊戲設置成4K,打開DLSS,那麼實際的計算過程是先以1080p解析度渲染幀畫面,然後AI學習經過訓練的更高解析度的幀再將這個幀畫面壓縮到4K最終輸出,中間相差的這3/4部分的像素信息是通過AI計算來添加的(本地主要是Tensor Core來計算)。由於以低解析度渲染,所以在AI補充像素的性能足夠的情況下,幀率自然可以提高了。

這樣的方式無法突破CPU性能的瓶頸,畢竟降低原始渲染解析度可以使得GPU每一幀的計算量更少,但是CPU每一幀的計算量是不變化的(因為CPU負責計算的部分與解析度並無關係)。實際上,由於幀率提高,最終CPU的計算量還增大了。

那麼DLSS 3是怎麼做的呢?

首先,還是與DLSS 2一樣,比如輸出4K遊戲畫面的話,它也是先降低原始渲染解析度到1080p,然後通過AI計算來添加像素再壓縮成4K畫面。在連續的遊戲畫面中,我們就可以通過這樣得到連續的4K幀畫面,第1幀、第2幀、第3幀等等。

然後這樣的每兩幀之間,DLSS 3通過光流加速器為神經網路提供像素級的幀到幀的運動方向和速度信息,然後通過分析前一幀和當前幀幾何圖形和像素的運動矢量並將其輸入至神經網路,就能計算出兩幀中間的幀畫面了。

實現超越CPU限制的幀數

這樣連續下去的話,原本的第1幀、第2幀、第3幀中間都會有一個新的幀,等於實際最終輸出的幀畫面中,有1/2是沒有CPU參與的,完全是GPU計算出來的,所以理論上可以將原本受限於CPU性能的遊戲幀率提高一倍。

另外,我們去關注像素的話,會發現靠傳統渲染方式計算的像素其實只有1/8,最終輸出的遊戲畫面7/8的像素其實都是通過DLSS 3的一系列AI計算填補上的,這極大的提升了效率。

DLSS 3的畫質

其實看我們的網站的網友評論可以看到,還是有很多網友對DLSS技術很抗拒,認為不是原始渲染出的畫面就不好,或許這一觀念是時候需要改變了。且不說網友有這一觀念可能是由於初代DLSS技術確實效果不佳,形成了刻板印象,即便之後的DLSS 2超解析度技術已經有很好的畫面也很難摒棄已經形成的觀念,對於現在的DLSS技術其實可以比較一下這幾幀畫面,已經完全看不出區別。

對於DLSS 3的生成幀這方面大家不免想到已經問世好久的各種插幀技術,DLSS 3的生成幀確實也可以算作插幀的一種,但是又與其他的插幀技術完全不一樣。

簡單的插幀技術利用兩幀之間像素的位移來確定中間幀的圖像,這樣其實非常容易出現明顯令人覺得視覺異常的畫面,特別是對於陰影這種需要計算的畫面效果,當主體移動之後,正確的陰影是需要經過複雜計算的,單單根據像素的位移來確定的畫面幾乎肯定違反客觀世界的物理規律。

DLSS 3使用光流加速器分析兩幀連續的遊戲圖像,計算幀到幀之間物體、元素的運動矢量數據,綜合遊戲中的一對超級解析度幀,以及引擎和光流運動矢量,並將其輸入至卷積神經網路,計算生成出新的一幀,大大提高了畫面的準確性。

DLSS 3的延遲

通過前面的梳理大家會發現DLSS 3儘管提高了幀速率,也保證了畫質,但是對於延遲是沒有縮短的,因為每一個新生成的幀都是需要後一幀渲染出來之後才可以準確生成的。更高的幀率提升了遊戲的順滑程度,但延遲會影響遊戲的響應度,如果延遲太高,遊戲的體驗也不會好,而為此,DLSS 3也集成了NVIDIA Reflex技術來降低延遲提高響應速度。

總得來說,DLSS 3是包括了基於AI的超解析度提升技術、基於AI的幀生成技術以及NVIDIA Reflex低延遲技術這些軟體層面以及第四代Tensor Core的1400 TFLOPS的張量處理性能、Ada Lovelace光流加速器300 TFLOPS的光流運算性能以及NVIDIA超級計算機提供的超過1 ExaFLOPS的AI計算性能組成的硬體層面綜合實現的一項新技術,對於遊戲體驗的提升也不是單方面的,而是全方位的提升。

全新第八代NVENC支持AV1編碼和雙編碼器

Ada Lovelace架構相比Ampere架構的另一項重要升級就是NVIDIA 編碼器 (NVENC)升級到了第八代,開始支持AV1編碼了。AV1的效率比H.264高40%,這意味著在傳輸同樣質量的畫面時候只需要大約70%的數據量,或者說在同樣的帶寬下可以實現更清晰的畫面質量,並且由於AV1是免費、開放的,可以讓廠商節省相當一筆費用,AV1已經明顯將要取代H.264成為主流格式。

在中國的備受歡迎的視頻編輯應用「剪映專業版」、Blackmagic Design 的 DaVinci Resolve 18、以及 Adobe Premiere Pro 較為流行的 Voukoder 插件均支持 AV1,且均可通過編碼預設使用NVENC AV1編碼器。此外,OBS、Discord以及更多的公司都已在採用NVENC AV1編碼器。

比如首發的RTX 4090給開放了兩個NVENC編碼器,這兩個NVENC可實現協同工作,並自動分配以實現雙路輸出。全新的雙編碼器可將視頻導出時間縮短至原來的一半,未來主播用戶可藉助第八代編碼器中AV1雙編碼器的優勢提升直播體驗,還可以通過OBS Studio錄製高達8K@60FPS的內容。


RTX 4070 Ti星曜OC解析

由於沒有Founders Edition產品,所以首批上市的都是NVIDIA合作夥伴的非公顯卡。這次我們GeForce RTX 4070 Ti的首發評測會有三款非公版顯卡,影馳GeForce RTX 4070 Ti星曜OC便是其中之一。


規格

從名字就知道,影馳的這款GeForce RTX 4070 Ti星曜OC是一張經過出廠預超頻的顯卡。其Boost頻率由公版的2610MHz提升至2685MHz,默認的溫度上限是84攝氏度,可以向上解鎖至88攝氏度,整卡功耗的上限默認狀態下為285W,可解鎖提升至360W。其他規格就與RTX 4070 Ti公版一致,供電介面同樣採用新款12VHPWR介面。


介紹

影馳的這款GeForce RTX 4070 Ti星曜OC的外包裝延續了上一代產品的二次元動漫風格,淺淺的、略微漸變的色調非常好看,洋溢著青春的味道。正面中間位置是影馳新版的虛擬形象「星曜娘」的戰鬥篇形象,作為影馳星曜系列的代表人物形象,展現了年輕、動感、活力的形象氣息,與星曜系列可定製外觀的特性相得益彰,右下方則標明了顯卡為RTX 4070 Ti。外包裝背面有顯卡的主要技術特性說明,以及一些基本的介紹,讓消費者對這款產品有基本的了解。

GeForce RTX 4070 Ti星曜OC採用了純白色的外觀設計,散熱器保護罩最外一層是透明的上殼,上面帶有鑽石切割和類似碎鑽的造型,有著水晶的既視感,搭配的散熱風扇也是透明的,整體顯得玲瓏剔透。顯卡正面、右側面與頂部LOGO燈之外的白色部分均採用包邊進行銜接,大大增加了自由噴繪和塗鴉的面積,且能讓定製圖案更加立體。同時透明的上殼是可拆卸的,方便玩家對顯卡進噴塗和拆裝,玩家可以發揮自己的想像力,打造個人專屬顯卡。

新顯卡採用的是最新的12VHPWR供電介面,理論上可以提供最高600W的持續供電,影馳還附送了3x 8Pin轉12VHPWR的轉接線。視頻輸出介面方面,GeForce RTX 4070 Ti星曜OC為三個DisplayPort 1.4a介面和一個HDMI 2.1介面,均可實現最高8K@60Hz的輸出,並實現最多4屏輸出,支持HDCP 2.3。擋板也有大面積的鏤空設計,可以加大出風口面積,增加散熱效果。

GeForce RTX 4070 Ti星曜OC顯卡的重量為1800g,相比不少RTX 4080/4090顯卡會稍微輕一些。

影馳在新款GeForce RTX 4070 Ti星曜OC上採用了星卓III散熱系統,有三個102mm超大風扇,每個風扇包括11片半透明的三折靜霜扇葉,轉動時候能呈現一種陀螺的樣子,強化散熱效能的同時,能夠投射璀璨的極光炫彩燈效,而且風扇邊緣的水晶外殼均帶有凸起花邊,可以進一步反射燈光,增強ARGB氛圍。影馳也對頂部的LOGO燈也進行了全面升級,新增多層折射鏡面設計,通過特殊工藝可營造多達8層的ARGB燈光效果。

GeForce RTX 4070 Ti星曜OC還附送了全新的星曜定製散熱支架,能通過簡單調控來穩固支撐顯卡體型,且支持ARGB燈光同步。利用ARGB三風扇 頂部LOGO燈 星曜定製散熱支架,構成了星曜系列獨一無二的ARGB燈效系統,支持多種律動和色彩變幻,並使用影馳魔盤和各大板廠燈控軟體對其進行同步調控。

此外,該款顯卡通過ARGB同步線連接設置後,可以與四大主板廠商實現同步操作,配合純白透明的外觀,帶來更炫更耀的ARGB燈效。其ARGB燈效除了能讓玩家構建光彩奪目的系統,還能利用其「負能量」檢測系統,通過不同的燈色的閃爍,讓玩家更直觀地排除故障,比如開機顯卡燈效呈現黃光閃爍代表顯卡外接供電異常,開機顯卡燈效呈現紅光閃爍代表主板異常。


拆解

GeForce RTX 4070 Ti星曜OC為8層PCB的影馳自研非公版,尾部還運用了PCB鏤空設計,進一步優化散熱效能。其採用13相核心供電,3相顯存供電設計,所用的MosFET為Alpha & Omega的AOZ5311NQI,這款DrMOS的連續電流輸出是55A,而10ms的瞬時峰值電流能到80A,10us瞬時峰值能到120A,核心供電的PWM控制器是uP9512R,在PCB的背面。6顆美光的GDDR6X芯粒半圍繞著GPU布置,組成192bit/12GB的規格。

將GeForce RTX 4070 Ti星曜OC顯卡拆解後,可以很清晰地看到AD104核心。RTX 4070 Ti所搭載的AD104核心和RTX 4080的AD103核心是pin to pin,所以PCB設計方面會有一些相似的地方,最明顯的就是GPU周圍有8個放置顯存晶元的位置。由於AD104隻有192bit所以只會焊上6顆GDDR6X芯粒,多出了兩個空焊位,同時供電方面也有所縮減,沒有在PCB兩側都安放有GPU供電。

這次星曜新系列產品採用了星卓III散熱系統,實現了GPU、顯存和供電部分的全方位覆蓋;配備了三個102mm超大風扇,專屬11葉靜霜扇葉,支持智能啟停,閑暇時自動停止轉動以減少噪音和功耗;配有兩根8mm和五根6mm鍍鎳複合熱管;採用了迴流焊接工藝;利用合金加強件強化PCB;背板大面積鏤空以強化散熱,高效能複合熱管結合均熱板以及大面積散熱鰭片。影馳通過打造一體式強力散熱系統,為顯卡超頻預留了更多的餘量。


性能測試

測試平台與說明

測試平台CPU使用的是AMD Ryzen 9 7950X,而搭配的主板是華碩ROG CROSSHAIR X670E HERO,加上32GB的EXPO DDR5-6000內存以及1200W的電源,最大程度上確保測試時不會出現瓶頸,從而影響顯卡最終的測試成績。

參加測試的顯卡包括了更高一級的GeForce RTX 4080,還有NVIDIA和AMD的上一代卡皇GeForce RTX 3090 Ti和Radeon RX 6950 XT,測試以2K解析度為主,包括傳統光柵遊戲以及光追遊戲,光柵遊戲分為2K和4K解析度,光追遊戲只測試2K解析度,DLSS測試部分只測試DLSS3。


理論性能測試

首先是純理論跑分,會以3D Mark作為顯卡基準性能測試,測試項目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Port Royal以及Speed Way六個項目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三個項目分別測試的是顯卡在DX11遊戲中的1080p解析度、2K解析度和4K解析度下的性能指數,Time Spy、Time Spy Extreme兩個項目則是顯卡在DX12遊戲中的2K解析度和4K解析度下的性能指數,Port Royal是測試的顯卡實時光線追蹤的性能指數,具體成績見下表,表中所列成績均為3D Mark顯卡單項的得分。

在1080P和2K解析度下,RTX 4070 Ti的性能略微超越自家上一代旗艦RTX 3090 Ti了,不過在4K解析度下還是有一點差距,畢竟兩者之間在顯存帶寬和容量方面還是有差距。兩項光追測試里,RTX 4070 Ti的得分也是略低於RTX 3090 Ti,但差距不大,與高一級的RTX 4080相比,跑分大概落後19%~25%左右。

如果與競爭對手AMD上一代旗艦RX 6950XT相比,DX11時解析度越低RX 6950XT的領先幅度越大,不過隨著解析度的提高,RTX 4070 Ti與RX 6950XT的差距逐漸縮小,在4K解析度下兩者基本平手;到了DX12測試,RTX 4070 Ti至少領先RX 6950XT 12%;兩項光追測試,RTX 4070 Ti的領先幅度就更明顯了,Speed Way測試裡面領先接近40%。


遊戲性能測試

在這次遊戲測試環節中,我們選擇了15款光柵化遊戲和8款光追遊戲。一般情況下,光柵遊戲會選擇極高或者超高的預設畫質,而光追遊戲會根據流暢度來決定具體的設置,這些測試里都沒有開啟DLSS或FSR。


2K光柵化遊戲

2K解析度是目前最多玩家關注的解析度,也是RTX 4070 Ti的主戰場。在該解析度下,RTX 4070 Ti、RTX 3090 Ti和RX 6950XT三者之間爭奪得非常激烈。

大部分情況下,RTX 4070 Ti的表現與RTX 3090 Ti相同,不過落到具體的遊戲就會顯現差異了。在《木衛四協議》里,RTX 4070 Ti領先RTX 3090 Ti接近15%;《F1 22》里,RTX 4070 Ti落後RTX 3090 Ti差不多20%;RTX 4070 Ti在《極限競速:地平線5》中也領先RTX 3090 Ti超過10%。如果將RTX 4070 Ti與RX 6950XT進行比較,RTX 4070 Ti整體領先約5%,RTX 4070 Ti的整體性能可以與NVIDIA與AMD的上代旗艦相媲美。不少項目里,RTX 4070 Ti都有著超過120fps的高幀率表現,完全可以滿足遊戲玩家在2K解析度下的流暢遊戲需求。


4K光柵化遊戲

許多玩家還非常在意新一代顯卡在4K解析度下的表現,由於RTX 4070 Ti只配備了12GB顯存,想要在高解析度下仍有良好的幀數表現,壓力有點大。

不少遊戲里RTX 4070 Ti的幀率都低於RTX 3090 Ti,只不過兩者的差距不算太大,整體落後5%左右。如果比較對象換成RX 6950XT,RTX 4070 Ti領先和落後的項目基本各佔一半,整體領先大概5%。雖然RTX 4070 Ti在4K解析度下的表現不是那麼出眾,但大多數遊戲仍在60fps以上,其實還是可以的。玩家如果想有有更順暢的遊戲體驗,可以選擇開啟像DLSS這樣的功能。


2K光追遊戲

光追遊戲項目里,由於《賽博朋克2077》對顯卡的要求太高,所以只選擇了RTX中等畫質,而其他7款遊戲都選擇了最高畫質以及最高光線追蹤效果。

RTX 4070 Ti在2K解析度下的表現說明,可以流暢運行光追遊戲。與前面一些測試反映的情況一樣,RTX 4070 Ti基本能向RTX 3090 Ti看齊,兩者的整體差價不大;與高一級的RTX 4080相比,性能落後19%左右;與競爭對手上一代旗艦RX 6950XT相比,則要領先30%。另外眾所周知,NVIDIA的GPU架構在光追性能方面仍然有比較大的優勢。


DLSS性能測試

在DLSS 3測試中,將測試RTX 4070 Ti在2K/4K解析度下開啟與關閉DLSS 3時的遊戲幀率、1%低幀率以及系統整體延遲,同時還會放上RTX 3090 Ti開啟DLSS 2時的數據作為對比。在2K解析度,會使用DLSS質量模式,到4K解析度,則會使用性能模式。

首先來看看DLSS 3開啟和關閉的畫質對比,列出部分測試遊戲的實機截圖。

DLSS 3 OFFDLSS 3 OFFDLSS 3 ONDLSS 3 ON

DLSS 3 OFFDLSS 3 OFFDLSS 3 ONDLSS 3 ON

可以直觀地看到,開啟DLSS 3不但沒有降低畫質,而且提升了畫質,情況或許會與部分玩家所想的有些不一樣。接下來可以看看在畫質提升的情況下,平均幀、1%低幀率和系統延遲的對比。

與前面的測試一樣,《賽博朋克2077》里選擇的是是RTX中等畫質,RTX 4070 Ti在2K解析度下啟用DLSS 3質量模式後,平均幀率直接翻了一倍,1%最低幀更是翻了一倍多,系統延遲降低了39%,顯然流暢度會大幅提升,和開啟DLSS 2的RTX 3090 Ti相比,平均幀率提升了44%,1%低幀率也提升了44%。

當解析度提升到4K解析度後,RTX 4070 Ti無法直接承受4K光追的負載,不過在DLSS 3性能模式加持下,幀率變成了原來的3.2倍,1%低幀率也是原來的2.6倍,延遲降低了60%。顯然不開啟DLSS基本沒辦法正常遊戲,開啟後效果明顯。如果RTX 4070 Ti和RTX 3090 Ti進行對比,平均幀率要高出20fps,而1%低幀率相同。

《F1 22》開啟最高畫質及最高光追效果後,即便沒有開啟DLSS,RTX 4070 Ti在2K解析度下也有著較高幀率,整體延遲很低。當開啟DLSS 3質量模式後,平均與1%低幀率都翻了一倍,延遲變化不大。在DLSS 3的加持下,RTX 4070 Ti的平均幀率高出RTX 3090 Ti大概18.5%,1%低幀率則高出48.5%。

將解析度提升到4K的話,DLSS 3的作用就比較明顯了。不開啟時,RTX 4070 Ti的平均幀率是低於60fps,開啟DLSS 3性能模式後幀率直接飆升至144fps,完全可以滿足高刷屏的需求,延遲也降低了28%。此時RTX 4070 Ti的平均幀率和用DLSS 2性能模式的RTX 3090 Ti差不多,但1%低幀率要高出不少。

《戰錘40K:暗潮》同樣選擇最高畫質與最高光追效果,RTX 4070 Ti在2K解析度不開啟DLSS時平均幀率低於60fps,開啟DLSS 3質量模式後平均和1%低幀率都實現了翻倍,延遲也降低了31%。RTX 4070 Ti和RTX 3090 Ti相比平均幀率高出44.8%,1%低幀率高出35.4%。

4K解析度下,若沒有DLSS,RTX 4070 Ti運行起來非常勉強,當開啟DLSS 3性能模式後,幀率差不多提升到原來的3倍,1%最低幀更是提升至3倍以上,延遲也降低到原來的一半。RTX 4070 Ti和RTX 3090 Ti相比,平均幀率高出30%,1%低幀率高出25.8%。

《微軟模擬飛行》開啟最高畫質,RTX 4070 Ti在2K解析度下也有不錯的表現,打開DLSS 3質量模式後,平均幀率增加了84.8%,1低幀率提升了87.4%。RTX 4070 Ti和RTX 3090 Ti相比平均幀率高出43.5%,1%低幀率高出77.9%。

4K解析度下,RTX 4070 Ti沒有DLSS時幀率不超過60fps,開啟DLSS 3性能模式後,平均與1%低幀率都翻倍了,延遲也降低了16%。RTX 4070 Ti和RTX 3090 Ti相比平均幀率高出43.5%,1%低幀率高出77.9%。

《瘟疫傳說:安魂曲》開啟最高畫質,RTX 4070 Ti在2K解析度下也可以流暢運行,在開啟DLSS 3質量模式後,平均幀率是原來是193%,1%低幀率也翻倍了,系統延遲降低了26%。RTX 4070 Ti和使用DLSS 2的RTX 3090 Ti相比,平均幀率提升了41%,1%低幀率提升了51.8%。

解析度提升到4K後,RTX 4070 Ti的平均幀率低於60fps,開啟DLSS 3性能模式後,平均幀率是原來的2.4倍,1%低幀率接近原來的3倍,系統延遲降低了39%。RTX 4070 Ti和RTX 3090 Ti相比,平均幀率提升32%,1%低幀率提升了40.8%。


AV1編碼測試

RTX 4070 Ti的媒體引擎與RTX 4090和RTX 4080是一樣的,均配備兩個第八代的NVENC和一個NVDNC,支持AV1格式的編碼/解碼,這兩個NVENC可實現協同工作,並自動分配以實現雙路輸出。

在該測試中,測試了視頻編輯應用「剪映專業版」和Blackmagic Design 的 DaVinci Resolve 18通過編碼預設使用NVENC AV1編碼器的輸出耗時。由於RTX 3090 Ti和RX 6950 XT不支持AV1編碼,所以選擇Intel的Arc A770來進行AV1編碼的對比。

AV1編碼測試可以看到RTX 4070 Ti在製作4K解析度的適配時效率和RTX 4080是同一水平,但在製作8K視頻時速度就明顯慢不少了,無論是RTX 4080還是RTX 4070 Ti相比Arc A770都大幅度領先,剪映中的耗時只是Arc A770的40%左右。


溫度測試

我們的GPU散熱測試均在裸機狀態(如果安裝在機箱內,GPU溫度會高出5℃左右)下進行測試,測試環境溫度約為24.6℃。待機溫度是開機以後記錄5分鐘,滿載溫度則是完成3DMark壓力測試後記錄下,數據通過GPU-Z的Log to File功能記錄,以下為溫度測試曲線。

影馳GeForce RTX 4070 Ti星曜OC顯卡支持風扇待機停轉,所以待機溫度都是被動散熱下的溫度,經過5分鐘的待機測試,從開始的31.9攝氏度上升到36.3攝氏度左右,5分鐘待機過程中最熱點溫度則是最低是開始的39.9攝氏度,最後最高處是44.6攝氏度。

滿載狀態下,最高溫度位67.1攝氏度,對於高端顯卡來說這溫度並不高。如果是最熱點溫度,最高是78.6攝氏度,可見GeForce RTX 4070 Ti星曜OC的散熱器模塊能很好地應付AD104核心本身的發熱量。

通過GPU-Z,可以看到影馳GeForce RTX 4070 Ti星曜OC顯卡在待機時風扇是會停轉,也就是說在待機狀態下完全沒有噪音,當負載和溫度超過一定程度後風扇就會啟動,滿載狀態下,風扇最高轉速在1255RPM,轉速並不高。


功耗測試

通過PCAT套件,可以分別精確地測量顯卡PCIe和外接電源介面瓦特數,顯卡最大功耗在3DMark Time Spy Extreme壓力測試中獲得,待機功耗則是在進入系統後記錄1分鐘取平均值。

統計功耗測試的結果算出,這張影馳GeForce RTX 4070 Ti星曜OC顯卡的整卡待機功耗平均為18.46W,滿載功耗平均為282.49W,峰值功耗達到了327.88W。對於RTX 4070 Ti這樣級別的顯卡來說,如果平台其他部件的功耗不高,那麼選擇額定功率為750W的電源就可以了,如果其他部件的功耗或者為以後升級留有餘地,建議至少選擇額定功率850W的電源。

影馳GeForce RTX 4070 Ti星曜OC顯卡在滿載運行情況下,顯卡的最高頻率能達到2805MHz,負載過程中一般保持在2790MHz,這個頻率還是非常穩定的。


噪音測試

上面的測試所知顯卡滿載時風扇最高轉速是1260RPM,PWM大概是39%左右。將顯卡放進了環境噪音只有18 dBA的消音房,把風扇調成同樣轉速,然後在50厘米的距離上測試其噪音水平,由於顯卡在待機時風扇是停轉的,所以就不用測試了。

在消音房裡,影馳GeForce RTX 4070 Ti星曜OC顯卡所測得的噪音水平是非常低,只有33.8 dBA,這是一個較低的噪音值,非常地安靜,基本上不會察覺到。


超頻測試

超頻的時候顯卡的TGP上限提升至360W,經過多番嘗試,最終顯卡的加速頻率能提高250MHz,GPU的頻率最高能到3.075GHz,顯存頻率提高175MHz,等效數據頻率達到了23.8Gbps,並通過了3DMark Time Spy測試,顯示顯卡得分為24456分,相比默認頻率,性能提高了約8%。


總結

在這次GeForce RTX 4070 Ti首發評測中,我們直接選擇了上一代旗艦產品RTX 3090 Ti進行比較,可以更為直觀地了解到性能的提升,因此就沒有再選擇性能明顯更低的RTX 3070 Ti。新一代基於Ada Lovelace架構的GeForce RTX 4070 Ti,在2K解析度下的表現非常不錯,與RTX 3090 Ti沒有太大的差別,而且支持更新的技術,能效比表現也更好。

當解析度提高到4K以後,由於12GB顯存容量的限制,在部分遊戲中會有些力不從心,實際表現會比RTX 3090 Ti差一些,但不代表完全不能適應於4K解析度。由於GeForce RTX 4070 Ti支持DLSS 3,遊戲幀數可以有翻倍的表現,優於RTX 3090 Ti開啟DLSS 2,使其可以滿足4K解析度下的遊戲需求,即便在2K解析度下也能帶來更高且穩定的幀數。雖然仍然有一些玩家不太願意接受超解析度技術,但從長遠來看,這樣的技術可以能夠使硬體選擇和遊戲設置更為靈活,提供了更多的可能性,會被更多的遊戲開發商所支持。

相比更高一級的RTX 4080相比,RTX 4070 Ti有著大概19%的性能落差,反映到價格上的差距就更大了。對於選擇2K而非4K顯示器的玩家來說,RTX 4070 Ti可能更為適合。從這個角度來看,RTX 4070 Ti更好地迎合了現今玩家對於性能的需求。

顯卡迷你天梯榜 (完整顯卡天梯榜)

影馳GeForce RTX 4070 Ti星曜OC顯卡在設計上延續了之前該系列RTX 4080產品的設計,外觀、性能、靜音和功耗等各方面有著很好的平衡,溫度和噪音控制都相當不錯,而且有著一定的可玩性,滿足了部分玩家自定義的需求。其價格為7099元,比RTX 4070 Ti的官方起售價高一些,考慮到該款顯卡的品質,加上有著更高的廠商頻率,這樣的定價還是能夠接受的。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 超能網 的精彩文章:

鎧俠發布第二代XL-FLASH存儲級內存解決方案:更高性能,更低延遲