英偉達發布「霸王龍」Titan RTX：價格降低，本月上市

科技 12-06

機器之心報道

參與：

路雪、劉曉坤、張倩

英偉達在 NeurIPS 大會上發布最新款產品 Titan RTX，這是去年 Titan V 的「繼承者」：價格更低，顯存更大，性能更強，且使用圖靈架構，因此具備強大的光線追蹤能力。

今年英偉達發布了新一代 GPU 架構 Turing 和 Quadro RTX 系列，然後又發布了三款消費級 GeForce RTX 顯卡，以及第一款 Turing Tesla T4。然而，英偉達的產品線中通常會有一款比較高端的顯卡，這就是 Titan。Titan 不是旗艦卡也不算是消費級顯卡，但它仍然是英偉達產品中非常有趣的存在，它是最快的顯卡，其他卡無法企及，現在它成為英偉達主推的工作站計算顯卡。

去年此時，英偉達在 NeurIPS 大會上發布了售價 3000 美元的 Titan V。今年英偉達再度選擇在 NeurIPS 發布最新的 Titan 顯卡——Titan RTX。Titan RTX 將於本月稍晚時候大批量上市，是英偉達為工作站計算和光線追蹤提供的一款重量級產品，該顯卡售價 2500 美元。

Titan RTX、Titan V、GeForce RTX 2080 Ti、Telsa V100 參數對比圖。

從上圖數字來看，Titan RTX 像是加強版的 GeForce RTX 2080 Ti。儘管它並非消費級顯卡，但它與英偉達的消費級旗艦顯卡 RTX 2080 Ti 一樣，都基於 TU102 GPU，不過 RTX 2080 Ti 使用的是 GPU 的輕微縮小版，而 Titan RTX 使用的是完整晶元，類似於英偉達最好的 Quadro 晶元。此外，Titan RTX 的功能與 Quadro RTX 6000 非常相似。也就是說儘管 Titan RTX 並不是旗艦顯卡，它也不屬於第二梯隊：其能力和速度與英偉達最好的 TU102 顯卡相當，因此它屬於頂級。

英偉達對其市場地位進行了觀察，隨著 Titan V 於去年上市，英偉達逐漸轉向，不再將 Titan 定位為比 GeForce 具備更多內存和稍高性能的「專業消費級」顯卡，而是更多地偏向於為非圖形學任務服務的專業級工作站顯卡。使用伺服器級 GV100 GPU 縮小版的 Titan V 輕鬆實現了英偉達這一轉向，但它仍受伺服器級 GPU 的限制。現在英偉達重新使用更接近工作站級別的 GPU TU102，再次調整了其晶元之間的平衡。但是 Titan RTX 仍然是英偉達的工作站計算顯卡，此外由於圖靈架構追蹤光線的能力，Titan RTX 也將是最適合內容創作者的光線追蹤顯卡。

深入來看，令 Titan RTX 與英偉達其他晶元都不一樣的原因有三，尤其是 GeForce RTX 2080 Ti。原始性能是原因之一，我們能看到 Titan RTX 在著色、紋理生成和計算的性能提升了 15%，內存帶寬和像素吞吐量增加了大約 9%。

但是，對英偉達真正市場——數據科學家和其他計算用戶來說，重點是張量核心。英偉達修改了 GeForce 軟體使用條款，禁止在數據中心運行深度學習等應用，這對專業市場影響很大。在圖靈的最高精度 FP16 模式中，圖靈能夠不斷進行 FP32 累積來獲取更高的精度，然而在 GeForce 顯卡上該操作被限制在半速吞吐量。而最新發布的 Titan RTX 移除了該限制，這款新型晶元可以在其張量核心上全速進行 FP32 累積。

鑒於英偉達的張量核有十幾種模式，這似乎是 GeForce 和 Titan 之間存在的奇怪區別。然而對於數據科學家而言，這非常重要；FP32 累積對於神經網路訓練來說通常是必需的（FP16 累積沒有足夠的精度），特別是在需要購買 Titan 和 Tesla 晶元的領域。所以這個微小的變化是對數據科學家用戶的價值定位重要組成部分，因為英偉達沒有提供更便宜的、具有 Titan RTX 可以達到的頂級 130 TFLOPS 張量性能的顯卡。

最後一個因素是內存容量。GeForce RTX 2080 Ti 是一款 11GB 內存的顯卡，Titan RTX 是一款 24GB 內存顯卡。對於遊戲玩家來說，11GB 都算大材小用了，但是再添加 13GB 顯存可以打造或打破大型數據集。英偉達非常了解他們的市場。

除了市場定位之外，Titan RTX 的推出也意味著其餘的張量性能優勢最終將會出現在 Titan 級卡上。圖靈架構引入了對低精度模式的支持，這有助於進一步將 Titan RTX 與去年的 Titan V 區分開來。總體而言，原本考慮 Titan V 的數據科學家們會注意到 Titan RTX 將顯存容量提高了一倍，並將張量性能提高了 20％（精度較低時提升更多），以及圖靈架構的所有其他改進。如果這還不夠，英偉達此次還啟用了 NVLink 功能（它在 Titan V 上被禁用），因此工作站用戶也可以通過連接兩張 Titan RTX 卡進行擴展，以獲得更高的性能。

與此同時，英偉達也瞄準了這款顯卡的內容創作者用戶。數據科學家仍然是主要用戶，但鑒於圖靈架構對光線追蹤進行了大量投入，英偉達似乎也應該在這裡試驗一下，看看哪個市場適合高端但非 Quadro 的光線追蹤顯卡。嚴格來說 Quadro 6000 在這裡應該是優越的（如果僅僅看驅動程序和支持的話），但它價格高昂。因此，看看英偉達將為 2500 美元的光線追蹤顯卡 Titan RTX 開闢什麼樣的市場會很有趣。

雖然英偉達第一個注意到該卡並非真正用於遊戲，但是自 Titan 使用 GeForce 驅動程序堆棧以來，即使 Titan V 也出售給一些遊戲玩家，Titan RTX 的情況可能將大致相同。由於 Titan V 是唯一使用 GeForce 驅動程序的 Volta 架構卡，其在遊戲支持方面很尷尬，而圖靈架構則無處不在。所以 Titan RTX 應該表現得更像一個稍快的 2080 Ti，沒有我們在 Titan V 上玩遊戲時看到的那麼多性能不一致。

在設計方面，與其前任一樣，Titan RTX 也非常貼近 GeForce 系列的風格。值得注意的是，英偉達在這一代產品中使用了露天雙風扇散熱器，而不是傳統的鼓風機，如 Titan V 或目前的 Quadro 卡。正如我們在 GeForce 卡上看到的那樣，露天雙風扇散熱器可以最大限度地增大氣流並降低溫度。但是對於 Titan 而言，這是一個混合包，因為英偉達允許將 Titan RTX 與 NVLink 配對。露天冷卻卡需要用戶更多的關注，而鼓風機在工作站中基本上設置好後就可以忽略。然而，Titan RTX 顯卡的 TDP 功率為 280W，這是圖靈卡中功率最高的，比 Titan V 高 30W。人們據此可以看出為什麼英偉達有興趣將冷卻性能最大化放到其他優先順序之上。這也意味著理論上 Titan RTX 的平均時鐘頻率應該比 Quadro 略高，因為它具有更多的散熱和 TDP 餘量；所以至少現在為止，它可能是所有 TU102 卡中最快的。

Titan RTX 是一款非常典型的英偉達設計顯卡。它具有與 Quadro 和 GeForce 顯卡相同的埠配置，具有 3x DisplayPort 1.4 輸出、HDMI 2.0b 埠和支持 DP alt 模式的 USB-C 埠，以及 VR 耳機的 VirtualLink 標準。Titan 的獨特之處當然是它的金色配色方案，讓它不會與 GeForce 混淆。英偉達為 Titan RTX 取的綽號是「霸王龍」（T-rex），這似乎是第一次有人提供 T-rex 黃金版。

無論如何，數據科學家和其他任何想要了解英偉達工作站「恐怖」之處的人，請準備好錢，準確地說是 2500 美元。對於英偉達來說，這個價格實際上比 3000 美元的 Titan V 還要低一些（TU102 製造成本更低，特別是沒有 HBM2），但它仍然是一款昂貴的顯卡。這款新顯卡 Titan V 將在本月本月晚些時候出現在英偉達網站（http://www.nvidia.com/titan-rtx）。

活躍在 NeurIPS

英偉達把最高端的 Titan 顯卡放在 NeurIPS 大會期間發布，這不是一個巧合：去年的 NIPS 大會上，黃仁勛正是在英偉達舉辦的晚宴上發布了 Titan V，還現場贈送了顯卡。

今年，英偉達在 NeurIPS 上同樣活躍，一篇「GAN 生成視頻」的論文再次引來了人們的關注。其中人工智慧技術與傳統視頻遊戲引擎相結合，這種混合圖形系統未來有望應用於遊戲、電影和虛擬現實等領域。

英偉達放出的 Demo 視頻是一個模擬駕駛環境，其中玩家可以在 AI 生成的城市中駕駛車輛——重要的是，這個演示視頻僅需一塊 GPU 即可實現（不過得是 Titan 級別的）。

真實圖像與 AI 生成圖像的對比。

英偉達的系統使用幾個步驟來生成圖形。首先，研究人員收集訓練數據，這些數據來自用於自動駕駛研究的開源數據集。隨後，計算機對這些圖像進行分割處理——每一幀都被分成不同的類別：天空、汽車、樹木、道路、建築物等。然後，對分割後的數據訓練生成對抗網路（GAN），以生成虛擬圖像。

論文：Video-to-Video Synthesis

我們研究了視頻到視頻的合成問題，目標是學習從輸入源視頻（例如，一系列的語義分割掩碼）到輸出照片級視頻的映射函數，輸出視頻精確地描繪了源視頻的內容。與之對應的圖像問題，即圖像到圖像合成問題是目前流行的研究課題，而視頻到視頻的合成問題則在文獻中很少出現。在沒有理解時間動力學的情況下，直接把已有的圖像合成方法應用到輸入視頻通常會導致視覺效果差、時間不連貫的視頻輸出。

在本文中，我們提出了一種新型的生成對抗網路框架下的視頻到視頻合成方法。通過精心設計生成器和判別器架構，結合空間-時間對抗目標函數，我們在多種輸入視頻格式下生成了高解析度、時間連貫的照片級視頻，其中多種形式的輸入包括分割掩碼、草圖和姿態圖。

在多個基準上的實驗結果表明，相對於強基線，我們的方法更具優越性。特別地，我們的模型可以合成長達 30 秒的 2K 解析度街景視頻，與當前最佳的視頻合成方法相比具備顯著的優勢。最後，我們把該方法應用到未來視頻預測中，結果超越了多個當前的最佳系統。