NVIDIA GTC大會概覽

科技 03-30

昨日凌晨0點開始，NVIDIA在美國聖何塞McEnery會議中心召開的GTC 2018大會，老黃公布了一些新品和技術方向，並調整了一些戰略目標。

「Amazing science, amazing graphics, amazingproducts and amazing AI.」

▌新核彈

大會上，老黃首先發布了支持英偉達RTX技術的核彈級顯卡——Quadro GV100。雖然這次並沒有推出面向玩家的桌面級顯卡，但這張新的專業級顯卡著實強大，老黃當場給大家演示了RTX技術的強大。

要知道，這樣驚為天人的電影級畫質是實時渲染出來的！頂級的畫質、頂級的價格，這張牛逼的GV100價格達到了約6萬塊錢（8999美元）。

性能方面，GV100基於Volta架構，採用32GB HBM2 ECC顯存，5120個CUDA核心，640個Tensor。現場演示的《星球大戰：電梯尬演》Demo是用2塊GV100通過NVLink2連接，這意味著這台電腦擁有64GBHBM2顯存、10240個CUDA核心，代替了傳統渲染農場、可以極大提高效能和節省時間、空間。

每張 GV100可以提供7.3TFlps雙精度性能、14.8TFlps單精度性能，以及118.5TFlps深度學習性能。NVIDIARTX內置的NVIDIA OptiX AI-Denoiser可以實時AI去噪，官方表示其性能相當於採用CPU方式的100倍。

▌「世界最大GPU」

幾年前，NVIDIA發了P100和NVLINK後，推出了售價12900美元的深度學習超級計算機DGX-1，今年，又給大家帶來了真·重磅核彈——DGX-2，核彈級的售價——399000萬美元（約合人民幣250萬）！

對於這份巨無霸套餐，老黃自己都說它就是世界上最大的GPU了。大會上老黃還宣布，新版的Tesla V100顯存擴容了一倍。「5 年前 AlexNet 在ImageNet 上展示了突破性的能力，」黃仁勛說道，「它有 8 層，數百個參數。而今天我們能夠看到數百層的神經網路，內含數十億參數，深度學習模型經過五年的發展，體量擴大了 500 倍。」

這個新一代巨無霸DGX-2由16塊Tesla V100組成，使用NVSwitch技術互相連接，它的晶元間傳輸速率達到了驚人的300GB/s、超越傳統PCIe整整12倍，藉助NVLink2最終形成14TB/s的通道。這是個什麼概念，用老黃自己的話說就是，如果以一本電影1GB來算，14000部電影可以在1s內傳輸完成，並隨即露出一臉微笑。

DGX-2搭載了2塊Intel Xeon Platinum CPU、1.5TB內存、30TB NVMe SSD（最高60TB）、512GB HBM2顯存、最高提供2PFLOPs（2000TFLOPs）即每秒兩千萬億次浮點運算的深度計算能力，功率為10KW、重量350磅，所以說有多重磅呢？沒錯，就是這麼重磅，它可能是有史以來第一個老黃單手舉不起來的GPU。

它的意義在哪裡？同樣的性能，以往需要300台伺服器、15個數據中心機架空間，如今體積縮小60倍、能效提升18倍！

（據說已經有礦老闆們在籌資買來挖礦了……）

▌AI平台改進

如同往屆，老黃對AI做了介紹，公布了一系列重要進展，其中包含Tesla V100 32GB GPU的2倍顯存、革命性NVSwitch結構、全面的軟體堆棧推動性能提升、深度學習核能站DGX-2、發布深度學習引擎TensorRT 4等等。NV表示相較於6個月前的DGX-1，這次的性能提升高達10倍！

老黃表示，基於在數據中心、汽車應用、以及包括機器人和無人機等嵌入式設備領域中，諸如語音識別、自然語言處理、推薦系統、以及圖像識別等新功能的支持，面向深度學習推理的 GPU 加速正在獲得越來越多的關注。

▌GPU加速

「The more GPUs youbuy，the more money you save（用越多的GPU，你就越省錢）」，老黃演講之餘還不忘diss一下摩爾定律，當然，老黃是有這個實力為前提的，基於GPU的特性，老黃調戲了一番英特爾。他們選擇Skylake CPU做比較，這是CPU能夠同時處理的花朵數量：

而下面是老黃的：

黃仁勛在觀眾的笑聲中說到：「這個奇妙的系統編排層叫做Kubernetes，人生已經圓滿」。

現在，NVIDIA GPU已經支持由Google孵育的Kubernetes容器編排系統了，它旨在優化GPU在超大型數據中心的使用，這包含成百上千GPU來加速機器的學習進程，並允許開發人員將這些容器帶到多個雲中、無需任何更改。NVIDIA向Kubernetes開源社區貢獻了自家的GPU增強，機器學習的工作量往往很大，無論是所需的算力還是驅動它的數據。黃仁勛稱：「現在我們已經有了所有這些加速框架和代碼，然後該如何將它們部署到數據中心的世界中呢？比如 Kubernetes！它將為我們帶來相當多的歡樂」。

此外，NVIDIA宣布推出新版TensorRT推理軟體——TensorRT 4，並將其集成到Google的TensorFlow（1.7）框架了。它可以將計算機視覺、神經網路機器翻譯、自動語音識別、語音合成等深度學習推理速度加快190倍（對比CPU）！

▌蛋疼的事情

英偉達對上周Uber自動駕駛車禍事故也做出了回應，因為他們扮演了Uber無人車後台計算的角色、是Uber無人車的合作夥伴，所以他們重新反思了自動駕駛技術的訓練流程，會現在模擬環境中控制進行測試，通過海量模擬還原實際情況，通過自家的SIM人工智慧對自己百般刁難，從而避開實際上幾乎不可能發生的事故。

之後，老黃還現場演示了一段通過VR設備遠程控制車輛的實際演示，是不是有一種《黑豹》電影里的感覺？

與此同時，老黃表示英偉達將暫停研發無人車技術，但發布了自動駕駛汽車模擬系統DRIVE Constellation，但蛋疼的事情來了，英偉達當日股價應聲下跌。但是自動駕駛對於未來而言是絕對必要的，這是個繞不過去的坎兒，相信NV能夠挺過難關、推動社會發展！

▌總結

這次NVIDIA GTC的重點在於渲染處理、人工智慧、自動駕駛等等，著手於挖掘GPU極限性能，因為業務的擴大，自己的對手已經不僅僅是AMD了，他們還需要和汽車廠、醫療器械廠、工業機器人製造商等進行合作、競爭，而至於我們玩家關心的遊戲顯卡嘛……等著吧您吶~

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 極客灣 的精彩文章:

※科技年輪｜電腦也講風水？散熱系統的簡單介紹（二）
※小教程｜開始超頻之旅！

TAG:極客灣 |