NVIDIA GTC大會概覽
昨日凌晨0點開始,NVIDIA在美國聖何塞McEnery會議中心召開的GTC 2018大會,老黃公布了一些新品和技術方向,並調整了一些戰略目標。
「Amazing science, amazing graphics, amazingproducts and amazing AI.」
▌新核彈
大會上,老黃首先發布了支持英偉達RTX技術的核彈級顯卡——Quadro GV100。雖然這次並沒有推出面向玩家的桌面級顯卡,但這張新的專業級顯卡著實強大,老黃當場給大家演示了RTX技術的強大。
要知道,這樣驚為天人的電影級畫質是實時渲染出來的!頂級的畫質、頂級的價格,這張牛逼的GV100價格達到了約6萬塊錢(8999美元)。
性能方面,GV100基於Volta架構,採用32GB HBM2 ECC顯存,5120個CUDA核心,640個Tensor。現場演示的《星球大戰:電梯尬演》Demo是用2塊GV100通過NVLink2連接,這意味著這台電腦擁有64GBHBM2顯存、10240個CUDA核心,代替了傳統渲染農場、可以極大提高效能和節省時間、空間。
每張 GV100可以提供7.3TFlps雙精度性能、14.8TFlps單精度性能,以及118.5TFlps深度學習性能。NVIDIARTX內置的NVIDIA OptiX AI-Denoiser可以實時AI去噪,官方表示其性能相當於採用CPU方式的100倍。
▌「世界最大GPU」
幾年前,NVIDIA發了P100和NVLINK後,推出了售價12900美元的深度學習超級計算機DGX-1,今年,又給大家帶來了真·重磅核彈——DGX-2,核彈級的售價——399000萬美元(約合人民幣250萬)!
對於這份巨無霸套餐,老黃自己都說它就是世界上最大的GPU了。大會上老黃還宣布,新版的Tesla V100顯存擴容了一倍。「5 年前 AlexNet 在ImageNet 上展示了突破性的能力,」黃仁勛說道,「它有 8 層,數百個參數。而今天我們能夠看到數百層的神經網路,內含數十億參數,深度學習模型經過五年的發展,體量擴大了 500 倍。」
這個新一代巨無霸DGX-2由16塊Tesla V100組成,使用NVSwitch技術互相連接,它的晶元間傳輸速率達到了驚人的300GB/s、超越傳統PCIe整整12倍,藉助NVLink2最終形成14TB/s的通道。這是個什麼概念,用老黃自己的話說就是,如果以一本電影1GB來算,14000部電影可以在1s內傳輸完成,並隨即露出一臉微笑。
DGX-2搭載了2塊Intel Xeon Platinum CPU、1.5TB內存、30TB NVMe SSD(最高60TB)、512GB HBM2顯存、最高提供2PFLOPs(2000TFLOPs)即每秒兩千萬億次浮點運算的深度計算能力,功率為10KW、重量350磅,所以說有多重磅呢?沒錯,就是這麼重磅,它可能是有史以來第一個老黃單手舉不起來的GPU。
它的意義在哪裡?同樣的性能,以往需要300台伺服器、15個數據中心機架空間,如今體積縮小60倍、能效提升18倍!
(據說已經有礦老闆們在籌資買來挖礦了……)
▌AI平台改進
如同往屆,老黃對AI做了介紹,公布了一系列重要進展,其中包含Tesla V100 32GB GPU的2倍顯存、革命性NVSwitch結構、全面的軟體堆棧推動性能提升、深度學習核能站DGX-2、發布深度學習引擎TensorRT 4等等。NV表示相較於6個月前的DGX-1,這次的性能提升高達10倍!
老黃表示,基於在數據中心、汽車應用、以及包括機器人和無人機等嵌入式設備領域中,諸如語音識別、自然語言處理、推薦系統、以及圖像識別等新功能的支持,面向深度學習推理的 GPU 加速正在獲得越來越多的關注。
▌GPU加速
「The more GPUs youbuy,the more money you save(用越多的GPU,你就越省錢)」,老黃演講之餘還不忘diss一下摩爾定律,當然,老黃是有這個實力為前提的,基於GPU的特性,老黃調戲了一番英特爾。他們選擇Skylake CPU做比較,這是CPU能夠同時處理的花朵數量:
而下面是老黃的:
黃仁勛在觀眾的笑聲中說到:「這個奇妙的系統編排層叫做Kubernetes,人生已經圓滿」。
現在,NVIDIA GPU已經支持由Google孵育的Kubernetes容器編排系統了,它旨在優化GPU在超大型數據中心的使用,這包含成百上千GPU來加速機器的學習進程,並允許開發人員將這些容器帶到多個雲中、無需任何更改。NVIDIA向Kubernetes開源社區貢獻了自家的GPU增強,機器學習的工作量往往很大,無論是所需的算力還是驅動它的數據。黃仁勛稱:「現在我們已經有了所有這些加速框架和代碼,然後該如何將它們部署到數據中心的世界中呢?比如 Kubernetes!它將為我們帶來相當多的歡樂」。
此外,NVIDIA宣布推出新版TensorRT推理軟體——TensorRT 4,並將其集成到Google的TensorFlow(1.7)框架了。它可以將計算機視覺、神經網路機器翻譯、自動語音識別、語音合成等深度學習推理速度加快190倍(對比CPU)!
▌蛋疼的事情
英偉達對上周Uber自動駕駛車禍事故也做出了回應,因為他們扮演了Uber無人車後台計算的角色、是Uber無人車的合作夥伴,所以他們重新反思了自動駕駛技術的訓練流程,會現在模擬環境中控制進行測試,通過海量模擬還原實際情況,通過自家的SIM人工智慧對自己百般刁難,從而避開實際上幾乎不可能發生的事故。
之後,老黃還現場演示了一段通過VR設備遠程控制車輛的實際演示,是不是有一種《黑豹》電影里的感覺?
與此同時,老黃表示英偉達將暫停研發無人車技術,但發布了自動駕駛汽車模擬系統DRIVE Constellation,但蛋疼的事情來了,英偉達當日股價應聲下跌。但是自動駕駛對於未來而言是絕對必要的,這是個繞不過去的坎兒,相信NV能夠挺過難關、推動社會發展!
▌總結
這次NVIDIA GTC的重點在於渲染處理、人工智慧、自動駕駛等等,著手於挖掘GPU極限性能,因為業務的擴大,自己的對手已經不僅僅是AMD了,他們還需要和汽車廠、醫療器械廠、工業機器人製造商等進行合作、競爭,而至於我們玩家關心的遊戲顯卡嘛……等著吧您吶~
※科技年輪|電腦也講風水?散熱系統的簡單介紹(二)
※小教程|開始超頻之旅!
TAG:極客灣 |