黃仁勛北京演講:GPU帝國啟幕,發布可編程AI 推理加速器TensorRT 3
TensorTR 3,英偉達迎接谷歌TPU的一招。
新智元報道
【新智元導讀】GTC CHINA上,黃仁勛展示了英偉達強大的生態系統建構能力,在圍繞GPU的計算生態中:BAT已在雲服務中使用GPU,華為、浪潮和聯想也都使用GPU伺服器,此外還有海康威視、科大訊飛和京東也都在積極使用GPU產品。GPU的計算帝國已然呈現。另外,黃仁勛在北京現場重磅發布了可編程的AI 推理加速器TensorRT 3,從功能上看與TPU有眾多相似之處。演講中,黃仁勛特別提到了自動駕駛和自主機器,這將是英偉達接下來發力的重點。
2017年9月26日,北京,英偉達GPU技術峰會GTC CHINA 開幕。英偉達創始人兼CEO黃仁勛發表主旨演講。
生態:GPU帝國,BAT、華為浪潮聯想,1900家創業公司統統包括
「Welcome Beijing!」黃仁勛揮著手激動上台,然後直奔主題。
首先,黃仁勛講了兩股力量推動計算領域發生改變。第一次是摩爾定律的結束,加快、加深管道,讓CPU設計者在片上放下越來越多的晶體管。但是,現在這樣做越來越來難以持續,晶體管每年增長50%,CPU性能卻只以10%的速度增長。
另一方面,新的計算模型,也即深度學習,以暴風般的速度和大數據一起席捲而來。
深度學習研究者發現了GPU的力量。
一方面發現新的計算模型,持續提升性能。每一代都能夠將更多晶體管的數量轉換為計算力。讓一個月的計算縮減為一天。
GPU的崛起,單從GTC的參會人數就能看出來。在短短5年間,GTC的參會人數就堪比大型會議,今年有22,000人蔘會。
黃仁勛在演講中提到,摩爾定律已經是昨天的定律,是一種緩慢的定律,我們現在處於超級摩爾定律時代。
在展示了GPU的獨特性能和為深度學習而生的歷史使命之後,黃仁勛展示了英偉達更加強大的一面——生態系統。圍繞著英偉達而生的GPU帝國似乎已經成型,他在現場宣布,阿里巴巴、百度和騰訊都已經在雲服務中使用GPU,另外華為、浪潮和聯想也都採用GPU伺服器。
另外,他還介紹了面向全球開發人員的NVIDIA.AI。英偉達將會全力推進「統一架構」 CUDA GPU計算。通過Inception計劃,支持1900家初創企業。
從CUDA開始,英偉達其實一直做得最出色的便是打造生態系統的能力,在GPU性能不斷受到關注的今天,有人指出,英偉達的技術也許不是最強的,但是他們打造生態系統的能力和決心絕對不容忽視。未來,GPU帝國終會成型。
關於英偉達在中國打造的計算新紀元,下面這張圖是很好的說明:
最重磅發布:NVIDIA TENSORRT 3,應對TPU
在本次大會上,黃仁勛發布了本次發布會英偉達最重要的一個產品NVIDIA TENSORRT3——一款可編程的AI 推理加速器。支持所有的框架,比如Caffe,Pytorch和TensorFlow。
正是因為具備相對良好的編程環境,GPU成為目前最主流的深度學習硬體。英偉達公司發布的CUDA運算平台,是專門針對開發者提供的一種並行計算平台。開發者能通過CUDA平台使用軟體語言很方便得開發英偉達GPU實現運算加速。由於CUDA平台之前被廣泛認可和普及,積累了良好的編程環境,目前應用在人工智慧領域、可進行通用計算的GPU市場基本被英偉達壟斷。
現在,英偉達推出加速推理的TensorRT 3,可編程,支持所有框架,所有機器,可以想見,又會擴大另一大片市場。
從黃仁勛現場的介紹來看,TensorRT 3主要的功能是推理和加速,這與谷歌的TPU功能類似。
黃仁勛在現場說,神經網路的響應時間或處理延時會對服務質量造成直接影響。運行在V100上的TensorRT在處理頭像時刻實現7ms的延時,在處理語音時延時報道200ms,這是標準雲服務的理想目標。單靠CPU是無法實現的。上圖,藍色是CPU運行TensorFlow。
接下來黃仁勛介紹了AI 推理在數據中心的應用,最主要的是是降低成本,在這裡依然是與CPU直接作比較,他說,V100相較CPU加速了40倍。
提到省錢,黃仁勛說:「你買越多的GPU,你節省的錢就越多。」
原來,4個機架,160CPU,65KW
現在,1個機架就行了,節省50萬美元
黃仁勛來來回回將4個機架和1個機架的圖像進行對比,他說自己可以玩上一整天。「更少的空間,更少的主機,節省更多錢!」
How exciting is that!
Demo 圖像處理和聲音處理
為了展示TensorTR 3的性能,台上做了挺多展示。其中有《權力的遊戲》的展示,用語音搜索「冬天來了」,首先轉換成文字,然後直接跳到那一幀。語音到文字的轉換,龐大的視頻數據,幾乎沒有延遲,達到可以商用的程度。
黃仁勛說,有了TensorTR 3,將來我們不需要龐大的數據中心,更多樣的應用,「節省更多的錢」!
然後他宣布,中國AI五巨頭——阿里巴巴、騰訊、百度、京東、訊飛,都已經採用了英偉達的推理平台。
不僅如此,英偉達還與海康威視聯手,利用TensorRT,發布端到端的智能視頻解決方案,目標是直接從視頻中尋找答案。
海康威視的合作屬於智慧城市(AI CITY)的議題。在這方面,英偉達與大華、華為和阿里巴巴也有合作。
所有這些,都是希望用一個推理平台,解決不同類型的數據和應用案例的問題。
力推自動駕駛汽車變革
黃仁勛展示了圖中是英偉達與空客正在實際進行的項目。分為三部分,車架、車廂和自動飛行的機翼——將來,你能自動駕駛到一個地方,然後讓機翼來接你,自動飛行到另一個地點。
英偉達的自動駕駛平台,支持L3、L4、L5。
感知(用雷達、激光雷達和其他感測器感知周圍環境),推理(定位),規劃(比如如何行車變換軌道)是自動駕駛三大核心要素,會議現場展示了英偉達自動駕駛平台的效果。
145家初創公司基於NV Drive開發自動駕駛平台,包括Pony.ai、圖森和景馳等。
自主機器新紀元:京東X 選擇Xavier實現自主機器
黃仁勛說,自動駕駛汽車的根本的目標是「避免碰撞」,因此即使起影響巨大,但技術上卻是自動機器當中最簡單、最容易實現的。
黃仁勛說,下一個AI時代,是AI離開雲端,走入與人類交互的機器中來。
接著,黃仁勛發布了全球首款自主機器處理器 Xavier,將在2018年第四季度推出。
Xavier實時運行並行演算法,推理周圍世界,最後進行規劃。這是世界上最複雜的SoC——將超級計算機變為一張晶元。
黃仁勛介紹,這款晶元是世界第一,英偉達幾年前開始做這個項目,代號Project Xavier。
接著,他宣布京東X與英偉達合作,使用Xavier晶元,實現自主機器。
還沒有完!
英偉達還發布了一個能夠實時訓練機器人的模擬環境 Isaac Lab。Nvidia虛擬現實模擬器實驗室來構建機器人 isac lab 演示了如何玩曲棍球和高爾夫。
Tesla V100 GPU、可編程推理平台TensorRT 3,自動駕駛平台、自助機器超級Soc Xviare,還有虛擬機器人訓練環境,可以說,英偉達的AI布局全線鋪開,沒有放過任何一塊。
除了深度學習,黃仁勛在這次GTC上還頻頻提到遷移學習、VR。其中,最顯眼的無疑是TensorRT 3。推理是一個巨大的市場,潛力無限,而英偉達已經用TensorRT 3搶佔先機,並且已經佔據了中國AI五巨頭。
【號外】新智元正在進行新一輪招聘,飛往智能宇宙的最美飛船,還有N個座位
點擊閱讀原文可查看職位詳情,期待你的加入~
※英特爾研發神經元晶元,模擬人腦自學習能效提升1000倍
※「黃仁勛北京演講」GPU帝國啟幕,發布可編程AI 推理加速器TensorRT 3(PPT實錄)
※自然語言處理終極方向:深度學慣用於自然語言處理的5大優勢
※「遷移學習」6張圖像vs13000張圖像,超越2013 Kaggle貓狗識別競賽領先水平
※「阿法狗只是小兒科」5年內,AI將問鼎星際爭霸,橫掃人類玩家
TAG:新智元 |