「全球最大GPU」、全VR自動駕駛路測,快來看「推銷狂人」黃仁勛發了啥
雷鋒網按:Buy more GPU,save more money!(買越多GPU,省越多錢!)上面這句話,英偉達CEO黃仁勛在整場GTC中足足重複了9次(可能還有數漏的)。
作為英偉達每年最重要的大會,一年一度在美國舊金山舉辦的GTC一直都是英偉達技術實力最集中的展示。這些技術實力往往覆蓋多個方向,大家關注最多的無疑是「新核彈」,更通俗的說——全新的GPU架構、更強大的GPU等等。
事實上,他們都「缺席」了本次GTC 2018。或許是受此影響,再加上美股大盤整體下挫,英偉達股價在整場GTC進行期間不斷下滑,截止發稿整體跌幅已經超過7%。
這樣的股價表現,不由得讓人們心中浮現一個問題——這次GTC真的有那麼糟么?(事實上,有部分友媒已經開始發文看衰英偉達了,但這樣的判斷真的是對的么?)為了解答這個問題,我們首先有必要先重新一下黃仁勛在本次GTC Keynote中提及的各種內容。
看似槽點、其實亮點:「世界最大的GPU」
正如上文所提到的,本次GTC之上沒有像之前大家預期的那樣,發布全新的GPU架構,以及傳統定義上的「核彈」(單顆GPU、或者單顯卡封裝的產品)。
但英偉達實際上拿出了一款被黃仁勛自己稱為「全球最大的GPU」的新產品——DGX-2。
組件強的不像話的DGX-2
去年發布Volta架構之時,英偉達實際上已經將DGX-1中原有的P100 GPU換成了V100 GPU。原有的V100 GPU已經很強大了,那麼想要更強大就只剩一種「簡單而又粗暴」的方法了:再加幾顆V100 GPU,這也是為啥在DGX-2伺服器加速器中你會看到有16顆V100 GPU。
16顆GPU中任何兩顆都能以300GB/s進行數據交換
GPU數量是翻倍了,但要想將他們發揮出真正的威力,英偉達還祭出了一項升級版的技術NVLink Switch(簡稱NV Switch)。這項技術的目標只有一個:讓DGX-2中的16顆V100 GPU能夠化身為一顆巨大的「GPU」運作。
根據英偉達副總裁和DGX系統產品經理Jim McHugh介紹,因為NVswitch技術,DGX-2中的16顆GPU之間都能夠直接1對1連接傳輸,每顆GPU擁有高達50Gb/s的帶寬,同時最多支持18顆GPU相互連接,讓整個系統的吞吐性能達到驚人的900Gb/s。
現場減價「促銷」
最後是整個系統的售價,黃仁勛現場表示展示用的這套實驗產品實際上價值250萬美元,然後先放出了一個150萬美元的售價,在最後一秒直接自己「砍到」了39.99萬美元。
高舉著兩倍顯存的Quadro GV100加速器的黃仁勛
值得一提的是,DGX-2中使用的雖然還是V100 GPU,但它發生了一點小變化——原有的4顆4GB HBM2顯存,升級為4顆8GB HBM2顯存,也讓V100 GPU的整體顯存大小升級為32GB。(GPU其他參數,包括顯存位寬、帶寬均沒有改變。)而在DGX-2中,16個V100 GPU中各自擁有的32GB顯存都將連接到一起,你甚至可以將它看成一整個512GB的顯存空間。
那麼究竟這對於用戶來說有多大的影響呢?英偉達官方的原話是:「顯存容量增加,讓運行更深、更大的深度學習模型成為可能,同時也會提升深度學習的表現。對於內存大小比較敏感的應用,最多能夠提升50%的實際表現。」
黃仁勛:對於他這樣的工程師來說,DGX-2太「sex」了
拋開DGX-2的性能本身、拋開DGX-2在各種深度學習解決方案的性價比等等,英偉達在DGX-2上所採取的新策略或許更值得思考:並行架構先天擁有優秀的擴展性,英偉達似乎在傳統的GPU架構、晶元製程之外找到了一個延續性更強的性能增長路線。
當然從另外一個方面來講,通過數量的疊加,設備的性能的確可以快速增長,但如何實現數塊GPU之間的大量數據吞吐、同時保證這些新添加的數據傳輸能力不會造成太高的成本、以及更多的功耗,將會是這一種路線的挑戰。
高速、高效,讓自動駕駛路測走向VR時代Drive Constellation的實際系統組成(下圖)
在眾多的人工智慧應用當中,自動駕駛絕對是英偉達最堅定的一個方向。在今年GTC大會的演講上,英偉達創始人兼CEO黃仁勛又為自動駕駛行業帶來了一個全新的解決方案——Drive Constellation。
Drive Constellation是一種使用虛擬現實(VR)技術的自動駕駛的模擬器,它讓自動駕駛的開發者們在數據中心打造一個虛擬世界,並對自動駕駛車輛的演算法進行數十億英里的測試。英偉達方面希望,通過自身強大的圖像渲染和虛擬現實技術,讓演算法在虛擬環境中的測試無限接近於真實場景。
在Drive Constellation中模擬夜間自動駕駛
它的組成結構也非常簡單,外觀看上去就是兩台DGX-1伺服器。不過兩台伺服器中的內容不太一樣:一台配置了數張英偉達的專業顯卡,另外一台則裝著和自動駕駛車輛相同的英偉達DRIVE PX平台。
整個系統的工作方式也非常簡單,配置了專業顯卡的伺服器結合高清地圖、車輛行駛模擬演算法、以及天氣、光照等一系列條件,經由專業渲染形成虛擬的駕駛環境。然後這些數據以類似於真實感測器的格式被直接發送到裝載著Drive PX平台的伺服器中,Drive PX平台根據這些數據,執行相應的自動駕駛演算法,並且最終將車輛的操縱輸出返回到虛擬化的伺服器中,形成循環。
根據英偉達官方的說明,兩台伺服器在1秒的時間內可以進行30次這樣的循環。英偉達還表示,這套系統能夠模擬不同的天氣,如暴風雨雪天氣、一天中不同時刻致盲的炫光、夜晚有限的視野以及不同類型的路況和地形。同時,它也可以模擬危險的路況以測試自動駕駛汽車的反應能力。然後開發者可以對自動駕駛的演算法進行改進和完善。
英偉達汽車部門高級主管Danny Shapiro對此表示:「這對於行業來說是一個非常有價值的工具,它能夠加速自動駕駛的研發進程。」黃仁勛在演講中也說了一個數字:10000套Drive Constellation系統,一年就能夠路測30億英里。
據雷鋒網了解,Drive Constellation將在今年第三季度推向市場,並為英偉達的早期客戶提供服務。
在英偉達的生態系統中,目前已經彙集了超過370個不同的公司。大家將合力開發自動駕駛技術。雖然這個數字反映了英偉達陣營的龐大,但這個生態中的 370 個合作夥伴並不都是汽車廠商。具體來說,這些合作夥伴包括乘用車,卡車、物流車和自動駕駛計程車等,一級供應商,自動駕駛初創公司、激光雷達公司、地圖公司等等。
通過這套虛擬現實的駕駛模擬器,英偉達完全可以將數量眾多的合作夥伴放到一個平台當中,加速自動駕駛技術研發、落地的進程,反過來鞏固英偉達自身硬體在自動駕駛領域的不可替代性。
持續滲透的TensorRT,不斷加速的AI版圖TensorRT也是一項英偉達去年發布的新技術,它的目標是將各種人工智慧架構的演算法,與英偉達各種架構的GPU相適配,通過二次優化演算法提升整體演算法在英偉達GPU上面運行的效率。
而在本次GTC之上,英偉達也拿出了最新版本的TensorRT 4,它最重要的特點就是更高的效率,根據英偉達官方的測試在多種人工智慧演算法在同一個伺服器上運行的時候,TensorRT 4能夠減少70%的硬體需求,同時還能在延遲方面提升190倍。
得益於軟硬體的提升,英偉達在AlexNet的訓練速度上5年間提升了500倍
相比性能方面的提升,此次TensorRT在業界支持方面的新進展其實更加值得關注。因為在去年TensorRT某種程度上已經是一個英偉達自己的人工智慧架構,而且是凌駕於幾乎所有人工智慧架構的終極架構。這對於之前希望通過培育人工架構、打造自由人工智慧生態的公司來說並不是好事。
令人驚喜的是,英偉達官方表示已經和Google達成合作,將在最新的TensorFlow 1.7版本中直接內嵌TensorRT,進而進一步加強TensorFlow架構在GPU中的表現。Goolge的工程總監Rajat Monga還特別表示,Google的TensorFlow團隊一直和英偉達保持著緊密的合作關係。
其他「一部分」重點內容:光線追蹤、醫療平台、自家GPU雲技術、自動駕駛路線圖、遠程VR駕駛- 英偉達RTX技術
RTX技術是目前市面上最強大的光線追蹤技術,可以對多種材質進行最接近真實的實時渲染,現場演示中還包括了比較複雜的動態場景。
- 醫療平台Clara
由人工智慧驅動的醫療平台Clara是英偉達的一次全新嘗試,現場的展示中,英偉達通過對一個二維的超聲波探測實時結果進行處理,直接精準還原患者體內臟器的活動,甚至可以直接算出心臟的容積、以及每次跳動的體積差異。
- 未來自動駕駛平台路線圖
Roadmap是半導體廠商常見的一種產品規劃手段,最出名的要數Intel已經失效的「Tick-Tock」。在本次GTC上,黃仁勛也分享了英偉達DRIVE系列產品的RoadMap策略——小尺寸的單晶元平台,然後通過晶元數量和GPU的添加獲得更強的性能,然後利用技術將更強的性能再次壓縮為小尺寸的單晶元平台,一次類推。
現場透露下一代單晶元平台代號為Orin。
- 基於Holodeck的遠程虛擬駕駛系統
打算用VR來做遠程駕駛的初創公司可能很崩潰。
雷鋒網總結:GPU的動力依舊強勁,英偉達不只是一家「性能驅動公司」回顧完現場的主要內容,自然也是時候再反過頭來看上文開篇的問題了。首先不得不提的就是人們對於GPU的期待,雖然在前幾年的歷程中,英偉達幾乎源源不斷地拿出更新、更強大的GPU晶元。但它終究也是半導體的晶元,同樣會受到製程的物理限制,單顆晶元的提升難度還將不斷提升。
但因為並行運算的原因,GPU實際上很容易進行橫向的拓展,此次GTC上發布的全新16顆V100 GPU的DGX-2加速器就是最好的證明。在利用合適的數據傳輸技術的前提下,GPU未來的動力增長依舊會「很強勁」。
另外一個要點實際上是英偉達在硬體之外所做的諸多工作,從針對各種人工智慧架構、演算法的持續優化,到完全VR化的自動駕駛路測,英偉達實際上在不斷為整個生態賦能,掃除一些關鍵性的障礙。這種能力,放眼人工智慧、自動駕駛這樣的領域,都是無人能及的。
毫無疑問,在2018接下來的日子裡,教主和他的英偉達,還將給我們帶來更多驚喜。
※萬字長文解析丨除了暴富傳說,區塊鏈還有什麼可能?(上)
※Overstock ICO受SEC審查,股價下跌4%
TAG:雷鋒網 |