英偉達GTC大會:黃仁勛現場秀AI跳舞 公布DGX-2H
來源:內容整理自互聯網,謝謝。
11月21日上午消息,NVIDIA GTC(GPU Technology Conference)今日在中國蘇州舉辦,NVIDIA創始人兼CEO黃仁勛(粉絲昵稱「老黃」)宣布了一系列英偉達產品(RAPIDS機器學習平台、首款圖靈架構的Tesla T4 GPU、超高性能計算機HGX-2、英偉達GPU雲、Xavier系列晶元、自動駕駛)的合作新進展。
比如,美團/菜鳥/京東基於英偉達AGX晶元打造無人物流/外賣小車、華大基因用RAPIDS平台進行癌症基因檢測、沃爾沃、小鵬汽車、奇點汽車等加入英偉達自動駕駛大家庭、網易「逆水寒」成為首個支持RTX光線追蹤的中國遊戲等等。
在現場,老黃還秀了一把自己的「AI跳舞」,通過學習邁克爾傑克遜的舞步,AI可以生成一個跳著同樣舞步的黃仁勛。
HGX-2應用進展
黃仁勛在發布會上宣布其HGX-2伺服器平台已被廣泛採用。該加速伺服器平台適用於AI深度學習、機器學習和高性能計算。
在GTCChina上最新採用HGX-2的企業包括:百度、騰訊、浪潮等等,浪潮是中國首家構建HGX-2伺服器的廠商,浪潮AI超級伺服器AGX-5專為解決當前AI深度學習和高性能計算的性能擴展難題而設計。聯想、華為、曙光也已宣布成為NVIDIAHGX-2雲伺服器平台的合作夥伴。
此外,甲骨文上月宣布其計劃為甲骨文雲基礎設施部署NVIDIAHGX-2平台,並將採用裸機和虛擬機兩種實例,便於顧客輕鬆訪問統一的HPC和AI計算架構。
NVIDIA的HGX-2在單節點中能夠提供2千萬億次的計算性能,據黃仁勛介紹,與僅使用CPU的伺服器相比,它將AI機器學習工作負載的運行速度提升近550倍,將AI深度學習工作負載的運行速度提升近300倍,將高性能計算工作負載的運行速度提升近160倍。
HGX-2雲伺服器平台融合了高精度FP64和FP32,可實現精確高性能計算;同時也融合了更快速的低精度FP16和INT8,可實現深度學習和機器學習。
計算性能方面,HGX-2具備NVIDIANVSwitch互聯結構等功能,將16個NVIDIATeslaV100TensorCoreGPU連接到一起,形成一個巨型GPU,能夠提供2千萬億次的AI性能。HGX-2還具有0.5TB內存和16TB/s總內存帶寬。
GPU伺服器升級:16塊450W的Tesla V100
NVIDIA今天發布了升級版的GPU計算伺服器「DGX-2H」,和上代DGX-2一樣配備多達16顆Tesla V100 GPU,但熱設計功耗從350W開放到450W,性能更上一層樓。Tesla V100是迄今為止最強悍的GPU計算卡,核心採用12nm工藝製造,集成210多億個晶體管,面積達創紀錄的815平方毫米,架構基於Volta(伏特),內置5120個FP32單精度浮點核心、2560個FP64雙精度浮點核心、640個Tensor張量核心,搭配16/32GB HBM2顯存。
基於Tesla V100的第一代計算伺服器DGX-1隻有八塊卡,搭配雙路Xeon E5-2600 v4,第二代的DGX-2則有16快卡,同時各方面全線升級,比如配備雙路Xeon Platinum 8168 24核心處理器。
DGX-2H仍然是16塊Tesla V100,都是32GB HBM2顯存,總計512GB,而隨著熱設計功耗的放開,頻率有所提升(具體未公布),張量計算性能從1.92PFlops提高到2.1PFlops(幅度約9%),不過半單雙精度性能未公布。
另外,新系統處理器升級為兩顆24核心的Xeon Platinum 8174(不在官方公開型號之列或為定製版),網路從雙路25GbE升級為雙路100GbE,內存還是最大1.5TB DDR4,存儲30-60TB NVMe。
整機功耗從10千瓦增至12千瓦,而且重量增加了20磅(約9千克),很可能是換了新的散熱系統。
價格沒說,但必然高於上代的39.9萬美元。
福利
免費拿4.7G精選資料+30天學習網VIP
※SUMCO晶圓廠繼續停工,股價創1年來新低
※丁文武:發展半導體產業要「補短板、強長板」
TAG:摩爾精英 |