當前位置:
首頁 > 最新 > 核彈教父勢不可擋:英偉達發布8萬核桌面機,售價一度150萬美元…

核彈教父勢不可擋:英偉達發布8萬核桌面機,售價一度150萬美元…

在經典計算技術的時代,推動進步的是英特爾和由它發揚光大的摩爾定律。2012 年之後,當計算技術進入了名為「深度學習」的全新時代,創辦於 1993 年的英偉達卻成為了強勢黑馬。

「英偉達通過深度學習平台所取得的創新,許多都已成為世界標準。我們以遠超摩爾定律的速度推動計算性能飛速增長,促進健康、交通、科學探索等無數領域的突破。」在一場演講中,創辦人兼 CEO 黃仁勛 (Jensen Huang) 自豪地對數千名觀眾表示。

去年,站在同一個舞台,黃仁勛說他一直想要找到摩爾定律之後的路。而以神經網路為基礎的人工智慧,其爆髮式發展到了 2018 年已經過去了五年。而在這五年里,GPGPU(通用圖形處理器)成為了人工智慧研發的利器,在計算密集型的深度學習任務上獨步天下。英偉達指出,和五年前的 Ferml GPU 架構相比,最新一代的 Volta GPU 架構的浮點計算能力提升了25 倍

「摩爾定律 10 年 5 倍,」黃仁勛說,「這就是我們超越摩爾定律的證明。」

英偉達開發者社群的擴張迅速,印證了黃仁勛大膽的聲明。該公司統計,GPU 開發者在今年將達到 82 萬人,比五年前增長了 5 倍;在英偉達 GPU 上開發必備的並行計算架構工具包 CUDA,下載數量超過了 800 萬,其中約一半是在過去一年裡下載的。不僅如此,該公司提供的 GPU 加速技術還被世界上大量超級計算機協同採用,其 Volta GPU 為美國的 Summit 和 Sierra 兩大超算增加了大約 100 PFLOPS(千萬億次浮點計算能力)。

在美國時間 3 月 27 日的英偉達 GPU 技術大會 (GTC 2018) 上,該公司帶來了多個在深度學習、自動駕駛和機器人領域足以掀起浪潮的新產品。其中最為重頭的,則是一年一度的新核彈級顯卡——這次,並不是 GTX 11 系列,也不是傳聞甚囂塵上的「礦卡」,而是一台被黃仁勛稱為「桌面超級計算機」的工作站:NVIDIA DGX-2

DGX-2 是一台專門用於人工智慧訓練和/或推理任務的桌面計算機:

這是它的內部結構:

你可以看到,在圖中 1 和 2 的位置看起來是很多塊晶元。其實他們是英偉達的 Tesla V100 Volta 架構 GPGPU,單枚算力達到雙精度 7.8 TFLOPS(萬億次浮點計算)、單精度 15.7TFLOPS、深度學習 125TFLOPS。

DGX-2 單機箱安裝了 16 枚 V100,總體性能達到了驚人的 2PFLOPS——業界第一台超過千萬億次浮點計算能力的單機箱計算機——稱它為超算或許並不浮誇。

但 DGX-2 的算力並非靠堆疊出來,如果它們之間不能實現高帶寬的數據互通則無意義。

時間倒回兩年前,英偉達有意在深度學習的設備市場上對英特爾發起直接挑戰,推出了 Pascal 架構的 P100 GPGPU。在當時,主流伺服器 PCIe 匯流排介面的帶寬和時延,已經無法滿足英偉達的需求。於是它們開發出了一個新的設備內互聯標準,叫做 NVLink,使得帶寬達到了 300 GB/s。一個 8 枚 GPGPU 的系統里,NVLink 大概長這樣:

然而 NVLink 的標準拓撲結構在理論上最多支持 8 枚 顯卡,仍不足以滿足英偉達對於新系統內置更多顯卡的需要。於是在 NVLink 的基礎上,英偉達開發出了一個名專門在顯卡之間管理 NVLink 任務的協處理器,命名為 NVSwitch。這個元件在 DGX-2 上,讓 16 枚 GPGPU 中兩兩之間實現 NVLink 互通,總帶寬超過了 14.4 TB

這一數字創造了桌面級電腦內匯流排介面帶寬的新高,但實現它的目的並非跑分,而在於 DGX-2 可以 1)更快速地訓練一個高複雜度的神經網路,或 2)同時訓練大量不同結構的神經網路。

英偉達 CEO 黃仁勛,背景是 NVSwitch 示意圖


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 pingwest中文網 的精彩文章:

三年做到百億美金,華為瞄準了智能家居
陳睿發公開信:想看到國產動畫、遊戲受到世界範圍歡迎

TAG:pingwest中文網 |