當前位置:
首頁 > 科技 > 如果你有100萬美元AI預算:來看看Pure和Nvidia聯手打造的AIRI系統吧

如果你有100萬美元AI預算:來看看Pure和Nvidia聯手打造的AIRI系統吧

Pure Storage和Nvidia打造了一個融合的機器學習系統,以使用數百萬個數據點訓練人工智慧模型。

這個被稱為AIRI(AIRI-AI-Ready Infrastructure)的系統將Pure FlashBlade全快閃記憶體陣列與4個Nvidia DGX-1 GPU加速系統以及一對100GbitE交換機結合在一起。

該系統由Pure和Nvidia共同設計,據說在購買、部署和操作方面要比單獨購買和集成組件更容易更簡單,是標準化的融合基礎設施。

如果你有100萬美元AI預算:來看看Pure和Nvidia聯手打造的AIRI系統吧

AIRI是你數據中心所需要的

FlashBlade是Pure Storage的全固態存儲陣列,可快速訪問非結構化數據,這個4U系統包含15個垂直安裝的刀片或對象節點伺服器,每個刀片都有一個多核英特爾至強CPU和17TB快閃記憶體,總共255TB容量,或者數據縮減後523TB有效容量。每個刀片還包含一對ARM核心、一個FPGA、NVRAM和基於PCIe的網路。這絕對不是基於SSD的商用系統。

這是一個強大的並行訪問快閃記憶體陣列,在AIRI中必須配置超過160,000個GPU核心。

AIRI將數據提供給4台基於英特爾至強處理器、配有8個Tesla V100 GPU(與NVlink相連)的DGX-1系統。這些都是性能強大的GPU,每個配有5,120個CUDA核心,640個Tensor核心,16MB緩存和帶寬為900GB/s的16GB HBM2內存組。V100使用64位浮點運算的最大輸出功率為7.5TFLOPS,32位浮點運算為15TFLOPS。

除了32個V100之外,AIRI還有163,840個CUDA核心和20,480個Tensor核心。我們得知,AIRI提供了4個Tensor PFLOPS,一個方面是應用(機器學習任務)必須在容器中運行。

為了連接到外部世界,採用了若干個支持GPUDirect RDMA的Arista 100GbE交換機,這為使用PCIe的GPU和FlashBlades之間數據傳輸提供了直接快速的路徑。FlashBlade和DGX-1之間的介面是基於文件的:NFS over ROCE (RDMA Over Converged Ethernet)。

這裡使用了具體哪款Arista產品並未對外透露。

有兩個包含的軟體項目:

- Nvidia的GPU Cloud Deep Learning Stack。

- AIRI擴展工具包,它是一個配置驗證器和多節點訓練管理系統。

Pure表示,這款軟體將可以幫助數據科學家在幾個小時內——而不是數天或數周——啟動並運行機器學習項目。

在機器學習領域,AIRI的競爭對手包括HPE的Apollo 6500 gen-10系統和增強採用GPU的IBM AC922伺服器,AIRI看起來更強大一些。

HPE的Apollo 6500 gen-10使用單精度浮點數學運算的性能高達125 TFLOPS。同樣條件下單個V100大約可以達到15 TFLOPS,這意味著一個DGX-1的性能就可以達到大約120 TFLOPS,而AIRI則可以達到480 TFLOPS,不是一個量級的。

IBM的AC922支持多達6個Tesla V100 GPU,比單個DGX-1少2個,而AIRI有4個DGX-1,同樣地,和IBM系統不是一個量級的。

Pure表示,多個訓練任務可以並行運行,並且在AIRI上比其他系統完成地更快,運行時間減少到原來的1/4。

價格怎麼樣? Pure沒有提供價格信息,稱這取決於渠道供應商,但會一定程度上反映組件的成本。

計算一下,4個DGX-1大約是60萬美元。Arista交換機的成本在3,000美元以上,而FlashBlade的成本低於1美元/ GB,這意味著523TB的有效容量的成本將低於523,000美元。

所以這可能是一個百萬美元量級的系統,適合大型企業或專有客戶購買。該系統支持4個DGX-1,但可以從1個-2個DGX-1開始部署,降低前期成本。

目標客戶是那些需要運行大量大型機器學習任務、對數百萬數據項目進行模型訓練的組織。

每個DGX-1的功耗為3.2kW,因此在考慮存儲和網路以及英特爾計算晶元等因素之前,你的功耗已經接近13kW。

目前Pure已經通過特定經銷商合作夥伴提供AIRI,包括ePlus Technology、FusionStorm、GroupWare Technology、PNY、Trace3、World Wide Technology和Xenon等。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

Cloudian收購軟體定義存儲合作夥伴Infinity Storage
區塊鏈可能是可持續能源未來的關鍵

TAG:至頂網 |