當前位置:
首頁 > 科技 > 英偉達聯手Arm迎戰高性能計算!GPU加速卡將支持Arm架構

英偉達聯手Arm迎戰高性能計算!GPU加速卡將支持Arm架構

智東西(公眾號:zhidxcom)文 | 心緣

智東西6月17日消息,在今日於德國舉行的ISC 2019國際超算大會上,美國晶元巨頭英偉達(NVIDIA)今天宣布其用於超級計算機的加速平台將對Arm架構CPU支持,即計劃利用其晶元與使用Arm架構的CPU協作打造超級計算機。

這為高性能計算(HPC,High Performance Computing)行業開闢了一條全新的路徑,為能夠實現「exascale」性能的超級計算機鋪平道路,有助於構建具有極高能效水平的百萬兆級AI超級計算機。

NVIDIA表示,將於年底前向Arm生態系統提供全堆棧的AI和HPC軟體。堆棧優化完成後,NVIDIA將能為包括x86、POWER和Arm在內的所有主流CPU架構提供加速。

此外,NVIDIA還於今日推出了全球排名第22快的超級計算機DGX SuperPOD,據稱可滿足自動駕駛車輛部署計劃的大量需求。

一、NVIDIA將支持Arm CPU

NVIDIA一直是數據中心市場的佼佼者,其GPU晶元被用於與英特爾、IBM等公司的中央處理器(CPU)協同工作,完成大規模並行計算的加速任務。

在超大規模數據中心和高性能計算的伺服器市場,英特爾x86處理器長期佔據主導地位,隨後IBM Power晶元則成為後起之秀,而IBM的Power處理器在近年亦出現翻盤之勢,主要在中低端伺服器晶元市場分食x86的市場蛋糕,而Arm則試圖在中低端伺服器市場贏得更多的市場份額。

英國Arm公司是全球領先的半導體知識產權(IP)供應商, 於2016年被日本軟銀集團以234億英鎊(約合310億美元)高價收購。

不同於英特爾和IBM,Arm公司本身不直接從事晶元生產,而是依靠給晶元廠商們提供底層的處理器架構授權,從而獲得授權費用和一定版稅。

蘋果、三星、高通、華為、飛利浦等各大晶元廠商們都從Arm那裡購買授權,全球絕大多數智能手機和平板電腦等攜帶型消費電子產品均採用Arm架構。

和其他架構相比,Arm的一大特色在於出色的能效,它能夠為超級計算機提供開放式架構,因此用戶可以添加各種有益於超級計算的有趣技術,例如緊密集成。

NVIDIA副總裁兼加速計算總經理Ian Buck稱,通過將Arm CPU與Tesla GPU相結合,使用者可以完成大量的HPC模擬和AI所需的繁重計算,並且Arm可以使用快速單線程來執行CPU。

Arm已經在世界各地的許多HPC中心獲得了越來越多的關注,此前採用Arm架構的exascale系統沒有GPU,如今NVIDIA新增對Arm支持的舉動並不令人意外。

Buck表示,從技術角度來看,用Arm製造超級計算機的項目將是一次「重舉」。據他介紹,現在是NVIDIA宣布支持Arm CPU的最佳時期,他們花了兩年的時間來完成所有這些工作,希望在今年年底之前發布第一個完整版本。

NVIDIA支持Arm CPU後,將為研發超算的研究人員們提供了除英特爾和IBM外的第三種選擇,並使得研發者可以通過這種方式獲得更多的自主控制能力。

二、年底前向Arm生態系統提供全堆棧的AI和HPC軟體

HPC市場預計到2025年價值將達到596.5億美元,NVIDIA一直是推動高性能計算髮展的重要力量。今日發布的Green500排行榜,在全球最節能的25款超級計算機中,有22款都得益於NVIDIA的支持。

之所以能有如此成績,源自NVIDIA的多項核心技術。採用NVIDIA GPU的超級計算機,能夠將繁重的處理作業卸載至更為節能的並行處理CUDA GPU之上,另外NVIDIA與InfiniBand和乙太網互連供應商Mellanox合作優化整體超級計算集群的處理,NVIDIA還在SXM 3D封裝技術和可實現極密集型擴展節點的NVIDIA NVLink互聯技術方面投入大量研發。

NVIDIA對基於Arm的HPC系統的支持建立在雙方超過10年的合作基礎之上。NVIDIA的幾款用於攜帶型遊戲、自動駕駛汽車、機器人和嵌入式AI計算的系統級晶元產品都採用了Arm。

據悉,NVIDIA將於年底前向Arm生態系統提供全堆棧的AI和HPC軟體,該堆棧為600多個HPC應用程序和所有AI框架提供加速,其中包括所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟體開發工具,如支持OpenACC的PGI編譯器和性能分析器。

NVIDIA創始人兼首席執行官黃仁勛表示:「超級計算機是促進科學發現的重要工具,建立百萬兆級超級計算將能夠極大地擴展人類知識的邊界。隨著傳統計算規模擴展步伐的停止,功率也將成為所有超級計算機的限制因素。NVIDIA CUDA加速的計算和Arm的高能效CPU架構的相結合,將助力HPC社區實現大幅提升,以達到百萬兆級。」

「Arm正在與生態系統合作,為基於Arm的SoC帶來前所未有的計算性能提升,並實現百萬兆級功能,」Arm首席執行官Simon Segars表示,「HPC社區已經部署了Arm技術,以應對全球最複雜的研究挑戰。通過與NVIDIA合作,將CUDA加速引入Arm架構,這一舉措對於HPC社區來說,可謂是一大重要里程碑。」

三、在HPC行業及Arm生態系統,部分業內人士這麼看

Ampere Computing董事長兼首席執行官Renee James認為,其客戶正致力於尋求基於Arm的高性能處理器,來運行其最苛刻的工作負載,因此很高興NVIDIA正在將CUDA和圍繞NVIDIA所建立的豐富的生態系統引入Arm。

Arm生態系統另一位領導者——Atos的高級執行副總裁、大數據和網路安全部門負責人Pierre Barnabé亦表示,這一重要發布將加速AI和模擬世界的融合,同時優化能效。

Cray總裁兼首席執行官Peter Ungaro表示,其Cray系統管理和編程環境(編譯器、庫和工具)已經能夠在XC和未來的Shasta超級計算機上支持Arm處理器,將CUDA和CUDA-X HPC和AI軟體堆棧用於Arm平台,並將其與Cray系統管理和編程環境緊密集成。

此外, CSC、 EPI、HPE、Jülich超算中心、Marvell等均表態稱,看好將Arm架構與NVIDIA GPU相結合,認為它將有助於優化HPC和AI工作負載,匹配未來百萬兆級前(pre-exascale)解決方案的構建模塊,助力HPC行業解決日益不可持續的功耗水平問題。

在高校與科研機構的一些專家也發表了看法,比如理化學研究所計算科學研究中心負責人、東京工業大學教授Satoshi Matsuoka。

「過去十年中,我們一直積極率先在大型超級計算機上採用NVIDIA GPU,包括日本最強大的ABCI超級計算機,」Satoshi Matsuoka說,「理化學研究所計算科學研究中心目前正在致力於開發下一代基於Arm的百萬兆級Fugaku超級計算機,我們很高興聽到NVIDIA的GPU加速平台很快將能夠用於基於Arm的系統。」

四、全球第22快的超算DGX SuperPod

今日,NVIDIA還推出了全球排名第22快的超級計算機:DGX SuperPOD。據NVIDIA人工智慧基礎設施副總裁Clement Farabet表示,它提供的AI基礎設施可滿足公司自動駕駛車輛部署計劃的大量需求。

據介紹,SuperPOD包含96個DGX-2H單元和1536個V100 Tensor Core圖形晶元,與Mellanox和NVIDIA的NVSwitch技術相互連接。

它比同等頂級超級計算系統小約400倍,組裝只需三周,同時提供9.4 petaflops的計算性能。在實際測試中,它試圖在不到兩分鐘的時間內訓練基準AI模型ResNet-50。

「很少有AI挑戰與訓練自動駕駛汽車一樣苛刻,這需要對神經網路進行數萬次重新訓練,以滿足極端的精確度需求,」Farabet說,「沒有像SuperPOD那樣的大規模處理能力的替代品。」

客戶可以從NVIDIA的任何DGX-2合作夥伴處購買SuperPOD的全部或部分內容。

結語:進一步推動HPC擴展性能和優化能效

如果NVIDIA按照預期,在年底前為Arm生態系統提供全套的人工智慧和高性能計算(HPC)軟體,這將為超算研發者們提供除x86、Power之外,另一種更具開放性的選擇。

此外,從眾多業內人士的表態來看,這一重要發布對於基於Arm打造超級計算機的研發機構或企業而言,將是進一步擴展其超算性能,推動高性能計算提供更出色能效的重要推動力。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 智東西 的精彩文章:

三星高通華為鏖戰Wi-Fi 6!比5G商用落地更快的肥肉
我是不是遇到了假5G?北京五地實測,5G網路真相

TAG:智東西 |