一舉超越競爭對手?AMD全球首發7nm CPU/GPU
2018年11月6日,AMD公司於舊金山的Next Horizon技術大會上兌現了其對數據中心計算創新的廣泛承諾,詳細介紹了即將上市的旨在拓展現代數據中心性能的7nm計算和顯卡產品組合。在活動上,AMD分享了即將推出的「Zen 2」處理器核心架構的全新細節,詳細介紹了其基於「Chiplet」的革命性 x86 CPU設計,推出了7nm AMD Radeon Instinct MI60圖形加速器,並首次公開展示了其下一代7nm EPYC(霄龍)伺服器處理器,代號「Rome」。全球範圍內被全面和廣泛採用的雲平台翹楚AWS參加此次活動,並宣布在其最受歡迎的EC2里推出三款採用AMD EPYC(霄龍)的實例系列。
AMD總裁兼首席執行官蘇姿豐博士表示:「我們對數據中心硬體和軟體路線圖的多年投入, 推動我們的CPU與GPU被越來越多的雲計算、企業計算和高性能計算客戶採用。在接下來的季度里,隨著具有業內領先的7nm製程技術的、業界超級廣泛和強大的數據中心CPU與GPU產品組合的推出,我們相信這一趨勢將加速。」
全新的計算架構
AMD首次詳細介紹了即將推出的「Zen 2」高性能x86 CPU處理器核心,它是革命性的模塊設計方法的最新成果。該模塊化系統設計採用AMD Infinity Fabric互聯的增強版本,在單個處理器封裝內鏈接多片獨立的硅晶片(「chiplets」)。得益於先進的製造工藝,這種多芯處理器的「Zen 2」CPU核心採用7nm製程技術,而晶元的I/O部分則採用業已嫻熟的14nm製程技術,從而可以獲得更高的性能:在同等功耗下擁有更多的CPU核心;而與傳統的單片設計相比,生產成本又更低。
將這種全新的設計方法與台積電最前沿的7nm製程技術優勢相結合,「Zen 2」帶來了性能、電量消耗和密度的跨世代巨大提升,有助於降低數據中心的運營成本、碳足跡和散熱需求。基於屢獲殊榮的「Zen」核心的其他跨世代提升還有:
1.更優良的執行流水線,給計算引擎帶來更高的效率;
2.前後端改進 – 更優良的分支預測器,更出色的指令預取,重新優化的指令緩存和更大的運行緩存;
3.浮點增強 – 浮點寬度翻倍,增至256 bit,載入/存儲帶寬翻倍,增加了分發/收回帶寬,所有模式都能夠保持高吞吐量;
4.領先的安全性 – 硬體增強的Spectre(幽靈)漏洞修復,採用軟體遷移並強化在設計中,同時增加了內存加密的靈活性;
多款7nm AMD產品目前正在推進中,包括在此次活動上AMD詳細介紹和展示的下一代AMD EPYC(霄龍) CPU和AMD Radeon Instinct GPU;此外,AMD公司還透露其後續的基於7nm+ 的「Zen 3」和「Zen 4」 x86核心架構也都按計劃推進。
EPYC (霄龍)伺服器CPU的新動態
AWS計算服務副總裁Matt Garman 參會並登台宣布首批基於AMD EPYC(霄龍)處理器的Amazon Elastic Compute Cloud(EC2)雲實例立即上線。作為最受歡迎的AWS雲實例系列的一部分,由全新AMD EPYC(霄龍)處理器驅動的新服務具有行業領先的核心密度和內存帶寬,從而給通用型和內存優化型的工作負載帶來超高的每美元性能。AMD EPYC(霄龍)處理器的核心密度可以給M5a和T3a實例客戶提供計算、內存和網路資源之間的平衡,滿足網頁和應用伺服器、企業應用後端伺服器以及測試/開發環境中應用無縫遷移的需要。對於R5a實例客戶來說,AMD EPYC(霄龍)處理器的內存帶寬優勢特別適合內存內的處理、數據挖掘和動態數據處理。
AMD還透露了其代號為「Rome」的下一代EPYC(霄龍)處理器的新細節,並帶來了性能預覽:
1.處理器增強,包括最高達64個「Zen 2」核心,更高的每周期指令和計算領先、I/O和內存帶寬。
2.平台增強,包括行業首例支持PCIe 4.0 的x86伺服器處理器,每通道帶寬翻倍,顯著提升了數據中心加速器的性能。
3.與當前的AMD EPYC(霄龍)處理器相比,每個插槽的計算性能提升為2倍,每個插槽的浮點性能則為當前的4倍。
4.插槽與現在的AMD EPYC(霄龍)伺服器平台兼容。
AMD在活動中用兩個演示分別展示了其下一代EPYC(霄龍)處理器的性能和平台優勢:
1.一款提前生產的單路下一代AMD EPYC(霄龍)處理器在計算密集型的行業標準「C-Ray」測試中,性能超群。
2.行業首例x86 PCIe 4.0平台演示,展示了Radeon Instinct MI60處理器如何加速圖像識別。
代號為「Rome」 的下一代處理器現在已經給客戶提供樣片,預期將成為世界上首款高性能x86 7nm CPU。
全新的AMD 數據中心顯卡
AMD發布了全球首款7nm GPU和業內僅有的硬體虛擬化GPU:AMD Radeon Instinct MI60 and MI50,並計劃於今年第四季度上市。這兩款全新GPU均基於「Vega」架構,性能與靈活性都極為出色,專為機器學習以及人工智慧而設計,帶來更高水平的浮點性能,更高的效率和適合數據中心部署的全新特性。活動上用旗艦級的AMD Radeon Instinct MI60進行了實時訓練、推理和圖像分類的現場演示。
除了新硬體的發布,AMD還公布了ROCm 2.0,一款專為加速運算而生的開源軟體平台的新版本,包括了新的數學庫、更廣泛的軟體框架支持和優化的深度學習運行。ROCm 2.0也已針對Linux內核發行版進行了升級,將ROCm的可用性擴展至數以百萬的Linux開發人員和用戶。專為規模用戶而設計,ROCm使客戶可以在開放環境中部署高性能、高能效的異構計算系統。