AMD全球首發7nm CPU/GPU,一舉超越英特爾和英偉達?
雷鋒網消息,繼全球首款7nm手機處理器之後,同樣基於台積電7nm製程的CPU和GPU產品也正式發布。11月7日,AMD在美國舊金山的Next Horizon會議上發布了全球第一款7nm 代號「Rome」(羅馬)的第二代EPYC霄龍CPU處理器以及Radeon Instinct MI60/MI50的GPU計算卡。
打開今日頭條,查看更多精彩圖片7nm Rome(羅馬)第二代EPYC霄龍處理器
首發7nm CPU和GPU
AMD代號為Rome的第二代EPYC霄龍處理器基於Zen2架構,Rome EPYC採用特殊設計的架構,每顆處理器有8個CPU 裸片,每個裸片內集成8個物理核心,共64個。同時為了更好地協調如此眾多CPU核心的協同工作,還專門設計了一個I/O裸片,放置在中央位置,專門負責輸入輸出控制,不過I/O裸片用14nm工藝製造。Rome處理器有8通道DDR4內存控制器,每個插槽支持最高4TB DRAM。
Rome EPYC也是第一個支持PCIE 4.0技術的伺服器級CPU,支持128個PCIe 4.0,帶寬通道數翻番,可提升加速器性能,搭配同樣支持PCIE 4.0技術的全新加速卡Radeon Instinct MI60,AMD表示可以帶來前所未有的加速性能。當然,Rome EPYC也是全球第一款採用7nm工藝的數據中心處理器。目前Rome EPYC更詳細的參數暫未公布,AMD預測Rome EPYC性能將因核心數量的增加而翻倍,浮點性能也將因為IPC架構的改進和核心數量的增加兩倍。
兼容性方面,Rome EPYC與現有的Naples,以及下一代的Milan都將保持兼容,這可以簡化基於AMD處理器的伺服器開發,也能讓伺服器公司把現有的設計用在未來的伺服器當中。進度方面,AMD正在向伺服器製造商提供Rome EPYC樣品,計劃在2019年推出產品,但具體時間尚未公布。亞馬遜AWS計算副總裁Matt Garman表示,基於AMD霄龍晶元的R5和M5實例產品今天就可使用,T3實例將在未來幾周上線,並重點強調了幫助客戶運行最常見應用程序時節省成本的特點。
GPU方面,AMD在今年Computex 2018上公布了7nm Radeon Vega GPU,雷鋒網《AMD搶先推全球首款7nm GPU,但能否按時出貨?》有詳細介紹,不過第一款正式發布的7nm GPU產品並不是Radeon RX遊戲顯卡,而是Radeon Instinct計算卡。AMD同時發布了Radeon Instinct MI60/MI50,均基於7nm工藝的Vega架構,得益於7nm工藝,Radeon Instinct計算卡集成132億個晶體管,比目前14nm Vega 的125億個晶體管增加了6.4%,核心面積為331平方毫米,比現在的484平方毫米縮小了31.6%。據稱,在同等功耗下,新核心性能提升超過25%,同等頻率下新核心功耗降低50%。
Radeon Instinct顯存搭配最多32GB HBM2,帶寬達1TB/s,內建ECC糾錯。同樣,7nm Vega也是世界首個支持PCIE 4.0技術的GPU,雙向帶寬64GB/s,藉助帶寬高達100GB/s的Infinity Fabric系統匯流排,支持4路GPU並行,雙路性能提升99%,4路比單路提升298%,8路比單路提升664%。
AMD 7nm Radeon Instinct 計算卡
在加速功能上,7nm Vega計算卡在幾個關鍵領域與Vega10有所不同,7nm Vega支持半速率雙精度,同時支持新的低精度數據類型。具體看,MI60 FP64雙精度浮點最高為7.4TFlops,FP32單精度最高為14.7TFlops,INT整數最高為118Tops,相比於同樣Vega 10核心的MI25專業性能提升8.8倍。
還有值得注意的是,新的GPU還包括一對片外Infinity Fabric鏈路,允許Radeon Instinct卡通過相干鏈路直接相互連接。由於每個GPU只有2個鏈接,因此AMD的拓撲選項僅限於環上的變化,這意味著4路配置的GPU不能全部直接相互通信。另外,AMD仍堅持使用PCIe卡,沒有像NVIDIA一樣的定製夾層式卡,所以這些卡需要通過頂部的橋接器連接。
為彌補AMD在軟體方面的不足,AMD宣布了開源計算平台ROCm 2.0,並繼續承諾完全開源。進度上,Radeon Instinct MI50將於今年第四季度上市,MI60將在明年一季度上市。
7nm的勝利?
7nm無疑成為了業界關注的焦點,不過AMD總裁兼首席執行官蘇姿豐博士(Lisa Su)此前已經多次談到AMD的7nm進展。在此次Next Horizon會議上,AMD CTO Mark Papermaster表示,AMD在7nm上豪賭了一把,首先是相信能把7nm做出來,其次是認為7nm將成為產業關鍵節點,並持續很長一段時間。AMD最初的目標是用自己的7nm和英特爾10nm競爭,至少打成平手,但沒想到AMD先做出了7nm,並將成為在新節點上最先推出產品的公司。
除了已經公布7nm架構和產品,AMD還表示明年銳龍、霄龍將全線轉向7nm工藝的Zen2架構,接下來將是7nm+升級版工藝的新架構Zen3。不止於此,AMD還首次披露Zen4架構正在設計中。Papermaster也強調了AMD路線圖的重要性以及實現路線圖的能力和決心,他表示Zen2架構晶元正在流片,Zen3預計在2020年使用7nm+製程,Zen4開發已接近尾聲。Zen4是否有機會用上5nm?
一舉超越英特爾和英偉達?
在Next Horizon會議上發布7nm EPYC的時候,AMD用一顆Rome EPYC(64核心)與兩顆Skylake Xeon 8180M(56核心)同時渲染1080p/QuadHD/4K圖像對比,結果成績分別是28.1秒和30.2秒,AMD更勝一籌。GPU方面,AMD擁有GPU最快配置的1TB/S全內存帶寬,甚至超過NVIDIA旗艦產品GV100 GPU。這是否意味著AMD憑藉著7nm一舉超越了英特爾和英偉達?
雷鋒網在《AMD的7nm處理器樣品出鍋了,不過似乎對Intel威脅不大》一文中已經提到,國外論壇HardOCP上的一位壇友mockingbird爆料稱RTG(Radeon Technology Group)已經收到首款Zen 2架構7nm處理器的樣品,但測試樣品的基礎/睿頻頻率是4.0/4.5GHz,要比目前Ryzen 7 2700X(3.7/4.1GHz)高一些,但與英特爾8700K 4.7GHz的睿頻頻率有差距,更不及未來9800K/9900K的5GHz。雖然AMD未來還有繼續打磨提高頻率的空間,但從初代Ryzen測試樣品與正式發售產品的頻率對比來看,提升空間應該不大。
另外,硬體以及7nm並不就意味著處理器的成功,指令集也十分關鍵。據了解,AMD先有了SSE5指令集,然後英特爾推出了AVX指令集,接著AMD又效仿AVX,但保留SSE5中的FMA4、CVT16和XOP指令;然後英特爾效仿AMD加入CVT16,但改名為F16C,隨後又加入FMA4簡化後的FMA3和AVX2.0指令;AMD只得跟風,加入FMA3,承認F16C,將來還要加入AVX2.0。可以看到AMD在指令集方面的競爭非常激烈。
至於GPU領域,從AMD首發的7nm計算卡可以看出其非常重視伺服器市場,不過在這一市場英偉達GPU擁有絕對的優勢,與在CPU領域與英特爾的競爭一樣,英偉達的領先使其有能力從架構以及指令集等方面佔據優勢,一旦使用了7nm工藝,AMD在部分性能方面的優勢能保持多久就不得而知。我們也可以從架構上看,英偉達在今年八月放出了號稱12年來的最大招圖靈(Turing)架構,但圖靈架構的RTX2080 GPU也繼承了很多Fermi架構的東西,這意味著AMD也不太可能完全放棄GCN架構設計新的架構,並且此前AMD的研發中心都放在Zen架構上,GPU的改進乏力,基於目前的情況看,AMD能夠憑藉新的工藝就實現對英偉達的反超?
雷鋒網認為,AMD作為在高性能計算領域同時具有CPU和GPU產品的公司十分難得,不過可惜的是在CPU領域難以超越英特爾,在GPU領域難以超越英偉達,這其中有技術的因素,也有商業方面的原因。當然對於消費者和雲廠商而言,只有競爭才會帶來更好的產品,因此對於AMD的7nm CPU和GPU我們依舊保持期待。
※馬雲家族再成中國首富,賈躍亭2202萬股股票被強制用於還債
※浙江大學錢煒:無人駕駛中的人工智慧挑戰|AI 研習社第 86 期大講堂
TAG:雷鋒網 |