AMD技術溝通會結束，都說了啥？

科技 11-08

在處理器市場上，AMD Ryzen對Intel造成的實際壓力越來越大。

據外媒報道，Mercury Research發布的2018年第三季度處理器市場份額報告顯示，AMD在桌面x86處理器的市場佔有率提升到了13%，環比增加0.8個百分點，同比增加2.1個百分點。

在筆記本處理器市場，AMD的份額在第三季度提升了1.5個百分點，摸到10.9%，伺服器市場的增幅更是高達10.6%。

AMD Zen架構取得了空前成功，今年還優化為Zen+增強版，並有同樣優化的12nm工藝輔助，而現在我們終於迎來了全新的第二代Zen 2架構，以及全新的7nm工藝加持。

AMD原計劃採用GlobalFoundries 7nm為自家新CPU、GPU代工，但後者已經放棄7nm及後續工藝，好在還有天字一號代工廠台積電，AMD 7nm CPU、GPU全都轉移了過去，而且目前看起來很順利，無論產品設計還是路線圖都在按計划進行。

根據台積電提供的數據，7nm相比於目前的14/12nm可以將晶體管密度提高一倍，同等頻率下功耗可以降低一半，而同等功耗下性能提升可以超過25％。

如果說12nm更多地是在「數字」上領先Intel 14nm，這一次7nm則是在技術上完全實現超越，也能稍微領先Intel仍在難產的10nm。

Zen 2，這是世界上第一個7nm工藝的高性能x86 CPU，除了新工藝主要變化包括：CPU核心執行增強、更深入的安全增強、模塊化設計靈活配置並降低製造難度。

Zen 2實現了兩倍於第一代的吞吐能力，這主要得益於執行流水下的改進、浮點單元和載入存儲單元的翻番、核心密度的翻番、每操作功耗的減半。

在前端設計上，Zen 2重點改進和優化了分支預測、指令預取、指令緩存、操作緩存。

而在浮點方面，Zen 2將浮點寬度翻了一番達到256-bit，載入存儲帶寬同樣翻了一番，並提升了分發/回退帶寬，所有模塊都保持著很高的吞吐。

安全性方面，AMD重點強調了新架構可以在硬體層面免疫Spectre幽靈安全漏洞。

Zen 2架構支持更多核心，但並不是單純地增加核心數量，而是採用了特殊的組合結構：EPYC霄龍最多單路64核心128線程，分為八個Die，每個Die內八個物理核心，同時外部還有一個單獨的I/O Die，集成內存控制器、Infinity Fabric高速匯流排、I/O輸入輸出，專門負責聯絡各個Die與物理核心。

這種新的模塊化設計更加靈活，可以單獨針對每個模塊進行優化、調配，同時藉助I/O Die大大優化了整體延遲與功耗。

不過注意，CPU Die部分用的是7nm工藝， I/O Die部分則還是14nm，因為後者大部分都是模擬電路，對新工藝並不敏感，即便上了7nm也不會帶來集成度、性能、功耗的明顯改善，成本卻會明顯增加，所以採用了這種混合工藝模塊組合。

事實上，Intel也正在同一顆晶元內嘗試不同工藝的組合，都是出於同樣的目的。

以上說的都是Zen 2架構的理論部分，最終落實到EPYC霄龍、Ryzen銳龍產品上，還會有不同的表現，但可以預料，新架構新工藝，必然會帶來明顯更高的頻率、更低的功耗，而且無論桌面還是伺服器，AMD這幾年都會保持前後代兼容。

AMD還首次確認，Zen 4架構已經在設計中，將在7nm+ Zen 3之後面世，時間上估計至少會在2021年。

7nm Radeon Instinct系列首發兩款產品，型號分別是MI60、MI50，主打機器學習訓練、高性能領域，也可用於虛擬化、機器學習推理，將在今年底出貨，相關係統和應用明年問世，2020年還有下一代產品。

Radeon Instinct MI60、MI50仍舊基於Vega GPU核心架構，但是一方面升級新工藝，另一方面也針對數據中心應用做了調整優化，包括計算單元、顯存、PCI-E 4.0等等。

14nm Vega 10核心擁有125億個晶體管，核心面積484平方毫米，7nm Vega則增至132億個晶體管(增幅6.4％)，面積卻縮小到331平方毫米(幅度31.6％)，同時只相當於對手(815平方米的12nm GV100)的大約40％。

新核心對基礎的計算單元進行了針對性的調整增強，比如矢量ALU單元支持16/32/64位操作，同時所有模塊都支持ECC。

它還是世界上第一個顯存帶寬達到1TB/s的GPU，最多32GB HBM2。

架構優化加上頻率提升(具體未公開)，MI60相比於MI25在流處理器相同的情況下，性能提升幅度十分驚人，比如FP16浮點性能快了20％，INT8、INT4整數性能分別快了140％、380％，還有新的指令集，更適合執行機器學習應用。

如果只是進行矩陣乘法運算，MI60隻會提升25％以上，但對於Resnet-50這樣的特定應用，提升幅度最高可達2.8倍，非常驚人。

TensorFlow FP32提升幅度在25-50％之間，而且憑藉Infinity Fabric，MI60還支持近乎線性提升的多路擴展，比如四路性能就幾乎是單路的整整4倍。

Vega、EPYC現在都支持PCI-E 4.0，但是平台尚未構建完成，所以八路並行在PCI-E 3.0下性能提升會受到一定的限制，未來都換到PCI-E 4.0還有望更猛。

PCI-E 4.0，7nm Vega是第一個支持的GPU，Rome EPYC則是第一個支持的CPU，二者互相配合，雙向帶寬可達64GB/s，最多可以四塊並行。

Infinity Fabric匯流排則可以在不同顯卡之間提供200GB/s的帶寬，是PCI-E 3.0的足足6倍，不過注意這裡用了硬體橋接方式互連，目的是更方便地處理超大傳輸數據量。

而得益於對硬體虛擬化的支持(唯一哦)，MI60/56還可以最多八塊卡並行，但實現方式略有不同，每四塊通過Infinity Fabric高速互聯，然後兩組四塊卡再通過PCI-E匯流排互連。

如果不需要這麼多卡，也可以一塊、兩塊、四塊各自組成虛擬機再並聯於同一個系統內，但注意必須是完全同一型號的卡，不能混用。

MI60是個完全體，集成64個計算單元、4096個流處理器，峰值整數性能INT4 118Tops、INT8 59Tops，峰值浮點性能FP16 29.5TFlops、FP32 14.7TFlops、FP64 7.4TFlops，技術特性支持全晶元ECC錯誤校驗、RAS、PCI-E 4.0、雙鏈路Infinity Fabric，顯存搭配4096-bit 32GB HBM2，帶寬1TB/s，熱設計功耗300W。

MI50精簡到60個計算單元、3840個流處理器，性能降低約9.5％，顯存容量減半至16GB，其他完全同上。

對手如此來勢洶洶，Intel這邊也坐不住了。據Anandtech，Intel宣布將於12月11日舉辦「Forward-Looking（展望未來）」架構溝通會。

本次活動密級很高，議程和內容尚不得而知，且只有少數媒體、分析師可以參與。不知何故，Intel如今對架構技術細節越發「三緘其口」，甚至取消了Intel開發者大會。

對於Intel來說，可談的話題相當多，比如CPU、GPU、AI、FPGA、PCIe 4.0/DDR5、安全漏洞、10nm家族、摩爾定律等，甚至還包括Jim Keller/Raja Koduri等行業大牛加入後對Intel產品路線的調整。

另外，一直有傳言酷睿架構將走到盡頭，難道這次Intel要放大招了？

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 科技美學 的精彩文章:

※都去關注蘋果了，華碩其實也沒閑著
※智能＋安全-果加智能指紋鎖F1S

TAG:科技美學 |