當前位置:
首頁 > 科技 > Intel推出10nm 3D新CPU架構,讓失效的摩爾定律再次生效!

Intel推出10nm 3D新CPU架構,讓失效的摩爾定律再次生效!

Intel在大洋彼岸的Architecture Day 2018活動中,公布了多項重大產品消息,最重要的消息就是發布了基於下一代Sunny Cove架構的10nm晶元,該CPU晶元將有望在2019年下半年開始出貨。

大會公布了Sunny Cove架構細節和2019-2021年的核心路標。Intel將核心產品線的路標更新方式分為兩個分支: 通用和專用產品。


下一代Sunny Cove架構

在摩爾定律已經發展到盡頭的今天,英特爾在10nm工藝製程上遇到巨大困難,本來2到3年提高工藝製程的計劃一拖再拖。以至於從2015年發布Skylake架構的晶元以來,英特爾一直在14nm上小修小補,面對10nm工藝製程上遇到巨大困難,曾經幾乎完全放棄10nm計劃。

但此次對下一代Sunny Cove架構的改進和創新讓人耳目一新,並證實了10nm計劃的落地。

Sunny Cove基於10nm技術,將於2019年上市,提供更高的單線程性能、新指令和「改進的可伸縮性」。Willow Cove將是2020年的核心設計,也有可能也在10nm上技術。Intel將對緩存重新設計(L1/L2緩存調整),新晶體管優化(基於製造)和額外的安全特性。Golden Cove採用的工藝還是一個問號,但很可能基於10nm和7nm工藝設計。Golden Cove增加了單線程性能,並在核心設計中增加了網路和AI功能。安全特性也得到了提升。

而英特爾突然宣布明年將推出下一代Sunny Cove架構的酷睿與至強晶元,其架構平台終於從「湖」(Lake)變成「海」(Cove)。旨在提高通用計算任務的時鐘和功率效能,Sunny Cove的特點主要包括:

增強CPU微架構,提高並行操作能力

通過新演算法降低延時

增加關鍵緩存大小優化工作負載

特定和架構擴展(如AES、SHA-NI性能提升加密指令等)

下一代Deeper、Wider、Smarter處理器

Deeper:Sunny Cove是一種基於10nm工藝構建的增強型微架構。 雖然它仍然來自之前的Skylake,但是已被改進以並行執行更多指令,並具有更低的延遲,同時晶元緩存也比之前擴大很多。Sunny Cove晶元的一級緩存比Skylake大50%,至於2級緩存大小則會取決於晶元的市場定位。

Smarter:Sunny Cove包括對AVX-512指令的支持。 AVX-512涵蓋許多不同的擴展和功能,一些是通用矢量演算法,另一些是專門用於神經網路等工作負載。提供更好的分支預測精度演算法,有效降低負載延時。

除此之外,Sunny Cove還包含加速加密和數據壓縮工作負載的新指令,在這些新指令上相比前代有75%的性能提升。

Wider:Sunny Cover處理器也比Skylake更寬,有5寬度分配能力、10個執行埠、2倍L1存儲寬度。將SIMD、Shuffle、LEA單元添加到向量和整數塊區中。

低功率Atom微架構路線圖的節奏比核心微架構慢,考慮到其歷史,這並不奇怪。鑒於Atom必須適應各種設備,我們期望它具有廣泛的功能,特別是SoC方面。2019年Atom微架構被稱為Tremont,專註於提高單線程性能、電池壽命和網路伺服器性能,緊隨Tremont之後的將是Gracemont產品。

但英特爾推出的並非完全是10nm晶元,而是通過Foveros技術將不同性能、不同部分封裝在一起,僅高性能部分使用的是10nm工藝製程。


Foveros全新3D封裝技術

英特爾在推出Sunny Cove的同時,也宣布了其業界首創的邏輯晶元3D堆疊技術Foveros。該技術之前已經應用在存儲晶元上,但用在CPU上仍有困難,如果在CPU上堆疊內核,不但會讓CPU極度過熱,而且驗證測試也需謹慎。

下圖顯示了通過Active Interposer層將兩個獨立的晶元裝載到同一個Package中。這種設計讓Intel在設計部件時擁有極大的靈活性。應客戶的要求,Intel生產了一款搭載Atom和標準Core處理器的CPU。雖然這種異構組合在ARM架構上比較常見,但這是我們第一次在Intel CPU上看到它。

Foveros允許將複雜的邏輯晶元堆疊在一起,從而提供更大的功能,使處理器不同部分的組件與相應的製造工藝匹配。例如,高性能CPU內核可能構建在性能最高的10nm工藝上,但集成USB、Wi-Fi、乙太網、PCIe的I/O連接部分不需要這麼高的性能。

因此,對於晶元的這一部分使用性能稍低的14nm甚至22nm工藝可能更有意義,性能仍然足夠好,但功耗和成本要低得多。Foveros意味著處理器可以按照不同的製程集成這些組件。

使用Foveros,這些不同的組件可以並排緊密包裝在一起,實現更高的密度和更小的晶元面積。

大會上演示的基於Foveros技術晶元實現核心CPU和Atom CPU的物理硅空間共享。如果把市面上的EMIB和Foveros相比,答案就是Foveros是一個3D晶元堆疊解決方案,而EMIB是2D堆疊解決方案,但這兩種技術並不排斥,據說Intel英特爾正在計劃開發使用這兩種技術的硬體產品。

英特爾表示,Foveros產品將在2019年下半年出貨,該技術已準備好進行大規模生產,它不僅僅面向專用或定製處理器,還包括主流消費級CPU。首批產品將採用22FFL(低功耗FinFET)工藝,將10nm計算單元堆疊在晶元頂部。

10nm部分將包含Sunny Cove高功率核心和四個Atom內核,它與現代手機上的ARM處理器類似,對於較輕的工作任務使用低功耗Atom內核,而Sunny Cove用於計算量更大的任務。

該產品的最終結果是一個混合x86架構,它可以在Core和Atom之間切換,兩者都構建在10nm上。晶元上的邏輯包含在底部晶元中,而CPU內核位於頂部。AMD和英特爾都在向Chiplets進軍,但Intel似乎相信,3D晶元將獲得更多的市場份額。


EMIB和Foveros的組合能力使Intel能夠以新的組合連接硬體。隨著時間的推移和新問題的出現,摩爾定律的定義也發生了變化。但是今天,CPU繼續遵循摩爾定律,繼續改進規模、集成和功耗。如果英特爾能夠真正開始大規模生產3D晶元,它可能重塑我們未來設計CPU的方式。

獨立顯卡2020年上市

Intel放棄第10代集成顯卡推出全新的第11代(Gen11)集成顯卡,它配備64個增強型執行單元,比此前的英特爾第9代集成顯卡(24EU)多出一倍以上,運算能力突破1 TFLOPS。

新的集成顯卡將使用基於圖塊的渲染方法,該方法將圖像劃分為單獨渲染的圖塊。這樣會減少GPU所需的內存帶寬。該晶元包含兩個解碼器和一個編碼器,英特爾重新設計了HEVC/H.265編碼器。它將支持4K甚至8K視頻流,並且支持HDR和AMD的FreeSync技術。

新的集成顯卡將在2019年與10nm處理器一起推出,因此很可能與新的Sunny Cove核心搭配組合。Intel強調,公司計劃推出新架構的獨立顯卡,代號為「Xe」,預計將於2020年出貨。


推出深度學習參考堆棧

除了以上技術內容,Architecture Day 2018還宣布推出深度學習參考堆棧(Deep Learning Reference Stack),這是一個集成、高性能的開源堆棧,基於英特爾至強可擴展平台進行了優化。

它的開源社區版本旨在確保人工智慧開發者可以輕鬆訪問英特爾平台的所有特性和功能。深度學習參考堆棧經過高度調優,專為雲原生環境而構建。

該版本可以降低集成多個軟體組件所帶來的複雜性,幫助開發人員快速進行原型開發,同時讓用戶有足夠的靈活度打造定製化的解決方案。

操作系統:Clear Linux操作系統可根據個人開發需求進行定製,針對Intel平台以及深度學習等特定用例進行了調優;

編排:Kubernetes可基於對Intel平台的感知,管理和編排面向多節點集群的容器化應用;

容器:Docker容器和Kata容器利用Intel虛擬化技術來幫助保護容器;

函數庫:Intel深度神經網路數學核心函數庫(MKL DNN)是Intel高度優化、面向數學函數性能的數學庫;

運行時:Python針對Intel架構進行了高度調優和優化,提供應用和服務執行運行時支持;

框架:TensorFlow是一個領先的深度學習和機器學習框架;

部署:KubeFlow是一個開源、行業驅動型部署工具,在Intel架構上提供快速體驗,易於安裝和使用。

參考鏈接:

https://www.extremetech.com/computing/282137-intel-uses-new-foveros-3d-chip-stacking-technology-to-build-core-atom-on-the-same-silicon

https://wccftech.com/intel-sunny-cove-cpu-architecture-and-next-generation-roadmap-revealed/

溫馨提示:

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 架構師技術聯盟 的精彩文章:

程序員熬過中年危機的八條建議
選擇GPU伺服器的基本原則

TAG:架構師技術聯盟 |