AMD伺服器CPU EPYC將終結Intel暴利時代！

最新 08-13

本文研究AMD推出的伺服器系統晶元 (SoC): AMD Epyc。許多客戶會購買雙插槽 (2S) 伺服器，因為可以獲得比英特爾單插槽 (1S) 伺服器體系結構更多的可用 i/o 或內存容量。AMD Epyc 的1S 處理器和 i/o 資源有可能取代2S 伺服器設計的許多工作負載。

圖 1: AMD Epyc SoC-插座 (左), 底部視圖 (右)

資料來源: TIRIAS 研究和 AMD

多處理器伺服器已經存在數十年了。在二十世紀八十年代, 它們是由每個處理器 (CPU) 的許多主板構建的, 之後是許多 "單板計算機"。單片微處理器使伺服器設計人員能夠將幾個處理器插座放到一個主板上。這些多插座主板被標記為 "n 處理器" (nP), 其中 "n" 是主板上的處理器數, 如1P、2P、4P 等。

今天, 一個伺服器插座可以承載許多硬體線程。多插槽主板現在被標記為 "n 插座" (nS), 因此1S 伺服器有一個包含多個處理器內核的處理器插座等。

圖 2: 一個AMD Epyc SoC是2008年時四插槽系統的兩倍線程

資料來源: TIRIAS 研究

在十年前AMD 推出AMD Opteron雙核處理器時, 多核處理器進入主流伺服器市場。多線程處理器內核在每個內核中都有額外的 CPU 資源, 可以一次運行多個軟體執行線程, 在過去十年中也變得很流行。多線程、多核處理器引起從主板計數處理器到計數Socket的行業轉變。計數Socket消除了處理器晶元可以處理的硬體線程數和主板上插槽中的物理晶元數量之間的混淆。

同期, 基於伺服器的並行編程實踐已停滯不前，大多數應用程序有8個以下的軟體執行線程，很少有超過16個線程的。對於大多數主流商業應用來說都是如此。虛擬化的興起是由於硬體性能的飛速發展, 而不是單個軟體應用程序能夠吸收硬體性能的增加。在 21世紀, 多核處理器的泛濫使得4S 系統能夠取代更昂貴的8插槽 (8S) 市場, 因為4S 系統變得更強勁。然後, 在過去的十年中, 2S 系統從更昂貴的4S 系統中接管了許多工作負載。2S 系統現在被定義為企業級伺服器的主流。

繼續向每個伺服器處理器中注入更多內核和線程的副產品是, 一個 AMD Epyc SoC CPU現在包含大約2008年時的雙線程、四核、4S 伺服器的線程執行資源的兩倍 (見圖 2)。這就引出了一個問題: 為什麼2S 系統仍然是主流的伺服器主板外形？是否有可能將主流伺服器工作負載移動到1S 基礎架構？1S 伺服器可以是 "企業級" 嗎？

2S還是1S？這就是問題所在

每個可調度任務或進程生成超過16個並發線程的工作負載很少，大多數情況下每個實例生成的線程不超過8個。在每個進程中生成超過16個線程的大多數工作負載都是 "令人尷尬的並行" 高性能計算 (HPC) 工作負載, 每個實例生成數量級更多的線程，它們更適合GPU或其他卸載加速，而不是擴展到更多的CPU。

大多數工作負載（例如在虛擬機中運行的業務邏輯和運行在容器中的雲微服務）可以在1S伺服器上以2S伺服器上的速度和價格運行，如果現有的1S系統可用於2S伺服器就只插一個插槽。

英特爾的伺服器CPU功能和定價細分策略似乎旨在保持其可觀的2S容量和利潤率。由於核心數量的增加以及底層核心和緩存體系結構的改進, 2014年底英特爾至強「Haswell」的推出增加了只用一個插槽的2S伺服器的數量。

圖3顯示, 在 Haswell CPU銷量快速增長期間, 僅有一個插座填充的 3000美元以下 2S 伺服器的數量增加了約 20% (從25% 到30% )。此外, 只有一個插座的3000美元至6000美元 2S 伺服器的出貨量也躍升約 25%, (從27% 到35%)。

圖 3: 僅裝入一個套接字的2S 伺服器共享

AMD的 Epyc 體系結構具有相同的核心數量和結構提升, 因此在市場上有機會產生同樣的效果, 但值得注意的是AMD也有興趣推廣1S 市場。

今天, 超過1/3 的2S 功能機架優化伺服器只配備了一個處理器。有關兩個最暢銷2S 伺服器價格區間的只配一個CPU的市場份額, 請參閱表1。

表 1: 2019年Q3：2S 機架優化伺服器在Q1期間只配備了一個處理器

Source: IDC, 2016

今天購買許多2S 伺服器只是為了比英特爾1S伺服器架構上更多可用的和不同的I / O容量或內存。要增加大量內存和 PCIe 通道, 需要添加第二個處理器。這些設計將2S 晶元組用於提供更多或不同的 I/O (主要是 PCIe、NVMe 和SATA), 而不是用於第二套插座的計算資源。

大多數企業和大規模伺服器購買者不會為了省錢，從英特爾的帶有緩存RDIMM等企業級功能的至強 E5 CPU換到只有無緩衝DIMM（UDIMM）等消費級PC功能的1U伺服器中使用的Xeon E3 CPU。考慮到以後要升級到兩個E5，所以購買至強 E3 與至強 E5 的價格差異, 讓人覺得可以接受，可是實際上，財務成本實際上非常高, 因為幾乎沒有人購買一個只有一個至強 E5 的2S 伺服器之後安裝第二個處理器。

表2: Epyc 的競爭優勢

Source: TIRIAS Research

表2顯示了 AMD Epyc 和競爭性英特爾至強產品的比較。表3中的所有信息都適用於1S 配置, 儘管 Epyc 和至強 E5 都支持雙插槽。該表清楚地表明，AMD Epyc不僅超越了Xeon E3的限制，而且還超越了至強E5 v4的集成和功能。

對於兩個處理器插座都主要用於增加內存容量和PCIe通道的情況, 這不僅增加了主板面積、機箱體積和第二個處理器的額外支出, 而且還由於第二個處理器的額外功耗, 持續運營成本增加。

表3顯示，英特爾定價Xeon D 1S SoC的價格是可比Xeon E3處理器的兩倍，但Xeon E3需要額外的南橋晶元，網路和I / O支持。相比之下，英特爾正在為Xeon E5處理器定價，這也需要額外的南橋晶元，網路和I / O支持，價格是同類E3 SKU的六倍 - 對於只有一個插座的2S板，E5是可升級性所需（如上所述，很少發生，但仍在購買決策中考慮）。隨著2S板的兩個插座的填充，英特爾雙E5處理器的定價是單個E3處理器價格的12倍。

表 3: 英特爾至系列價格比較

Source: TIRIAS Research and https://ark.intel.com/

有兩種方法可以查看升級:

升級兩個插槽中的處理器以提高速度和其他體系結構改進。當每新一代處理器通過時鐘速率提高和體系結構改進提高了性能時, 這種技術就能良好運行。不幸的是, 英特爾目前的 x86 處理器核心體系結構正在成熟, 而且由於流程縮短，摩爾定律不再自動生成更快的時鐘速度。因此, 一代又一代的性能改進通常在一位數內。今天的伺服器通常是在它們發生故障之前保持服務狀態, 直到它們不受支持, 或者直到它們無法運行特定的工作負載。

首先使用一個處理器, 然後添加一個處理器以添加更多功能。有趣的是, 從與許多雲和企業 IT 商店交談, 大多數伺服器不會打開其機箱蓋以升級伺服器的任何部分。對於僅用一個處理器的2S 伺服器也是如此。雖然從應用軟體的角度來看，二十年前添加第二個處理器是一個合理的選擇，但現代應用程序傾向於通過添加更便宜的伺服器來很好地擴展，而不是購買昂貴的擴展伺服器，這些伺服器是虛擬化的許多應用程序的過度構建機器託管部署。如今，橫向擴展以增加容量要容易得多。如果運營商打算投入人力來打開伺服器機架並拔出機箱 - 他們也可以更換整個機箱，而不是試圖安裝額外的CPU，散熱器和更多內存。

AMD 的 Epyc SoC 旨在解決潛在的1S 伺服器需求,雖然英特爾已經推進到昂貴而且沒必要的2U 伺服器, 以及高性能2U 伺服器的需求。

Epyc SoC 可以直接連接多達32個 SATA 或 NVMe 設備。在設計主板時, 將 Epyc 的 PCIe Gen3 通道配置為 NVMe、SATA 或2S 插座互連。在2S 配置中, Epyc 的系統內存容量加倍到 2/4TB的內存 (RDIMM/LRDIMM), 但系統 I/O 與1S 解決方案相同，一半的 I/O 通道用於兩個 SoC 插座之間的高速鏈接。

圖 4: AMD Epyc 1S 開發板 (左) 和2S 預生產板 (右)

Source: TIRIAS Research

伺服器成本有兩個經濟組成部分: 資本支出CAPEX和 OPEX。資本支出是一個完整伺服器的買方價格, 而 OPEX 主要是伺服器的功耗和管理開銷成本。

在1S 和2S 的經濟學之間推廣比較是有點模糊的。表4列出了主要比較的特徵。

表 4: 資本和 OPEX 對1S 和2S 伺服器成本差異的貢獻

Source: TIRIAS Research

還有一個OPEX軟體許可組件，但是很難在各種應用程序中進行概括。

我們估計典型的1S和2S主板之間的定價增加了200到300美元（由於額外的元件，增加的電路板成本等） - 接近Xeon E3和Xeon E5之間單處理器價格的差異。對於更大和更複雜的電路板設計，以及第二個處理器或SoC插座所需的支持組件（電源調節器，插座等），這種價格差異是正常的。

此外, 即使從不填充第二處理器插座，也會用容量更高、價格更貴的電源, 在2S設計中用於為附加處理器和支持組件供電。

雖然額外的2S主板組件導致功耗增加，但同樣，處理器功耗相比其他主板組件相形見絀。英特爾的1S Xeon E3系列功耗規格範圍為25W至80W，Xeon D功耗規格範圍為45W至60W。英特爾的2S Xeon E5系列功耗範圍從50W到145W。相比之下，DIMM插槽的功耗為7.5W，因此四個DIMM可能消耗高達30W的功率，而八個DIMM可能消耗高達60W的功率。

然而, 主板的價格差異約為600美元, 從英特爾1S 至強 E3 系列處理器移動到2S 至強 E5 系列處理器的價格相差甚遠。適合2S 系統的 Epyc SoCs 也將適合1S 系統,不會降低每個插座的功能 (見表 2)。

無論是1S 還是2S 設計, 每個 Epyc SoC 都具有相同的內存帶寬和容量。這將極大地影響系統設計者創建高性能1S 系統的能力, 因為英特爾通過限制1S 內存帶寬和容量來細分其1S 和2S 產品線, 這將使 "向上銷售" 客戶對2S 設計產生影響。

將 Epyc 從1S 擴展到2S 會消耗一些 I/O 通道。Epyc 2S 設計使用每個 soc 的高速 i/o 通道中的一端連接到另一個 soc 插座。但1S 和 2S Epyc 主板支持相同數量的 PCIe 車道。

從表2可以看出，至強 D 和至強 E3 的內存容量有限, 並且至強 E3 不支持伺服器標準 RDIMM。

AMD 的 Epyc 架構將支持功能強大的1S 伺服器解決方案。TIRIAS 的研究認為, 性價比高, 加上內存和 i/o擴展, 足以證明數據中心的客戶可以批量採用1S 設計, 因為 AMD 的 Epyc SoC 可靠地解決了大多數1S 的架構和價格的問題。

換句話說，一旦Epyc 1S伺服器普遍可用，我們認為購買過度配置的2S伺服器將會浪費資金。這是伺服器市場在AMD推出雙核AMD Opteron和英特爾以實物方式響應後所經歷的轉變，導致8S和更高的系統銷售陷入4S細分市場。從那時起，公共雲提供商幾乎完全忽略了4S伺服器，支持其元服務（MaaS），基礎架構即服務（IaaS）和平台即服務（PaaS）中的2S配置。

從軟體開發的角度來看, 開發 Epyc 1S 解決方案與開發其他伺服器處理器沒有什麼不同。此外, 客戶還可以設計性能最佳的的Epyc 2S 解決方案，他們可以使用完全相同的 Epyc sku 實現這一目標。

從客戶的角度來看, 每個伺服器都應該支持給定應用程序 (用戶數、事務數、吞吐量等) 的基準性能。無論伺服器是1S 還是 2S, 只要它滿足或優於企業的基準性能水平即可。目前的挑戰是, 在 Epyc 之前, 供應鏈中所有模塊都不同。Epyc 的高核心計數和強達的功能應使 AMD 能夠將僅有一個處理器的2S 伺服器的簡單增長轉化為專用1S 伺服器設計的擴展市場。

AMD 設計了 Epyc 來解決企業級伺服器部署問題。我們期待 Epyc 性能指標和 TCO 分析作為其推出日期方法, 以進一步量化其1S 優於英特爾至強處理器的優勢。

懂快閃記憶體，得未來

快閃記憶體技術革命，奠定未來10年存儲大勢

四年磨一劍，授之以漁，而不是授之以魚

一本銷量和好評快速增長的暢銷書

請長按下面指紋購買紙書

京東、淘寶、亞馬遜、Kindle也同時在售《深入淺出SSD》

快閃記憶體、AI、區塊鏈、物聯網

高端微信群介紹

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 ssdfans 的精彩文章:

※Alibaba Open Channel SSD，阿里巴巴存儲架構的重要里程碑
※信息存儲記錄歷史，傳承文明

TAG:ssdfans |

AMD伺服器CPU EPYC將終結Intel暴利時代！

歷史

特點

提升

AMD 的新伺服器體系結構和設計

經濟

內存和I/O

結論