高端存儲已死？——Dell EMC PowerMax細節解讀

最新 05-09

作為一個叫「高端存儲知識」的公眾號，如果不解讀一下Dell EMC最新發布的PowerMax，肯定是不稱職的。雖然網上已經很多帖子了，但是，很大網友還是想看看西瓜哥怎麼想，怎麼評價這款代替高端存儲VMAX的大怪獸。

EMC推出這款新品，我其實是有一點預期的。因為DSSD退市的時候，EMC就表示其技術可能會用於下一代高端存儲，因此，高端存儲支持NVMe，應該是遲早的事情。

只是沒有想到，EMC的步子邁得這麼大。現在你去看EMC的產品頁，已經找不到VMAX，甚至VMAX-AF都不見了。

當然，如果你用搜索還可以看到。說明VMAX和VMAX-AF還在銷售，但是不主推了，未來的高端存儲只屬於PowerMax。

其實，根據Gartner 2017年Q4的數據，我統計了一下，EMC的VMAX-AF已經佔據高端存儲的3/4了。

也就是，高端存儲形態現在基本都是全快閃記憶體形態了。

說句大實話，看趨勢，你不得不佩服Gartner。Gartner在2016年在IT Market Clock for Storage的報告里，就預告了高端存儲快退休了。

也就是，高端存儲還有2-5年就到Replacement階段，這個階段，用戶不應該再新購買高端存儲了。16年後的2年，不正好是2018年嗎？EMC的步伐看來還是踩到了點上了。

這次PowerMax採用NVMe架構，這也在Gartner的預測之中。Gartner覺得2018年NVMe後端會得到採納，而2019年前端NVMe-oF才會來臨。未來主流的NVMe-oF協議可能是FC和RoCE。PowerMax的路標好像也是這樣的。

其實華為在2017上半年就退出了NVMe產品，Pure Storage在下半年推出。而PowerMax在2018年推出。論踩點，我只服EMC，O(∩_∩)O哈！

oooO ┏━┓ Oooo

( 踩)┃你┃ (死 )

( ┃√┃ ) /

\_)┗━┛ (_/

好了，下面言歸正傳，我們來解讀解讀這款PowerMax。

首先，PowerMax的關鍵字就三個：快速，智能和效率。

和VMAX-AF對比：

1、SAS變為NVMe，性能大幅提高，因此更快了；

2、引入AI/ML，有了一定的自動運維能力，因此更智能了；

3、除了壓縮，多了對重刪的支持，因此效率更高了；

具體這次Dell Tech World 2018上，EMC發布了兩款PowerMax，2000和8000。Power這個名字估計來自Dell伺服器PowerEdge，沒有辦法，因為現在存儲的領導基本都是Dell的人了。

我對比了一下，除了性能快外，軟體特性基本和原來VMAX-AF一樣，只是少了一個CloudArray的雲網關功能，估計以後會補上。

CPU還是v4，沒有用最新的v5。埠還是16G FC，還沒有支持32G FC，25G等高速介面。這個路標好像是2019年。

指標上，我們也看到，最大支持有效容量是一樣的，還是最多4PBe。按照EMC的定義，這個有效容量是包含thin，重刪壓縮和快照的容量。也就是說，其物理的裸容量其實不是太大的。

大家如果看過我以前的分析就可以看出，這是VMAX遺傳下來的限制。因為VMAX支持的最大有效容量和內存大小有關，現在PowerMax最多的內存也是16TB，和VMAX一樣，因此，其支持的最大有效容量也只能是4PB了。

下面我分別展開來講講這三個關鍵字。

一、快速

EMC號稱PowerMax是世界上最快的存儲，說句老實話，如果在中國，我們可以告EMC違反廣告法，O(∩_∩)O哈！

不過，從指標來看，確實挺快的，比如千萬IOPS，雖然全部是內存命中下測得的，沒有啥參考意義。

不過，時延還是說明一定的問題。對比VMAX-AF，時延下降25%，如果用SCM，會下降一半。

快的原因不多說了，就是NVMe和SCM。

二、智能

現在你發布一款產品，不說AI都是可恥的。PowerMax也不例外。也就是以後存儲也"自動駕駛"了。

發布會上，EMC堆砌了一堆數據，一句話，PowerMax能處理這麼多數據，不然怎麼好意思叫big data，O(∩_∩)O哈！

不過吹了這麼多，真正落到的場景，主要在數據的智能布局上。也就是分析應用，然後你知道這些數據放在SCM還是Flash上更合適。不過，EMC這個特性要2019年才出來，現在只是提前宣傳，因為現在還不支持SCM。

不過，這個思路不是EMC發明的，是高端存儲之父Moshe Yanai發明的，他在設計的第三代高端存儲Infinibox里，採用AI的方式來做Cache，號稱"neural caching"，我在文章AI在企業存儲已有三大落地應用，你知道嗎？里介紹過。

不過，目前PowerMax的緩存演算法沒有AI功能，我看EMC的資料說PowerMax的Cache命中率只有50%，人家Infinidat宣傳自己的神經緩存演算法的Cache命中率可以超過98%。也許明年PowerMax AI版本上線才能改善這個指標。

還有一個地方會用AI，就是在壓縮處理部分。如果用AI分析某些數據是熱數據，就先不用壓縮了，因為反覆壓縮和解壓還是浪費大量的資源的。這個也是有意義的。這個資料裡面都沒有提到，我是聽媒體的採訪才知道的。可憐我蹩腳的英語，希望沒有聽錯。不過，這個也需要等AI版本出來才行。

一句話，智能是路標，PowerMax現在還沒有比VMAX-AF聰明。

三、高效

大家知道，VMAX-AF有壓縮功能，但PowerMax多了一個重刪功能，因此號稱可以做到5:1的數據縮減比。

效率還體現在空間的節省。

還有功耗的減低上。

不過，這塊人家Pure Storage表示不服。Pure的//X採用CFM，自己做的NVMe板卡，密度更高一些，而且Pure的數據縮減自認為做得比PowerMax好，因此，空間的節省更多一些。但是，拿人家一個機櫃來比就有點搞了，因為那個機櫃還是很大地方空的，可以放其他設備啊。

講完3大關鍵詞，我想看看一些實現的細節，特別是區別於VMAX-AF的。

A、Smart RAID

首先講講EMC老強調的雙埠NVMe，這個沒啥特別的，為了可靠性和性能，NVMe SSD最好是雙埠的，華為的Dorado v3用的NVMe SSD也是雙埠的。一般消費級的NVMe都是單埠的。

由於是雙埠，因此每個控制器（Director）都可以訪問一個埠。因此，EMC還包裝了一個術語Smart RAID，由於NMVe協議的並行性，因此每個控制器都可以同時訪問所有的SSD，不管你是否在一個RAID組內。

其實SAS盤也是雙埠的，但是由於SAS/SCSI協議沒有並行能力（一個LUN只支持一個隊列），因此，無法做到Active/Active的RAID組共享。

2、NVMe磁碟框的連接

EMC在PowerMax後端採用PCIe，而不是像很多Startup公司採用RoCE來連接。

由於原來的存儲都沒有支持PCIe的磁碟框（DAE），因此，這是全新的硬體。EMC還是設計成24個小盤，2U高度的DAE。

如果是PowerMax 2000，一個引擎（2控）可以連接兩個DAE。2000最多支持4控，因此，連接方式如下：

但是如果是高端的PowerMax 8000，連接方式就奇怪了。2個引擎（4控）最多支持3個DAE，也即中間有一個DAE是兩個引擎共享的。

看了一下，以為EMC也搞一個HDS和華為老吹牛的4壞3設計，即中間那個DAE的數據很安全，因為任意一個引擎（2控）故障，另外一個引擎也有線路相連，也就是可以訪問？

其實不是這樣。大家仔細看中間的DAE，其實分成兩個部分，前14個盤位是引擎1來控制，後面10個盤位（編號15-24）是由引擎2控制。也就是各訪問各的，如果引擎1故障，那麼引擎1管理的盤也不能被引擎2訪問。

我們看到，中間的DAE的中間4個盤位（編號13-16）是用來專門放置熱備盤的，也就是說，PowerMAX的RAID機制還是VMAX那套，還是需要專門的熱備盤的。

中間的DAE為什麼不平分，而是前面14個盤給引擎1，後面10個盤給引擎2。估計和RAID組的設計有關。EMC一般採用8個盤一個RAID組，7+1或者8+2。不過，PowerMax支持的最大有效容量是由內存的大小決定的，因此，瓶頸並不在盤數上。我用PowerMax Studio做了一個最大配置，大家看看下半部分的DAE的盤是怎麼插的（上面部分是一樣的），很不規律，而且有很多盤位空的。

C、重刪壓縮

EMC的PowerMax這次多了重刪，但壓縮功能也和原來VMAX-AF不同。不過，兩者都通過專門的硬體加速卡來實現的。

大家看看，引擎裡面，NVMe的後端卡和數據縮減卡著兩種類型的卡是新的，其他的卡都是原來VMAX-AF有的。引擎之間還是採用Infiniband連接。

這個模塊不僅僅負責寫入數據的重刪壓縮，還負責SRDF複製時候的數據壓縮。

這是重刪壓縮特性對比。

我們看到，壓縮多了一個EDC，即擴展數據壓縮功能。這個功能是系統不忙的時候，去看看那些不常用的數據是否可以進一步壓縮，這樣可以獲得更好的壓縮率。這個思路其實是向Pure Storage學的。

還有，壓縮的演算法不同。PowerMax採用DEFLATE演算法，而VMAX-AF採用LZS演算法。具體區別大家百度吧，下面是無損壓縮演算法的發展一覽表。我的數學不太好，對其差別了解不多。

不過，PowerMax的壓縮有一點做得不好，估計是為了保證SRDF的兼容性，數據做遠程複製的時候，先要解壓，然後再用SRDF的演算法進行壓縮，對端收到後也多了一個解壓的再壓縮的過程，比較浪費資源。

說完了壓縮，我們來看看重刪，這個是新特性。從EMC提供的流程看，沒有看到hash ID一樣然後進行數據比對這個步驟。

也就是說，PowerMax和XtremIO一樣，都是採用強hash演算法（文檔說採用SHA-2演算法），不比對數據的處理方式。這個和NetApp、Huawei的思路不同。理論上有hash衝突的風險。

D、SLA服務模式

這個和VMAX一樣，採用SLA來進行等級劃分。不過，VMAX靠的是調整LUN的快閃記憶體百分比來調整服務等級，而PowerMax都是NVMe了，只能通過Host I/O Limit來控制前端埠的I/O來降速了。

看，全是NVMe SSD，居然也提供7.2ms時延的銅牌服務。這些主要給ISP用的，因為有些用戶希望便宜的服務，需要把體驗降下來，不然就賣不了貴的服務了。

E、秒級NDU

PowerMax繼承了VMAX的可靠性，甚至秒級NDU能力。

原理就是升級的時候提前把代碼裝載到EEPROM里，然後所有控制器同時熱載入，整體系統只需要10s左右就可以完成升級，業務不中斷。

F、LUN歸屬問題

我們知道，VMAX是沒有LUN歸屬的，也就是LUN可以被多個控制器同時讀寫，I/O無需轉發。但是，LUN沒有歸屬，下面某一個邏輯塊還是需要有歸屬的，HPE 3PAR是CK，而VMAX就是TDAT。

SmartRAID的描述就提到，TDAT是有歸屬的。

這樣設計的好處就是主機只能看到LUN，看不到TDAT，TDAT有歸屬就不需要鎖機制，系統性能更好，而且主機可以對同一個LUN多路徑負載均衡，控制器切換主機不感知，業務影響小。

好，到這裡，我想到的技術要點解讀都解讀完了。最後給大家提一個問題，根據IDC的定義，PowerMax到底算原生型還是改良型呢？

確實，PowerMax有很多新東西，但是，我們看軟體上和VMAX基本一樣，特別是RAID方式和SRDF壓縮的實現等等，我們都看到很多妥協。也就是還是有歷史包袱的，不可能像全新設計的架構一樣輕裝上陣。不過，改良型也有改良型的好處，就是功能豐富，成熟度高。當然，不好的地方就是有妥協，性能無法發揮到極致。

最後，再回到我們開頭討論的，高端存儲已經死了嗎？我覺得沒有，傳統的高端存儲死了，但新的全快閃記憶體高端存儲，雖然不一定叫高端存儲，但本質上還是。也就是說，只是叫AFA而已，但骨子裡還是高端存儲。從這個意義來講，高端存儲還有很長的生命期的。

因此，做高端存儲的做過好夢吧。什麼，碎不著，你聽：星星還是那個猩猩......

籬笆牆的影子

毛阿敏影視歌曲集

毛阿敏

00:00/04:38

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 高端存儲知識 的精彩文章:

※Gartner眼裡2018最酷的存儲廠商到底是誰？why so cool？
※美國人眼裡的存儲領導品牌解讀

TAG:高端存儲知識 |