當前位置:
首頁 > 最新 > 高端存儲已死?——Dell EMC PowerMax細節解讀

高端存儲已死?——Dell EMC PowerMax細節解讀

作為一個叫「高端存儲知識」的公眾號,如果不解讀一下Dell EMC最新發布的PowerMax,肯定是不稱職的。雖然網上已經很多帖子了,但是,很大網友還是想看看西瓜哥怎麼想,怎麼評價這款代替高端存儲VMAX的大怪獸。

EMC推出這款新品,我其實是有一點預期的。因為DSSD退市的時候,EMC就表示其技術可能會用於下一代高端存儲,因此,高端存儲支持NVMe,應該是遲早的事情。

只是沒有想到,EMC的步子邁得這麼大。現在你去看EMC的產品頁,已經找不到VMAX,甚至VMAX-AF都不見了。

當然,如果你用搜索還可以看到。說明VMAX和VMAX-AF還在銷售,但是不主推了,未來的高端存儲只屬於PowerMax。

其實,根據Gartner 2017年Q4的數據,我統計了一下,EMC的VMAX-AF已經佔據高端存儲的3/4了。

也就是,高端存儲形態現在基本都是全快閃記憶體形態了。

說句大實話,看趨勢,你不得不佩服Gartner。Gartner在2016年在IT Market Clock for Storage的報告里,就預告了高端存儲快退休了。

也就是,高端存儲還有2-5年就到Replacement階段,這個階段,用戶不應該再新購買高端存儲了。16年後的2年,不正好是2018年嗎?EMC的步伐看來還是踩到了點上了。

這次PowerMax採用NVMe架構,這也在Gartner的預測之中。Gartner覺得2018年NVMe後端會得到採納,而2019年前端NVMe-oF才會來臨。未來主流的NVMe-oF協議可能是FC和RoCE。PowerMax的路標好像也是這樣的。

其實華為在2017上半年就退出了NVMe產品,Pure Storage在下半年推出。而PowerMax在2018年推出。論踩點,我只服EMC,O(∩_∩)O哈!

oooO ┏━┓ Oooo

( 踩)┃你┃ (死 )

( ┃√┃ ) /

\_)┗━┛ (_/

好了,下面言歸正傳,我們來解讀解讀這款PowerMax。

首先,PowerMax的關鍵字就三個:快速,智能和效率。

和VMAX-AF對比:

1、SAS變為NVMe,性能大幅提高,因此更快了;

2、引入AI/ML,有了一定的自動運維能力,因此更智能了;

3、除了壓縮,多了對重刪的支持,因此效率更高了;

具體這次Dell Tech World 2018上,EMC發布了兩款PowerMax,2000和8000。Power這個名字估計來自Dell伺服器PowerEdge,沒有辦法,因為現在存儲的領導基本都是Dell的人了。

我對比了一下,除了性能快外,軟體特性基本和原來VMAX-AF一樣,只是少了一個CloudArray的雲網關功能,估計以後會補上。

CPU還是v4,沒有用最新的v5。埠還是16G FC,還沒有支持32G FC,25G等高速介面。這個路標好像是2019年。

指標上,我們也看到,最大支持有效容量是一樣的,還是最多4PBe。按照EMC的定義,這個有效容量是包含thin,重刪壓縮和快照的容量。也就是說,其物理的裸容量其實不是太大的。

大家如果看過我以前的分析就可以看出,這是VMAX遺傳下來的限制。因為VMAX支持的最大有效容量和內存大小有關,現在PowerMax最多的內存也是16TB,和VMAX一樣,因此,其支持的最大有效容量也只能是4PB了。

下面我分別展開來講講這三個關鍵字。

一、快速

EMC號稱PowerMax是世界上最快的存儲,說句老實話,如果在中國,我們可以告EMC違反廣告法,O(∩_∩)O哈!

不過,從指標來看,確實挺快的,比如千萬IOPS,雖然全部是內存命中下測得的,沒有啥參考意義。

不過,時延還是說明一定的問題。對比VMAX-AF,時延下降25%,如果用SCM,會下降一半。

快的原因不多說了,就是NVMe和SCM。

二、智能

現在你發布一款產品,不說AI都是可恥的。PowerMax也不例外。也就是以後存儲也"自動駕駛"了。

發布會上,EMC堆砌了一堆數據,一句話,PowerMax能處理這麼多數據,不然怎麼好意思叫big data,O(∩_∩)O哈!

不過吹了這麼多,真正落到的場景,主要在數據的智能布局上。也就是分析應用,然後你知道這些數據放在SCM還是Flash上更合適。不過,EMC這個特性要2019年才出來,現在只是提前宣傳,因為現在還不支持SCM。

不過,這個思路不是EMC發明的,是高端存儲之父Moshe Yanai發明的,他在設計的第三代高端存儲Infinibox里,採用AI的方式來做Cache,號稱"neural caching",我在文章AI在企業存儲已有三大落地應用,你知道嗎?里介紹過。

不過,目前PowerMax的緩存演算法沒有AI功能,我看EMC的資料說PowerMax的Cache命中率只有50%,人家Infinidat宣傳自己的神經緩存演算法的Cache命中率可以超過98%。也許明年PowerMax AI版本上線才能改善這個指標。

還有一個地方會用AI,就是在壓縮處理部分。如果用AI分析某些數據是熱數據,就先不用壓縮了,因為反覆壓縮和解壓還是浪費大量的資源的。這個也是有意義的。這個資料裡面都沒有提到,我是聽媒體的採訪才知道的。可憐我蹩腳的英語,希望沒有聽錯。不過,這個也需要等AI版本出來才行。

一句話,智能是路標,PowerMax現在還沒有比VMAX-AF聰明。

三、高效

大家知道,VMAX-AF有壓縮功能,但PowerMax多了一個重刪功能,因此號稱可以做到5:1的數據縮減比。

效率還體現在空間的節省。

還有功耗的減低上。

不過,這塊人家Pure Storage表示不服。Pure的//X採用CFM,自己做的NVMe板卡,密度更高一些,而且Pure的數據縮減自認為做得比PowerMax好,因此,空間的節省更多一些。但是,拿人家一個機櫃來比就有點搞了,因為那個機櫃還是很大地方空的,可以放其他設備啊。

講完3大關鍵詞,我想看看一些實現的細節,特別是區別於VMAX-AF的。

A、Smart RAID

首先講講EMC老強調的雙埠NVMe,這個沒啥特別的,為了可靠性和性能,NVMe SSD最好是雙埠的,華為的Dorado v3用的NVMe SSD也是雙埠的。一般消費級的NVMe都是單埠的。

由於是雙埠,因此每個控制器(Director)都可以訪問一個埠。因此,EMC還包裝了一個術語Smart RAID,由於NMVe協議的並行性,因此每個控制器都可以同時訪問所有的SSD,不管你是否在一個RAID組內。

其實SAS盤也是雙埠的,但是由於SAS/SCSI協議沒有並行能力(一個LUN只支持一個隊列),因此,無法做到Active/Active的RAID組共享。

2、NVMe磁碟框的連接

EMC在PowerMax後端採用PCIe,而不是像很多Startup公司採用RoCE來連接。

由於原來的存儲都沒有支持PCIe的磁碟框(DAE),因此,這是全新的硬體。EMC還是設計成24個小盤,2U高度的DAE。

如果是PowerMax 2000,一個引擎(2控)可以連接兩個DAE。2000最多支持4控,因此,連接方式如下:

但是如果是高端的PowerMax 8000,連接方式就奇怪了。2個引擎(4控)最多支持3個DAE,也即中間有一個DAE是兩個引擎共享的。

看了一下,以為EMC也搞一個HDS和華為老吹牛的4壞3設計,即中間那個DAE的數據很安全,因為任意一個引擎(2控)故障,另外一個引擎也有線路相連,也就是可以訪問?

其實不是這樣。大家仔細看中間的DAE,其實分成兩個部分,前14個盤位是引擎1來控制,後面10個盤位(編號15-24)是由引擎2控制。也就是各訪問各的,如果引擎1故障,那麼引擎1管理的盤也不能被引擎2訪問。

我們看到,中間的DAE的中間4個盤位(編號13-16)是用來專門放置熱備盤的,也就是說,PowerMAX的RAID機制還是VMAX那套,還是需要專門的熱備盤的。

中間的DAE為什麼不平分,而是前面14個盤給引擎1,後面10個盤給引擎2。估計和RAID組的設計有關。EMC一般採用8個盤一個RAID組,7+1或者8+2。不過,PowerMax支持的最大有效容量是由內存的大小決定的,因此,瓶頸並不在盤數上。我用PowerMax Studio做了一個最大配置,大家看看下半部分的DAE的盤是怎麼插的(上面部分是一樣的),很不規律,而且有很多盤位空的。

C、重刪壓縮

EMC的PowerMax這次多了重刪,但壓縮功能也和原來VMAX-AF不同。不過,兩者都通過專門的硬體加速卡來實現的。

大家看看,引擎裡面,NVMe的後端卡和數據縮減卡著兩種類型的卡是新的,其他的卡都是原來VMAX-AF有的。引擎之間還是採用Infiniband連接。

這個模塊不僅僅負責寫入數據的重刪壓縮,還負責SRDF複製時候的數據壓縮。

這是重刪壓縮特性對比。

我們看到,壓縮多了一個EDC,即擴展數據壓縮功能。這個功能是系統不忙的時候,去看看那些不常用的數據是否可以進一步壓縮,這樣可以獲得更好的壓縮率。這個思路其實是向Pure Storage學的。

還有,壓縮的演算法不同。PowerMax採用DEFLATE演算法,而VMAX-AF採用LZS演算法。具體區別大家百度吧,下面是無損壓縮演算法的發展一覽表。我的數學不太好,對其差別了解不多。

不過,PowerMax的壓縮有一點做得不好,估計是為了保證SRDF的兼容性,數據做遠程複製的時候,先要解壓,然後再用SRDF的演算法進行壓縮,對端收到後也多了一個解壓的再壓縮的過程,比較浪費資源。

說完了壓縮,我們來看看重刪,這個是新特性。從EMC提供的流程看,沒有看到hash ID一樣然後進行數據比對這個步驟。

也就是說,PowerMax和XtremIO一樣,都是採用強hash演算法(文檔說採用SHA-2演算法),不比對數據的處理方式。這個和NetApp、Huawei的思路不同。理論上有hash衝突的風險。

D、SLA服務模式

這個和VMAX一樣,採用SLA來進行等級劃分。不過,VMAX靠的是調整LUN的快閃記憶體百分比來調整服務等級,而PowerMax都是NVMe了,只能通過Host I/O Limit來控制前端埠的I/O來降速了。

看,全是NVMe SSD,居然也提供7.2ms時延的銅牌服務。這些主要給ISP用的,因為有些用戶希望便宜的服務,需要把體驗降下來,不然就賣不了貴的服務了。

E、秒級NDU

PowerMax繼承了VMAX的可靠性,甚至秒級NDU能力。

原理就是升級的時候提前把代碼裝載到EEPROM里,然後所有控制器同時熱載入,整體系統只需要10s左右就可以完成升級,業務不中斷。

F、LUN歸屬問題

我們知道,VMAX是沒有LUN歸屬的,也就是LUN可以被多個控制器同時讀寫,I/O無需轉發。但是,LUN沒有歸屬,下面某一個邏輯塊還是需要有歸屬的,HPE 3PAR是CK,而VMAX就是TDAT。

SmartRAID的描述就提到,TDAT是有歸屬的。

這樣設計的好處就是主機只能看到LUN,看不到TDAT,TDAT有歸屬就不需要鎖機制,系統性能更好,而且主機可以對同一個LUN多路徑負載均衡,控制器切換主機不感知,業務影響小。

好,到這裡,我想到的技術要點解讀都解讀完了。最後給大家提一個問題,根據IDC的定義,PowerMax到底算原生型還是改良型呢?

確實,PowerMax有很多新東西,但是,我們看軟體上和VMAX基本一樣,特別是RAID方式和SRDF壓縮的實現等等,我們都看到很多妥協。也就是還是有歷史包袱的,不可能像全新設計的架構一樣輕裝上陣。不過,改良型也有改良型的好處,就是功能豐富,成熟度高。當然,不好的地方就是有妥協,性能無法發揮到極致。

最後,再回到我們開頭討論的,高端存儲已經死了嗎?我覺得沒有,傳統的高端存儲死了,但新的全快閃記憶體高端存儲,雖然不一定叫高端存儲,但本質上還是。也就是說,只是叫AFA而已,但骨子裡還是高端存儲。從這個意義來講,高端存儲還有很長的生命期的。

因此,做高端存儲的做過好夢吧。什麼,碎不著,你聽:星星還是那個猩猩......

籬笆牆的影子

 毛阿敏影視歌曲集

毛阿敏 

00:00/04:38


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 高端存儲知識 的精彩文章:

Gartner眼裡2018最酷的存儲廠商到底是誰?why so cool?
美國人眼裡的存儲領導品牌解讀

TAG:高端存儲知識 |