HDS GAD陣列雙活宣傳支持500KM,真的嗎?
我們知道,一般資料庫雙活都建議不要超過100KM,如果是VM的雙活,理論也不要超過300KM。
但是,我最近看到,一向保守的HDS,居然宣傳其GAD雙活可以支持500KM了。而且,也公布了其不同距離的寫時延的測試結果。
由於讀都是本地讀,因此,讀時延和距離無關。從HDS公布的測試結果看,其IOPS一直上升,但時延基本不變,只和距離有關。最後直到性能飽和了,時延才會突然上升。
從上圖我們也可以看到,由於設備本身有時延,因此距離為0的時候,也有一定的寫時延(不到0.5ms),從測試的結果來看,HDS應該拿的是全快閃記憶體陣列做的測試。然後距離每增加100km,時延大約增加1ms。因此,當距離超過了500km的時候,其時延就超過了5ms。
一般來說,ORACLE RAC的時延不建議超過1ms,而VMware HA可以放寬到5ms。因此,這個500km,超過5ms時延的場景,估計應用集群的超時要特別調整或者定製。
其實,這個距離還和I/O的大小密切相關。據說某大行有兩個數據中心,距離只有75km,大機都實現了雙活了,但開放系統一直沒有部署雙活。因為幾年前他們拿EMC VPLEX+ORACLE RAC做過測試,發現性能達不到要求,因此只好作罷。不過,現在ORACLE RAC應該有新版本,而且有了陣列雙活,不需要增加網關時延,還有了全快閃記憶體,更是可以把存儲側的時延降到最低,因此,也許到了重新評估高I/O開放系統雙活的時候了。
為什麼雙活的距離那麼重要?
1、客觀條件。用戶已經同城已經有了兩個數據中心,你不能為了做雙活重新建一個數據中心吧,代價太大了。
2、增加抗災能力。自然災害很多,有地震、海嘯、風暴、洪水等,距離越遠,抗災能力越強。
比如針對美國而已,一般的容災距離指導原則是:
颶風:170km
火山噴發:112km
洪水:64km
停電:32km
龍捲風:16km
大家看到,如果距離可以支持超過200km的雙活,一般的災害就不用怕了。如果能夠支持500km,估計抗地震都沒有問題。
現在對於業務連續性,一些存儲廠商做了一些承諾。比如最近HPE對其3PAR和Nimble Storage都承諾6個9的數據可用性。
不過如果做不到,HPE也就是免費提供一定時長的支持服務而已。
其實業界對HDS的承諾認可度更高,不是6個9,而是100%。不過,做不到也就是有折扣(最多免費)更換設備而已。
而且,有承諾並不一定保證不會出事,大家記得前段時間the register一直報道的澳大利亞稅務局的事故了吧(參見澳大利亞稅務局(ATO)的存儲宕機報告出爐,但真相還是不了了之....)。
關鍵的關鍵,一般存儲廠商的承諾一般和硬體強相關,但是系統不可用的原因多了去了。Intel公布的數據,關鍵系統,硬體故障只佔20%,運維的原因高達43%。
因此,雙活數據中心將是比較理想的應對之道,這也是這幾年陣列雙活大行其道的原因。陣列雙活由於沒有網關,部署簡單,運維也簡單。HDS的內部blog說,其GAD的部署的季度增長率超過40%,已經部署了幾千套,幾百個PB。現在的高端存儲出貨,有1/3的目標是做雙活。
※IDC 2Q17企業存儲的數據也出來了,居然……
※群暉,比你期待的多更多!
※EMC被Dell收了,HDS也合併不見了,現在又謠傳Cisco收購NetApp,Pure尋求出售,獨立的存儲公司何去何從?
※Dell EMC存儲收購一周年盤點,看Gartner分析師的意思好像……
※從Gartner公有雲存儲服務關鍵能力評估報告里發現了一個巨大的秘密……
TAG:高端存儲知識 |