當前位置:
首頁 > 科技 > 澳大利亞稅務局的存儲宕機報告出爐,但真相還是不了了之……

澳大利亞稅務局的存儲宕機報告出爐,但真相還是不了了之……

Register的記者Simon Sharwood前兩天說澳大利亞稅務局(ATO)關於HPE 3PAR存儲的兩次宕機事件分析報告出來了。這估計是該記者最後一次報道這事了吧。

原來他前前後後寫過好幾篇文章追蹤報導,說一直要追蹤到調查報告出爐。

關於這事,HPE發言人也給記者發了一個官方的解釋:

現在,這個調查報告終於出來了,發表在ATO的官網上,鏈接如下:

https://www.ato.gov.au/uploadedFiles/Content/CR/downloads/js39322_ATO-systems-report_w.pdf

這份報告一共22頁,還是有一些詳細的信息。

比如,大家仔細看備註,發現HPE 3PAR的設備型號居然是高端全快閃記憶體陣列3PAR 20850,HPE推薦用這個當時(2015年)這個最新的型號來替換EMC的存儲。兩次出事的居然是高端存儲,而且還是全閃。

但出事的原因,好像交代得不太清楚,最少說了下面幾點吧:

1、SAN光纖問題。應該是3par 20850後面的磁碟框的SAS光纜有問題。第一和第二次都是由於光纖的問題觸發的故障。至於為什麼光纖會造成故障,報告也沒有講得太清楚。

2、硬碟的固件問題。可惜報告沒有點名是那個廠商的硬碟。由於3par 20850是AFA,因此肯定是SSD盤。我知道三星應該是3par的SSD供貨商之一,不知道這個是否是三星的SSD。固件的bug造成3par陣列不能複位SSD,這個原因裡面提了。

當然,裡面還提到了監控沒有搞配好,導致故障前的警告沒有第一時間自動回傳給HPE。另外,這是一個turn key的項目,外包給了HPE,用戶自己關注不夠,而且可靠性設計不夠好,更關注性能和成本了。比如備份的配置也放在同一個陣列,造成陣列故障的時候,備份也不能用。

(怎麼感覺有點想西安地鐵壞電纜的事件似的,看來HPE有低價中標的嫌疑)

但是,我看其一共用了兩台3par的陣列,一個在悉尼數據中心,一個在悉尼西數據中心,採用非同步複製的技術。雖然不能自動切換,但是一個數據中心故障後應該可以手工切換到另外一個中心才對啊?報告說沒有進行過切換的演練,但是好像也沒有做切換嘗試,可能怕數據不完全一致吧?因為畢竟是非同步複製(估計距離太遠)。

文章最後說,要繼續加強可靠性設計。今年年底要改成下圖4陣列的形態。

看來客戶還是覺得HP XP7(OEM自HDS)要更可靠性些,因此,打算上兩套XP7做生產存儲,分布放在兩個數據中心,做非同步複製。原來的3par存儲作為開發測試環境使用,也做非同步複製。但同一個數據中心內,XP7和3PAR做同步複製。

大家可能奇怪,XP7和3par是不同的平台,怎麼能做同步複製?剛開始我也沒有想明白,後來我像通了,應該是利好了HP XP7的異構虛擬化功能,把3par接管過去,採用卷鏡像的方式來實現異構的同步複製。

另外,ATO已經把WEB伺服器遷移到公有雲上了,因為他們覺得公有雲更安全一些。以後估計更多的應用會遷移到公有雲。

據說現在3par的存儲已經全部更換了,老的存儲HPE 3PAR要拿回去再分析。也許有新的故障診斷髮現也不一定。但我估計ATO的事件真相可能永遠都不會大白於天下,但也無所謂,這份22頁的報告還是看出ATO的一些改進的措施,其他用戶如果關注關注存儲的可靠性問題,也是可以仔細閱讀,也許會有一些啟發。

其實,上一套陣列雙活加異地複製的兩地三中心方案就比較理想了,這些故障也許都能避免。

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 高端存儲知識 的精彩文章:

全球伺服器市場格局簡述,又跌跌跌跌跌跌跌跌了……
近期SPC-1新測試規範受捧,宏杉、富士通和華為相繼發布新測試結果
NetApp HCI的計算節點和存儲節點是分離的,這也叫超融合?宣傳理念有點像參數帝Pivot3!
交流-孩子什麼都不說怎麼辦?

TAG:高端存儲知識 |

您可能感興趣

手機的存儲空間,為什麼總是很快就用完了?
人的大腦的存儲量相當於多少內存?,說出來你都不敢信
當存儲的中期茶出現一下情況,該如何處理呢?
蘋果與長江存儲談判,中國存儲晶元終於崛起了嗎?真相讓人不敢相信!
磁帶逐漸在時代中消失,你以為它沒用了?其實它是數據存儲的未來
記憶是如何形成的、又是如何存儲在我們的大腦里的?
還在為有限的存儲而煩惱?榮耀存儲一步解決
與傳統存儲方式相比,雲存儲都有哪些優勢?
手機的存儲空間,為什麼那麼快就用完了?
人類的大腦相當於多少存儲,說出來你一定想像不到
如今都在搞雲存儲,移動硬碟就不需要了嗎?
這麼清理手機內存太高效了,手機的存儲空間省了很多
隨著雲計算的發展,存儲又該何去何從?
存儲市場疲軟,未來的路在哪裡,如何走?
你在使用多大存儲空間的手機?
存儲器需求量最大的?竟然是最被忽略的它!
存儲器降價了,產業的繁榮是否到此為止?
如果大腦是硬碟的話,那麼它的存儲量是多少?會超出上限嗎?
手機清理,教你這幾招,手機再也不提示「存儲空間不足」
公有雲在發展,存儲賣得更好了