當前位置:
首頁 > 最新 > 運營商存儲系統需求與發展趨勢探討

運營商存儲系統需求與發展趨勢探討

最近接觸了不少業務支撐系統的朋友們,看到了各種業務需求,以及各種存儲的使用方法,同時也接觸和研究了一下開源分散式存儲。由這些,可以觀察運營商,尤其是支撐系統的存儲需求與發展趨勢。在此做個總結,同時讓時間驗證觀點。

先說結論:

1.性能、可靠性、成本、使用方法等方面的因素使存儲分層級使用越來越普遍和細化

2.核心業務依然是傳統企業存儲為主,並快速向全快閃記憶體存儲過渡

3.各類分散式存儲佔據海量存儲和雲計算領域,並在向核心應用滲透

4.大數據、分散式資料庫等新技術不會使「存儲」消失,反而促進了存儲的新用途出現

5.未來,很可能有一種融合分散式架構與傳統企業存儲的新型企業存儲成為新的運營商存儲系統,解決性能、可靠性、運維等問題

在詳細分析前,先說明一下分析問題所站的視角。國內運營商沒有類似CIO的高層綜合決策者,所以這個分析是站在各個IT建設、運營部門的視角視角來看問題,而不是採購部門,或IT廠商,所以主要是從功能、維護角度出發,兼顧成本。而其中維護的比重會很大,因為具體IT部門要直接面對維護問題,而運營商的自有維護能力,與互聯網廠商區別可以說是兩個平行宇宙。

一、存儲需求的分層級化

存儲需求分層級主要來自於幾個方面:

由於業務互聯網化,流量業務、內容計費的快速發展,核心數據吞吐量大規模的增長。簡單點說就是單位時間內要處理的業務越來越多,業務高峰越來越多,峰值越來越高。

數據量爆炸式的增長。數據量增長不但來源於業務量增長,還源於數據保存期延長,以及各種新型數據的不斷出現。比如業務和網路日誌數據,客戶行為數據,網路爬蟲數據,這些數據最終都由大數據平台進行處理分析,可見數據量也是巨大的。

新的數據和數據使用方法的出現:傳統的數據主要是資料庫和文件,以結構化數據為主,包括文件很多都是有格式的。而現在對象、消息等數據的新的數據使用方式,視頻、圖象、非結構化文本等數據大量出現,相應的出現了專門處理這類數據的存儲系統。

傳統上運營商的IT系統會使用單一的企業存儲,通過SAN或NAS功能提供存儲服務。而新的業務需要,使傳統方式在性能、容量、擴展性、成本、功能等方面都不能直接滿足全部的需求,因此分層級就成為必然的選擇與趨勢。

二、核心業務仍以企業存儲為主,並向全快閃記憶體存儲過渡

目前分散式存儲大熱。但近期接觸的大量客戶基本上認為,在運營商的核心業務,尤其是支撐系統核心業務中,暫時不會使用分散式存儲。為什麼在核心業務中企業存儲仍難以替代,客戶主要考慮的是以下因素:

核心業務規模並不大,但性能要求非常高,要求存儲以少量的容量,提供極高的性能,這本是企業存儲的強項,而全快閃記憶體儲更是極大的提升了這方面的能力。分散式存儲在此場景沒有性能優勢,而擴展性的優勢在此場景無法發揮。

核心業務的可靠性要求極高。企業存儲的設計中高可靠性是其中重要的一部分。相對來說分散式存儲基於伺服器,可靠性保障的基礎基於伺服器可靠性,加上分散式存儲廠家眾多,產品能力參差不齊,很多廠家的產品可靠性不具備核心業務應用條件。客戶不想在核心系統冒險嘗試。

核心業務的重要性也對運維能力提出了很高的要求,當前運營商自身的運維能力有限,而企業存儲的運維很成熟,多數客戶對分散式存儲的運維能力則還在構建中。

業務改造風險也是經常需要考慮的問題尤其是業務規模很大的系統,使用分散式存儲很可能要伴隨業務改造與跨平台(從小型機遷到X86)數據遷移,風險和成本都很高。

長期以來,運營商IT部門使用企業存儲的各類增值功能,用於實現容災、讀寫分離、測試等場景。而分散式存儲這方面起步比較晚,並且除菊廠以外,多數廠家都不具備這方面能力。替換的綜合成本是很高的。

總之,核心系統事關最終用戶體驗和運營商的業務支撐能力,一旦出問題影響巨大。運營商客戶們在積極探索新技術,但在核心業務上則會比較慎重。其實阿里去IOE也用了很多年,新技術的使用本就是一個漸進的過程。

而從去年開始,很多省支撐系統的核心系統都採用全快閃記憶體或配置SSD盤的融合存儲替換現有核心業務存儲系統,取得了業務性能大幅度提升,運營成本大幅度下降的良好效果。現在越來越多的核心業務系統開始考慮使用全快閃記憶體存儲。在保證性能的前提下,成本方面,由於RAID方式存儲利用率更佳、重刪壓縮技術應用,以及本身成本下降,目前全快閃記憶體存儲在採購成本上已大幅度下降,如果再考慮機房、耗電,以及運維和不需要業務改造帶來的成本和風險下降,核心業務使用全快閃記憶體存儲反而具備一定成本優勢,而其可靠性、增值特性繼承自傳統企業存儲,並有新的發展。可以說小而美的全快閃記憶體存儲是運營商核心業務目前的最佳選擇

三、分散式存儲佔據海量存儲領域,並向核心業務滲透

近年來分散式存儲在運營商發展很快。相對傳統企業存儲來說,分散式存儲的架構優勢在於擴展能力,因此更適合海量數據的存儲。而目前數據量的爆炸式增長,以及這部分數據相對低的性能和服務等級要求,正好給了分散式存儲很好的發展機會,發揮其高擴展性,低成本的優勢。因此分散式存儲開始佔據存儲分層級的海量數據層。

分散式存儲快速發展的另一個推動力是雲計算。雲計算按需服務、彈性擴展的特性,決定了在大規模部署時,其存儲層也必須具備良好的擴展能力,這方面正是分散式存儲的強項。

分散式存儲廣泛應用還得益於新的業務架構被引用到運營商的業務系統中。比如很多互聯網應用中使用的對象存儲,傳統應用需要改造才能使用,而部分新開發應用因為借鑒了互聯網應用的架構,開始支持對象存儲,一些互聯網或雲計算應用的移植,如備份、視頻處理軟體也促進了對象存儲等新型存儲在運營商系統中的應用。

而像華為這樣的同時開發企業存儲和分散式存儲的廠商,基於企業存儲的技術,結合大規模部署的需求,移植了大量企業存儲的特性到分散式存儲中,提升了系統可靠性並提供了容災、快照等多項企業存儲特性,使分散式存儲可能用在更多場景。目前很多客戶都在積極嘗試和使用分散式存儲,通過實際使用進行磨合,積累使用維護經驗,並計劃根據使用情況逐步擴大使用範圍到小規模的核心系統。

四、分散式技術並沒有使存儲消失,而是創造出新的使用場景

當前很多新的應用系統,如分散式資料庫,HADOOP,大量採用的是物理伺服器計算與存儲一體化部署方式。一些小規模系統如內存資料庫、Mysql也使用伺服器本地盤方式部署,再通過集群或分散式數據路由保障可靠性。似乎這樣的部署架構,存儲產品將要消失了。其實不然,我們看幾個例子:

1.某省話單排重使用了MongoDB,但本地盤的IO性能不足,後來改為使用企業存儲,問題解決

2.如果上面例子顯得有點土,那麼再來看看互聯網廠商的例子:

(1)阿里云為了實現大數據上雲部署,實現了在其對象存儲上部署HADOOP

(2)阿里云為實現混合部署來提升虛擬機CPU利用率,採用了計算與存儲分離的方式,把虛擬機使用存儲全部放在統一存儲池中,通過網路遠程訪問,再在虛擬機和存儲池中部署交易系統和大數據應用

(3)亞馬遜推出基於其雲計算和S3存儲的數據湖解決方案,解決數據湖數據流轉與共享

(4)FaceBook自研「溫數據存儲」實現「分解式的存儲」,採用計算和存儲分離的方式部署內部大數據平台,解決計算與存儲資源不匹配,本地盤部署可靠性低,計算和存儲一體維護時互相干擾等問題

可見沒有最好的技術,只有合適的方案。隨著技術的進步和大規模部署對可靠性、性能、靈活性等方面需求的提升,很多從起步起就是部署在本地硬碟上的業務正在「回」到存儲上,所謂分久必合,合久必分。

五、運營商存儲發展趨勢

未來運營商存儲會如何發展,我覺得需要根據運營商的業務和組織特點來分析。單純談技術是沒有意義的。大家都認為Google,亞馬遜的技術很棒,但真正能像他們那樣運用IT技術的,也就BAT等少數幾家而已。不管國內還是海外,運營商、銀行等企業都需要按自身的情況來構建自身的IT系統,而不可能全照搬互聯網企業的模式。

首先運營商的業務複雜度是很高的,業務量是很大的,並且很難改變這一點。因此如果用一種存儲提供所有的存儲服務,那麼它必須同時具備高性能、大容量、多協議、易擴展等多種形態,然後將不同形態的存儲服務在同一個資源池中統一管理,提供給雲計算平台。

這樣一來,當前的企業存儲和分散式存儲就需要融合。早在2002年,企業存儲中就有像XIV這樣的「網格化」先驅(先烈?)出現了,這比SDS的概念出現還要早10年。而華為目前正將企業存儲的大量特性移植到分散式存儲中。是企業存儲吸收分散式存儲的特性還是分散式存儲吸收企業存儲的特性?其實殊途同歸。

但不管誰融合誰,運營商仍會主要使用「企業」存儲,雖然其架構與之前可能有顛覆性的變化,但「企業」這個特性不會變。這與運營商當前的組織結構,人員結構,維護能力是相關的。尤其是核心業務,考慮其性能要求、可靠性與維護性要求,軟硬體一體化,具備強大維護支持能力的解決方案是首選,用這樣的方案目的就是用得放心,省心,解決問題和少出問題就是最大的節省。還是那個觀點:沒有最好的技術,只有合適的方案。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 紅松鼠的IT窩 的精彩文章:

TAG:紅松鼠的IT窩 |