SDS之Object Storage:對象存儲-生於時代,長於場景
【編者Peter Ye按】
十年了,我還是喜歡下面這張圖,它表明了存儲發展的趨勢。
在這漫長的發展中,對象存儲將隨之茁壯成長。還記得第一次見這張圖的時候,是我2008年從EMC剛跳槽到Compellent(2011年被戴爾收購),從雷濤(現任天雲大數據CEO)那看到的,彼時很欣喜的發現Compellent的流動數據架構的精髓,Dynamic Block Architecture,已經有了對象存儲的影子。
Compellent前端介面採用主流的SAN存儲之FC,是非常明智的選擇,使其不會成為先烈(EMC Centera不錯,但太早誕生,不幸夭折),而成為了先進,它在2003或2004年推出的自動分級存儲技術,足足領先EMC整整5~6年!而這只是它Dynamic Block Architecture的體現之一,另外其Data Instant Replay(近CDP效果)是其另外一個體現,基於這個架構還有非常大的潛力。
綜上所述,您可以發現對象存儲能夠給帶來無以倫比的靈活性和功能的豐富性。
隨著,雲計算、大數據、軟體定義存儲的普及,是時候了,對象存儲恰逢其時。我們了解一下,從備份軟體廠商的視角,如何看待對象存儲的。
---Begin---
越來越多的人開始承認,他們低估了對象存儲。這當然不必過於苛責,畢竟大多數人都不具備從青萍之末,預測到狂風驟雨的能力。
在Gartne發布的「2017年存儲技術成熟度曲線」上,作為破壞性創新典型代表的對象存儲滑落到了「泡沫化的底谷期」。
—2017年存儲技術成熟度曲線—
不過不用擔心,這僅僅是從技術層面而言,在業務層面,越發成熟的對象存儲在2-5年內將迎來他的發展高峰,不管是開源還是閉源,不管是軟體定義還是硬體定義,不管是IT巨頭還是創業公司。
不過如果深究爆紅的原因,則並不是因為對象存儲在一次意外掉下懸崖被一棵大樹接住撿回一條小命還順便撿到一本武功秘籍沒怎麼苦練就打通了任督二脈而成為絕世高手。而是它趕上了一個好時候。就像郭靖原本只是四川嘉陵江地區一個地方土豪的護衛隊首領卻在金庸筆下的那個亂世成為了郭大俠。
對象存儲這個概念最早可以追溯到20世紀90年代中期,但商業產品卻直到2003年的時候才出現。那個時候的純粹還是主要以追求性能為第一要務。而隨著大數據、移動互聯網時代的到來,非結構化數據量呈現出爆發的態勢,以證券行業為例,隨著電子化、無紙化進程的深入,非結構的文件數量呈現出爆發的態勢,數據的傳輸、查詢、備份、歸檔等日常業務開展都面臨不同程度的影響。
這個時候對象存儲的優勢便得以凸顯。對象存儲是把存儲層與應用層進行分離,將數據看作「對象「來處理。具體表現為,首先是它的協議支持,對象存儲先是基於HTTP(S)協議,採用基於REST的API調用存儲和檢索數據,專為使用API 在應用級別(而非用戶級別)進行訪問而設計。隨後增加了NFS和SMB。這就好比孫悟空先是學了七十二變,然後又學了筋斗雲。
其次,對象存儲具有更高的可擴展性。塊和文件存儲是將數據放置在目錄層次結構中,而對象存儲則是將數據存在於平面地址空間內。舉個例子,塊和文件存儲住的是一棟一棟的樓房,而對象存儲住的則是一片一片的平房。因此在橫向擴展中可以有更好的表現。
如果問一款產品的爆紅有什麼不二法門的話,那麼就是如何更好的滿足需求。這種需求在很多時候可以理解為一種具體使用場景。
如果我們對三種類型的存儲做簡單對比的話,大致可以得出如下這張表格:
這個表你已經可以忽視它了。因為脫離了場景的對比其實並沒有什麼意義,這就好比討論孫悟空和超人誰更厲害一樣毫無意義。
相比於傳統的塊存儲、文件存儲等,對象存儲已經在特定場景中找到了自己的用武之地。此前,Gartner發布了2018對象存儲關鍵能力評估(參考1),其中對幾個主要應用場景做了能力對比,本文則主要討論在這些場景中為什麼是對象存儲?
1、歸檔場景
最主要的催生因數當然是另一個重要原因當屬GDPR等數據保護法規的不斷推出。也就是說數據需要更長的生命周期。
通過與歸檔軟體、分級存儲軟體結合,將在線系統中的數據無縫歸檔/分級存儲到對象存儲,釋放在線系統存儲資源。越來愈多的廠家對象存儲提供幾乎可無限擴展的容量,智能管理能力,幫助用戶降低海量數據歸檔的TCO;對象歸檔採用主動歸檔模式使得歸檔數據能夠被按需訪問,而無需長時間的等待和延遲。
本文我們曾經討論了對象存儲的扁平化的數據結構,這種架構的好處就是允許存儲容量從TB級擴展到PB乃至EB級,同時解決了文件系統複雜的索引節點帶來的擴展性瓶頸。比如英方的對象存儲管理產品i2DTO,就可以應用於Windows和Linux操作系統上,將數據遷移、數據准實時和定時備份到對象存儲上,降低了存儲成本及維護成本。
2、備份場景
如果說歸檔的數據是一種「凍」狀態的話,那麼在備份場景中,數據更多的是作為一種「冷」狀態存在,不過隨著「等保2.0「的提出,這種「冷」狀態將會有所改變。知名市場分析機構MT認為,數據備份和恢復市場快速增長的主要驅動因素除了快速增長的數據量之外,還包括企業對卓越運營和數據質量管理的關注日益提升。此外,雲端數據備份解決方案的日益普及也是關鍵因素。
對象存儲可以說是為備份而量身打造的。其安全、經濟、可擴展等特點是備份場景中都需要的,比如Amazon的S3(SimpleStorage Service)以及Azure的Blob。Azure表示,2014年它存儲的對象就有大約20萬億個。隨著相關技術的推進,對象存儲也使得雲服務商的雲備份服務在災備環節中表現得更為出色。
3、網盤場景
在海量存儲資源池基礎上,使用圖形用戶界面(GUI)實現對象存儲資源的封裝,向用戶提供網盤產品成為對象存儲重要的應用之一。放眼目前市面上的SaaS類的網盤產品很多都是基於對象存儲進行搭建。只需在公有雲平台上購買LVS、業務伺服器、RDS,輔之以先使用後付費的對象存儲,那麼一套網盤產品的基礎架構即可搭建完成。
當然,在這個紅海市場中,差異化將至關重要。以英方的i2Share為例,依靠英方在位元組級實時數據複製和真正CDP數據保護技術,i2Share主打備份與分享合二為一的理念,滿足企業用戶數據保護與辦公場景的具體需求。
4、分析場景
大數據分析越來越成為一種必需品在,輿情分析、互聯網金融風控、BI報表、3D建模……而要做到數據分析首先要解決數據存儲調用的問題。
對象存儲對外提供更抽象的對象介面,而不是SCSI或文件介面。與SAN存儲以邏輯扇區為單位的較細粒度的固定IO(512B~4KB)不同,對象存儲IO粒度更具彈性,可以支持B(位元組)級到TB級範圍內的任意大小,使得數據可以靈活分割以供不同業務的使用。
未來伴隨著產品和市場需求的相互影響,對象存儲業務的數據層面與控制平面都還有更為廣闊的發展空間,而在產品和需求對應匹配的過程中,對象存儲需要更多的前瞻性。最後,祝福每一位從業者,儘快找到你的產品切入點,在起風的時候就做好準備。
·本文首發於樂生活與愛IT公眾號
CriticalCapabilities for Object Storage:
https://www.gartner.com/doc/reprints?id=1-4PTQGGY&ct=180129&st=sb
TAG:英方雲 |