當前位置:
首頁 > 科技 > IBM GDPS 五種高可用&災備方案比較及選擇

IBM GDPS 五種高可用&災備方案比較及選擇

企業數據中心的災備和業務連續性解決方案的架構和實施對於企業已經越來越重要。企業需要參考業界實踐來制訂或實施切合自身實際情況的方案,或對現有的實現進行改進提高。本文主要介紹IBM GDPS解決方案家族和實際應用在站點雙活或站點快速切換實施上的一些實踐。

數據中心,顧名思義是數據為王。數據正在成為新的自然資源。這不僅是互聯網時代最與眾不同的資源,也是互聯網時代企業競爭優勢的基礎。數據對每一個公司的差別化競爭優勢,都蘊藏著巨大的潛能。如何利用好數據已然成為最熱門的話題之一。然而千萬不能忽視了根本的根本,那就是如何保護好源數據。準確鮮活的源數據,才是真正有價值的寶藏。保護好數據,就是保護了自己的寶藏、自己的生命線。

簡而言之,災難恢復就是指利用技術,管理手段以及相關資源確保既定的關鍵數據,關鍵數據處理系統和關鍵業務在災難發生後可以恢復的過程。一旦災難發生,災難備份中心就必須要在確定的時間內接替生產中心的運營,恢復既定範圍內的業務運作,保障企業業務連續性。

近代的IT實踐也證明了,數據安全對於業務連續性的重要性,是一個企業生死存亡的大事。雖然歐美很多金融機構早在大數據信息時代來臨之際就著手進行災難備份並加強對業務連續性系統的建設工作,但是直到911事件發生之後,金融行業才開始真正重視災備能力的建設,並投入大量人力物力提升業務連續性水平。911事件中,金融機構聚集的世貿大廈里的大量數據化為烏有,這是對所有金融機構的重大挑戰:

德意志銀行(Deutsche Bank)早在1993年就制定了嚴謹可行可信的業務連續性計劃(BCP),災難發生後,德意志銀行調動4000多名員工及全球分行的資源,短時間內在距離紐約30公里的地方恢復了業務運行,得到了客戶和行業的好評。

摩根士丹利(Morgan Stanley)在25層辦公場所全毀、3000多員工被迫緊急疏散的情況下,半小時內就在災備中心建立了第二辦公室,第二天就恢復了全部業務,可謂金融災備的典範。

與之相反,紐約銀行(Bank of New York)在數據中心全毀,通訊線路中斷後,缺乏災備系統和有力的應急業務恢復計劃, 造成一系列連鎖反應,關掉相關分支機構。

據IDC(International Data Center,國際數據中心)的統計數字表明,美國在2000年以前的10年間發生過災難的公司中,有55%當時倒閉,剩下的45%中,因為數據丟失,又有29%也在兩年之內倒閉,生存下來的僅佔16%。

另據統計,金融業在災難後信息系統停機2天所受的損失為日營業額的50%,如果兩個星期內無法恢複信息系統,75%的公司將業務停頓,43%的公司將再也無法開業,沒有實施災難備份措施的公司,60%將在災難後2-3年間破產。

其實人們早在1970年代就萌發了災備恢復的念頭,1980年代就開始有了為客戶提供災難恢復的數據中心公司成立,客戶的災備意識也有了較大的增長,相關災難恢復計劃的法律法規也開始制定。在1990年著名的千年蟲讓人們在發展災備恢復計劃的基礎上又認識到了業務連續性的重要性。然而,沒有教訓,決心就不堅定。上面的血淚教訓終於讓人們痛定思痛、痛下決心,在數據中心災難備份功能和業務連續性要求上有了更加明確、強制的合規要求。隨著互聯網的崛起,電子商務的蓬勃發展,數據比以往顯得更加重要。各大企業和組織在數據災備和業務連續性的問題上,已經不是僅僅滿足監管要求而已,而是要做得更好。保障數據安全性、提高業務連續性在愈發激烈的競爭中已經變得不可或缺。

IBM主機自1964年正式推向市場以來,一直在世界經濟活動中起到了重要的作用。眾多的關鍵客戶在IBM主機的支持下很好地應對了世界經濟起伏變化的各種挑戰。同時,這些挑剔地客戶也對IBM主機提出了挑剔地要求。在挑剔客戶的促進下,基於IBM主機的解決方案也是日臻全面和成熟。

IBM主機在災備和業務連續性方面的解決方案當然是首選GDPS家族了。GDPS(Geographically Dispersed Parallel Sysplex)是一種多站點或單站點端到端解決方案,能夠讓用戶從一個統一的控制點完成對分布在多個站點的主機系統、磁碟和數據複製等進行自動化的管理和操作,在出現故障場景時自動進行恢復操作。

GDPS還支持多種磁碟複製架構;自動化Sysplex的運維操作;一定程度上兼顧z/OS系統和開放系統的數據;提供開放的架構為客戶定製和裁剪提供高度靈活性;GDPS的實施幾乎和用戶應用無關,用戶仍然只需專註自己的業務邏輯的開發,而並不需要花大功夫特意為災備而進行應用改造。

GDPS家族的解決方案把高可用性和災備恢復能力提供給廣大用戶,為客戶提供跨中心,跨地域的災備、雙活的解決方案,幫助實現計劃內和計劃外停機的恢復程序的自動化,以實現近乎連續的可用性和災難恢復能力。將近20年的客戶實踐,也使得GDPS家族的產品方案日臻成熟和完善。從為保證中心內磁碟的故障,到兩地三中心雙活的實現,GDPS為客戶提供自動化一鍵式的解決方案,大大簡化生產運維和災備恢復的複雜度。

IBM GDPS 五種高可用&災備方案比較及選擇

GDPS家族的五大解決方案如上圖所示:

GDPS/PPRC HyperSwap Manager提供單一數據中心內部數據的持續可用。RTO=0和RPO=0使得業務系統可以在磁碟系統發生故障的情況下保持連續可用。

GDPS/PPRC方案可以提供同城範圍內持續可用和災備方案。同城的兩個數據中心可以是雙活模式,通過不同的配置可以得到Active/Standby模式的RPO=0, RTO<1小時;或者Active/Active模式的RPO=0和分鐘級的RTO。由於核心的部分是跨站點的Sysplex,因而考慮到性能影響則存在一定的距離限制。

GDPS/GM和GDPS/XRC方案可以提供異地災備的能力。在不限距離的情況下,實現秒級的RPO和小於1小時的RTO。

GDPS/MGM和GDPS/MzGM是前兩種方案的混合體,可以提供完整的兩地三中心解決方案。實現同城A/S或A/A模式下RPO=0,RTO<1小時或分鐘級的災備以及異地秒級RPO和<1小時的RTO災備。

最後一個方案,GDPS/Active-Active方案實現了跨中心的雙活和負載調度,實現持續的高可用。設計的出發點是與距離無關。因而採用了基於軟體複製技術的數據複製。同時使用Lifeline產品完成智能載荷跨中心調度。GDPS/A-A產品提供了完善統一的管理服務,使得中心間的切換可以達到一鍵式完成。

以上五個方案分別針對於不同的災備需求(距離,RPO,RTO):

IBM GDPS 五種高可用&災備方案比較及選擇

各位看官您可能也已經注意到了一個事實,那就是僅僅看到幾個GDPS解決方案和它們的一些基本功能並不能解決您心中所有疑慮。那麼讓我們再看一下基於GDPS產品家族在提升業務連續性上的雙活實現或站點快速切換的實踐方案吧。

IBM GDPS 五種高可用&災備方案比較及選擇

在上圖中筆者總結並展望了已經實現的方案和未來可能可以進步的方向。

首先,在業務連續性數據中心業務連續性站點部署的範疇內,我們先以距離為一個主要的考慮維度。那麼,就可以分成同城距離內的數據中心部署和無距離限制的部署(也可以稱作異地部署,但事實上並不要拘泥於必須要異地,同城範圍內也可以使用無距離限制的部署模式)。

基礎上,我們有兩個GDPS基本解決方案,一個是GDPS/PPRC一個是GDPS/AA 。從最初的技術方案設計上GDPS/PPRC為基礎的方案設計就傾向於同城距離的站點部署;而GDPS/AA更適合於無距離限制的部署。因此,在這兩大基礎上發展出來其他的方案。

同城距離的方案中,Cross-Site Sysplex Single Site Workload是跨站點Sysplex(主機z/OS的集群架構)的部署模式。一個Sysplex分成兩個部分分別部署在兩個站點;數據層面通過磁碟同步數據複製技術PPRC(Peer to Peer Remote Copy)實現同步。用戶的工作負載部署在主磁碟所在的主站點。當主站點故障時,GDPS自動實現站點切花和系統恢復。實現災備快速切換。計劃內可以進行應用無感知的站點切換。

Cross-Site Sysplex Multi-Site Workload同樣是跨站點Sysplex的部署模式。和Single Site Workload不同的地方就是在兩個站點都部署用戶的工作負載,實現工作負載的兩個站點雙活。當主站點故障時,GDPS自動實現站點切花和系統恢復。根據不同的具體配置,可以實現計劃內/外的應用無感知切換,或計劃外RTO一小時內的站點切換。

以上兩種方案基本上都採用了GDPS/PPRC的基礎方案,只在一些細節配置上進行調整而實現。

在同城距離方案中,還有一支是從GDPS/AA Sites無距離限制的方案中變異來的。那就是GDPS/AA ZDL(Zero Data Loss)方案。這個方案的最大特色是集成了GDPS/AA基礎方案的軟體複製技術和磁碟複製技術的新特性。在保持了軟體複製的靈活性的基礎上,通過磁碟同步數據複製做到RPO=0。

ZDL方案在實際部署的時候又可以分成兩周部署模式,非對稱部署和對稱部署。根據用戶對業務連續性的要求和實際的站點切換和回切的期望可以選定其中一種進行部署。非對稱模式的特點是在主站點到備站點方向進行切換時,無論計劃內外均做到零數據丟失。但從備站點回切至主站點時採用計劃內的切換手段來保障數據無丟失。顧名思義,對稱模式的部署就是雙向切換都支持計劃內外的零數據丟失。(參見《零數據丟失 -- 開創主機雙活數據中心新模式》)

當採用了ZDL對稱模式部署時,您就會發現在系統架構層面已經是一個具有相當保護數據能力的業務連續性平台了。在這個平台基礎上,根據您對業務連續性和站點間角色的劃分,進一步可以做到是站點切換模式還是平台運行的模式。站點切換模式主要從站點接管的角度來看,用戶工作負載的部署以其中一個站點為主;而平台運行模式則可以根據不同工作負載的業務連續性要求進行雙站點的統一部署和管理。

回到無距離限制的方案,基礎的方案就是GDPS/AA基於軟體數據複製的方案。然而,從用戶的角度一定還有不同的需求。我們也可以設想一下,在異地進行數據中心災備或雙活部署,如果系統層面可以提供一個較好的方式解決由於距離原因而導致的可能數據丟失的問題,那也是很好的。另一個方面,如果有多個數據中心的存在,那麼統一地成體系地對多站點進行管理,同時從工作負載的角度進行多活部署,也會更好地發揮多個數據中心的作用,也是值得探尋的一個方向。上圖中兩個虛線框就想表示這個意思。各位觀眾心裡有什麼奇思妙想,也可以一吐為快。歡迎留言。

總之,進行數據中新的災備建設和業務連續性提升不是一件容易的事情。如果您心裡有困惑,那麼就讓IBM GDPS 20多年的經驗來幫助您吧 —— 從企業級災備規劃、業務連續性規劃,政策法規、監管要求等等方面,提供包括但不僅限於諸如機房選址、數據中心整體災備能力、雙活多活策略、兩地三中心、多地多中心架構部署等的諮詢,提供基於GDPS解決方案的規劃實施、深度裁剪、性能調優等等的服務。做到讓用戶清清楚楚地決策、明明白白地花錢,最重要的是達到預期的目標和效果。同時在運維過程中,不會一出問題就怪網路、一有事情就怪臨時工開的挖掘機。

本文作者:李洪濤,從事IBM主機相關技術和方案實施工作已有24年的經驗。致力於為中國主機客戶提供盡心儘力的服務。對業界其他的IT技術和架構也有充滿興趣。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

Gartner:只有65%的企業組織有網路安全專家
青雲B2B2B新模式 行業雲的邊界再延伸

TAG:至頂網 |