施耐德電氣:全生命周期服務,要交給專業的人
至頂網報道
作者:鄒大斌
專業的事情給專業的人做,效率更高、更可靠,這句話在數據中心行業也同樣適用。隨著雲計算、大數據、物聯網等技術和應用的普及,大大小小的數據中心如雨後春筍般出現各地,相應地,數據中心的設計、建造以及維護需求也凸顯出來。特別是,隨著企業業務與IT的聯繫日益密切(有些甚至業務即IT,比如金融),數據中心的可靠性和可用性的重要性越來越突出,依靠企業現有技術能力越來越難以提供可靠的保障,不少企業開始尋求外部幫助。根據波洛蒙研究所發布的「數據中心成本中斷」報告顯示,自2010年以來,停機時間的平均成本上升了38%,平均每起事件成本超過74萬美元,相當於每分鐘損失成本近9000美元。在這種背景下專業的數據中心全生命周期服務開始贏得關注,一些富有前瞻性的公司也開始大力布局。
高可用數據中心,一個艱巨的任務
如今在各地都能看到各種雲計算園區和大數據園區,據不完全統計全國現在大約有50萬個大大小小的數據中心。大量的新興和改造升級的數據中心的出現帶動了整個行業的變化:一個顯著變化是大型數據中心越來越多。如今10萬台、50萬台伺服器規模的數據中心越來越常見。根據相關統計,以AWS、Google、微軟為首的全球10個超大規模數據中心其伺服器部署量佔到了全球伺服器保有量的10%;另一方面,傳統IDC也在頻繁進行併購和整合以提升競爭實力;第三個變化,隨著節能環保理念的深入人心,綠色數據中心正在被廣泛接受。
與此同時,數據中心的各種故障也是頻頻爆出。根據有關機構的一份2017年的數據統計,18%的數據中心在一年內出現過宕機等業務中斷的情形,另有50% 的企業雖然沒有業務中斷,但也發生過異常事件。因此,如何保證數據中心的高可靠和高可用、低能耗,同時還要降低整體運營成本,成為擺在很多數據中心管理者面前亟待解決的問題。
「數據中心出現宕機、斷電等事故,其原因可能存在於數據中心全生命周期中,包括從一開始的規劃設計到中間的施工再到最後的運營,每個階段都可能誘發最後的事故。」施耐德電氣IT業務部數據中心業務架構總監張子揚表示。
張子揚舉例說,某些超大型的數據中心設計時水系統也採用了雙環路雙系統2N設計(即一主一備),看似高可用了,但有實際使用過程中出於經濟性的考慮,採取單路單系統運行,另一套系統處於長期閑置的狀況,一旦需要進行切換時,其長期閑置組件沒有驗證,就會出現切換時的故障或無法實際切換的狀況,所以做設計的人,應該首先了解業主真實的使用狀況,以終為始進行設計,不能追求過度冗餘。
顯然,要保證數據中心的可靠運營並不是一件十分容易的事情。正因為如此,施耐德電氣推出了數據中心全生命周期服務。張子揚介紹,這是一個沉澱了施耐德電氣在數據中心36年的技術積累、覆蓋數據中心設計、建造、運營的一攬子解決方案,能夠真正覆蓋從CAPEX到OPEX階段進行全過程管理。
「我們會聚焦在四點:第一,在設計上我們會推出諮詢設計和設計驗證服務以保證設計過程本身是可以驗證的,降低系統性故障和更貼近真實業務需求;第二,在建造前後進行雙驗證,前面是設計驗證,後面是測試驗證。這樣才能實現透明數據中心建設過程;第三,抓住運營,提供永續運營的能力;第四,進行二次評估和優化。這是一個完整的閉環過程。張子揚介紹,其最終目的是:通過標準化的、可視化的工具為客戶提供全過程的規劃、運營、升級服務,提高可驗證性,降低運營風險,為用戶的數據中心永續運行提供保障,實現可持續發展。
設計和建造階段,驗證的價值不容忽視
一個好的數據中心是從科學的規劃、設計開始的,科學的可驗證型的規劃設計加上可追溯的建造能為後期運營打下一個非常好的基礎,從而大大降低後期數據中心運營時的隱患。
張子揚告訴記者,數據中心的設計和建造過程中普遍存在如下問題:數據中心建設規模超大,需要管理的資產非常龐大,資產本身所產生的信息更是數量級增長,但是我們的數據中心選址、設計過程缺乏驗證,盲目跟從美國,沒有形成自己的驗證標準;建設階段運維人員很少介入;建設標準和度量衡落後,未完成從面積造價的不精確模式向IT機櫃造價的精細模式的轉換;缺乏有效工具和方法論。
根據上述問題,施耐德電氣提出了自己的全生命周期服務。區別於常規數據中心全生命周期分為四個環節(設計、實施、驗收、升級改造),施耐德電氣的全生命周期服務細分為9個環節,即在設計之前加入了諮詢環節;在設計和實施之間加上了設計驗證;實施後又加上了測試驗證和驗收環節;以及最後的運營、升級改造和新數據中心選址。
施耐德電氣數據中心全生命周期服務的9個環節
強調驗證是施耐德電氣全生命周期服務的一大特色,施耐德電氣也是業內首批提出「設計驗證」者之一。所謂「設計驗證服務」是指終端用戶在最終投入總包實施建設前,一次關鍵性的模擬故障、性能推演服務,以降低系統設計風險,並優化核心指標(PUE、可用性、可驗證性)。由於設計驗證是真正動手實施之前需求的最後一次系統性的梳理,非常關鍵。
張子揚介紹,設計驗證需要藉助一些工具幫助客戶在方案階段、圖紙階段就檢查各種保護是不是成立的,來降低系統性故障和系統性風險。為此,施耐德電氣提供了很多工具,包括權衡工具以及設計參考等,可供免費使用。
「大多數時候,設計中的問題都是隱性的,不容易發現,要追溯比較難。施耐德電氣致力於在業界建立一個度量衡,來看看最終的設計跟初衷(如能效指標等核心指標)是否一致。「張子揚說。
WHOES法則是施耐德電氣的全生命周期服務的又一特色,也是施耐德電氣多年積累下來的經驗總結。WHOES是5個英文字母的縮寫,分布代表了5個方面的內容,即What(這個客戶是誰、他的業務是什麼樣的)、How(尋找什麼樣的路徑來實現這個目標)、Optimize(對尋找到的最佳路徑進行優化)、Engineering(如何工程化、實施落地)、Standardization(把整個文檔標準化,並作為一個完整的文件交出去)。
「WHOES法則是施耐德電氣總結的一個方法論,如果設計工程師都能夠按照這個來做設計,準確度和效率都會高很多。施耐德電氣的架構師都是按照這個WHOES法則進行工作的,這也是我們做諮詢設計和設計驗證的優勢。」張子揚表示。
運維到運營 賦予服務更高的價值
數據中心是一個長期的投資,除了前期的設計和建設,後期的運維一樣重要。與設計和建造不同,一旦數據中心投入使用,運維將會始終相隨。而且,如前所述運維對數據中心的可靠性和可用性的影響是顯性的、直接的,比如,數據中心停機事故中人為誤操作高達70%。
「根據我們的經驗,數據中心運維真正的考驗是在數據中心建成5年以後,此時設備進入老化階段,壓力會集中爆發。」施耐德電氣IT業務部全生命周期服務業務拓展經理蔣勝表示,但在實踐中客戶普遍重視設計和建設,而對運維重視程度不夠。
蔣勝介紹,數據中心運維的關注重點是可用性、可靠性和能效,這些都是一個長期的工作,需要持續改進的。正因為此,施耐德電氣更願意將數據中心的「運維」稱為「運營」。
「運維是指運行和維護,這個是最基本的,是保證數據中心正常的運行;而運營指在數據中心在運行的過程中要產生價值,要不斷優化,要給客戶帶來價值,甚至可以為客戶優化成本並幫助客戶實現主營業務的增值。」蔣勝說。
他介紹,施耐德電氣在運營服務方面分別提供三個層次的服務,一個是維護集成服務,它相當於服務的總包,集成管理客戶所有的供應商,維護合同,幫助出報告和出維護標準。第二個是維護管理服務,比維護集成服務高一級,如果供應商不能夠及時到位,施耐德電氣會派工程師到現場服務,另外還負責制定運維流程。第三個是關鍵設施運營,國內普遍稱為代維服務,是駐場服務,也是最高等級的運營服務。
近年來,有些客戶提出打造自己的數據中心運維團隊,蔣勝認為,客戶最應該做的還是專註於自己的核心業務和競爭力建設,這也是數據中心運營服務的核心價值之一。除此之外,運營服務的價值還包括獲得更多的正常運營時間和更高可用性、可靠性;通過優化和維護來實現節約成本;通過基於標準的、質量驅動的全面能力實現服務的可伸縮性(既可以給客戶提供駐場服務,也可以培訓客戶自己運維)等。
今天,隨著數據中心的大量湧現,市場上出現了不少提供數據中心相關服務的廠商,服務也林林總總。蔣勝告訴記者,相對同類業務施耐德電氣全生命周期服務的不同之處在於全方位的解決方案。
「施耐德電氣在數據中心擁有覆蓋最廣泛的產品線和解決方案,以及豐富的數據中心運營管理經驗,我們擁有一套完整的標準化的流程和專家級的維護服務。此外我們也不斷針對客戶需求推出多種數字化工具,比如數據中心數字化運維平台、數字化能效管理平台等,以推動數據中心管理的數字化轉型。這些都是施耐德電氣與眾不同之處,也是能幫助客戶最終實現卓越運營價值所在。」蔣勝說。
-END-
至頂網
一個談新技術和新商業模式的信息服務平台,致力於記錄和推動數字化創新,服務CIO、CTO等技術和商業的決策者、從業者。
※阿布扎比有一個「智慧港口」
※十三連射:IBM公司一舉發布大批存儲軟體新功能
TAG:至頂網 |