當前位置:
首頁 > 最新 > 系統三智能運維實踐之四——EOPS分散式自動化運維平台

系統三智能運維實踐之四——EOPS分散式自動化運維平台

本篇介紹系統三7e平台之EOPS

隨著主機下移和小機下移,以及網路銀行的持續發展,系統三目前運維面臨了很多問題,這些問題包括:

一、監控工具BPPM/NETCOOL的問題

  • 中心集中採購的BMC的監控工具,服務端在系統一,所有監控配置的需求必須由系統一統一配置,流程複雜,各團隊想看自己的伺服器圖表比較難操作,不太方便

  • 目前生產在用的功能基本就是關鍵詞告警和固定閾值告警,很多高級功能未開啟,也不方便定製

二、監控工具SCOM的問題

三、自動化部署、配置、變更的問題

四、運維智能化程度不高的問題

五、運維數據利用率不高的問題

上述問題每一個都很實在,都是切膚之痛,因此x86平台亟需一個能解決、或者部分解決上述問題的、成體系架構的東西,它不能只是一個簡單工具或者一個平台,而應該是從方法論到平台實踐到流程管控的貫穿整個運維生命周期的一套技術體系。

系統三團隊自2016年開始的智能化運維轉型與實踐之路,主要的成果之一即分散式自動化運維平台EOPS。本篇重點講述EOPS的功能和架構規劃設計。

用一句話描述什麼是EOPS——系統三團隊完全自主研發的,以x86分散式系統為主要運維對象,基於開源軟體技術實現的一套分散式可擴展的,滿足標準化、自動化和平台化的,提供系統與組件部署、多維監控,以及日誌統計分析等功能在內的綜合運維管理平台

EOPS功能架構

EOPS整體功能上依賴於CMDB配置管理信息,系統三在2015年起建立了自己的CMDB,詳見系統三智能運維實踐之三——EIRMS資源管理平台。以CMDB為基礎,EOPS實現了如下主要功能:

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 x86weekly 的精彩文章:

系統三智能運維實踐之二——基於Kubernetes的容器集群與微服務管理

TAG:x86weekly |