當前位置:
首頁 > 最新 > 牛x的大甲方信息系統為啥對自動化巡檢情有獨鍾

牛x的大甲方信息系統為啥對自動化巡檢情有獨鍾

隨著智能化的快速發展及信息通信技術的不斷創新,甲方企業信息化運維工作的要求越來越高。如何保證信息系統的安全穩定運行,及時發現和消除信息系統隱患是對企業信息系統運維人員的巨大挑戰。自動化巡檢的應用提升了信息系統運行的可靠性,減輕了運維人員的工作壓力,對大型複雜信息系統的運維工作模式具有重要示範意義。

1

自動化巡檢的目標

1、全面自動化巡檢

對機房基礎環境設備、網路設備、主機設備、資料庫及中間件系統等實現全面監控,形成完整的實時監控系統,自動收集各種監控指標,及時發現系統缺陷和故障,為不同角色的運維人員提供統一的工作平台,對各種運行設備巡檢實行量化、動態管理的現代化手段,促進信息系統運維的科學化管理。

2、全面綜合分析

1)在全面監控的基礎上,建立信息化建設和信息化運維管理展現窗口,從整體業務角度,將各個管理對象有效組織起來,對每個運維環節可能出現的問題,及時發現,快速定位,提前發現潛在的風險。

2)提供各種業務系統的運行狀態展現,讓運維人員和管理人員通過這些數據了解系統運行動態,通過建立科學的數據分析模型來提高系統在數據分並為信息化建設規劃提供有效數據支撐。

3)以運維部門日常管理為主線,根據巡檢器中記錄的數據對巡檢工作的完成情況進行管理,實現日常運維管理的信息化,加強信息系統運維管理的科學化、制度化,提高整體管理水平。

2

自動化巡檢如何實現

高度集成的易於擴展的標準化信息系統自動巡檢平台,可以對各種軟硬體設備運維數據進行自動採集和分析,形成電子巡檢記錄,使信息系統綜合運行質量得到有效提升。信息系統正常運行所採用的技術方法和手段,涉及操作系統、集群、網路、備份、中間件、資料庫、應用系統、監控等相關的信息技術,設備狀態信息採集工作的標準需要包括信息採集的目標、範圍、原則和內容,明確信息設備狀態參數的基礎要素。

通過信息系統自動巡檢平台,可以將多種相關的功能整合在一個展現平台上,使信息系統自動巡檢平台模塊清,層次分明,各模塊之間既相互獨立,又相互關聯,可以實現對被管設備的集中監控和管理,通過Web方式對用戶進行集中展現。

信息系統的數據模型是在各種數據抽取的基礎上構建的,按照系統的數據管理需求和數據管理模式對系統後台業務數據進行類型劃分和來源分析,通過建立科學的數據分析模型來提高系統在數據分析過程中的整體效率及數據可用性。

機房基礎環境透明化

1)機房基礎環境包括機房溫度、濕度、精密空調狀態、UPS電源、漏水、煙感、攝像頭、門禁等,信息系統自動化巡檢平台以三維立體方式,集成展現機房設備對象,實時顯示各項關鍵參數,實現所見即所得的透明化管理。

2)以機櫃為單位通過模擬方式,展現各種設備在機房中的真實位置以及設備實時運行狀況,並且可以通過點擊設備方式與設備管理功能相關聯,實時查看該設備的背板、埠以及流量等。對於重要機房環境數據UPS、溫度、煙感等實時監測,如有異常立即報警。

信息網路設備統一集中管理及故障自動告警

1)實現信息網路設備統一集中管理,主動對核心設備的負載及故障情況進行實時監控,發現故障及時告警,並通過IP地址管理,配置實用的網路管理工具進行高效的核心網路管理,對信息系統的核心設備以及鏈路進行關鍵數據分析,為網路整體規劃提供科學的數據依據。

2)自動發現、構建所有網路使用者的IP、MAC、連接位置等實時信息形成信息網路拓撲圖,並提供基於該地址表的非法網路連接及使用監視告警,通過IP/MAC地址綁定,實時發現非法接入網路設備及用戶私自更改IP地址的行為。通過在系統中設定不同的用戶,並賦予不同的許可權,管理者可以攔截與放行設備,手動或者自動將非法設備隔離出網路。

硬體設備統一集中管理及圖形化界面顯示

1)實現企業全部信息系統硬體設備的統一集中管理,包括小型機伺服器、PC伺服器、存儲設備,可對不同操作系統的主機進行監控,如AIX,Sun Solaris,Redhat Linux,Windows等。

2)通過一體化查看的方式,同時以圖形化界面直觀地顯示出主機的系統和網路關聯信息,技術上採用SSH2、SNMP等多種協議。

4)抽取主機操作系統的運行狀態、關鍵進程、日誌信息、負載情況等信息,對主機設備、存儲設備硬體進行故障掃描並可以及時報警。如果主機空間、存儲設備空間的使用超出閾值平台可以及時報警,並對雙機環境的集群運行狀態進行監測。

資料庫及中間件系統運行狀態監控

實現對多種類型資料庫系統進行自動巡檢管理,實時監控SQLServer,Oracle,Sybase,Mysql,DB2,Informix,SybaseIQ等資料庫系統的運行狀態,實時監控Weblogic,Domino,Tuxedo,WebSphere,Cognos,DSG,OGG等中間件系統的運行狀態。

運維指標抽取及偏離告警

一般企業信息系統運行要求有多項考核指標,從信息系統自動巡檢平台設備及軟體運行數據中抽取相應的數據,根據指標設定上下限閾值,在運維指標出現偏離前發出告警信息,提醒管理人員和運維人員分析指標偏離原因,及時採取運維措施,提高運維指標水平。

高效率智能自動巡檢及預警

1)安全預警根據安全態勢的分析結果建立自適應的閾值設定模型,實現危險狀態警報閾值的自適應調整,並依據設定的閾值對系統的危險級別達到一定程度的安全狀態進行預警,定期輸出安全態勢評估報告,有效幫助相關領導掌控信息系統自身和外圍的安全態勢,準確、高效地進行安全決策。

2)利用所有系統可自動採集的指標和對象,實現定時採集和自動判斷,並以最短15 s的巡檢頻率確保異常事件能被及時發現,不僅可以提供細化到某個應用進程某一列的值進行告警,而且支持更為先進的趨勢告警,準確地把握故障發生前的「異常」,真正做到「事前管理」。

3)自動巡檢結果異常報警方式採用郵件、簡訊、即時通軟體等多種形式,同時系統具有大屏窗口展示功能,運行人員可以通過大屏窗口實時監控,及時發現信息系統運行動態問題。

全網運維分析報表自動建立

建立各種系統自動巡檢報告、缺陷故障報告、運行分析報告和性能分析報告等,信息運維人員和管理人員可以根據這些報告準確評估信息系統整體運行情況,及早發現故障隱患,為管理人員決策提供參考依據。

3

自動化巡檢應用效果

1)較好的自動化巡檢平台一般可具有50多種自動巡檢組件類型,近1000多個巡檢指標,並且實現各類指標的閾值設定和故障告警,運維人員能在不同業務分析場下找到所涉及的關鍵指標,如主機進程、網路設備埠流量、資料庫及中間件運行狀態等。

2)平台以關鍵參數運轉圖方式,動態實時展現設備及系統運行的關鍵參數,使運維人員能及時掌握各類設備及系統的動態變化情況,並及時採取措施,避免產生設備及信息系統的運行風險。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 ServiceHot 的精彩文章:

DevOps工程師成長秘籍
一分鐘秒懂公有雲、私有雲、混合雲……
IT運維話題調研《自動化巡檢與傳統監控之爭》
驚了!多家企業因無ITSS資質證明導致政府項目投標受阻!

TAG:ServiceHot |

您可能感興趣

自動化鐵路系統正在測試中
外媒:華為試圖淡化外界對擁有自己的智能手機操作系統的猜測
人類認知進化來自外部環境和方法論形成的自指系統
三種給電腦重裝系統的方法,總有一個適合你!附:各自具體優缺點
製作電腦系統啟動,安裝引導的方法
美容院的自動化視覺營銷系統
重裝系統的三種方法,適合各類人群
以系統性機構改革推動國家機構職能體系全方位優化
電腦空開機突然出現系統磁碟自檢的解決方法
對抗深度強化學習是如何解決自動駕駛汽車系統中的安全性問題的?
Win7系統怎麼關閉自動更新?Win7電腦關閉系統自動更新的操作方法
現代艦艇的自衛系統:滾動機體導彈系統
自動控制系統:機器是如何進化成機器人的?
數據類型「系統自動編號」
DNF:官方愚人節活動的玩笑,全自動掃蕩副本地圖系統
動力系統與優化演算法
成功實施自動化系統升級的三要素:項目計劃、無線網路和移動性
全自動智能《逍遙情緣》全新組隊系統上線
10種自然的方法來改善你的消化系統健康
水廠沉澱池自動排泥系統的優化研究