機器學習如何幫助IT管理人員走出運維的泥濘
傳統的運維方式基本都是依賴人工和靜態規則,它們無法適應於動態複雜變化的場景。而人工智慧可以讓運維具備機器學習和演算法的能力,從而在動態變化場景的複雜條件下,能夠做出高效準確的決策判斷。我們需要具有從「基於專家經驗」到「基於機器學習」的觀念轉變。
近年來,機器學習技術在監控工具中的應用已經成為 IT運維與 DevOps團隊的一大熱點話題。儘管相關的使用案例很多,對 IT團隊而已真正的「殺手級應用」是機器學習如何提高實時事件管理能力,從而幫助較大規模的企業提高服務質量。對此,關鍵在於在用戶發現問題之前提早探測異常,進而減少生產事故與中斷的負面影響。
在運維過程中,會產生海量的運維數據,這其中有些可用於描述應用或者系統的運行狀態、有些可用於標籤、有些可用於進行經驗反饋。這些巨量的、多維度的數據是機器學習建立行為模型的基礎。
具體有哪些優勢呢?
首先,機器學習的優點在於可以通過無監督學習實現定製化,從而滿足公司獨特業務環境的需求。機器學習通過採用各種演算法,識別數據中可實際應用於商業活動、挑戰和機會的一致、連貫且循環的模式,從而實現這一優勢。
另外,現今的公司往往都掌握了大量的數據,但是大多未被利用或者不可用,並且可能還正在迅速變化。這些數據太過龐大,即使是整個部隊的分析員也無法奢望能夠完全掌控。有了機器學習,大數據的優勢可以通過將操作智能嵌入到現有的性能管理工具中得到有效實現。例如,假設一家大型百貨商店使用機器學習來分析銷售交易,就可以輕鬆地評估數十億筆交易及相關元數據並從中獲取有價值的信息。這些信息可以被納入現有的工具中,以幫助商店改進其內部運營,並提升端對端的客戶體驗。
不僅如此,機器學習也可以幫助彌補IT運維專家退休或離開公司時留下的空缺。例如,新一代的IT專家未必接受過大型機技術的培訓,而許多領先的企業以及政府都依賴此技術來執行其最重要的應用程序。嵌入智能和應用機器學習技術吸納了大型機專家的技能和知識,可以降低風險,確保機構可以實現持續和可擴展的運營,從而彌補對於優化大型機性能和故障排除等專業能力的缺失。
當然,這並不意味著企業IT運維可以直接無縫向機器學習靠攏。事實上,機器學習可以分成兩個階段的應用。第一個階段是鏈接來自不同IT工具的數據,第二個階段是確定哪裡的關聯是最有意義的。在處理非結構化數據的第一階段,聯繫的過程是並不明顯的。
機器學習可以推斷出不同數據源之間的關係,並確定如何才能將它們鏈接到有關的運行環境中去。演算法包括模糊的匹配規則和如何去識別同時頻繁出現的事件的關聯規則,自然語言中的數據語言分析和根據預測模型建立的估算系統。而在這個過程中又產生了一系列的跨數據的帶有語義標註的數據樣本。
IT運維的發展足以使所有的可自動化功能變得自動,並使用精密的組件工具來確保一切正常運行。IT運維分析已經進入了一個新的時代——一個由演算法處理IT運維的領域,將學習演算法的過程融入在收集的大量數據,警報,票證和測量中,以提取出其被深深隱藏的洞察力,這種洞察力將能夠提供準確的警報,建立情景感知意識,找到根本原因,甚至能預測事件。
來源:IT168
— END —
※淺析機器學習在網路測量和網路數據分析中的應用
※機器學習精華版
TAG:機器學習 |