當前位置:
首頁 > 科技 > 聯想上萬台網路設備如何做到一切盡在掌握?

聯想上萬台網路設備如何做到一切盡在掌握?

至頂網網路頻道 01月12日 綜合消息: 當今世界企業的日常運營越來越離不開IT,這使得IT系統也越來越多,而我們越來越依賴IT的時候,就會對包括網路設備在內的IT底層基礎設施的管理帶來了巨大挑戰。特別是像聯想這樣的世界500強企業,業務遍及全球160多個國家和地區,在全球擁有5.2萬名員工之一,要保證所有網路設備都穩定可靠運行,無疑是一個相當艱巨的任務。而這個任務需要包括IT網路團隊與監控團隊等團隊合作完成。聯想集團的IT監控中心與網路團隊一起,依靠監控工具和一套最佳實踐的幫助,順利地完成了這一相當富有挑戰的工作,進而為企業數字化轉型提供了有力支撐。

監控上萬台網路和伺服器設備

聯想集團的監控中心隸屬於聯想IT管控中心,主要負責IT系統端到端的監控方案設計、部署、運營及優化。監控範圍涵蓋APM、業務流程監控、應用平台、資料庫、中間件、伺服器、網路、存儲、數據中心設施等,監控超過百個應用系統,所監控伺服器、網路設備數量均超過萬台,而且監控的設備數量和應用系統還在一直增加中。

這個工作看起來很專業,但其實與每個用戶息息相關,比如大家訪問一些網頁和應用的時候感受怎麼樣,用多長時間打開這個網頁,還有業務流程、業務數據和應用是不是可用等指標,都在其監控範圍內。而用戶訪問一旦要出現故障或者體驗不佳,則需要深入網路和伺服器層面進行分析。然而,聯想的網路規模既龐大又複雜。

據聯想集團管控中心監控經理胡永介紹,作為一個全球化的公司,聯想在全球辦公室已經超過200多個,擁有多個數據中心,每個地區的公網、網路環境都不一樣。「這樣造成了:在使用一些通過網路交付的應用時,如果出現用戶體驗不佳或者應用出現問題時,很難定位問題,特別是訪問一些網路應用的時候,如果性能不佳,我們很難去分析到底是應用問題還是網路問題,如果是網路問題,到底是當地網路情況還是數據中心的網路問題?」胡永說。

聯想上萬台網路設備如何做到一切盡在掌握?

聯想集團管控中心監控經理胡永

其他遇到的挑戰還包括:已有網路監控方案專註於網路設備,缺少對網路流量的提取和分析,無法主動獲得應用在網路上運行的狀態與用戶的真實體驗,比如,過去對網路設備的性能有一些指標可以獲得(包括埠是否可用、吞吐量多大等),但缺少網路整體監控,如果網路設備本身出現問題可以了解到,而網路線路出現問題則不容易主動發現,很多時候只能被動等待用戶提交工單來告訴運維人員。另外,網路信息廣泛而離散,缺乏統一的、定製化的展現與智能化的關聯分析。歸結這些需求,監控中心感覺到有必要實施NPMD(Network Performance Monitoring and Diagnostics)方案,這對於保證IT系統的性能和最終用戶感受,具有非常重要的意義。

實際上,聯想的這一需求並不意外。Gartner的研究表明,IT運維管理正在轉型,即業務正在不斷地驅動著IT運維管理朝著以應用/業務為中心發展,與此同時,應用也變得越來越難於管理。而另一家分析機構Forrester也認為,關鍵複雜應用如果不具備高性能和高可用性將直接給業務生產力,業務收入和IT效率造成負面影響。

全網運營盡在掌握

從2015年開始監控中心開始著手考察NPMD系統,在已經實現APM、DEM 以及ITIM 監控之後,再補足 NPMD。對於這個系統設立了以下一些關鍵目標:建立完整的網路流量採集、監控分析平台;實現網路流量及網路性能的分析與可視化;實現網路流量原始數據的隸屬數據回溯分析;協助運維團隊,加快網路性能故障的分析定位。

「我們的最終目標是建立一個完整的、能夠把網路流量搜集起來進行統一的分析、關聯,把整體的狀態完全可視化展現給大家的一個平台。」胡永表示,而最高目標也是所有IT部門的目標,就是降低運維成本,提高運維質量。

經過全面考察,聯想最後選擇了Riverbed的NPM方案。談及選擇Riverbed的原因,胡永表示,除了之前和Riverbed有著長期的合作建立起來非常好的合作關係之外,還在於Riverbed的NPM方案技術的先進性以及能很好地滿足聯想的需求。這包括Riverbed的NPM在Gartner連續四年NPMD的排名中位列領導者象限;第二,因為聯想的網路環境非常複雜,有不同類型的應用,而Riverbed也支持多種應用類型的監控;第三,也是聯想非常關注的一點,是Riverbed的NPM方案可以支持上百個各類網路性能指標的監控。

「Riverbed的NPM不只是能看到網路設備的情況,還能看到整體網路性能,這是很多網路監控方案所缺失的。」胡永說。

而最後還有一個原因是,聯想一直希望有一個統一的展示平台,把所有監控到的信息、收集到的信息進行統一展示,以方便聯繫其他的團隊查看當前網路狀態,並利用監控中心提供的信息做進一步優化或診斷,而Riverbed的NPM就能滿足這些需求。

2016年,聯想開始部署和實施Riverbed的NPM方案,涉及聯想在北京、香港、美國和德國伊森共4個數據中心。方案採用分散式部署與集中展現相結合,在這些核心數據中心當中部署了Riverbed的SteelCentral AppResponse設備,通過它把數據流量進行統一收集,進行分析和展示。另外,NPM方案針對聯想員工廣泛使用的統一通信Microsoft Lync系統進行了優化,增加SteelCentral UCExpert組件,整合了網路流量性能數據與基礎設施性能數據,並且從客戶體驗、網路、應用等多視角監控UC質量,藉此對Lync也實現了統一監控。

隨著項目的完成,效果也開始顯現。給聯想監控和運維管理帶來的一個明顯的好處是通過監控可視化實現了對應用系統狀態以及性能數據的統一展示,哪些地區出現了網路問題、性能不好一目了然,而且歷史問題也可以追溯。「比如,以前有的用戶反饋前一天或者幾個小時之前訪問應用很慢,但是我們網路團隊或者應用團隊去解決這個問題的時候,系統已經一切正常,沒有辦法回溯到當時的狀態。而現在這個系統就可以看到之前一些歷史的狀態,從而針對性的解決問題。」胡永說。

而對於聯想集團內部部署的統一通信系統Microsoft Lync,有了Riverbed的NPM之後也給系統運維帶來很大的方便。這是因為NPM能實時監控各地域用戶(中國區、北美、南美、亞太、歐洲)及網路類型用戶(Wlan、VPN),訪問總部數據中心的Lync應用時的實時客戶體驗,其通過語音性能可視化展示,將語音通信按路徑進行進一步分析,實現性能問題的精確定位。

「比如,我們可以把某個同事的語音情況拿出來,來看他的語音經過的路線,看其網路上每一跳響應時間是多少,,UC團隊可以利用這些可視化數據進行進一步的UC優化和問題診斷。」胡永表示。

回顧聯想的NPM項目,胡永總結說,「我們的IT也正處於向數字化轉型的過程中,而Riverbed的NPM方案特別好地支持我們做轉型,比如它的可視化、問題的快速定位這些功能,都提供了特別好的支持。而接下來,還要把更多的設備都納入管理,然後逐步優化,滿足我們全場景的監控,更好地支持業務。」

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

TAG:至頂網 |