當前位置:
首頁 > 知識 > 如今這伺服器都成精了?

如今這伺服器都成精了?

這天早晨,我帶兒子在公園裡溜達,迎著冬日朝陽沐浴在晨輝下,感覺身心美滋滋。

正閉眼享受愜意時光的當下,口袋突然震了起來。

7點剛過誰打我電話?這日子還能不能過了

拿起手機一看,咦

~某遊戲公司的運維經理王總?那麼早找我幹嘛?出於專(qiong)業(bi)的職業素養和精神,接了再說!客戶滿意度第一!

我: 喂,早呀!王總, 那麼早就起來啦? 早飯吃了么?

王:沒吃!吃不下!你上午有空來次我們公司么?有些事情我要了解下!

我:啊!? 關於什麼事情?需要我準備什麼資料么?

王:就兩個月前我們買的200多台伺服器的事情! 不用準備,你來就可以了!

我:啊啊?? 怎麼了?出故障了么?

嘟嘟嘟…….

撂下電話,我火速抓住撒歡的兒子一路狂奔到家,背上雙肩包,坐上地鐵殺向客戶公司……

如今這伺服器都成精了?

打開今日頭條,查看更多精彩圖片

見面後我開門見山:那200多台伺服器不是你們另一個項目組A的么?

王總:這半年來我們項目組的在線玩家數量和收入增長都不錯,而且接下來會上新版本,所以我們就和採購提了200台擴容需求。 而暑假期間項目組A的遊戲流量只有預期的一半,於是大老闆就把兩個月前買的那260台伺服器轉給我們了。

我:這不挺好的么?這樣一來你們項目組差不多有800台伺服器了吧?

王總:問題是這260台伺服器目前的BIOS&RAID配置和預裝的系統是按照A項目組的要求做的,和我們要求不一樣啊。你也知道我們組算上我才3個人。以往需求都是你們出廠預設好,我上架就能用的,現在怎麼辦?總監要求3天內就上線。你有啥辦法不? 愁死我了……

如今這伺服器都成精了?

我:……就這事啊?(我還差點就坐火箭來了!)對戴爾易安信伺服器來說,這都不叫事好嗎!

批量重新配置神器——OME

對戴爾易安信伺服器全生命周期管理來說,批量重新配置及部署是默認的標準功能~

如今這伺服器都成精了?

首先我來介紹批量部署及監控的神器—— OME(OpenManage Essentials)

OpenManage Essentials 是戴爾營銷硬體管理應用程序,能夠對企業網路中的系統、設備和組件提供全面的監控、部署及資源清冊。用戶可在設置並允許的網段內,通過SNMP協議管理及監控最多可達8000台伺服器,前面王總說的260台伺服器重新配置,完全可以靠OME實現。

在OME的部署門戶頁面,用戶可以執行初始伺服器及操作系統部署。通過該門戶用戶創建伺服器配置模板,針對伺服器有iDRAC、BIOS、RAID 和 NIC 的設置,以及針對刀片機箱有CMC 的設置。這些配置模板隨後可以部署到多個伺服器或機箱以進行初始配置,然後再從預定義的可引導 ISO 映像啟動操作系統部署流程。通過設定多個模板,用戶可快速切換現有伺服器的設置,極大地簡化了日常運維工作。

關鍵這個軟體是免費的!!!

王總:哇塞!這麼好的東西你怎麼現在才告訴我,這個還能監控和預警?我不用派人天天去機房巡檢了?

我: SNMP、WMI、WS-MAN可管理並監控伺服器、交換機、超融合存儲、防火牆等設備,具體內容請看OME界面。

如今這伺服器都成精了?

▲上圖,即為OME的操作界面,主要分為4個模塊:

○ 模塊1是頂部導航欄,模塊2為菜單欄和搜索框;

○ 主要看模塊3,這裡是控制台區域,清晰地顯示了設備狀態及報警餅圖,界面右側排列了一系列報警日誌,對應的時間、報警級別、設備IP地址一目了然;

○ 模塊4顯示了具體的報警內容。

如果向OME管理伺服器開放外網訪問戴爾易安信官方源的話,OME還可提供對伺服器的BIOS、固件、驅動的更新,並在第一時間通知用戶高優先順序補丁的更新情況。

另外,OME還可以幫助用戶盤點資產並生成資源清冊報告哦!

OME另一高招——資源清冊報告

王總:資產報告?OME統計地全面和準確么?我們現在是用表格手動做資產管理系統,經常出錯。報修換了主板或者網卡後,表格里的mac地址也經常不準。

我: OME做伺服器資產盤點的效果可是杠杠的!它能對所有受管設備生成非常全面及詳盡的資源清冊報告,如下就是對於所有設備的NIC信息做出的統計,其中IP、MAC、Vendor信息都清晰可見。

如今這伺服器都成精了?

此外,清冊報告里還包括如下內容▼:

伺服器資源清冊類別

說明

伺服器概覽

提供關於伺服器的信息,例如:系統名稱、伺服器上安裝的操作系統、處理器和內存

硬碟驅動器信息

確定硬碟驅動器的序列號、修訂版、製造商、匯流排類型和自加密功能。

內存信息

提供有關DIMM 的詳情,並確定特定

DIMM 在伺服器中佔用的插槽。

PCI 設備信息

確定每台伺服器中的型號、製造商

以及PCI 和PCIe 控制器的插槽。

存儲控制器信息

確定伺服器上的存儲控制器,並提供控制器名稱、供應商、控制器類型和控制器狀態。

虛擬磁碟信息

提供有關虛擬磁碟的信息,如大小、布局,條帶大小等等。

伺服器組件和版本

標識所有查找到的和進行資源清冊的伺服器上的BIOS、驅動程序和固件版本

設備配置合規性

向關聯的設備配置模板提供與伺服器或機箱的合規性有關的信息

我:利用這些OME功能,就算你們團隊只有3人,管理好800多台伺服器也不在話下!

伺服器成精了?不,是SA

王總: OME的監控、管理和部署確實非常不錯!不過每次保修還是很麻煩,要聽很久電腦語音,還要抓日誌!

不過剛才我聽你說伺服器能主動報修,還能主動換備件?難道伺服器成精了嗎?如果這樣,那我們就省力了。哈哈~

如今這伺服器都成精了?

我:哈哈,伺服器當然不會成精。主動式報修和更換部件是通過SA實現的

SA全稱SupportAssist Enterprise,是一款可自動為 Dell 伺服器、存儲、網路設備提供技術支持的軟體程序。在設置 SA 並正確配置待監測設備後,任何受監測設備發生硬體事件,SA便會收到警報,並通過使用各種策略對收到的警報進行篩選,以確定警報是否符合報修條件。符合報修條件的警報被安全地發送給 SA 伺服器,創建或更新報修案例後,售後部門使用報警信息對問題進行故障排除,並提供適當的解決方案。具體可參考下表▼:

SA 功能

說明

主動檢測硬體故障

SA 接收受監測設備中發生的硬體事件的警報,並主動確定警報是否表明發生了硬體故障

預測性檢測硬體故障

對從受監測設備收集的系統信息進行智能分析,從而預測將來可能發生的硬體故障

自動收集系統信息

自動從設備收集對問題進行故障排除所需的系統信息,並將其安全地發送至戴爾

自動創建支持案例

在主動檢測到或預測性檢測到硬體故障時,系統自動向技術支持部門創建服務請求

自動電子郵件通知

將關於支持案例或問題的電子郵件通知自動發送到貴公司的主要和第二 SA聯繫人

主動部件派發

如需要更換部件才能解決問題,SA中配置的派送首選項向您派發更換部件

技術支持部門主動回應

技術支持代理將就該支持案例主動與您聯繫,並幫助您解決此問題

部分地區故障發生後4小時,我們的售後工程師就可以帶著備件上門更換了。上次在一個部署了OME+SA的客戶那裡,我們的售後工程師都帶著備件上門了,他的機房駐場工程師才發現原來一台伺服器的硬碟壞了一塊。

由此,SA的專業性可窺一斑。

綜上,OME+SA雙劍合璧,可打造一個集部署、故障監控、資產清冊、自動報障、自動維修為一體的自動化運維平台,保障您運維無憂!

如今這伺服器都成精了?

點擊「了解更多」查看數字化轉型方案詳情

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT168企業級 的精彩文章:

深耕企業組網 H3C企業主網交換機評測
超融合市場誰主沉浮?

TAG:IT168企業級 |