當前位置:
首頁 > 知識 > 伺服器宕機了別慌 快記住這些常規操作吧

伺服器宕機了別慌 快記住這些常規操作吧

伺服器的宕機是一種較為嚴重的伺服器故障問題,對於很多支付行業來講是一種致命性的設備故障問題,比如:

2009年秋天,微軟數據中心的一次伺服器故障導致T-Mobile Sidekick手機存放在微軟伺服器上的用戶數據全部丟失。這些數據包括通訊錄、日程表、照片、待辦事項等等;

2013年10月雅虎郵箱進行全面改版升級,一些用戶在升級後表示賬戶存在郵件丟失的情況。12月,雅虎正式確認這次升級導致1%的郵箱賬戶出現郵件丟失問題,一些郵件耗時數周甚至數月都無法送達,這次事件最終影響到用戶數量約100萬人左右;

2015年9月,剛剛推出DynamoDB伺服器導致亞馬遜雲服務宕機,包括Redait、Tinder、Netflix、IMDB在內的大量熱門網站受此影響並停運超過七個小時。

伺服器宕機了別慌 快記住這些常規操作吧

當然,伺服器按照工作負載不同可以分為很多類別,一篇文章並不能把所有的問題都說清楚,今天主要說一下Web伺服器出現宕機時,運維人員第一時間要做的有哪些?

其實宕機可以分為兩類:假宕機(非藍屏宕機)和宕機。

假宕機是由於硬體資源暫時性地被消耗殆盡,因而無法對外部指令進行響應的現象,通常是網站處於訪問高峰期,帶寬等資源跑滿,這時只需要等待一定的時間,待伺服器騰出更多的硬體資源即可恢復正常。而宕機,如果通過ping測試伺服器,鍵盤切換數字鎖定鍵(NumLock)或大寫鎖定鍵(Caps Lock)功能,顯示器無畫面輸出,或者滑鼠游標沒有任何反應則表明伺服器硬體故障。

伺服器宕機了別慌 快記住這些常規操作吧

首先,檢查所有電纜和外圍設備,試著使用ping命令探測設備狀況,ping命令是所有平台通用的,也是最簡單的。如果可以在區域網內ping通伺服器,接著可以試試從區域網外ping伺服器進行檢測。這樣做可以迅速判斷問題是否產生在交換和路由層面,而不是伺服器級別。

電源沒有問題,Ping不通,就要叢底層到高層來逐層檢查問題了,檢查網路介面和網路配置是否正常?DHCP是否啟動?Web伺服器是否指向正確的DNS伺服器?在Windows環境,需要檢查伺服器是否具有Web服務的角色。在Linux環境下,檢查會更複雜,可以試試查找http相關的文件或服務來確保伺服器是否正在運行。

此外,如果Web伺服器已經虛擬化,試著ping物理伺服器自己的真實IP。這樣可以幫助你進一步隔離問題。如果完全無法ping同伺服器,而且也已經確定完全檢查了網路連接,那麼就需要進行更深入的分析了。

這種時候,就要去檢查日誌並查明在Web伺服器宕機時日誌紀錄的信息,如果是專業人士,日誌信息可以告訴你一切,半專業人士可以google搜索日誌報警的錯誤信息,逐步找到解決方法,非專業專人的管理員就要求救外援了,總之,找問題要縱覽全局,多從架構、資源層面去查找問題。

伺服器宕機了別慌 快記住這些常規操作吧

當然,經常進行資料備份,在去選擇一個備用伺服器以方便遇到緊急狀況隨時切換,這是最笨也是最簡單的辦法。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT168企業級 的精彩文章:

這幾天你一定收到了一封來自蘋果的郵件

TAG:IT168企業級 |