當前位置:
首頁 > 最新 > PC伺服器帶外管理批量自動配置

PC伺服器帶外管理批量自動配置

PC伺服器帶外管理模塊的核心是BMC(BaseboeradManagement Controller),通過BMC模塊,用戶可以遠程對伺服器進行硬體監控、微碼升級、上下電控制、甚至是操作系統的安裝等操作。

PC伺服器出廠時帶外BMC模塊一般會有一個默認的固定IP地址和用戶名,客戶可以根據需要對IP、用戶的配置進行調整,如重新設定為靜態IP或者調整用戶許可權等工作,以便後續接入帶外網路後統一管理。

常用做法:目前伺服器帶外BMC的配置工作通常是通過在機房本地用筆記本直連伺服器帶外模塊,手動單台進行設置。實現效率較低,操作繁瑣,因人為操作失誤而導致的配置錯誤的概率較高。而如果通過DHCP的方式並實現自動化配置的話,則效率大大提升,有效減輕運維人員工作量。

自動化配置的優勢:

1、人機交互降為最低,用戶只需要事先上傳配置文件,建立待配置伺服器的序列號及想要設置的靜態IP,後續所有校驗及配置工作通過腳本全自動實現,效率大大提升。

2、雖然實現原理上用到了DHCP,但其實最終落到伺服器BMC上的IP是一個靜態,同時DHCP服務也僅在腳本執行期間開啟,平時為關閉狀態,因此這個方法最大程度的降低了DHCP帶來的不可控風險,安全性較高。

BMC批量配置的原理如下

A、前置條件:到貨所有伺服器的BMC地址出廠默認設為DHCP(目前到貨伺服器的BMC地址均為靜態地址,例如BMC默認為192.168.2.100;

B、組網物理拓撲:一台DHCP伺服器(只有在腳本執行期間才會開啟DHCP服務,平時不會開啟,最大程度控制風險)----已經接入網路的待進行配置的伺服器BMC(下文簡稱為client);

C、用戶需要的操作:事先為伺服器的BMC地址做規劃,分配靜態IP(手動為伺服器BMC分配靜態IP和我們目前的做法保持一致,一方面便於管理,一方面可以有效降低DHCP帶來的不可控風險),並將服務的序列號SN和實際分配的靜態IP做一個對應關係,形成ip.txt配置文件並上傳至DHCP伺服器上;

D、實現原理(簡要步驟):在現有的BMC管理網路區域中新增一台DHCP伺服器,並為其預先劃分一個IP地址池(初步定位50個),當待配置的伺服器BMC接入網路後,會首先通過DHCP在這個IP地址池中得到一個臨時的IP從而與DHCP伺服器建立臨時通訊,然後DHCP伺服器會偵測到此client並主動獲取其序列號SN,然後根據此SN在之前用戶上傳的配置文件(ip.txt)中檢索其對應的靜態IP,然後DHCP伺服器將此靜態IP配置給client(redfish協議),client得到靜態IP後,關閉其DHCP-client服務,所有client的配置完成後,DHCP伺服器關閉其DHCP-server服務。

此方法的優點在於:

1、最終落到伺服器BMC上的是一個靜態IP,這個IP為用戶手動分配,台賬便於管理。

2、DHCP伺服器只有在執行腳本時才會開啟DHCP服務,平時為關閉狀態,最大程度的將風險降至最低。

幾種特殊情況及對應的處理邏輯:

1、如果用戶上傳的配置文件(ip.txt)中存在重複的IP或者重複的伺服器序列號會發生什麼?

DHCP服務會在腳本執行的開始便對這個配置文件中的IP和序列號進行重複性校驗,如果發現重複IP或者重複序列號均會強制退出(重複IP是非常嚴重的情況,這會導致兩台伺服器分了同一個IP,從而造成IP衝突)。

2、如果用戶上傳的配置文件中某一台伺服器分配的靜態IP其實已經被佔用了會發生什麼?

DHCP服務會在腳本執行的過程中對這個配置文件的IP進行連通性校驗,如果發現某一台client待分配的IP實際已經被佔用了,則會對這條配置信息進行標誌(occupied)。隨後當這台client通過DHCP協議連上DHCP伺服器後,DHCP伺服器會發現這台client待分配的靜態IP已經被佔用,從而放棄後續配置動作,並將此台client的MAC地址添加到DHCP伺服器的黑名單中,防止其再連上來(為什麼要將MAC加入黑名單,稍後解釋),並在最終的結果中提示用戶此台伺服器配置失敗,原因是待分配的IP已經被佔用。

3、如果用戶上傳的配置文件中某一台伺服器的序列號寫錯了會發生什麼?

由於DHCP伺服器為對端client分配靜態IP是根據配置文件中序列號和IP的對應關係來分配的,所以當你配置文件中的序列號寫錯時,會導致DHCP伺服器識別不出對端client,從而不知道要分配的靜態IP。這種情況下,DHCP伺服器也會將此client的MAC的地址添加到DHCP伺服器的黑名單中,防止其再連上來(為什麼要將MAC加入黑名單,稍後解釋),並在最終的結果中通知用戶兩點。A、ip.txt中有一條配置信息配置失敗(序列號寫錯的那條)。B、腳本執行過程中偵測到一台新client,其序列號為XXXXX,且該client不在此次配置的範圍內(因為配置文件中序列號寫錯了)。

4、如果腳本執行過程中,突然有一台其他伺服器BMC也接入進了網路,且成功DHCP到了臨時地址會發生什麼?

處理邏輯同情況3,因為其本質的表現還是DHCP伺服器獲取到的SN在配置文件(ip.txt)中檢索不到。

5、為什麼在情況234中,都需要將這些client的MAC地址添加到DHCP伺服器的黑名單中,防止其再連上來?

這是因為首先DHCP地址池的資源有限。正常情況下,當一台client通過DHCP得到一個臨時地址後,DHCP伺服器會為其分配一個靜態IP並關閉client的DHCP服務,因此當這個DHCP臨時IP的租期滿了以後,該IP地址變會被自動釋放回收以供其他client繼續使用。而在情況234中,由於DHCP伺服器不會對對端client進行任何操作,從而會導致這些client不斷在DHCP,一直佔用DHCP的地址池資源。想像一種極端情況,如果我要為100台機器BMC進行配置,恰巧貼的配置文件中有50台機器的序列號都錯了,於是便會導致整個DHCP地址池被這50台序列號錯誤的機器佔滿,那另外50機器也就沒法配置了。所以針對情況234,必須想辦法阻止該client繼續申請DHCP地址,這也就是為什麼需要將MAC添加到DHCP的伺服器的黑名單中的原因了。此外每次腳本執行完畢後,DHCP伺服器的黑名單會清空,所以放心,這個處理邏輯並不會影響下一次的批量配置,即被黑名單的client在下一次配置時還是可以DHCP到地址的。

以下為實際的演示效果圖及腳本邏輯圖:


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 全球大搜羅 的精彩文章:

匠人精神真的就很好嗎?
煙貨源,斯科拉飛

TAG:全球大搜羅 |