運維可視化之INT功能詳解
INT技術背景及可視化方案
Telemetry是一項遠程的從物理設備或虛擬設備上高速採集數據的技術。設備通過推模式(Push Mode)主動向採集器推送設備數據信息,提供更實時更高效的數據採集能力。
▲ Telemetry模型
Telemetry技術採取推送方式,由設備主動向後台監控伺服器推送自身信息,從而避免了查詢模式下查詢請求造成的在網路中的額外延時,以及大量查詢請求給網路和設備帶來的壓力。與傳統的SNMP、CLI、SYSLOG等方式相比,Telemetry可以實現亞秒級監控精度。理論上,通過Telemetry技術可以獲取設備所有信息。
INT技術是由Barefoot、Arista、Dell、Intel和VMware在Telemetry的基礎上共同提出的一種新的Telemetry模型。INT技術是通過在數據層面收集和報告網路的狀態來實現對網路狀態的監控,這個過程不需要控制層面的參與。
INT架構模型中的術語:
INT header:任何包含INT信息的packet header;
INT Source:在報文中嵌入INT header的設備;
INT Instruction:收集數據信息的定義;
INT Metadata:監控對象信息,即在每台設備上收集的數據信息;
INT Transit Hop:加入本設備節點INT Metadata信息的設備;
INT Sink:拆除INT header報文頭,並收集上送INT Metadata信息的設備。
基於INT實現運維可視化的具體流程:
1
業務報文進入第一台交換機(INT Source),通過交換機上設置的採樣方式採樣並鏡像出該業務流報文,INT Source在報文中封裝一個INT header,同時定義INT Instruction,並在INT header後添加INT Metadata,將需要收集的交換機信息填入INT Metadata 中。
2
報文轉發至下一台路徑上的交換機(INT Transit Hop),INT Transit Hop根據上一台設備的INT Metadata內容繼續添加本機的INT Metadata 信息。
3
經過所有INT Transit Hop,報文轉發至最後一台交換機(INT Sink),INT Sink將INT Header拆除,並將其中的路徑信息通過gRPC報文發送給後端的監控伺服器進行解析和呈現。
▲可視化網路
通過上圖我們可以清楚地了解到INT的具體流程,簡單地說INT就是在報文轉發路徑上的每台設備上收集Metadata數據,通過對Metadata數據的分析來準確監控網路狀態。那麼Metadata中有哪些數據可以提供給我們來監控網路呢?
INT Metadata報文信息詳解
INT Metadata報文格式:
從上圖中可以看到INT Metadata報文包含8個位元組的報文頭和多個Metadata數據,每個Metadata數據,即每一跳設備收集的數據信息。
INT Metadata報文頭中包含幾個關鍵的欄位:
Ver(2bit):版本號;
Flags(9bit):包括複製允許、超過最大跳數置位等以及5bit的Reserved預留;
Instruction Count(5bit):Metadata中收集數據項的數量;
Max Hop Count(8bit):最大跳數,即報文中可封裝的Metadata數據的最大數量;
Total Hop Count(8bit):當前總跳數,即當前報文中封裝的Metadata數據的數量;
Instruction Bitmap(8bit):Metadata數據的具體內容。
Instruction Bitmap 欄位8個bit分別對應8個數據選項,每個bit的置位代表該項數據需要收集到Metadata中。
bit0:交換機ID
bit1:入埠號
bit2:轉發時間
bit3:隊列佔用
bit4:入時間戳
bit5:出埠號
bit6:隊列擁塞狀態
bit7:出埠鏈路利用率
舉個例子,上圖是一個INT Metadata報文頭,我們看下其中的具體信息:
Instruction Count欄位數值為2,表示Metadata中共收集兩項數據;
Max Hop Count欄位數值為16,表示最大支持16跳,可封裝16個Metadata數據;
Total Hop Count欄位數值為3,表示當前為第3跳,報文已封裝了3個Metadata數據;
Instruction Bitmap欄位,2個bit置位,表示Metadata數據中包含兩個數據項,交換機ID(bit0)和隊列佔用(bit3);
Metadata數據部分即為每一跳交換機封裝的交換機ID以及隊列佔用信息。
總結一下,INT技術可以基於交換機晶元提供的可視化能力,通過收集分析數據報文在交換機網路中轉發的詳細信息,實現流量轉發的路徑可視化和延時可視化,為實現數據中心網路運維可視化提供了新的解決方案。銳捷網路新一代25G/100G數據中心網路解決方案已全面支持INT功能,歡迎留言交流。
本期作者:劉臣平
銳捷網路互聯網系統部行業諮詢
有獎調研
感謝您關注銳捷網路《技術盛宴》專欄!現誠邀您參與有獎調研,您寶貴的意見和建議將幫助我們在技術探索與分享上持續精進。
TAG:銳捷網路 |