當前位置:
首頁 > 最新 > 秒級監控 無盡迭代

秒級監控 無盡迭代

一年一度的618年中購物節在今年端午節達到高潮,在一眾電商齊齊發力的情況下,京東依然再創佳績。截至6月18日24點,京東618全球年中購物節累計下單金額達1592億元,創歷史新高!

驚人的戰績、激增的訂單量離不開背後強大的技術支撐。企業信息化部-財務研發團隊在今年618備戰期間有針對性的進行了技術優化,為了保障618期間生產系統的高吞吐和資金的安全性,他們的總體原則為:以監控為眼,壓測查缺,不斷的迭代優化。

618備戰技術亮點

360度監控,以監控為眼

完善的監控信息能提前暴露問題,為解決問題,穩定系統,系統降級和限流提供重要依據。在今年的618備戰中,我們採取了多維度的數據監控。

1、性能監控:在對外介面、jimdb、JMQ、資料庫大事務、DAO性能、機器性能各指標綜合建立監控數據,通過環比和同比,發現異常挑點,查找原因並修復問題,將問題消滅在萌芽中。

2、業務監控:通過上下游系統的數據流差異、本系統的輸入輸出差異指標,通過環比和同比比對,從外部宏觀監控系統的業務處理能力。

3、機器監控:通過每個監控指標的內部機器的性能橫向對比,快速排查問題docker,進行下線處理。

4、監控大小屏:

監控大屏——融合部門0級系統的監控指標,語音實時報警,有問題及時跟進處理。

監控小屏——每個系統關注的監控點,融合配置到一個監控大屏中,通過語音報警,快速定位問題發生流程,根據預定方案採取調整或降級方案。

系統優化

本著大處統籌,小處著眼的基本思想,我們對每個系統的吞吐量和穩定性進行優化。

1、大處統籌:對業務流程微服務化,針對每個類型的微服務特點,針對性採用多IO、多CPU、多TCP連接等特點進行有針對性的優化。針對系統中薄弱環節資料庫,設置最大限流量,防止緩存擊穿,數據流超洪峰情況下導致資料庫被打死,系統無法恢復。

2、小處著眼:每個微服務自我負責,通過設置每個微服務的限流量和JSF的處理線程數,保證每個微服務的在異常大洪峰流量下穩定性,通過快速部署新的微服務節點,進而提升整體服務的吞吐量。

流程壓測

我們秉承不信任原則,認為上游所有服務都是不可靠的,確保在任何一個介面異常情況下,系統的穩定性,並且保證數據的完整性。

對於京東三大中間件JIMDB、JMQ,JSF採取不信任原則,確立中間件異常情況下的應對處理方案。同時,我們會對全鏈路進行壓測,確定系統的薄弱點,針對性調整優化,降級切換方案。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 京東信息化+ 的精彩文章:

TAG:京東信息化+ |