當前位置:
首頁 > 知識 > 大數據平台常見異常-zookeeper

大數據平台常見異常-zookeeper

本文主要闡述大數據平台環境zookeeper常見異常和解決方案


1.Connection reset by peer異常

  • 異常說明

我們現在項目有個任務OneMinuteDataSync是用spark將實時數據同步插入到hbase中,程序已經穩定運行很長一段時間,不過最近數據量增加比較多,任務運行一段時間後,突然僵死幾個小時後,有恢復正常繼續運行,如下圖,任務正常運行情況下耗時15s左右,但2017-07-11 04:33:00這個批次運行了9486s,而凌晨數據量很少的,才13w左右,白天峰值穩定在45w左右。

大數據平台常見異常-zookeeper

查看該任務的運行的worker節點的日誌,發現zoookeeper connection reset by peer異常日誌

大數據平台常見異常-zookeeper

  • 解決方案

首先查詢zookeeper日誌,只發現了Too many connectionn 警告

由於剛開始的時候zookeeper zoo.cfg沒有配置maxClientCnxns參數,而zookeeper默認配置為60,即單個客戶端與單台伺服器之間的連接數的限制,而我們前幾天才升級hbase和zookeeper集群,已經將

maxClientCnxns=300

而對於單台伺服器來說,300個連接我們認為已經足夠使用。我們在30.27.96.14上查看2181埠的連接情況

netstat -anp | grep 2181

netstat -anp | grep 2181 | wc

發現實際上狀態為ESTABLISHED的連接只有不到10個,而狀態為TIME_WAIT的連接有幾百個,而TIME_WAIT狀態實際上是客戶端建立連接,完成任務後正常斷開連接後的狀態,其他狀態解釋如下:

CLOSED:無連接是活動的或正在進行

LISTEN:伺服器在等待進入呼叫

SYN_RECV:一個連接請求已經到達,等待確認

SYN_SENT:應用已經開始,打開一個連接

ESTABLISHED:正常數據傳輸狀態

FIN_WAIT1:應用說它已經完成

FIN_WAIT2:另一邊已同意釋放

ITMED_WAIT:等待所有分組死掉

CLOSING:兩邊同時嘗試關閉

TIME_WAIT:另一邊已初始化一個釋放

LAST_ACK:等待所有分組死掉

更加詳細的內容要去閱讀TCP協議。而我們現在要解決的是連接正常關閉後,儘快減少TIME_WAIT狀態的連接,最後我們通過修改Linux內核參數來減少伺服器的TIME_WAIT套接字數量,步驟如下:

#1.切換到root用戶
su root

#2.更改sysctl.conf配置,增加如下兩行配置
vi /etc/sysctl.conf
net.ipv4.tcp_tw_reuse=1
##表示開啟重用。允許將TIME_WAIT套接字重新用於新的TCP連接。默認為0,表示關閉。

net.ipv4.tcp_tw_recycle=1
##表示開啟TCP連接中TIME_WAIT套接字的快速回收。默認為0,表示關閉

#3.讓配置立即生效
/sbin/sysctl -p

更改spark集群伺服器配置後,目前程序運行正常,後續繼續觀察。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 達人科技 的精彩文章:

使用ant自動構建apk
第2篇:用as3.0製作一個滾動條組件
數據應用達人之SQL基礎教程分享13-存儲過程與事務
Redis持久化機制比對

TAG:達人科技 |

您可能感興趣

Spring Boot與Kotlin使用Spring-data-jpa簡化數據訪問層
Keep network以太坊的隱私數據存儲平台
數據泄露越演越烈,Twitter、Google、Facebook信息安全高管紛紛離職
數據挖掘平台Discover解鎖Tensorflow
奇簡 Terark:數據壓縮存儲方面,我們幹掉了 Facebook、Google
阻止Facebook跟蹤數據的Firefox開源插件Facebook Container
Zzreal的大數據筆記-StormDay02
美國參議院將召開數據隱私聽證會 Facebook、Alphabet和Twitter受邀
Salesforce數據現在可以導入到Google Analytics 360中了
奇簡 Terark:數據壓縮存儲方面,我們幹掉了 Facebook、Google|創業
淺談大數據Bigtable與MapReduce、GFS有何聯繫
Facebook 稱谷歌和 Twitter 也會收集數據
Twitter 開源數據分析工具——tinfoleak
TalkingData:曝光iPhoneX真實在用量數據
WhatsApp將不會在歐洲與Facebook共享用戶數據
受 Facebook 隱私醜聞影響,Instagram 將允許用戶下載平台數據
如果Facebook告訴你 你的數據被Cambridge Analytica使用
用戶數據泄露三連彈:Facebook、安德瑪&Panera Bread
Veritas收購雲數據管理公司fluid Operations AG
Section 14-Halcon實戰寶典之數據結構