當前位置:
首頁 > 最新 > 基於密度聚類的能耗數據採集網關設計

基於密度聚類的能耗數據採集網關設計

摘要:

現有用電信息採集網路集中器不具備對異常用電量進行檢測功能,導致主站對異常用電行為分析與響應滯後。設計一款具備異常檢測功能的用電信息採集網關,將網關安裝在集中器側對集中器能耗數據進行異常分析是應對該問題的有效解決方案。根據用電信息採集網路的特徵和相關電網規約,網關通過構造數據幀查詢主站地址池配置自身地址;基於密度聚類DBSCAN演算法和決策樹C4.5演算法對異常用電行為進行判斷。實驗結果表明,該網關能夠快速地對自身地址進行配置並對能耗數據進行異常分析。

0 引言

隨著網路技術的進步與發展,將無線抄表系統應用於電力行業已然成為一種趨勢[1]。集中器作為用電信息採集系統中的重要節點,是實現主站與採集節點的通信橋樑[2]。集中器作為中介轉發設備,缺乏對用電數據進行分析的能力,導致主站對用電行為分析和響應的滯後[3]。為了能夠在用戶側實現對能耗採集數據的分析與處理,採用該網關對集中器進行接入管理,獲取各集中器的能耗數據並進行分類存儲與分析,以解決主站對異常用電滯後的問題。

目前,諸多學者針對用電信息採集系統及異常能耗數據分析提出了多種解決方案。文獻[3]通過構造關聯規則,提出了一種基於密度聚類DBSCAN演算法,用於識別離群點的用電模式。文獻[4]通過軟、硬體的協同配合,實現了集中器與控制終端和遠程管理中心快速、可靠的通信。文獻[5]中的用電信息採集系統側重於需求管理和響應,分析了用戶用電行為。文獻[6]基於實時性方面的考慮,提出了一種層次化的異常事件檢測系統。以上研究對用電信息採集系統的發展做出了積極貢獻。

為解決主站對用電數據分析滯後的問題,本文研究了網關接入用電信息採集系統時獲取地址的過程;網關接入用電信息採集網路後,讀入集中器能耗數據並進行分類存儲,採用密度聚類DBSCAN演算法[7-8]得出離群點集合,並通過決策樹C4.5演算法[9-10]得出離群點數據對應的用電行為。

1 網關獲取節點地址

網關與主站通信在應用層應滿足376.1電網規約[11],該規約對數據域地址進行規定,其地址由3部分組成:2 B行政區劃碼A1、2 B終端地址A2和1 B主站地址和組地址標誌A3。

網關接入用電信息採集網路,獲取節點地址的流程如下:網關通過構建數據幀,向主站發送地址查詢命令,獲取地址A,其由2 B的行政區劃碼A1和2 B的終端地址A2構成,地址格式如圖1所示。

網關與主站進行通信的過程中,主站根據網關節點地址構建數據幀地址域,包括地址段A1、A2和A3。在單播情況下,A1、A2直接從目標集中器地址A中獲取,A3為主站地址和組地址標誌。A3的D0位為終端組地址標誌,D0為0時表示終端地址A2為單地址;D0為1時表示終端地址A2為組地址;A3的D1~D7組成0~127個主站地址MSA,其中數據幀地址域格式如圖2所示。

2 網關關鍵軟硬體設計

網關基於ARM11和Linux操作系統[12]進行設計,採用輕量級的SQLite3資料庫對相關能耗數據及用戶信息進行存儲。對用電信息採集數據進行分析需要基於一定規模的歷史數據,考慮到存儲容量、網關規格和成本等因素,採用SD卡進行內存擴展。選取BOA伺服器作為網關的Web伺服器程序,在網關上實現簡單的網頁查看功能。

2.1 外擴存儲模塊設計

在網關上實現對用電信息採集數據的分析,需要基於一定的歷史數據,網關需要存儲一定數量的數據,而網關自身內存有限,所以需要擴大用電信息採集網關的存儲能力,SD卡與S3C6410中的SDIO0介面的原理圖如圖3所示。

2.2 SQLite3資料庫的設計

SQLite3是一個嵌入式資料庫,其存儲後端採用Btree實現。SQLite在硬碟上一個資料庫一個文件,每個資料庫文件頭部保存有這個資料庫的元信息,包括版本、大小、Btree根節點位置等。

資料庫可以高效、安全、大批量地對數據進行管理,將SQLite3資料庫移植到本網關中以實現對能耗數據的分析。根據用電異常量分析演算法對數據類型的需求進行存儲,包括能耗類型、相對頻率、用戶類型、環境溫度等。

2.3 BOA伺服器程序的設計

本網關採用BOA伺服器Web程序搭載後台管理界面,前端界面採用AJAX技術與伺服器中的CGI程序進行交互,後台管理網頁設計架構如圖4所示。

用電信息採集網關Web網頁中的主要功能包括以下3個方面:

(1)查詢能耗信息:通過曲線對能耗信息進行顯示,可以查看用戶時、日、月的用電信息等情況。

(2)查看網關狀態:主要顯示當前資料庫的可用空間、與伺服器間的通信狀況及接入的集中器信息。

(3)查看能耗數據分析:可查看歷史能耗信息及異常情況下的數據情況。

3 用電信息異常分析演算法

3.1 密度聚類演算法

網關將集中器上傳的能耗數據進行備份,以進行及時分析。對用電時段進行劃分,將工作日劃分為黑、白兩個時段,將周末劃分為早、中、晚3個時段,各時段的時間跨度可根據用戶類型及其生活作息習慣進行調整。在相同日期類型和時間段內,人們的用電行為比較類似,用電數據具有較小的波動性,採用密度聚類DBSCAN演算法獲取異常用電數據。

3.2 異常量的獲取

將不同日期類型和時間段的數據作為一個能耗數據單元,針對不同的數據單元採用不同的參數Eps和MinPts。參數的選擇效率直接決定了該網關的質量,採用文獻[13]提出的根據KNN分布演算法與數學統計分析使網關自行計算各個數據單元中參數Eps與MinPts的值。

3.3 異常量分析

以一定周期對用電數據進行採集,同時採集溫度、日期類型和用電狀態(是否有異常,是何種異常),並將採集的數據存放在data.db文件中。採用決策樹C4.5演算法對歷史數據及對應的用電行為進行訓練。調入通過DBSCAN演算法獲取的各個數據單元的雜訊點集合根據決策樹C4.5演算法得出各雜訊點所對應的異常用電行為,並通過相應的機制採取對應的措施。然後根據實際調查驗證通過決策樹C4.5演算法得出的結論是否正確,如果不正確將實際用電行為替代判斷用電行為。

4 測試與分析

4.1 實驗平台的搭建

搭建測試環境,所需設備與模塊如表1所示。

採用2個集中器分別與16個採集節點通過470 MHz構建無線抄表網路,網關通過交換機與集中器和主站(筆記本電腦)相連,集中器通過交換機接入網關。一個集中器採集子網放置在距離網關較近的地方,另一個集中器採集子網放置在較遠的地方,並且將兩個集中器採集子網設置為不同的通信信道,將一個子網內節點的信道設置為9,另一個子網內節點的信道設置為14,以防止採集節點之間的相互干擾。

4.2 網關獲取地址的驗證

網關上電後,向主站發送地址查詢主站的行政區劃碼A1和管理的網關數量配置自身地址,通過串口調試助手列印網關地址信息。列印結果為00000001,前兩個位元組為行政區劃碼A1,與主站保持一致;由於在網關接入主站時主站僅有網關這一個節點,因此終端地址A2為0001,其列印信息如圖5所示。

4.3 異常分析模塊的驗證

將用電數據進行分段,並歸一化至溫度為25 ℃的情況下,通過KNN分布演算法和數據統計演算法實現對參數Eps與MinPts的自行計算,提高了網關的運行效率。

根據不同日期類型和用戶的用電習慣將一天的用電數據進行分段劃分,分別對工作日和周末的不同時間段的用電數據進行聚類,並將節假日通過節假日因子歸併為周末進行聚類,採用DBSCAN演算法能夠準確判斷新讀入的用電信息是否為雜訊點。通過決策樹C4.5演算法對歷史數據分時段和日期類型進行訓練,能夠準確判定雜訊點的異常用電行為。

以工作日、周末和節假日對用電日期進行歸類,並將節假日歸併為周末,使得在各自的用電類別中人們的用電習慣具有較高的相似性,採用決策樹C4.5演算法可以得到更為準確的結果。將周末和工作日的用電數據根據人們的用電習慣的不同分為不同的區間單元,使得在各個時段內用電數據波動幅度較小,提高了DBSCAN演算法的準確性。

5 結論

本網關結合用電信息採集網路特徵,基於相關電網規約構造數據查詢幀,配置網關自身地址,實現網關對集中器的接入管理。通過對外擴存儲拓展程序、SQLite3資料庫程序、BOA伺服器程序的設計和移植以及異常檢測單元塊的設計,完成網關在數據存儲和異常檢測功能。本文所採用的查詢主站地址池方法可以高效地配置網關自身地址;網關採用SQLite3資料庫實現對能耗數據的有效存儲,通過採用DBSCAN演算法和決策樹C4.5演算法實現對採集數據的異常用電行為的判斷,解決了主站對能耗數據分析滯後的問題。

參考文獻

[1] 孫宏斌,郭慶來,潘昭光.能源互聯網:理念、架構與前沿展望[J].電力系統自動化,2015(19):1-8.

[2] 佟為明,張希棟,李中偉,等.基於橢圓曲線密碼的數據集中器通信報文混合密碼演算法[J].電力系統自動化,2014,38(4):86-91.

[3] 田力,向敏.基於密度聚類技術的電力系統用電量異常分析演算法[J].電力系統自動化,2017(5):64-70.

[4] 向敏,王時賀,趙星宇.一種基於電力載波通信的路燈控制系統集中器的設計[J].重慶郵電大學學報(自然科學版),2013,25(2):161-165.

[6] LEE S C,NEVATIA R.Hierarchical abnormal event detection by real time and semi-real time multi-tasking video surveillance system[J].Machine Vision & Applications,2014,25(1):133-143.

[7] 韓利釗,錢雪忠,羅靖,等.基於區域劃分的DBSCAN多密度聚類演算法[J/OL].[2017-06-04].http://www.arocmag.com/article/02-2018-06-047.html.

[8] MALHOTRA A,BAJAJ K.A hybrid pattern based text mining approach for malware detection using DBScan[J].CSI Transactions on ICT,2016,4(2-4):141-149.

[9] 苗煜飛,張霄宏.決策樹C4.5演算法的優化與應用[J].計算機工程與應用,2015,51(13):255-258.

[10] MANTAS C J,ABELLAN J,CASTELLANO J G. Analysis of Credal-C4.5 for classification in noisy domains[J].Expert Systems with Applications,2016,61:314-326.

[11] Q/GDW 376.1-2013.電力用戶用電信息採集系統通信協議[S].北京:國家電網公司,2013.

[12] 劉煒,毛建鑫,梁磊,等.一種基於ARM的集中器的硬體實現[J].電子技術應用,2014,40(1):86-89.

[13] 周治平,王傑鋒,朱書偉,等.一種改進的自適應快速AF-DBSCAN聚類演算法[J].智能系統學報,2016,11(1):93-98.

作者信息:

王 平,於祥春

(重慶郵電大學 自動化學院,重慶400065)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 電子技術應用ChinaAET 的精彩文章:

一種基於HDMI2.0的編解碼器設計

TAG:電子技術應用ChinaAET |