唐取 畢圣靈
摘要:電力工程數(shù)據(jù)分析與應(yīng)用,是實(shí)現(xiàn)大規(guī)模電力工程缺失數(shù)據(jù)篩選、進(jìn)行形態(tài)分析的基礎(chǔ)。文章針對(duì)電力工程缺失數(shù)據(jù)篩選困難的問(wèn)題,提出了一種基于密度聚類(lèi)算法的分析方法,該方法通過(guò)電力工程數(shù)據(jù)收集、預(yù)處理、提取數(shù)據(jù)個(gè)性化特征以及進(jìn)行密度聚類(lèi)算法分析等步驟,實(shí)現(xiàn)了電力工程缺失數(shù)據(jù)的高速篩查和形態(tài)分析。文章通過(guò)智能儀表、智能終端數(shù)據(jù)同步性驗(yàn)證,認(rèn)為所提出的基于密度聚類(lèi)算法的電力工程數(shù)據(jù)完整性分析方法能夠有效實(shí)現(xiàn)缺失數(shù)據(jù)篩查和形態(tài)分布解讀,對(duì)于全面提升電力我國(guó)電力工程數(shù)據(jù)完整性和用電情況分析具有較好的指導(dǎo)意義。
關(guān)鍵詞:密度聚類(lèi)算法;電力工程;缺失數(shù)據(jù)篩查;特征提取
中圖分類(lèi)號(hào):TM7;TP311.13
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001-5922(2020)12-0074-04
0 引言
電力工程事業(yè)的飛速發(fā)展,使我國(guó)電力事業(yè)領(lǐng)域逐漸積累了豐富的信息技術(shù)應(yīng)用經(jīng)驗(yàn)、信息化系統(tǒng)構(gòu)建和使用經(jīng)驗(yàn)以及電能數(shù)據(jù)資源。然而,由于我國(guó)幅員遼闊、各地區(qū)經(jīng)濟(jì)發(fā)展水平參差不齊,尚存在部分電能數(shù)據(jù)收集、分析與應(yīng)用水平較低、對(duì)區(qū)域性宏觀(guān)數(shù)據(jù)分析缺少智能化、精益性和實(shí)時(shí)性等問(wèn)題。電能數(shù)據(jù)收集過(guò)程中的數(shù)據(jù)缺失問(wèn)題,對(duì)線(xiàn)損、預(yù)測(cè)以及電能計(jì)費(fèi)、調(diào)控等后續(xù)工作帶來(lái)了較多不變。
電力工程計(jì)量智能化系統(tǒng)的應(yīng)用,不僅能夠有效改善我國(guó)部分地區(qū)傳統(tǒng)電力數(shù)據(jù)收集過(guò)程中的諸多弊端,且能夠大幅提升區(qū)域電網(wǎng)能耗信息獲取效率、精度,確保電力供給過(guò)程中的平穩(wěn)安全。當(dāng)前電力工程計(jì)量智能化技術(shù)主要面臨的挑戰(zhàn)有:電力工程數(shù)據(jù)完整性、數(shù)據(jù)聚合分析、電力數(shù)據(jù)不同體系間共享、海量數(shù)據(jù)存儲(chǔ)等[1-3]。其中電力工程數(shù)據(jù)的完整性是電力工程計(jì)量、分析與智能化應(yīng)用的基礎(chǔ)。基于此,本文提出了一種基于密度聚類(lèi)算法的電力工程數(shù)據(jù)完整性分析體系,可以從海量數(shù)據(jù)中迅速篩查電力工程系統(tǒng)中的數(shù)據(jù)缺失現(xiàn)象并進(jìn)行形態(tài)分析。
1 密度聚類(lèi)算法
密度聚類(lèi)算法(DBSCAN)能夠根據(jù)所設(shè)置的Eps(半徑)和MinPts(樣本數(shù))等[4],將待聚類(lèi)的電力工程數(shù)據(jù)分為3類(lèi):①核心點(diǎn),以該點(diǎn)為圓心的待聚類(lèi)數(shù)據(jù)半徑為Eps的圓內(nèi)至少包含MinPts個(gè)樣本點(diǎn);②邊界點(diǎn),以該點(diǎn)為圓心的待聚類(lèi)數(shù)據(jù)半徑為Eps的圓內(nèi)包含少于MinPts個(gè)樣本點(diǎn);③噪聲點(diǎn),不屬于核心點(diǎn)或邊界點(diǎn)的其他待聚類(lèi)數(shù)據(jù)點(diǎn)。與一般聚類(lèi)算法相比,密度聚類(lèi)算法無(wú)需對(duì)電力工程數(shù)據(jù)聚類(lèi)中心量進(jìn)行事先確定,可直接判定任意形狀的簇?zé)鬧5,6]。同時(shí),該方法可以通過(guò)密度直接判定中心點(diǎn)與邊界點(diǎn),抗噪聲能力極強(qiáng)。對(duì)于某樣本1)所屬的直接密度可達(dá)與相連進(jìn)行定義,到達(dá)樣本q所需要滿(mǎn)足的條件為:
其中,NEps (q)表示樣本p直接達(dá)到樣本q后的樣本范圍;樣本p、q之間密度相連即存在樣本滿(mǎn)足樣本Eps(半徑)和MinPts(樣本數(shù))等均為密度可達(dá)[7]。
2 基于密度聚類(lèi)算法電力工程數(shù)據(jù)完整性分析
2.1 數(shù)據(jù)收集
電力工程領(lǐng)域所產(chǎn)生的信息數(shù)據(jù)主要包括電力運(yùn)行過(guò)程中所產(chǎn)生的實(shí)時(shí)海量數(shù)據(jù)、用戶(hù)檔案數(shù)據(jù)以及電力系統(tǒng)運(yùn)行/非運(yùn)行狀態(tài)下的系統(tǒng)報(bào)警數(shù)據(jù)等[8]。其中,電力運(yùn)行過(guò)程中產(chǎn)生的實(shí)時(shí)數(shù)據(jù)主要包括:通信流量數(shù)據(jù),由各類(lèi)型計(jì)量終端獲取可用于判斷電力工程網(wǎng)絡(luò)中各計(jì)量設(shè)備的運(yùn)行狀態(tài);瞬時(shí)量數(shù)據(jù),為電網(wǎng)中不同用戶(hù)提供實(shí)施電力信息;表碼數(shù)據(jù),為電網(wǎng)用戶(hù)提供直觀(guān)的累積用電有/無(wú)功表碼信息。
本文利用智能終端對(duì)表碼信息數(shù)據(jù)進(jìn)行收集并傳遞,數(shù)據(jù)收集間隔為t= 15min,數(shù)據(jù)傳遞間隔為t=1h。得到了表1、2所示的電力工程瞬時(shí)量數(shù)據(jù)以及表碼數(shù)據(jù)實(shí)例。
表1中瞬時(shí)量數(shù)據(jù)包括用戶(hù)的總有功功率,IⅡⅢ相有功功率、電流值以及電壓值等數(shù)據(jù);表2中表碼數(shù)據(jù)包括用戶(hù)的累計(jì)用電信息如費(fèi)率類(lèi)型、正反向有功表碼、正反向無(wú)功表碼等數(shù)據(jù),其中費(fèi)率類(lèi)型包含了用戶(hù)總電量、正常情況電力計(jì)費(fèi)標(biāo)準(zhǔn)以及其他不同時(shí)段電力計(jì)費(fèi)標(biāo)準(zhǔn)等。
2.2 預(yù)處理
對(duì)表1、2中所獲取數(shù)據(jù)進(jìn)行完整性分析。對(duì)數(shù)據(jù)采集周期t=15min及傳遞周期t=1h進(jìn)行充分考量后,本研究主要選擇智能終端所獲取的電力工程計(jì)量點(diǎn)、時(shí)間與功率等作為電力工程瞬時(shí)數(shù)據(jù)完整性分析的主要指標(biāo);選擇智能計(jì)量終端所獲取的計(jì)量點(diǎn)、時(shí)間及正向有功表碼等作為電力工程表碼數(shù)據(jù)完整性分析的主要指標(biāo)??紤]到智能計(jì)量終端數(shù)據(jù)缺失主要來(lái)源于記錄時(shí)間不齊以及部分設(shè)備出現(xiàn)的網(wǎng)絡(luò)通信中斷等問(wèn)題,本文擬主要通過(guò)分析電力工程缺失數(shù)據(jù)的形態(tài)來(lái)判定電力工程數(shù)據(jù)的完整性及出現(xiàn)的問(wèn)題[9,10]。
本文采用二進(jìn)制將智能計(jì)量終端收集數(shù)據(jù)進(jìn)行去值化處理,分別用0、1表示電力工程網(wǎng)絡(luò)某用戶(hù)在某一時(shí)刻缺失及存在的瞬時(shí)數(shù)據(jù)及表碼數(shù)據(jù)。利用該思路進(jìn)行電力工程網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理的流程如下:
1)對(duì)獲取數(shù)據(jù)進(jìn)行掃描后表碼。
2)將不同計(jì)量點(diǎn)按照月份(31)和時(shí)刻(24)設(shè)定為31x24組,并進(jìn)行初始化處理。
3)利用程序?qū)Τ跏蓟癁?后的計(jì)量點(diǎn)在相應(yīng)數(shù)組位上的數(shù)據(jù)存在情況進(jìn)行判斷,若判斷結(jié)果為“存在”且不為NULL,則給數(shù)組的相應(yīng)位賦值為1,若判斷結(jié)果為“不存在”或/且為,不為NULL,則給數(shù)組的相應(yīng)位賦值為0。
4)對(duì)所有缺失數(shù)據(jù)數(shù)量進(jìn)行統(tǒng)計(jì)并記錄,代碼以ERRORNUM表示。
利用以上方法對(duì)表1、2數(shù)據(jù)進(jìn)行預(yù)處理,得到表3、4所示的瞬時(shí)數(shù)據(jù)、表碼數(shù)據(jù)預(yù)處理結(jié)果,分別以SSi和BM,表示,其中i=0,1,…,23。
2.3 提取數(shù)據(jù)個(gè)性化特征
基于密度聚類(lèi)算法的電力工程數(shù)據(jù)完整性分析,需要針對(duì)不同問(wèn)題對(duì)表3、4中的數(shù)據(jù)進(jìn)行個(gè)性化特征提取和分析,從而適應(yīng)聚類(lèi)算法中相應(yīng)的問(wèn)題與模式。本研究根據(jù)我國(guó)當(dāng)前電力工程智能終端設(shè)備普遍存在的數(shù)據(jù)缺失特征,構(gòu)造了不同的組合以便于對(duì)預(yù)處理后的瞬時(shí)數(shù)據(jù)和表碼數(shù)據(jù)進(jìn)行有效性分析。