王子馨,胡俊杰,劉寶柱
(華北電力大學(xué)電氣與電子工程學(xué)院,北京市 102206)
隨著電網(wǎng)的快速發(fā)展,我國(guó)基本形成了送、受端結(jié)構(gòu)清晰,交、直流協(xié)調(diào)發(fā)展的骨干網(wǎng)架[1-2]。電網(wǎng)規(guī)模的不斷擴(kuò)大以及電力電子設(shè)備的不斷投入使電網(wǎng)的時(shí)空特性日益復(fù)雜[3-4]。傳統(tǒng)的監(jiān)視控制與數(shù)據(jù)采集系統(tǒng)(supervisory control and data acquisition,SCADA)由于數(shù)據(jù)采集密度低以及傳輸過(guò)程間隔較長(zhǎng),無(wú)法滿足復(fù)雜系統(tǒng)狀態(tài)估計(jì)和動(dòng)態(tài)實(shí)時(shí)監(jiān)測(cè)的要求[5],而廣域測(cè)量系統(tǒng)(wide-area measurement system,WAMS)因其高精度、同步測(cè)量等優(yōu)點(diǎn),在系統(tǒng)動(dòng)態(tài)分析控制等方面發(fā)揮著越來(lái)越重要的作用。
與此同時(shí),隨著電力系統(tǒng)量測(cè)技術(shù)的快速發(fā)展及量測(cè)成本的不斷下降,量測(cè)數(shù)據(jù)呈現(xiàn)快速增長(zhǎng)趨勢(shì),逐步具備了大數(shù)據(jù)特征[6]。海量多類(lèi)型的量測(cè)數(shù)據(jù)對(duì)電力系統(tǒng)狀態(tài)估計(jì)、設(shè)備評(píng)估、優(yōu)化運(yùn)行、事故分析等具有重要意義[7-8]。隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,海量量測(cè)數(shù)據(jù)的傳輸、存儲(chǔ)和分析也成為電力系統(tǒng)領(lǐng)域重要的研究方向。
在此背景下,獲取更為真實(shí)可靠的電力系統(tǒng)量測(cè)數(shù)據(jù)變得越來(lái)越重要。然而由于氣候變化、噪聲干擾、通信延遲等多種復(fù)雜因素影響,數(shù)據(jù)采集、量測(cè)、傳輸和存儲(chǔ)過(guò)程中往往存在數(shù)據(jù)缺失等問(wèn)題,導(dǎo)致無(wú)法獲取真實(shí)可靠的量測(cè)數(shù)據(jù)。2009年,美國(guó)高德納信息咨詢公司(Gartner)針對(duì)140家公司做過(guò)一次調(diào)查,其中22%的公司估計(jì)其每年因數(shù)據(jù)質(zhì)量問(wèn)題造成的經(jīng)濟(jì)損失高達(dá)2 000萬(wàn)美元。2011年,美國(guó)California ISO發(fā)布的“五年計(jì)劃”指出北美約有10%至17%的量測(cè)數(shù)據(jù)存在質(zhì)量問(wèn)題。2017年,全球能源互聯(lián)網(wǎng)研究院在《大數(shù)據(jù)背景下電網(wǎng)數(shù)據(jù)質(zhì)量研究與實(shí)踐》報(bào)告中指出目前我國(guó)電力系統(tǒng)量測(cè)數(shù)據(jù)存在較為嚴(yán)重的質(zhì)量問(wèn)題。缺失數(shù)據(jù)嚴(yán)重影響電力系統(tǒng)狀態(tài)估計(jì)、參數(shù)辨識(shí)等,導(dǎo)致電網(wǎng)運(yùn)行狀態(tài)無(wú)法及時(shí)準(zhǔn)確獲取,甚至威脅電網(wǎng)安全穩(wěn)定運(yùn)行[9-10]。
目前,國(guó)內(nèi)外學(xué)者針對(duì)缺失數(shù)據(jù)問(wèn)題提出了眾多處理方法,主要可分為后評(píng)估和預(yù)處理兩大分支。后評(píng)估是基于狀態(tài)估計(jì)的相關(guān)方法。該類(lèi)方法利用冗余量測(cè)和系統(tǒng)拓?fù)浣Y(jié)構(gòu),構(gòu)造狀態(tài)方程恢復(fù)缺失數(shù)據(jù)。文獻(xiàn)[11]提出了一種基于擴(kuò)展卡爾曼濾波的動(dòng)態(tài)狀態(tài)估計(jì)方法,用于估計(jì)系統(tǒng)缺失的量測(cè)數(shù)據(jù)。文獻(xiàn)[12]利用時(shí)間相關(guān)性和測(cè)量一致性,提出了一種廣義魯棒估計(jì)器,實(shí)現(xiàn)缺失量測(cè)數(shù)據(jù)的恢復(fù)。后評(píng)估的方法雖然可實(shí)現(xiàn)缺失數(shù)據(jù)的準(zhǔn)確恢復(fù),但其估計(jì)時(shí)間較長(zhǎng),需要系統(tǒng)拓?fù)鋮?shù)。預(yù)處理則為數(shù)據(jù)驅(qū)動(dòng),通過(guò)研究已知數(shù)據(jù),獲取數(shù)據(jù)規(guī)律實(shí)現(xiàn)對(duì)缺失數(shù)據(jù)的補(bǔ)充。文獻(xiàn)[13]提出了一種線性插值的方法,恢復(fù)系統(tǒng)中缺失的相量數(shù)據(jù)。在此基礎(chǔ)上,文獻(xiàn)[14]將改進(jìn)三次樣條插值與優(yōu)先級(jí)分配策略相結(jié)合,提高了系統(tǒng)動(dòng)態(tài)下缺失數(shù)據(jù)的恢復(fù)精度。文獻(xiàn)[15]提出基于低秩矩陣填充理論的電能質(zhì)量感知數(shù)據(jù)補(bǔ)全方法。文獻(xiàn)[16]計(jì)及數(shù)據(jù)缺失曲線相似度,同樣將低秩矩陣填充理論用于恢復(fù)缺失的電量數(shù)據(jù)。文獻(xiàn)[17]則提出了一種基于張量分解的數(shù)據(jù)恢復(fù)方法,將數(shù)據(jù)分解為時(shí)間、位置和變量三個(gè)維度。同時(shí),隨著深度學(xué)習(xí)技術(shù)在電力系統(tǒng)中的應(yīng)用,電力系統(tǒng)量測(cè)數(shù)據(jù)的時(shí)序性、相關(guān)性、規(guī)律性都可以作為缺失數(shù)據(jù)恢復(fù)的重要依據(jù)。文獻(xiàn)[18]采用淺層自動(dòng)編碼器神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)間特性進(jìn)行學(xué)習(xí)實(shí)現(xiàn)數(shù)據(jù)恢復(fù)。文獻(xiàn)[19]提出了改進(jìn)生成式對(duì)抗網(wǎng)絡(luò)學(xué)習(xí)量測(cè)數(shù)據(jù)間復(fù)雜的時(shí)空特性,利用真實(shí)性約束及上下文相似性約束優(yōu)化隱變量,從而實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)確恢復(fù)。但上述網(wǎng)絡(luò)模型較為復(fù)雜,不易于應(yīng)用。此外,文獻(xiàn)[20]利用電力系統(tǒng)量測(cè)數(shù)據(jù)的時(shí)序特性,提出了一種基于長(zhǎng)短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)的數(shù)據(jù)生成方法。文獻(xiàn)[21]同樣基于長(zhǎng)短期記憶網(wǎng)絡(luò)提出了負(fù)荷短期預(yù)測(cè)的方法。LSTM網(wǎng)絡(luò)可有選擇記憶序列信息,對(duì)量測(cè)數(shù)據(jù)有著良好的適用性,且易于實(shí)現(xiàn)。
基于上述背景,本文計(jì)及電力系統(tǒng)量測(cè)數(shù)據(jù)的時(shí)序特性,提出一種基于長(zhǎng)短期記憶網(wǎng)絡(luò)的電力系統(tǒng)量測(cè)缺失數(shù)據(jù)恢復(fù)方法。該方法可構(gòu)造已有數(shù)據(jù)對(duì)缺失數(shù)據(jù)的映射,并可有選擇地記憶對(duì)缺失數(shù)據(jù)影響較大的信息。同時(shí)為進(jìn)一步提高系統(tǒng)不同狀態(tài)和不同缺失位置下的恢復(fù)精度,提出基于隨機(jī)森林的狀態(tài)辨識(shí)方法和缺失數(shù)據(jù)恢復(fù)策略。最終通過(guò)仿真數(shù)據(jù)和實(shí)測(cè)數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果表明該方法依靠數(shù)據(jù)驅(qū)動(dòng),在不同數(shù)量的缺失情況下恢復(fù)的數(shù)據(jù)均能保持較高的準(zhǔn)確率。
本節(jié)將重點(diǎn)介紹LSTM網(wǎng)絡(luò)單元結(jié)構(gòu),建立雙層全連接的LSTM網(wǎng)絡(luò)結(jié)構(gòu)模型,并分析所提LSTM網(wǎng)絡(luò)應(yīng)用于電力系統(tǒng)缺失數(shù)據(jù)恢復(fù)的適用性。
電力系統(tǒng)量測(cè)數(shù)據(jù)呈現(xiàn)時(shí)序特性,本文以廣域測(cè)量系統(tǒng)中同步相量測(cè)量單元(phasor measurement units,PMUs)量測(cè)數(shù)據(jù)為例進(jìn)行分析。系統(tǒng)某動(dòng)態(tài)條件下量測(cè)的結(jié)果如圖1所示。幅值X可看作時(shí)間t的函數(shù),X=f(t)。假設(shè)在t3—t4時(shí)段幅值數(shù)據(jù)缺失。
圖1 動(dòng)態(tài)數(shù)據(jù)示意圖
LSTM網(wǎng)絡(luò)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),由于其獨(dú)特的門(mén)結(jié)構(gòu),使梯度沿時(shí)間反向傳播時(shí)可經(jīng)過(guò)較長(zhǎng)的距離,從而降低梯度消失的可能。同時(shí),作為一種用于序列學(xué)習(xí)的體系結(jié)構(gòu),LSTM網(wǎng)絡(luò)可有選擇地篩選并遺忘之前序列中的某些信息以減少對(duì)后續(xù)序列的影響[22-23]。因此,LSTM網(wǎng)絡(luò)可用于如圖1所示的電力系統(tǒng)量測(cè)數(shù)據(jù)的處理,其單元結(jié)構(gòu)如圖2所示。
圖2 LSTM網(wǎng)絡(luò)單元結(jié)構(gòu)
LSTM網(wǎng)絡(luò)在傳統(tǒng)RNN的隱含層中增加了一個(gè)細(xì)胞狀態(tài)Ct,并利用遺忘門(mén)ft、輸入門(mén)it和輸出門(mén)ot實(shí)現(xiàn)對(duì)信息傳遞的控制。在t時(shí)刻,該網(wǎng)絡(luò)單元有3個(gè)輸入和2個(gè)輸出。輸入分別為當(dāng)前時(shí)刻的輸入xt,上一時(shí)刻的輸出ht-1以及上一時(shí)刻的細(xì)胞狀態(tài)Ct-1。輸出為當(dāng)前時(shí)刻的輸出ht和當(dāng)前時(shí)刻的細(xì)胞狀態(tài)Ct。其中,ht負(fù)責(zé)記憶序列短期特征,Ct負(fù)責(zé)記憶序列長(zhǎng)期特征。
遺忘門(mén)ft決定細(xì)胞狀態(tài)中保存或丟棄前序信息長(zhǎng)期特征的程度,可表示為:
ft=σ(Wf·[ht-1,xt]+bf)
(1)
式中:ft為t-1時(shí)刻輸出ht-1、t時(shí)刻輸入xt和偏置項(xiàng)bf的激活值,激活函數(shù)為sigmoid,激活函數(shù)將ft縮放至0(完全遺忘)和1(完全記憶)之間;Wf為權(quán)重項(xiàng),包括Wfx和Wfh。
輸入門(mén)it確定如何更新細(xì)胞狀態(tài),即將新的信息選擇性地記憶到細(xì)胞狀態(tài)Ct,公式如下:
(2)
輸出門(mén)ot決定當(dāng)前時(shí)刻的輸入,與輸入門(mén)類(lèi)似,ht由ot和Ct確定攜帶的信息,公式如下:
(3)
式中:Wo為權(quán)重項(xiàng),包括Wox和Who;bo為偏置項(xiàng)。
基于以上分析,將LSTM網(wǎng)絡(luò)應(yīng)用于如圖1所示的幅值數(shù)據(jù)恢復(fù),針對(duì)t3—t4時(shí)段的缺失數(shù)據(jù),遺忘門(mén)會(huì)有選擇地增加前序信息中類(lèi)似時(shí)段的數(shù)據(jù)(如t1—t2時(shí)段),遺忘其余部分時(shí)段的數(shù)據(jù)。同時(shí)由于幅值在t3時(shí)刻前正逐漸減小,輸入門(mén)會(huì)記憶序列短期的變化規(guī)律,將幅值逐漸減小的信息增加到細(xì)胞Ct中,最后通過(guò)輸出門(mén)決定輸出。通過(guò)上述若干非線性變化,可實(shí)現(xiàn)高維函數(shù)的逼近,挖掘幅值數(shù)據(jù)中的隱藏信息以實(shí)現(xiàn)t3—t4時(shí)段缺失數(shù)據(jù)的恢復(fù)。
為了更好耦合電力系統(tǒng)量測(cè)數(shù)據(jù)的時(shí)序特性,本文組合多個(gè)LSTM網(wǎng)絡(luò)單元,提出一種雙層全連接的LSTM網(wǎng)絡(luò)結(jié)構(gòu),可實(shí)現(xiàn)已知數(shù)據(jù)到缺失數(shù)據(jù)的映射,如圖3所示。
圖3 雙層LSTM網(wǎng)絡(luò)模型
設(shè)時(shí)間t內(nèi),幅值數(shù)據(jù)為D=X1,X2, …,Xmn。對(duì)幅值數(shù)據(jù)標(biāo)準(zhǔn)化處理,令m個(gè)數(shù)據(jù)為1組,共n組,首先建立模型的輸入層。每組數(shù)據(jù)對(duì)應(yīng)一個(gè)輸入xi,其中x1={X1,X2, …,Xm},x2={X2,X3, … ,Xm+1}, …,xn={X(n-1)m+1, X(n-1)m+2, … ,Xnm}。然后將多個(gè)LSTM單元組合為一層,通過(guò)兩層LSTM網(wǎng)絡(luò)與Dense全連接組成形成隱藏層。第一層LSTM網(wǎng)絡(luò)將輸入的xi通過(guò)特定結(jié)構(gòu)隱投影到高維空間,其中包含了幅值數(shù)據(jù)Xi,Xi+1, … ,Xi+m間的相互關(guān)系。同時(shí)根據(jù)獨(dú)特的門(mén)結(jié)構(gòu)進(jìn)行判斷,決定記憶或遺忘某些特征。第二層LSTM網(wǎng)絡(luò)將hi提煉為與恢復(fù)數(shù)據(jù)X′m+k+i具有線性關(guān)系的多變量。Dense全連接層可視為回歸層(regression layer),將LSTM網(wǎng)絡(luò)提取的特征hi(狀態(tài)變量)轉(zhuǎn)化為恢復(fù)的缺失數(shù)據(jù)X′m+k+i。輸出層最后通過(guò)迭代和反標(biāo)準(zhǔn)化實(shí)現(xiàn)對(duì)缺失數(shù)據(jù)的恢復(fù)。
本文對(duì)于上述網(wǎng)絡(luò)采用反向傳播算法(backpropagation through time algorithm, BPTT)[24],計(jì)算網(wǎng)絡(luò)中各參數(shù)值。通過(guò)反向計(jì)算每個(gè)神經(jīng)元的誤差項(xiàng)δ,誤差項(xiàng)將沿著時(shí)間反向并向上一層傳播。根據(jù)誤差項(xiàng)可得各時(shí)刻權(quán)重梯度,即可完成所提LSTM網(wǎng)絡(luò)訓(xùn)練,同時(shí)也避免了梯度爆炸和梯度消失的問(wèn)題。
由于量測(cè)數(shù)據(jù)可能處于系統(tǒng)不同運(yùn)行狀態(tài)下,而不同狀態(tài)下的數(shù)據(jù)時(shí)序特性不同,所需LSTM網(wǎng)絡(luò)模型參數(shù)不同,因此需提出一種數(shù)據(jù)狀態(tài)的辨識(shí)方法。隨機(jī)森林方法綜合Bagging集成學(xué)習(xí)算法和隨機(jī)子空間方法的思想,算法構(gòu)建簡(jiǎn)單,準(zhǔn)確性高,比傳統(tǒng)決策樹(shù)方法具有更強(qiáng)的泛化能力[25],因此,本文提出基于隨機(jī)森林的數(shù)據(jù)狀態(tài)辨識(shí)方法。電力系統(tǒng)穩(wěn)態(tài)量測(cè)數(shù)據(jù)和動(dòng)態(tài)量測(cè)數(shù)據(jù)如圖4所示。
圖4 穩(wěn)態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)
圖4中,方框表示量測(cè)數(shù)據(jù)D=X1,X2, … ,Xkj,藍(lán)色方框表示穩(wěn)態(tài)數(shù)據(jù),紅色方框表示動(dòng)態(tài)數(shù)據(jù),其中穩(wěn)態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)各占50%。令j個(gè)數(shù)據(jù)為一組,共k組,數(shù)據(jù)量Q=k×j。設(shè)穩(wěn)態(tài)數(shù)據(jù)組的狀態(tài)標(biāo)簽s1=0,動(dòng)態(tài)數(shù)據(jù)組的狀態(tài)標(biāo)簽s2=1。由于穩(wěn)態(tài)數(shù)據(jù)較為平穩(wěn),離散程度較低,動(dòng)態(tài)數(shù)據(jù)波動(dòng)性強(qiáng),離散程度高,且變化規(guī)律明顯,所以將各數(shù)據(jù)組的均值a、標(biāo)準(zhǔn)差b、極值差c、斜率均值d和斜率極值e作為特征屬性,通過(guò)學(xué)習(xí)上述特征屬性實(shí)現(xiàn)對(duì)兩類(lèi)數(shù)據(jù)的辨識(shí)。
首先通過(guò)Bootstrap重采樣方法對(duì)樣本數(shù)據(jù)D進(jìn)行有放回的m次抽樣,生成m個(gè)訓(xùn)練子集S,其中訓(xùn)練子集樣本數(shù)應(yīng)小于Q。然后從上述5個(gè)特征屬性中隨機(jī)選取w個(gè),對(duì)各訓(xùn)練子集構(gòu)造分類(lèi)回歸樹(shù)(classification and regression tree,CART)。分類(lèi)回歸樹(shù)基于基尼系數(shù)選擇特征,構(gòu)造過(guò)程如下。
1)設(shè)訓(xùn)練子集S中存在穩(wěn)態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù),則訓(xùn)練子集的基尼系數(shù)為:
(4)
式中:p1表示子集中穩(wěn)態(tài)數(shù)據(jù)的概率;p2表示動(dòng)態(tài)數(shù)據(jù)的概率。
2)假設(shè)根據(jù)特征a中某屬性值ai劃分訓(xùn)練子集,訓(xùn)練子集分為S1和S2,則在特征a下的基尼系數(shù)為:
(5)
式中:|·|表示訓(xùn)練子集中的樣本數(shù)。
上述各特征均為連續(xù)特征,需離散化處理。設(shè)連續(xù)特征均值a有z個(gè)不同取值,將這些值從小到大排列,得到特征值集合{a1,a2,… ,az},取各區(qū)間[ai,ai+1)中點(diǎn)作為候選劃分點(diǎn),可得集合Pa:
(6)
3)根據(jù)式(5),計(jì)算各候選劃分點(diǎn)的基尼系數(shù),將基尼系數(shù)最小的候選劃分點(diǎn)作為分支節(jié)點(diǎn)對(duì)訓(xùn)練集中數(shù)據(jù)進(jìn)行分類(lèi),不斷遞歸計(jì)算,直至形成分類(lèi)回歸樹(shù)。
最后,重復(fù)進(jìn)行M次重采樣和特征選取,可得M個(gè)決策樹(shù),形成隨機(jī)森林。將測(cè)試樣本輸入隨機(jī)森林,對(duì)各決策樹(shù)的辨識(shí)結(jié)果采用基于集成投票的思想,選出票數(shù)最多的數(shù)據(jù)狀態(tài),得到隨機(jī)森林方法的辨識(shí)結(jié)果。
考慮到電力系統(tǒng)缺失數(shù)據(jù)的隨機(jī)性,本文提出了一種考慮不同缺失位置的量測(cè)數(shù)據(jù)恢復(fù)策略,如表1所示。在固定時(shí)間窗的前提下,對(duì)時(shí)間窗內(nèi)的量測(cè)缺失數(shù)據(jù)進(jìn)行恢復(fù)。
表1 不同位置下恢復(fù)策略
綜上所述,結(jié)合雙層全連接的LSTM網(wǎng)絡(luò)、隨機(jī)森林的數(shù)據(jù)狀態(tài)辨識(shí)以及不同缺失位置恢復(fù)策略,可得電力系統(tǒng)量測(cè)缺失數(shù)據(jù)恢復(fù)流程,如圖5所示。首先將包含缺失數(shù)據(jù)的樣本輸入訓(xùn)練好的隨機(jī)森林中進(jìn)行數(shù)據(jù)狀態(tài)辨識(shí)。若為穩(wěn)態(tài)數(shù)據(jù),則根據(jù)缺失數(shù)據(jù)在整體數(shù)據(jù)中的具體位置選擇對(duì)應(yīng)的恢復(fù)策略,并輸入LSTM-s網(wǎng)絡(luò)進(jìn)行恢復(fù);若為動(dòng)態(tài)數(shù)據(jù),則在判斷缺失數(shù)據(jù)所處位置后,根據(jù)其對(duì)應(yīng)的恢復(fù)策略,輸入LSTM-d網(wǎng)絡(luò)進(jìn)行恢復(fù)。其中LSTM-s網(wǎng)絡(luò)參數(shù)利用穩(wěn)態(tài)數(shù)據(jù)訓(xùn)練,LSTM-d網(wǎng)絡(luò)參數(shù)利用動(dòng)態(tài)數(shù)據(jù)訓(xùn)練。
圖5 缺失數(shù)據(jù)恢復(fù)流程
本文方法計(jì)算環(huán)境:CPU為Core i7-9700k,主頻為3.6 GHz,內(nèi)存為16 GB,GPU為NVIDIA GTX 2070,編程平臺(tái)為Python 3.7。
經(jīng)大量仿真測(cè)試,LSTM網(wǎng)絡(luò)及隨機(jī)森林的最優(yōu)參數(shù)按下列方法進(jìn)行設(shè)置。LSTM網(wǎng)絡(luò)參數(shù)設(shè)置如下:輸入層維度為1;隱藏層層數(shù)為3,第一層LSTM神經(jīng)元個(gè)數(shù)為64,第二層LSTM神經(jīng)元個(gè)數(shù)為64,Dense層神經(jīng)元個(gè)數(shù)為32;輸出層維度為1,采用Adam優(yōu)化算法更新LSTM網(wǎng)絡(luò)權(quán)重。隨機(jī)森林方法的參數(shù)設(shè)置如下:決策樹(shù)個(gè)數(shù)M為81,隨機(jī)特征數(shù)w為3。若采用其他參數(shù),缺失數(shù)據(jù)恢復(fù)精度將存在不同程度的降低。
為驗(yàn)證本文所提方法的有效性,利用如圖6所示的IEEE 10機(jī)39節(jié)點(diǎn)系統(tǒng)仿真數(shù)據(jù)與西北地區(qū)某750 kV變電站實(shí)測(cè)母線電壓幅值數(shù)據(jù)進(jìn)行驗(yàn)證并與現(xiàn)有方法進(jìn)行對(duì)比。
圖6 IEEE 10機(jī)39節(jié)點(diǎn)拓?fù)?/p>
在仿真系統(tǒng)穩(wěn)態(tài)下,設(shè)置0.2 Hz的低頻振蕩,記錄母線1電壓幅值數(shù)據(jù),上送頻率100 Hz,仿真數(shù)據(jù)如圖7所示。由圖7可知,系統(tǒng)運(yùn)行約1.6 s后發(fā)生低頻振蕩。藍(lán)色表示穩(wěn)態(tài)數(shù)據(jù)為160個(gè),紅色表示動(dòng)態(tài)數(shù)據(jù)為240個(gè)。
圖7 穩(wěn)態(tài)和動(dòng)態(tài)仿真數(shù)據(jù)
首先設(shè)置不同的缺失數(shù)據(jù)占比,仿真次數(shù)為100次。采用本文所提隨機(jī)森林方法測(cè)試數(shù)據(jù)狀態(tài)辨識(shí)精度(對(duì)應(yīng)圖5中隨機(jī)森林部分),并與文獻(xiàn)[25]的決策樹(shù)法進(jìn)行對(duì)比,結(jié)果如圖8所示。
圖8 仿真數(shù)據(jù)狀態(tài)辨識(shí)結(jié)果
由圖8可知,隨著缺失數(shù)據(jù)占比的增加,兩種方法的辨識(shí)精度均不同程度降低,當(dāng)缺失數(shù)據(jù)占比為10%至60%時(shí),本文所提隨機(jī)森林的數(shù)據(jù)狀態(tài)辨識(shí)方法的平均準(zhǔn)確率約為98.5%,并且均高于決策樹(shù)法。
然后針對(duì)圖7的仿真數(shù)據(jù),在缺失數(shù)據(jù)數(shù)占比為10%時(shí),改變?nèi)笔?shù)據(jù)位置,結(jié)合所提隨機(jī)森林狀態(tài)辨識(shí)與LSTM網(wǎng)絡(luò)恢復(fù)方法對(duì)缺失數(shù)據(jù)進(jìn)行恢復(fù)(對(duì)應(yīng)圖5中LSTM網(wǎng)絡(luò)部分),并與僅采用LSTM網(wǎng)絡(luò)的恢復(fù)方法、文獻(xiàn)[13]的插值法和文獻(xiàn)[16]的低秩法對(duì)比,恢復(fù)數(shù)據(jù)的均方根誤差見(jiàn)表2。
表2 不同缺失位置對(duì)數(shù)據(jù)恢復(fù)精度的影響
由表2可知,本文所提結(jié)合隨機(jī)森林狀態(tài)辨識(shí)與LSTM網(wǎng)絡(luò)恢復(fù)方法受缺失數(shù)據(jù)位置的影響較小;由于不同缺失位置下數(shù)據(jù)狀態(tài)不同,因此僅采用LSTM網(wǎng)絡(luò)的恢復(fù)方法受其影響較大,無(wú)法準(zhǔn)確恢復(fù)缺失數(shù)據(jù),須結(jié)合基于隨機(jī)森林的數(shù)據(jù)狀態(tài)辨識(shí)方法;插值法無(wú)法較好地恢復(fù)動(dòng)態(tài)下的數(shù)據(jù);低秩法在過(guò)渡階段的恢復(fù)誤差較大。中部數(shù)據(jù)為穩(wěn)態(tài)到動(dòng)態(tài)的過(guò)渡階段,因此4種方法在該情況下的恢復(fù)精度均有不同程度的降低。
接下來(lái)將缺失數(shù)據(jù)設(shè)置位于序列中部,改變?nèi)笔д急龋瑢?duì)比4種方法的恢復(fù)結(jié)果,如表3所示。
表3 不同缺失占比對(duì)數(shù)據(jù)恢復(fù)精度的影響
由表3可知,插值法在缺失數(shù)據(jù)較多時(shí),無(wú)法準(zhǔn)確恢復(fù)缺失數(shù)據(jù)。在缺失占比為30%時(shí),僅本文所提方法可有效恢復(fù)缺失數(shù)據(jù),可見(jiàn)本文所提方法受缺失占比的影響較小。
在此基礎(chǔ)上,設(shè)置圖7中的動(dòng)態(tài)數(shù)據(jù)存在20%的缺失數(shù)據(jù),采用所提雙層全連接的LSTM網(wǎng)絡(luò)對(duì)缺失數(shù)據(jù)進(jìn)行恢復(fù),并與插值法、低秩法進(jìn)行對(duì)比。由于該過(guò)程未涉及數(shù)據(jù)狀態(tài)辨識(shí),因此無(wú)須使用基于隨機(jī)森林的狀態(tài)辨識(shí)方法,恢復(fù)結(jié)果如圖9所示。
圖9 動(dòng)態(tài)缺失數(shù)據(jù)恢復(fù)結(jié)果
通過(guò)計(jì)算可知,本文所提量測(cè)缺失數(shù)據(jù)恢復(fù)方法的均方根誤差為0.18%,插值法的均方根誤差為4.61%,低秩方法的均方根誤差為1.17%??梢?jiàn)本文所提方法恢復(fù)精度較高,可有效恢復(fù)動(dòng)態(tài)下的缺失數(shù)據(jù)。
選用西北地區(qū)某750 kV變電站實(shí)測(cè)母線電壓幅值數(shù)據(jù)驗(yàn)證所提方法的有效性。實(shí)測(cè)數(shù)據(jù)均為穩(wěn)態(tài)數(shù)據(jù),如圖10所示。在不同母線實(shí)測(cè)數(shù)據(jù)中設(shè)置多種動(dòng)態(tài)數(shù)據(jù),首先驗(yàn)證所提數(shù)據(jù)狀態(tài)辨識(shí)方法的有效性,結(jié)果如表4所示。
圖10 現(xiàn)場(chǎng)實(shí)測(cè)母線電壓幅值數(shù)據(jù)
表4 不同方法對(duì)現(xiàn)場(chǎng)數(shù)據(jù)狀態(tài)辨識(shí)結(jié)果對(duì)比
由表4可知,對(duì)于不同母線實(shí)測(cè)數(shù)據(jù),隨機(jī)森林方法的辨識(shí)準(zhǔn)確率均高于決策樹(shù)法,即隨機(jī)森林方法具有較好的泛化性,不受現(xiàn)場(chǎng)噪聲等的影響。
在如圖10所示的位置設(shè)置缺失數(shù)據(jù),采用時(shí)間窗為0.5 s的量測(cè)數(shù)據(jù)進(jìn)行恢復(fù),保證缺失數(shù)據(jù)的位置位于中部,并與插值法、低秩法進(jìn)行對(duì)比,結(jié)果如圖11所示。
圖11 現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)恢復(fù)結(jié)果
由圖11可知,本文所提恢復(fù)方法的均方根誤差為0.94%,插值法的均方根誤差為3.1%,低秩法的均方根誤差為2.6%。可見(jiàn)本文所提的LSTM網(wǎng)絡(luò)的缺失數(shù)據(jù)恢復(fù)方法對(duì)實(shí)測(cè)缺失數(shù)據(jù)的恢復(fù)精度最高,可適用于現(xiàn)場(chǎng)量測(cè)數(shù)據(jù)。
本文提出了一種基于長(zhǎng)短期記憶網(wǎng)絡(luò)的電力系統(tǒng)量測(cè)缺失數(shù)據(jù)恢復(fù)方法。該方法可有效辨識(shí)系統(tǒng)量測(cè)數(shù)據(jù)的不同狀態(tài),進(jìn)而實(shí)現(xiàn)對(duì)量測(cè)缺失數(shù)據(jù)的準(zhǔn)確恢復(fù),有效提高數(shù)據(jù)的可用性。本文研究主要結(jié)論如下:
1)基于長(zhǎng)短期記憶網(wǎng)絡(luò)對(duì)電力系統(tǒng)量測(cè)數(shù)據(jù)規(guī)律選擇記憶的特性,提出了一種雙層全連接的LSTM網(wǎng)絡(luò)模型,實(shí)現(xiàn)從已知數(shù)據(jù)到缺失數(shù)據(jù)的映射。
2)提出一種基于隨機(jī)森林的數(shù)據(jù)狀態(tài)辨識(shí)方法,有效區(qū)別系統(tǒng)穩(wěn)態(tài)、動(dòng)態(tài)數(shù)據(jù),為后續(xù)缺失數(shù)據(jù)恢復(fù)提供基礎(chǔ)。
3)提出一種考慮缺失數(shù)據(jù)位置的恢復(fù)策略,根據(jù)數(shù)據(jù)的缺失位置匹配相應(yīng)的恢復(fù)策略提高恢復(fù)精度。
4)通過(guò)仿真和實(shí)測(cè)數(shù)據(jù)測(cè)試表明所提方法可有效恢復(fù)系統(tǒng)穩(wěn)態(tài)、動(dòng)態(tài)下的缺失數(shù)據(jù),亦可提高現(xiàn)有方法的恢復(fù)精度。
本文暫未計(jì)及不良數(shù)據(jù)對(duì)量測(cè)缺失數(shù)據(jù)恢復(fù)的影響,后續(xù)將進(jìn)一步針對(duì)不良數(shù)據(jù)檢測(cè)辨識(shí)展開(kāi)研究。