嚴(yán)明輝,潘舒宸,吳滇寧,崔雪,盧少平,趙俊
(1. 昆明電力交易中心有限責(zé)任公司, 云南省 昆明市 650011;2. 武漢大學(xué)電氣與自動(dòng)化學(xué)院, 湖北省 武漢市 430072)
2015年3月份黨中央、國(guó)務(wù)院《關(guān)于進(jìn)一步深化電力體制改革的若干意見》(中發(fā)[2015]9號(hào))印發(fā)后,迎來了新一輪的電力體制改革。改革堅(jiān)持市場(chǎng)化方向,以建立健全電力市場(chǎng)機(jī)制為主要目標(biāo),電力市場(chǎng)的建設(shè)也隨著新一輪電改的推進(jìn)而逐步前行。
隨著電力現(xiàn)貨市場(chǎng)建設(shè)的不斷推進(jìn)對(duì)交易結(jié)算環(huán)節(jié)中電量數(shù)據(jù)的可靠性與準(zhǔn)確性提出了更高的要求。計(jì)量系統(tǒng)實(shí)際運(yùn)行過程中,由于用戶側(cè)電表運(yùn)行中出現(xiàn)的故障等問題,會(huì)出現(xiàn)跳表、死數(shù)等問題導(dǎo)致電量數(shù)據(jù)良莠不齊,造成數(shù)據(jù)的缺失與異常。對(duì)異常數(shù)據(jù)進(jìn)行辨識(shí)與修正,保證電力市場(chǎng)用戶電量數(shù)據(jù)的準(zhǔn)確性,有利于維持電力市場(chǎng)的安全穩(wěn)定運(yùn)行。
關(guān)于電力系統(tǒng)異常數(shù)據(jù)的辨識(shí),國(guó)內(nèi)外專家學(xué)者已經(jīng)提出過許多方法,有基于統(tǒng)計(jì)學(xué)的方法[1-2]、基于聚類的方法[3-8]、基于神經(jīng)網(wǎng)絡(luò)的方法[9]、基于密度估計(jì)的方法[10]以及基于T橢圓圖的方法[11]等。
而電力市場(chǎng)用戶異常電量數(shù)據(jù)的修正,各省份已編制出臺(tái)的電力現(xiàn)貨市場(chǎng)交易規(guī)則[12]中采取的傳統(tǒng)的方法有插值法、相似日均值填充法等。這類傳統(tǒng)修正方法的處理方式較為粗糙,無法對(duì)異常電量數(shù)據(jù)進(jìn)行精確修正。為更加準(zhǔn)確地修正電量數(shù)據(jù),國(guó)內(nèi)外學(xué)者提出了各種算法來修正異常數(shù)據(jù)。
文獻(xiàn)[1]以歷史負(fù)荷數(shù)據(jù)為基礎(chǔ),基于統(tǒng)計(jì)學(xué)的方法計(jì)算同一時(shí)刻電量數(shù)據(jù)的均值與方差來對(duì)異常數(shù)據(jù)進(jìn)行辨識(shí)和修復(fù)。文獻(xiàn)[3]采取基于模糊負(fù)荷聚類的方法進(jìn)行負(fù)荷異常數(shù)據(jù)辨識(shí)與修正,利用模擬退火遺傳優(yōu)化的模糊c均值聚類算法獲取負(fù)荷的特征曲線,并用于異常數(shù)據(jù)的辨識(shí)與修正,但該方法的修正效果依賴于聚類中心的準(zhǔn)確度與聚類曲線的相似性。文獻(xiàn)[4]以模糊c均值聚類算法為基礎(chǔ),引入快速爬山函數(shù)法對(duì)聚類算法進(jìn)行優(yōu)化,提取特征曲線進(jìn)行不良數(shù)據(jù)的辨識(shí)與修復(fù)。文獻(xiàn)[13]采取BP神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行負(fù)荷異常點(diǎn)數(shù)據(jù)的預(yù)測(cè)并應(yīng)用于修正,但因網(wǎng)絡(luò)各層間的權(quán)值和閾值確定不合理影響了修正效果。文獻(xiàn)[14]采取基于聚類訓(xùn)練樣本的遺傳算法優(yōu)化的徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)對(duì)負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè)并將其應(yīng)用于異常數(shù)據(jù)修正,改進(jìn)了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)選取的問題,但對(duì)樣本數(shù)據(jù)的規(guī)模有較大的依賴性。
以上文獻(xiàn)所述方法均應(yīng)用于電力系統(tǒng)負(fù)荷數(shù)據(jù)處理,或是多用戶負(fù)荷不良數(shù)據(jù)的辨識(shí)與修正,針對(duì)單一電力市場(chǎng)用戶的異常電量數(shù)據(jù)的辨識(shí)與修正涉及較少。本文采用非參數(shù)核密度估計(jì)的方法對(duì)單一電力市場(chǎng)用戶的電量數(shù)據(jù)進(jìn)行研究,發(fā)掘其歷史數(shù)據(jù)中的潛在規(guī)律,進(jìn)一步提高異常數(shù)據(jù)辨識(shí)與修正的準(zhǔn)確性。
核密度估計(jì)(kernel density estimation,KDE)方法是一種常見的非參數(shù)統(tǒng)計(jì)方法。從數(shù)據(jù)本身出發(fā),對(duì)數(shù)據(jù)分布特征與分布規(guī)律進(jìn)行描述,在各個(gè)領(lǐng)域都有其廣泛的應(yīng)用。文獻(xiàn)[15-16]通過建立非參數(shù)核密度估計(jì)模型進(jìn)行風(fēng)電功率概率區(qū)間預(yù)測(cè),結(jié)果符合真實(shí)誤差分布,且概率區(qū)間預(yù)測(cè)效果良好。文獻(xiàn)[17]則采用高斯核密度估計(jì)對(duì)電力系統(tǒng)短期負(fù)荷區(qū)間進(jìn)行預(yù)測(cè),也取得了良好的效果。
本文提出基于非參數(shù)核密度估計(jì)的電量數(shù)據(jù)辨識(shí)與修正方法,以期準(zhǔn)確辨識(shí)電量異常數(shù)據(jù)。
非參數(shù)核密度估計(jì)基于概率統(tǒng)計(jì)的思想,與參數(shù)估計(jì)相比,其無需利用經(jīng)驗(yàn)對(duì)有關(guān)數(shù)據(jù)做出假設(shè)作為先驗(yàn)分布,對(duì)數(shù)據(jù)分布不附加任何假定,從數(shù)據(jù)樣本本身特征出發(fā),研究其分布特征,具有更加廣泛的應(yīng)用能力。因此,非參數(shù)核密度估計(jì)方法在應(yīng)用領(lǐng)域受到了高度的重視。本文對(duì)樣本用戶一個(gè)月的電量數(shù)據(jù)進(jìn)行非參數(shù)核密度估計(jì),提取出一條日電量特征曲線,并將其應(yīng)用于異常數(shù)據(jù)的辨識(shí)與修正。
該方法在電量特征曲線提取中的具體步驟如圖1所示。
1)某用戶第i日與第j日96點(diǎn)日電量數(shù)據(jù)為Xi=[xi1,xi2,…,xi96]T與Xj=[xj1,xj2,…,xj96]T,則該用戶共n日電量數(shù)據(jù)為
2)非參數(shù)核密度估計(jì)中常見核函數(shù)有Uniform核函數(shù)、Triangle核函數(shù)、Gaussian核函數(shù)以及Epannechnikov核函數(shù)等。有文獻(xiàn)指出核函數(shù)的選取對(duì)估計(jì)的漸進(jìn)性質(zhì)幾乎沒有影響,并且由于Gaussian核函數(shù)具有任意階連續(xù)導(dǎo)數(shù),有優(yōu)良的可導(dǎo)性,且計(jì)算相對(duì)容易,故而本文采用Gaussian核函數(shù)作為非參數(shù)核密度估計(jì)的核函數(shù)K,其計(jì)算公式為
式中c為大于0的常數(shù),K(x)滿足:
3)根據(jù)非參數(shù)核密度理論計(jì)算該用戶歷史負(fù)荷數(shù)據(jù)第k時(shí)刻負(fù)荷值xk_num對(duì)應(yīng)的概率密度函數(shù)fk(xk_num),其表達(dá)式為
式中:T為時(shí)序k下的樣本點(diǎn)數(shù)目;h為窗寬;xik為第i日k時(shí)刻的電量值。
4)使用式(4)計(jì)算該用戶各時(shí)刻對(duì)應(yīng)的概率密度函數(shù),形成最大概率密度向量曲線,Xmp=[xmp_1,xmp_2,…xmp_k,…,xmp_96]T,其中xmp_k為fk(xk_num)取最大值時(shí)xk_num對(duì)應(yīng)的數(shù)值。
5)計(jì)算參與特征曲線提取的樣本日i的電量向量Xi=[xi1,xi2,···,xi96]T相較于最大概率電量曲線向 量Xmp=[xmp_1,xmp_2,···xmp_k,···,xmp_96]T的 權(quán) 重wi,計(jì)算公式為:
式中 λ為用于調(diào)整di對(duì)wi的影響程度的可調(diào)參數(shù),且 λ∈[0,1],而di為
6)對(duì)參與電量特征曲線提取的各樣本日的日電量曲線按式(7)進(jìn)行加權(quán)疊加以獲得該用戶的特征曲線,其計(jì)算公式為
在非參數(shù)核密度估計(jì)的應(yīng)用中,窗寬h的選取對(duì)最終結(jié)果的影響至關(guān)重要。窗寬h選擇過小,將使樣本的局部波動(dòng)特征對(duì)最終結(jié)果造成過大的影響,單一樣本對(duì)整體模型影響較大,導(dǎo)致最終結(jié)果平穩(wěn)性較低。窗寬h選擇過大,將使核密度估計(jì)的預(yù)測(cè)精度降低,導(dǎo)致最終結(jié)果誤差較大。
目前,求取窗寬h主要基于均方誤差(mean squarederror,MSE)準(zhǔn)則、積分平方誤差(integrated squared error,ISE)準(zhǔn)則和均勻積分平方誤差(mean integrated squared error,MISE)準(zhǔn)則。MSE準(zhǔn)則僅考慮非參數(shù)核密度估計(jì)在某一個(gè)點(diǎn)處的估計(jì)優(yōu)劣,ISE準(zhǔn)則依賴于參與非參數(shù)核密度估計(jì)的樣本,在不同次觀測(cè)中將得到不同的結(jié)果,而MISE準(zhǔn)則考慮了估計(jì)的全局優(yōu)劣性[18]。故而本文采取MISE最小的方法來進(jìn)行窗寬的選取優(yōu)化。MISE的定義為
式中:結(jié)果的第1項(xiàng)是期望值與實(shí)際值之差平方的積分;第2項(xiàng)為估計(jì)值的方差積分。
將式(8)進(jìn)行泰勒展開后求解可得:
將式(9)中的無窮小量忽略后,即可得到漸進(jìn)積分均方誤差(asymptotic mean integrated square error,AMISE):
對(duì)該結(jié)果求導(dǎo),導(dǎo)數(shù)為0時(shí),AMISE最小,此時(shí)最佳窗寬為
采集到的電力市場(chǎng)用戶電量數(shù)據(jù)中,常見的數(shù)據(jù)異常類型有數(shù)據(jù)缺失、數(shù)據(jù)異常跳變、表計(jì)死數(shù)造成的電量為零等。通過綜合利用特征曲線與歷史電量數(shù)據(jù)中所蘊(yùn)含的信息,得到用戶電量數(shù)據(jù)的可行域矩陣,可較為準(zhǔn)確地辨識(shí)出電量數(shù)據(jù)中存在的異常數(shù)據(jù),具體方法如下文所述。
1)對(duì)于歷史電量數(shù)據(jù)樣品集U,計(jì)算出該用戶歷史電量數(shù)據(jù)在同一時(shí)刻的最大值與最小值:
2)通過對(duì)比提取得到特征曲線Xd=[xd_1,xd_2,···,xd_96]與歷史數(shù)據(jù)的電量最大最小值,應(yīng)用式(13)可計(jì)算出歷史數(shù)據(jù)域的上下限:
3)由電力公司結(jié)合歷史經(jīng)驗(yàn)確定各類電力市場(chǎng)用戶允許變化的閾值系數(shù)Kt,計(jì)算出電量數(shù)據(jù)可行域的上下限:
4)利用計(jì)算出的可行域上下限形成電量數(shù)據(jù)的可行域矩陣,該用戶的可行域矩陣為
當(dāng)Xnew中 第i個(gè) 分量滿足xnew,i≤xd_i時(shí),利用式(17)計(jì)算待檢數(shù)據(jù)下限:
當(dāng)待檢曲線的上下限均處于可行域范圍內(nèi)時(shí),則認(rèn)為待檢曲線數(shù)據(jù)正常,無異常數(shù)據(jù)。當(dāng)出現(xiàn)越限情況時(shí),即可辨識(shí)出異常數(shù)據(jù)。
對(duì)識(shí)別出的異常數(shù)據(jù),需由電力公司聯(lián)系電力用戶確認(rèn)是否由突發(fā)情況或計(jì)劃停電等因素引起的用電行為異常。若異常用電行為客觀存在,則應(yīng)對(duì)異常電量數(shù)據(jù)予以保留。
對(duì)于電力市場(chǎng)用戶電量數(shù)據(jù)出現(xiàn)異常數(shù)據(jù)情況可根據(jù)出現(xiàn)異常數(shù)據(jù)點(diǎn)的個(gè)數(shù)分為單點(diǎn)數(shù)據(jù)異常與多點(diǎn)數(shù)據(jù)異常。
由于電力市場(chǎng)用戶電量是由表碼讀數(shù)相減間接計(jì)算得到的,表碼數(shù)據(jù)的單點(diǎn)異常將導(dǎo)致電量數(shù)據(jù)兩點(diǎn)出現(xiàn)異常。此時(shí)采用插值的方法進(jìn)行電量修正不僅計(jì)算簡(jiǎn)單,誤差也較小。
當(dāng)電量數(shù)據(jù)出現(xiàn)多點(diǎn)異常時(shí),使用插值的修正方法將導(dǎo)致較大的誤差。與傳統(tǒng)的僅考慮異常數(shù)據(jù)點(diǎn)的相似日均值填充法不同,本文采取的修正方法還考慮了異常數(shù)據(jù)區(qū)間前后的正常電量數(shù)據(jù)中所蘊(yùn)含的信息,使誤差進(jìn)一步降低。
通過電力市場(chǎng)用戶電表出現(xiàn)異常數(shù)據(jù)區(qū)間前后的表碼讀數(shù)相減可得出異常數(shù)據(jù)區(qū)間的總用電量,與特征曲線對(duì)應(yīng)的區(qū)間總用電量進(jìn)行比較,再將特征曲線對(duì)應(yīng)數(shù)據(jù)點(diǎn)的數(shù)據(jù)按比例進(jìn)行縮放作為修正后的數(shù)據(jù)。實(shí)現(xiàn)方法如下所述。
根據(jù)1.1節(jié)所述方法提取得到用戶日電量特征曲線Xd,通過電力市場(chǎng)用戶異常數(shù)據(jù)區(qū)間前后的表碼讀數(shù)相減可得異常數(shù)據(jù)區(qū)間的總用電量Et,再根據(jù)特征曲線對(duì)應(yīng)區(qū)間的總用電量計(jì)算出縮放比例Kd,即
式中:Et為 異常數(shù)據(jù)區(qū)間的總用電量;ei為特征曲線第i個(gè)異常數(shù)據(jù)出現(xiàn)時(shí)刻的電量數(shù)據(jù);n代表異常數(shù)據(jù)點(diǎn)個(gè)數(shù)。
則第i個(gè)異常時(shí)刻的電量數(shù)據(jù)修正值為
《廣東電力市場(chǎng)結(jié)算實(shí)施細(xì)則》電量數(shù)據(jù)擬合辦法中將電力市場(chǎng)用戶的日期類型按時(shí)間屬性分為工作日、雙休日、國(guó)家法定節(jié)假日3種。參考該細(xì)則的日期類型劃分,本文將某省電力市場(chǎng)用戶2018年12月份工作日電量數(shù)據(jù)作為樣本數(shù)據(jù)進(jìn)行算例分析,該數(shù)據(jù)集以每15 min為一個(gè)數(shù)據(jù)點(diǎn),共計(jì) 21×96=2016個(gè)數(shù)據(jù)點(diǎn)。在該數(shù)據(jù)集中隨機(jī)選取數(shù)據(jù)點(diǎn)將其作為異常數(shù)據(jù)點(diǎn),利用本文所提方法進(jìn)行異常數(shù)據(jù)的辨識(shí)與修正,并將修正結(jié)果與線性插值方法、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法和相似日均值填充方法進(jìn)行比較。
圖2為該用戶12月份工作日每一日的日電量曲線與所提取出的特征曲線。
根據(jù)該用戶的類別由歷史經(jīng)驗(yàn)確定該用戶允許變化的閾值系數(shù)為Kt=1.3,經(jīng)計(jì)算可得該數(shù)據(jù)集的可行域如圖3所示。
隨機(jī)選取12月18日的第34至37數(shù)據(jù)點(diǎn),將12月18日的第34,36數(shù)據(jù)點(diǎn)的電量數(shù)據(jù)放大為實(shí)際值的2倍,第35,37數(shù)據(jù)點(diǎn)的電量數(shù)據(jù)縮小為實(shí)際值的0.2倍作為異常數(shù)據(jù)點(diǎn),采用本文所提方法進(jìn)行異常數(shù)據(jù)的識(shí)別。
將異常電量數(shù)據(jù)曲線映射至可行域,其結(jié)果如圖4所示。
從圖4中可以看出,經(jīng)過放縮后的數(shù)據(jù)點(diǎn)映射至可行域后明顯越過了可行域的上下限,被識(shí)別為異常數(shù)據(jù)點(diǎn),證明本文所提識(shí)別方法可準(zhǔn)確識(shí)別出異常數(shù)據(jù)。
對(duì)上例中選取的4個(gè)異常數(shù)據(jù)點(diǎn)分別利用線性插值、相似日均值填充、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)和本文所提方法進(jìn)行修正,修正結(jié)果如圖5所示。
表1為各方法的修復(fù)結(jié)果。相對(duì)誤差結(jié)果如表2所示。進(jìn)行100組隨機(jī)試驗(yàn)后,各修正方法的平均相對(duì)誤差如表3所示。
表1 電量數(shù)據(jù)修正結(jié)果對(duì)比Table 1 Comparison of corrected results of electric quantity data kW·h
表2 連續(xù)4點(diǎn)缺失情況下不同算法相對(duì)誤差對(duì)比Table 2 Comparison of relative errors from different algorithms under four consecutive missing points %
表3 連續(xù)4點(diǎn)缺失情況下不同算法平均相對(duì)誤差對(duì)比Table 3 Comparison of average relative error from different algorithms under four consecutive missing points %
從表1—2可以看出在修復(fù)電量異常數(shù)據(jù)點(diǎn)的數(shù)據(jù)時(shí),各種方法都存在一定的誤差,本文所提方法充分考慮了電量異常數(shù)據(jù)點(diǎn)前后數(shù)據(jù)的有效信息,因此修正誤差在以上4種方法中最小。
從表3可以看出,通過100組隨機(jī)試驗(yàn)后,線性插值方法所造成的平均相對(duì)誤差較大,相似日均值填充與神經(jīng)網(wǎng)絡(luò)方法造成的平均相對(duì)誤差接近,本文所提修正方法所造成的平均相對(duì)誤差仍是最小的。
在12月份工作日內(nèi)隨機(jī)設(shè)置連續(xù)16個(gè)電量異常數(shù)據(jù)點(diǎn),分別采用4種方法進(jìn)行數(shù)據(jù)修復(fù)。圖6為隨機(jī)設(shè)置的一組異常電量數(shù)據(jù)的修復(fù)結(jié)果。
本例中將12月20日的第35至50數(shù)據(jù)點(diǎn)作為異常數(shù)據(jù)點(diǎn),由圖6可知,在異常點(diǎn)數(shù)目較多時(shí),線性插值方法已無法準(zhǔn)確地描述曲線的變化趨勢(shì),誤差較大。
在經(jīng)過100次隨機(jī)試驗(yàn)后,統(tǒng)計(jì)所得各種方法的平均相對(duì)誤差如表4所示。
表4 連續(xù)16點(diǎn)缺失情況下不同算法平均相對(duì)誤差對(duì)比Table 4 Comparison of average relative errors from different algorithms under sixteen consecutive missing points %
從表4中可以看出線性插值方法由于連續(xù)異常數(shù)據(jù)點(diǎn)較多,僅利用異常數(shù)據(jù)區(qū)間前后的表碼讀數(shù)無法還原異常數(shù)據(jù)點(diǎn)真實(shí)電量的變化規(guī)律,因此修復(fù)結(jié)果的誤差較大。本文所提修正方法不僅考慮了異常數(shù)據(jù)區(qū)間前后的表碼讀數(shù),還根據(jù)歷史數(shù)據(jù)提取出了異常數(shù)據(jù)區(qū)間的變化規(guī)律,修正結(jié)果所造成的平均相對(duì)誤差仍為幾種方法中最小的,準(zhǔn)確度最高。
通過上述2組算例驗(yàn)證了本文所提修正方法的優(yōu)越性。為了進(jìn)一步驗(yàn)證本文所提方法的準(zhǔn)確性,本文分別將連續(xù)異常數(shù)據(jù)點(diǎn)數(shù)目設(shè)置為2—96,再對(duì)4種方法分別進(jìn)行100組測(cè)試,取其平均相對(duì)誤差。修正結(jié)果的誤差曲線如圖7所示。
從圖7中可以看出除線性插值的相對(duì)誤差隨異常點(diǎn)個(gè)數(shù)的增加不斷增大外,其余幾種方法隨著缺失點(diǎn)數(shù)目的增加都有很好的適用性。除線性插值方法外的誤差曲線如圖8所示。
從圖8中可以看出,相似日均值填充方法與神經(jīng)網(wǎng)絡(luò)方法在異常點(diǎn)個(gè)數(shù)不同時(shí)表現(xiàn)各有優(yōu)劣,而本文所提方法在連續(xù)多點(diǎn)異常數(shù)據(jù)的修正表現(xiàn)上始終保持誤差最低,準(zhǔn)確性較高。
為了解決在電力現(xiàn)貨市場(chǎng)結(jié)算環(huán)節(jié)中所面臨的計(jì)量電量數(shù)據(jù)異常問題,本文提出了基于非參數(shù)核密度估計(jì)的電力市場(chǎng)用戶電量數(shù)據(jù)辨識(shí)與修正方法。本文所提方法可準(zhǔn)確識(shí)別出電力市場(chǎng)用戶的電量異常數(shù)據(jù)并對(duì)其進(jìn)行修正。算例分析結(jié)果表明,與各省份已出臺(tái)的電力現(xiàn)貨市場(chǎng)交易結(jié)算規(guī)則中的線性插值、相似日均值填充方法以及神經(jīng)網(wǎng)絡(luò)方法相比,本文所提方法在連續(xù)多點(diǎn)電量數(shù)據(jù)異常的修正過程中準(zhǔn)確度最高,可為電力現(xiàn)貨市場(chǎng)結(jié)算環(huán)節(jié)中對(duì)日分時(shí)電量數(shù)據(jù)異常處理問題提供技術(shù)支撐。