羅煜
摘 要:在當(dāng)前國家推進(jìn)電力市場化交易的形勢下,研究電力大客戶的負(fù)荷模式具有重要意義。文章通過應(yīng)用K-means的聚類算法,實(shí)現(xiàn)對工業(yè)大客戶的電力負(fù)荷模式識(shí)別。同時(shí),也提出了通過小波的方法壓縮存儲(chǔ)空間,并簡要分析了負(fù)荷模式對負(fù)荷預(yù)測的作用。
關(guān)鍵詞:負(fù)荷模式;K-means聚類;負(fù)荷預(yù)測
中圖分類號(hào):TM714 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8937(2016)12-0117-03
許多企業(yè)用戶對電力的需求相當(dāng)大,這些電力大客戶日負(fù)荷非常大,并且其負(fù)荷模式常常在一段時(shí)期內(nèi)基本固定。
本文通過K-means的聚類算法對其日負(fù)荷曲線進(jìn)行模式識(shí)別,來研究電力大客戶的負(fù)荷模式。通過對電力大客戶的負(fù)荷模式研究,可以大致掌握其用電規(guī)律,并可應(yīng)用于負(fù)荷預(yù)測、需求側(cè)響應(yīng)、調(diào)度管理等實(shí)際工作中。
1 電力負(fù)荷模式研究
1.1 測度函數(shù)
在進(jìn)行電力客戶模式研究時(shí),必須先定義近鄰測度函數(shù)。近鄰測度函數(shù)有兩種,一種是相似性測度,兩個(gè)向量(或點(diǎn)集)之間越相似,其相似測度函數(shù)值越大;另一種是不相似測度,兩個(gè)向量(或點(diǎn)集)之間越相似,其不相似測度函數(shù)值越小。
著名的歐氏距離函數(shù)即是一種不相似性測度函數(shù),對兩個(gè)向量x,y而言,其歐氏距離定義為:
d■=(x,y)=■2■(1)
在本文中,采取常用的一種相似性測度函數(shù)Pearson系數(shù)來衡量日負(fù)荷曲線間的相似性。Pearson系數(shù)定義為:
rPearson(x,y)=■(2)
1.2 負(fù)荷曲線去噪
對于電力負(fù)荷曲線而言,我們更關(guān)心的是曲線的整體形狀,局部的“毛刺”對曲線的整體形狀影響不大。為了聚類結(jié)果更快速,以及節(jié)省儲(chǔ)存空間,這里提出用Haar小波去燥的方法來處理負(fù)荷曲線。
Haar小波的尺度函數(shù)定義為:
φ(x)=1, 若0≤x<10, 其余情況(3)
?撞k∈zφ(2jx-k)構(gòu)成一組正交基,其正交補(bǔ)定義為:
?撞k∈z?漬(2jx-l)
?漬(x)定義如下:
?漬(x)=1, 若0≤x≤1/2-1, 若1/2≤x<1 0, 其余情況(4)
將日負(fù)荷曲線展開為?漬(2jx-l)與φ(x-k)的序列相加,去掉屬于較大的j的?漬(2jx-l)分量(去噪),但如果?漬(2jx-l)前的系數(shù)很大則予以保留,再進(jìn)行重構(gòu)。
1.3 聚類算法
對負(fù)荷曲線進(jìn)行聚類就是把大量負(fù)荷曲線分割成不同的類,使得同一個(gè)類內(nèi)的負(fù)荷曲線的相似性盡可能大,同時(shí)不在同一個(gè)類中的負(fù)荷曲線的差異性也盡可能地大。即聚類后相似的負(fù)荷曲線盡可能聚集到一起,不同負(fù)荷曲線盡量分離。 K-means聚類算法是經(jīng)典的聚類1之一。其聚類準(zhǔn)則采用平方誤差準(zhǔn)則,其定義如下:
E=■■f■(p,m■)(5)
式中,E的值是聚類的判斷條件,p為需要聚類的元素,Ci為一個(gè)類,mi為Ci的中心。ki為Ci目前的元素?cái)?shù)目,f為測度函數(shù),表示元素p到mi的距離,本文采取f=■。其聚類算法過程如下:
①設(shè)共有x個(gè)元素,目前已有個(gè)n元素已聚類,目前有m個(gè)類Ci(i=1,2,…,m),Ci的元素個(gè)數(shù)為ki設(shè)定閥值?夼。
②對第n+1個(gè)元素pn+1,對于每個(gè)類Ci,求取將pn+1歸并入Ci后的Ei,取最小的Ei為Emin,設(shè)此時(shí)i=o,若Emin<?夼,則將pn+1歸入Co中,否則新建一個(gè)類Cm+1={pn+1}。
③重復(fù)步驟①②,直到n=x,所有元素聚類為止。
1.4 實(shí)際數(shù)據(jù)分析
以下為某企業(yè)連續(xù)71 d的日負(fù)荷曲線(每15 min采樣一次,單條日負(fù)荷曲線共96個(gè)數(shù)據(jù)點(diǎn)),如圖1所示。
采用1.3的聚類算法,得到的結(jié)果,如圖2所示。
2 電力客戶負(fù)荷預(yù)測的應(yīng)用
大型制造型企業(yè)在一段較短時(shí)間內(nèi)負(fù)荷模式基本不變。因此,對于用電量較大的電力客戶,可以采取負(fù)荷模式來進(jìn)行負(fù)荷預(yù)測。
從圖1中挑選出連續(xù)8 d的日負(fù)荷曲線,如圖3所示。
通過聚類算法后,其中一條明顯不同與其他的負(fù)荷曲線被區(qū)分出來,得到的結(jié)果,如圖4(a)(b)所示。該條明顯不同的負(fù)荷曲線其實(shí)是對應(yīng)企業(yè)的某個(gè)周日的負(fù)荷曲線。
另外,圖3采用Harr小波去噪后,得到的結(jié)果,如圖5所示。對圖5的曲線采用同樣的聚類算法,和圖4的聚類結(jié)果相同,但聚類過程中其相關(guān)性變得更明顯,而且圖5每條負(fù)荷曲線只有48個(gè)數(shù)據(jù)點(diǎn),比圖4的節(jié)省了一般儲(chǔ)存空間。
從圖4中a類取3條連續(xù)的日負(fù)荷曲線,如圖6所示,我們假想下一天的負(fù)荷模式與(a)類相同。
然后,我們可以用選取的這三條日負(fù)荷曲線,經(jīng)過小波去燥后,如圖7所示,求出其中心曲線,如圖8所示。這里我們把中心定義為圖7中三條曲線相加后求平均,中心的定義也可以參考聚類算法中的一些經(jīng)典定義。
我們將第4日的日負(fù)荷曲線與中心曲線放相對比得到的結(jié)果,如圖9所示。通過計(jì)算,其Pearson相關(guān)系數(shù)系數(shù)達(dá)到0.9667,可見,電力負(fù)荷模式識(shí)別對負(fù)荷預(yù)測有極其重要的作用。
3 結(jié) 語
本文通過應(yīng)用K-means的聚類算法將電力大客戶的日負(fù)荷曲線進(jìn)行聚類,研究其負(fù)荷模式。本文分析表明,K-means聚類算法對負(fù)荷曲線聚類有很好的效果。同時(shí),負(fù)荷模式對于分析電力客戶的用電行為及其負(fù)荷預(yù)測有重要作用。在目前推進(jìn)電力市場化交易的背景下,大客戶的電力負(fù)荷模式研究具有重要意義。如何進(jìn)一步采取數(shù)據(jù)挖掘等方法和手段去更深入了解用戶行為去指導(dǎo)實(shí)際工作等課題,需要進(jìn)一步展開研究。
參考文獻(xiàn):
[1] 西奧多里蒂斯.李晶皎(譯).模式識(shí)別(第四版)[M].北京:電子工業(yè)出版 社,2012.
[2] 劉耀年.基于模糊識(shí)別與模糊聚類理論的短期負(fù)荷預(yù)測[J].電工技術(shù) 學(xué)報(bào),2002,(5).
[3] 許甜田.大用戶負(fù)荷預(yù)測方法研究及其應(yīng)用[D].長沙:湖南大學(xué),2013.
[4] Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工 業(yè)出版社,2007.
[5] 劉麗輕.電力用戶負(fù)荷模式識(shí)別系統(tǒng)研究與設(shè)計(jì)[D].北京:華北電力大 學(xué),2011.
[6] 張忠華.電力系統(tǒng)負(fù)荷分類研究[D].天津:天津大學(xué),2007.
[7] Kuncheva,L. L,Vetrov, etal.Evaluation of Stability of k-Means ClusterEnsembles with Respect to Random Initialization [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,(11).
[8] Shehroz S. Kha,Amir Ahmad. Cluster center initialization algorithmfor K-means clustering[J]. Pattern Recognition Letters,2004.
[9] 仲偉寬.模糊聚類方法在用戶負(fù)荷曲線分析中的應(yīng)用[J].華東電力,2007,(8).