張靠社,何優(yōu)琪,劉福潮,梁雅芳
(1. 西安理工大學(xué) 水利水電學(xué)院,陜西 西安 710048;2. 甘肅省電力科學(xué)研究院,甘肅 蘭州 730050)
伴隨智能電網(wǎng)的不斷發(fā)展,需求側(cè)負(fù)荷管理技術(shù)在電網(wǎng)被廣泛采用,負(fù)荷分類也變?yōu)殡妰r制定、負(fù)荷預(yù)測、系統(tǒng)規(guī)劃、負(fù)荷管理等的重要工作基礎(chǔ)。由此,研究提出更準(zhǔn)確有效的負(fù)荷分類方法,具有重要的理論意義和實用價值。由于電力系統(tǒng)綜合負(fù)荷具有地域分散、類型繁多、結(jié)構(gòu)復(fù)雜和非線性等特點,負(fù)荷的分類與綜合已成為電力系統(tǒng)的一個難題[1]?,F(xiàn)今對大量的用戶負(fù)荷時序數(shù)據(jù)進(jìn)行描述分析和分類控制時,在前期處理時大多數(shù)都利用的是負(fù)荷的聚類分析。
通常利用的聚類方法有模糊聚類、C—均值法、系統(tǒng)聚類、K—均值法、K—means聚類、基于人工神經(jīng)網(wǎng)格和基于密度的方法[2-4]等。近年來,逐步深入的進(jìn)行數(shù)據(jù)挖掘研究,涌現(xiàn)了許多新的聚類分析法[5-6]。文獻(xiàn)[7]采用Ward法,該方法最終聚類數(shù)目的確定需要根據(jù)結(jié)果和經(jīng)驗進(jìn)行選??;文獻(xiàn)[8]采用將最大最小距離作為度量進(jìn)行聚類。在負(fù)荷分類領(lǐng)域中,現(xiàn)今運用最廣泛的方式是自組織映射方法(Self Organizing Mapping,SOM),文獻(xiàn)[9]對SOM算法做了相關(guān)研究,應(yīng)用中SOM方法的主要缺點是分析人員需要在計算前,提前給定分類的具體數(shù)目(K),通常需進(jìn)行多次試算才能得到滿意的分類結(jié)果,且很難控制負(fù)荷分類結(jié)果的精度。
針對這些負(fù)荷聚類方法算法復(fù)雜、計算量大、要求預(yù)先設(shè)定聚類初值等缺陷,為了更有效地進(jìn)行負(fù)荷分類,經(jīng)研究發(fā)現(xiàn),一種基于曲線相似性的判定方法被廣泛應(yīng)用于各領(lǐng)域。文獻(xiàn)[10]提出一種基于類曲率的曲線相似判定方法,并應(yīng)用于圖像拼接,圖像修補(bǔ)等方向;文獻(xiàn)[11]采用離散Fréchet 距離作為距離的測度進(jìn)行研究,建立數(shù)學(xué)模型用于判定曲線相似性,利用150個隨機(jī)的在線手寫簽名進(jìn)行驗證,結(jié)果匹配率高達(dá)90%以上;文獻(xiàn)[12]對中國各個貿(mào)易大類商品中加工貿(mào)易的構(gòu)成曲線進(jìn)行分析歸納,得到中國加工貿(mào)易主體商品結(jié)構(gòu)的演變過程。
把曲線相似性作為判定依據(jù),應(yīng)用于大規(guī)模電力負(fù)荷分類領(lǐng)域的研究非常少。為此,本文提出一種基于日負(fù)荷曲線,將曲線相似精度設(shè)定為分類閾值的負(fù)荷分類方法。該方法在滿足事先確定的精度要求下,能將日負(fù)荷曲線集聚合成滿足要求的類別。并完成某電網(wǎng)實測負(fù)荷樣本的分類,證明該方法具有可行性和高效性,可作為系統(tǒng)規(guī)劃、錯峰管理、負(fù)荷預(yù)測的可靠依據(jù)。
以下列出負(fù)荷曲線聚類方法的主要定義,含有曲線類相似精度及曲線相似度的明確概念[13]。
將n個連續(xù)觀測的數(shù)據(jù)連成的曲線記為Ci=Ci(xi1,xi2,…,xin)。則可以定義Ci與Cj兩條曲線間的相似度測量如下述。
定義1 曲線Ci(xi1,xi2,…,xin)和Cj(xj1,xj2,…,xjn)之間的距離:
按照上面的定義1,在曲線間相應(yīng)分量點距離中的最大距離就是兩曲線之間的距離。距離Dij可以表征曲線的形態(tài)相似度,曲線越相似Dij值越小。只有在對應(yīng)的范圍內(nèi)控制好曲線類中的全部曲線間的相似度,才能保證分類的結(jié)果符合一定的精度。這個“范圍”即是該曲線類的“相似精度”。
定義2 記曲線類M(C1,C2,…,Cm),其中,Ci(xi1,xi2,…,xin)。曲線類M的相似精度為
從式(2)可以看出,如果E(M)為曲線類M的相似精度是已知的,若引入一條不屬于M的新曲線Ci以后變?yōu)樾碌那€類M′,判定E(M′)>E(M)是否成立時,利用表達(dá)式(3)計算新曲線類M′的相似精度變得更簡單。
可使用以下3個定義,進(jìn)一步分析曲線集合分類結(jié)果的質(zhì)量。
首先給出曲線類M的質(zhì)心的定義,從物理學(xué)方面來考慮,曲線類的質(zhì)心就是此類曲線中各點的平均值。記M(C1,C2,…,Cm)為曲線,Ci(xi1,xi2,…,xin),1≤i≤m,定義曲線類C的質(zhì)心如下表述。
定義3 曲線類M的質(zhì)心為
如有曲線類M(C1,C2,…,Cm),與曲線Cj(xj1,xj2,…,xjn),其中Cj不屬于M,曲線Cj與曲線類M的距離同曲線Cj的平均離差定義如下表示。
定義4 定義曲線Cj和曲線類M的距離為曲線Cj與質(zhì)心的距離,即
由于分類結(jié)果的優(yōu)劣很大程度上會影響預(yù)測建模的精度,即使分類后得出結(jié)果,對曲線類聚集程度進(jìn)行分析也是十分必要的。若曲線具有較好的分類效果,才可進(jìn)行該類曲線的建模;如果曲線比較離散,某一類分類效果不佳,為保留原始信息,要求對該類曲線完成二次分類,直至得出滿足要求的結(jié)果。
顯示一組數(shù)據(jù)的離散程度的量化方式中,標(biāo)準(zhǔn)差是最為常用的一種。設(shè)曲線類M(C1,C2,…,Cm),其中,Cj(xj1,xj2,…,xjn),1≤j≤m其曲線類M的質(zhì)心為則時刻T(1≤T≤n)該類曲線類的標(biāo)準(zhǔn)差可表示為
SDT體現(xiàn)該組數(shù)據(jù)的變異程度,其值越大變異程度就大,質(zhì)心代表性越差,相反也一樣。將曲線類所有時刻的標(biāo)準(zhǔn)差連起來即得該類的標(biāo)準(zhǔn)差曲線。因各類曲線的數(shù)據(jù)相差較大,因此在使用標(biāo)準(zhǔn)差曲線判定各類曲線的離散度以前,對其數(shù)據(jù)需要進(jìn)行預(yù)處理。
由于負(fù)荷數(shù)據(jù)庫極大,且數(shù)據(jù)庫非常容易受到不一致數(shù)據(jù)、噪聲和丟失數(shù)據(jù)的影響。通常數(shù)據(jù)中存在“壞數(shù)據(jù)”或“不良數(shù)據(jù)”,為此利用數(shù)據(jù)前需先完成數(shù)據(jù)預(yù)處理,以避免其影響分類結(jié)果。本文利用的是比較濾波法[14],該方法的原理是在T時刻,將負(fù)荷進(jìn)行縱橫向?qū)Ρ龋嬎愠鯰-1時刻和T+1時刻的負(fù)荷平均值與T時刻的負(fù)荷進(jìn)行比較,且計算出前一天、前兩天的T時刻負(fù)荷平均值再次對比。若兩個的偏差超出某一閾值,則選擇橫、縱向比較的平均值。
若進(jìn)行系統(tǒng)用戶負(fù)荷分類時,選取負(fù)荷特性指標(biāo)的不同,很大程度影響到最后的分類結(jié)果。日負(fù)荷曲線能體現(xiàn)負(fù)荷隨時間變化的特性,用戶負(fù)荷的變化趨勢和大小經(jīng)日負(fù)荷曲線體現(xiàn)非常直觀,該曲線也可以較全面反映各用戶的負(fù)荷特性。在合約交易中典型日負(fù)荷曲線更是作為期貨、分配電量、分析互聯(lián)系統(tǒng)錯峰效益和審核調(diào)峰能力的基礎(chǔ)。并且利用各類型用戶的用電日負(fù)荷曲線,各級電網(wǎng)變電站和調(diào)度中心能研究用戶結(jié)構(gòu)改變對用電負(fù)荷造成的重要影響,從而掌握更全面負(fù)荷的變化情況。為此,本文選擇日負(fù)荷曲線作為系統(tǒng)負(fù)荷分類的依據(jù)。
本文出現(xiàn)的負(fù)荷曲線都是用戶日負(fù)荷曲線標(biāo)準(zhǔn)化后的結(jié)果,所以完成電力系統(tǒng)用戶的分類工作其本質(zhì)就是進(jìn)行用戶日負(fù)荷曲線的分類。
下面介紹的負(fù)荷曲線分類方法是將相似精度作為閾值。此算法的基本思路為設(shè)一個曲線集合為M。按照具體需求,開始選定一個相似精度,并且把其作為分類時使用的終止閾值,然后選擇M中間曲線距離最大的兩條。將任一條定成聚核開始聚類,若出現(xiàn)此類相似精度達(dá)到閾值的情況,則停止聚類,從而聚類出首個曲線類M1。定M2=M-M1,由此曲線集合M2完成相同聚類步驟,在全部曲線均歸到特定類別后,算法停止。此算法的具體步驟如下:
針對給定曲線集M(C1,C2,…,Cm),設(shè)W作為曲線聚類的相似精度閾值。1)在曲線集合M中計算兩兩曲線間的距離,挑選出兩兩間距離最大的一條曲線,記為A;2)將A歸到曲線類M1,中,并記M=MM1;3)曲線集合M中,將集合M1同各曲線的距離計算出來,得最小距離相應(yīng)的曲線B,并記M1′=M1+B;4)按照式(3)計算E(M1′)。如果E(M1′)>W,那么算法轉(zhuǎn)至1)。反之把B歸到曲線類M1中,分別記M1=M1+B;M=M-M1,算法轉(zhuǎn)3);5)若M是空集,那么有算法停止。
根據(jù)所取得的聚類結(jié)果,可以再綜合每一條曲線Cj,j=1,2,…,m,至曲線類質(zhì)心M軓的距離,以及各條曲線Cj,j=1,2,…,m的離差平均值。從整體全面地把握任一曲線的歸類精度和分類效果的分布狀況。
本文從某電網(wǎng)選取370個用戶負(fù)荷的時序數(shù)據(jù),同時采用模糊C均值聚類(Fuzzy C-Means,F(xiàn)CM)方法與負(fù)荷曲線分類方法對該電網(wǎng)的用戶負(fù)荷分別進(jìn)行分類。首先利用FCM方法對370條日負(fù)荷曲線進(jìn)行分類,在劃分的聚類算法理論基礎(chǔ)之上,F(xiàn)CM方法的思想是保證被歸到同一類的對象間的相似度最大,非同類之間的相似度最小。首先需要確定聚類數(shù)目并建立模糊相似矩陣,才能開始迭代直至目標(biāo)函數(shù)收斂到最小值,最后顯示聚類結(jié)果。利用距離聚類方法對樣本數(shù)據(jù)進(jìn)行分類,得最優(yōu)分類數(shù)是十類,分析得到的這十類負(fù)荷曲線的簇集程度。計算出每一類各時刻的標(biāo)準(zhǔn)差,繪制各類負(fù)荷的標(biāo)準(zhǔn)差曲線如圖1示,由圖1可表明標(biāo)準(zhǔn)差曲線中第一類、第七類與第九類明顯高于其他負(fù)荷曲線,顯示這些類曲線簇中的負(fù)荷曲線分布較為分散。為此,需進(jìn)行再次分類的為此三類負(fù)荷曲線,以確保對用戶負(fù)荷曲線初始信息的準(zhǔn)確辨識。
圖1 十類標(biāo)準(zhǔn)差曲線Fig. 1 Ten class standard deviation curves
依照標(biāo)準(zhǔn)差結(jié)果圖,其中有三個曲線類(第一類、第七類與第九類)的聚集不夠理想,分類以后效果較差,且其負(fù)荷的均值曲線代表性較差,用此直接進(jìn)行辨識或預(yù)測,導(dǎo)致誤差很大。分類效果較好的是七類,控制標(biāo)準(zhǔn)差都在0.7之下,需對聚集效果不理想的三類中的曲線進(jìn)行二次分類,以確保每一類的精度。第一類曲線含有38條,第七類曲線包含98條,第九類曲線包含44條,依次對其完成二次分類,總共分為六類,再對二次分類的六類曲線進(jìn)行簇集度分析,求其六類的標(biāo)準(zhǔn)差及標(biāo)準(zhǔn)差曲線,如圖2所示。
圖2 二次分類后六類標(biāo)準(zhǔn)差曲線Fig. 2 Six standard deviation curves after secondary classification
圖2中表明對第一類、第七類和第九類二次分類,得到較好的分類結(jié)果,明顯改善了各類中的曲線類聚集程度。最終把用戶的370條日負(fù)荷曲線分成十三大類,同時將每條曲線的標(biāo)準(zhǔn)差控制在0.07以下,分類效果良好。通過上述分類過程看出,F(xiàn)CM方法是應(yīng)用較為廣泛聚類方法,能順利完成大規(guī)模曲線的分類,并具有較好的分類效果。但因FCM聚類需要預(yù)先指定分類數(shù)目,需要進(jìn)行聚類的有效性檢驗,所以其具有分類效率和準(zhǔn)確性低的缺點。
鑒于此,以下使用本文中基于曲線相似性的負(fù)荷分類方法進(jìn)行該電網(wǎng)的負(fù)荷分類。因分類依據(jù)是在日負(fù)荷曲線的原始形狀基礎(chǔ)上,且各負(fù)荷具有量綱不一致的難題,但預(yù)先已對370個用戶負(fù)荷的時序數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,再利用新的負(fù)荷曲線分類方法進(jìn)行分類,設(shè)定0.5為所選日曲線類相似精度的閾值。該方法把370條不同用戶曲線聚類成十三類,所得到每類的最大值、最小值以及均值曲線,如圖3所示。
圖3 基于曲線相似性分類算法效果圖Fig. 3 Classification algorithm renderings based on the similarity of curves
依照圖3可知,其中每一類的分類效果良好。效果圖顯示,采用新的負(fù)荷曲線分類法所得的結(jié)果,同使用模糊C均值聚類法的分類結(jié)果相差并不大,優(yōu)點在于很大程度上減少了分類的工作量,實現(xiàn)了更準(zhǔn)確有效進(jìn)行負(fù)荷分類的目標(biāo)。計算求出各類曲線的標(biāo)準(zhǔn)差,效果圖4中得,若把每一類標(biāo)準(zhǔn)差均控制在0.7以下,分類產(chǎn)生良好效果,且曲線簇集程度較好。
圖4 十三類標(biāo)準(zhǔn)差曲線Fig. 4 Thirteen class standard deviation curve
將上述計算出的每一類負(fù)荷曲線的算術(shù)均值,當(dāng)成此類用戶的典型日負(fù)荷曲線,其對電網(wǎng)的運行、規(guī)劃和負(fù)荷管理都具有重要意義,同時在電力市場條件下,更是作為期貨、合約交易中分配電量,審核調(diào)峰能力及分析互聯(lián)系統(tǒng)錯峰效益的基礎(chǔ)。
本文提出了一種基于曲線相似性的負(fù)荷分類方法,依照相似精度的閾值將日負(fù)荷曲線集地劃分成若干的曲線類別,其結(jié)果可做為系統(tǒng)規(guī)劃、負(fù)荷管理和控制的依據(jù)。通過實例分析,該方法可以高效地得出滿足相似精度要求的分類結(jié)果,能大幅度降低系統(tǒng)負(fù)荷管理的難度與復(fù)雜度。
[1] 林舜江,李欣然,劉楊華,等. 電力負(fù)荷動特性分類方法研究[J]. 電力系統(tǒng)自動化,2005,29(22): 33-38.LIN Shunjiang,LI Xinran,LIU Yanghua,et al. A classification method for aggregated load dynamic characteristics[J]. Automation of Electric Power Systems,2005,29(22): 33-38(in Chinese).
[2] TSEKOURAS G J,KOTOULAS P B,TSIREKIS C D. A pattern recognition methodology for evaluation of load profiles and typical days of large electricity customers[J].Electric Power Systems Research,2008(27): 1494-1510.
[3] BIDOKI S M,MAHMOUDI-KOHAN N. Evaluating different clustering techniques for electricity customer classification[C]. Transmission and Distribution Conference and Exposition,2010 IEEE PES: 1-5.
[4] Teemu rasanen,Dimitrios Voukantsis. Data-based method for creating electricity use load profiles using large amount of customer-specific hourly measured electricity use data[J].Applied Energy,2010(87): 3538-3545.
[5] WANG Wensheng,WANG Jin,WANG Kewen. Application of SOM neural network and C-means method in load classification[J]. Proceedings of the CSU-EPSA,2011,23(4): 36-39.
[6] 周歡,李廣明,張高煜. SOM+K-means兩階段聚類算法及其應(yīng)用[J]. 計算機(jī)應(yīng)用技術(shù),2010(16): 113-116.ZHOU Huan,LI Guangming,ZHANG Gaoyu. SOM+Kmeans two-phase clustering algorithm and its application[J].Modern Electronics Technique,2010(16): 113-116(in Chinese).
[7] TANG Guangze,WANG Jin,LI Cailing. Study on characteristics classification of power load based on ward method[J]. Journal of Electric Power,2008,12(23): 470-473.
[8] 周涓,熊忠陽,張玉芳,等. 基于最大最小距離法的多中心聚類算法[J]. 計算機(jī)用,2006,26(6): 1425-1428.ZHOU Juan,XIONG Zhongyang,ZHANG Yufang,et al.Multiseed clustering algorithm based on max-min distance means[J]. Computer Applications,2006,26(6): 1425-1428(in Chinese).
[9] YU Jian,GUO Ping. Research of clustering algorithm of self-organizing maps neural networks[J]. Modern Computer,2007(255): 7-9.
[10] 于昊,趙乃良,陳小雕. 類曲率在曲線相似性判定中的應(yīng)用[J]. 中國圖象圖形學(xué)報,2012,17(5): 707-714.YU Hao,ZHAO Nailiang,CHEN Xiaodiao.Quasi-curvature and its application in similarity measurement of curves[J].Journal of Image and Graphics,2012,17(5): 707-714(in Chinese).
[11] 朱潔,黃樟燦,彭曉琳. 基于離散Fréchet 距離的判別曲線相似性的算法[J]. 武漢大學(xué)學(xué)報:理學(xué)版,2009,55(2): 227-232.ZHU Jie,HUANG Zhangcan,PENG Xiaolin. Curve similarity judgment based on the discrete fréchet distance[J].Wuhan University Journal,2009,55(2): 227-232(in Chinese).
[12] 葉明. 中國加工貿(mào)易商品演變過程分析—基于曲線聚類方法研究[J]. 世界經(jīng)濟(jì)研究,2011(8): 49-54.YE Ming. The evolution of China’s processing trade goods:an analysis based on the curves clustering method[J]. World Economy Study,2011(8): 49-54(in Chinese).
[13] 葉明,王惠文,寇微. 大規(guī)模曲線的自動分類方法及其應(yīng)用[J]. 系統(tǒng)管理學(xué)報,2010,19(2): 640-644.YE Ming. WANG Huiwen,KOU Wei. Automatic classification method of large-scale curves and application[J].Journal of Systems&Management,2010,19(2): 640-644(in Chinese).
[14] 馮曉蒲.基于實際負(fù)荷曲線的電力用戶分類技術(shù)研究[D].北京: 華北電力大學(xué),2010.
[15] 鞠平,金艷,吳峰,等. 綜合負(fù)荷特性的分類綜合方法及其應(yīng)用[J]. 電力系統(tǒng)自動化,2004,28(1): 64-68.JU Ping,JIN Yan,WU Feng,et al. Studieson classifieation and synthesis of cornposite dynarnie loads[J]. Automation of Eleetrie Power Systems,2004,28(1): 64-68(in Chinese).
[16] 張忠華. 電力系統(tǒng)負(fù)荷分類研究[D]. 天津: 天津大學(xué),2007.
[17] 賀仁睦,劉應(yīng)梅. 基于KOHONEN神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)負(fù)荷動特性聚類與綜合[J]. 中國電機(jī)工程學(xué)報,2003,23(5): 1-5.HE Renmu,LIU Yingmei. The characteristics clustering and synthesis of electric dynamic loads based on KOHONEN neural network[J]. Proceedings of the CSEE,2003,23(5):1-5(in Chinese).