余 林 ,舒 勤,馬 哲(四川大學(xué)電氣信息學(xué)院,四川 成都 610065)
經(jīng)驗?zāi)B(tài)分析綜合法在負荷預(yù)測中的應(yīng)用
余 林 ,舒 勤,馬 哲
(四川大學(xué)電氣信息學(xué)院,四川 成都 610065)
針對電力負荷的周期相似性,提出一種基于經(jīng)驗?zāi)B(tài)分析法的綜合負荷預(yù)測方法。先對原始數(shù)據(jù)進行統(tǒng)計,使用EMD將統(tǒng)計的時間序列分解為有限個固有模態(tài)分量,對固有模態(tài)分量使用模糊C均值聚類,再采用ARMA將聚類后的固有模態(tài)分量預(yù)測,最后把每個分量預(yù)測值求和得到負荷預(yù)測值。實例仿真計算表明,該算法比直接使用ARMA模型進行預(yù)測具有更高的預(yù)測精度,是一種有效短時預(yù)測方法。
負荷預(yù)測;經(jīng)驗?zāi)B(tài)分解;自回歸滑動平均;聚類
電力系統(tǒng)短期負荷預(yù)測對電力系統(tǒng)控制、電網(wǎng)安全、經(jīng)濟運行、系統(tǒng)規(guī)劃、優(yōu)化調(diào)度及電能質(zhì)量等方面起著十分重要的作用,是能量管理系統(tǒng)的重要組成部分[1]。隨著電力生產(chǎn)和消費日益市場化,準確的進行電力系統(tǒng)短期負荷預(yù)測可合理地規(guī)劃地市電網(wǎng)用電的供需平衡,有效地增強電網(wǎng)運行的安全性及可靠性,提高電力企業(yè)的經(jīng)濟效益和社會效益。因此,短期負荷預(yù)測已成為電力系統(tǒng)中一個重要研究領(lǐng)域。
短期負荷預(yù)測的關(guān)鍵問題是如何提高預(yù)測日期的精度。國內(nèi)外許多專家和學(xué)者在此方面做了大量的研究工作,提出了很多預(yù)測方法[2],可分為傳統(tǒng)預(yù)測方法和人工智能方法兩大方面。傳統(tǒng)預(yù)測方法包括回歸分析法、時間序列法等,回歸分析法是根據(jù)歷史數(shù)據(jù)變化規(guī)律及影響負荷變化因素建立回歸方程,確定參數(shù)來預(yù)測負荷值,該方法對歷史數(shù)據(jù)要求高,結(jié)構(gòu)過于簡單,精度不高;時間序列法是按一定時間間隔對電力負荷進行采樣得到的時間序列,建立模型,雖然該算法較為成熟,但只適用于負荷變化較為均勻的短期負荷,且沒有考慮天氣、節(jié)假日等因素。人工智能方法包括專家系統(tǒng)[5]、模糊邏輯方法[6]和人工神經(jīng)網(wǎng)絡(luò)方法[7]等。專家系統(tǒng)是基于知識的程序設(shè)計方法建立計算機系統(tǒng),根據(jù)專家知識和經(jīng)驗豐富系統(tǒng)并預(yù)測,其只適用于單一系統(tǒng),且容易出現(xiàn)人為錯誤;模糊邏輯法是建立在模糊數(shù)學(xué)理論上的新技術(shù),但在實際應(yīng)用中較困難;人工神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)及自適應(yīng)能力,很適合電力短期負荷預(yù)測,但其存在收斂速度慢、泛化能力差等不足。近年,支持向量機(SVM)[8]是建立在統(tǒng)計學(xué)習(xí)理論上的一種新方法,其提高了泛化能力,具有預(yù)測能力強、收斂速度快等特點,但依然存在核函數(shù)和參數(shù)的最優(yōu)選擇等問題。
這里首先對一定時間間隔采集到的時間序列電力負荷數(shù)據(jù)對其進行曲線擬合,之后利用采用經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)對負荷數(shù)據(jù)進行分解。對提取的分量聚類處理,再對聚類后的分量分別進行自回歸滑動平均(aoturegressive moving average,ARMA)預(yù)測,最終得到預(yù)測日一天的負荷。通過試驗驗證了該方法的有效性。
由于電力負荷模型是一個受到多種不確定因素影響的非線性大系統(tǒng),其系統(tǒng)的高度復(fù)雜性和不確定性,導(dǎo)致數(shù)據(jù)成分復(fù)雜且不滿足廣義平穩(wěn)信號的條件:①其均值為常數(shù),與時間變量無關(guān);②自相關(guān)函數(shù)僅為時間差的函數(shù);因此是一種典型的非平穩(wěn)信號。其信號成分的不同代表不同的特征,確定的成分代表負荷的主要趨勢,非確定的成分代表著負荷在主要趨勢附近的波動。EMD方法對非平穩(wěn)性信號有較大的優(yōu)越性與適應(yīng)性,已經(jīng)成為處理非線性、非平穩(wěn)信號的一種有效工具[9-12]。經(jīng)驗?zāi)B(tài)分解可以將原始信號分解為一系列固有模態(tài)分量(intrinsic mode function,IMF)。EMD分解能夠起到放大關(guān)鍵部位數(shù)據(jù)的效果,經(jīng)過分解信號得到的各個固有模態(tài)分量放大了數(shù)據(jù)的局部特征,對它們進行分析,可以更準確有效地把握原數(shù)據(jù)的特征信息。因此對電力負荷的統(tǒng)計數(shù)據(jù)做EMD分解可以有效、準確得到信號的瞬時特征,通過對IMF分量的分析能夠更清楚地發(fā)現(xiàn)負荷的本質(zhì)和變化趨勢。EMD分解后的每個IMF需要滿足兩個條件:①在整個數(shù)據(jù)長度上,必須有相同數(shù)目的極值點和過零點,或者二者之差不能多于一個;②在任意時刻,上包絡(luò)線(由局部極大值點形成)與下包絡(luò)線(由局部極小值點形成)的均值為零;經(jīng)過EMD分解得到的各個IMF分量從高頻到低頻依次分布,每個IMF分量的頻率成分與信號自身變化、采樣頻率等因素有關(guān),因此該方法具有自適應(yīng)性,適合應(yīng)用在復(fù)雜信號的研究中。EMD的本質(zhì)就是一個篩分過程,設(shè)定一個信號由多個IMF組成,步驟如下[13]。
(1)確定信號x(t)的所有局部極值點,并求出上下包絡(luò)線。所有原信號數(shù)據(jù)都應(yīng)該在這兩條包絡(luò)線內(nèi);
(2)將這兩條包絡(luò)線的均值記為m(t),并求出y1(t)=x(t)-m(t);
(3)判斷y1(t)是否為IMF,若y1(t)不滿足IMF條
件,則將y1(t)視為新的x(t),重復(fù)以上步驟,直到y(tǒng)1(t)滿足IMF條件,此時,記y1(t)=c1(t),則c1(t)為信號x(t)的第一個IMF分量,它代表信號x(t)中最高頻率的分量;(4)將c1(t)從x(t)中分離出來,即得到一個去掉高頻分量的差值信號r1(t),即有r1(t)=x(t)-c1(t);
(5)重復(fù)以上步驟,得到c2(t)…cn(t),直到cn(t)或者rn(t)滿足給定的終止條件(通常使rn(t)成為一個單調(diào)函數(shù))時終止篩選,由此可得x(t)的分解式為
x(t)=∑ni=1ci(t)+rn(t)
式中,rn(t)為殘余函數(shù),代表信號的平均。而各IMF分量c1(t),c2(t),…,cn(t)代表了信號的高頻分量到低頻分量的變化,各分量頻率由高頻到低頻依次分布。
模糊C均值聚類算法(fuzzy c-means algorithm,FCM)[14]的基本思想為:將數(shù)據(jù)集X={x1,x2,…,xn}∈R劃分為c類,uik∈R為數(shù)據(jù)集X中任意數(shù)據(jù)對i類的隸屬度,模糊隸屬度矩U={uik}∈R來表示分類結(jié)果,隸屬度矩陣滿足以下條件。
uik∈[0,1],?i,k
0<∑kuik
(1)
模糊C均值聚類是通過迭代的方法不斷更新隸屬度矩陣U和聚類中心V以達到目標函數(shù)Jm(U,V)收斂來實現(xiàn)的,目標函數(shù)如式(2)。
(2)
其中,U={uik}為滿足條件式(2)的隸屬度矩陣;V={v1,v2,…,vc}∈R為聚類中心點集;m為加權(quán)指數(shù),其范圍為[1,∞),一般情況下m=2是較理想的取值。第k個樣本到第i類中心點的距離定義為式(3)。
(3)
(1)初始化聚類中心V={v1,v2,…,vc};
(2)計算隸屬度矩陣為
uik=[∑cj=1[dik(xk,vi)djk(xk,vj)]2/(m-1)]-1
(4)
(3)更新聚類中心為
vi=∑nk=1(uik)mxk∑nk=1(uik)mi=1,2,…,c
(5)
(4)重復(fù)步驟(2)、(3)直到式(2)收斂。
電力負荷的歷史數(shù)據(jù)是按一定時間間隔進行采樣記錄下來的有序集合,因此它是一個時間序列,電力負荷時間序列預(yù)測方法就是根據(jù)負荷的歷史資料設(shè)法建立一個時間序列的數(shù)學(xué)模型,用這個模型一方面來描述電力負荷時間序列變化的規(guī)律,另一方面在該模型的基礎(chǔ)上建立負荷預(yù)測的數(shù)學(xué)表達式,對未來的負荷進行預(yù)測。傳統(tǒng)的時間序列模型[15,16]有以下幾種。
3.1 自回歸模型(AR模型)
在p階的AR模型中,時間序列的當(dāng)前值表示為序列中過去的p個值與隨機噪聲的線性組合。
y1=φ1yt-1+……+φpyt-p+at
(6)
式中,yt為第t時刻的最大或最小負荷;yt-i(i=1,2,…,p)為t-i時刻的最大或最小負荷;at為白噪聲。
設(shè)B為時間后移算子
Bzt=zt-1,Bmzt=zt-m
φ(B)=1-φ1B-φ2B2-……φpBp
(7)
則式(6)可以改寫為
φ(B)yt=at
(8)
自回歸過程可能是平穩(wěn)的或是非平穩(wěn)的。平穩(wěn)的條件是:φ(B)=1-φ1B-φ2B2-……φpBp看作為B的p次多項式,φ(B)所有根的絕對值都必須大于1,即所有根都在單位圓以外。
3.2 滑動平均模型(MA模型)
在q階MA模型中,時間序列的當(dāng)前值表示為過去的q個隨機噪聲的線性組合為
yt=at-θ1at-1……θqat-q
(9)
且乘在a上的權(quán)數(shù)1,θ1,θ2,……,θq不必總和為1,也不必是正數(shù)。令
θ(B)=1-θ1B-θ2B2-……θqBq
(10)
則式(9)可寫為
yt=θ(B)at
(11)
由于θ(B)=1-θ1B-θ2B2-……θqBq為有限q項,所以θ(B)無條件收斂,即該過程是無條件平穩(wěn)。
3.3 自回歸滑動平均模型(ARMA模型)
在實際時間序列的擬合中,將自回歸和滑動平均兩個模型組合起來一同納入一新模型,可得到更一般的(p,q)階自回歸滑動平均模型為
yt=φ1yt-1+……+φpyt-p+at-θ1at-1……θqat-q
即φ(B)yt=θ(B)a1
(12)
ARMA模型的階數(shù)主要由準則函數(shù)進行判定,選取合適的階數(shù)使得模型對原始數(shù)據(jù)擬合程度最高,即在此時準則函數(shù)達到最小值。實際應(yīng)用中ARMA模型的階數(shù)通常都比較低,因此可以從低到高逐漸選取p值和q值,并判斷每種取值情況下的準則函數(shù)值是否達到極小值。常用的準則函數(shù)有AIC準則、BIC準則、FPE準則等。ARMA模型具有隨機差分方程的形式,利用它不僅能揭示負荷時序數(shù)據(jù)本身的結(jié)構(gòu)與規(guī)律,也可以定量地了解觀測數(shù)據(jù)之間的線性相關(guān)特性,預(yù)測其未來值的大小。
對電力負荷信號進行EMD分解,形成若干個固有模態(tài)分量,去除其中干擾分量,然后對分量進行模糊C聚類,最后對分類后的分量建立ARMA預(yù)測模型來進行負荷預(yù)測。具體算法如下。
(1)應(yīng)用第1節(jié)中的EMD分解步驟進行負荷數(shù)據(jù)分解;
(2)分析分解后的分量,去除其中的隨機干擾分量;
(3)對IMF分量進行模糊C均值聚類,設(shè)定聚類個數(shù)為n;
(4)對聚類后的分量無量綱化處理;
(5)對分量建立ARMA模型進行預(yù)測;
(6)將預(yù)測結(jié)果進行反無量綱化處理;
(7)將全部的預(yù)測數(shù)據(jù)結(jié)果累加得到負荷的預(yù)測結(jié)果。
采用某地市地區(qū)的負荷數(shù)據(jù),每15 min采集一次數(shù)據(jù),從零點15分開始到第2天零點,一天共96個負荷值。選擇歷史負荷的天數(shù)為21天,來預(yù)測第22天的負荷,即根據(jù)連續(xù)21天的共2 016個負荷值數(shù)據(jù)來預(yù)測下一天的96個負荷數(shù)據(jù)。21天的負荷數(shù)據(jù)如圖1所示。
圖1 21天電力負荷數(shù)據(jù)
5.1 EMD分解
利用所提方法,對要預(yù)測日前面21天的數(shù)據(jù)進行EMD分解,分解的結(jié)果如圖2所示,共有12個IMF,從上至下分別為IMF1到IMF12,第一個模態(tài)分量主要為隨機干擾,在預(yù)測中去除,最后一個為殘余量,表示平均趨勢。由于電力負荷數(shù)據(jù)存在周期性的相似性質(zhì)成分,故將分解后的IMF采用模糊C均值聚類,將聚類數(shù)設(shè)定為6類,結(jié)果如圖3所示。
圖2 電力負荷EMD分解
圖3 經(jīng)過模糊聚類后的分量
5.2 IMF的預(yù)測
利用ARMA模型對聚類后的分量分別進行預(yù)測,將預(yù)測結(jié)果累加得到負荷值。前面采用一步預(yù)測,對每一個分量采用AIC準則,使得信息量達到最小來確定ARMA模型的階數(shù),具體的分類如表1所示。取2013年1月3日至1月24日的電力負荷數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),以2013年1月25日的負荷數(shù)據(jù)作為預(yù)測樣本數(shù)據(jù),對2013年1月25日的負荷數(shù)據(jù)進行預(yù)測。利用Matlab實現(xiàn)前面所提方法預(yù)測,結(jié)果如圖4所示。
表1 聚類后每個ARMA模型階數(shù)(p,q)
圖4 EMD-ARMA預(yù)測與實際值的比較
為了比較所提方法的優(yōu)越性,將其用直接的ARMA進行預(yù)測的方法進行比較。直接使用ARMA方法對樣本進行訓(xùn)練后,預(yù)測的負荷值與實際值比較結(jié)果如圖5所示。
圖5 ARMA預(yù)測與實際值的比較
為更加可靠、方便對比,引入如下為一些誤差的計算公式。
1)平均絕對誤差
(13)
2)均方誤差
(14)
3)平均絕對百分比誤差
(15)
其中,Yi表示的是第i個負荷實際值;Y^表示的是第i個負荷預(yù)測值;N代表的是需要預(yù)測的負荷個數(shù),這里是預(yù)測一天96個點的負荷量,所以N為96。
表2中給出了兩種方法的平均絕對誤差,均方誤差和平均絕對百分比誤差從表中可以驗證所提方法的有效性,誤差小于直接用ARMA方法,具有更高的預(yù)測精度。
表2 兩種方法的平均絕對誤差、均方誤差和平均絕對百分比誤差的對比
提出了一種基于短時負荷的預(yù)測方法,采用EMD分解和時間序列模型進行負荷預(yù)測。經(jīng)驗?zāi)B(tài)分解方法將負荷信號序列分解成多個本征模態(tài)分量,把分解后的每個分量進行模糊聚類,再就聚類后的分量構(gòu)造時間序列模型進行預(yù)測,然后將各個子模型預(yù)測值相加獲得電力負荷預(yù)測值。從具體的地市地區(qū)的負荷數(shù)據(jù)進行驗證,預(yù)測下一天的負荷量。仿真結(jié)果和預(yù)測誤差表明,該方法性能較好,優(yōu)于一般的時間序列預(yù)測方法,可以有效地對負荷數(shù)據(jù)進行短時預(yù)測。
[1] 康重慶,夏清,劉梅.電力系統(tǒng)負荷預(yù)測[M].北京:中國電力出版社,2007.
[2] 康重慶,夏清,張伯明.電力系統(tǒng)負荷預(yù)測研究綜述與發(fā)展方向的探討[J].電力系統(tǒng)自動化,2004,28(17):1-11.
[3] 雷紹蘭,孫才新,周湶,等. 電力短期負荷的多變量時間序列線性回歸預(yù)測方法研究[J]. 中國電機工程學(xué)報,2006,26(2):25-29.
[4] 萬昆,柳瑞禹.區(qū)間時間序列向量自回歸模型在短期電力負荷預(yù)測中的應(yīng)用[M].電網(wǎng)技術(shù),2012,36(11):77-81.
[5]HoKu-Long,HsuYuan-Yih,LeeCE,etal.Short-termLoadForecastingofTaiwanPowerSystemUsingaKnowledge-basedExpertSystem[J].IEEEPWRS,1990,5(4):46-57.
[6]ChowMo-yuen,ZhuJin-xiang,HahnTram.ApplicationsofFuzzyMulti-objectiveDecisionMakinginSpatialLoadForecasting[J].IEEETrans.onPowerSystems,1998,13(3):1185-1190.
[7]ParkDC,EI-SharKawiM.A,MarksJ,etal.ElectricLoadForecastingUsingaNeuralNetwork[J].IEEETransonPowerSystem,1991,6(2):442-449.
[8] 趙登福,王蒙,張講社,等. 基于支撐向量機的短期負荷預(yù)測[J]. 中國電機工程學(xué)報,2002,22(4):26-30.
[9] 楊宇, 于德介, 程軍圣. 基于EMD與神經(jīng)網(wǎng)絡(luò)的滾動軸故障診斷方法[J]. 振動與沖擊, 2005,24(1): 85-86.
[10] 陳小強, 王琦, 汪同慶,等.基于EMD的輕軌錨固螺桿故障診斷方法研究[J]. 機械強度,2009,31(4): 548-552.
[11]HuangNE,ShenZ,LongSR,etal.TheEmpiricalModeDecompositionandtheHilbertSpectrumforNonlinearandNon-stationaryTimeSeriesAnalysis[J].ProcRSocLondA,1998,454: 903-905.
[12] 劉霖雯, 劉超, 江成順.EMD新算法及其應(yīng)用[j]. 系統(tǒng)仿真學(xué)報,2007,19(2):446-447.
[13] 羅向龍, 牛國宏, 潘若禹. 交通流量經(jīng)驗?zāi)B(tài)分解與神經(jīng)網(wǎng)絡(luò)短時預(yù)測方法[J]. 計算機工程與應(yīng)用,2010,46(26): 212-214.
[14] 杜海順, 汪鳳泉. 一種快速的模糊C均值聚類彩色圖像分割方法[J]. 計算機工程與應(yīng)用,2009,45(33):138-140.
[15] 張冉, 趙成龍.ARIMA模型在網(wǎng)絡(luò)流量預(yù)測中的應(yīng)用研究[J]. 計算機仿真,2011,28(2):171-174.
[16] 葉瑰昀, 羅耀華, 劉勇. 基于ARMA的電力系統(tǒng)負荷預(yù)測方法研究[J]. 信息技術(shù),2002(6):74-76.
According to the similarity of power load, an integrated load forecasting method based on empirical mode decomposition (EMD) is proposed. Firstly, an artificial statistical is done for the raw data, and the statistical time series is decomposed into different intrinsic modes by EMD, then the intrinsic mode components are clustered by fuzzy clustering. Then, these different clustered components are predicted by aoturegressive moving average (ARMA) model. Finally, the forecasted load is obtained by adding together the predicted values of each component. The experiment simulations show that the proposed algorithm has a higher forecasting accuracy than the direct use of ARMA model, which is an effective short-term forecasting method.
load forecasting; empirical mode decomposition; aoturegressive moving average; cluster
TM714
A
1003-6954(2015)02-0040-05
2014-10-25)
余 林(1988),碩士,研究方向為電力系統(tǒng)信號檢測與處理、現(xiàn)代信號處理;
舒 勤(1958),教授,博士,研究方向為現(xiàn)代信號處理、智能電網(wǎng);
馬 哲(1989),碩士,研究方向為電力系統(tǒng)信號檢測與處理、現(xiàn)代信號處理。