唐 衍,顧 潔,張宇俊,儲琳琳,施偉國
(1.上海交通大學 電氣工程系,上海 200240;2.上海市電力公司 市南供電公司,上海 200233)
電力系統(tǒng)短期負荷預測結果對電力系統(tǒng)的優(yōu)化調度和可靠運行影響顯著,準確的負荷預測有助于提高系統(tǒng)的安全性和穩(wěn)定性,能夠減少發(fā)電成本。隨著電力市場的建立和發(fā)展,短期負荷預測工作正在發(fā)揮著越來越重要的作用[1]。
負荷預測的一個核心問題是預測的技術和方法,即預測的數學模型[2]。除了回歸模型法、時間序列法、趨勢外推預測法等傳統(tǒng)的預測方法之外,利用人工神經網絡、模糊理論、小波分析法的短期負荷預測方法也在不斷的走向成熟。文獻[3]提出了一種模糊集分類的人工神經網絡預測方法,把每小時的負荷數據根據天氣分類,把模糊化的數據輸入人工神經網絡中進行訓練并預測;文獻[4]提出了基于自回歸動平均的模糊預測方法;文獻[5]提出了灰色預測和單指數平滑法的組合預測法。
但是目前短期負荷預測的預測方法都是從總負荷入手進行分析建模,未能充分關注負荷變化的各個組成成分,因而無法有效分析負荷的局部特性,影響了預測效果。本文結合電力系統(tǒng)短期負荷變化的特點,建立EMD分解與ARMA時序分析預測相結合的模型對短期電力負荷進行預測,仿真結果證明了該模型的有效性,且預測精度能夠較好地滿足實際需求。
1998年,美國國家宇航局的Huang N E等人在對瞬時頻率的概念進行深入研究的基礎上,提出了一種新的信號處理方法——希爾伯特黃轉換(Hilbert-Huang transform,HHT),即基于EMD的時頻分析方法。1999年,Huang又對該方法進行了一些改進[6]。該方法的本質是對信號進行平穩(wěn)化處理,用EMD將信號中真實存在的不同尺度波動或趨勢逐級分解出來,產生一系列具有不同特征尺度的數據序列。
EMD分解的基本思想是:假如一個原始數據序列x(t)的極大值或極小值數目比上跨零點(或下跨零點)的數目多2個(或2個以上),則該數據序列就需要進行平穩(wěn)化處理。
對于給定的信號x(t)∈R1,其EMD的過程如下所示:
(1)找到x(t)所有的局部極值點。
(2)對極大值點和極小值點,利用樣條插值的方法分別建立信號的極大值包絡函數和極小值包絡函數,并分別記為emax(t)和emin(t)。
(3)計算上包絡函數和下包絡函數的均值函數
(4)計算信號x(t)與包絡均值函數em(t)的差值函數
(5)用h(t)代替x(t),重復步驟(2)—步驟(4),直到所得到的包絡均值趨于零,這樣就得到了第一個IMF分量c1(t)。
由于c1(t)代表的是原始信號中的最高頻成分,因此,可以得到原始信號x(t)中的低頻信號
對x1(t)重復步驟(2)—步驟(4),就可以得到第二個IMF分量c2(t)。如此重復下去,直到得到的差值函數xn(t)是一個常值函數或者單調函數。最后,原始信號x(t)就可以由這些IMF函數cj(t),j=1,2,…,n,和趨勢函數rn(t)來表示,如式(4)所示。
序列x(t)的EMD流程如圖1所示。
圖1 EMD流程
(1)篩選過程停止準則
EMD分解過程實質上是一個篩選過程,但是在應用這一處理過程時必須注意:過多地重復該處理過程會導致本征模態(tài)分量變成純粹的頻率調制信號,而其幅度變?yōu)楹愣ǖ?。為了保證本征模態(tài)分量保存足夠的反映物理實際的幅度與頻率調制信息,必須確定一個篩選過程停止的準則。這個篩選過程停止的條件準則可以通過限制標準差(standard deviation,SD)的值的大小來實現,SD的值通過計算2個連續(xù)篩選結果得到,如式(5)所示。
通常SD的值取在0.2~0.3之間時停止本次篩選,Huang提出的這個準則逐點比較了相鄰篩選結果的差別。本文采用Huang提出的判斷準則對篩選過程停止處進行判斷。
(2)包絡線擬合
曲線擬合是EMD中的關鍵問題,嚴格來說,這里討論的擬合是指插值問題。插值方法對包絡線擬合效果的好壞直接影響到EMD分解的結果,也將影響EMD方法的最終完善和推廣。數值分析方法中有很多插值算法,如:埃爾米特插值法、阿克瑪插值法、三次樣條插值法等。后續(xù)的研究者又提出了不少改進,將高次樣條插值法、多項式擬合法、分段冪函數插值法、B樣條插值法等用于EMD分解算法中。
三次樣條插值是一種既能克服高次多項式插值的缺陷又能保證一定光滑性的插值,在工程中應用廣泛。但對于非均勻插值點,這種方法容易造成過沖和欠沖現象。另外,三次樣條插值要運用矩陣解聯立方程組,計算比較復雜[7]。綜合考慮各擬合方法的優(yōu)缺點,本文采用三次樣條插值法作為包絡線求取的辦法。
(3)邊界處理
邊界處理問題主要是對信號兩端數據進行一定的處理,以消除或減小邊界效應[8]。一個較為基本的思想是對信號兩端采用一定方法進行延拓,即在信號兩端向外延伸處添加一定長度的數據點,使得有效數據區(qū)間的邊界效應外移到延拓后的兩端,從而減小邊界效應對有效信號區(qū)間內的影響。目前常用的邊界處理方法有:邊界全波法、本征波匹配預測法、神經網絡延拓法、多項式擬合法、鏡像延拓法、包絡延拓法和應用AR模型處理EMD邊界問題的方法等。這些方法在一定程度上起到了抑制邊界效應的作用。參考相關文獻的研究成果并結合實際算例數據分析,本文采用多項式擬合算法進行處理。
EMD理論可以把一個非平穩(wěn)非線性的信號分解成多個分量的形式[9],這些分量可以是不同頻率的,而且疊加在一起就是原來的信號曲線。負荷曲線也可以分解出多個分量。通過對大量歷史數據的分析可以發(fā)現:負荷主要包含典型負荷分量、天氣敏感負荷分量、異常或特殊事件負荷分量以及隨機負荷分量4個方面[10],電力系統(tǒng)某一時刻的總負荷
式中:L(t)、B(t)、W(t)、S(t)、V(t)分別為t時刻的系統(tǒng)總負荷、基本負荷分量、天氣敏感負荷分量、特別事件負荷分量、隨機負荷分量。
ARMA預測方法的實現一般可以分為以下幾個步驟:①根據時間序列的散點圖、自相關函數和偏自相關函數圖,以擴展單位根檢驗判斷其方差、趨勢及季節(jié)性變化規(guī)律,對序列的平穩(wěn)性進行識別;②對非平穩(wěn)序列進行平穩(wěn)化處理;③根據時間序列模型的識別規(guī)則建立相應的模型;④進行參數估計,檢驗是否具有統(tǒng)計意義;⑤進行假設檢驗,診斷殘差序列是否為白噪聲;⑥利用已通過檢驗的模型進行預測分析。
對原始負荷序列進行EMD分解,利用ARMA預測模型對各分量分別進行預測后,將得到的各預測結果相加,從而得到最終的預測結果。在構建預測模型時還可以考慮氣候因素的影響,并將其作為模型的一組輸入,如圖2所示。
圖2 基于EMD分解的短期負荷預測步驟
選取我國南方某地區(qū)2008年7月份連續(xù)5個星期工作日內的負荷值作為原始數據,應用本文建立的模型進行短期負荷預測。具體過程如下:從6月30日0:00開始,每隔1 h取一個負荷數據,至8月1日24:00為止,一共25天,共計600個負荷數據點。與此同時,取同一時間段的溫度數據,以便找出負荷變動與溫度變化之間的關系。該時段內的負荷曲線和溫度曲線分別如圖3、圖4所示。
圖3 工作日負荷曲線
圖4 工作日溫度曲線
從圖3可以看出,7月的大部分時間內負荷曲線周期性相對比較平穩(wěn),但在7月初和7月末時有較為明顯的下偏趨勢。觀察對應時間的溫度曲線可以發(fā)現:在負荷下偏的那段時間內,氣溫也相對偏低;在溫度相對平穩(wěn)的連續(xù)幾天內,負荷曲線則處于平穩(wěn)狀態(tài)。
負荷序列的EMD分解結果如圖5所示。圖中:圖a為原始負荷序列;圖b—圖g為負荷的各IMF分量;圖h為余量。
圖5 負荷序列EMD分解結果
分析圖5中每條曲線的規(guī)律,可以看出:圖b中所示分量的幅值相對較小且頻率很高,沒有明顯周期性,可判定它為負荷中的高頻分量,即原負荷序列的隨機分量;圖c、圖d中所示的分量具有較明顯的周期性,幅值較大,故判定它們?yōu)樵摵尚蛄械闹芷诜至?。其中:圖c的幅值隨時間的推移有一定的波動,可認為是氣候敏感分量;圖d的幅值在整個時間段內基本保持恒定,故為負荷的正常周期分量。圖e、圖f、圖g所示的分量具有明顯的趨勢變化特征,隨著時間的推移幅值逐漸變大,故將這幾個分量劃分為原負荷序列的趨勢分量。剩余的圖h所示的曲線則為趨勢分量的余量。
由此,負荷序列被分解為了一系列具有規(guī)律性的、分別代表不同含義的分量,由于各分量變化規(guī)律不盡相同,因此對各分量分別進行預測,將能夠有效地改善預測效果。
直接采用溫度的IMF分量與負荷的IMF分量進行相關性分析并建立相關性模型進行預測的效果較差,所以進一步考慮各IMF的ARMA外推。預測過程為:在選取適當參數的情況下使用ARMA模型對分解出的負荷序列的每個IMF分量進行建模分析后,再根據擬合的模型進行沿拓預測,最后對預測結果進行分析。
3.3.1 ARMA參數選取
ARMA模型的階數可以通過赤量信息準則(Akaike information criterion,AIC)來確定。AIC準則同時給出ARMA模型階數和參數的最佳估計,適用于樣本數據較少的問題。具體運用時,在規(guī)定范圍內使模型階數由低到高,分別計算AIC值,最后確定使其值最小的階數,就是模型的合適階數。
鑒于ARMA模型對歷史樣本的依賴性,以及考慮外推預測時間段內自變量的變化規(guī)律與歷史數據的相關性,選取樣本中前500 h的數據作為已知量,預測500~550 h之間的負荷變化,從而對模型進行驗證。
3.3.2 預測結果與誤差分析
對各IMF分量分別進行擬合預測之后,將它們的預測值以及趨勢量的預測值相加就能得到最后的預測結果。將500~550 h時間段的負荷實際值與經過上述步驟得到的負荷預測值進行比較,如圖6所示。直接用ARMA對原始負荷序列進行預測的同一時段的預測結果如圖7所示。
對比圖6與圖7可以看出,經過EMD分解之后再進行預測的預測值,比未經過EMD分解而直接預測得到的預測值,更加接近真實值。經過EMD分解后預測得到的負荷值,在上下坡段幾乎與實際值相重合,只在波峰和波谷處有略微的誤差;未經EMD分解直接進行預測得到的負荷值,無論在峰谷或上下坡階段,都存在著比較明顯的誤差。
圖6 各分量預測值相加所得值與實際值比較
圖7 負荷序列直接進行擬合預測結果與實際值比較
圖8比較了該時段內2種預測途徑得到的預測值與實際值的相對誤差。從圖中可以看出,EMD分解方法的相對誤差比直接預測的相對誤差小很多。
圖8 2種預測方式相對誤差比較
經計算,EMD方法預測結果的最大相對誤差為3.71%,整體均方誤差為1.71%,平均誤差為1.41%;而不經過分解,直接運用ARMA進行預測所得的結果,最大誤差高達9.63%,整體均方誤差為3.76%,平均誤差達3%。計算結果表明,運用了EMD分解法之后,負荷序列預測的精度有了大幅的提高,比直接利用ARMA時間序列法進行預測有明顯的優(yōu)勢。
EMD時頻分析方法對信號的分解,是根據信號自身的特征時間尺度,具有自適應的特性。對EMD時頻分析方法在電力系統(tǒng)短期負荷預測領域的研究,也從一定程度上顯示出該方法對負荷預測精度的改善有著明顯的優(yōu)越性。
但是,本文的研究還不夠全面,存在不少有待進一步探討的問題。
(1)分解程度判據的完善:本文采用Huang提出的判據作為分解停止準則,該判據簡潔但不一定能完全準確判斷停止位置,尋找和使用更準確的判斷方法有待進一步研究。
(2)改善EMD算法細節(jié),提高EMD分解的運算速度。
(3)對負荷分量特征的利用:雖然本文利用EMD分解將負荷序列分解為若干具有規(guī)律性的分量,但對于各分量的規(guī)律性和變化特征沒有進行太多的分析和利用,如果能夠找到其中一些分量的特征,例如從其變化趨勢中分析出特殊事件發(fā)生時間或氣候變化的規(guī)律并加以處理,將對下一步的預測更加有利。
[1] 康重慶,夏清,劉梅.電力系統(tǒng)負荷預測[M].北京:中國電力出版社,2007:3-5.
[2] 唐卓貞.地方電網短期負荷預測的研究與實現[D].廣西:廣西大學,2008.
[3] 王志勇,郭創(chuàng)新,曹一家.基于模糊粗糙集和神經網絡的短期負荷預測方法[J].中國電機工程學報,2005,25(19):7-11.
[4] 葉瑰昀,羅耀華,劉勇,等.基于ARMA模型的電力負荷預測方法研究[J].信息技術,2002(6):74-76.
[5] 李穎峰.改進灰色模型在電力負荷預測中的應用[J].電網與清潔能源,2009,25(3):10-11.
[6] Huang N E,Shen Z,Long SR.A new view of the nonlin-ear water waves:The Hilbert spectrum[J].Annual Re-view of Fluid Mechanics,1999,31:417-457.
[7] 李卿.EMD時頻分析方法的研究與應用[M].湖北:華中師范大學,2008.
[8] 鄧擁軍,王偉,錢成春,等.EMD方法及Hilbert變換中邊界問題的處理[J].科學通報,2001,46(3):257-263.
[9] Drazin PG.Nonlinear systems[M].London:Cambridge University Press,1998:55-89.
[10] 張曉.電力系統(tǒng)短期負荷預測研究[D].四川:四川大學,2001.