田珂 丁博 馬文棟 趙衛(wèi)華 王坤
摘? ?要:為了提高短期負荷預測(STLF)的精度問題,采用了新的信號分解和相關分析技術(shù),結(jié)合改進的經(jīng)驗模態(tài)分解法(IEMD)將負荷需求時間序列分解為若干個規(guī)則的低頻分量。為了補償信號分解過程中的信息損失,通過使用T-Copula進行相關分析來合并外部變量的影響。通過T-Copula分析,可從風險值(VaR)得出峰值負荷指示二進制變量,以提峰值時間負荷預測的準確性。將IEMD和T-Copula得到的數(shù)據(jù)應用于深度置信網(wǎng)絡(DBN)來預測特定時間的未來負荷需求。
關鍵詞:短期負荷預測;經(jīng)驗模態(tài)分解;T-Copula;峰值負荷;風險值;深度置信網(wǎng)絡
中圖分類號:TP348? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻識別碼:A
A Hybrid Model for Power Load Forecasting
TIAN Ke1 ,DING Bo2,MA Wen-dong1,ZHAO Wei-hua2,WANG Kun2
(1.State Grid Henan Electric Power Company,Zhengzhou,Henan 450000,China;
2. Customer Service Center,State Grid Henan Electric Power Research Institute,Zhengzhou,Henan 450000,China)
Abstarct:In order to improve the accuracy of short-term load forecasting (STLF),this paper uses new signal decomposition and correlation analysis technology,combined with improved empirical mode decomposition (iemd) to decompose the load demand time series into several regular low-frequency components. In order to compensate for the information loss during signal decomposition,T-Copula is used for correlation analysis to merge the effects of external variables. Through T-Copula analysis,the binary variable indicating peak load can be obtained from the value of risk (VaR) to improve the accuracy of peak time load forecasting. The data from IEMD and T-Copula are applied to deep confidence network (DBN) to predict future load demand at a specific time.
Key words:short-term load forecasting;empirical mode decomposition;T-Copula;peak load;VaR;DBN
電力負荷預測是電力系統(tǒng)的重要組成部分。根據(jù)時間跨度,負荷預測通??梢苑譃槎唐谪摵深A測(STLF)[1]、中期負荷預測(MTLF)[2]和長期負荷預測(LTLF)[3]。目前,國內(nèi)外學者對負荷預測問題進行了廣泛的探索,通??煞譃榛跈C器學習理論的智能預測方法和基于時間序列預測原理的經(jīng)典預測方法。其中,智能預測方法包括神經(jīng)網(wǎng)絡[4]、極限學習機[5]、專家系統(tǒng)[6]等。智能預測方法預測效果好,理論值高,但實際操作較差,泛化能力較弱,容易受到數(shù)據(jù)和實驗設備等因素的影響。與經(jīng)典預測方法不同,智能預測方法中的經(jīng)驗模態(tài)分解法(EMD)可以利用歷史負荷數(shù)據(jù)進行建模,并且具有所需數(shù)據(jù)少、建模理論完備、可操作性強的特點[7]。
為了緩解傳統(tǒng)EMD的端點效應和包絡擬合限制,文獻[7]提出了改進的經(jīng)驗模式分解(IEMD)方法。為了補償信號分解過程中的信息損失,本文引入T-Copula相關分析技術(shù),將天氣因素(即外生變量)的影響納入到信號分解中。利用IEMD對電力負荷需求時間序列進行分解,引入系統(tǒng)負荷與外部輸入變量的相關性分析,提高峰值時段負荷預測的準確性,通過合適的模型分別預測這兩個分量,將各分量的預測結(jié)果相加得到最終的預測結(jié)果。
1? ?短期負荷預測(STLF)
如果一天內(nèi)的電力負荷曲線定義為Em(t) = [Em(1),…,Em(N)]T ,其中,Em(N)是第m天的負荷曲線,t = 1,…,N表示不同的時間實例。STLF模型的任務是預測未來時間實例的負荷分布,即Em(t+1)或Em+1(t)。為了避免以后出現(xiàn)符號復雜性,將使用E(t)作為負荷需求時間序列,而不是特定日期Em(t)的負荷分布。提出的STLF混合模型的框架如圖1所示。
該STLF混合模型的基本體系結(jié)構(gòu)由負荷需求時間序列分解和借助相關性分析處理的外部輸入變量組成,負荷需求時間序列和外部輸入變量并行處理。與文獻[8]相比,IEMD的應用將提高信號分解效率,并將峰值負荷指示變量作為輸入?yún)?shù),可提峰值值負荷時段的負荷預測精度。根據(jù)T-Copula相關分析計算出的風險值(VaR),確定每個外部輸入的二元峰值負荷指示變量。
使用IEMD進行信號分解將產(chǎn)生固有模式函數(shù)的低頻分量,如(IMFi)和信號單調(diào)函數(shù)(殘差函數(shù))。根據(jù)信號分解進行負荷預測的步驟如下:
步驟1:利用IEMD將電力負荷需求時間序列分解為具有不同頻率的子序列,即固有模式函數(shù)(IMFi)和殘差。
步驟2:將每個IMF和殘差作為DBN輸入,并獲得每個IMF和殘差的預測結(jié)果。
步驟3:對每個DBN獲得的輸出進行平均加權(quán),然后合計得到輸出1。
當通過T-Copula處理外部輸入變量時,Gumbel-Hougaard Copula計算電力負荷需求與四個外部輸入變量(如干球溫度、濕球溫度、露點溫度和濕度)之間的上尾相關性。
步驟1:計算上尾相關參數(shù)λu = [λ1,λ2,λ3,λ4]和串聯(lián)參數(shù),即每個變量的VaR1,VaR2,VaR3,VaR4。然后,根據(jù)每個變量確定每個外部變量的峰值負荷指示性變量。
步驟2:使用負荷需求、相關參數(shù)和峰值負荷指示變量對每個DBN模型進行預訓練。針對每個外部變量獲得預測結(jié)果
步驟3:從每個DBN獲得的輸出進行加權(quán)平均,然后合計得到輸出2。
2? ?負荷需求時間序列信號分解
現(xiàn)有信號分解方法有傳統(tǒng)小波變換、離散小波變換、EMD等。與傳統(tǒng)的小波變換相比,EMD適用于非平穩(wěn)和非線性時間序列。然而,EMD還需要控制端部效應和包絡擬合等問題。IEMD是對傳統(tǒng)EMD的改進,其方法是:(1)結(jié)合線性外推法確定端點極值,使擬合包絡包含給定的數(shù)據(jù)集;(2)采用非均勻有理B樣條曲線擬合包絡代替三次樣條曲線處理復雜信號。
2.1? ?傳統(tǒng)的經(jīng)驗模態(tài)分解
EMD是一種迭代移位過程,它將信號分解成不同振幅的規(guī)則低頻分量。低頻分量包括IMF和殘差函數(shù)。IMF的性質(zhì)如下:
(1)對于單個IMF,整個IMF長度的極值和過零點的個數(shù)應等于或小于1。
(2)在任何數(shù)據(jù)位置,由局部極值定義的包絡線的平均值為零。
為了滿足這兩個性質(zhì),本文給出了從給定信號E(t)中提取IMF的迭代移位過程:
(1)確定電力負荷需求時間序列E(t)的局部極大值(Emax(t))和局部極小值(Emin(t)),并利用三次樣條曲線連接上、下包絡來構(gòu)造局部最大值和局部極小值。
(2)確定兩個包絡線的平均值與原始負荷需求時間序列之間的差異。如果上下包絡線的平均值表示為g1(t),且E1(t) & g1(t)之間的差定義為d1(t),則
d1(t) = E(t) - g1(t)? ? ? ? ?(1)
為了成為IMF,d1(t)必須遵守上述IMF的屬性。當d1(t)滿足IMF的條件時,就將其選為第一個IMF的I1(t)。否則,重復上述步驟。
(3)從原始電力負荷需求時間序列中減去第一個IMF,以確定剩余r1(t):
r1(t) = E(t) - I1(t)? ? ? ? ?(2)
(4)殘差r1(t)可視為經(jīng)過上述移位處理的新數(shù)據(jù)。重復上述過程,直到殘差時間序列r1(t)是單調(diào)函數(shù),即殘差數(shù)據(jù)足夠小以至于沒有轉(zhuǎn)折點。
(5)通過使用EMD,原始電力負荷可以表示如下:
E(t) = ■Ii(t) + rn(t)? ? ? ? (3)
在這個迭代移位過程之后,數(shù)據(jù)可以用IMF和殘差函數(shù)來表示。
2.2? ?傳統(tǒng)經(jīng)驗模態(tài)分解的問題
即使EMD比其他傳統(tǒng)分解技術(shù)(如小波變換或離散小波變換)更有效地分解復雜時間序列,但EMD與以下問題相關:
(1)傳統(tǒng)EMD的末端效應會導致數(shù)據(jù)兩端出現(xiàn)發(fā)散現(xiàn)象。信號的末端極值無法確定為最大值或最小值,它使包絡變形并影響EMD分解。
(2)與傳統(tǒng)EMD相關的三次樣條擬合會導致超調(diào)和欠調(diào)現(xiàn)象。因此,得到的包絡并不完整,因此會反映到提取的IMF中。
2.3? ?改進的經(jīng)驗模態(tài)分解
為了控制傳統(tǒng)EMD的端點效應和包絡擬合限制,利用改進的信號分解技術(shù)(IEMD)抑制端部效應和包絡擬合限制:
(1)抑制端點效應:為了抑制端部效應并實現(xiàn)真正有效的分解,采用線性外推方法確定信號的端點,使擬合包絡包含給定的數(shù)據(jù)集。為了形成一個包含所有信號數(shù)據(jù)的完整包絡,必須對信號的端點進行處理。此方法確定上包絡擬合的端點的過程如圖2所示。
兩個最大值A和B最接近端點。直線AB線性延伸到終點C。如果點C小于信號的端點值E,則將點E視為是上包絡擬合的新的最大值。否則,如果點C大于端點值點E,則將點E視為是上包絡交叉點的新的最大值。同理,可以確定下包絡擬合的端點。
(2)抑制包絡擬合的局限性:文獻[9]提出的原始EMD算法利用三次樣條函數(shù)擬合信號的上、下包絡,然后計算擬合上、下包絡的平均值。由于三次樣條曲線擬合計算簡單,但三次樣條曲線擬合會產(chǎn)生超調(diào)和欠調(diào)現(xiàn)象,使包絡擬合偏離實際信號包絡并形成不完全包絡。
采用非均勻有理B樣條(NURBS)曲線擬合方法對信號的上、下包絡進行擬合得到平均包絡。采用累加弦長參數(shù)化算法實現(xiàn)NURBS曲線擬合。與通過三次樣條函數(shù)擬合包絡相比,相同的仿真信號使用NURBS曲線可以擬合包絡。IEMD算法可以將信號分解為不同的頻率分量,不存在模式混合。
3? ?T-Copula分析
電力負荷與外部輸入變量之間存在較高的尾部相關性。Gumbel-Hougaard-Copula模型計算了電力負荷與四個外部輸入變量之間的尾部相關性。經(jīng)典的二元Gumbel-Hougaard模型可以定義為:
f (x1(t),E(t)) = CP [ f? x1(x1(t)),fE(E(t))]
(4)
其中,f? x1(x1(t))和fE(E(t))表示邊際累積分布函數(shù),x1表示外部輸入變量,E表示系統(tǒng)負荷需求,f (x1,x2)是二維聯(lián)合分布函數(shù),CP(x1,E)是Copula函數(shù)。確定每個外部變量的尾部相關參數(shù):
CP(x1,E) = exp{-[(-ln x1)α + (-ln E)α]1/α}
(5)
最大似然法可用于確定Copula模型的參數(shù) 。對于系統(tǒng)負荷需求與外部輸入變量的非線性關系,采用基于樣本的累積分布函數(shù)(CDF)經(jīng)驗實現(xiàn)典型最大似然(CML)方法。CML的目標表示為:
■ = arg min - ■ln f (x1(t),E(t))? ? ? ? (6)
其中,N表示外部輸入變量的數(shù)量。Gumbel-Hougard Copula的尾部相關參數(shù)λ1由下式給出:
λ1 = 2 - 21/α? ? ? (7)
按照這種方法,可以為每個外部輸入變量確定所需的Copula參數(shù)。由于電力負荷數(shù)據(jù)的波動性和多樣性,對峰值負荷進行有效的統(tǒng)計估計至關重要。引入VaR的閾值參數(shù)來確定每個變量的峰值負荷指示變量?;赩aR計算的峰值負荷指示變量有助于提高負荷預測的準確性。由于外部輸入變量是隨機的,并且對電力負荷有影響,根據(jù)以下公式確定了VaR:
VaR1p = CP -1[ f (x1(t),E(t))]? ? ? (8)
其中,VaR1p表示外部輸入變量和系統(tǒng)負載的二元分布的第p個百分位數(shù)。因此,峰值負荷指示變量的二進制值由以下公式確定:
M(x1) = 1,x1(t) ≥ VaR1p0,x1(t) < VaR1p? ? ? ?(9)
其中,M(x1)表示外部變量x1的峰值負荷指示變量,并且p的值設置為0.95。將對每個外部輸入變量重復這個過程,即需要對四個外部輸入變量進行四次計算。
Gumbel-Hougaard Copula模型擬合了系統(tǒng)負荷與外部氣象變量之間的尾部相關性。顯著性的默認值設置為0.05,并且通過最大似然估計來估計模型參數(shù)。
4? ?深度置信網(wǎng)絡
分治算法是將問題遞歸分解為兩個(或多個)相同(或相關)類型的子問題。該方法通過IEMD將電力負荷需求數(shù)據(jù)分解為多個IMF和一個殘差。在相關分析中,可以得到了尾部相關參數(shù)和峰值負荷指示變量。將IMF、殘差、尾部相關參數(shù)、峰值負荷指示變量和系統(tǒng)負荷的數(shù)據(jù)應用于深度置信網(wǎng)絡(DBN)。其中,DBN具有一個無監(jiān)督子部分,該子部分由多個受限玻爾茲曼機(RBM)和一個監(jiān)督部分組成,監(jiān)督部分是邏輯回歸層,即ANN。因此,使用DBN進行學習是半監(jiān)督學習。文獻[10]提出的DBN為訓練置信網(wǎng)絡模型方法,即逐層貪婪預訓練算法。
DBN預訓練程序?qū)⒍鄬由窠?jīng)網(wǎng)絡(MLP)中的每個連續(xù)層對視為RBM[11],其聯(lián)合概率定義為:
Ph | v(h|v) = ■·e■? ? (10)
其中,h表示應用于隱藏層的輸入,v表示從可見層獲得的輸出,W表示隱藏層的神經(jīng)元權(quán)重,a表示激活。對于每個RBM都有一對隱藏層和可見層。對于應用于具有第二偏置向量b和歸一化項Zh,v的二進制v的高斯伯努利RBM:
Ph | v(h|v) = ■·e■? ? (11)
對于應用于連續(xù)變量v的高斯伯納利RBM[12]。在這兩種情況下,條件概率Ph | v(h|v)具有與MLP層中相同的形式。RBM的目標函數(shù)為:
L(a,b,W) = ∑log Ph | v(h|v)? ? ?(12)
分層預訓練方法要求DBN遵循目標函數(shù)的隨機梯度下降法進行預訓練。梯度法表明,參數(shù)(如a,b,W)是基于目標函數(shù)公式(12)的梯度進行更新。概率分布函數(shù)的梯度可以用以下方式表示:
■ = < vi hi >? Ph | v(h|v) - < hi vi >? recon? ? (13)
■ = < vi >? Ph | v(h|v) - < vi >? recon? ? (14)
■ = < hi >? Ph | v(h|v) - < hi >? recon? ? (15)
其中,< hi >? Ph | v(h|v)是相對于輸入原始數(shù)據(jù)的條件分布的期望,< hi vi >? recon是第i步重構(gòu)分布的期望。使用對比發(fā)散通過交替的Gibbs采樣來獲得重構(gòu)分布的期望值[13]。則更新公式如下:
Wi+1 = Wi + η(< vi hi >? Ph | v(h|v) - < hi vi >? recon)? ?(16)
ai+1 = ai+η(< vi >? Ph | v(h|v) - < vi >? recon)? ? ?(17)
bi+1 = bi+η(< hi >? Ph | v(h|v) - < hi >? recon)? ? ?(18)
為了訓練多層,可以訓練第一層并將其凍結(jié),然后將輸出的條件期望用作下一層的輸入并繼續(xù)訓練下一層?;诜謱拥念A訓練方法,對DBN算法的所有參數(shù)進行初始化。以監(jiān)督的方式對這些參數(shù)進行調(diào)整,直到DBN的損耗函數(shù)達到其最小值[14]。最后,將反向傳播算法應用于微調(diào)過程。所有參數(shù)均從上到下更新,從而減少了預測誤差。
由于氣候和社會活動的影響,電力負荷數(shù)據(jù)主要表現(xiàn)為日、周、年三個周期。假設時間序列數(shù)據(jù)集為E = Et ∶ t∈T,其中T是索引集。滯后k自相關系數(shù)rk可以通過表示為:
rk = ■? ? (19)
其中,■是給定時間序列中所有E的平均值,rk表示度量時間t和k處時間序列的線性相關性。
5? ?仿真分析
5.1? ?數(shù)據(jù)集描述
在國網(wǎng)河南省電力公司電力科學研究院數(shù)據(jù)集上驗證了所提出的混合負荷預測模型。數(shù)據(jù)集包括三組主要的測量變量:天氣數(shù)據(jù)(即干球溫度、濕球溫度、露點溫度和濕度)、時間分類數(shù)據(jù)(即小時、月、日)、社會數(shù)據(jù)(即工作日、周末、假日)和特定采樣時間的電力負荷需求。
5.2? ?性能評估標準
相對于平均絕對百分比誤差(MAPE)和均方根誤差(RMSE),比較了所提出的負荷預測模型的性能
(1)MAPE定義為:
MAPE = ■■■ × 100? ? (20)
其中,E(t)表示實際負荷需求,■(t)表示預測負荷需求。
(2)RMSE定義為:
RMSE = ■? ? (21)
MAPE和RMSE值越小,預測精度越高。
5.3? ?實驗結(jié)果
所有仿真都是在Matlab上進行,并對兩個算例進行了驗證。對于案例研究,使用以下公式將數(shù)據(jù)集線性縮放為[0,1]:
Ei = ■? ? ? (22)
在案例研究中,數(shù)據(jù)采集日期為2018年1月1日至2018年12月31日,采樣時間為半小時。將全年數(shù)據(jù)分為四個季節(jié):(1)1月至3月,(2)4月至6月,(3)7月至9月,(4)10月至12月。將一個月的三周數(shù)據(jù)集作為訓練數(shù)據(jù)集,剩余一周作為測試數(shù)據(jù)集。信號分解得到的輸入數(shù)據(jù)集為8個IMF和殘差信號。利用自滯后相關,將這些分解后的信號應用于電力負荷預測。從相關性分析中獲得的輸入數(shù)據(jù)集包括尾部相關參數(shù)、二元峰值指示變量和根據(jù)學習環(huán)境設置的負荷需求數(shù)據(jù)集,這些數(shù)據(jù)集應用于DBN進行外部變量的負荷預測。為了公平比較,在2018年的每個月中,都將三周負荷需求數(shù)據(jù)集視為訓練數(shù)據(jù)集,剩余一周視為測試數(shù)據(jù)集。這意味著目標是預測一周的負荷需求。對于每個季節(jié),考慮了兩個月的數(shù)據(jù)集來評估所提出方法的負荷預測性能。因此,在兩個月內(nèi),預測了兩周的負荷需求。
為了預測電力負荷需求,匯總了信號分解和相關分析結(jié)果??紤]了相等的加權(quán)平均值來確定最終的預測負荷需求。2018年1月至3月河南鄭州的模型預測電力負荷需求結(jié)果,如圖3所示。
由圖4可見,峰值負荷時間內(nèi)負荷預測精度有所提高。從平均誤差分布結(jié)果可以看出,峰值時段的負荷預測精度有所提高,這將有助于電力運營商制定合理的發(fā)電計劃和配電維護計劃。為了與文獻[16]中的結(jié)果進行比較,對河南省其他5個地市進行了模擬,如表1所示。
由表1可見,負荷預測結(jié)果的誤差,即所提出模型的MAPE和RMSE值低于文獻[16]中的其他比較模型。與文獻[16]相比,該模型的MAPE值降低了21.19%,RMSE值降低了16.93%。性能提高的原因是:(1)IEMD提高了信號分解效率;(2)T-Copula通過計算Var中的峰值負荷指示性變量,有助于提高峰值時段的負荷預測精度。
6? ?結(jié)? ?論
針對電力負荷預測問題,提出了一種新的混合STLF模型。利用IEMD對電力負荷需求時間序列進行分解,引入系統(tǒng)負荷與外部輸入變量的相關性分析,提高峰值時段負荷預測的準確性,通過合適的模型分別預測這兩個分量,將各分量的預測結(jié)果相加得到最終的預測結(jié)果,利用電力負荷數(shù)據(jù)集驗證了該模型的有效性。
參考文獻
[1]? ? 楊照坤,宋萬清,曹琨. 基于量子遺傳算法的FARIMA模型電力負荷短期預測[J]. 傳感器與微系統(tǒng),2019,(10):143-145.
[2]? ? 何耀耀,秦楊,楊善林. 基于LASSO分位數(shù)回歸的中期電力負荷概率密度預測方法[J]. 系統(tǒng)工程理論與實踐,2019,39(07):1845-1854.
[3]? ? 張建寰,吉瑩,陳立東. 深度學習在電力負荷預測中的應用[J]. 自動化儀表,2019,40(08):8-12.
[4]? ? 張小軍,吳標,孫帆,等. 一種基于數(shù)據(jù)挖掘技術(shù)的電力負荷預測算法研究[J]. 自動化技術(shù)與應用,2018,37(12):7-11.
[5]? ? 胡函武,楊英,施偉,等. 一種基于極限學習機的短期負荷預測方法[J]. 黑龍江電力,2018,40(06):471-476.
[6]? ? 張超,陳杰睿,馮平. 基于混沌理論的電力系統(tǒng)負荷預測應用[J]. 計算機與數(shù)字工程,2018,46(11):2165-2169.
[7]? ? 肖白,房龍江,李介夫,等. 空間負荷預測中確定元胞負荷最大值的經(jīng)驗模態(tài)分解方法[J]. 東北電力大學學報,2018,38(03):8-14.
[8]? ? MOHAMMADI M,TALEBPOUR F,SAFAEE E,et al. Small-scale building load forecast based on hybrid forecast engine[J].? Neural Processing Letters,2018,48(1):329-351.
[9]? ? LI H,WANG C,ZHAO D. Filter bank properties of envelope modified EMD methods[J].? IET Signal Processing,2018,12(7):844-851.
[10]? CHENG W,SUN Y,LI G,et al. Jointly network:a network based on CNN and RBM for gesture recognition[J].? Neural Computing and Applications,2019,31(1):309-323.
[11]? 王志明,張航. 融合多層卷積神經(jīng)網(wǎng)絡特征的快速圖像檢索方法[J]. 計算機輔助設計與圖形學學報,2019,31(08):1410-1416.
[12]? 張光榮,王寶亮,侯永宏. 融合標簽的實值條件受限波爾茲曼機推薦算法[J]. 計算機科學與探索,2019,13(01):138-146.
[13]? COHEN J D,LI L,WANG Y,et al. Detection and localization of surgically resectable cancers with a multi-analyte blood test[J].? Science,2018,359(6378):926-930.
[14]? 吳堅,鄭照紅,薛家祥. 深度置信網(wǎng)絡光伏發(fā)電短時功率預測研究[J]. 中國測試,2018,44(05):6-11.
[15]? QIU X,REN Y,SUGANTHAN P N,et al. Empirical mode decomposition based ensemble deep learning for load demand time series forecasting[J].? Applied Soft Computing,2017,54:246-255.
[16]? QIU X,SUGANTHAN P N,AMARATUNGA G A J. Short-term electricity price forecasting with empirical mode decomposition based ensemble kernel machines[J].? Procedia Computer Science,2017,108(2):1308-1317.