盧忠山, 袁建華
(三峽大學(xué)電氣與新能源學(xué)院,湖北 宜昌 443002)
隨著傳統(tǒng)化石能源的日益緊缺和環(huán)境污染問題的日益嚴(yán)重,清潔可再生能源,特別是太陽能得到了大規(guī)模的開發(fā)和利用[1]。在光伏發(fā)電系統(tǒng)中,發(fā)電功率主要取決于天氣情況,但天氣情況類型各異、數(shù)量差異巨大,個別地區(qū)天氣突變較快,使得發(fā)電功率的波動較大,給電力系統(tǒng)的安全穩(wěn)定運行帶來了挑戰(zhàn)[2-3]。因此,研究太陽能的波動特性,在1 h或更短的時間內(nèi)獲得精確的超短期光伏功率預(yù)測,有助于電網(wǎng)部門通過預(yù)測值確定實際發(fā)電量的不足來確定必要的備用發(fā)電容量,對于促進(jìn)光伏電站融入電力系統(tǒng),提高電網(wǎng)的安全性和穩(wěn)定性具有重要意義[4-5]。
一般來說,光伏發(fā)電功率的預(yù)測主要有物理預(yù)測模型和統(tǒng)計模型兩大類。物理預(yù)測模型利用太陽輻照度預(yù)報值,結(jié)合光伏電池板傾角以及電站所處位置等信息,按照光伏功率的物理成因建立模型[6]。文獻(xiàn)[7]使用傳統(tǒng)光伏電池的數(shù)學(xué)模型進(jìn)行建模,增加了光輻射強度對溫度的修正,從而對傳統(tǒng)模型進(jìn)行了改進(jìn)。文獻(xiàn)[8]選取5種參數(shù)模型,對光伏器件的仿真模型進(jìn)行測試,利用新的組合方法對模型求解。文獻(xiàn)[9]利用傳感器收集光伏陣列和氣象站上的相關(guān)數(shù)據(jù),提出一種可對學(xué)習(xí)速率進(jìn)行回溯調(diào)整的預(yù)測算法,提高了模型的收斂速度。
統(tǒng)計模型依托光伏電站歷史功率數(shù)據(jù),分析多種外界因素對發(fā)電量的影響,最后建立輸入與輸出的映射模型實現(xiàn)光伏功率的預(yù)測[10]。文獻(xiàn)[11]提出了一種基于小波變換和深度卷積神經(jīng)網(wǎng)絡(luò)的混合模型,該模型基于比利時光伏發(fā)電農(nóng)場的光伏輸出時間序列數(shù)據(jù)。計算結(jié)果表明,所提供的預(yù)測模型的平均誤差在季節(jié)、預(yù)測期和光伏發(fā)電位置方面優(yōu)于其他模型。文獻(xiàn)[12]提出了一種基于深度循環(huán)神經(jīng)網(wǎng)絡(luò)-長短期記憶神經(jīng)網(wǎng)絡(luò)的SPV光伏發(fā)電負(fù)荷預(yù)測模型,并證明了該模型與傳統(tǒng)的支持向量機工具相比性能良好。文獻(xiàn)[13]利用深度信念網(wǎng)絡(luò)預(yù)測短時間光伏發(fā)電的輸出功率。該模型的輸入變量為太陽輻照度、大氣壓力、相對濕度和過去4天太陽輸出功率數(shù)據(jù)。文獻(xiàn)[14]利用氣象數(shù)據(jù)和歷史光伏輸出數(shù)據(jù)作為輸入,訓(xùn)練和測試深度神經(jīng)網(wǎng)絡(luò),提出了一種高精度的基于DNN的“PVPNet”模型來預(yù)測24 h光伏系統(tǒng)輸出功率。文獻(xiàn)[15]提出了一種深度deep-RNN模型預(yù)測一天中每小時的太陽輻照度水平。
以上研究取得眾多成果,但兩類方法都存在部分局限性。物理預(yù)測方法需要依托詳細(xì)的電站及歷史氣象數(shù)據(jù)信息,且計算過程中容易產(chǎn)生偏差,導(dǎo)致預(yù)測結(jié)果不理想。統(tǒng)計模型方法在建模時更為簡單快捷,但部分模型難以收斂,且多數(shù)統(tǒng)計模型并未根據(jù)天氣類型將不同天氣下的光伏功率分別預(yù)測,而天氣類型對光伏發(fā)電功率影響較大。為更好地提高模型的預(yù)測精度,本文將天氣變化情況分為非突變天氣及突變天氣兩大類,利用EEMD分解法對光伏電站歷史數(shù)據(jù)進(jìn)行模態(tài)分解,將相關(guān)性較強的分量送入高精度的LSTM神經(jīng)網(wǎng)絡(luò)。為驗證所提模型預(yù)測精度,建立BP、SVM、KNN和LSTM共4種模型與所提模型進(jìn)行比較,比較結(jié)果清楚地表明了所提出預(yù)測方法的有效性。
本文選用某光伏發(fā)電系統(tǒng)2017年1月1日-2017年12月31日整年的光伏功率數(shù)據(jù),每天采集52個樣本點。僅選擇光伏功率穩(wěn)定輸出的時段(08:00-18:00)進(jìn)行分析,不同天氣下光伏發(fā)電功率如圖1所示,當(dāng)天氣較為穩(wěn)定時,晴天天氣光伏發(fā)電功率最高,其他依次是多云、陰天和雨雪天氣。穩(wěn)定天氣,光伏系統(tǒng)功率波動較小,輸出較為穩(wěn)定,整體接近拋物線。突變天氣情況下,光伏發(fā)電功率波動較大,此時對整個電網(wǎng)的穩(wěn)定運行有較大的影響。因此,區(qū)分天氣類型對于光伏發(fā)電功率預(yù)測意義重大。
圖1 不同天氣下光伏發(fā)電功率
統(tǒng)計光伏電站歷史功率數(shù)據(jù)可知,輸出功率不僅與天氣類型有關(guān),而且受溫度影響。圖2是28 d內(nèi)每天14:00的光伏發(fā)電功率與溫度對比情況,第1 d、2 d、3 d 均為晴天,但發(fā)電功率略有差別,即溫度可影響光伏發(fā)電系統(tǒng)功率。但整體而言,光伏系統(tǒng)功率變化趨勢與溫度變化趨勢大致相同。
圖2 光伏發(fā)電功率與溫度對比圖
當(dāng)光伏發(fā)電輸出功率波動較大時,預(yù)測模型的精度會受到影響,故采用EEMD分解法對歷史數(shù)據(jù)進(jìn)行模態(tài)分解。
2.1.1 EEMD 分解原理
EEMD分解混疊法主要是為了綜合改善類似經(jīng)驗?zāi)B(tài)分解法(EMD)中的模態(tài)混疊現(xiàn)象,是在EMD分解法的基礎(chǔ)上改進(jìn)而來的一種新的模態(tài)分解法[16]。EEMD分解法將光伏功率數(shù)據(jù)加入高斯白噪聲之后進(jìn)行多次EMD分解,然后對分解出來的IMF分量進(jìn)行一個總體上的平均化定義。在原始信號中加入高斯白噪聲有效改善了模態(tài)混疊問題。由于EEMD法是在EMD法的基礎(chǔ)上改進(jìn)而來,故EMD分解次數(shù)M與高斯白噪聲幅值k直接影響模型的預(yù)測精度。本文經(jīng)過多次調(diào)試參數(shù)值,最終取M值為150,k值為0.25。
EEMD分解流程如下:
1)向信號內(nèi)部加入幅值為k=0.25的正態(tài)高斯噪聲,設(shè)置EMD分解次數(shù)M=150,迭代次數(shù)m=1。
2)開展第m次EMD分解。EMD分解流程為:
①發(fā)電功率的數(shù)據(jù)序列中加入高斯白噪聲得到新的功率序列為:
式中:x(t)——發(fā)電功率的原始數(shù)據(jù)序列;
m——添加白噪聲的次數(shù);
qm(t)——高斯白噪聲;
xm(t)——新的功率序列。
②對新的功率序列xm(t)進(jìn)行EMD分解,得到n個IMF分量和1個剩余分量:
式中:Cmi(t)——第m次分解得到的第i次IMF分量;
Rm(t)——剩余分量。
3)計算得到各個分解量的均值:
其中Ci(t)為分解的最終結(jié)果。
4)輸出EEMD的分解量。
2.1.2 EEMD 分解結(jié)果
采用EEMD法對光伏輸出功率序列分解,得到IMF1~I(xiàn)MF5和剩余分量。分解后的功率序列如圖3所示。第一行為光伏原始輸出功率,IMF1~I(xiàn)MF5為分解后序列,最后一行為剩余分量。觀察分解后的序列可知,IMF1~I(xiàn)MF5分量整體波動趨勢呈現(xiàn)出一定的相似性,但波動的細(xì)節(jié)有所不同。IMF1~I(xiàn)MF5和剩余分量加入其他氣象因素作為LSTM模型的預(yù)測條件。
圖3 功率序列分解結(jié)果
長短期記憶神經(jīng)網(wǎng)絡(luò)[17]作為一種循環(huán)邏輯神經(jīng)網(wǎng)絡(luò)的特殊變體,它的拓?fù)浣Y(jié)構(gòu)在充分保留傳統(tǒng)的循環(huán)反饋機制功能的同時,通過引進(jìn)門控單元的方式來控制信息累計和增減的速度,包括用戶有選擇地添加新的信息以及遺忘先前已經(jīng)累計和增減的信息,徹底解決了功率序列建模中普遍存在的長期依賴性問題。
LSTM拓?fù)渖窠?jīng)網(wǎng)絡(luò)同樣由輸入控制層、輸出控制層和隱含層組合構(gòu)成,與傳統(tǒng)的RNN網(wǎng)絡(luò)相比,LSTM神經(jīng)網(wǎng)絡(luò)的隱含層使用門控記憶模塊替換普通的輸入神經(jīng)元,拓?fù)浣Y(jié)構(gòu)如圖4所示。
圖4 LSTM記憶模塊結(jié)構(gòu)
門控記憶模塊單元是LSTM系統(tǒng)結(jié)構(gòu)中最重要的核心組成部分,其在某一特定t時刻的記憶狀態(tài)記為ct,包涵了該記憶序列的一些長期性的記憶數(shù)據(jù)信息。隱含層在某一特定時刻t的記憶狀態(tài)ht包含了該記憶序列的一些短期性的記憶數(shù)據(jù)信息。前者的記憶數(shù)據(jù)周期更新率遠(yuǎn)遠(yuǎn)要低于后者。整個記憶模塊通過輸入門、輸出門和遺忘門實現(xiàn)。
在某一時刻,LSTM中一個記憶單元模塊的輸入主要包括:序列輸入xt、隱含層前一個時刻的狀態(tài)ht-1及記憶單元前一個時刻的狀態(tài)ct-1;記憶單元模塊的序列輸出主要包括:該時刻隱含層的狀態(tài)ht和記憶單元狀態(tài)ct。輸入門控制xt對ct的影響程度;輸出門控制ct對ht的影響程度;遺忘門控制和處理記憶單位中的歷史數(shù)據(jù)信息。三者的計算公式如下式:
式中:it、Wt、bt——輸入門的計算結(jié)果、權(quán)重矩陣和偏置項;
io、Wo、bo——輸出門的計算結(jié)果、權(quán)重矩陣和偏置項;
ft、Wf、bf——遺忘門的計算結(jié)果、權(quán)重矩陣和偏置項;
在t時刻記憶模塊輸出結(jié)果為ct與ht,公式如下式所示:
tanh——雙曲正切激活函數(shù);
Wc——輸入單元權(quán)重矩陣;
bc——輸入單元狀態(tài)偏執(zhí)項;
·——按元素相乘。
光伏電站的功率序列受多個氣象因素的影響,是典型的非線性、非平穩(wěn)信號,為此本文提出EEMD-LSTM耦合模型。該模型通過EEMD分解將功率序列分解為一系列IMF分量,篩選出強相關(guān)的子序列送至不同深度的LSTM網(wǎng)絡(luò),最后將子序列預(yù)測結(jié)果重構(gòu)得到最終預(yù)測結(jié)果,模型結(jié)構(gòu)如圖5所示。
圖5 EEMD-LSTM模型框架結(jié)構(gòu)圖
具體建模流程如下:
1)EEMD 分解
通過EEMD分解法將信號x(t)分解為5個IMF和剩余分量Rn。
2)IMF 分量提取
計算IMF分量和剩余分量Rn與x(t)的Pearson相關(guān)系數(shù),記為 P ={p1,p2,···,pn}。將Pearson相關(guān)系數(shù)和的1 / (2(n+1))作為相關(guān)系數(shù)閾值p0,其中n為IMF分量個數(shù)和剩余分量Rn個數(shù)之和。
其中pi表示兩個連續(xù)變量的Pearson相關(guān)性系數(shù)。
由式(11)可知,pi大小在-1~1 之間,當(dāng) pi的絕對值接近1時,表現(xiàn)為具有強相關(guān)性;當(dāng)pi的絕對值接近0時,則被稱為無相關(guān)性。根據(jù)閾值p0可篩選出相關(guān)性較大的IMF分量或Rn分量。
3)LSTM網(wǎng)絡(luò)預(yù)測
為避免功率序列經(jīng)過EEMD分解后不同量綱帶來的影響,將篩選出來的相關(guān)性較大的分量進(jìn)行歸一化處理后,輸入至LSTM神經(jīng)網(wǎng)絡(luò)得到子序列預(yù)測結(jié)果。將子功率預(yù)測分量反歸一化后進(jìn)行疊加得到最終的光伏功率預(yù)測結(jié)果。
本文采用的LSTM模型結(jié)構(gòu)如圖6所示,為一階兩層的結(jié)構(gòu),模型的具體參數(shù)設(shè)置如下:訓(xùn)練次數(shù)設(shè)置為1 000次,LSTM層節(jié)點數(shù)設(shè)置為50,批大小設(shè)置為72,選取平均絕對誤差函數(shù)作為損失函數(shù),adam作為優(yōu)化函數(shù),tanh作為激活函數(shù)。由于數(shù)據(jù)量較大,為緩解過擬合現(xiàn)象,設(shè)置Dropout為0.2。
圖6 LSTM模型結(jié)構(gòu)圖
搭建EEMD-LSTM預(yù)測模型對光伏發(fā)電系統(tǒng)功率進(jìn)行超短期(15 min)預(yù)測。根據(jù)天氣因素分類指標(biāo),將天氣情況分為非突變天氣和突變天氣兩大類。由于光伏發(fā)電系統(tǒng)在突變天氣和非突變天氣情況下輸出功率有較大區(qū)別,所以本文搭建EEMDLSTM預(yù)測模型對兩類天氣分別進(jìn)行預(yù)測。同步建立BP、SVM、ANN、LSTM 4種單一模型與所提模型進(jìn)行計算精度對比。
選擇希爾不等系數(shù)eTIC、均方根誤差eRMSE和平均絕對百分比誤差eMAPE對模型精度進(jìn)行評價,表達(dá)式如式(12)~(14)所示。eTIC介于 0~1之間,系數(shù)越小表明預(yù)測功率和真實功率之間的差異越小,預(yù)測精度越高。當(dāng)eTIC=0時,表示預(yù)測功率曲線和真實功率曲線完全擬合。eRMSE用來評價功率預(yù)測值與真實值之間的偏差,對功率序列中特大誤差反映較為敏感。eMAPE常用于時間序列的預(yù)測,用來衡量預(yù)測模型的準(zhǔn)確度,eMAPE值越小,預(yù)測精度越高。
式中:Z——測試樣本數(shù)目;
y′ ——光伏輸出功率的預(yù)測值;
y——光伏輸出功率的實際值。
使用BP、SVM、ANN和LSTM單一模型對光伏功率進(jìn)行預(yù)測時,直接將氣象因素作為輸入量,光伏功率作為輸出量。
基于EEMD-LSTM模型的光伏發(fā)電系統(tǒng)超短期功率預(yù)測流程見圖7。將天氣情況分為突變天氣和非突變天氣兩大類。由圖1可知,突變天氣時光伏電站的輸出功率波動較大,該電站輸出功率最大時刻為午間14:00左右,故將該時刻的輸出功率進(jìn)行EEMD模態(tài)分解,使之成為平穩(wěn)的輸出功率序列。非突變天氣細(xì)分為晴天、多云、陰天和雨雪4種天氣類型,將不同天氣類型光伏發(fā)電系統(tǒng)的歷史功率數(shù)據(jù)進(jìn)行EEMD模態(tài)分解,對分解后的IMF1~I(xiàn)MF5和剩余分量加入不同的氣象因素作為LSTM模型的預(yù)測條件。在搭建預(yù)測模型時,在原始功率序列中加入150組k=0.25的高斯白噪聲,對新的功率序列進(jìn)行150次EEMD模態(tài)分解。
圖7 預(yù)測流程圖
利用目前收集的某光伏發(fā)電系統(tǒng)2017年整年的天氣及功率數(shù)據(jù)驗證EEMD-LSTM模型的有效性,并分別對突變天氣以及非突變天氣進(jìn)行預(yù)測驗證。數(shù)據(jù)來自于同一大型光伏發(fā)電系統(tǒng),總裝機容量約50 MW。選取光伏功率穩(wěn)定輸出的時段(08:00-18:00)進(jìn)行預(yù)測。根據(jù)數(shù)據(jù)統(tǒng)計情況,該光伏電站所在地區(qū) 2017 年中晴 139 d,多云 50 d,陰31 d,雨雪 67 d,突變天氣 78 d。非突變天氣中以晴天和陰天為例進(jìn)行分析,在139 d的晴天數(shù)據(jù)中,選取 120 d 作為訓(xùn)練樣本,19 d 作為測試樣本;31 d 的陰天天氣中,26 d作為訓(xùn)練樣本,5 d作為測試樣本。驗證突變天氣預(yù)測準(zhǔn)確性時,選擇晴轉(zhuǎn)雨雪天氣為例進(jìn)行分析,其中14 d作為訓(xùn)練樣本,2 d作為測試樣本。
1)晴朗天氣光伏功率預(yù)測結(jié)果如圖8所示,預(yù)測誤差如表1所示。在晴朗天氣情況下,光伏輸出功率曲線波動較小,功率變化具有一定的規(guī)律性。除SVM模型外,其余4種模型均呈現(xiàn)出較好的預(yù)測效果。分析eMAPE、eRMSE、eTIC3個指標(biāo)可以發(fā)現(xiàn),所提的EEMD-LSTM預(yù)測模型的誤差均小于單一預(yù)測模型,且在午時,功率曲線出現(xiàn)輕微波動時,單一模型預(yù)測的準(zhǔn)確性略有降低。對比單一預(yù)測模型,所提EEMD-LSTM預(yù)測模型整體上能更好地貼近實際功率曲線,擬合效果最佳。
表1 晴朗天氣光伏功率預(yù)測誤差
圖8 1月8日晴天光伏功率預(yù)測結(jié)果
2)陰天天氣光伏輸出功率預(yù)測結(jié)果如圖9所示,誤差如表2所示。在陰天天氣情況下,受多種氣象因素影響,光伏輸出功率曲線波動較大,各模型的預(yù)測功率與實際功率產(chǎn)生偏差,其中BP神經(jīng)網(wǎng)絡(luò)和SVM的預(yù)測誤差明顯增大,而EEMDLSTM模型經(jīng)過集合經(jīng)驗?zāi)B(tài)分解減小了功率數(shù)據(jù)波動對模型精度的影響,在天氣狀況發(fā)生波動時段改善了模型的預(yù)測性能。在4月2日陰天天氣下,EEMD-LSTM的 eMAPE值相較于 BP、SVM、ANN和 LSTM分別降低了 0.148、0.259、0.13和 0.047,即EEMD-LSTM模型性能較好,預(yù)測準(zhǔn)確度最高。
表2 陰天天氣光伏功率預(yù)測誤差
圖9 4月2日陰天光伏功率預(yù)測結(jié)果
3)突變天氣預(yù)測結(jié)果如圖10所示,誤差如表3所示。天氣發(fā)生突變后,BP神經(jīng)網(wǎng)絡(luò)的預(yù)測功率明顯低于實際功率,準(zhǔn)確度難以保證。在2 d的突變天氣情況下的BP、SVM和ANN 3種預(yù)測模型誤差較大。EEMD-LSTM模型較LSTM模型的eMAPE值分別降低0.091和0.048,EEMD分解在一定程度上改善了模型預(yù)測性能。對比晴朗天氣和陰天天氣誤差指標(biāo),突變天氣的預(yù)測誤差雖略有變大,但EEMD-LSTM模型的預(yù)測效果仍是最好的。
圖10 2月20日突變天氣預(yù)測結(jié)果
表3 突變天氣光伏功率預(yù)測誤差
本文統(tǒng)計了該光伏電站所有測試樣本的預(yù)測值和有效值,分別在LSTM和EEMD-LSTM兩種不同的算法下評估其eRMSE、eMAPE和eTIC,結(jié)果見表4。
表4 LSTM和EEMD-LSTM預(yù)測誤差對比
對比LSTM預(yù)測模型的表現(xiàn),EEMD-LSTM耦合模型在eRMSE、eMAPE、eTIC上分別提升了21.23%、11.92%、25.67%,即光伏輸出功率曲線數(shù)據(jù)經(jīng)過EEMD模態(tài)分解后,使得LSTM預(yù)測算法更加精準(zhǔn)。
文章對天氣類型進(jìn)行劃分,提出基于EEMDLSTM方法的光伏功率超短期預(yù)測模型,直接對輸出功率數(shù)據(jù)進(jìn)行EEMD模態(tài)分解,找出數(shù)據(jù)局部特征進(jìn)行功率預(yù)測,建立4種單一模型與所提模型進(jìn)行對比,并根據(jù)eMAPE、eRMSE、eTIC評價預(yù)測誤差。所提模型解決了傳統(tǒng)預(yù)測方法在功率波動時準(zhǔn)確性低的問題。主要結(jié)論如下:
1)光伏輸出功率具有較大的隨機性,特別是天氣類型對光伏輸出功率的影響較大。
2)將光伏輸出功率曲線數(shù)據(jù)進(jìn)行EEMD模態(tài)分解,通過提取曲線細(xì)節(jié)分量,充分表征曲線的局部特征,使得LSTM預(yù)測算法更加精準(zhǔn),EEMDLSTM模型較LSTM模型在eRMSE、eMAPE、eTIC上分別提升了21.23%、11.92%、25.67%;而BP和SVM模型結(jié)構(gòu)較為簡單,在各類天氣下都表現(xiàn)出較大誤差,不適合光伏功率序列的預(yù)測;ANN模型在功率波動較大的突變天氣下準(zhǔn)確度難以保證。
3)經(jīng)過晴天、陰天及突變天氣的預(yù)測結(jié)果可知,EEMD-LSTM模型預(yù)測的精度滿足光伏發(fā)電系統(tǒng)輸出功率的超短期預(yù)測要求,其預(yù)測的功率與實際功率差值較小,預(yù)測誤差值不影響系統(tǒng)正常工作。