路 巖
(中國大唐集團(tuán)科學(xué)技術(shù)研究總院有限公司,北京 100040)
對(duì)可持續(xù)環(huán)境和能源系統(tǒng)的日益關(guān)注使太陽能和風(fēng)能等可再生能源得到廣泛增長,使發(fā)電組合構(gòu)成發(fā)生了顯著變化[1,2]。這些資源的最高年增長率可以在世界各地觀察到,可從中看出能源結(jié)構(gòu)的快速轉(zhuǎn)變[3]。例如,全球風(fēng)力發(fā)電能力從2010 年的180 千兆瓦增長到2019 年的622千兆瓦,太陽能發(fā)電能力同時(shí)從41 千兆瓦增長到585千兆瓦[4]。由于太陽能和風(fēng)能的經(jīng)濟(jì)效益提高,預(yù)計(jì)其滲透率將進(jìn)一步增長。但是,風(fēng)電等新能源與天氣的強(qiáng)相關(guān)性會(huì)威脅電力系統(tǒng)運(yùn)行的可靠性和經(jīng)濟(jì)性[5],導(dǎo)致重大的社會(huì)和經(jīng)濟(jì)損失[6]。因此,準(zhǔn)確的風(fēng)電功率預(yù)測,有助于電網(wǎng)的安全和經(jīng)濟(jì)運(yùn)行。
風(fēng)電功率預(yù)測方法可分為3 類:物理方法、常規(guī)統(tǒng)計(jì)方法和基于人工神經(jīng)網(wǎng)絡(luò)的方法。物理方法建立在中尺度天氣模型或數(shù)值天氣預(yù)報(bào)系統(tǒng)的基礎(chǔ)上,它代表了基于各種地理和氣象信息的數(shù)學(xué)表達(dá)模型[7,8]。雖然這種方法對(duì)3 h 以上的中期預(yù)報(bào)效果很好,但它對(duì)短期預(yù)報(bào)有局限性,因?yàn)楹茈y收集所有相關(guān)的地理或氣象數(shù)據(jù)[9-11]。傳統(tǒng)的統(tǒng)計(jì)方法是基于歷史數(shù)據(jù)產(chǎn)生風(fēng)力輸出的線性特征,如自回歸模型或ARIMA 模型已被廣泛用于構(gòu)建線性關(guān)系。但是,風(fēng)電數(shù)據(jù)的非線性往往會(huì)損害模型的準(zhǔn)確性和通用性。盡管基于傳統(tǒng)統(tǒng)計(jì)方法有各種方法來表示非線性,但這些基于線性形式的方法在表示非線性動(dòng)力學(xué)方面仍然受到限制[12-14]。而基于人工神經(jīng)網(wǎng)絡(luò)的方法,則可以有效地表示風(fēng)速和功率的非線性和復(fù)雜特征,因此基于人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測或風(fēng)速預(yù)測模型比物理或常規(guī)統(tǒng)計(jì)方法具有更高的精度[15,16]。與此同時(shí),除了這3 種方法,有研究提出了混合模型,將基本人工神經(jīng)網(wǎng)絡(luò)模型與其他模型(如卡爾曼濾波器和支持向量機(jī))并行,以提高風(fēng)電功率預(yù)測的精度[17,18]。在深度神經(jīng)網(wǎng)絡(luò)(DNN)中引入循環(huán)神 經(jīng)網(wǎng)絡(luò)(RNN)提高了人工神經(jīng)網(wǎng)絡(luò)模型的精度[19,20]?;陂L期保存數(shù)據(jù)的能力,LSTM 被用于提取風(fēng)電功率時(shí)序數(shù)據(jù)的時(shí)間特征[21]。如文獻(xiàn)[22]所述,基于LSTM 的風(fēng)電功率預(yù)測模型優(yōu)于基于人工神經(jīng)網(wǎng)絡(luò)或ARIMA 的模型。
本文為解決風(fēng)電功率預(yù)測的難題,從網(wǎng)絡(luò)結(jié)構(gòu)以及網(wǎng)絡(luò)深度兩方出發(fā),通過融合網(wǎng)絡(luò)方法構(gòu)建了改進(jìn)的深度ResBiLSTM 網(wǎng)絡(luò),對(duì)風(fēng)電短期功率進(jìn)行了較為準(zhǔn)確的預(yù)測。
LSTM 是傳統(tǒng)RNN 的改進(jìn)結(jié)構(gòu),以克服其在解決長期依賴問題上的局限性。LSTM 可以通過增加一個(gè)特殊的隱藏單元來緩解漸變消失的問題,該單元可以增加或刪除新的輸入。3 個(gè)控制門通過控制數(shù)據(jù)流來確定單元的操作,如圖1 所示。遺忘門從狀態(tài)向量中丟棄無用的信息,輸入門從新的輸入和先前的凈輸出中添加必要的信息。最后,相應(yīng)單元的新輸出由輸出門決定?;谶@些操作,LSTM 單元可以長時(shí)間保存有用的數(shù)據(jù),因此它比傳統(tǒng)的RNN 更好地捕捉長期相關(guān)性。
圖1 LSTM單元結(jié)構(gòu)Fig.1 LSTM unit structure
雙向?qū)W習(xí)有助于提高傳統(tǒng)LSTM 的準(zhǔn)確性[12]。雙向LSTM(BiLSTM)通過正向和反向路徑訓(xùn)練其參數(shù)來理解上下文,這個(gè)訓(xùn)練過程可以捕獲雙向方面的特征或模式,而LSTM 只在前向路徑中訓(xùn)練。BiLSTM 在序列學(xué)習(xí)中表現(xiàn)出比傳統(tǒng)RNN 更高的準(zhǔn)確性和性能。如圖2 所示,BiLSTM 將雙向概念引入LSTM。BiLSTM 的前向?qū)酉馤STM 網(wǎng)絡(luò)一樣,更新單元中的參數(shù)。另一方面,后向?qū)又械腖STM 單元計(jì)算前向?qū)又袀鞑フ`差的導(dǎo)數(shù)。后向?qū)又袉蝹€(gè)LSTM 單元h 的操作可以描述如下:
圖2 雙向LSTM網(wǎng)絡(luò)的總體結(jié)構(gòu)Fig.2 The overall structure of the bidirectional LSTM network
He 等[13]提出了殘差網(wǎng)絡(luò)結(jié)構(gòu)(ResNet),通過引入殘差塊(Residual block)來構(gòu)建深度網(wǎng)絡(luò)。殘差塊以x 為輸入,H(x)為輸出,結(jié)構(gòu)如圖3 所示。其中,F(xiàn)(x)為殘差映射函數(shù)。
圖3 殘差塊結(jié)構(gòu)圖Fig.3 Residual block structure diagram
構(gòu)建深層網(wǎng)絡(luò)的基本約束是堆疊后的網(wǎng)絡(luò)模型誤差應(yīng)不高于基礎(chǔ)的淺層模型,He 等在實(shí)際中采用恒等映射的方法構(gòu)建深層模型,即用H(x)=x 表示一組堆疊網(wǎng)絡(luò)層的最佳解映射。當(dāng)網(wǎng)絡(luò)較深時(shí),模型難以直接擬合實(shí)際映射H(x),殘差網(wǎng)絡(luò)通過引入“shortcut”快捷連接將問題轉(zhuǎn)換為擬合殘差映射F(x),此時(shí)實(shí)際映射H(x)表示為H(x)=F(x)+x。當(dāng)F(x)=0 時(shí),就構(gòu)成了一個(gè)恒等映射H(x)=x,模型只需最小化殘差函數(shù)F(x)=H(x)-x 來逼近實(shí)際映射,以解決網(wǎng)絡(luò)層堆疊的性能退化問題。
常規(guī)的深度殘差網(wǎng)絡(luò)即將圖3 所示殘差塊層層堆疊,但不管堆疊多少層,均能夠維持輸入流,不會(huì)卡在某些訓(xùn)練細(xì)節(jié)上,因此可以防止網(wǎng)絡(luò)的過擬合或者梯度爆炸等情況。
為進(jìn)一步提高網(wǎng)絡(luò)的準(zhǔn)確性,本文通過融合網(wǎng)絡(luò)方式改進(jìn)了深層殘差網(wǎng)絡(luò),融合網(wǎng)絡(luò)包括垂直和水平方向的堆疊層,其中水平方向的堆疊并非簡單相加,而是將各級(jí)網(wǎng)絡(luò)進(jìn)行合并串聯(lián)連接起來,充分利用各級(jí)網(wǎng)絡(luò)特征提取能力,具體的網(wǎng)絡(luò)形式如圖4 所示。
圖4 融合網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Fusion network structure
本文的水平堆疊映射采用1D CNN 方式,可以進(jìn)一步提取數(shù)據(jù)時(shí)間特征。
互信息為信息論中用來度量變量間信息共享程度的方式,它可以表征一個(gè)隨機(jī)變量與另一個(gè)隨機(jī)變量信息的相關(guān)性情況[18,19]。
定義向量X=[x1,x2,,,xn],n為X的長度。如式(2)所示對(duì)X進(jìn)行歸一化計(jì)算:
式(2)中,X0是X歸一化處理后的結(jié)果。
設(shè)B為X0的組距,Ei為X0的波動(dòng)區(qū)間上下限,其計(jì)算公式分別如式(3)和式(4)所示:
依據(jù)一維直方圖分析法,按式(4)將X0分為n個(gè)波動(dòng)區(qū)間,設(shè)Xi表示第i個(gè)波動(dòng)區(qū)間,如式(5)所示:
設(shè)p(·)表示上下限概率密度函數(shù),則各波動(dòng)區(qū)間Xi的上下限概率密度p(Xi)為:
式(6)中,ni為X0中元素在波動(dòng)區(qū)間Xi的數(shù)據(jù)樣本數(shù)。
通過自信息熵H(Xi)來表征X自身隨機(jī)波動(dòng)的不確定度大小,即:
依據(jù)香農(nóng)信息論[15],一維向量的自信息熵H(Xi)擴(kuò)展到二維向量的互信息I(X;Y),即為:
式(8)中,Y為與X不同的向量;p(Yj)為波動(dòng)區(qū)間Yj的上下限概率密度;p(XiYj)表示X0和Y0在波動(dòng)區(qū)間Xi和Yj的聯(lián)合概率密度。
I(X;Y)表征了X和Y信息的共享程度,可用于衡量兩個(gè)變量中一個(gè)同另一個(gè)相關(guān)性的大小情況。若向量X和向量Y彼此獨(dú)立無關(guān),那么向量X將不會(huì)給向量Y提供任何信息,它們彼此間的互信息為零;反之,若向量X和向量Y互相相關(guān),則X和Y之間所傳遞的全部信息都會(huì)共享,那么二者間的互信息I(X;Y)=1。
為消除量綱的影響,廣義互信息I(X;Y)經(jīng)過歸一化計(jì)算后,最終得MIE 相關(guān)系數(shù)IXY為:
式(9)中,H(Y)表示向量Y的自信息熵。
MIE 表征了變量之間概率分布的統(tǒng)計(jì)特性,其始終是非負(fù)的,即IXY≥0,與廣義的線性相關(guān)系數(shù)相關(guān),可應(yīng)用的范圍更廣,能更好地挖掘氣象因素與光伏功率間的非線性相關(guān)性,有利于關(guān)鍵氣象特征的篩選。
為降低預(yù)測難度,需減少預(yù)測輸入中與風(fēng)電功率低相關(guān)因素的干擾,因此需要簡化預(yù)測輸入特征變量,從而減低輸入維度。假設(shè)各氣象變量X'(i=1,2,…,4)分別代表風(fēng)速、風(fēng)向、溫度和氣壓,風(fēng)電功率表示為Y'。本文利用2.1 節(jié)中的公式分別計(jì)算各氣象因素與風(fēng)電功率的MIE 相關(guān)系數(shù)IXY'=[ISP,IDP,IEP,IPP],其計(jì)算結(jié)果見表1。
表1 各氣象因素與風(fēng)電功率的MIE相關(guān)系數(shù)Table 1 MIE Correlation coefficients of various meteorological factors and wind power
從表1 可知,各氣象因素與風(fēng)電功率的MIE 相關(guān)系數(shù)由大到小分別是風(fēng)速、風(fēng)向、溫度和氣壓,即風(fēng)速和風(fēng)向與風(fēng)電功率相關(guān)性最高,均大于0.5。為了最大程度地平衡訓(xùn)練精度和訓(xùn)練效率的關(guān)系,本文最終將MIE 相關(guān)系數(shù)較高的前兩種氣象因素(風(fēng)速和風(fēng)向)作為風(fēng)電功率深度ResBiLSTM 預(yù)測模型最終的輸入變量,同時(shí)本文還將歷史功率值亦作為輸入變量之一。
好的預(yù)測誤差指標(biāo)有助于預(yù)測模型更好的迭代尋優(yōu),也可方便進(jìn)行不同算法之間的對(duì)比,本文選取常見的均方根誤差和平均絕對(duì)誤差作為預(yù)測誤差指標(biāo),具體定義如下。
1)均方根誤差
2)平均絕對(duì)誤差
式中,T為采樣時(shí)間點(diǎn)數(shù);Pi和別代表i時(shí)刻實(shí)際值和預(yù)測功率值。
風(fēng)力發(fā)電數(shù)據(jù)集取自2017 年~2019 年26311 h的ERCOT 每小時(shí)總風(fēng)力輸出[14]。數(shù)據(jù)顯示了德克薩斯州所有風(fēng)力發(fā)電機(jī)的總輸出功率??傃b機(jī)風(fēng)力發(fā)電量從16246MW 增加到22607MW,最大風(fēng)力輸出為19099MW。本文先是建立了三層LSTM 風(fēng)速和風(fēng)向預(yù)測模型,根據(jù)風(fēng)速和風(fēng)向的歷史值對(duì)當(dāng)前風(fēng)速和風(fēng)向進(jìn)行了預(yù)測。隨后根據(jù)風(fēng)速和風(fēng)向的預(yù)測值,以及風(fēng)功率的歷史值,構(gòu)建了深度ResBiLSTM 風(fēng)功率預(yù)測模型。
從圖5 和圖6 中可以看出,無論風(fēng)速還是風(fēng)向,二者的預(yù)測值和實(shí)際值趨勢和大小基本一致,利用2.3 小結(jié)的平均絕對(duì)誤差公式進(jìn)行計(jì)算,得到二者平均絕對(duì)誤差分別為3.54 m/s 和21.7°,可見均較小,預(yù)測效果良好。
◇風(fēng)速預(yù)測
圖5 風(fēng)速預(yù)測Fig.5 Wind speed prediction
◇風(fēng)向預(yù)測
圖6 風(fēng)向預(yù)測Fig.6 Wind direction forecast
◇風(fēng)電功率預(yù)測
圖7 風(fēng)功率預(yù)測Fig.7 Wind power prediction
◇預(yù)測對(duì)比
圖8 風(fēng)功率預(yù)測算法對(duì)比Fig.8 Comparison of wind power prediction algorithms
表2 預(yù)測結(jié)果比較Table 2 Comparison of prediction results
從圖7 可知,本文算法的預(yù)測值與實(shí)際值較為接近,誤差值在零附近波動(dòng),僅在個(gè)別點(diǎn)出現(xiàn)較大的誤差。圖8是本文算法與另外兩種算法的對(duì)比驗(yàn)證情況,表是3 種算法的RMSE 和MAE 指標(biāo)的計(jì)算結(jié)果,從表看出本文提出的算法RMSE 和MAE 兩種誤差均更小,可見本文所提預(yù)測模型可以更好地適應(yīng)風(fēng)電機(jī)組的實(shí)際工作條件,具有更高預(yù)測準(zhǔn)確率。
為更準(zhǔn)確地進(jìn)行短期風(fēng)電功率預(yù)測,本文充分結(jié)合BiLSTM 的網(wǎng)絡(luò)結(jié)構(gòu)以及深度網(wǎng)絡(luò)非線性表示的優(yōu)勢,以融合網(wǎng)絡(luò)方法對(duì)ResBiSLTM 進(jìn)行了改進(jìn),同時(shí)通過MIE方法對(duì)影響風(fēng)電功率預(yù)測的氣象因素進(jìn)行降維處理,降低了輸入的復(fù)雜性,提升了預(yù)測模型精度和效率。在ERCOT 風(fēng)電廠與BiLSTM 和CNN 的對(duì)比驗(yàn)證可知,改進(jìn)的ResBiLSTM 能更準(zhǔn)確地進(jìn)行短期風(fēng)電功率預(yù)測。本方法針對(duì)復(fù)雜時(shí)序數(shù)據(jù)進(jìn)行專門設(shè)計(jì),亦可對(duì)其他時(shí)序數(shù)據(jù)進(jìn)行準(zhǔn)確預(yù)測,具有較大的可推廣性。