趙 征, 周孜鈺, 南宏鋼
(華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,河北 保定 071003)
當(dāng)今世界能源形勢(shì)空前危急,化石能源日漸枯竭,人們因此越來(lái)越重視風(fēng)能等可再生清潔能源[1]。風(fēng)力發(fā)電由于能源豐富、技術(shù)成熟、發(fā)電性能較為穩(wěn)定等優(yōu)點(diǎn)受到了越來(lái)越多國(guó)家和地區(qū)的關(guān)注,風(fēng)電已經(jīng)成為繼火電、水電之后的第三大發(fā)電系統(tǒng)[2]。
風(fēng)能是隨機(jī)波動(dòng)的不穩(wěn)定能源,具有間歇性、波動(dòng)性等特點(diǎn),大規(guī)模的風(fēng)電并入電網(wǎng),必將會(huì)對(duì)電網(wǎng)系統(tǒng)的穩(wěn)定性帶來(lái)巨大挑戰(zhàn)[3]。因此,只有更加科學(xué)準(zhǔn)確地得到風(fēng)力發(fā)電的相關(guān)功率參數(shù),才能做到最大限度地保障整個(gè)電網(wǎng)系統(tǒng)的安全性、經(jīng)濟(jì)性和穩(wěn)定性[4]。
目前,風(fēng)電功率區(qū)間預(yù)測(cè)主要有兩種方法:一種是使用深度學(xué)習(xí)方法建立輸入輸出數(shù)據(jù)之間的模型映射關(guān)系[5]。例如:Huang等[6]建立了一種考慮機(jī)組動(dòng)態(tài)特性的輕量梯度上升學(xué)習(xí)機(jī)(LGBM)預(yù)測(cè)模型,Yang等[7]提出了一種基于核極限學(xué)習(xí)機(jī)分位數(shù)回歸的風(fēng)電功率區(qū)間預(yù)測(cè)模型,Xiong等[8]提出了基于BP神經(jīng)網(wǎng)絡(luò)與非參數(shù)核密度估計(jì)的短期風(fēng)電功率概率區(qū)間預(yù)測(cè)方法。這種方法具有良好的逼近和泛化能力,考慮了預(yù)測(cè)的多種不確定性因素[9]。另一種是首先假設(shè)風(fēng)電功率預(yù)測(cè)誤差的概率分布,再對(duì)其進(jìn)行逆運(yùn)算,生成風(fēng)電功率的置信區(qū)間[10]。
近幾年來(lái),在深度神經(jīng)網(wǎng)絡(luò)的快速發(fā)展下,卷積神經(jīng)網(wǎng)絡(luò)和雙向長(zhǎng)短期記憶網(wǎng)絡(luò)都在數(shù)據(jù)處理和工業(yè)數(shù)據(jù)預(yù)測(cè)方面展現(xiàn)了良好的穩(wěn)定性和較高的精確度[11],CNN-BiLSTM模型將CNN的特征學(xué)習(xí)能力和BiLSTM的時(shí)間序列記憶功能相結(jié)合,在提高運(yùn)算速度的同時(shí)可進(jìn)一步提高預(yù)測(cè)精度[12]。VMD是一種時(shí)間-頻率信號(hào)分解方法,對(duì)非線性、非平穩(wěn)信號(hào)的良好處理能力,且可有效避免“虛假分量”和“端點(diǎn)效應(yīng)”等問(wèn)題[13]。
因此,本文提出一種基于VMD的CNN-BiLSTM超短期風(fēng)電功率多步區(qū)間預(yù)測(cè)方法。首先構(gòu)造初始上下限,再運(yùn)用VMD分解方法分解風(fēng)電功率時(shí)間序列,之后將由VMD分解出的子分量輸入CNN-BiLSTM預(yù)測(cè)模型,生成初始預(yù)測(cè)區(qū)間,最后以CWCproposed[14]為目標(biāo)函數(shù),優(yōu)化預(yù)測(cè)區(qū)間,生成給定置信水平下的風(fēng)電功率預(yù)測(cè)區(qū)間。
由于風(fēng)電功率數(shù)據(jù)存在波動(dòng)大、非線性強(qiáng)、不穩(wěn)定、時(shí)間依賴性強(qiáng)等特點(diǎn),直接輸入預(yù)測(cè)網(wǎng)絡(luò)一般難以得到準(zhǔn)確的預(yù)測(cè)結(jié)果,故使用變分模態(tài)分解(Variational Modal Decomposition, VMD)對(duì)預(yù)測(cè)輸入數(shù)據(jù)進(jìn)行預(yù)處理,從而提高預(yù)測(cè)精度。
VMD是一種時(shí)間-頻率數(shù)據(jù)分解方法,它的作用是將一種多分量信號(hào)分解成多個(gè)單分量調(diào)幅調(diào)頻信號(hào),再通過(guò)求解約束變分問(wèn)題將原始信號(hào)分解為數(shù)個(gè)IMF分量。這種方法可以有效避免運(yùn)算迭代過(guò)程中可能遇到的“虛假分量”和“端點(diǎn)效應(yīng)”問(wèn)題,具有強(qiáng)大的非線性、非平穩(wěn)信號(hào)處理能力。并且可以最大程度降低風(fēng)電功率數(shù)據(jù)的波動(dòng)大、非線性強(qiáng)等特點(diǎn)對(duì)預(yù)測(cè)結(jié)果造成的影響,相比于EEMD等其它分解方法,它也能很好地解決噪聲殘留問(wèn)題[15]。
1.2.1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是深度學(xué)習(xí)領(lǐng)域中一類比較常用的神經(jīng)網(wǎng)絡(luò)模型,由于其具有很強(qiáng)的特征學(xué)習(xí)能力且可極大程度降低模型中的參數(shù)數(shù)量,故被廣泛使用在圖像識(shí)別等領(lǐng)域[16]。
CNN一般包含卷積層、池化層和全連接層。卷積層使用數(shù)個(gè)不同的卷積核對(duì)輸入的特征圖譜進(jìn)行卷積運(yùn)算后使用激活函數(shù)賦予非線性特征,從而獲得輸入數(shù)據(jù)中的局部特征信息。池化層對(duì)卷積輸出進(jìn)行降維采樣,提取卷積輸出中更為關(guān)鍵的信息,從而防止網(wǎng)絡(luò)過(guò)擬合。全連接層將池化層輸出的特征圖譜映射成固定長(zhǎng)度的列向量,以便進(jìn)行之后的分類或回歸運(yùn)算。
本文使用CNN提取原始數(shù)據(jù)的特征,發(fā)掘多個(gè)特征之間的相互關(guān)聯(lián)并有效濾除噪聲和不穩(wěn)定成分,最后將經(jīng)過(guò)層卷積運(yùn)算處理后的特征數(shù)據(jù)送入BiLSTM網(wǎng)絡(luò)進(jìn)行進(jìn)一步運(yùn)算。
1.2.2 BiLSTM網(wǎng)絡(luò)
為了有效獲取輸入時(shí)間序列關(guān)于時(shí)間的變化特征,使用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(Bidirectional Long-Short Term Memory,BiLSTM)對(duì)卷積神經(jīng)網(wǎng)絡(luò)輸出序列進(jìn)行進(jìn)一步處理運(yùn)算,利用雙向長(zhǎng)短期記憶網(wǎng)絡(luò)的記憶功能提取時(shí)間特征。
BiLSTM發(fā)展自循環(huán)神經(jīng)網(wǎng)絡(luò)[17](Recurrent Neural Network,RNN),將每個(gè)時(shí)刻點(diǎn)的輸入數(shù)據(jù)分別輸入網(wǎng)絡(luò)進(jìn)行計(jì)算,每一隱藏層的輸出不僅送至網(wǎng)絡(luò)的下一層,而且同時(shí)送至下一時(shí)刻點(diǎn)。其結(jié)構(gòu)如圖1所示。
圖1 BiLSTM網(wǎng)絡(luò)單元結(jié)構(gòu)
其中,每一個(gè)隱藏層單元均包含兩個(gè)長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)單元,其中一個(gè)為前向LSTM,它接收上一時(shí)刻的輸出數(shù)據(jù),計(jì)算后傳給下一時(shí)刻,用以獲取網(wǎng)絡(luò)過(guò)去的信息,另一個(gè)為后向LSTM,相對(duì)的,它接收下一時(shí)刻的輸出數(shù)據(jù),計(jì)算后傳給上一時(shí)刻,用以獲取網(wǎng)絡(luò)未來(lái)的信息。每一個(gè)LSTM計(jì)算單元有四個(gè)門控單元,分別為輸入門(it)、輸出門(ot)、控制門(Ct)和遺忘門(ft)。
遺忘門決定保存多少上一時(shí)刻的輸入信息ht-1至當(dāng)前的控制門輸出Ct,其輸出ft和當(dāng)前時(shí)刻輸入xt存在如下關(guān)系:
ft=σ(ωf·[ht-1,xt]+bf)
(1)
(2)
it=σ(ωi·[ht-1,xt]+bi)
(3)
(4)
ot=σ(ωo·[ht-1,xt]+bo)
(5)
ht=ot·tanh(Ct)
(6)
式中:wo和bo分別為輸出門的權(quán)重參數(shù)和偏置參數(shù);Ct為控制門輸出;ht為本LSTM計(jì)算單元的輸出值。
t時(shí)刻的BiLSTM計(jì)算單元總輸出值為它所包含的前向LSTM單元和后向LSTM單元的輸出值之和,具體計(jì)算公式如下:
(7)
ht=ht(1)⊕ht(2)
(9)
式中:⊕為向量拼接操作。
1.2.3 CNN-BiLSTM模型
將CNN的強(qiáng)特征提取能力和BiLSTM的強(qiáng)時(shí)間序列記憶能力相結(jié)合,構(gòu)造CNN-BiLSTM網(wǎng)絡(luò)結(jié)構(gòu)。先對(duì)輸入特征序列進(jìn)行一層卷積運(yùn)算,然后再進(jìn)行兩層BiLSTM運(yùn)算,在提取特征的同時(shí)極大程度降低運(yùn)算成本,防止過(guò)擬合,最后經(jīng)一層全連接層之后輸出結(jié)果,極大地提高了預(yù)測(cè)精度。
針對(duì)風(fēng)電功率時(shí)間序列的隨機(jī)性、非平穩(wěn)性,本文提出了一種基于VMD的CNN-BiLSTM風(fēng)電功率區(qū)間預(yù)測(cè)方法。
模型預(yù)測(cè)步驟如下:
(1)對(duì)風(fēng)電功率時(shí)間序列進(jìn)行數(shù)據(jù)預(yù)處理。首先剔除異常數(shù)據(jù)點(diǎn),其次對(duì)風(fēng)電功率序列上下浮動(dòng)25%,得到初始的上、下兩個(gè)功率序列。
(2)對(duì)上、下兩個(gè)序列各自進(jìn)行VMD分解,獲得一系列頻率不同、幅值不同的子分量。
(3)兩個(gè)序列的所有分量輸入CNN-BiLSTM預(yù)測(cè)模型,兩個(gè)序列各自分量的預(yù)測(cè)結(jié)果疊加,生成初始預(yù)測(cè)區(qū)間。
(4)以預(yù)測(cè)區(qū)間綜合評(píng)價(jià)指標(biāo)CWCproposed為目標(biāo)函數(shù),優(yōu)化PICP、PINAW,得到置信水平90%、80%的風(fēng)電功率預(yù)測(cè)區(qū)間。
本文選用預(yù)測(cè)區(qū)間覆蓋率(Prediction Interval Coverage Probability,PICP)[18]、預(yù)測(cè)區(qū)間平均帶寬(Prediction Interval Normalized Average Width,PINAW)[19]和改進(jìn)覆蓋寬度準(zhǔn)則(Coverage Width Criterion proposed,CWCproposed)來(lái)評(píng)價(jià)預(yù)測(cè)模型的性能,PICP計(jì)算公式如下:
(10)
(11)
式中:N為樣本總數(shù);ci為區(qū)間上限Ui和區(qū)間下限Li對(duì)風(fēng)電功率真實(shí)值Pti的可靠性指標(biāo),PINAW與CWCproposed計(jì)算公式如下:
(12)
(13)
式中:α用于避免PINAW過(guò)小導(dǎo)致的PICP的影響被忽略的問(wèn)題;β為PINAW指標(biāo)的比重系數(shù),η為懲罰參數(shù),μ為預(yù)先設(shè)置的區(qū)間預(yù)測(cè)名義置信水平。
本文選用西北某風(fēng)電場(chǎng)1月至3月的風(fēng)電功率數(shù)據(jù)作為實(shí)驗(yàn)樣本,將數(shù)據(jù)分為訓(xùn)練集和測(cè)試集。數(shù)據(jù)采樣時(shí)間間隔為15 min。
由于風(fēng)電功率序列波動(dòng)較大,需對(duì)數(shù)據(jù)進(jìn)行處理,本文采用VMD將原始序列分解為若干個(gè)相對(duì)平緩的分量[20]。以向上浮動(dòng)25%為例,VMD分解結(jié)果如圖2所示。
圖2 CEEMDAN分解風(fēng)電功率序列結(jié)果
從風(fēng)電功率分解圖可以看出,風(fēng)電功率序列分解為13個(gè)子分量。從IMF1-RES,各分量逐漸從高頻分量過(guò)渡到低頻分量。
實(shí)際中,電力系統(tǒng)的運(yùn)行需要較高的置信水平以獲取更為準(zhǔn)確的信息[21]。因此,本文的置信水平選取90%、80%。圖3、圖4分別給出了測(cè)試集在置信水平90%、80%的VMD-CNN-BiLSTM模型風(fēng)電功率一步區(qū)間預(yù)測(cè)結(jié)果。
從圖3、圖4可以直觀地看出,在同一置信水平下,VMD-CNN-BiLSTM預(yù)測(cè)模型的一步區(qū)間預(yù)測(cè)結(jié)果,能夠在保證跟蹤風(fēng)電功率時(shí)間序列變化的同時(shí),具有更窄的區(qū)間上下限,證明了所提方法的有效性。
圖3 置信水平90%的超短期一步區(qū)間預(yù)測(cè)
圖4 置信水平80%的超短期一步區(qū)間預(yù)測(cè)
為了進(jìn)一步驗(yàn)證VMD-CNN-BiLSTM預(yù)測(cè)模型的優(yōu)越性,將輸入數(shù)據(jù)同樣經(jīng)過(guò)VMD分解之后分別使用CNN-GRU、CNN-LSTM、KELM、SVR這4種預(yù)測(cè)模型進(jìn)行預(yù)測(cè)。表1是5種模型90%置信水平一步區(qū)間預(yù)測(cè)結(jié)果對(duì)比。表2是5種模型80%置信水平一步區(qū)間預(yù)測(cè)結(jié)果對(duì)比。
由表1、表2可得,當(dāng)置信水平相同時(shí),CNN-BiLSTM模型的預(yù)測(cè)區(qū)間平均帶寬PINAW最小、改進(jìn)覆蓋寬度準(zhǔn)則CWCproposed值最小,說(shuō)明CNN-BiLSTM模型的一步區(qū)間預(yù)測(cè)效果最好。
表1 5種模型90%置信水平一步區(qū)間預(yù)測(cè)結(jié)果
表2 5種模型80%置信水平一步區(qū)間預(yù)測(cè)結(jié)果
當(dāng)置信水平為90%時(shí),CNN-BiLSTM模型的預(yù)測(cè)區(qū)間平均帶寬指標(biāo)PINAW相對(duì)于CNN-GRU模型、CNN-LSTM模型、KELM模型、SVR模型分別降低了0.003 3、0.002 5、0.022 5、0.012 5。CNN-BiLSTM模型的改進(jìn)覆蓋寬度準(zhǔn)則CWCproposed指標(biāo)相對(duì)于其余4種模型分別降低了0.019 7、0.015 4、0.135 4、0.036 5 。兩項(xiàng)指標(biāo)充分說(shuō)明了VMD-CNN-BiLSTM模型的優(yōu)越性。
圖5、圖6、圖7分別是VMD-CNN-BiLSTM模型置信水平90%的風(fēng)電功率超短期2步、3步、4步區(qū)間預(yù)測(cè)結(jié)果。表3是5種模型90%置信水平風(fēng)電功率多步區(qū)間預(yù)測(cè)結(jié)果對(duì)比。
圖5 2步區(qū)間預(yù)測(cè)結(jié)果圖
圖6 3步區(qū)間預(yù)測(cè)結(jié)果圖
圖7 4步區(qū)間預(yù)測(cè)結(jié)果圖
表3 5種模型90%置信水平多步區(qū)間預(yù)測(cè)結(jié)果
由表3,當(dāng)置信水平相同,預(yù)測(cè)步數(shù)相同,CNN-BiLSTM模型的預(yù)測(cè)區(qū)間平均帶寬PINAW和改進(jìn)覆蓋寬度準(zhǔn)則CWCproposed均優(yōu)于其余4種對(duì)比模型。例如2步區(qū)間預(yù)測(cè)結(jié)果中CNN-BiLSTM模型的預(yù)測(cè)區(qū)間平均帶寬PINNAW相對(duì)于CNN-GRU模型、CNN-LSTM模型、KELM模型、SVR模型分別降低了0.001 2、0.002 3、0.021、0.010 9。CNN-BiLSTM模型的改進(jìn)覆蓋寬度準(zhǔn)則CWCproposed相對(duì)于其余4種模型分別降低了0.007 3、0.013 5、0.125 9、0.073 9。兩項(xiàng)指標(biāo)充分說(shuō)明了VMD-CNN-BiLSTM模型的優(yōu)越性。
本文針對(duì)風(fēng)電功率區(qū)間預(yù)測(cè)中的基于神經(jīng)網(wǎng)絡(luò)構(gòu)建風(fēng)電功率雙輸出模型進(jìn)而生成風(fēng)電功率置信區(qū)間的方法進(jìn)行研究,通過(guò)仿真對(duì)比實(shí)驗(yàn),得到以下結(jié)論:
(1)采用VMD分解算法處理風(fēng)電功率時(shí)間序列,避免了EEMD分解帶來(lái)的噪聲殘留問(wèn)題;
(2)建立CNN-BiLSTM預(yù)測(cè)模型,將CNN的前饋機(jī)制和BiLSTM的反饋機(jī)制相結(jié)合,既提高了計(jì)算速度,又提高了預(yù)測(cè)精度;
(3)以實(shí)際風(fēng)電場(chǎng)數(shù)據(jù)為例,采用CNN-BiLSTM組合模型,相比于CNN-GRU模型、CNN-LSTM模型、KELM模型、SVR模型,一步區(qū)間預(yù)測(cè)和多步區(qū)間預(yù)測(cè)結(jié)果均具有優(yōu)越性。