蔣艾町,李小雨,夏 雪,李嘉逸
(中國電力工程顧問集團(tuán)西南電力設(shè)計院有限公司,四川 成都 610021)
隨著化石能源等不可再生能源的不斷消耗,資源緊張、環(huán)境污染和氣候變化等問題日益加劇。風(fēng)力發(fā)電以其清潔安全、可持續(xù)、技術(shù)成熟、開發(fā)價值高等優(yōu)勢,迅速在各國的能源戰(zhàn)略中占據(jù)重要位置[1-3]。但由于風(fēng)力資源固有的隨機(jī)和波動特性,不論采用何種風(fēng)電功率預(yù)測方法,風(fēng)功率預(yù)測都具有一定的不確定性,對風(fēng)電系統(tǒng)的電網(wǎng)調(diào)度、棄風(fēng)限電、備用容量配置以及安全運行都會產(chǎn)生影響[4-5],因此,中國各省陸續(xù)推出風(fēng)電功率預(yù)測誤差考核政策。儲能作為改善風(fēng)電功率預(yù)測誤差的一種有效手段在工程中被廣泛應(yīng)用,有效估計風(fēng)電功率預(yù)測誤差,不僅能為風(fēng)電并網(wǎng)系統(tǒng)的調(diào)度和運行提供參考,還能對風(fēng)電場儲能系統(tǒng)容量的合理配置進(jìn)行指導(dǎo),因此有必要對風(fēng)電功率預(yù)測誤差估計方法進(jìn)行研究。
目前國內(nèi)研究最為廣泛的是采用概率分布擬合的方法對風(fēng)電功率預(yù)測誤差進(jìn)行估計計算。該方法通過統(tǒng)計風(fēng)電功率預(yù)測誤差歷史數(shù)據(jù),對統(tǒng)計數(shù)據(jù)進(jìn)行擬合,建立其概率密度分布模型,進(jìn)而求取預(yù)測誤差的估計區(qū)間[6-13]。文獻(xiàn)[6]利用混合高斯分布對風(fēng)電功率預(yù)測誤差進(jìn)行擬合研究分析,結(jié)果表明不同預(yù)測方法下產(chǎn)生的功率預(yù)測誤差的分布特性不同,但混合高斯分布對于應(yīng)用不同預(yù)測方法的風(fēng)電功率預(yù)測誤差均具有高精度的適應(yīng)性。文獻(xiàn)[7-8]基于貝塔分布對風(fēng)電場實際風(fēng)電功率進(jìn)行分析,得到其貝塔分布的概率密度函數(shù),然后建立相應(yīng)的最優(yōu)解模型,求取風(fēng)功率預(yù)測誤差的最小概率區(qū)間。文獻(xiàn)[9-12]采用非參數(shù)概率區(qū)間估計方法,不對總體分布進(jìn)行先驗假設(shè),通過滑動分塊百分位數(shù)Bootstrap法、核密度估計等方法直接求取預(yù)測誤差的置信區(qū)間。文獻(xiàn)[13]首先采用聚類算法將預(yù)測誤差采樣數(shù)據(jù)進(jìn)行分類,然后針對每類數(shù)據(jù)計算其概率密度函數(shù),求取分布模型,進(jìn)而得到風(fēng)電預(yù)測誤差估計區(qū)間。
此外,特征值提取法也經(jīng)常被用于風(fēng)功率預(yù)測誤差估計模型的建立[14-18]。文獻(xiàn)[14-16]根據(jù)風(fēng)電場的歷史運行數(shù)據(jù)和日前預(yù)測數(shù)據(jù)提取數(shù)據(jù)中的有效特征值,如當(dāng)日功率波動、近期功率波動及預(yù)測方法精度等,通過多元線性回歸法建立回歸方程,進(jìn)而求取預(yù)測誤差的估計區(qū)間。文獻(xiàn)[17-18]在直接提取數(shù)據(jù)特征值的基礎(chǔ)上,加入小波分析、粗糙集理論及字典學(xué)習(xí)等算法,對風(fēng)電功率預(yù)測數(shù)據(jù)進(jìn)行處理后采用多元線性回歸方程,建立風(fēng)電功率預(yù)測誤差的估計模型。然而,這些方法雖然能夠改善預(yù)測誤差估計效果,但增加了算法的復(fù)雜程度,工程實用性較低。
綜上所述,下面選取適用范圍較廣的基于混合高斯分布擬合法和特征值提取法的風(fēng)電功率預(yù)測誤差估計算法,針對這兩種方法進(jìn)行了詳細(xì)的對比研究。同時提出了一種結(jié)合高斯混合模型(Gaussian mixture model,GMM)和馬爾可夫模型(Markov model,MM)的MM-GMM優(yōu)化預(yù)測誤差區(qū)間估計算法并驗證其有效性。
基于混合高斯分布擬合法的風(fēng)電功率預(yù)測誤差估計方法首先假設(shè)誤差數(shù)據(jù)的概率密度函數(shù)符合混合高斯分布,然后通過對歷史風(fēng)電功率預(yù)測誤差數(shù)據(jù)的統(tǒng)計分析,進(jìn)行數(shù)據(jù)擬合,得到樣本數(shù)據(jù)的混合高斯模型,進(jìn)而設(shè)置合理的置信水平求得預(yù)測誤差的估計區(qū)間。該方法適用范圍廣、精度高[6]。
一維混合高斯分布模型由多個正態(tài)分布線性組成,其概率密度函數(shù)表達(dá)式為
f(x;μ1,…,μN,σ1,…,σk)=
(1)
式中:k為正態(tài)分布的個數(shù);ai(1≤i≤k)為各正態(tài)分布的權(quán)值;μi為各正態(tài)分布的均值;σi為各正態(tài)分布的標(biāo)準(zhǔn)差。
根據(jù)風(fēng)電場歷史誤差數(shù)據(jù),利用期望最大化(expectation maximization,EM)算法對混合高斯模型進(jìn)行參數(shù)估計,求解式(1)中的ai、μi和σi[6, 19]。
設(shè)θj=(aj,μj,σj),j=1,2,…,k為GMM中各正態(tài)分布模型的參數(shù),Θ=(θ1,θ2,…,θk)為GMM中的所有參數(shù)。EM算法主要包含以下兩個步驟:
1)計算樣本數(shù)據(jù)X的對數(shù)似然函數(shù)的最大似然估計值,其對數(shù)似然函數(shù)如式(2)。
(2)
式中:T為樣本總數(shù);k為正態(tài)分布的個數(shù);Θ(q)為第q次迭代時計算得到的參數(shù)的最大似然估計值。
2)最大化上一步得到的最大似然估計值,求解參數(shù)。
(3)
重復(fù)迭代上述步驟至Θ(q+1)和Θ(q)之間的差值無窮小,即收斂時,則為最優(yōu)的模型參數(shù)。
根據(jù)上述步驟建立基于混合高斯分布擬合法的風(fēng)電功率預(yù)測誤差估計模型,然后設(shè)置合理的置信水平,即可求得風(fēng)電功率預(yù)測誤差估計區(qū)間。
基于特征值提取法的風(fēng)電功率預(yù)測誤差估計是通過分析與預(yù)測誤差相關(guān)的特征值,將這些特征值與風(fēng)電功率預(yù)測誤差聯(lián)合建立多元線性回歸方程,進(jìn)而求取預(yù)測誤差的估計區(qū)間。
獲得風(fēng)電場的歷史運行數(shù)據(jù),包括歷史預(yù)測功率和實際功率以及風(fēng)電場日前預(yù)測功率,從統(tǒng)計學(xué)角度出發(fā),利用各種統(tǒng)計學(xué)參數(shù)提煉出與預(yù)測誤差相關(guān)的特征值,如日前預(yù)測功率波動性、近期風(fēng)電功率波動性、風(fēng)功率幅值及預(yù)測方法的預(yù)測精度等,進(jìn)行相關(guān)性分析[14-15]。選取相關(guān)性較強(qiáng)的特征值,利用多元線性回歸方程建立預(yù)測誤差估計模型。其中,相關(guān)性計算使用卡爾·皮爾遜對相關(guān)系數(shù)r的表述如式(4)所示[14,17]。
(4)
風(fēng)電功率預(yù)測誤差估計模型為
E=b0+b1·x1+b2·x2+...+bn·xn
(5)
式中:E為當(dāng)日風(fēng)電功率的平均絕對誤差;x1,…,xn為與E強(qiáng)相關(guān)的各個特征值;b0,…,bn為估計模型的回歸系數(shù)。
通常來講,與風(fēng)電預(yù)測功率的平均絕對誤差相關(guān)性較強(qiáng)的因素有當(dāng)日風(fēng)電功率波動、當(dāng)日風(fēng)電功率水平和預(yù)測方法的預(yù)測精度等[14-16]。其中,當(dāng)日風(fēng)電功率波動和當(dāng)日風(fēng)電功率水平對預(yù)測誤差的影響較大[13]。
用當(dāng)日的日前預(yù)測風(fēng)電功率的標(biāo)準(zhǔn)方差ST表示當(dāng)日風(fēng)電功率波動,ST越大,表明當(dāng)日風(fēng)電功率波動越大,風(fēng)電功率預(yù)測難度增加,預(yù)測精度下降,風(fēng)電功率預(yù)測誤差則會增大[14-16]。ST的具體表達(dá)式為[14-16]
(6)
用當(dāng)日預(yù)測功率平均值表示當(dāng)日風(fēng)電功率水平Pave,若當(dāng)日風(fēng)電功率水平較大,則風(fēng)電功率容易變化,增大風(fēng)電功率預(yù)測誤差[14-16]。當(dāng)日風(fēng)電功率水平Pave如式(7)所示[14-16]。
(7)
同樣地,若風(fēng)電功率預(yù)測系統(tǒng)的預(yù)測精度較低,風(fēng)電功率預(yù)測誤差也會較大[14-16]。風(fēng)電功率近期預(yù)測精度Pre如式(8)所示[14]。
(8)
式中:Pmt為每一時刻的實際功率;N2表示近幾日預(yù)測時刻數(shù),取96的正整數(shù)倍。
根據(jù)風(fēng)電場歷史運行數(shù)據(jù)計算得到ST、Pave和Pre,并利用式(4)計算各特征值與平均絕對誤差的相關(guān)性,選取相關(guān)性強(qiáng)的因素和平均絕對誤差帶入式(5),利用Matlab進(jìn)行求解,即可得到風(fēng)電功率預(yù)測誤差估計模型并求解誤差估計區(qū)間。
為了驗證評估上述兩種方法的有效性,利用西北地區(qū)某風(fēng)電場2018年6月1日至2018年7月30日的風(fēng)電預(yù)測功率數(shù)據(jù)和實際功率數(shù)據(jù),根據(jù)前50日的數(shù)據(jù)樣本,分別采用兩種方法對2018年7月21日至2018年7月30日進(jìn)行風(fēng)電功率預(yù)測誤差估計。
基于得到的風(fēng)電場功率數(shù)據(jù),對風(fēng)電場的功率預(yù)測誤差數(shù)據(jù)進(jìn)行歸一化,利用Matlab軟件,根據(jù)第1節(jié)的誤差估計模型建立步驟,對預(yù)測誤差進(jìn)行混合高斯分布擬合,分別建立二權(quán)值和三權(quán)值的混合高斯模型,得到的結(jié)果如表1所示。
表1 二權(quán)值和三權(quán)值的混合高斯模型參數(shù)值
根據(jù)表1分別繪制二權(quán)值和三權(quán)值的混合高斯模型曲線,對比其概率密度分布圖(如圖1所示)??梢钥闯?,對于該風(fēng)電場的功率預(yù)測誤差分布,較二權(quán)值混合高斯模型而言,三權(quán)值混合高斯模型擬合的概率分布曲線更加準(zhǔn)確。
因此,風(fēng)電功率預(yù)測誤差模型采用三權(quán)值的混合高斯模型,設(shè)置95%的置信水平,得到風(fēng)電功率預(yù)測誤差估計區(qū)間為[-25.235 1,24.507 5],其與實際風(fēng)電運行數(shù)據(jù)的對比如圖2所示。
圖1 不同權(quán)值混合高斯模型分布擬合圖
圖2 基于混合高斯分布擬合法的風(fēng)電功率預(yù)測誤差區(qū)間估計結(jié)果
同樣地,基于得到的風(fēng)電場功率數(shù)據(jù),根據(jù)式(6)、式(7)、式(8)分別計算得到特征值ST、Pave和Pre,通過式(4)計算得到3個特征值與日平均絕對誤差E的相關(guān)性有:rST_E=0.516 9、rPave_E=0.785 0、rPre_ E=0.126 4。
可以看出,對于該風(fēng)電場,當(dāng)日風(fēng)電功率波動ST和當(dāng)日風(fēng)功率幅值Pave與誤差的相關(guān)性較高。因此,以當(dāng)日風(fēng)電功率波動和當(dāng)日風(fēng)功率幅值兩個特征值作為線性回歸方程的自變量來建立如式(5)所示的風(fēng)電功率預(yù)測誤差估計模型。
基于以上分析,利用Matlab軟件,計算得到風(fēng)電功率預(yù)測誤差估計模型的線性回歸系數(shù)及其95%的置信區(qū)間,如表2所示。
表2 基于特征值提取的風(fēng)電功率預(yù)測
根據(jù)表2和式(5),求得風(fēng)電場2018年7月21日至2018年7月30日這10天的風(fēng)電功率預(yù)測誤差估計區(qū)間,結(jié)果如圖3所示。
圖3 基于特征值提取的風(fēng)電功率預(yù)測誤差區(qū)間估計結(jié)果
風(fēng)電功率預(yù)測誤差估計區(qū)間是決定風(fēng)電場儲能容量配置的關(guān)鍵。利用兩個指標(biāo)對得到的誤差估計區(qū)間進(jìn)行評估:區(qū)間覆蓋率RPICP和區(qū)間平均帶寬RPINAW,這兩個指標(biāo)的數(shù)學(xué)表達(dá)式如式(9)[9,12]所示。
(9)
式中:N為樣本總數(shù);kt為布爾量,當(dāng)t時刻的誤差值位于誤差估計區(qū)間內(nèi),kt為1,否則為0;R為實際值的變化范圍;Ut(xt)為t時刻誤差估計區(qū)間的上限;Lt(xt)為t時刻誤差估計區(qū)間的下限。
可以看出,對于風(fēng)電場儲能的容量配置,RPICP決定了容量配置的有效性,RPINAW決定了容量配置的經(jīng)濟(jì)性。對于一個理想的誤差估計區(qū)間,RPICP越大,覆蓋率越高,儲能容量配置則越有效;RPINAW越小,區(qū)間精度越高,儲能容量配置則越經(jīng)濟(jì)。根據(jù)前兩個小節(jié)的分析計算,兩種方法的誤差估計區(qū)間的RPICP和RPINAW如表3所示。
表3 兩種方法的誤差估計區(qū)間的指標(biāo)結(jié)果
由表3可知,基于特征值提取法的風(fēng)電功率預(yù)測區(qū)間估計的區(qū)間覆蓋率和基于混合高斯分布擬合方法的風(fēng)電功率預(yù)測區(qū)間估計的區(qū)間覆蓋率分別為58.85%和92.08%,后者的區(qū)間覆蓋率遠(yuǎn)高于前者。但是基于混合高斯分布擬合方法得到的估計區(qū)間的帶寬較大,為80.37%,因此根據(jù)該區(qū)間配置儲能容量的經(jīng)濟(jì)性較差,而基于特征值提取法得到的估計區(qū)間的RPINAW則較小,為25.43%。
根據(jù)前面的分析可以看出,若根據(jù)混合高斯分布擬合得到的誤差估計區(qū)間進(jìn)行風(fēng)電場儲能容量配置,其有效性較高但經(jīng)濟(jì)性較差;若根據(jù)特征值提取法得到的誤差估計區(qū)間進(jìn)行儲能容量配置,其經(jīng)濟(jì)性較好但有效性較低。為了解決上述問題,兼顧儲能容量配置時的有效性和經(jīng)濟(jì)性,基于混合高斯模型,結(jié)合馬爾可夫模型,提出了一種MM-GMM優(yōu)化預(yù)測誤差區(qū)間估計算法。
由于風(fēng)本身固有的隨機(jī)性和波動性,風(fēng)電功率預(yù)測誤差也具有較強(qiáng)的不確定性,風(fēng)電功率預(yù)測通常只與相鄰時段有關(guān),而與過去所處的狀態(tài)無關(guān),因此,考慮在風(fēng)電預(yù)測誤差區(qū)間估計中引入馬爾可夫模型。
若隨機(jī)過程具有“無后效性”,即在已知現(xiàn)在狀態(tài)的前提下,其未來的狀態(tài)與過去的狀態(tài)無關(guān),則稱其為馬爾可夫過程[20-21]。
定義P為馬爾可夫過程的一步狀態(tài)轉(zhuǎn)移概率矩陣,Pij為狀態(tài)轉(zhuǎn)移矩陣P中由狀態(tài)Si一步轉(zhuǎn)移到狀態(tài)Sj的概率,根據(jù)其無后效性有[20-21]:
Pij(t)=P{S(t+1)=j|S(t)=i}
(10)
式中:S(t)=i表示t時刻的狀態(tài)為i;S(t+1)=j表示t+1時刻的狀態(tài)為j。
根據(jù)上述分析,結(jié)合第1節(jié)的混合高斯模型的求解過程,MM-GMM優(yōu)化預(yù)測誤差區(qū)間估計算法的具體步驟如下:
1)利用EM算法求出樣本數(shù)據(jù)中每個時刻的功率預(yù)測誤差處于混合高斯分布中的具體分布及其均值和標(biāo)準(zhǔn)差;
2)根據(jù)計算得到的每個時刻誤差所處的分布狀態(tài),計算馬爾可夫過程的一階狀態(tài)轉(zhuǎn)移矩陣PE;
3)根據(jù)最近時刻所處的狀態(tài),利用計算得到的一階狀態(tài)轉(zhuǎn)移矩陣PE,預(yù)測未來一天各時刻誤差所處的分布狀態(tài);
4)設(shè)置置信水平,計算預(yù)測狀態(tài)所處分布的對應(yīng)置信區(qū)間即為該時刻的預(yù)測誤差估計區(qū)間。
對所提的優(yōu)化算法進(jìn)行算例驗證,同樣地,利用西北地區(qū)某風(fēng)電場的數(shù)據(jù)樣本,采用所提的優(yōu)化算法對2018年7月21日至2018年7月30日進(jìn)行風(fēng)電功率預(yù)測誤差估計。每個狀態(tài)采用95%的置信區(qū)間,得到的結(jié)果如圖4所示。
圖4 MM-GMM優(yōu)化預(yù)測誤差區(qū)間估計算法的區(qū)間估計結(jié)果
根據(jù)如圖4所示的估計區(qū)間,計算該區(qū)間RPICP為71.56%,RPINAW為26.01%。3種方法的誤差估計區(qū)間指標(biāo)結(jié)果的對比如表4所示。可以看出,與前兩種方法相比,所提的優(yōu)化算法不僅有效性較高,且區(qū)間較窄,能夠為風(fēng)電場的儲能容量配置提供有效的指導(dǎo)信息,經(jīng)濟(jì)性較好。
表4 3種方法的誤差估計區(qū)間的指標(biāo)結(jié)果
對混合高斯分布擬合法和特征值提取法這兩種典型的風(fēng)電功率預(yù)測誤差估計算法進(jìn)行的詳細(xì)研究表明:基于混合高斯分布擬合的誤差估計方法得到的誤差估計區(qū)間進(jìn)行儲能容量配置的有效性高但經(jīng)濟(jì)性較差;基于特征值提取的誤差估計方法得到的誤差估計區(qū)間進(jìn)行儲能容量配置的經(jīng)濟(jì)性好但有效性較低。
為了有效估計風(fēng)電功率預(yù)測誤差,上面給出對于風(fēng)電場儲能配置具有指導(dǎo)意義的預(yù)測誤差估計區(qū)間,在混合高斯模型的基礎(chǔ)上,對風(fēng)電功率預(yù)測誤差進(jìn)行狀態(tài)劃分,結(jié)合馬爾可夫模型,提出了一種MM-GMM優(yōu)化誤差區(qū)間估計算法并進(jìn)行了算例驗證。結(jié)果表明,基于所提的優(yōu)化算法得到的估計區(qū)間不僅覆蓋率較高,而且?guī)捿^小,兼顧了風(fēng)電場儲能容量配置時的有效性和經(jīng)濟(jì)性,具有較好的綜合性能,能夠為改善風(fēng)電功率預(yù)測誤差的儲能系統(tǒng)容量配置提供理論依據(jù)。