甘 迪 柯德平 孫元章 崔明建
(武漢大學(xué)電氣工程學(xué)院 武漢 430072)
?
基于集合經(jīng)驗(yàn)?zāi)J椒纸夂瓦z傳-高斯過程回歸的短期風(fēng)速概率預(yù)測
甘 迪 柯德平 孫元章 崔明建
(武漢大學(xué)電氣工程學(xué)院 武漢 430072)
短期風(fēng)速概率預(yù)測對實(shí)現(xiàn)大規(guī)模風(fēng)電并網(wǎng)具有重要意義。當(dāng)前風(fēng)速預(yù)測方法大多為點(diǎn)預(yù)測,無法描述風(fēng)能的隨機(jī)性。提出了一種基于集合經(jīng)驗(yàn)?zāi)J椒纸?EEMD)和遺傳-高斯過程回歸(GA-GPR)的組合概率預(yù)測方法,首先對篩選和歸一化后的風(fēng)速時(shí)間序列進(jìn)行集合經(jīng)驗(yàn)?zāi)J椒纸猓缓髮Ω鞣至糠謩e建立高斯過程回歸模型,并引入遺傳算法代替共軛梯度法,改進(jìn)協(xié)方差函數(shù)的超參數(shù)尋優(yōu)過程。最后疊加子序列預(yù)測結(jié)果得到風(fēng)速概率預(yù)測結(jié)果,并與分位點(diǎn)回歸法進(jìn)行比較。仿真結(jié)果表明,該方法能夠有效提高概率預(yù)測準(zhǔn)確度,并為類似工程提供借鑒。
集合經(jīng)驗(yàn)?zāi)J椒纸?高斯過程回歸 遺傳算法 風(fēng)速 概率預(yù)測
隨著常規(guī)能源短缺和環(huán)境污染問題的日益突出,風(fēng)能因其清潔無污染、蘊(yùn)藏量巨大逐漸受到世界各國的重視[1]。風(fēng)力發(fā)電是風(fēng)能的主要利用方式之一。由于自然風(fēng)具有隨機(jī)性、波動(dòng)性和不可控制性,當(dāng)大規(guī)模風(fēng)電接入電網(wǎng)時(shí),電力供需平衡、電網(wǎng)的安全穩(wěn)定運(yùn)行及電能質(zhì)量會(huì)遭受嚴(yán)峻挑戰(zhàn)[2]。風(fēng)電場風(fēng)速的有效預(yù)測,對調(diào)度部門制訂發(fā)電計(jì)劃、合理安排旋轉(zhuǎn)備用容量、提高風(fēng)電功率穿透率及提高風(fēng)電在電力系統(tǒng)中的競爭力都具有重要意義[3]。
目前,風(fēng)速預(yù)測大多是確定性的點(diǎn)預(yù)測,主要方法有持續(xù)預(yù)測法[4]、時(shí)間序列分析法(ARMA)[5,6]、人工神經(jīng)網(wǎng)絡(luò)法(ANN)[7,8]、卡爾曼濾波法[9,10]和支持向量機(jī)法(SVM)[11,12]等。這些方法在相應(yīng)的特定風(fēng)速場景下都取得了較好的預(yù)測效果,但受制于各自的固有缺陷,其預(yù)測效果的魯棒性在更一般性的場景下則有所欠缺。比如持續(xù)法預(yù)測誤差較大,且預(yù)測結(jié)果不穩(wěn)定;神經(jīng)網(wǎng)絡(luò)存在大樣本、過學(xué)習(xí)、推廣能力較差和局部優(yōu)化的缺點(diǎn);支持向量機(jī)在懲罰函數(shù)、核函數(shù)和核參數(shù)的選擇上存在困難等問題。并且這些方法的預(yù)測結(jié)果不具有概率意義,難以描述風(fēng)速預(yù)測的不確定性和隨機(jī)性。
隨著風(fēng)電并網(wǎng)規(guī)模的逐漸加大,風(fēng)速的概率預(yù)測日益受到人們的重視[13]。風(fēng)速概率預(yù)測與常規(guī)點(diǎn)預(yù)測方法有諸多不同,可以歸納為以下3個(gè)方面:
1)輸出結(jié)果不同。常規(guī)點(diǎn)預(yù)測方法將風(fēng)速視為確定性變量,輸出風(fēng)速單點(diǎn)(或多點(diǎn))的確定性預(yù)測值,即認(rèn)為預(yù)測時(shí)刻的風(fēng)速等于該預(yù)測值,預(yù)測結(jié)果不具有概率意義。而風(fēng)速概率預(yù)測認(rèn)為風(fēng)速具有不確定性,可用隨機(jī)序列來描述風(fēng)速序列,即認(rèn)為預(yù)測時(shí)刻的風(fēng)速是不確定的(任何一種風(fēng)速值都有可能出現(xiàn))。理想情況下,概率預(yù)測方法輸出預(yù)測時(shí)刻的風(fēng)速概率分布。而一般情況下,概率預(yù)測方法能輸出預(yù)測時(shí)刻風(fēng)速在某一個(gè)區(qū)間內(nèi)取值的累積概率;或在給定置信度(累積概率)的情況下,概率預(yù)測能輸出對應(yīng)的風(fēng)速區(qū)間。
2)評價(jià)方法不同。常規(guī)點(diǎn)預(yù)測方法大多以預(yù)測值與實(shí)際值之間的誤差為評價(jià)指標(biāo),誤差越小,預(yù)測的效果越好。而風(fēng)速概率預(yù)測的評價(jià)主要從兩個(gè)方面來考慮:一是概率預(yù)測結(jié)果應(yīng)可靠,風(fēng)速落在預(yù)測區(qū)間的概率接近置信度;二是預(yù)測區(qū)間應(yīng)盡量窄。
3)應(yīng)用范圍不同。風(fēng)速的常規(guī)點(diǎn)預(yù)測方法主要應(yīng)用于確定性的電力系統(tǒng)優(yōu)化調(diào)度問題[14]和電力市場發(fā)電競價(jià)問題[15],而風(fēng)速概率預(yù)測方法主要應(yīng)用于氣象學(xué)中風(fēng)速預(yù)測的風(fēng)險(xiǎn)評估問題[16]及含風(fēng)電場的電力系統(tǒng)概率優(yōu)化調(diào)度、概率風(fēng)險(xiǎn)分析和決策問題[17]。
目前概率預(yù)測方法與點(diǎn)預(yù)測方法相比,尚處于起步階段,所采用的方法大多基于分位點(diǎn)回歸[18,19](Quantile Regression,QR)技術(shù)。分位點(diǎn)回歸法通過估計(jì)累計(jì)概率函數(shù)的分位數(shù)提供預(yù)測對象的概率信息,其優(yōu)點(diǎn)是沒有事先的分布假設(shè),能提供穩(wěn)定的預(yù)測信息,但需事先選擇回歸模型和分位點(diǎn),對每一個(gè)分位點(diǎn)分別建立模型求解,模型計(jì)算量較大,且得到的概率分布不連續(xù)。
針對上述研究現(xiàn)狀,本文提出一種新的基于集合經(jīng)驗(yàn)?zāi)J椒纸夂瓦z傳-高斯過程回歸的短期風(fēng)速概率預(yù)測模型,為短期風(fēng)速概率預(yù)測提供一種新的解決思路。作為一種新型的機(jī)器學(xué)習(xí)算法,高斯過程回歸[20-22](Gaussian Process Regression,GPR)在構(gòu)建概率預(yù)測模型時(shí),具有易實(shí)現(xiàn)、超參數(shù)自適應(yīng)獲取及預(yù)測輸出具有概率意義等優(yōu)點(diǎn),能在預(yù)測風(fēng)速期望值的同時(shí)對其分布狀況進(jìn)行估計(jì);與其他常見回歸模型(如ARMA、ANN、SVM等)相比,GPR的優(yōu)勢在于它是一種獨(dú)立的概率預(yù)測模型,該模型基于貝葉斯框架,其預(yù)測結(jié)果具有概率意義,能直接用于概率預(yù)測。而上述回歸模型只能得到確定性預(yù)測結(jié)果,并不能獨(dú)立應(yīng)用于概率預(yù)測;與分位點(diǎn)回歸法相比,GPR的優(yōu)勢在于模型無需事先選擇分位點(diǎn),復(fù)雜度較小,且基于貝葉斯框架能得到連續(xù)的概率分布。然而,現(xiàn)有基于GPR的概率預(yù)測在預(yù)測準(zhǔn)確度上仍有較大的改善空間。因此,本文在采用GPR進(jìn)行短期風(fēng)速概率預(yù)測的基礎(chǔ)上,首次通過引入集合經(jīng)驗(yàn)?zāi)J椒纸鈁23](Ensemble Empirical Mode Decomposition,EEMD)和遺傳算法[24](Genetic Algorithm,GA)以可靠地提升其預(yù)測準(zhǔn)確度。運(yùn)用本文模型對風(fēng)電場實(shí)測風(fēng)速序列進(jìn)行提前1 h的短期概率預(yù)測,并采用多個(gè)概率預(yù)測評價(jià)指標(biāo)評估模型,結(jié)果表明本文模型具有較高的短期風(fēng)速概率預(yù)測準(zhǔn)確度和較好的魯棒性,可實(shí)際應(yīng)用于電力系統(tǒng)和電力市場的諸多方面。
1.1 經(jīng)驗(yàn)?zāi)J椒纸?/p>
風(fēng)速信號具有非線性和非平穩(wěn)性,采用前置分解方法能降低信號的非平穩(wěn)性,提取信號不同頻次的信息,在此基礎(chǔ)上結(jié)合統(tǒng)計(jì)學(xué)方法進(jìn)行組合預(yù)測往往能改善預(yù)測效果。經(jīng)驗(yàn)?zāi)J椒纸?Empirical Mode Decomposition,EMD)是一種自適應(yīng)信號時(shí)頻處理方法,可將原信號中不同尺度的趨勢逐級分解,得到有限個(gè)包含不同時(shí)間尺度局部特征信號的固有模式分量(Intrinsic Mode Function,IMF)。IMF應(yīng)滿足[25]:①局部極大值和局部極小值定義的包絡(luò)線均值始終為0;②極點(diǎn)數(shù)和零點(diǎn)數(shù)相等,或相差不大于1。對某風(fēng)速序列{x(t)},EMD的分解過程如下:
1)確定x(t)所有的局部極值點(diǎn),用三次樣條插值分別連接所有極大值點(diǎn)和極小值點(diǎn),形成上包絡(luò)線xmax(t)和下包絡(luò)線xmin(t),計(jì)算兩包絡(luò)線的均值m(t),進(jìn)而求出x(t)和均值的差值h(t)
(1)
h(t)=x(t)-m(t)
(2)
2)判斷h(t)是否滿足IMF的條件,若滿足則令h(t)為第1個(gè)IMF,記c1(t)=h(t),并求出原信號與該IMF的差值r1(t);若不滿足則重復(fù)上述過程若干次,直到新的h(t)滿足IMF的條件。
3)將r(t)作為待分解信號,重復(fù)以上過程,直到剩余信號為單調(diào)函數(shù)時(shí),終止整個(gè)分解過程。則原序列可表示為
(3)
1.2 集合經(jīng)驗(yàn)?zāi)J椒纸?/p>
集合經(jīng)驗(yàn)?zāi)J椒纸馐窃趥鹘y(tǒng)經(jīng)驗(yàn)?zāi)J椒纸獾幕A(chǔ)上,通過引入高斯白噪聲來克服頻頻出現(xiàn)的模式混疊問題,以最大程度地保留真實(shí)信號的改進(jìn)算法。EEMD的原理詳見文獻(xiàn)[26],分解步驟如下:
1)在風(fēng)速序列x(t)中加入零均值的高斯白噪聲序列,噪聲方差為(pε)2,其中p為白噪聲的強(qiáng)度參數(shù),ε為x(t)的標(biāo)準(zhǔn)差。
2)將加入了白噪聲的序列EMD分解為若干個(gè)IMF。
3)重復(fù)步驟1)和2)N次,每次加入的白噪聲序列不同。
4)將N次分解所得的IMF的均值作為x(t)的最終IMF。
2.1 高斯過程回歸
高斯過程又稱正態(tài)隨機(jī)過程,對于任意一組隨機(jī)變量{xi∈X,i=1,2,…,n},與其對應(yīng)的過程狀態(tài){Y(x1),Y(x2),…,Y(xn)}的聯(lián)合概率分布服從n維高斯分布。從函數(shù)空間的視角看,高斯過程的全部統(tǒng)計(jì)特征完全由其均值μ(x)和協(xié)方差函數(shù)C(x,x′)確定
(4)
式中,x,x′∈X均為任意隨機(jī)輸入變量,且均為d維矢量。則高斯過程可定義為f(x)~GP(μ(x),C(x,x′))。
將有n個(gè)觀察數(shù)據(jù)的數(shù)據(jù)集D={(xi,yi),i=1,2,…,n}作為高斯過程的訓(xùn)練集,其中xi為d維輸入矢量,觀測目標(biāo)yi∈R。觀測目標(biāo)y被噪聲腐蝕,與真實(shí)輸出值相差ε。則帶有高斯白噪聲的標(biāo)準(zhǔn)線性回歸模型可表示為
y=f(X)+ε
(5)
(6)
式中,I為單位矩陣。
在GPR先驗(yàn)分布所定義的泛函空間中,基于貝葉斯框架可以計(jì)算出后驗(yàn)分布的函數(shù)預(yù)測輸出值。由式(6)可得訓(xùn)練樣本輸出y和測試樣本輸出y*所形成的聯(lián)合高斯先驗(yàn)分布為
(7)
式中,C(X,X)為n×n階正定的協(xié)方差矩陣,其任意項(xiàng)cij表征xi和xj的相關(guān)性;C(X,x*)為訓(xùn)練集輸入X和測試集x*的協(xié)方差矩陣;C(x*,x*)為測試集x*自身的協(xié)方差。
(8)
(9)
(10)
用置信區(qū)間描述高斯過程回歸模型的概率預(yù)測結(jié)果。在置信度1-α下,預(yù)測結(jié)果的置信區(qū)間為
(11)
式中,Lb1-α(y*)和Ub1-α(y*)分別為預(yù)測值的下界和上界;z(1-α)/2為標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)。
2.2 核函數(shù)選取
GPR中協(xié)方差函數(shù)是一個(gè)滿足Mercer條件[20]的對稱函數(shù),并且在有限輸入集上是正定的,因此協(xié)方差函數(shù)等價(jià)于核函數(shù),則式(9)可改寫為
(12)
其中
(13)
預(yù)測值的均值是核函數(shù)C(xi,xj)的線性組合,可將非線性關(guān)系的數(shù)據(jù)映射到特征空間后轉(zhuǎn)換為線性關(guān)系,從而使復(fù)雜非線性問題轉(zhuǎn)換為線性問題。
GPR可選用不同的核函數(shù),常見的核函數(shù)有:
1)平方指數(shù)核函數(shù)(SE)
(14)
2)有理二次協(xié)方差核函數(shù)(RQ)
(15)
組合核函數(shù)的性能一般優(yōu)于單一核函數(shù)[20],本文選擇組合核函數(shù)為
CCK(xi,xj)=CSE+CRQ
(16)
2.3 改進(jìn)超參數(shù)訓(xùn)練過程
現(xiàn)有研究GPR的文獻(xiàn)在確定最優(yōu)超參數(shù)時(shí),大多采用共軛梯度法,即通過求取訓(xùn)練樣本的對數(shù)似然的極大值獲得最優(yōu)超參數(shù)。然而,共軛梯度法從單個(gè)初始值出發(fā),依梯度下降迭代求最優(yōu)解,容易陷入局部最優(yōu),并且其優(yōu)化效果及迭代的收斂性過于依賴初值,難以保證優(yōu)化的效果。比較而言,遺傳算法[24]是一種公認(rèn)的具有較好的全局搜索能力的算法,從問題的初始解集開始并行搜索,覆蓋面大,具有較大概率找到全局最優(yōu)解;并且其優(yōu)化結(jié)果對初值依賴性小,減少了初值的選取對優(yōu)化效果的影響。在本文中,GPR超參數(shù)的優(yōu)化直接關(guān)聯(lián)短期風(fēng)速概率預(yù)測模型的準(zhǔn)確度,即優(yōu)化結(jié)果越好,預(yù)測準(zhǔn)確度越高。相對于共軛梯度法,遺傳算法更能在全局范圍內(nèi)保證搜索解的質(zhì)量,因而本文將其應(yīng)用于優(yōu)化GPR的超參數(shù),其操作算子敘述如下。
2.3.1 選擇算子
采用輪盤賭選擇法,個(gè)體適應(yīng)度按照比例轉(zhuǎn)換為選擇的概率。個(gè)體適應(yīng)度越大,被選中的可能性越大。每個(gè)個(gè)體a對應(yīng)的選擇概率pa為
(17)
式中,F(xiàn)a和Fi為個(gè)體a和i的適應(yīng)度值;N為種群個(gè)體的數(shù)目。
通過個(gè)體選擇概率計(jì)算其累計(jì)概率,產(chǎn)生[0,1]間的隨機(jī)數(shù)與之進(jìn)行比較,以決定選擇的個(gè)體。
2.3.2 交叉算子
采用算術(shù)雜交,反復(fù)按式(18)對父代進(jìn)行雜交操作,檢查產(chǎn)生的后代是否為可行解,直到獲得可行的后代
(18)
式中,Ai、Bi為選擇的父代;Ai+1、Bi+1為產(chǎn)生的子代;r為[0,1]間的隨機(jī)數(shù)。
2.3.3 變異算子
采用自適應(yīng)變化的變異算子,加快算法收斂速度。選取第a個(gè)個(gè)體的第k個(gè)基因xak進(jìn)行變異操作,變異后的基因yak隨機(jī)產(chǎn)生于區(qū)間M,即
M=[xak-f(g)(xak-amin),xak+f(g)(amax-xak)]
(19)
f(g)=1-m[1-(g/Gmax)]n
(20)
式中,xak∈[amin,amax];g為當(dāng)前迭代次數(shù);Gmax為最大迭代次數(shù);m、n為參數(shù),本文m=3,n為[0,1]間的隨機(jī)數(shù)。
2.3.4 適應(yīng)度函數(shù)
本文選用的適應(yīng)度函數(shù)為
(21)
式中,f(xi)為訓(xùn)練時(shí)第i個(gè)測試樣本的預(yù)測值;yi為訓(xùn)練時(shí)第i個(gè)測試樣本的實(shí)測值。
2.3.5 遺傳算法的參數(shù)確定
遺傳算法的參數(shù)對算法的搜索效率、質(zhì)量等有直接影響。然而,在當(dāng)前發(fā)展水平下,遺傳算法,乃至整個(gè)啟發(fā)式搜索策略家族都沒有簡單、直觀且通用的參數(shù)確定方法。與大多數(shù)使用遺傳算法的文獻(xiàn)[27]相同,本文采用兩階段法確定其參數(shù):
1)在執(zhí)行搜索之前,根據(jù)文獻(xiàn)推薦的參數(shù)取值范圍(先驗(yàn)經(jīng)驗(yàn)),如種群規(guī)模一般取40~100,雜交概率一般接近于1,變異概率一般小于0.1,進(jìn)化代數(shù)一般介于100~500,隨機(jī)選取一組參數(shù)并進(jìn)行優(yōu)化計(jì)算。
2)觀察優(yōu)化結(jié)果,并根據(jù)啟發(fā)式的參數(shù)調(diào)整策略反復(fù)修正參數(shù)并重新進(jìn)行計(jì)算,直到得到滿意的搜索過程和結(jié)果。此處,啟發(fā)式調(diào)整策略是指根據(jù)遺傳算法各個(gè)參數(shù)對搜索過程和結(jié)果的一般性影響來調(diào)整參數(shù)。例如種群規(guī)模越大越能找到全局解,但運(yùn)行時(shí)間也相對較長;變異概率越大搜索的范圍越大,但算法越不容易收斂。
本文以原始風(fēng)速信號作為輸入,建立EEMD-GA-GPR模型實(shí)現(xiàn)提前1 h的風(fēng)速概率預(yù)測。EEMD-GA-GPR模型結(jié)構(gòu)圖如圖1所示。
圖1 基于EEMD-GA-GPR的風(fēng)速概率預(yù)測模型結(jié)構(gòu)圖Fig.1 Model Structure of wind speed probabilistic forecasting based on EEMD-GA-GPR
1)采用EEMD分解風(fēng)速信號,參數(shù)p取0.3,ε取 100。
2)對各子序列建立GA-GPR模型,核函數(shù)選擇式(16)的組合核函數(shù)形式;根據(jù)2.3.5節(jié)所述,本文確定的種群規(guī)模為50,雜交概率為0.9,變異概率為0.03,進(jìn)化200代。
3)將各子序列預(yù)測結(jié)果疊加得到最終風(fēng)速概率預(yù)測值。
4)模型評價(jià)。
4.1 風(fēng)速數(shù)據(jù)選擇與處理
以國外某風(fēng)電場A在2014年1月的實(shí)測風(fēng)速數(shù)據(jù)作為實(shí)驗(yàn)樣本,對本文的預(yù)測方法進(jìn)行驗(yàn)證。該數(shù)據(jù)的采樣周期是1 h,選取連續(xù)600個(gè)采樣點(diǎn)的數(shù)據(jù)作為實(shí)驗(yàn)樣本,如圖2所示。其中前450個(gè)數(shù)據(jù)作為訓(xùn)練樣本,后150個(gè)數(shù)據(jù)作為測試樣本用于驗(yàn)證預(yù)測結(jié)果的可靠性。
圖2 原始風(fēng)速時(shí)間序列Fig.2 Original wind speed time series
圖3 訓(xùn)練樣本序列經(jīng)EEMD分解結(jié)果Fig.3 Decomposed training pattern series by EEMD
4.2 概率預(yù)測評價(jià)指標(biāo)
概率預(yù)測的準(zhǔn)確性評估與常規(guī)點(diǎn)預(yù)測方法不同。常規(guī)點(diǎn)預(yù)測方法大多以描述風(fēng)速的預(yù)測值與實(shí)際值的誤差大小的指標(biāo)(如平均絕對誤差、平均相對誤差、平均絕對百分比誤差、均方根誤差等)作為模型評價(jià)指標(biāo),誤差越小,預(yù)測值與實(shí)際值越接近,則預(yù)測的效果越好。而風(fēng)速概率預(yù)測主要從兩個(gè)方面來評價(jià)預(yù)測方法:一是概率預(yù)測結(jié)果的可靠性,即風(fēng)速實(shí)際落在預(yù)測區(qū)間內(nèi)的概率應(yīng)等于或盡量接近事先給定的置信度;二是預(yù)測區(qū)間應(yīng)盡量窄,不確定信息盡可能集中,因?yàn)槿绻A(yù)測區(qū)間太寬(如預(yù)測區(qū)間取0到正無窮大),雖然能滿足可靠性,但對決策者是沒有意義的。本文選用4種概率預(yù)測評價(jià)指標(biāo)來分析預(yù)測結(jié)果。
1)可靠性(Reliability)[29]
(22)
式中,R(1-α)為置信度1-α下的可靠性值;N為測試樣本的個(gè)數(shù);ξ(1-α)為在置信度1-α下實(shí)際值落入預(yù)測置信區(qū)間的個(gè)數(shù)。
2)區(qū)間平均寬度(IntervalAverageWidth)[30]
(23)
3)技能分?jǐn)?shù)(SkillScore)[31]
(24)
(25)
4)期望值平均絕對百分比誤差
(26)
在上述4個(gè)評價(jià)指標(biāo)中,可靠性R用于評價(jià)置信區(qū)間的可信程度,其絕對值越小,可信程度越高;區(qū)間平均寬度IAW用于評價(jià)預(yù)測結(jié)果聚集不確定信息的能力,其值越小越好;技能分?jǐn)?shù)SC是二者的綜合評估,其值越大越好;期望值平均絕對百分比誤差MAPE用于評價(jià)預(yù)測期望值與實(shí)際值的偏差,其值越小越好。
4.3 預(yù)測結(jié)果分析
對EEMD分解后得到的各個(gè)序列分別建立GPR模型。本文采用遺傳算法進(jìn)行超參數(shù)的搜索。其中σn,l,σf,α的搜索區(qū)間依次為[0,10;0,10;0,100;0,10]。
本文所建立的EEMD-GA-GPR模型在不同置信度(以90%、70%、20%為例)下的概率預(yù)測結(jié)果分別如圖4~圖6所示。從圖中可以直觀看出:①風(fēng)速預(yù)測期望值能夠有效跟蹤風(fēng)速序列的變化;②風(fēng)速實(shí)際值絕大部分都落在90%的置信區(qū)間內(nèi),只有很少一部分落在20%的置信區(qū)間內(nèi),體現(xiàn)了本文概率預(yù)測結(jié)果的有效性;③隨著概率預(yù)測置信度的增大,置信區(qū)間的范圍變大,實(shí)際值有更大的可能落在置信區(qū)間內(nèi);④風(fēng)速變化越劇烈的時(shí)段,實(shí)際值與預(yù)測期望值偏差越大,置信區(qū)間的寬度也越大,這是因?yàn)樽兓瘎×业臄?shù)據(jù)占訓(xùn)練數(shù)據(jù)的比例小,經(jīng)模型訓(xùn)練的高斯核函數(shù)能有效表征變化相對平緩的時(shí)段,而在描述變化劇烈的風(fēng)速時(shí)誤差相對較大。
圖4 90%置信度下風(fēng)速概率預(yù)測結(jié)果Fig.4 Wind speed probabilistic forecasting results with the 90% confidence level
圖5 70%置信度下風(fēng)速概率預(yù)測結(jié)果Fig.5 Wind speed probabilistic forecasting results with the 70% confidence level
圖6 20%置信度下風(fēng)速概率預(yù)測結(jié)果Fig.6 Wind speed probabilistic forecasting results with the 20% confidence level
為了進(jìn)一步評價(jià)模型,本文采用如下4種模型進(jìn)行對比研究:①不采用前置分解算法,直接進(jìn)行預(yù)測的GA-GPR模型;②用EMD替代EEMD的EMD-GA-GPR模型;③采用共軛梯度法尋優(yōu)GPR參數(shù)的EEMD-GPR模型;④用分位點(diǎn)回歸替代改進(jìn)高斯過程回歸的EEMD-QR模型,回歸函數(shù)用支持向量機(jī)構(gòu)造。
幾種預(yù)測模型的概率預(yù)測評價(jià)結(jié)果分別如圖7、圖8和表1所示,從中可以看出:
1)EEMD-GA-GPR在不同置信度下的各項(xiàng)概率預(yù)測評價(jià)指標(biāo)基本優(yōu)于EMD-GA-GPR,而GA-GPR在五種模型中的預(yù)測效果最差,這表明采用前置分解能有效改善預(yù)測準(zhǔn)確度,并且EEMD的效果比EMD更佳。
圖7 各模型可靠性結(jié)果Fig.7 Reliability results of different models
圖8 各模型區(qū)間平均寬度結(jié)果Fig.8 Interval average width results of different models
模型EEMD-GA-GPREMD-GA-GPRGA-GPREEMD-GPREEMD-QRSC-0.173-0.217-0.346-0.231-0.189MAPE9.53%11.85%14.69%11.67%12.73%
2)EEMD-GA-GPR在不同置信度下的各項(xiàng)概率預(yù)測評價(jià)指標(biāo)優(yōu)于EEMD-GPR,證明了用遺傳算法代替共軛梯度法能解決初值選取困難和陷入局部解的缺陷,提高預(yù)測準(zhǔn)確度。
3)EEMD-GA-GPR的SC和MAPE均優(yōu)于EEMD-QR,說明本文模型無論是概率預(yù)測還是確定性預(yù)測均優(yōu)于分位點(diǎn)回歸模型。
本文還計(jì)算了各模型的時(shí)間成本。采用在程序中定義時(shí)鐘函數(shù)的方法對計(jì)算時(shí)間進(jìn)行監(jiān)測,各模型的耗時(shí)特性如表2所示(使用酷睿i5雙核3.7 GHz,內(nèi)存4 G的筆記本計(jì)算機(jī))。
表2 不同模型計(jì)算時(shí)間對比Tab.2 Comparison of calculation time by different models
從表2可以看出,EEMD-GPR用時(shí)遠(yuǎn)少于EEMD-QR,這是因?yàn)镼R需要事先設(shè)定分位點(diǎn),對每一設(shè)定的分位點(diǎn)分別求解模型,算法復(fù)雜度大于GPR。EEMD-GA-GPR用時(shí)約是EEMD-GPR的4倍,說明用GA智能算法尋優(yōu)參數(shù)是以犧牲時(shí)間成本來提高預(yù)測準(zhǔn)確度的。盡管如此,EEMD-GA-GPR用時(shí)僅243 s,其時(shí)間成本仍小于EEMD-QR。
綜上所述,本文提出的EEMD-GA-GPR模型具有較高的概率預(yù)測準(zhǔn)確度,預(yù)測準(zhǔn)確度和時(shí)間成本均優(yōu)于EEMD-QR,具有可行性。
4.4 模型魯棒性驗(yàn)證
為進(jìn)一步驗(yàn)證模型的有效性、魯棒性和優(yōu)越性,以國外某風(fēng)電場B從2008年1月至2013年1月共5 a的實(shí)測風(fēng)速數(shù)據(jù)作為樣本進(jìn)行仿真,對不同時(shí)段數(shù)據(jù)分別進(jìn)行概率預(yù)測,并基于預(yù)測結(jié)果的統(tǒng)計(jì)分析評估整體預(yù)測效果。具體為:選取實(shí)測風(fēng)速數(shù)據(jù)中連續(xù)36 000個(gè)數(shù)據(jù)點(diǎn),每600個(gè)數(shù)據(jù)點(diǎn)劃分為一個(gè)樣本子集,共得到60個(gè)子集;對每一子集分別建立EEMD-GA-GPR概率預(yù)測模型和4種對比模型進(jìn)行仿真,即對60個(gè)不同的風(fēng)速序列分別建立概率預(yù)測模型(每個(gè)模型仍取前450個(gè)數(shù)據(jù)為訓(xùn)練樣本,后150個(gè)數(shù)據(jù)為測試樣本),記錄各子集預(yù)測的技能分?jǐn)?shù)SC和期望值平均絕對百分比誤差MAPE,并統(tǒng)計(jì)出現(xiàn)的頻率。用統(tǒng)計(jì)學(xué)常用的正態(tài)分布擬合方法來擬合出各模型SC和MAPE的概率密度曲線,其中正態(tài)分布擬合的置信水平取95%。擬合結(jié)果如圖9和圖10所示。
圖9 SC概率密度分布Fig.9 Probabilistic density distribution of SC
圖10 MAPE概率密度分布Fig.10 Probabilistic density distribution of MAPE
表3為不同模型在各子集的SC和MAPE經(jīng)正態(tài)分布擬合得到的均值估計(jì)值和標(biāo)準(zhǔn)差估計(jì)值對比??梢钥闯觯疚奶岢龅腅EMD-GA-GPR模型SC估計(jì)值為-0.161,MAPE估計(jì)值為0.103,均在5種模型的概率預(yù)測評價(jià)指標(biāo)中取值最小,說明本文模型在60個(gè)不同的風(fēng)速序列場景下,概率預(yù)測結(jié)果整體優(yōu)于其他模型,驗(yàn)證了模型的有效性、魯棒性和優(yōu)越性。
表3 不同模型概率預(yù)測結(jié)果對比Tab.3 Comparison of probabilistic forecasting results by different models
提出一種基于EEMD和GA-GPR的短期風(fēng)速概率預(yù)測方法,為短期風(fēng)速概率預(yù)測提供了一種新的解決思路。經(jīng)反復(fù)實(shí)驗(yàn)和深入對比,驗(yàn)證了所提方法在短期風(fēng)速概率預(yù)測中的有效性和創(chuàng)新性。
本文所提方法在短期風(fēng)速概率預(yù)測的工程實(shí)踐中具有較好的參考價(jià)值,預(yù)測結(jié)果可應(yīng)用于電力系統(tǒng)和電力市場的諸多方面。然而,由于純粹基于歷史數(shù)據(jù),可以預(yù)見本文方法在步長和預(yù)測區(qū)間增大情況下的預(yù)測效果將可能變差。下一步的研究工作是將基于EEMD和GA-GPR的概率預(yù)測方法與數(shù)值天氣預(yù)報(bào)和物理模型相結(jié)合,不同模型優(yōu)勢互補(bǔ),豐富模型輸入,理論上可減小概率預(yù)測誤差,在確保一定預(yù)測質(zhì)量的前提下提高預(yù)測區(qū)間和步長,使得基于EEMD和GA-GPR的風(fēng)速概率預(yù)測具有更廣泛的實(shí)用價(jià)值。
[1] 雷亞洲.與風(fēng)電并網(wǎng)相關(guān)的研究課題[J].電力系統(tǒng)自動(dòng)化,2003,27(8):84-89. Lei Yazhou.Studies on wind farm integration into power system[J].Automation of Electric Power Systems,2003,27(8):84-89.
[2] 袁小明.大規(guī)模風(fēng)電并網(wǎng)問題基本框架[J].電力科學(xué)與技術(shù)學(xué)報(bào),2012,27(1):16-18. Yuan Xiaoming.The basic framework of large-scale wind power integration problems[J].Journal of Electric Power Science and Technology,2012,27(1):16-18.
[3] Kariniotakis G,Waldl I H P,Marti I,et al.Next generation forecasting tools for the optimal management of wind generation[C].Probabilistic Methods Applied top ower Systems,Stockholm,Sweden,2006:1-6.
[4] Negnevitsky M,Potter C W.Innovative short-term wind generation prediction techniques[C].Power Engineering Society General Meeting,Montreal,Canada,2006:60-65.
[5] Alexiadis M C,Dokopoulos P S,Sahsamanoglou H S.Short term forecasting of wind speed and related electrical power[J].Solar Energy,1998,63(1):61-68.
[6] 丁明,張立軍,吳義純.基于時(shí)間序列分析的風(fēng)電場風(fēng)速預(yù)測模型[J].電力自動(dòng)化設(shè)備,2005,25(8):32-34. Ding Ming,Zhang Lijun,Wu Yichun.Wind speed forecasting model based on time series analysis[J].Electric Power Automation Equipment,2005,25(8):32-34.
[7] 武小梅,白銀明,文福拴.基于RBF神經(jīng)元網(wǎng)絡(luò)的風(fēng)電功率短期預(yù)測[J].電力系統(tǒng)保護(hù)與控制,2011,39(15):80-83. Wu Xiaomei,Bai Yinming,Wen Fushuan.Short-term wind power forecast based on the Radial Basis Function neural network[J].Power System Protection and Control,2011,39(15):80-83.
[8] Kariniotakis G N,Stavrakakis G S,Nogaret E F.Wind power forecasting using advanced neural networks models[J].IEEE Transactions on Energy Conversion,1996,11(4):762-767.
[9] 修春波,任曉,李艷晴,等.基于卡爾曼濾波的風(fēng)速序列短期預(yù)測方法[J].電工技術(shù)學(xué)報(bào),2014,29(2):253-259. Xiu Chunbo,Ren Xiao,Li Yanqing,et al.Short-term prediction method of wind speed series based on Kalman filtering fusion[J].Transactions of China Electrotechnical Society,2014,29(2):253-259.
[10]Bossanyi E A.Short-term wind speed using Kalman filters[J].Wind Engineering,1985,9(1):1-7.
[11]羅文,王莉娜.風(fēng)場短期風(fēng)速預(yù)測研究[J].電工技術(shù)學(xué)報(bào),2011,26(7):68-74. Luo Wen,Wang Lina.Short-term wind speed forecasting for wind farm[J].Transactions of China Electrotechnical Society,2011,26(7):68-74.
[12]孫斌,姚海濤.基于PSO優(yōu)化LSSVM的短期風(fēng)速預(yù)測[J].電力系統(tǒng)保護(hù)與控制,2012,40(5):85-89. Sun Bin,Yao Haitao.The short-term wind speed forecast analysis based on the PSO-LSSVM predict model[J].Power System Protection and Control,2012,40(5):85-89.
[13]王松巖,于繼來.風(fēng)速與風(fēng)電功率的聯(lián)合條件概率預(yù)測方法[J].中國電機(jī)工程學(xué)報(bào),2011,31(7):7-15. Wang Songyan,Yu Jilai.Joint conditions probability forecast method for wind speed and wind power[J].Proceedings of the CSEE,2011,31(7):7-15.
[14]孫元章,吳俊,李國杰,等.基于風(fēng)速預(yù)測和隨機(jī)規(guī)劃的含風(fēng)電場電力系統(tǒng)動(dòng)態(tài)經(jīng)濟(jì)調(diào)度[J].中國電機(jī)工程學(xué)報(bào),2009,29(4):41-47. Sun Yuanzhang,Wu Jun,Li Guojie,et al.Dynamic economic dispatch considering wind power penetration based on wind speed forecasting and stochastic programming[J].Proceedings of the CSEE,2009,29(4):41-47.
[15]Barthelmie R J,Murray F,Pryor S C.The economic benefit of short-term forecasting for wind energy in the UK electricity market[J].Energy Policy,2008,36(5):1687-1696.
[16]Sloughter J M,Gneiting T,Raftery A E.Probabilistic wind vector forecasting using ensembles and Bayesian model averaging[J].Monthly Weather Review,2013,141(6):2107-2119.
[17]顏擁,文福拴,楊首暉,等.考慮風(fēng)電出力波動(dòng)性的發(fā)電調(diào)度[J].電力系統(tǒng)自動(dòng)化,2010,34(6):79-88. Yan Yong,Wen Fushuan,Yang Shouhui,et al.Generation scheduling with fluctuating wind power[J].Automation of Electric Power Systems,2010,34(6):79-88.
[18]李智,韓學(xué)山,楊明,等.基于分位點(diǎn)回歸的風(fēng)電功率波動(dòng)區(qū)間分析[J].電力系統(tǒng)自動(dòng)化,2011,35(3):83-87. Li Zhi,Han Xueshan,Yang Ming,et al.Wind power fluctuation interval analysis based on quantile regression[J].Automation of Electric Power Systems,2011,35(3):83-87.
[19]Bremnes J B.Probabilistic wind power forecasts using local quantile regression[J].Wind Energy,2004,7(1):47-54.
[20]Rasmussen C E,Williams C K I.Gaussian processes for machine learning[M].Massachusetts:The MIT Press,2006.
[21]Williams C K I.Prediction with Gaussian processes:From linear regression to linear prediction and beyond[R].Birmingham:Aston University,1997.
[22]孫斌,姚海濤,劉婷.基于高斯過程回歸的短期風(fēng)速預(yù)測[J].中國電機(jī)工程學(xué)報(bào),2012,32(29):104-109. Sun Bin,Yao Haitao,Liu Ting.Short-term wind speed forecasting based on Gaussian process regression model[J].Proceedings of the CSEE,2012,32(29):104-109.
[23]王賀,胡志堅(jiān),陳珍,等.基于集合經(jīng)驗(yàn)?zāi)B(tài)分解和小波神經(jīng)網(wǎng)絡(luò)的短期風(fēng)功率組合預(yù)測[J].電工技術(shù)學(xué)報(bào),2013,28(9):137-144. Wang He,Hu Zhijian,Chen Zhen,et al.A hybrid model for wind power forecasting based on ensemble empirical mode decomposition and wavelet neural networks[J].Transactions of China Electrotechnical Society,2013,28(9):137-144.
[24]Guindon S,Gascuel O.A simple,fast,and accurate algorithm to estimate large phylogenies by maximum likelihood[J].Systematic Biology,2003,52(5):696-704.
[25]Wu Zhaohua,Huang N E.A study of the characteristics of white noise using the empirical mode decomposition method[J].Process of the Royal Society of London Series A,2003,460(2046):1597-1611.
[26]Wu Zhaohua,Huang N E.Ensemble empirical mode decomposition:a noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009,1(1):1-41.
[27]Goldberg D E.Genetic algorithm in search,optimization and machine learning[M].New Jersey:Addison-Wesley,1989.
[28]楊世杰.動(dòng)態(tài)測試數(shù)據(jù)中壞點(diǎn)處理的一種新方法——絕對均值法及應(yīng)用研究[J].中國測試技術(shù),2006,32(1):47-49,82. Yang Shijie.A new method of removing singular points in dynamic testing data—absolute mean value method and its application study[J].China Measurement & Testing Technology,2006,32(1):47-49,82.
[29]Pinson P,Kariniotakis G.Conditional prediction intervals of wind power generation[J].IEEE Transactions on Power System,2010,25(4):1845-1856.
[30]Sideratos G,Hatziargyriou N D.Probabilistic wind power forecasting using radial basis function neural networks[J].IEEE Transactions on Power System,2012,27(4):1788-1796.
[31]Pinson P,Nielsen H,Moller J,et al.Nonparametric probabilistic forecasts of wind power:required properties and evaluation[J].Wind Energy,2007,10(6):497-516.
Short-term Wind Speed Probabilistic Forecasting Based on EEMD and Coupling GA-GPR
GanDiKeDepingSunYuanzhangCuiMingjian
(School of Electrical Engineering Wuhan University Wuhan 430072 China)
Short-term wind speed probabilistic forecasting is quite significant for grid integration of large wind energy.By now the wind speed forecasting methods are mostly point predictions,whose results cannot describe the randomness of wind energy.A hybrid probabilistic forecasting method based on ensemble empirical mode decomposition (EEMD) and genetic algorithm-Gaussian process regression (GA-GPR) is proposed.Firstly,the EEMD is used to decompose the selected and normalized wind speed time series.Then,the GPR models of each component are established,in which the conjugate gradient algorithm is replaced by GA to optimize the hyper-parameters of covariance functions.Finally,the wind speed probabilistic forecasting results are obtained via superimposing the results of each component,which are compared with the quantile regression algorithm.The simulation results show that the proposed model can enhance the prediction precision,which can be served as a reference for similar engineering projects.
Ensemble empirical mode decomposition,Gaussian process regression,genetic algorithm,wind speed,probabilistic forecasting
國家重點(diǎn)基礎(chǔ)研究發(fā)展973計(jì)劃(2012CB215101)資助項(xiàng)目。
2014-11-15 改稿日期2015-03-13
TM315
甘 迪 男,1992年生,碩士研究生,研究方向?yàn)轱L(fēng)速、風(fēng)電功率以及風(fēng)電爬坡事件的預(yù)測。(通信作者)
柯德平 男,1983年生,博士,講師,研究方向?yàn)轱L(fēng)電并網(wǎng)相關(guān)問題以及電力系統(tǒng)分析與控制。