楊 玉,牛洪海,李 兵,陳 霈,管曉晨
(南京南瑞繼保電氣有限公司,江蘇 南京 211102)
風電功率具有明顯的不確定性以及隨機性。傳統(tǒng)對風電功率預測的研究主要集中在確定性的點預測。但是點預測的誤差不可避免,且其結果不能對發(fā)電功率不確定性作出定量描述[1]。從目前電網的應用層面來看,含風電的電網規(guī)劃、運行和安全穩(wěn)定分析需要對風電功率的波動范圍有比較精確的估計,因此需要能定量反映發(fā)電功率不確定性的新預測形式來克服傳統(tǒng)點預測的缺陷。概率預測正是解決該問題的有效方式。
近年來,對風電功率概率預測的研究吸引了較多學者的關注。概率預測的建模對象通常分為兩種:風電功率和風電功率點預測誤差。第一種直接對風電功率實測數據進行建模,得到風電功率的分布。第二種先進行點預測,將點預測誤差作為建模對象,得到誤差的分布情況后嵌套至點預測結果上,形成最終的概率預測結果。常規(guī)對概率預測的研究主要基于點預測誤差,并假設預測誤差屬于正態(tài)分布[2]、指數分布[3],通過參數化的方法求出誤差分布函數,進而得到預測區(qū)間。文獻[4]使用非參數核密度估計求取預測誤差的分布。上述方法計算復雜度低,但預測結果依賴于點預測的精度,容易出現泛化能力差的問題。
直接對風電功率進行概率預測的方法有多種。文獻[5]使用bootstrap的方法對風電功率進行重采樣,并假定輸出滿足正態(tài)分布,得到最終預測區(qū)間。文獻[6]~文獻[8]分別使用聯合分位數回歸,直接分位數回歸,基于深度學習的分位數回歸建立風電功率的分位數回歸模型,并得到概率預測結果。文獻[9]采用樸素貝葉斯分類獲得風電功率的分類,并通過粒子群算法尋優(yōu)得到預測區(qū)間的加權系數。文獻[10]~文獻[11]分別將預測區(qū)間的上、下限作為極限學習機、核極限學習機的輸出,并通過粒子群尋優(yōu)得到極限學習機的輸出權重。使用風電功率自身作為建模對象,無需先進行點預測,消除了對點預測結果的依賴。本文直接對風電功率作概率預測,并在此基礎上尋求結構簡單的建模方法,以提高實用性。
對于概率預測評價指標,通常采用預測區(qū)間覆蓋率(prediction interval coverage probability,PICP)評價預測區(qū)間的可靠性、預測區(qū)間平均寬度(prediction interval normalized average width,PINAW)以及預測區(qū)間的清晰度;采用區(qū)間平均偏差指標(interval normalized average deviation,INAD),評價實際功率在未被預測區(qū)間覆蓋下偏離區(qū)間的整體程度。對于綜合評價指標,文獻[12]中提出覆蓋寬度準則(coverage width criterion,CWC),將PICP與PINAW進行分段式結合,但實際應用顯示該指標不能科學地評估概率預測的全局性能。因此,需要尋找更為合理、有效的綜合性能評價指標。
基于上述分析,本文提出一種新型的、基于集成學習的風電功率概率預測方法?;贐agging的思想,本文將極限學習機(extreme learning machine,ELM)與分位數回歸相結合,得到多個分位點的分位數回歸模型,并將其作為個體學習器。同時,為了更好地評價概率預測的結果,本文使用一種新型的綜合性能評價指標(new comprehensive index,NCI)[13]:通過灰狼優(yōu)化算法對NCI進行極大化尋優(yōu),得到各個體學習器的最優(yōu)加權系數;融合個體學習器的輸出以及加權系數,得到最終的預測區(qū)間。本文所提出的方法充分結合了多種算法優(yōu)勢,仿真對比測試驗證了其優(yōu)越性。
與傳統(tǒng)的神經網絡不同,極限學習機會隨機生成輸入權重和偏置,再通過簡單的矩陣運算即可獲得輸出權重。該方法顯著提高了學習速度、降低了計算量。
(1)
式中:g(·)為激活函數;wi為輸入變量與第i個隱藏節(jié)點間的權重,wi=[wi1,wi2,…,win];βi為第i個隱藏節(jié)點與輸出變量間的輸出權重,βi=[βi1,βi2,…,βim]T;bi為第i個隱藏節(jié)點的偏置。
對于N個訓練數據,若ELM的輸出可以近似零偏差的接近實際輸出。此時,有:
(2)
式(2)可進一步整理為:
Hβ=T
(3)
式中:H為隱藏層的輸出矩陣,可以由式(4)表示;β=[β1,β2,…,βK]T為輸出權重矩陣;T=[t1,t2,…,tN]T為輸出變量矩陣。
(4)
ELM會在開始學習時隨機生成輸入權重和偏置,并在整個學習過程保持不變。根據式(4)可知,H的值會在開始學習時確定并保持不變。ELM通過求式(3)的最小二乘解來得到最優(yōu)輸出權重β*。根據廣義逆理論,其解為:
β*=H+T
(5)
式中:H+為H矩陣的摩爾-彭洛斯(Moore-Penrose,M-P)廣義逆,通常使用奇異值分解法(singular value decomposit,SVD)獲得。
由于ELM不需要使用梯度下降法進行反復迭代,可以克服傳統(tǒng)基于梯度的神經網絡中存在的過擬合、局部最優(yōu)解等問題。同時,由于其只需要通過簡單的矩陣運算即可求解式(5),明顯減少了求解過程的計算負擔。
(6)
輸入變量與輸出變量之間的映射關系φ(·)可由式(7)表示。
ti=φ(xi,θ)
(7)
式中:θ為模型參數。
τ分位點的回歸參數的估計問題可以轉化為式(8)所示的優(yōu)化問題。
(8)
式中:ρτ(·)為檢驗函數。
(9)
根據上文ELM的推導過程可知,ELM可隨機生成輸入權重和偏置。若輸入變量值已知,式(3)中的H為確定值,待求解的輸出權重β與輸出變量間可看作是線性關系。將多入單出的ELM網絡模型代入式(8)中,即可得到極限學習機分位數回歸的目標函數:
(10)
式中:Hi為H矩陣的第i行。
目前,求解線性分位數回歸的方法主要有單純形法、內點法以及平滑算法。內點法以其運算效率高、數值穩(wěn)定等特點,得到了廣泛應用。本文使用內點法求解極限學習機分位數回歸模型。
(11)
將式(11)整理為標準的線性規(guī)劃形式:
min(cTd)s.t.Ad≤b
(12)
使用內點法對上述線性規(guī)劃進行求解,即可得到τ分位點回歸參數βτ。
(13)
傳統(tǒng)的預測區(qū)間評價指標主要包括可靠性和清晰度,本文在此基礎上使用一種新型綜合性能評價指標。
①可靠性。
(14)
式中:Ψ為測試樣本的PICP;Ntest為測試樣本的個數。
(15)
為了保證預測區(qū)間有高可靠性,PICP應當盡可能接近PINC。另外一個相關的指標為平均覆蓋誤差(average coverage error,ACE)。其定義如式(16)所示。
Λ=Ψ-Ω
(16)
式中:Λ為測試樣本的ALE,應當盡可能地接近0,以保證預測區(qū)間的可靠性;Ω為設定的PINC。
②清晰度。
當預測區(qū)間的寬度越寬,區(qū)間的可靠性就越高。但是過寬的區(qū)間在實際應用中意義不大。這是因為它并不能真正地反映輸出變量的不確定信息。因此,需引入預測區(qū)間寬度的評價指標。
(17)
(18)
每個預測輸出均可通過式(18)得到區(qū)間分數。對于全部測試數據而言,全局區(qū)間分數可通過式(19)獲得。
(19)
區(qū)間分數既考慮了預測區(qū)間的寬度,又兼顧了預測區(qū)間外的累積偏差,從而能更加合理地表述預測區(qū)間的性能。
③新型綜合性能評價指標。
在實際應用中,期望的預測區(qū)間應當是可靠性高(ACE盡可能接近0)并且區(qū)間分數較高。這對后續(xù)優(yōu)化才會更有意義。對于綜合評價指標而言,應該能夠兼顧可靠性與清晰度,并自適應地分配不同情形下考核的重點?;谏鲜瞿康?,本文中使用一種新型綜合性能評價指標[13]。其表達式如式(20)所示。
(20)
(21)
在選擇合適的η、σ后,當ACE與0偏差較小時,RIS趨近于0。此時,RIS對綜合性能指標影響較小,主要考核的為區(qū)間分數。當ACE與0偏差較大時,RIS突增。此時,RIS對綜合性能指標影響較大,主要考核的為可靠性。因此,本文使用的新型綜合性能評價指標能夠根據情況自適應地調整考核重點。
2.2.1 概率預測模型結構
集成學習可獲得優(yōu)越性能的重要條件是個體學習器的多樣性以及差異性。個體學習器多樣性的產生方式主要有3種:數據多樣性、參數多樣性與結構多樣性。
本文提出的新型概率預測模型結構如圖1所示。
圖1 新型概率預測模型結構Fig.1 Novel probabilistic prediction model structure
本文將極限學習機分位數回歸作為個體學習器,通過設定不同的分位點獲得多個個體學習器。由于極限學習機會隨機生成輸入權重和偏置,并且不同分位點回歸的目標函數不同,本文所構造的個體學習器可以滿足參數與結構多樣性,同時個體學習器間不存在強依賴關系。
根據文獻[5]的描述,假設預測輸出屬于正態(tài)分布,則滿足置信度為100(1-α)%下的預測區(qū)間可通過式(22)獲得。
(22)
(23)
(24)
(25)
2.2.2 概率預測模型求解
通過上述推導可知,加權系數的選取將會直接影響預測區(qū)間的范圍。因此,加權系數的整定將是概率預測過程中的重要一環(huán)。
概率預測模型計算流程如圖2所示。
圖2 概率預測模型計算流程圖Fig.2 Flowchart of probabilistic prediction model calculation
灰狼優(yōu)化算法由于具有收斂性強、參數少、易實現等特點,被廣泛應用于各種尋優(yōu)場景。本文采用灰狼優(yōu)化算法,通過極大化NCI得到最優(yōu)的加權系數。為了避免過擬合,本文把數據集分為Dtrain、Dvalid和Dtest這3類。
本文使用江蘇省某風電場2018年以及2019年的歷史數據進行仿真測試,參數如下。數據采樣周期為15 min。風速使用70 m測風塔采集的平均風速。風電功率使用數據采集與監(jiān)視控制(supervisory control and data acquisition,SCADA)系統(tǒng)采集的實際數據。該風場的總裝機容量為202 MW,包含37臺4 MW以及18臺3 MW的風機。
個體學習器的個數設定為19個,分位點為0.05~0.95,間隔為0.05。Dtrain包含4 000組數據,使用的是2018年7~8月份的數據。Dvalid包含480組數據。為了增加泛化能力,使用的是2019年7~8月份的數據。Dtest使用960組2019年的數據。
本文通過使用灰狼優(yōu)化算法極大化NCI,得到最優(yōu)的加權系數。在90%與80%置信度下,NCI隨迭代次數的變化曲線如圖3所示。由圖3可知,隨著迭代次數的增加,NCI逐步趨于最大值。
圖3 NCI隨迭代次數的變化曲線Fig.3 NCI veriation curves with different iteration numbers
測試數據Dtest在90%和80%置信度下的預測結果如圖4所示。
圖4 預測結果示意圖Fig.4 Schematrc diagram of prediction results
由圖4可知,預測區(qū)間較窄且區(qū)間外的點距離區(qū)間邊界也較近。
性能指標計算結果如表1所示。
表1 性能指標計算結果
計算結果顯示,ACE基本趨近于0,根據式(19)計算得到的區(qū)間分數(Score)以及式(20)計算得到的綜合性能評價指標也較高,充分說明基于本文所提出的算法可以獲得有效的預測區(qū)間。
本文中的個體學習器使用的是不同分位點的分位數回歸模型?;趥€體學習器,將本文所提出的尋優(yōu)加權融合策略與2種典型的方法進行對比。性能指標對比結果如表2所示。平均加權法是對每個個體學習器賦予相同的權重,并通過式(22)~式(25)的計算得到預測區(qū)間。直接分位法是將0.95以及0.05分位點作為90%置信度下的預測區(qū)間的上下限,0.9以及0.1分位點作為80%置信度下的預測區(qū)間的上下限。
表2 性能指標對比結果
從表2可知,平均加權法在80%置信度下,可靠性以及區(qū)間分數都比較高;但是在90%置信度下,區(qū)間分數較高但是可靠性比較差。直接分位法在90%置信度下的結果優(yōu)于平均加權法,但在80%置信度下的結果則較差。上述結果說明平均加權法以及直接分位法對不同置信度的適應性較弱,且與本文所提出的算法相比,在可靠性、區(qū)間分數以及NCI上均不占優(yōu)。該結果也充分說明多個體集成學習的優(yōu)勢以及尋優(yōu)加權的有效性。
不同算法的詳細性能指標計算結果如表3所示。
表3 不同算法的詳細性能指標計算結果
基于Bootstrap的極限學習機(Bootstrap extreme learning machine,BELM)算法首先使用Bootstrap對訓練數據進行重采樣,然后通過ELM建立每一組采樣數據的模型,最后假定輸出滿足正態(tài)分布,以得到預測區(qū)間?;诜菂岛嗣芏裙烙?kernel density estimation,KDE)算法首先對風電功率進行點預測,然后對點預測誤差進行非參數核密度估計,最后與點預測結果相結合得到預測區(qū)間。KDE算法依賴于點預測的精度,而通過訓練數據得到的預測誤差分布通常并不適用于測試數據。由表3可知,KDE算法的可靠性雖然較高但是預測區(qū)間較寬,所以對應的NCI較小、得到的預測區(qū)間有效性較弱。對于BELM算法,90%置信度下與KDE算法的區(qū)間分數相似但可靠性較差,80%置信度下的結果整體優(yōu)于KDE算法。由于Bootstrap采用隨機抽樣,所以最終得到的結果容易出現不穩(wěn)定的情況。結合表1的計算結果,本文提出的算法在各項指標上均優(yōu)于上述2種算法,能夠在確保高可靠性的同時,獲得較窄的預測區(qū)間。這也進一步說明了基于新型綜合評價指標優(yōu)化后的預測區(qū)間更加有效。
為了獲取有效的風電功率概率預測結果,本文提出一種新型的基于集成學習的概率預測方法,其主要特點如下。
①充分利用極限學習機的快速學習以及較強的泛化能力,有效地獲得分位數回歸模型。
②使用了新型的綜合性能評價指標,能夠根據不同情況自適應地調整考核重點,從而更加合理地兼顧可靠性和清晰度。
③提出了新型基于集成學習的概率預測模型結構?;谛滦途C合性能評價指標,通過灰狼優(yōu)化算法得到加權系數,充分融合了多種算法優(yōu)勢。
本文利用風電場實際運行數據進行了仿真研究和對比分析。結果表明,本文方法可提供更為有效的預測區(qū)間,綜合性能具有明顯優(yōu)勢,能夠為電網的安全、穩(wěn)定運行提供有效的數據支撐。