李知藝,丁劍鷹,吳 迪,文福拴
(1.浙江大學(xué) 電氣工程學(xué)院,浙江 杭州 310027;2.廣東省粵電集團(tuán)有限公司,廣東 廣州 510630)
電力負(fù)荷預(yù)測,尤其是短期和超短期預(yù)測,是現(xiàn)代電力系統(tǒng)運(yùn)行的基礎(chǔ),其預(yù)測精度對系統(tǒng)的安全經(jīng)濟(jì)運(yùn)行具有重要影響[1]。其中,短期預(yù)測是對未來一日或幾日每個(gè)采樣點(diǎn)(每日等時(shí)間隔采樣24,48或96次)用電負(fù)荷的預(yù)測,因此也稱為日度預(yù)測[2]。超短期負(fù)荷預(yù)測是對當(dāng)前時(shí)段往后一個(gè)或幾個(gè)時(shí)間點(diǎn)(每個(gè)時(shí)間點(diǎn)間隔5,10,15或30 min)用電負(fù)荷的預(yù)測,因此也稱為時(shí)分預(yù)測[2]。
為準(zhǔn)確預(yù)測短期和超短期負(fù)荷,國內(nèi)外很多學(xué)者做了大量研究工作,提出了回歸分析法[3]、人工神經(jīng)元網(wǎng)絡(luò)法[4]、支持向量機(jī)法[5]、灰色模型法[6]等諸多方法。然而,這些方法都只能得到確定性的點(diǎn)預(yù)測結(jié)果,由于預(yù)測過程中存在的不確定因素,得到的預(yù)測結(jié)果一般都有不同程度的誤差。
隨著電力系統(tǒng)負(fù)荷特性趨于復(fù)雜,負(fù)荷預(yù)測難度隨之增加,而另一方面電力系統(tǒng)運(yùn)行對負(fù)荷預(yù)測結(jié)果的準(zhǔn)確性的要求不斷提高,傳統(tǒng)的點(diǎn)預(yù)測方法越來越難以滿足電力系統(tǒng)運(yùn)行的實(shí)際需求。在此背景下,區(qū)間預(yù)測方法逐步受到重視。區(qū)間預(yù)測方法可以對由不確定性因素引起的預(yù)測結(jié)果變動(dòng)范圍進(jìn)行量化,實(shí)際負(fù)荷觀測值以一定期望概率落在區(qū)間上、下界確定的預(yù)測區(qū)間內(nèi),可用于電力系統(tǒng)短期和超短期負(fù)荷預(yù)測,得到合理的預(yù)測區(qū)間[7]。
現(xiàn)有的區(qū)間預(yù)測方法普遍存在計(jì)算復(fù)雜、假設(shè)性強(qiáng)、預(yù)測時(shí)間長等問題[8,9],因此有必要尋求更加簡單高效的方法來構(gòu)建預(yù)測區(qū)間。以電力系統(tǒng)短期和超短期負(fù)荷預(yù)測為應(yīng)用背景,本文對區(qū)間預(yù)測技術(shù)進(jìn)行了新的探索,以極限學(xué)習(xí)機(jī)點(diǎn)預(yù)測模型為基礎(chǔ),提出了比例系數(shù)法,并用實(shí)際數(shù)據(jù)說明了該方法的預(yù)測性能。
極限學(xué)習(xí)機(jī)(Extreme Learning Machine)是單隱含層前向神經(jīng)網(wǎng)絡(luò)的一種學(xué)習(xí)算法,網(wǎng)絡(luò)結(jié)構(gòu)如附錄圖1所示(略)。該算法只需設(shè)定隱含層節(jié)點(diǎn)數(shù)以確定網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)的輸出權(quán)值能由隨機(jī)產(chǎn)生的隱含層節(jié)點(diǎn)學(xué)習(xí)參數(shù)直接解析確定而無需迭代調(diào)整,網(wǎng)絡(luò)訓(xùn)練速度極快。同時(shí),該算法能保證在已有條件下網(wǎng)絡(luò)訓(xùn)練誤差最小且由解析獲得的輸出權(quán)值范數(shù)最小,因此具備比常規(guī)單隱含層神經(jīng)網(wǎng)絡(luò)更好的泛化能力[10]。
極限學(xué)習(xí)機(jī)算法的主要思想如下所述:
可以證明[12],如果隱含層節(jié)點(diǎn)個(gè)數(shù)l與訓(xùn)練樣本個(gè)數(shù)N相等,則任取隱含層節(jié)點(diǎn)的學(xué)習(xí)參數(shù)(下文簡稱學(xué)習(xí)參數(shù))aj∈ ?n,bj∈ ? (j=1,2,…,l),該網(wǎng)絡(luò)都能夠以零誤差逼近訓(xùn)練樣本,即此時(shí)有:
上述N個(gè)等式可以表示為如下矩陣形式:
式中:
當(dāng)訓(xùn)練集樣本個(gè)數(shù)很大時(shí),為了減少計(jì)算量,l通常取比N小的數(shù),在這種情況下,極限學(xué)習(xí)機(jī)算法在訓(xùn)練前隨機(jī)選擇學(xué)習(xí)參數(shù)aj∈?n,bj∈? (j=1,2,…,l)且在訓(xùn)練過程中保持不變。訓(xùn)練這個(gè)網(wǎng)絡(luò)等同于求解以β為變量的線性系統(tǒng)Hβ =T 的最小二乘解[13],即
其解為
式中:H+為隱含層輸出矩陣H的摩爾-彭洛斯(Moore-Penrose)廣義逆矩陣,可以通過正交投影法或奇異值分解法等方法[14]解析獲取。
和聲搜索(Harmony Search)算法是一種新興的具備全局搜索能力的智能優(yōu)化算法[15]。這種算法模擬了樂隊(duì)演奏時(shí)樂師們尋求美妙和聲狀態(tài)的過程,具有程序?qū)崿F(xiàn)簡單、求解速度快、尋優(yōu)能力強(qiáng)等優(yōu)點(diǎn)。對于一些工程優(yōu)化問題,其算法性能比一些常規(guī)智能優(yōu)化算法(如遺傳算法和模擬退火方法法)更加有效[16,17]。
和聲搜索算法包括下述特征參數(shù):a.和聲記憶庫規(guī)模(Harmony Memory Size),SHM,即和聲記憶庫(Harmony Memory)能存放的解向量數(shù)目,和聲記憶庫在迭代過程中保持與外部信息交換更新,保證庫內(nèi)存放解向量的多樣性和較優(yōu)性;b.和聲記憶庫內(nèi)取值率(Harmony Memory Considering Rate),RHM,其值決定迭代過程中和聲記憶庫內(nèi)搜索解向量的概率,較高的RHM值將保證待搜索的解向量能充分繼承庫內(nèi)較優(yōu)解的相應(yīng)信息;c.音調(diào)調(diào)節(jié)率(Pitch Adjusting Rate),PHM,和音調(diào)調(diào)節(jié)帶寬bHM,通過適當(dāng)設(shè)置PHM和bHM可使解向量跳出局部最優(yōu)值,提高全局搜索能力;(4)創(chuàng)作次數(shù) (Number of Improvisations),NHM,即算法的最大迭代次數(shù),通常作為判定算法是否需要終止的條件參數(shù)。具體實(shí)現(xiàn)過程如下所述[18,19]:
STEP 1設(shè)置算法參數(shù)與初始化和聲記憶庫定義優(yōu)化問題的目標(biāo)函數(shù)f(·)、解向量維數(shù)DHM及變量取值范圍,并設(shè)置算法的特征參數(shù),即SHM,RHM,PHM,bHM和 NHM。之后,在和聲記憶庫里隨機(jī)產(chǎn)生SHM個(gè)初始解z1,z2,…,zSHM并計(jì)算相應(yīng)目標(biāo)函數(shù)值f(z1),f(z2),…,f(zSHM)。
STEP 2生成新的解向量
STEP 3評估新生成的解向量
對STEP 2生成的解向量進(jìn)行評估,即將zNEW對應(yīng)的目標(biāo)函數(shù)值f(zNew)與和聲記憶庫內(nèi)已有解向量的最劣目標(biāo)函數(shù)值f(zWorst)進(jìn)行比較,如果優(yōu)于f(zWorst),則將新生成的解向量存入記憶庫并替換出f(zWorst)對應(yīng)的解向量。
STEP 4判定是否滿足終止條件
重復(fù)STEP 2和STEP 3,直至迭代次數(shù)i達(dá)到NHM。同時(shí),為提高該算法的全局尋優(yōu)能力和魯棒性,在迭代過程中對RHM和PHM進(jìn)行自適應(yīng)取值,使得算法在迭代初期以較高概率搜索到相對較優(yōu)解,并能在迭代后期擴(kuò)大搜索范圍,避免陷入局部最優(yōu)解。自適應(yīng)取值的數(shù)學(xué)表達(dá)式為[20]
區(qū)間覆蓋率 (Coverage Probability),χCP,是衡量預(yù)測區(qū)間質(zhì)量的最關(guān)鍵指標(biāo),其定義了實(shí)際觀測值(下文簡稱觀測值)落在由上下界包絡(luò)的預(yù)測區(qū)間內(nèi)的概率。χCP值越大表示有越多的觀測值被構(gòu)建的預(yù)測區(qū)間所覆蓋,反之亦然。在理想情況下,χCP=100%,此時(shí)所有的觀測值都位于預(yù)測區(qū)間內(nèi)。
通常,期望觀測值以不低于額定置信水平的一定概率p落在所構(gòu)建的預(yù)測區(qū)間內(nèi),即
式中:P(·)表示概率;L(xi)和U(xi)分別是由xi預(yù)測得到的預(yù)測區(qū)間下界和上界;ti為與xi對應(yīng)的觀測值;μ為額定置信水平,其與顯著性水平γ的關(guān)系為
根據(jù)伯努利大數(shù)定律,可以直接用預(yù)測區(qū)間覆蓋觀測值的頻率來表示χCP,其將依概率收斂于p,即
式中:N為預(yù)測樣本的個(gè)數(shù),ci為布爾量
為構(gòu)建有效的預(yù)測區(qū)間,χCP應(yīng)高于額定置信水平μ;如果χCP遠(yuǎn)小于μ,則該預(yù)測區(qū)間視作無效區(qū)間,需重新構(gòu)建。
預(yù)測區(qū)間寬度是評估預(yù)測區(qū)間質(zhì)量的重要參考依據(jù)。如果區(qū)間足夠?qū)?,則很容易滿足χCP=100%的理想?yún)^(qū)間覆蓋率,然而這樣的區(qū)間過于保守,并不能給出關(guān)于待預(yù)測值不確定性的有效信息,使得區(qū)間預(yù)測的結(jié)果沒有實(shí)用價(jià)值[21]。為了更合理地評價(jià)預(yù)測區(qū)間,還需要度量區(qū)間寬度。定義平均寬度百分比 (Mean Width Percentage)指標(biāo)χMWP如式(14):
該指標(biāo)度量了每個(gè)待預(yù)測點(diǎn)的預(yù)測區(qū)間寬度占觀測值的平均百分比。需要指出,以相對寬度來度量預(yù)測區(qū)間往往比絕對寬度更具實(shí)用價(jià)值。在負(fù)荷預(yù)測問題中,用電高峰時(shí)的負(fù)荷往往難以準(zhǔn)確預(yù)測,預(yù)測區(qū)間理應(yīng)較寬,而用電低谷時(shí)的預(yù)測準(zhǔn)確度相對較高,預(yù)測區(qū)間相對較窄,因此以絕對寬度評估高峰和低谷負(fù)荷預(yù)測區(qū)間并不能準(zhǔn)確反映預(yù)測區(qū)間的優(yōu)劣。預(yù)測區(qū)間寬度一般與觀測值大小呈正相關(guān),借助χMWP能對區(qū)間寬度做出更準(zhǔn)確評價(jià)。在極端條件下,N個(gè)待預(yù)測點(diǎn)的預(yù)測區(qū)間上下界都相同,則預(yù)測區(qū)間寬度全都為零,此時(shí)區(qū)間預(yù)測退化為點(diǎn)預(yù)測,關(guān)于預(yù)測區(qū)間的評估指標(biāo)就失去實(shí)際意義。本文嚴(yán)格區(qū)分點(diǎn)預(yù)測和區(qū)間預(yù)測,定義預(yù)測區(qū)間均需滿足xMWP≠0。
已有關(guān)于區(qū)間預(yù)測的研究普遍采用了χCP和類似 χMWP的指標(biāo)[9,21~27],但僅靠這兩個(gè)指標(biāo)并不能完全評估所構(gòu)建預(yù)測區(qū)間的優(yōu)劣。以圖1為例對此進(jìn)行說明。子圖(a)和(b)為對同一待測數(shù)據(jù)集構(gòu)建預(yù)測區(qū)間的兩種不同情況,可以看出兩個(gè)區(qū)間的χCP和χMWP的值均相同,但未被預(yù)測區(qū)間覆蓋的兩個(gè)真實(shí)數(shù)據(jù)偏離預(yù)測區(qū)間上界(或下界)的程度不同,子圖(a)中兩點(diǎn)的偏離程度明顯大于圖(b)中兩點(diǎn),故一般認(rèn)為子圖(b)的預(yù)測區(qū)間要優(yōu)于子圖(a)。然而,現(xiàn)有的評估指標(biāo)體系并不能將這兩個(gè)區(qū)間的優(yōu)劣做出評判,往往將兩個(gè)區(qū)間視為等效區(qū)間。這里引入一個(gè)新指標(biāo),即累積偏差(Accumulated Deviation),χAD,計(jì)算式為
式中:εi表示觀測值偏離預(yù)測區(qū)間上界(或下界)的程度,表示為
與χMWP類似,也采用相對偏離程度來確定χAD。在相同χCP和χMWP的條件下,χAD越小則預(yù)測區(qū)間質(zhì)量一般越高。
圖1 兩類預(yù)測區(qū)間比較示意圖Fig.1 Comparison between two kinds of prediction intervals
χCP,χMWP和χAD3個(gè)指標(biāo)相互獨(dú)立,都只考慮了預(yù)測區(qū)間的某一性質(zhì),依據(jù)任何一個(gè)或兩個(gè)指標(biāo)都不能對預(yù)測區(qū)間做出完全而準(zhǔn)確的評估。理想的預(yù)測區(qū)間需要在滿足置信水平符合要求(χCP盡量大)的同時(shí),區(qū)間寬度和未覆蓋點(diǎn)偏離程度盡量小(即 χMWP和 χAD盡量小)。然而,由 χCP,χMWP和χAD的定義可知,這3個(gè)指標(biāo)實(shí)際上是相互沖突的:χCP越大,往往 χMWP越大;χMWP越小,往往χCP越小而χAD越大;χAD越小,往往χMWP越大。因此,需要綜合考慮這3個(gè)指標(biāo)。這里提出能對預(yù)測區(qū)間進(jìn)行量化評估的綜合指標(biāo),即預(yù)測區(qū)間滿意度指標(biāo) (Prediction Interval Satisfaction Index),χPISI,計(jì)算公式為
式中:λ,η和μ為χPISI的3個(gè)控制參數(shù),可以根據(jù)實(shí)際需要設(shè)定;λ和η分別為對χAD和χCP的懲罰系數(shù),μ為給定的置信水平。
如前所述,χCP是評判預(yù)測區(qū)間優(yōu)劣的最關(guān)鍵指標(biāo),一般而言在χCP不低于μ的情況下評估預(yù)測區(qū)間才有意義。實(shí)際上,χCP由有限樣本統(tǒng)計(jì)得到,其值可能會(huì)稍小于μ,此時(shí)同樣可以對相應(yīng)預(yù)測區(qū)間進(jìn)行評估[25]。附錄圖2(略)描繪了χPISI關(guān)于 χCP的函數(shù) (1+e-η·(χCP-μ)) 隨 χCP不同取值的變化規(guī)律(圖中 η =50,μ =90%)。當(dāng) χCP高于 μ時(shí),該函數(shù)走勢平緩并漸近趨于1,此時(shí)χPISI主要受χMWP和χAD影響;而當(dāng)χCP低于μ時(shí),函數(shù)值隨著χCP偏離μ而陡增,此時(shí)χCP對χPISI的計(jì)算起主導(dǎo)作用。
χPISI綜合考慮并有效結(jié)合了 χCP,χMWP和 χAD這3個(gè)指標(biāo),可以作為評判預(yù)測區(qū)間優(yōu)劣的指標(biāo)。為使χPISI更具實(shí)際意義,這里定義:當(dāng)χPISI的計(jì)算結(jié)果小于0時(shí),χPISI值取0。因此,χPISI始終在[0,100%)范圍內(nèi)取值,χPISI值越大,可認(rèn)為預(yù)測區(qū)間質(zhì)量越高。當(dāng)χCP等于100%,χAD等于0%;當(dāng)χMWP值趨近0%時(shí),χPISI值趨近100%。對于χPISI值只能無限趨近而不能達(dá)到100%這一現(xiàn)象,可以解釋為在實(shí)際預(yù)測過程中更希望得到的預(yù)測結(jié)果是確定的準(zhǔn)確值,而非可能出現(xiàn)的某個(gè)變動(dòng)區(qū)間,用“不確定”的區(qū)間預(yù)測代替“確定”的點(diǎn)預(yù)測只是對某些不確定因素的“妥協(xié)”,因此區(qū)間預(yù)測的結(jié)果永遠(yuǎn)不是最滿意(對應(yīng)χPISI=100%)的。
基于神經(jīng)網(wǎng)絡(luò)的 Bootstrap法[28]是目前應(yīng)用最廣泛的區(qū)間預(yù)測方法[21],其假設(shè)對預(yù)測模型集成后得到的點(diǎn)預(yù)測值(下文簡稱預(yù)測值)能以很小偏差(甚至無偏)估計(jì)真實(shí)回歸值(下文簡稱真實(shí)值),即觀測值的期望值,繼而以預(yù)測值為中心構(gòu)建對稱的預(yù)測區(qū)間,保證觀測值以不低于額定置信水平的概率落在此區(qū)間內(nèi)。此種假設(shè)下,預(yù)測值和預(yù)測區(qū)間如圖2(a)所示,預(yù)測值能以很小的偏差逼近真實(shí)值(甚至與真實(shí)值重合),構(gòu)建的預(yù)測區(qū)間近似于以真實(shí)值為中心對稱分布。
圖2 點(diǎn)預(yù)測值與預(yù)測區(qū)間示意圖Fig.2 Prediction point and prediction interval
理論上可以證明[29],以真實(shí)值為中心對稱的預(yù)測區(qū)間要較不對稱的預(yù)測區(qū)間更優(yōu)。實(shí)際上,真實(shí)值難以獲取,而由于數(shù)據(jù)噪聲及預(yù)測模型本身不確定性的影響,預(yù)測值很多情況下并不能作為真實(shí)值的無偏估計(jì)值。以極限學(xué)習(xí)機(jī)對短期(或超短期)負(fù)荷進(jìn)行點(diǎn)預(yù)測為例,對此進(jìn)行說明。一方面,在預(yù)測過程中選用的歷史負(fù)荷數(shù)據(jù)從SCADA系統(tǒng)獲取,而由于SCADA系統(tǒng)采集過程中的一些偏差會(huì)使所采集的負(fù)荷觀測值偏離真實(shí)值[1],因此極限學(xué)習(xí)機(jī)的輸入量和期望輸出量都能視為被數(shù)據(jù)噪聲污染的隨機(jī)變量,使得預(yù)測結(jié)果可信度降低。另一方面,極限學(xué)習(xí)機(jī)模型本身會(huì)對預(yù)測精度造成影響。預(yù)測過程中,往往難以確定最優(yōu)的特征輸入量、學(xué)習(xí)參數(shù)和網(wǎng)絡(luò)結(jié)構(gòu),而根據(jù)經(jīng)驗(yàn)選取的特征輸入量和隱含層節(jié)點(diǎn)數(shù)及隨機(jī)選取的學(xué)習(xí)參數(shù)使得模型預(yù)測性能達(dá)不到要求。即使極限學(xué)習(xí)機(jī)能零偏差學(xué)習(xí)訓(xùn)練樣本,然而由于樣本數(shù)據(jù)有限,難以保證模型對所有待預(yù)測樣本均能適用,而且訓(xùn)練樣本中往往存在“尖峰”數(shù)據(jù),為平緩這些“尖峰”,極限學(xué)習(xí)機(jī)的輸出值都會(huì)有偏離真實(shí)值趨向,導(dǎo)致預(yù)測精度達(dá)不到要求。如果由預(yù)測值估計(jì)真實(shí)值有較大偏差,此時(shí)以預(yù)測值為對稱中心構(gòu)建的預(yù)測區(qū)間很難滿足要求,如圖2(b)。
通過對數(shù)據(jù)進(jìn)行預(yù)處理(如替換異常值、非線性去噪等[30])和提高模型的預(yù)測精度和泛化能力[31],能使得預(yù)測值以更小的誤差估計(jì)真實(shí)值。然而,這些處理手段都需要靠經(jīng)驗(yàn)選取或經(jīng)過反復(fù)試錯(cuò)后找到,實(shí)際預(yù)測過程中往往難以將其全部實(shí)現(xiàn)。當(dāng)預(yù)測值估計(jì)真實(shí)值的偏差不能忽略時(shí),但是依然可以通過構(gòu)建如圖2(c)中的預(yù)測區(qū)間來抵消此偏差,此時(shí)區(qū)間并不再以預(yù)測值為中心對稱。
本文提出的方法將極限學(xué)習(xí)機(jī)(網(wǎng)絡(luò)模型如附錄圖3(略))對預(yù)測樣本(或稱預(yù)測集)的輸出值分別放大和縮小比例系數(shù)α和β得到的結(jié)果作為預(yù)測區(qū)間的上界和下界,故稱其為比例系數(shù)法。數(shù)學(xué)表達(dá)式為
式中:yi是極限學(xué)習(xí)機(jī)輸入量為xi的輸出值;U(xi)和L(xi)為對應(yīng)xi構(gòu)建的預(yù)測區(qū)間上界和下界;α和β為需要確定的兩個(gè)比例系數(shù)。
為獲得α和β并保證其能確定最優(yōu)的預(yù)測區(qū)間,假設(shè)比例系數(shù)在連續(xù)時(shí)間段內(nèi)的變化態(tài)勢是平滑的,α和β則近似于對近期歷史數(shù)據(jù)進(jìn)行事后預(yù)測并評估后確定的最優(yōu)比例系數(shù)和(對應(yīng)的事后預(yù)測區(qū)間最優(yōu))。因此,α和β可以由式(19)確定:
基于以上思想,比例系數(shù)法將近期歷史數(shù)據(jù)構(gòu)成的另一個(gè)預(yù)測樣本(稱為驗(yàn)證集),根據(jù)同一極限學(xué)習(xí)機(jī)的對應(yīng)輸出值類似式(18)構(gòu)建驗(yàn)證集預(yù)測區(qū)間,并用驗(yàn)證集觀測值對預(yù)測區(qū)間進(jìn)行評估,比例系數(shù)αValid和βValid在指定范圍內(nèi)不斷調(diào)整,直至獲得χPISI值最高的預(yù)測區(qū)間,即求解如下優(yōu)化問題:
式中: χPISI,Valid為驗(yàn)證集的 χPISI值,和分別為驗(yàn)證集比例系數(shù)αValid和βValid的指定最小值、最大值。
考慮到價(jià)值函數(shù)即“100% - χPISI,Valid”的函數(shù)形態(tài)復(fù)雜性,本文采用和聲搜索算法對αValid和βValid進(jìn)行尋優(yōu),最小價(jià)值函數(shù)對應(yīng)的和即為需要確定的比例系數(shù),根據(jù)式(18)對預(yù)測集構(gòu)建預(yù)測區(qū)間。
由于通過集成可以增加預(yù)測模型的穩(wěn)定性并且提高預(yù)測精度,比例系數(shù)法也引入了集成技術(shù)。這里首先給出兩個(gè)不同思路:
(1)將M個(gè)極限學(xué)習(xí)機(jī)對應(yīng)驗(yàn)證集和預(yù)測集的輸出值取中位值,以期望獲得更精確的預(yù)測值y*(xi),即
式中:median{·}表示取中位數(shù)。
(2)驗(yàn)證集根據(jù)要集成的第k個(gè)極限學(xué)習(xí)機(jī)對應(yīng)輸出值確定一組比例系數(shù)和,隨后預(yù)測集根據(jù)同個(gè)極限學(xué)習(xí)機(jī)對應(yīng)輸出值yk(xi)構(gòu)建一組區(qū)間上下界Uk(xi)和Lk(xi),即
最后對所得的M個(gè)區(qū)間進(jìn)行集成,分別取區(qū)間上、下界的中位值作為最終預(yù)測區(qū)間上、下界U*(xi)和L*(xi),即
以上兩種思路均能反映比例系數(shù)法的主要思想,由于比例系數(shù)法本質(zhì)上不嚴(yán)格區(qū)分預(yù)測值偏離真實(shí)值的程度,而每組預(yù)測值均能對應(yīng)一個(gè)高質(zhì)量的預(yù)測區(qū)間(如圖2(a)和圖2(c)),從統(tǒng)計(jì)角度而言,思路(2)能以更高概率找到最優(yōu)區(qū)間,因此本文采用的是思路(2)的方案。
此外,由于極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)結(jié)構(gòu)取決于隱含層節(jié)點(diǎn)個(gè)數(shù),如果節(jié)點(diǎn)過少,則會(huì)導(dǎo)致模型學(xué)習(xí)能力有限,影響預(yù)測結(jié)果的精度,如果節(jié)點(diǎn)過多,則容易導(dǎo)致“過擬合”,影響模型的泛化能力。同時(shí),由于極限學(xué)習(xí)機(jī)隨機(jī)選取隱含層節(jié)點(diǎn)學(xué)習(xí)參數(shù),不同的參數(shù)將對應(yīng)不同的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),即其最優(yōu)隱含層節(jié)點(diǎn)數(shù)不是一個(gè)固定值,而是在某個(gè)區(qū)間變動(dòng)。因此,比例系數(shù)法集成的極限學(xué)習(xí)機(jī),在指定區(qū)間內(nèi)選取隱含層節(jié)點(diǎn)數(shù),以增加網(wǎng)絡(luò)結(jié)構(gòu)的多樣性使集成的結(jié)果更穩(wěn)定[32]。
附錄圖4(略)給出了使用比例系數(shù)法對負(fù)荷進(jìn)行區(qū)間預(yù)測的實(shí)現(xiàn)流程,具體步驟如下所述:
STEP 1選取特征輸入量,構(gòu)造訓(xùn)練集和驗(yàn)證集
選取歷史負(fù)荷數(shù)據(jù)劃分訓(xùn)練集和驗(yàn)證集,并根據(jù)訓(xùn)練集負(fù)荷數(shù)據(jù)特性確定極限學(xué)習(xí)機(jī)特征輸入量 xi=[xi1,xi2,…,xin]T∈ ?n。
STEP 2確定隱含層節(jié)點(diǎn)數(shù)最優(yōu)選取區(qū)間
選取不同隱含層節(jié)點(diǎn)數(shù)的極限學(xué)習(xí)機(jī)學(xué)習(xí)訓(xùn)練集數(shù)據(jù),隨后對驗(yàn)證集進(jìn)行區(qū)間預(yù)測,根據(jù)χPISI對所得預(yù)測區(qū)間進(jìn)行評估,確定隱含層節(jié)點(diǎn)最優(yōu)選擇區(qū)間(下文簡稱選擇區(qū)間)。
STEP 3訓(xùn)練極限學(xué)習(xí)機(jī),對驗(yàn)證集和預(yù)測集進(jìn)行點(diǎn)預(yù)測
從選擇區(qū)間隨機(jī)選取隱含層節(jié)點(diǎn)數(shù)并從指定范圍內(nèi)選取相應(yīng)網(wǎng)絡(luò)結(jié)構(gòu)的學(xué)習(xí)參數(shù),使用訓(xùn)練集數(shù)據(jù)對極限學(xué)習(xí)機(jī)進(jìn)行訓(xùn)練。使用訓(xùn)練過的極限學(xué)習(xí)機(jī)對驗(yàn)證集和預(yù)測集分別進(jìn)行點(diǎn)預(yù)測。
STEP 4確定比例系數(shù)
使用和聲搜索算法在給定范圍內(nèi)尋找能使驗(yàn)證集χPISI最大的α和β,根據(jù)尋優(yōu)得到的最優(yōu)比例系數(shù)計(jì)算預(yù)測集的預(yù)測區(qū)間上下界,并將此結(jié)果保存。
STEP 5判定是否完成集成
判定集成的極限學(xué)習(xí)機(jī)個(gè)數(shù)是否已達(dá)到給定集成數(shù)M,如果沒有達(dá)到M,則重復(fù)STEP 3和STEP 4。
STEP 6確定預(yù)測集預(yù)測區(qū)間
取預(yù)測集在集成過程中得到的M個(gè)上、下界結(jié)果的中位值,分別作為所要構(gòu)建預(yù)測區(qū)間的上、下界。
為驗(yàn)證比例系數(shù)法應(yīng)用于負(fù)荷預(yù)測的正確性和有效性,本文選取2007年度浙江某城市冬季和夏季的兩個(gè)典型月(即1月和7月)實(shí)際用電負(fù)荷數(shù)據(jù)為樣本,分別進(jìn)行短期預(yù)測和超短期預(yù)測研究。其中,短期預(yù)測的對象是次日全天96點(diǎn)負(fù)荷觀測值(從0:00至23:45每隔15 min進(jìn)行一次采樣,共計(jì)96個(gè)采樣點(diǎn)),超短期預(yù)測則對下一采樣點(diǎn)(時(shí)間間隔為15 min)的負(fù)荷觀測值進(jìn)行在線預(yù)測。由于高比重的取暖(或空調(diào))負(fù)荷以及節(jié)假日的影響,這兩個(gè)月的用電負(fù)荷并無明顯的變化規(guī)律(如日類型)可遵循,常規(guī)的點(diǎn)預(yù)測方法很難滿足實(shí)際需求,因此對其進(jìn)行區(qū)間預(yù)測更為合理。
將1月和7月由日96點(diǎn)負(fù)荷數(shù)據(jù)組成的樣本集根據(jù)時(shí)間先后順序分別以70% ~20% ~10%的比例劃分為3個(gè)互不重疊的樣本子集:訓(xùn)練集、驗(yàn)證集和預(yù)測集,劃分結(jié)果見附錄表1(略)。此外,本文研究過程中以日為窗口單元對訓(xùn)練集和驗(yàn)證集進(jìn)行滾動(dòng)更新,如附錄圖5(略)。
由于選取合適的特征輸入量能提高極限學(xué)習(xí)機(jī)的預(yù)測精度,而這2個(gè)月負(fù)荷特性較為復(fù)雜,很難根據(jù)經(jīng)驗(yàn)選取合適的特征輸入量,因此借助于ARIMA(Autoregressive Integrated Moving Average model)中的偏自相關(guān)函數(shù)來幫助選取特征輸入量。對訓(xùn)練集歷史負(fù)荷數(shù)據(jù)構(gòu)成的時(shí)間序列進(jìn)行偏自相關(guān)分析,選取偏自相關(guān)系數(shù)最大的5個(gè)“已知”負(fù)荷數(shù)據(jù)作為特征輸入量 xi1,xi2,xi3,xi4和xi5。選取結(jié)果見附錄表2(略)。由于負(fù)荷數(shù)值落在神經(jīng)元的有效區(qū)間外將引起神經(jīng)元的飽和,需要將所有負(fù)荷數(shù)據(jù)歸一化到區(qū)間[-1,1],并對最終預(yù)測結(jié)果進(jìn)行相應(yīng)的反歸一化。
為增強(qiáng)極限學(xué)習(xí)機(jī)的學(xué)習(xí)能力,使之辨識(shí)不同時(shí)刻的負(fù)荷值,增加與各采樣點(diǎn)時(shí)標(biāo)相關(guān)的特征輸入量xi6,xi7,并按如下規(guī)則進(jìn)行編碼:
式中:k為與各采樣點(diǎn)對應(yīng)的時(shí)標(biāo)(k=1,2,…,96)。
在此編碼規(guī)則下,各采樣點(diǎn)的時(shí)標(biāo)能由xi6和xi7聯(lián)合確定,且由于xi6和xi7均在區(qū)間[-1,1]內(nèi)取值,所以無需再對其進(jìn)行歸一化。
極限學(xué)習(xí)機(jī)隱含層節(jié)點(diǎn)選為加法型節(jié)點(diǎn),激活函數(shù)為Sigmoid函數(shù),輸入權(quán)值和閾值均從[-1,1]范圍內(nèi)隨機(jī)選取。附錄表3(略)和附錄表4(略)分別給出了和聲搜索算法和χPISI的特征參數(shù)值以及隱含層節(jié)點(diǎn)數(shù)和比例系數(shù)的選擇區(qū)間。附錄圖6(略)描繪了對1月負(fù)荷進(jìn)行超短期預(yù)測時(shí),驗(yàn)證集價(jià)值函數(shù)值在和聲搜索過程中的典型演變情況。
將比例系數(shù)法與文獻(xiàn)[33]總結(jié)的配對自助法(Pairs Bootstrap)進(jìn)行比較,其中配對自助法實(shí)驗(yàn)過程中不區(qū)分訓(xùn)練集和驗(yàn)證集,集成數(shù)均取100。為消除算法的隨機(jī)性,重復(fù)實(shí)驗(yàn)10次,預(yù)測區(qū)間按日進(jìn)行劃分并用實(shí)際觀測值對當(dāng)日預(yù)測區(qū)間進(jìn)行評估,將所得χPISI的中位值對應(yīng)的預(yù)測區(qū)間取為最終結(jié)果。表1和表2分別比較了比例系數(shù)法和配對自助法的超短期和短期區(qū)間預(yù)測結(jié)果。圖3和圖4給出了比例系數(shù)法對1月負(fù)荷進(jìn)行超短期和短期區(qū)間預(yù)測的結(jié)果,7月的相應(yīng)結(jié)果請見附錄圖7(略)和附錄圖8(略)。配對自助法的短期區(qū)間預(yù)測結(jié)果如附錄圖9(略)和附錄圖10(略)所示。
(1)超短期預(yù)測結(jié)果及分析
從表1中容易看出,比例系數(shù)法確定的預(yù)測區(qū)間的χPISI基本都要高于配對自助法,且χPISI能基本穩(wěn)定在一個(gè)較高水平(1月為94%,7月為96%),而后者的χPISI波動(dòng)較大(1月波動(dòng)幅度約10%,7月波動(dòng)幅度約3%)。比例系數(shù)法構(gòu)建預(yù)測區(qū)間過程中,和聲搜索算法尋優(yōu)得到的比例系數(shù)結(jié)果典型值為:1月=0.0224,=0.0265,7 月=0.0183,=0.0175,可以推知,預(yù)測值可以作為真實(shí)值的近似無偏估計(jì)值,使得預(yù)測區(qū)間近似以預(yù)測值為中心對稱。此時(shí),使用配對自助法同樣可以獲得較為滿意的結(jié)果。
(2)短期預(yù)測結(jié)果及分析
從表2中數(shù)據(jù)容易得知,比例系數(shù)法確定的預(yù)測區(qū)間的χPISI要遠(yuǎn)比配對自助法穩(wěn)定,后者甚至出現(xiàn)了χPISI=0的情況。比例系數(shù)法構(gòu)建預(yù)測區(qū)間過程中,和聲搜索算法尋優(yōu)得到的比例系數(shù)結(jié)果典型值為:1月= 0.0433,=0.0825,7月=0.1108,=0.0595,此時(shí)預(yù)測區(qū)間不再以預(yù)測值為中心對稱,由預(yù)測值估計(jì)真實(shí)值將導(dǎo)致較大偏差。因此,基于預(yù)測值能夠無偏估計(jì)真實(shí)值的假設(shè)的配對自助法并不能給出可信的預(yù)測區(qū)間。此時(shí),配對自助法確定的1月和7月的預(yù)測區(qū)間由于預(yù)測值估計(jì)真實(shí)值時(shí)分別上偏和下偏,導(dǎo)致獲得的預(yù)測區(qū)間也相應(yīng)上偏和下偏,均不能很好的覆蓋全部觀測值,而比例系數(shù)法通過控制αValid和βValid的取值,通過構(gòu)建不對稱的預(yù)測區(qū)間,對預(yù)測值估計(jì)真實(shí)值的偏差進(jìn)行了修正,依然可以獲得較為滿意的結(jié)果。
與超短期預(yù)測結(jié)果類似,短期預(yù)測時(shí)雖然比例系數(shù)法確定的區(qū)間χMWP要高于配對自助法,但前者往往能夠獲得更高的χCP和χAD,使得χPISI也更高,因此前者構(gòu)建的預(yù)測區(qū)間質(zhì)量也往往更高。此外,短期預(yù)測時(shí),預(yù)測區(qū)間χMWP明顯大于超短期預(yù)測時(shí)的對應(yīng)值,這一現(xiàn)象符合區(qū)間預(yù)測的特征,即不確定性越大,預(yù)測區(qū)間結(jié)果將越保守,此時(shí)預(yù)測區(qū)間也就越寬。本文研究中為更好地反映負(fù)荷預(yù)測的不確定性,在短期預(yù)測時(shí),并未計(jì)入氣象因素的影響。在條件允許的情況下,增加相關(guān)的氣象因素(主要是溫度)為特征輸入量將有助于提高預(yù)測準(zhǔn)確度,進(jìn)而降低預(yù)測區(qū)間的χMWP。
如果實(shí)際生產(chǎn)運(yùn)行過程中需要待預(yù)測日的確定性點(diǎn)預(yù)測值,則可以將由預(yù)測區(qū)間上下界確定的區(qū)間中值作為點(diǎn)預(yù)測值,即
式中:yi和xi分別為待預(yù)測日第i個(gè)時(shí)刻的點(diǎn)預(yù)測值和極限學(xué)習(xí)機(jī)輸入量;L(xi)和U(xi)為與xi對應(yīng)的預(yù)測區(qū)間下界和上界。
對由比例系數(shù)法和配對自助法得到的預(yù)測區(qū)間分別由式(26)確定點(diǎn)預(yù)測值,并根據(jù)文獻(xiàn)[34]提供的評價(jià)點(diǎn)預(yù)測結(jié)果的日負(fù)荷預(yù)測準(zhǔn)確率A的計(jì)算公式進(jìn)行評估:
表3對兩個(gè)方法確定的點(diǎn)預(yù)測結(jié)果進(jìn)行了比較。比例系數(shù)法確定的點(diǎn)預(yù)測值在多數(shù)情況下比配對自助法的結(jié)果準(zhǔn)確率更高,而后者得到的點(diǎn)預(yù)測值本質(zhì)上是對集成的多個(gè)極限學(xué)習(xí)機(jī)輸出值取平均值后的結(jié)果??梢酝浦?,負(fù)荷預(yù)測的不確定性較大時(shí),依然可以通過由比例系數(shù)法構(gòu)造的預(yù)測區(qū)間中值來獲得較高準(zhǔn)確率的點(diǎn)預(yù)測值。
表1 超短期負(fù)荷區(qū)間預(yù)測結(jié)果Tab.1 Results of ultra-short-term load interval prediction
表2 短期負(fù)荷區(qū)間預(yù)測結(jié)果對比Tab.2 Results of short-term load interval prediction
圖3 超短期負(fù)荷區(qū)間預(yù)測結(jié)果(1月)Fig.3 Results of ultra-short-term load interval prediction in January
圖4 短期負(fù)荷區(qū)間預(yù)測結(jié)果(1月)Fig.4 Results of short-term load interval prediction in January
表3 日負(fù)荷預(yù)測準(zhǔn)確率Tab.3 Daily load forecasting accuracy
負(fù)荷區(qū)間預(yù)測的結(jié)果,可以使電力系統(tǒng)決策人員更好地認(rèn)識(shí)到未來負(fù)荷的不確定性及相關(guān)的風(fēng)險(xiǎn)信息,使其及時(shí)做出更加合理的決策[35]。本文提出的比例系數(shù)法簡單高效,適用范圍廣,能夠構(gòu)建高質(zhì)量的預(yù)測區(qū)間。當(dāng)預(yù)測值能近似無偏估計(jì)真實(shí)值時(shí),構(gòu)建的預(yù)測區(qū)間近似以預(yù)測值為中心對稱且區(qū)間寬度小。當(dāng)由預(yù)測值估計(jì)真實(shí)值存在較大偏差時(shí),預(yù)測區(qū)間則不再對稱且區(qū)間寬度大。最后需要指出,比例系數(shù)法的主要思想并不局限于超短期和短期負(fù)荷預(yù)測,在其他領(lǐng)域(如風(fēng)電和水文預(yù)測)同樣具有很好的應(yīng)用前景。
(因篇幅所限附錄略,如讀者需要可與作者聯(lián)系)
[1]何洋,鄒波,李文啟,等.基于混沌理論的電力系統(tǒng)短期負(fù)荷預(yù)測的局域模型[J].華北電力大學(xué)學(xué)報(bào) (自然科學(xué)版),2013,40(4):43-50.
[2]鄭金.短期電力負(fù)荷預(yù)測方法研究[D].鄭州:鄭州大學(xué),2012.
[3]汪峰,于爾鏗,閻承山,等.基于因素影響的電力系統(tǒng)短期負(fù)荷預(yù)報(bào)方法的研究[J].中國電機(jī)工程學(xué)報(bào),1999,19(8):54-58.
[4]周佃民,管曉宏,孫 婕,等.基于神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)短期負(fù)荷預(yù)測研究[J].電網(wǎng)技術(shù),2002,26(2):10-13.
[5]李元誠,方廷健,于爾鏗.短期負(fù)荷預(yù)測的支持向量機(jī)方法研究[J].中國電機(jī)工程學(xué)報(bào),2003,23(6):55-59.
[6]焦?jié)櫤#K辰雋,林碧英,等.基于氣象信息因素修正的灰色短期負(fù)荷預(yù)測模型[J].電網(wǎng)技術(shù),2013,37(3):720-725.
[7]林曉華,馮毅雄,譚建榮.基于免疫優(yōu)化的產(chǎn)品系統(tǒng)可靠性參數(shù)區(qū)間預(yù)測方法[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2013,(6):1013-1021.
[8]杜雅楠.基于核學(xué)習(xí)的冶金煤氣流量在線區(qū)間預(yù)測方法[D].大連:大連理工大學(xué),2013.
[9]Quan H,Srinivasan D,Khosravi A.Short-term load and wind power forecasting using neural network-based prediction intervals[J].IEEE Transactions on Neural Networks and Learning Systems,2013,25(2):303-315.
[10]Huang G,Zhu Q,Siew C.Extreme learning machine:theory and applications[J].Neurocomputing,2006,70(1):489-501.
[11]Lan Y,Soh Y C,Huang G.Ensemble of online sequential extreme learning machine[J].Neurocomputing,2009,72(13):3391-3395.
[12]Liang N,Huang G,Saratchandran P,et al.A fast and accurate online sequential learning algorithm for feedforward networks[J].IEEE Transactions on Neural Networks,2006,17(6):1411 -1423.
[13]高光勇,蔣國平.采用優(yōu)化極限學(xué)習(xí)機(jī)的多變量混沌時(shí)間序列預(yù)測[J].物理學(xué)報(bào),2012,61(4):37-45.
[14]Zhao J,Wang Z,Park D S.Online sequential extreme learning machine with forgetting mechanism[J].Neurocomputing,2012,87(11):79-89.
[15]Geem Z W,Kim J H,Loganathan G V.A new heuristic optimization algorithm:harmony search[J].Simulation,2001,76(2):60-68.
[16]Lee K S,Geem Z W.A new meta-heuristic algorithm for continuous engineering optimization:harmony search theory and practice[J].Computer Methods in Applied Mechanics and Engineering,2005,194(36 - 38):3902-3933.
[17]Geem Z W.Optimal cost design of water distribution networks using harmony search[J].Engineering Optimization,2006,38(3):259-280.
[18]雍龍泉.和聲搜索算法研究進(jìn)展[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2011,20(7):244-248.
[19]劉蓓,汪沨,陳春,等.和聲算法在含DG配電網(wǎng)故障定位中的應(yīng)用[J].電工技術(shù)學(xué)報(bào),2013,28(5):280-284.
[20]劉思遠(yuǎn),柳景青.一種新的多目標(biāo)改進(jìn)和聲搜索優(yōu)化算法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(34):27-30.
[21]Khosravi A,Nahavandi S,Creighton D,et al.Comprehensive review of neural network-based prediction intervals and new advances[J].IEEE Transactions on Neural Networks,2011,22(9):1341-1356.
[22]Quan H,Srinivasan D,Khosravi A.Construction of neural network-based prediction intervals using particle swarm optimization[C].The 2012 International Joint Conference on Neural Networks(IJCNN),New York:IEEE,2012.
[23]Khosravi A,Nahavandi S.Combined nonparametric prediction intervals for wind power generation[J].IEEE Transactions on Sustainable Energy,2013,4(4):849-856.
[24]Khosravi A,Nahavandi S,Creighton D.A neural net-work-GARCH-based method for construction of prediction intervals[J].Electric Power Systems Research,2013,96(3):185-193.
[25]Khosravi A,Nahavandi S,Creighton D.Construction of optimal prediction intervals for load forecasting problems[J].IEEE Transactions on Power Systems,2010,25(3):1496-1503.
[26]Khosravi A,Nahavandi S,Creighton D.Prediction intervals for short-term wind farm power generation forecasts[J].IEEE Transactions on Sustainable Energy,2013,4(3):602-610.
[27]Khosravi A,Nahavandi S,Creighton D,et al.Lower upper bound estimation method for construction of neural network-based prediction intervals[J].IEEE Transactions on Neural Networks,2011,22(3):337-346.
[28]Efron B.1977 Rietz lecture-bootstrap methods:another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.
[29]魏宗舒.概率論與數(shù)理統(tǒng)計(jì)教程[M].高等教育出版社,2008.
[30]Harrison R G,Yu D J,Oxley L,et al.Non-linear noise reduction and detecting chaos:some evidence from the S&P composite price index[J].Mathematics and Computers in Simulation,1999,48(4):497 -502.
[31]毛力,王運(yùn)濤,劉興陽,等.基于改進(jìn)極限學(xué)習(xí)機(jī)的短期電力負(fù)荷預(yù)測方法[J].電力系統(tǒng)保護(hù)與控制,2012,40(20):140-144.
[32]Zhang R,Dong Z Y,Xu Y,et al.Short-term load forecasting of Australian national electricity market by an ensemble model of extreme learning machine[J].IET Generation,Transmission & Distribution,2013,7(4):391-397.
[33]Wan C,Xu Z,Pinson P,et al.Probabilistic forecasting of wind power generation using extreme learning machine[J].IEEE Transactions on Power Systems,2013,PP(99):1-12.
[34]陳亞紅,馬麗,穆鋼,等.兩種短期負(fù)荷預(yù)測精度考核標(biāo)準(zhǔn)的比較[J].電力系統(tǒng)自動(dòng)化.2003,27(17):73-77.
[35]方仍存.電力系統(tǒng)負(fù)荷區(qū)間預(yù)測[D].武漢:華中科技大學(xué),2008.