李世昌, 李 軍
(1.中信重工工程技術(shù)有限責(zé)任公司,河南 洛陽 471039;2.蘭州交通大學(xué) 自動化與電氣工程學(xué)院,甘肅 蘭州 730070)
隨著可再生能源的發(fā)展,風(fēng)能已經(jīng)引起越來越多的關(guān)注。短期風(fēng)電功率預(yù)測對電力系統(tǒng)的安全、經(jīng)濟(jì)運(yùn)行有著重要的意義[1],因此是新能源應(yīng)用領(lǐng)域中的研究熱點(diǎn)。傳統(tǒng)基于線回歸的預(yù)測模型,如自回歸積分滑動平均模型、卡爾曼濾波等,難以表述風(fēng)電功率變化的內(nèi)在非線性特征,更先進(jìn)的統(tǒng)計(jì)方法,如神經(jīng)網(wǎng)絡(luò)[2-3]、支持向量機(jī)(Support Vector Machine,SVM)[4]、極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)[5]在風(fēng)電功率預(yù)測中取得了較好的預(yù)測結(jié)果。文獻(xiàn)[5]給出一種基于改進(jìn)的ELM預(yù)測方法,該方法具有學(xué)習(xí)速度快、泛化性能好的優(yōu)點(diǎn),并已在風(fēng)電功率預(yù)測中成功應(yīng)用。
稀疏表示在圖像領(lǐng)域中作為一種特征提取手段得到廣泛應(yīng)用[6]。稀疏表示方法包括稀疏編碼和字典學(xué)習(xí)。文獻(xiàn)[7]將基于正交匹配追蹤(Orthogonal Matching Pursuit,OMP)的貪婪學(xué)習(xí)算法應(yīng)用于數(shù)據(jù)恢復(fù)中。文獻(xiàn)[8]給出了針對信號稀疏表示的過完備字典進(jìn)行訓(xùn)練的高效字典學(xué)習(xí)算法——K-均值奇異值分解(K-Means Singular Value Decomposition,K-SVD)算法及其實(shí)現(xiàn)。文獻(xiàn)[9]則給出一種直接基于K-SVD的字典學(xué)習(xí)算法構(gòu)建預(yù)測模型的預(yù)測方法,將其成功用于金融領(lǐng)域時(shí)間序列的股票收益預(yù)測中。
鑒于稀疏表示方法的良好特性,本文提出一種基于字典學(xué)習(xí)的K-SVD-OMP特征建模方法,與SVM或ELM方法結(jié)合,構(gòu)成全局預(yù)測模型。所提出的方法將其應(yīng)用于短期風(fēng)電功率預(yù)測中,在同等條件下,將基于不同稀疏表示特征提取的建模方法,以及現(xiàn)有的單一預(yù)測方法進(jìn)行對比,驗(yàn)證所提出的方法的有效性。
稀疏表示是基于超完備字典中少數(shù)基向量,以更簡潔的形式表示原信號,以獲取原信號的內(nèi)在特性信息。信號x∈Rm的稀疏表示為
x=Φα
(1)
式中,α∈RK為系數(shù)向量;Φ={φ1,φ2,…,φK}∈Rm×K為字典矩陣,φi為字典Φ中的基向量。
針對式(1),通過l0范數(shù)優(yōu)化問題的求解,可獲得α∈RK的近似逼近,即
(2)
式中,δ為誤差指標(biāo)且δ≥0。
對式(2)中系數(shù)向量α的非零數(shù)目進(jìn)行約束,可變換為
(3)
式中,M為稀疏度,即α中的非零系數(shù)的數(shù)目。
對式(2)和式(3)的求解本質(zhì)是一個(gè)NP難問題,可采用貪婪算法或松弛算法進(jìn)行逼近求解,采用松弛算法時(shí),式(2)的優(yōu)化問題可變形為
(4)
式(4)為式(2)的l1范數(shù)表達(dá)形式。式(4)可通過LASSO(Least Absolute Shrinkage and Selection Operator)方法[10]求解。
在稀疏表示中,針對字典有不同的構(gòu)造方式,一般有分析字典和學(xué)習(xí)字典兩大類,分析字典有小波字典、離散余弦變換(Discrete Cosine Transform,DCT)字典等,本文采用在字典構(gòu)造中自適應(yīng)能力更強(qiáng)的K-SVD學(xué)習(xí)字典。
K-SVD算法在K-均值基礎(chǔ)上對K個(gè)不同子集進(jìn)行SVD分解,構(gòu)造出初始字典并對字典中的原子進(jìn)行更新,其更新策略是對字典Φ的原子(即其列向量),按順序更新。在算法迭代更新過程中,主要為兩個(gè)步驟:稀疏編碼求解和字典更新學(xué)習(xí)。
K-SVD算法的目標(biāo)方程可表示為
(5)
式(5)的求解即為稀疏編碼,本質(zhì)上式(5)的求解與式(3)是相同的,即可采用不同的稀疏編碼求解算法,得到對應(yīng)于字典矩陣Φ上的原信號的稀疏表示的系數(shù)矩陣A。
(6)
式中,Ek為字典Φ剝離原子φk后,在所有N個(gè)數(shù)據(jù)樣本中帶來的誤差。
(7)
針對式(3)中稀疏向量求解的問題,可采用貪婪算法求解策略,得到對應(yīng)于字典矩陣Φ上的原信號的稀疏表示的系數(shù)向量α。其中,OMP算法是MP算法的改進(jìn),它對所選的全部原子進(jìn)行正交化處理,使得在相同迭代次數(shù)下,OMP結(jié)果更優(yōu)。
對式(3)中稀疏編碼向量的求解問題,可轉(zhuǎn)換為
(8)
針對式(8)的系數(shù)編碼求解,采用OMP算法實(shí)現(xiàn),具體步驟如下。
① 初始化參數(shù),令索引集Λ0=?,殘差向量r0=x,迭代次數(shù)t=1。
② 求解出字典矩陣中原子φi與殘差r內(nèi)積最大時(shí)所對應(yīng)的索引χt,即
(9)
該步驟是一個(gè)貪心選擇求解過程。
③ 增廣索引集,選擇索引集Λt=Λt-1∪{χt},更新字典Φt=[Φt-1,φχt],需要注意的是,Φ0是空矩陣。
④ 由最小二乘問題求解,可獲取原數(shù)據(jù)新的表示,即
(10)
⑤ 更新殘差rt=x-Φtαt。
⑥t=t+1,判定是否滿足t≤M,若不滿足則執(zhí)行步驟②。
下面具體闡述基于稀疏表示的特征提取方法與不同預(yù)測模型結(jié)合構(gòu)建的短期風(fēng)電功率時(shí)間序列模型。
針對時(shí)間序列數(shù)據(jù){yi},i=1,2,…,N,將其構(gòu)建為預(yù)測模型的輸入數(shù)據(jù)集,預(yù)測模型為
(11)
在ELM預(yù)測模型中,對于一個(gè)有L個(gè)隱含層節(jié)點(diǎn)的單隱層神經(jīng)網(wǎng)絡(luò)(SLFN),當(dāng)給定激活函數(shù)為h(x)時(shí),其網(wǎng)絡(luò)節(jié)點(diǎn)的輸出為
(12)
Hθ=t
(13)
式中,θ為輸出權(quán)值向量;H為隱含層的輸出矩陣;t為目標(biāo)矩陣。
ELM的輸出等價(jià)于求解線性方程Hθ=t的最小二乘法求解,即
(14)
式中,H+為輸出矩陣H的廣義逆矩陣??紤]到求解的穩(wěn)定性,進(jìn)一步得到:
(15)
式中,η為正則化參數(shù)。ELM的輸出函數(shù)為
(16)
考慮SVM完成時(shí),采用LIBSVM軟件求解。對于單輸出的ε-SVM,則有
(17)
k(xi,xj)選取高斯核函數(shù),即:
k(xi,xj)=exp(-0.5‖xi-xj‖2/ζ2)
(18)
式中,ζ為函數(shù)的寬度參數(shù),設(shè)定函數(shù)的徑向作用范圍。
將基于K-SVD-OMP算法的稀疏表示特征提取建模方法應(yīng)用在短期風(fēng)電功率預(yù)測中,具體實(shí)現(xiàn)過程如下。
③ 基于2.2節(jié)中的OMP算法,可得到訓(xùn)練數(shù)據(jù)中的輸入xi,在超完備字典Φ上所對應(yīng)的稀疏表示系數(shù)向量αi。
④ 將αi作為預(yù)測模型f(·)輸入,訓(xùn)練集中相對應(yīng)的yi作為模型輸出,f(·)可采用式(16)或式(17),對模型進(jìn)行訓(xùn)練。
為對比在稀疏表示特征提取建模方法中不同的字典構(gòu)建方法與稀疏編碼求解算法對模型預(yù)測結(jié)果的影響,本實(shí)驗(yàn)考慮了非字典學(xué)習(xí)的稀疏編碼算法(如初始字典選擇DCT字典),另外,稀疏編碼算法還采用了LASSO算法,即將DCT-LASSO、DCT-OMP、K-SVD-LASSO等不同的稀疏表示建模方法在實(shí)驗(yàn)中進(jìn)行比較。
實(shí)驗(yàn)中預(yù)測結(jié)果評價(jià)指標(biāo)采用相對誤差(Relative Error,RE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)和均方根誤差(Root Mean Square Error,RMSE),即
(19)
(20)
(21)
實(shí)驗(yàn)數(shù)據(jù)來自于某風(fēng)電場2011年全年的實(shí)際風(fēng)電功率值,由加拿大亞伯達(dá)省電網(wǎng)公司提供[11],其原數(shù)據(jù)對風(fēng)電功率數(shù)值采樣間隔為10 min。實(shí)驗(yàn)中對原數(shù)據(jù)進(jìn)行處理,選取該風(fēng)電場3月24日至4月15日之前的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),4月16日全天數(shù)據(jù)作為測試數(shù)據(jù),并將3個(gè)連續(xù)的原數(shù)據(jù)進(jìn)行加和平均,即處理為采樣間隔為30 min的新數(shù)據(jù)。預(yù)測模型輸入構(gòu)造如式(11)所示,嵌入維m=6,步長h=1,延遲常數(shù)τ=1。
實(shí)驗(yàn)中,K-SVD算法中為保證得到超完備字典m 圖1 K-SVD字典迭代重構(gòu)誤差曲線 圖2 不同稀疏度下的不同預(yù)測模型MAPE對比 為對比不同特征提取建模預(yù)測方法,在M=5時(shí),將本文所提出的基于字典學(xué)習(xí)的K-SVD-OMP方法與DCT非字典學(xué)習(xí)的特征提取建模方法,以及采用單一模型的SVM、ELM預(yù)測方法在相同條件下進(jìn)行對比。其中,LASSO算法中,選擇λ=0.2。表1列出了不同稀疏表示方法的預(yù)測結(jié)果數(shù)值比較。 表1 多種方法的預(yù)測結(jié)果對比 由表1可見,與單一SVM、ELM方法相比,采用稀疏表示特征提取建模的各預(yù)測方法的各預(yù)測指標(biāo)均有提高,其中,基于字典學(xué)習(xí)的K-SVD-OMP特征提取建模方法對預(yù)測精度提升最有效,并在與ELM結(jié)合時(shí)取得了最好的預(yù)測效果。 為進(jìn)一步衡量稀疏表示特征提取與ELM結(jié)合模型的預(yù)測效果,圖3給出了單一ELM預(yù)測方法與ELM結(jié)合不同稀疏表示特征提取建模方法的絕對百分比誤差(Aboluate Percentage Errors,APE)的箱線圖。由圖3可以看出,在APE指標(biāo)下,基于字典學(xué)習(xí)的K-SVD-OMP方法與DCT非字典學(xué)習(xí)的特征提取建模方法相比,預(yù)測精度分布更為集中,預(yù)測精度更高。 圖3 不同稀疏表示建模方法的箱線圖 圖4給出了K-SVD-OMP、K-SVD-LASSO結(jié)合ELM的預(yù)測方法與DCT-OMP、DCT-LASSO、單一ELM方法與實(shí)際風(fēng)電功率預(yù)測結(jié)果比較。不同稀疏表示特征提取建模方法的預(yù)測結(jié)果與相對誤差對比如圖4、圖5所示,結(jié)果表明基于K-SVD-OMP特征提取建模方法的預(yù)測結(jié)果擬合最好,相對誤差波動較小。 圖4 不同稀疏表示建模方法的預(yù)測結(jié)果對比 圖5 不同稀疏表示建模方法的相對誤差對比 針對短期風(fēng)電功率預(yù)測實(shí)例,提出一種基于稀疏表示特征提取建模的K-SVD-OMP方法。該方法在字典構(gòu)建階段采用K-SVD算法,對重構(gòu)誤差進(jìn)行SVD分解,使用最小的重構(gòu)誤差分解項(xiàng)對初始字典進(jìn)行逐列更新,往復(fù)迭代直至獲取最優(yōu)解,較采用非字典學(xué)習(xí)的稀疏表示特征提取建模方法,在滿足稀疏度的要求下對不同數(shù)據(jù)的自適應(yīng)更好。在稀疏表示編碼求解階段采用OMP算法,因?qū)λx的全部原子進(jìn)行正交化處理,使得在相同迭代次數(shù)下,較LASSO算法結(jié)果更優(yōu)。將所提出的稀疏表示特征方法與不同全局回歸模型結(jié)合,并應(yīng)用在短期風(fēng)電功率預(yù)測實(shí)例中,與已有的單一SVM或ELM方法行了比較,實(shí)驗(yàn)結(jié)果表明,本文方法具有更高的預(yù)測精度,顯示出更好的預(yù)測效果。還可考慮采用其他的字典學(xué)習(xí)算法進(jìn)行進(jìn)一步研究,將其應(yīng)用于電力負(fù)荷峰值預(yù)測領(lǐng)域中。5 結(jié)束語