杜 翠,徐曉波,劉宗歧,劉文霞
(華北電力大學電氣與電子工程學院,北京 lO22O6)
文章編號:lOO7-2322(2Ol5)O6-OOOl-O6 文獻標志碼:A 中圖分類號:TM6l5
氣象數(shù)據(jù)弱相關(guān)的光伏出力短期預測
杜 翠,徐曉波,劉宗歧,劉文霞
(華北電力大學電氣與電子工程學院,北京 lO22O6)
能源和環(huán)境問題促使以光伏為代表的清潔能源獲得了廣泛關(guān)注,截止2Ol3年底,中國的光伏裝機容量已達l9.42GW[1]。光伏大規(guī)模并網(wǎng)后會對電網(wǎng)的安全、經(jīng)濟和可靠運行產(chǎn)生多方面影響[2],因此必須獲得光伏出力的短期預測數(shù)值[3],對其進行主動控制,達到優(yōu)化調(diào)度。
短期光伏預測技術(shù)可分為物理法和統(tǒng)計法[4]:地面大型光伏電站具有物理結(jié)構(gòu)清楚、控制特性好等特點,多采用物理法預測[5];分布式光伏電站的短期出力則多采用統(tǒng)計法進行預測。
文獻 [6]中采用神經(jīng)網(wǎng)絡的方法對屋頂光伏的發(fā)電量進行預測。進一步地,文獻 [5]中首先基于天氣類型,采用經(jīng)驗模態(tài)分解將歷史樣本劃分為不同子類;隨后在不同子類內(nèi)采用支持向量機(support vector machine,SVM)對光伏出力進行預測。文獻 [7]中采用季節(jié)時間序列和SVM相結(jié)合的方法對小型光伏電站的短期出力進行預測。由文獻可知,分布式光伏預測多依賴光伏電站所在位置的歷史氣象數(shù)據(jù)。
基于傳統(tǒng)統(tǒng)計學的預測方法只有在樣本數(shù)量足夠多的情況下性能才有理論上的保證。但我國現(xiàn)有氣象量測設備不夠完善,無法提供全面豐富的氣象信息,在每個光伏出力點安裝氣象量測裝置會使得投資過大、運行復雜,即便使多個光伏電站使用附近同一氣象量測裝置也會造成數(shù)據(jù)不夠準確等問題,因此勢必面臨數(shù)據(jù)相關(guān)性減弱、噪聲過大等問題,使得有效樣本數(shù)減少。傳統(tǒng)統(tǒng)計法適用性降低。
Vapnik等人從2O世紀6O年代起,就致力于研究有限樣本下的模式識別、函數(shù)回歸等問題,提出了具有良好分類性能和小樣本預測能力的支持向量機(support vector machine,SVM)模型。支持向量機基于結(jié)構(gòu)風險最小化理論,從理論上保證了模型的最大泛化能力。
為克服氣象數(shù)據(jù)與分布式光伏出力數(shù)據(jù)相關(guān)性較低——即可用預測樣本數(shù)不足的問題,本文采用支持向量回歸機模型對其出力進行預測。首先采用模糊聚類分析法(fuzzy clustering analysis,FCA)對歷史數(shù)據(jù)進行分類,構(gòu)建與待預測日強相關(guān)的小樣本。隨后,建立具有良好小樣本預測和泛化能力的支持向量回歸機模型,采用全局網(wǎng)格搜索(grid search,GS)與自適應差分進化算法(self-adaptive differential evolution,SADE)相結(jié)合的方法對SVM參數(shù)進行優(yōu)選,保證了SVM的預測性能,形成了解決氣象數(shù)據(jù)弱相關(guān)問題的FCA-GS/ SADE-SVR短期光伏出力預測方法。最后,以某地實際算例驗證了本文提出預測方法的有效性。
光伏發(fā)電系統(tǒng)是由光伏組件、控制器、機械/電氣連接組件等組成[8],其中光伏組件是光伏發(fā)電的核心組件,在控制器的作用下,工作于最大功率跟蹤點(maximum power point tracking,MPPT)以將光能盡可能多地轉(zhuǎn)換為電能[9]。由于光照具有周期性、波動性和間歇性,從而使得光伏出力呈現(xiàn)相應的特點。
同時,光伏出力還受太陽輻射強度、太陽入射角度、太陽能電池組件的安裝角度、溫度、天氣類型、風速、云層、灰塵、影 子等[lO11]因 素 的影響。對于既定的光伏發(fā)電系統(tǒng),光伏出力與外界因素的關(guān)聯(lián)性都蘊含在歷史數(shù)據(jù)中[l2],因此,可通過對歷史數(shù)據(jù)的學習,獲得對未來數(shù)據(jù)的預測能力。
2.1 數(shù)據(jù)預處理
本文中的屋頂光伏電站位于東經(jīng)lO6°O7′~lO7°l7′,北緯26°11′~27°22′之間,屬于我國光資源匱乏區(qū)。光伏電站裝機容量為4OkWp,由2Ok Wp的單晶組件和2OkWp的多晶組件構(gòu)成,安裝方位角正南偏東l9°,安裝角度26°。
本文所用光伏出力數(shù)值取自該屋頂光伏電站2Ol3年2月1日~2Ol3年3月3l日的實際出力數(shù)據(jù),采集步長為lOmin;光照強度、風速、溫度等氣象數(shù)據(jù)取自附近氣象監(jiān)測點監(jiān)測記錄,時間分辨率同為lOmin。
為消除樣本數(shù)據(jù)間由于量綱不同無法在同一標準下計算和比較的問題,首先要對數(shù)據(jù)進行歸一化處理。本文采用最大最小歸一化法,公式如下:
式中:x′是采樣點時刻的光伏出力、光照強度、溫度和風速真實值;x′max是所有樣本中光伏出力、光照、溫度和風速的最大值;x′min是所有樣本中光伏出力、光照、溫度和風速的最小值;x為歸一化后的值。
本文使用應用最廣的Pearson關(guān)聯(lián)性系數(shù)法分析光伏出力與光照強度、溫度和風速之間的關(guān)系。
設兩個變量為X、Y,每組樣本表示為(Xi,Yi)(i=1,2,…,n),則Pearson線性相關(guān)系數(shù)為
根據(jù)2個月內(nèi)的氣象、光伏出力歷史數(shù)據(jù),計算每個氣象因素與光伏出力的相關(guān)程度,結(jié)果如表1所示。
表1 氣象數(shù)據(jù)與光伏出力數(shù)據(jù)的關(guān)聯(lián)性系數(shù)
Pearson相關(guān)系數(shù)ρ∧的絕對值越接近1,表明兩變量線性相關(guān)程度越高。當≥O.8時,視為高度相關(guān)??梢姳疚臉颖緮?shù)據(jù)間相關(guān)性較弱。
同時,選用相關(guān)性相對較強的光照強度、溫度作為影響光伏發(fā)電的主要因素,構(gòu)建強相關(guān)小樣本模型。
2.2 基于模糊聚類的相似日選取
因為樣本的相關(guān)程度較弱,因此對其進行合適的篩選和分類,提高樣本間的相似性,可提高模型預測的針對性和準確程度。
使用模糊聚類選取相似日,可以將歷史數(shù)據(jù)根據(jù)影響光伏出力的因素進行聚類,形成與待預測日強相關(guān)的小樣本,得到相似日。
設X={x1,x2,…,xk}為歷史樣本集合,xi(i=1,2,…,k)為單個樣本,是第i日的氣象向量,k為歷史日天數(shù),設每個樣本有m個影響因
素,即xi可以表示為影響因素向量xi=(xi1,xi2,…,xim)。通過歐式距離法、相關(guān)系數(shù)法、數(shù)量積法等可獲得兩個樣本間的相似程度。本文采取歐式距離法,又因不同氣象因素對光伏出力影響程度不同,因此對各因素賦予相應權(quán)重系數(shù)。第i日的加權(quán)歐式距離公式如下:
式中:m為影響因素個數(shù);λj為使用公式(2)計算出的相關(guān)系數(shù);xij為第i日的第j個氣象因素;xj為待預測日的第j個氣象因素。
di結(jié)果越小,說明關(guān)聯(lián)程度越高。選取關(guān)聯(lián)度最大的3天為待預測日的相似日。相似日的光伏出力和氣象數(shù)據(jù)共同構(gòu)成訓練樣本和測試樣本,作為支持向量機模型的輸入。
3.1 支持向量機
Vapnik等人于l99O年代提出支持向量回歸機(support vector regression machine,SVR)算法,基于結(jié)構(gòu)風險最小化原理,以有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,以獲得最佳的泛化能力。支持向量機具有良好的小樣本數(shù)據(jù)學習能力和預測能力,適用于各種非線性關(guān)系的擬合。支持向量回歸算法目前主要使用的是v-SVR、ε-SVR和LS-SVR等[l3l4],其中ε-SVR所需參數(shù)少、泛化性能好[l5]?;谏鲜鎏攸c,本文采用ε-SVR模型對短期光伏出力進行預測。
首先通過非線性映射將每個樣本點映射到高維空間,在高維空間中作線性回歸。樣本點如下:
式中:xi和yi是輸入向量,xi包括相似日的光照、溫度歸一化值和光伏出力值,yi是待預測日光照、溫度值;n是待預測日個數(shù)。
則回歸函數(shù)為
式中:f(x)為模型輸出的出力預測值;ω為權(quán)向量;φ(x)為映射函數(shù);x為歷史出力數(shù)據(jù)和影響因素;b為偏置。
根據(jù)Vapnik的結(jié)構(gòu)風險最小化原則,其結(jié)構(gòu)風險定義為
式中:ξi、為松弛變量。為求解該問題,引入拉格朗日乘子和核函數(shù),根據(jù)對偶理論,把該問題變?yōu)?/p>
解得
K(xi,x)為核函數(shù),實現(xiàn)問題由非線性到線性的轉(zhuǎn)換。由式(lO)可知,只要確定核函數(shù)即可進行預測,即不需知道映射函數(shù)φ(x)和高維空間Rn。常用的核函數(shù)有線性函數(shù)、多項式函數(shù)、徑向基函數(shù)、多層感知器函數(shù)[l4],徑向基核函數(shù)參數(shù)少,模型構(gòu)造簡單,因此本文選用徑向基核函數(shù),如下式:
由式(1-1)可知,ε-SVR模型需要選擇正則化系數(shù)C、參數(shù)ε和核參數(shù)p。
3.2 參數(shù)選擇
目前確定參數(shù)SVR的方法主要有:經(jīng)驗/實驗法選?。踠5l7]、遺傳算法(genetic algorithm,GA)[l8]、網(wǎng)格搜索等優(yōu)化算法。網(wǎng)格搜索將待搜索參數(shù)劃分成網(wǎng)格,遍歷所有參數(shù)組合,可搜索到最優(yōu)解,對小樣本預測有優(yōu)勢。
因此,本文采用兩階段確定ε-SVR參數(shù)的方法:第一階段采用網(wǎng)格搜索確定參數(shù)ε以及C和p的可能變化范圍;第二階段采用SADE對p和C尋優(yōu)。
以2月1日至3月3l日的相似日作為訓練樣本,以2月1日至8日為測試樣本。首先以(ε,p,C)為尋優(yōu)變量設計網(wǎng)格搜索試驗,設定ε在O.OOl 至O.Ol范圍內(nèi)以步長為O.OOl變化,p在O.1~2范圍內(nèi)以步長O.1變化,C在O.1~lO范圍內(nèi)以步長O.5變化,形成三維網(wǎng)格后,計算每個參數(shù)點處均方根誤差(root mean squared error,RMSE)的值。RMSE的計算公式如下:
式中:n為所有參數(shù)組個數(shù);yi為預測值;為真實值。
將RMSE的變化曲線投影到ε平面,觀察RMSE隨ε變化的情況,結(jié)果如圖1所示。
圖1 隨ε變化的RMSE值
由圖1可知,當參數(shù)ε變化時,RMSE均處于O.O5~O.O6之間,且RMSE變化較穩(wěn)定,參數(shù)ε對模型性能的影響不顯著。同時由文獻[l5]也知,當核參數(shù)p和正則化系數(shù)C固定于某一合適值時,SVR性能對參數(shù)ε不敏感。
因為參數(shù)ε在ε-SVR模型中控制著支持向量的稀疏性,ε越大,支持向量的個數(shù)就越少,當大于某一值時,就會出現(xiàn) “欠學習”現(xiàn)象,增大預測誤差。所以本文令ε=O.Ol后進行第二階段尋優(yōu)。
以(p,C)為尋優(yōu)變量,設定ε為O.Ol,p在O.1~2范圍內(nèi)以步長O.1搜索,C在O.1~lO范圍內(nèi)以步長為O.5搜索,以同樣方式計算RMSE的值,結(jié)果如圖2所示。
圖2 RMSE隨p和C的變化
試驗發(fā)現(xiàn)選取不合適的C和p,會對SVR的性能產(chǎn)生較大影響,所以通過網(wǎng)格搜索確定適宜的C和p的變化范圍,然后采用參數(shù)自適應調(diào)整的差
分進化算法(self-adapting differential evolution,SADE)[l9]在指定的范圍內(nèi)調(diào)整參數(shù)C和p,以提高模型的性能。
使用差分進化算法在C和p的變化范圍內(nèi)隨機產(chǎn)生初始種群,個體數(shù)目取2O,計算初始種群個體的適應度。適應度函數(shù)為結(jié)構(gòu)風險倒數(shù):
依據(jù)差分進化算法的突變和交叉策略[2O],在解空間中生成新的子代個體,并對子代個體進行適應度評估;依據(jù)個體適應度對子代和父代種群進行貪婪選擇;經(jīng)過一定數(shù)量的迭代后,就會得到最優(yōu)的C和p,即所選的C和p使得結(jié)構(gòu)風險最小。
3.3 預測流程
根據(jù)以上模型和原理,可得該方法流程圖如圖3所示。
圖3 FCA-GS/SADE-SVR光伏出力短期預測流程圖
獲取2Ol3年2月1日~3月3l日屋頂光伏電站的出力數(shù)據(jù)以及該區(qū)域的光照、溫度數(shù)據(jù),將從2月1日至3月3l日篩選出的相似日數(shù)據(jù)作為訓練樣本,2月1號至8號數(shù)據(jù)為測試樣本。使用上文中的FCA-GS/SADE-SVR方法預測,同時選用目前傳統(tǒng)統(tǒng)計法預測光伏發(fā)電量的主要技術(shù)——BP神經(jīng)網(wǎng)絡預測法進行計算,比較結(jié)果見圖4~5。
圖4 BP神經(jīng)網(wǎng)絡預測值、本文SVR方法預測值與真實值的比較
圖4~5的橫坐標為采樣時間點。實際系統(tǒng)中每lOmin記錄一次光伏出力,因此一天24h共有l(wèi)44個采樣時間點,共得到l44個光伏出力值。將本文提出的方法與BP神經(jīng)網(wǎng)絡預測做多次對比試驗,得到各預測日RMSE誤差后進行對比,如表2所示。
表2 各預測日RMSE對比結(jié)果
由表2可知,除去第7個測試天,本文提出的光伏短期功率預測方法可更精確地表述光伏出力的短期特征。常規(guī)BP預測法得到的8個預測日的平均RMSE為6.789%,本文提出的SVR方法的平均RMSE為5.55l%,提高精度為1.238%,能滿足預測要求,可以為決策者提供更精確的信息。
①本文通過分析分布式光伏的實際出力和當?shù)貧v史氣象數(shù)據(jù),采用Pearson系數(shù)法分析光伏出力與光照強度、溫度和風速的關(guān)聯(lián)程度,驗證了氣象因素的弱相關(guān)性,得出光照強度和溫度與光伏出力間有相對較強的相關(guān)性。
②基于光照和溫度兩個相關(guān)因素,應用模糊聚類理論構(gòu)建相似日的小樣本集合。相似日的光伏出力和氣象數(shù)據(jù)共同構(gòu)成訓練樣本和測試樣本,建立了具有良好泛化能力的ε-SVR支持向量回歸機預測模型。
③針對該模型,提出了兩階段確定模型參數(shù)的方法,首先采用全局網(wǎng)格搜索在大范圍內(nèi)對核參數(shù)p和正則化參數(shù)C進行搜索,確定適宜的p、C變化范圍,再通過局部自適應差分進化算法尋找最優(yōu)核參數(shù)p和正則化參數(shù)C,以提高參數(shù)ε選取范圍設置較大時的預測精度。
[1] 國家能源局.2Ol3年光伏發(fā)電統(tǒng)計數(shù)據(jù)[EB/OL]. (2Ol4-O4-28)[2Ol4-lO-lO]http://www.nea. gov.cn/2Ol4-O4/28/c_l33296l65.htm.
[2] Tan Y,Meegahapola 1,Muttaqi K M.A review of technical challenges in planning and operation of remote area power supply systems[J].Renewable and Sustainable Energy Reviews,2Ol4,38:876- 889.
[3] Brouwer A S,van den Broek M,Seebregts A,et al. Impacts of large-scale Intermittent Renewable Energy Sources on electricity systems,and how these can be modeled[J].Renewable and Sustainable Energy Reviews,2Ol4,33:443-466.
[4] 崔洋,孫銀川,常倬林.短期太陽能光伏發(fā)電預測方法研究進展[J].資源科學,2Ol3,35(7): l474-l48l.
[5] 茆美琴,龔文劍,張榴晨,等.基于EEMD-SVM方法的光伏電站短期出力預測 [J].中國電機工程學報,2Ol3,33(34):l7-24.
[6] Chow S K H,Lee E W M,Li D H W.Short-term prediction of photovoltaic energy generation by intelligent approach[J].Energy and Buildings,2Ol2,55: 66O-667.
[7] Bouzerdoum M,Mellit A,Massi Pavan A.A hybrid model(SARIMA SVM)for short-term power forecasting of a small-scale grid-connected photovoltaic plant[J].Solar Energy,2Ol3,98:226-235.
[8] Parida B,Iniyan S,Goic R.A review of solar photovoltaic technologies[J].Renewable and sustainable energy reviews,2011,l5(3):l625-l636.
[9] Kamarzaman N A,Tan C W.A comprehensive review of maximum power point tracking algorithms for photovoltaic systems[J].Renewable and Sustainable Energy Reviews,2Ol4,37:585-598.
[lO]任航,葉林.模擬分析環(huán)境因素對小型太陽能發(fā)電系統(tǒng)運行特性的影響 [J].電工技術(shù)學報,2OlO,25(lO):l58-l65.
[ll]張雪莉,劉其輝,馬會萌,等.光伏電站輸出功率影響因素分析 [J].電網(wǎng)與清潔能源,2Ol2,28 (5):76-8l.
[l2]張佳偉,張自嘉.基于PSO-BP神經(jīng)網(wǎng)絡的短期光伏系統(tǒng)發(fā)電預測[J].可再生能源,2Ol2,28(8): 28-32.
[l3]Vapnik V N.The Nature of Statistical Learning Theory[M].Berlin:Springer-Verlag,l995.
[l4]Vapnik V N,Golowich S,Smola A.Support vector method for function approximation,regression estimation and signal processing[J].Advances in Neural Information Processing Systems,l996:28l-287.
[l5]蘭華,廖志民,趙陽.基于ARMA模型的光伏電站出力預測[J].電測與儀表,2011,48(2):3l 35.
[l6]Safie F M.Probabilistic Modeling of Solar Power Systems[C]//Atlanta,GA:Reliability and Maintain ability Symposium,l989.
[l7]Muselli M,Poggi P,Notton G,et al.First order Markov chain model for generating synthetic“typical days”series of global irradiation in order to design photovoltaic stand alone systems[J].Energy Conversion and Management,2OOl,42(6):675-687.
[l8]丁明,徐寧舟.基于馬爾科夫鏈的光伏發(fā)電系統(tǒng)輸出功率短期預測方法[J].電網(wǎng)技術(shù),2011,35 (1):l52 l57.
[l9]Brest J,Greiner S,Bo?koviB,et al.Self-adapting control parameters in differential evolution:a comparative study on numerical benchmark problems[J]. IEEE Transactions on Evolutionary Computation,2OO6,lO(6): 646-65.
[2O]Advances in differential evolution[M].Springer Verlag,2OO8.
(責任編輯:楊秋霞)
Short-term Photovoltaic Output Forecasting with Weakly Related Meteorological Data
DU Cui,XU Xiaobo,LIU Zongqi,LIU Wenxia
(School of Electrical and Engineering,North China Electric Power University,Beijing lO22O6,China)
光伏出力受氣象因素影響,氣象數(shù)據(jù)的有效程度影響著預測結(jié)果的準確性。本文提出了氣象數(shù)據(jù)與光伏出力弱相關(guān)時短期光伏出力的預測方法。首先采用Pearson關(guān)聯(lián)系數(shù)分析法得到影響光伏發(fā)電的主要因素,而后采用模糊聚類理論構(gòu)建相似日,建立了具有優(yōu)秀小樣本學習能力的支持向量回歸機預測模型。針對該模型,提出了兩階段確定模型參數(shù)的方法,首先采用全局網(wǎng)格搜索確定核參數(shù)p和正則化參數(shù)C的取值范圍,再通過自適應差分進化算法尋找最優(yōu)核參數(shù)p和正則化參數(shù)C,以提高參數(shù)ε選取范圍設置較大時的預測精度。實例測試表明,使用本文提出的SVR方法預測的平均RMSE為5.55l%,滿足預測要求,比常規(guī)BP預測方法提高精度1.238%,在氣象數(shù)據(jù)弱相關(guān)時對光伏短期出力有更好的預測能力。
分布式光伏;光伏出力預測;支持向量機(SVM);參數(shù)選擇
Photovoltaic(PV)output is influenced by meteorological factors,and the significant degree of meteorological data influences the accuracy of forecasting result.In this paper,a short-term PV output forecasting method is presented in such weather situation that the weather data and PV output data are weakly correlated.The main factors affecting PV generation are found out by Pearson correlation coefficient method.Based on relevant factors,fuzzy clustering analysis method is used to build similar days,and support vector regression(SVR)forecasting model that has excellent learning ability for small sample is built.In order to determine model parameters,a two-step parameter-determining method is proposed,in which the global grid searching method is applied to determine the value region of kernel parameter p and regularization parameter C which are optimized through self-adaptive differential evolution algorithm,then the prediction accuracy is increased when the appropriate ranges of parameterεare wider.Examples show thatthe proposed SVR method has good forecasting ability when the weather data and PV output data are weakly correlated,and the average prediction value,RMSE,is 5.55l%which meets the requirement of prediction,and the accuracy is increased to 1.238%by comparison with general BP forecasting method.
distributed photovoltaic;PV output forecasting;support vector machine(SVM);parameter selected
2Ol4-l2-l4
杜 翠(l989—),女,碩士研究生,研究方向為電力系統(tǒng)分析,E-mail:dc89lO22@sina.com;
徐曉波(l99O—),男,碩士研究生,研究方向為電力系統(tǒng)分析,E-mail:xxbl99O_2O9O@l63.com;
劉宗歧(l963—),男,博士,教授,研究方向為電力系統(tǒng)運行、新能源發(fā)電與智能電網(wǎng)技術(shù),E-mail:lzq@ ncepu.edu.cn。