趙鐵軍,孫玲玲,牛益國(guó),謝小英,賈清泉,*
(1.國(guó)網(wǎng)冀北電力有限公司秦皇島供電公司,河北 秦皇島 066004;2.燕山大學(xué) 電力電子節(jié)能與傳動(dòng)控制河北省重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004)
根據(jù)國(guó)家能源局的數(shù)據(jù)統(tǒng)計(jì),截至2019年9月底,中國(guó)光伏發(fā)電累計(jì)裝機(jī)容量達(dá)到1.9億kW,正向電能增量的主力供應(yīng)者過(guò)渡[1-2]。預(yù)計(jì)“十四五”期間光伏發(fā)電裝機(jī)容量和發(fā)電量仍將持續(xù)提高,光伏發(fā)電即將步入替代能源和平價(jià)上網(wǎng)時(shí)代,面臨規(guī)模化接入、高占比供能、主導(dǎo)電網(wǎng)行為的態(tài)勢(shì),其出力的隨機(jī)性和不確定性極大地增加了電網(wǎng)復(fù)雜性和風(fēng)險(xiǎn)程度,對(duì)電網(wǎng)的安全、可靠、經(jīng)濟(jì)運(yùn)行產(chǎn)生重大影響[3-4]。因此,探索建立精準(zhǔn)的光伏出力概率模型,對(duì)含光伏電網(wǎng)的不確定潮流分析、規(guī)劃與消納能力分析、安全分析等具有重要意義。
與光伏功率預(yù)測(cè)建模不同,光伏出力的概率建模,是在統(tǒng)計(jì)平均意義上用概率密度描述不同天氣、不同條件下光伏出力的概率分布。光伏出力的概率建??刹捎脜?shù)模型和非參數(shù)模型。β分布是一種典型的參數(shù)模型,但不同地區(qū)、不同條件下β分布模型的參數(shù)不易確定,因而模型準(zhǔn)確度差、分析精度低。核密度估計(jì)模型是一種數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)模型,是基于歷史數(shù)據(jù)的統(tǒng)計(jì)學(xué)方法,從而掌握特定地區(qū)或特定光伏出力的隨機(jī)分布特征[5-6]。文獻(xiàn)[7]創(chuàng)建了一種基于正交級(jí)數(shù)密度估計(jì)的光伏出力概率建模方法,能夠準(zhǔn)確模擬在不同地區(qū)不同時(shí)段下光伏出力的分布規(guī)律,并且在應(yīng)用中表現(xiàn)出高適用性、計(jì)算簡(jiǎn)便等性能優(yōu)勢(shì)。文獻(xiàn)[8]基于解集與條件核密度估計(jì)理論構(gòu)建了光伏出力的時(shí)序概率模型,能夠計(jì)及太陽(yáng)輻射度的小時(shí)輻射和日總輻射之間的加和特性,適用于多種現(xiàn)實(shí)場(chǎng)景。文獻(xiàn)[9]提出將數(shù)據(jù)按氣象條件分類(lèi),采用非參數(shù)核密度估計(jì)法建立晴天、多云、陰天、雨雪4種氣象條件下光伏出力的隨機(jī)分布模型。文獻(xiàn)[10]采用核密度估計(jì)函數(shù),將光伏出力的歷史數(shù)據(jù)作為樣本創(chuàng)建了一種非參數(shù)的建模方法;該方法能夠準(zhǔn)確模擬不同氣象條件下的光伏出力特性,但核密度估計(jì)的準(zhǔn)確性取決于所選帶寬,且不同的帶寬計(jì)算方法適用于不同的數(shù)據(jù)樣本。文獻(xiàn)[11]利用非參數(shù)核密度估計(jì)法(Nonparametric Kernel Density Estimation,NKDE)建立光伏發(fā)電出力誤差的概率分布模型。文獻(xiàn)[12]為避免因光伏模型設(shè)定和參數(shù)估計(jì)誤差帶來(lái)的影響,提出一種基于非參數(shù)核密度估計(jì)法的光伏功率短期預(yù)測(cè)誤差分布模型,對(duì)分布模式的多樣性進(jìn)行建模。文獻(xiàn)[13]提出綜合使用神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸、k近鄰算法、通徑分析和核密度估計(jì)的光伏出力概率分布估計(jì)方法,構(gòu)造了光伏出力概率密度函數(shù)。由上述研究結(jié)果分析可知,NKDE建模方法僅需根據(jù)歷史數(shù)據(jù)既能生成概率分布,不需預(yù)先假定任何分布,在應(yīng)用中表現(xiàn)出準(zhǔn)確性高、適用性強(qiáng)等特點(diǎn),非常適合具有隨機(jī)性分布的特征空間。然而,對(duì)于像光伏發(fā)電出力這種具有上下界限的樣本數(shù)據(jù),NKDE在建模過(guò)程中仍存在一定不足,表現(xiàn)為:無(wú)法在邊界點(diǎn)附近給出良好的估計(jì)結(jié)果,易出現(xiàn)邊界偏差;概率密度函數(shù)曲線在高密度樣本區(qū)間過(guò)于平滑,缺乏局部適應(yīng)性。因此,有必要探尋有效的方法改進(jìn)以克服NKDE在光伏出力建模中的問(wèn)題,得到更加精準(zhǔn)的光伏出力隨機(jī)模型。
本文針對(duì)非參數(shù)核密度估計(jì)方法應(yīng)用于光伏出力概率建模中存在邊界偏差和局部適應(yīng)性不足問(wèn)題,提出一種改進(jìn)的非參數(shù)核密度估計(jì)光伏出力概率建模方法。首先,闡述了采用參數(shù)法和非參數(shù)法建立的光伏出力概率分布模型;將自適應(yīng)核密度估計(jì)方法與基于偽數(shù)據(jù)的核密度估計(jì)相結(jié)合,在估計(jì)區(qū)間外生成偽數(shù)據(jù),將偽數(shù)據(jù)添加到邊界附近以修正偏差,構(gòu)建更加準(zhǔn)確的光伏出力概率模型;在此基礎(chǔ)上,采用χ2檢驗(yàn)作為擬合優(yōu)度指標(biāo)對(duì)模型進(jìn)行校驗(yàn)。最后,結(jié)合不同天氣條件下的光伏發(fā)電出力的實(shí)測(cè)數(shù)據(jù),對(duì)模型有效性進(jìn)行驗(yàn)證。
1) 光伏出力的核密度估計(jì)模型
首先建立光伏出力的單變量核密度估計(jì)模型[14]。設(shè)光伏輸出功率樣本值為PPV,1,PPV,2,…,PPV,n,其經(jīng)驗(yàn)分布函數(shù)為
(1)
其中,k=1,2,…,r-1。
光伏出力的概率密度函數(shù)f(PPV)是通過(guò)累積概率分布函數(shù)F(PPV)求導(dǎo)得到的,根據(jù)導(dǎo)數(shù)的定義有
(2)
由式(1)和式(2)可得到f(PPV)的密度估計(jì)為
(3)
由上述推導(dǎo)過(guò)程得出光伏出力概率密度函數(shù)估計(jì)后,需聯(lián)合常用的核函數(shù)從而構(gòu)建光伏出力核密度估計(jì)函數(shù)。常用的核函數(shù)類(lèi)型及具體計(jì)算公式如表1所示。
表1 常用的核函數(shù)Tab.1 Commonly used kernel functions
從表1中選擇均勻核函數(shù)公式并聯(lián)合式(3),從而計(jì)算得出基于非參數(shù)核密度估計(jì)的光伏出力概率分布模型為
(4)
式中:K(*)為核函數(shù);h為帶寬。
2) 基于自適應(yīng)核密度估計(jì)的光伏出力模型
自適應(yīng)核密度估計(jì)(Adaptive Kernel Density Estimation, AKDE)是一種使帶寬適應(yīng)樣本數(shù)據(jù)的密度估計(jì)方法,通過(guò)改變帶寬從而減少數(shù)據(jù)異常值對(duì)整體估計(jì)的影響。AKDE本質(zhì)上與NKDE相同,區(qū)別在于AKDE使用可變帶寬替換NKDE中的固定帶寬。首先通過(guò)交叉驗(yàn)證法計(jì)算出一個(gè)適當(dāng)?shù)娜止潭◣抙0,然后計(jì)算f(PPV)的先導(dǎo)估計(jì)函數(shù)
(5)
定義帶寬因子λi為
(6)
(7)
盡管NKDE有很多優(yōu)點(diǎn),但在光伏出力建模的實(shí)際使用過(guò)程中,仍存在如下不足或局限性,具體包括:
1) 邊界偏差
光伏出力的實(shí)際樣本數(shù)據(jù)具有上下界限,而NKDE對(duì)于樣本數(shù)據(jù)邊界以外的估計(jì)值大于零,這就意味著NKDE無(wú)法在邊界點(diǎn)附近給出良好的估計(jì)結(jié)果,導(dǎo)致估計(jì)結(jié)果出現(xiàn)邊界偏差。
(8)
由式(8)可得邊界偏差為
(9)
若f(x)是以零為邊界的概率密度函數(shù),則邊界偏差為
(10)
2) 缺乏局部適應(yīng)性
表2 常用評(píng)判指標(biāo)Tab.2 Common evaluation index
核密度估計(jì)的MSE為其方差與偏差平方之和,具體表達(dá)式為
(11)
(12)
由式(12)可知,MSE由h-1f(x)和h4[f″(x)]2決定,因此可以通過(guò)改變帶寬來(lái)降低MSE,進(jìn)而改善核密度估計(jì)的局部適應(yīng)性。
修正核密度估計(jì)邊界偏差的方法有很多,如數(shù)據(jù)反射法[16]、邊界核函數(shù)法[17]以及轉(zhuǎn)換法[18]等,但這些方法均不適用于二階及以上的核函數(shù)。而偽數(shù)據(jù)法沒(méi)有這些限制,可以與任意階的核函數(shù)一起使用,并且比普通數(shù)據(jù)反射方法的自適應(yīng)能力更強(qiáng)[19]。本文將自適應(yīng)核密度估計(jì)與基于偽數(shù)據(jù)法的核密度估計(jì)相結(jié)合,修正核密度估計(jì)邊界偏差。
(13)
將樣本從小到大排列,得到隨機(jī)變量X的順序統(tǒng)計(jì)量X(1),X(2),…,X(n)。設(shè)G=F-1為樣本Xi的分位函數(shù),其中F為隨機(jī)變量X的累計(jì)分布函數(shù),則在區(qū)間(-∞,0)上生成的偽數(shù)據(jù)為
(14)
(15)
由式(15)可得偽數(shù)據(jù)X(-i)為
(16)
則基于偽數(shù)據(jù)法的核密度估計(jì)為
(17)
式中,x>0,m為比nh大但比n小的整數(shù)。
基于偽數(shù)據(jù)法的核密度估計(jì)(Kernel Density Estimation with Pseudo-data,KDEP)雖然在一定條件下可以消除邊界偏差,但在樣本數(shù)值變化較大的局部區(qū)域,對(duì)受諸多因素影響的隨機(jī)變量使用固定帶寬的KDEP可能效果較差。為此,本文通過(guò)引入AKDE來(lái)改善局部適應(yīng)性問(wèn)題。
設(shè)光伏出力樣本為PPV,1,PPV,2,…,PPV,n,其概率密度函數(shù)為f(PPV),將KDEP與AKDE相結(jié)合,用式(7)中的自適應(yīng)帶寬h(PPV,i)代替式(17)中的固定帶寬,進(jìn)而得到基于偽數(shù)據(jù)法自適應(yīng)核密度估計(jì)(Adaptive Kernel Density Estimation with Pseudo-data,AKDEP)的光伏出力概率分布模型為
(18)
式(18)建立的基于AKDEP的光伏出力概率分布模型將偽數(shù)據(jù)添加到邊界附近以修正偏差,通過(guò)引入AKDE的自適應(yīng)帶寬來(lái)改善核密度估計(jì)的局部適應(yīng)性,從而克服了傳統(tǒng)非參數(shù)核密度估計(jì)模型的局限性。
(19)
(20)
核密度估計(jì)曲線反映觀測(cè)數(shù)據(jù)在曲線生成中的占比,其平滑程度是通過(guò)帶寬來(lái)體現(xiàn)的,帶寬選擇的不同會(huì)直接導(dǎo)致估計(jì)結(jié)果存在差異。一般而言,帶寬選擇越大,觀測(cè)數(shù)據(jù)點(diǎn)在曲線中的占比越小,核密度估計(jì)曲線越平滑;反之,帶寬選擇越小,核密度估計(jì)曲線波動(dòng)越顯著。
目前,最優(yōu)帶寬的選取主要有經(jīng)驗(yàn)法和交叉驗(yàn)證法。經(jīng)驗(yàn)法通過(guò)使MISE或AMISE最小來(lái)求得最優(yōu)帶寬,計(jì)算出的最優(yōu)帶寬比較適合于樣本數(shù)據(jù)整體分布與正態(tài)分布差距不大的函數(shù),對(duì)于隨機(jī)性強(qiáng)、整體分布與正態(tài)分布相差較大的樣本數(shù)據(jù)不適用。本文采用交叉驗(yàn)證法計(jì)算最優(yōu)帶寬,具體計(jì)算過(guò)程為
(21)
令
(22)
則有
(23)
最終得出最優(yōu)帶寬h為
(24)
擬合優(yōu)度檢驗(yàn)是判斷光伏出力理論分布是否符合樣本實(shí)際分布。如果理論分布與樣本實(shí)際分布有較大差距,那么依據(jù)理論分布建立的模型結(jié)果就可能與實(shí)際數(shù)據(jù)存在較大的誤差[20]。本文采用χ2檢驗(yàn)作為擬合優(yōu)度的指標(biāo)對(duì)基于AKDEP的光伏出力概率分布模型進(jìn)行檢驗(yàn),判斷其結(jié)果分布是否可以反映光伏隨機(jī)出力特性,以及其概率分布曲線是否與歷史實(shí)測(cè)數(shù)據(jù)有較高的擬合程度。
χ2檢驗(yàn)是根據(jù)理論頻數(shù)與觀察頻數(shù)的差值來(lái)衡量擬合優(yōu)度優(yōu)劣的一種方法。設(shè)光伏出力的樣本為PPV,1,PPV,2,…,PPVn,并將其劃分為m組不重復(fù)的數(shù)據(jù),則χ2檢驗(yàn)統(tǒng)計(jì)量為
(25)
式中:Ai為光伏出力樣本在第i個(gè)區(qū)間的觀測(cè)頻數(shù);Ei為光伏出力樣本在第i個(gè)區(qū)間的期望頻數(shù),其計(jì)算式為
Ei=F(PPV,max)-F(PPV,min)=npPV,i,
(26)
式中:PPV,max、PPV,min為第i組光伏出力樣本數(shù)據(jù)的最大值和最小值;pPV,i為光伏出力樣本在第i個(gè)區(qū)間的概率值;F為累積概率密度函數(shù)。
根據(jù)K.Pearson定理,當(dāng)樣本n足夠大時(shí),χ2統(tǒng)計(jì)量近似服從自由度為m-1的χ2分布,即
(27)
(28)
為分析光伏出力概率模型的輸出結(jié)果與實(shí)測(cè)數(shù)據(jù)之間的差異,本文采用均方根誤差判定,其表達(dá)式為
(29)
式中:m為劃分的區(qū)間總數(shù);xi為光伏出力的估計(jì)值;yi為第i個(gè)區(qū)間實(shí)測(cè)數(shù)據(jù)的概率。
本文數(shù)據(jù)來(lái)源于澳大利亞某大學(xué)新能源實(shí)驗(yàn)室光伏出力實(shí)測(cè)數(shù)據(jù),對(duì)基于AKDEP建立的光伏出力模型進(jìn)行檢驗(yàn)。將理論模型結(jié)果與歷史實(shí)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,以便直觀地體現(xiàn)理論分布與實(shí)際數(shù)據(jù)的差異。該光伏電站的規(guī)模是255 kW,電池板建于校園內(nèi)部分屋頂和地面。該光伏系統(tǒng)單片組件的功率為255 W,共1 000片,采用集中逆變器并網(wǎng)方式,直流側(cè)用匯流箱接入逆變器并網(wǎng)。
實(shí)驗(yàn)室提供的全年13:00時(shí)光伏出力實(shí)測(cè)數(shù)據(jù)如圖1所示。
將上述實(shí)測(cè)光伏出力數(shù)據(jù)為輸入樣本,計(jì)算得出基于NKDE的光伏模型和基于AKDEP的光伏模型出力概率密度曲線邊界對(duì)比結(jié)果如圖2所示。
圖1 全年13:00時(shí)光伏出力實(shí)測(cè)數(shù)據(jù)直方圖Fig. 1 Histogram of measured photovoltaic output datas at13:00 of the year
圖2 不同光伏模型的出力概率密度曲線邊界對(duì)比Fig. 2 The output probability density curve boundary comparison of different photovoltaic models
由圖2分析可知,NKDE光伏模型在小于0的區(qū)域仍有概率分布,存在邊界偏差;而AKDEP光伏模型在小于0的區(qū)域無(wú)概率分布,很好地修正了邊界偏差,與實(shí)際樣本數(shù)據(jù)分布基本相符。而且從整體來(lái)看,NKDE光伏模型雖然能反映光伏出力的變化趨勢(shì),但由于采用固定帶寬,局部適應(yīng)性較差,分布曲線比較平滑;AKDEP光伏模型采用可變帶寬,具有較強(qiáng)的局部適應(yīng)性,能更加精確地模擬光伏出力的隨機(jī)特性。
本文使用的數(shù)據(jù)范圍為該光伏電站2016至2018年的歷史數(shù)據(jù),其中包括每天各小時(shí)級(jí)光伏出力數(shù)據(jù),以及該數(shù)據(jù)對(duì)應(yīng)的日期、時(shí)段和天氣數(shù)據(jù)等。將全年各天分為晴天和陰天。天氣預(yù)報(bào)為晴,則該日的光伏出力數(shù)據(jù)劃為晴天數(shù)據(jù);天氣預(yù)報(bào)為多云和陰雨雪,則該日光伏出力數(shù)據(jù)作為陰天數(shù)據(jù)。分別以晴天和陰雨天的光伏出力實(shí)測(cè)數(shù)據(jù)作為輸入樣本,基于NKDE光伏模型和AKDEP光伏模型擬合光伏出力概率密度分布,與隨機(jī)抽取的單日相應(yīng)天氣條件下光伏出力實(shí)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,以檢驗(yàn)不同光伏模型對(duì)于光伏出力隨機(jī)性模擬的優(yōu)劣。
其中,晴天情況下兩種模型得出的光伏出力概率密度曲線如圖3所示。對(duì)比分析結(jié)果可知,基于AKDEP模型得出的光伏出力概率密度曲線與全年實(shí)測(cè)數(shù)據(jù)分布的擬合程度優(yōu)于NKDE光伏出力模型,能夠更好地反映光伏出力的隨機(jī)特性。利用生成的光伏出力概率分布模型與隨機(jī)抽取單日晴天各時(shí)段光伏出力分布的對(duì)比結(jié)果如圖4所示??梢?jiàn)兩種模型整體變化趨勢(shì)與單日實(shí)測(cè)光伏出力分布基本相符,但NKDE概率密度曲線過(guò)于平滑,在波動(dòng)和峰值區(qū)域誤差更大,對(duì)波動(dòng)的適應(yīng)性較差。
圖3 不同模型生成的晴天光伏出力概率密度曲線Fig.3 Probability density curves of photovoltaic output generated by different photovoltaic models under sunny weather
圖4 晴天光伏出力概率密度曲線與實(shí)測(cè)數(shù)據(jù)對(duì)比
陰雨天情況下兩種模型得出的光伏出力概率密度曲線如圖5所示。利用生成的光伏出力概率分布模型與隨機(jī)抽取的單日陰雨天各時(shí)段光伏出力分布的對(duì)比結(jié)果如圖6所示。可見(jiàn)在陰雨天情況下NKDE與AKDEP的光伏模型都能夠較好反映光伏出力的整體變化趨勢(shì)。原因是陰雨天光伏出力波動(dòng)較小,AKDEP和NKDE方法均能較好地適應(yīng)。對(duì)比單日光伏出力實(shí)測(cè)數(shù)據(jù),兩種方法的準(zhǔn)確度都較高。
圖5 陰雨天不同光伏模型生成的光伏出力概率密度曲線Fig.5 Probability density curves of photovoltaic output generated by different photovoltaic models in rainy days
圖6 陰雨天下光伏出力概率密度曲線與實(shí)測(cè)數(shù)據(jù)對(duì)比Fig.6 Comparison of probability density curve of PV output and histogram of measured data under cloudy and rainy days
由圖4和圖6也可以看出,本文建立的光伏出力模型與光伏單日出力分布有一定差異,這是由于本文模型是對(duì)光伏出力的全年統(tǒng)計(jì)平均分布,反映了全年的平均水平。
本文χ2檢驗(yàn)的門(mén)檻值設(shè)為31.54,不同光伏模型的χ2檢驗(yàn)結(jié)果和誤差分析結(jié)果見(jiàn)表3。
表3 光伏出力模型的χ2檢驗(yàn)和誤差分析Tab.3 Chi-square test and error analysis of photovoltaic output model
由表3檢驗(yàn)結(jié)果分析可知,基于參數(shù)分布建立的光伏模型未通過(guò)檢驗(yàn);雖然NKDE光伏模型與AKDEP光伏模型檢驗(yàn)統(tǒng)計(jì)量都小于臨界值,但后者的檢驗(yàn)統(tǒng)計(jì)量更小。由誤差分析結(jié)果可知,相較于其他兩種光伏模型,AKDEP光伏模型RMSE最小,說(shuō)明基于AKDEP的光伏模型出力概率分布與實(shí)測(cè)數(shù)據(jù)分布最接近。
本文針對(duì)非參數(shù)核密度估計(jì)在光伏出力概率建模中存在邊界偏差以及缺乏適應(yīng)性的問(wèn)題,將自適應(yīng)核密度估計(jì)和基于偽數(shù)據(jù)法的核密度估計(jì)相結(jié)合,提出一種改進(jìn)的非參數(shù)核密度估計(jì)建模方法,并基于此方法建立了光伏出力概率模型,結(jié)合算例分析,得出如下結(jié)論:
1) 基于偽數(shù)據(jù)法的自適應(yīng)核密度估計(jì)光伏出力概率模型可以很好地模擬不同天氣條件下光伏出力的隨機(jī)特性,更加精確地表征光伏出力隨機(jī)分布的整體趨勢(shì)。
2) 基于偽數(shù)據(jù)法的自適應(yīng)核密度估計(jì)所建光伏出力概率模型克服了傳統(tǒng)非參數(shù)核密度估計(jì)所建光伏出力模型的局限性,在避免邊界偏差的同時(shí)改善了局部適應(yīng)性。