李 峰,高效海,鄭鵬飛,劉 帥,高 潔
(1.國網(wǎng)山東省電力公司威海供電公司,山東 威海 264200; 2.國網(wǎng)山東省電力公司經(jīng)濟(jì)技術(shù)研究院,山東 濟(jì)南 250021)
迫于化石能源枯竭和環(huán)境保護(hù)的壓力,世界各國對(duì)于可再生新能源的開發(fā)正在展開[1]。全球能源轉(zhuǎn)型處于關(guān)鍵階段,發(fā)展多能互補(bǔ)綜合能源電力系統(tǒng)是實(shí)現(xiàn)能源轉(zhuǎn)型的重要途徑[2]。隨著新能源對(duì)電力系統(tǒng)的影響逐漸增大,其內(nèi)在的不確定性與負(fù)荷的不確定性也對(duì)系統(tǒng)規(guī)劃帶來了新的挑戰(zhàn),如何進(jìn)行多能源電力系統(tǒng)協(xié)調(diào)規(guī)劃成為熱點(diǎn)研究問題。
多能源電力系統(tǒng)協(xié)調(diào)規(guī)劃中,風(fēng)電概率模型具有隨機(jī)性與波動(dòng)性,很多情況下無法在電力系統(tǒng)規(guī)劃與運(yùn)行問題中直接使用,因此需要先將概率模型離散化,離散化后的結(jié)果即為場景。通過隨機(jī)變量的概率模型抽樣得到場景集合的過程即為場景生成。場景法常被用于應(yīng)對(duì)如風(fēng)電、光伏等隨機(jī)量的接入給電力系統(tǒng)帶來的不確定性問題,能夠?qū)в胁淮_定性的概率分布問題量化為具有確定性的幾個(gè)典型場景的組合,繼而用確定性問題方法進(jìn)行處理,大大降低了求解難度,減小了計(jì)算的工作量。
現(xiàn)已有多種基于場景法的實(shí)際應(yīng)用模型。文獻(xiàn)[3]提出了一種求解含風(fēng)電無功優(yōu)化模型的最優(yōu)場景法,可以在不使用蒙特卡洛模擬的情況下處理模型中風(fēng)電的不確定性;文獻(xiàn)[4]采用分層聚類算法對(duì)風(fēng)電出力樣本進(jìn)行聚類分析,然后采用類間樣本離差平方和作為聚類數(shù)的判定依據(jù)劃分樣本,得到聚類分組數(shù)未知的情況下地區(qū)風(fēng)電出力典型場景的選取方法;文獻(xiàn)[5]基于改進(jìn)的K-means聚類算法對(duì)風(fēng)電、光伏、潮汐、負(fù)荷進(jìn)行同步聚類,在不同的時(shí)間尺度下生成電力系統(tǒng)典型運(yùn)行場景;文獻(xiàn)[6]以風(fēng)電場出力、負(fù)荷水平為標(biāo)準(zhǔn),對(duì)網(wǎng)絡(luò)狀態(tài)進(jìn)行場景聚類,綜合所有場景調(diào)度信息,在傳統(tǒng)運(yùn)行規(guī)劃制定方法的基礎(chǔ)上,提出風(fēng)電接入下斷面極限傳輸功率運(yùn)行規(guī)劃的場景聚類提取方法。
場景法運(yùn)用的前提是根據(jù)歷史數(shù)據(jù)模擬生成大量的運(yùn)行場景。文獻(xiàn)[7]首先得到符合風(fēng)電輸出功率的連續(xù)正態(tài)概率分布,然后通過蒙特卡洛法對(duì)概率分布進(jìn)行抽取,得到用于生成典型場景的大量樣本;文獻(xiàn)[8]考慮不確定因素間的相關(guān)性,對(duì)風(fēng)電、光伏、負(fù)荷3個(gè)隨機(jī)變量進(jìn)行相關(guān)性建模;文獻(xiàn)[9]提出基于數(shù)據(jù)挖掘的貝葉斯網(wǎng)絡(luò)模型,描述了風(fēng)—光—負(fù)荷之間的非線性相關(guān)性;文獻(xiàn)[10-12]考慮了風(fēng)光等分布式電源以及負(fù)荷的自然增長時(shí)序數(shù)學(xué)模型,通過時(shí)間序列方法模擬出包含自然增長信息的電力系統(tǒng)場景樣本;文獻(xiàn)[13]利用拉丁超立方方法對(duì)連續(xù)正態(tài)分布進(jìn)行抽樣,通過更少的抽樣次數(shù)實(shí)現(xiàn)對(duì)輸入分布的重建;文獻(xiàn)[14]通過馬爾科夫鏈方法減弱了隨時(shí)間延長而造成的誤差累積效應(yīng)。
在擁有大量樣本集的基礎(chǔ)上,場景法需要進(jìn)一步通過聚類方法形成帶權(quán)典型場景集。文獻(xiàn)[15]通過雙層自適應(yīng)K-means方法,在構(gòu)建局部典型曲線的基礎(chǔ)上進(jìn)行二次聚類,從而構(gòu)建全局模型;文獻(xiàn)[16]考慮了曲線形態(tài),基于云模型提取出了電力負(fù)荷的典型模式;文獻(xiàn)[17]分析比較了多種聚類有效性評(píng)價(jià)指標(biāo),并在此基礎(chǔ)上評(píng)價(jià)了多種聚類方法和多種降維方法;文獻(xiàn)[18]從數(shù)據(jù)中提取了7類降維特征指標(biāo)取代歷史數(shù)據(jù)作為新的輸入,利用熵權(quán)法對(duì)指標(biāo)進(jìn)行客觀賦權(quán),并用模糊C-means法進(jìn)行聚類分析;文獻(xiàn)[19]建立了一種自適應(yīng)的K均值算法,利用臨界測試在不滿足條件時(shí)進(jìn)行聚類中心的動(dòng)態(tài)分離,在可能的最小聚類數(shù)目情況下,將相關(guān)性高的聚類中心進(jìn)行合并。
上述文獻(xiàn)雖然部分考慮了風(fēng)、光、負(fù)荷等電力系統(tǒng)中的不確定因素,但其典型場景生成時(shí)并未全面考慮相互耦合關(guān)系,導(dǎo)致生成的場景中各不確定因素仍較為獨(dú)立。另外,C-means聚類、K-means聚類、層次聚類等傳統(tǒng)聚類方法在高維數(shù)據(jù)集上的表現(xiàn)較差,提取的典型場景不能很好地體現(xiàn)原數(shù)據(jù)的特征。因此,本文提出一種基于高斯過程回歸的場景生成技術(shù),通過聯(lián)合高斯分布考慮不同不確定因素之間的相互耦合關(guān)系,進(jìn)而進(jìn)行場景生成;同時(shí),將總調(diào)度區(qū)間劃分為多個(gè)子調(diào)度區(qū)間,對(duì)每個(gè)子調(diào)度區(qū)間單獨(dú)進(jìn)行典型場景提取并結(jié)合成橫跨總調(diào)度區(qū)間的典型場景,從而實(shí)現(xiàn)了高維問題向低維問題的轉(zhuǎn)化;最后,利用Earth Mover’s Distance衡量所提取的典型場景對(duì)原場景的表征程度,并在此基礎(chǔ)上對(duì)算法超參數(shù)進(jìn)行優(yōu)化,進(jìn)行典型場景提取效果評(píng)價(jià)。
高斯過程又稱為正態(tài)隨機(jī)過程,是一種基于貝葉斯理論及統(tǒng)計(jì)學(xué)習(xí)理論的具有概率意義的核學(xué)習(xí)機(jī)。在已知一系列點(diǎn)及對(duì)應(yīng)值的前提下,設(shè)各個(gè)點(diǎn)對(duì)應(yīng)的取值符合高維多元高斯分布,在此基礎(chǔ)上求取點(diǎn)到取值的映射空間中不同映射的概率即為高斯過程[20]。
映射的概率后驗(yàn)分布可以通過貝葉斯公式求得,即
(1)
式中f為從輸入空間到取值空間的映射;D為輸入數(shù)據(jù)點(diǎn)的集合;p(D|f)為對(duì)數(shù)據(jù)點(diǎn)的最大似然估計(jì);p(f)為映射概率的先驗(yàn)分布。
f=(f(x1),f(x2),…,f(xN))
(2)
D={(x1,y1),(x2,y2),…,(xN,yN)}=(X,y)
(3)
式(2)、(3)中xi(i=1,2,…,N)為輸入空間中的n維輸入量;yi(i=1,2,…,N)為高斯過程回歸用于短期負(fù)荷預(yù)測建模時(shí),訓(xùn)練集合D中的訓(xùn)練樣本點(diǎn)。
對(duì)于先驗(yàn)分布來說,由于數(shù)據(jù)點(diǎn)特征未知,另外考慮到對(duì)稱性,設(shè)映射f的先驗(yàn)分布符合標(biāo)準(zhǔn)多元高斯分布[21],即
f~GP(·|0,K)=N(0,K+σ2I)
(4)
其中表征了測量值與實(shí)際值的誤差為
εi=yi-f(xi),εi~N(·|0,σ)
(5)
式(4)、(5)中K為相關(guān)度矩陣,衡量了不同數(shù)據(jù)點(diǎn)的耦合程度。K中元素通過核函數(shù)來計(jì)算。核函數(shù)是GPR中極其重要的一環(huán),不同應(yīng)用場景應(yīng)選擇特定的核函數(shù)與核函數(shù)中的超參數(shù)[22]。電力系統(tǒng)適用的核函數(shù)將在下一節(jié)中討論。
GPR的計(jì)算目標(biāo)是實(shí)現(xiàn)測試點(diǎn)對(duì)應(yīng)的預(yù)測值取得最大的概率值[23]。通過聯(lián)合概率分布邊緣化可以消去概率分布中特定的變量。通過對(duì)映射積分進(jìn)行邊緣化,即
p(ynew|xnew,D)=
(6)
式中p(ynew|xnew,f,D)為在已知映射以及數(shù)據(jù)點(diǎn)的前提下,求取得目標(biāo)值的概率;p(f|D)可通過式(1)計(jì)算。代入后的具體推導(dǎo)過程可參照文獻(xiàn)[24]。預(yù)測值概率分布為
(7)
(8)
與式(5)相同,式(8)的相關(guān)度矩陣中的元素將通過式(9)中的核函數(shù)來計(jì)算。
GPR適用于高維數(shù)據(jù)的處理。電力系統(tǒng)應(yīng)用中常常涉及到一個(gè)場景內(nèi)包含多個(gè)時(shí)序時(shí)間點(diǎn)的情況,且每個(gè)時(shí)序點(diǎn)都是一個(gè)維度。因此,隨著場景時(shí)間點(diǎn)數(shù)目的增多,電力系統(tǒng)場景維度常常超過20。此外,各個(gè)點(diǎn)對(duì)應(yīng)的高斯分布之間通過相關(guān)性系數(shù)進(jìn)行耦合,測試點(diǎn)回歸結(jié)果也包含了不同訓(xùn)練點(diǎn)的影響。在此基礎(chǔ)上,可以利用高斯過程回歸對(duì)電力系統(tǒng)中的多種不確定因素的耦合關(guān)系進(jìn)行建模,使得生成的場景數(shù)據(jù)體現(xiàn)多種不確定因素的影響。另外,GPR可以根據(jù)不同的任務(wù)采用不同的核函數(shù)將數(shù)據(jù)映射到特定的高維空間,增加了算法的靈活性。綜上所述,GPR適合應(yīng)用于電力系統(tǒng)中的數(shù)據(jù)處理和場景問題。
本文根據(jù)風(fēng)、負(fù)荷不確定性的影響,應(yīng)用基于改進(jìn)核函數(shù)的GPR進(jìn)行場景生成。選用的GPR核函數(shù)為
k(xn,xm)=
(9)
式中θ0為常用的徑向基項(xiàng)核函數(shù)項(xiàng)系數(shù);θ2為常數(shù)項(xiàng);θ3則對(duì)應(yīng)了輸入變量的一個(gè)線性函數(shù)的參數(shù)模型的系數(shù);λ表征了風(fēng)、負(fù)荷3項(xiàng)不確定因素之間的耦合關(guān)系。λ在不同情況下有不同取值,即
(10)
式中Xn為xn所在的數(shù)據(jù)點(diǎn)集合,包括風(fēng)電數(shù)據(jù)點(diǎn)集以及負(fù)荷數(shù)據(jù)點(diǎn)集。如果xm與xn同處同一數(shù)據(jù)點(diǎn)集,說明xm與xn為同一項(xiàng)不確定因素的2個(gè)樣本數(shù)據(jù),xm的取值對(duì)xn對(duì)應(yīng)預(yù)測值影響較大,在相關(guān)度矩陣中表征為二者相關(guān)度取值較大;若xm與xn處于不同數(shù)據(jù)點(diǎn)集,說明二者為不同項(xiàng)不確定因素的2個(gè)樣本數(shù)據(jù),xm的取值對(duì)xn對(duì)應(yīng)預(yù)測值影響較小,在相關(guān)度矩陣中表征為二者相關(guān)度取值較小。因此,c0應(yīng)在0~1之間取得一個(gè)較大值,表征同類數(shù)據(jù)點(diǎn)之間的強(qiáng)相關(guān)性。
電力系統(tǒng)中,根據(jù)大量的風(fēng)、負(fù)荷等歷史數(shù)據(jù)所提取出的具有代表性的典型場景,可以用于反映周期內(nèi)風(fēng)電、負(fù)荷的變化特征。經(jīng)典場景集是可以代表原始場景的一組場景,每一個(gè)場景由覆蓋總調(diào)度區(qū)間的所有時(shí)間點(diǎn)構(gòu)成。聚類算法根據(jù)不同場景間的距離進(jìn)行計(jì)算。然而,如果選用總調(diào)度區(qū)間作為一個(gè)場景進(jìn)行聚類,則會(huì)出現(xiàn)維度過高的問題,且場景距離不能很好地反映場景之間的差異程度,聚類效果較差。
因此,本文提出一種對(duì)總調(diào)度區(qū)間進(jìn)行拆分的時(shí)序分段典型場景提取分法,首先將總調(diào)度區(qū)間分成若干個(gè)子區(qū)間,即拆分為部分間數(shù)據(jù)特征差異較大、部分內(nèi)數(shù)據(jù)特征較為統(tǒng)一的幾個(gè)部分;然后對(duì)各個(gè)部分分別進(jìn)行聚類分析,得出各個(gè)部分的帶權(quán)典型場景集合;最后將各個(gè)部分采用笛卡爾積進(jìn)行連接,生成總調(diào)度區(qū)間長度的帶權(quán)經(jīng)典場景集。
設(shè)時(shí)間的總長度為T,選取k-1個(gè)分位點(diǎn),則總調(diào)度區(qū)間被分為k個(gè)子調(diào)度區(qū)間。根據(jù)每個(gè)子調(diào)度區(qū)間內(nèi)數(shù)據(jù)變化的趨勢應(yīng)該相似的原則,將時(shí)間軸上連續(xù)的確定性場景等距離切分成若干時(shí)間尺度相同的場景。因此選取二階導(dǎo)數(shù)作為子調(diào)度區(qū)間的劃分標(biāo)準(zhǔn),即
tk={t||f″(t)|>ζ,t∈T}
(11)
需要選取合適的ζ,使得總調(diào)度區(qū)間被劃分成合理數(shù)量的幾個(gè)區(qū)間。一方面,劃分?jǐn)?shù)量不能太少,否則可能導(dǎo)致各個(gè)區(qū)間內(nèi)數(shù)據(jù)變化趨勢的一致性較差,無法聚類出較好的結(jié)果;另一方面,劃分?jǐn)?shù)量也不能太多,否則即使區(qū)間內(nèi)數(shù)據(jù)變化趨勢趨于一致,但由于區(qū)間數(shù)量過多,使得經(jīng)過笛卡爾積連接之后的全調(diào)度區(qū)間典型場景數(shù)目過大,失去提取典型場景的意義。一般來說,劃分的典型場景數(shù)目為3~10,能使場景具有一定帶表性且有利于后續(xù)的分析。
根據(jù)各子調(diào)度區(qū)間內(nèi)數(shù)據(jù)變化趨勢相似的原則,對(duì)全調(diào)度區(qū)間進(jìn)行分段時(shí),若所分得子場景無法等長,則盡量保留各個(gè)子場景的最典型部分,在此基礎(chǔ)上對(duì)每個(gè)子區(qū)間進(jìn)行部分舍棄,使得最終劃分出的子調(diào)度區(qū)間等長。圖1為場景的子調(diào)度區(qū)間劃分。
圖1 場景劃分Figure 1 Schematic diagram of deterministic scene set reduction
聚類算法是一種無監(jiān)督學(xué)習(xí)算法,是一種不需要人的指導(dǎo),機(jī)器自行從數(shù)據(jù)中找出規(guī)律,將具有相似性的事物聚在一起的算法[25]。聚類時(shí),樣本往往處于歐式空間中,每一類的中心點(diǎn)由算法學(xué)習(xí)得出,但通常需要提前指定中心點(diǎn)數(shù)量。本文使用中心點(diǎn)聚類方法,該算法克服了傳統(tǒng)K-means算法容易被離群點(diǎn)影響的缺點(diǎn),所迭代出的中心點(diǎn)受異常點(diǎn)的影響較小[26]。中心點(diǎn)聚類的一般步驟。
1)確定中心點(diǎn)數(shù)量K。
2)在數(shù)據(jù)點(diǎn)集合中隨機(jī)選擇K個(gè)點(diǎn)作為初始類中心。
3)計(jì)算點(diǎn)集合其余所有點(diǎn)到K個(gè)中心點(diǎn)的距離,并且歸入最近類中心所代表的類。
4)對(duì)于每個(gè)類簇,計(jì)算類中所有點(diǎn)到其余所有點(diǎn)的距離之和,選取最小者為新的類中心。
5)重復(fù)步驟3、4,直到滿足迭代停止條件或者聚類結(jié)果不發(fā)生改變,即迭代收斂為止。
對(duì)各個(gè)子調(diào)度區(qū)間分別應(yīng)用中心點(diǎn)聚類進(jìn)行典型場景提取,得到不同子調(diào)度區(qū)間的幾組典型場景集。對(duì)不同子調(diào)度區(qū)間的典型場景集應(yīng)用笛卡爾積連接,形成全調(diào)度區(qū)間典型場景集。笛卡爾積連接又叫做交叉連接,具體指2個(gè)集合中的每個(gè)元素都與另一集合的所有元素相組合,如圖2所示。全調(diào)度區(qū)間典型場景提取流程如圖3所示。
圖2 子調(diào)度區(qū)間通過笛卡爾積連接Figure 2 Sub-scheduling intervals are connected by Cartesian product
圖3 基于高斯過程回歸的典型場景提取方法Figure 3 Typical scene extraction method based on Gaussian process regression
在提取典型場景后,需要評(píng)價(jià)典型場景對(duì)原場景集的表征效果,以衡量典型場景提取算法的優(yōu)劣。在此基礎(chǔ)上可以進(jìn)一步對(duì)典型場景提取算法進(jìn)行超參數(shù)優(yōu)化。本文選用基于Earth Mover’s Distance (EMD)的方法進(jìn)行典型場景提取效果評(píng)價(jià)。
EMD距離是2個(gè)概率分布間距離的一種度量方式[27],可以實(shí)現(xiàn)信息與信息之間多對(duì)多的優(yōu)良匹配,因此很適用于信息特征單元聚類問題。對(duì)于2個(gè)給定的概率分布,EMD將二者分別視為分散在空間的泥土和一組坑洞。EMD衡量的就是用泥土將坑洞填滿所需的最小工作量。設(shè)Pb1、Pb2為2個(gè)概率分布,Pb1、Pb2的離散化概率分布點(diǎn)集分別為
(12)
式中pi(i=1,2,…,m)為Pb1的離散化特征數(shù)據(jù)點(diǎn);wpi(i=1,2,…,m)為對(duì)應(yīng)的權(quán)重,權(quán)重由該特征數(shù)據(jù)點(diǎn)所代表的數(shù)據(jù)點(diǎn)個(gè)數(shù)決定;qi(i=1,2,…,n)為Pb2的離散化特征數(shù)據(jù)點(diǎn);wqi(i=1,2,…,n)為對(duì)應(yīng)的權(quán)重。則有D=[di, j],di, j為從特征數(shù)據(jù)點(diǎn)i到特征數(shù)據(jù)點(diǎn)j的代數(shù)距離,即
di,j=pi-qj
(13)
現(xiàn)需要求解得到流矩陣F=[fi,j],其中fi,j為第i個(gè)土堆到第j個(gè)坑洞的運(yùn)輸數(shù)量,即從特征數(shù)據(jù)點(diǎn)i到特征數(shù)據(jù)點(diǎn)j的流。流矩陣的求解是一個(gè)以整體費(fèi)用最小化為目標(biāo)的約束線性規(guī)劃,即
(14)
上述線性問題實(shí)際上是求取最佳目標(biāo)函數(shù),在滿足一系列約束的條件下,使得整體成本最小。求解得到流矩陣后,得Pb1、Pb2之間的EMD距離為
(15)
將典型場景集合各點(diǎn)概率密度函數(shù)離散化得到的概率分布Pi、原場景集合各點(diǎn)密度函數(shù)離散化得到的概率分布P′i代入公式中的Pb1、Pb2概率分布,即可進(jìn)行同一時(shí)間點(diǎn)下典型場景集合與原場景集合之間的EMD距離計(jì)算。
對(duì)于長度為T的全調(diào)度區(qū)間中的每個(gè)時(shí)間點(diǎn)Ti,基于提取的帶權(quán)典型場景集合,可以計(jì)算出當(dāng)前時(shí)間點(diǎn)的出力概率密度函數(shù)P(Ti)以及原始數(shù)據(jù)場景集合每個(gè)時(shí)間點(diǎn)的出力概率密度函數(shù)P′(Ti)。然后,通過EMD距離的計(jì)算,可以衡量同一時(shí)間點(diǎn)下典型場景集合概率分布與原場景集合概率分布之間的距離li。最后對(duì)所有時(shí)間點(diǎn)的EMD距離求代數(shù)平均得到全調(diào)度區(qū)間的平均EMD距離lm。此時(shí)lm即為反映典型場景集對(duì)原場景集表征效果的評(píng)價(jià)指標(biāo)。
基于平均EMD距離與數(shù)據(jù)集中驗(yàn)證集,不符合收斂條件的平均EMD距離將進(jìn)行超參數(shù)優(yōu)化。超參數(shù)優(yōu)化對(duì)機(jī)器學(xué)習(xí)算法的性能起著至關(guān)重要的作用,實(shí)際應(yīng)用中,通過不斷調(diào)整參數(shù)值來提高算法的實(shí)踐性能。在貝葉斯方法中,超參數(shù)(hyperparameters)指控制模型參數(shù)分布的參數(shù),選取最優(yōu)的超參數(shù)可以使得GPR的結(jié)果獲得較高的精度。
在本文基于GPR進(jìn)行典型場景提取的模型中,場景個(gè)數(shù)對(duì)提取結(jié)果和子場景的劃分均產(chǎn)生影響,因此視其為待優(yōu)化參數(shù)。鑒于GPR超參數(shù)優(yōu)化問題中,超參數(shù)設(shè)置不具備先驗(yàn)知識(shí)的情況下,本文采用文獻(xiàn)[28]的超參數(shù)優(yōu)化算法—改進(jìn)粒子群優(yōu)化算法(ADPSO-GPR),對(duì)GPR中超參數(shù)進(jìn)行自適應(yīng)優(yōu)化。計(jì)算全調(diào)度區(qū)間的EMD距離后,當(dāng)不符合式(12)中的收斂條件時(shí),該算法對(duì)典型場景進(jìn)行縮減,調(diào)整子調(diào)度區(qū)間的數(shù)量和典型場景數(shù)目。反復(fù)迭代直至全調(diào)度區(qū)間平均EMD距離符合收斂條件,使最終輸出的典型場景集最具代表性,達(dá)到最優(yōu)效果?;贓MD距離的典型場景表征效果評(píng)價(jià)流程如圖4所示。
圖4 基于EMD距離的典型場景集評(píng)價(jià)及優(yōu)化方法Figure 4 Evaluation and optimization method of typical scene set based on EMD distance
統(tǒng)計(jì)學(xué)中,考察2個(gè)變量之間相關(guān)程度的系數(shù)為相關(guān)系數(shù)。對(duì)于2個(gè)變量X={x1,x2,…,xn}和Y={y1,y2,…,yn},Pearson相關(guān)系數(shù)為
(16)
計(jì)算出的相關(guān)系數(shù)大小主要含義如下:
1)相關(guān)系數(shù)為0,表示2變量間無關(guān)聯(lián);
2)2變量為正相關(guān),相關(guān)系數(shù)為0.00~1.00;
3)2變量為負(fù)相關(guān),相關(guān)系數(shù)為-1.00~0.00。
由此可知,相關(guān)系數(shù)的絕對(duì)值越大,相關(guān)性越強(qiáng)。相關(guān)系數(shù)越接近于0,相關(guān)性越弱。計(jì)算風(fēng)電、負(fù)荷Pearson相關(guān)性系數(shù)時(shí),將風(fēng)電、負(fù)荷相關(guān)數(shù)據(jù)分別代入變量X={x1,x2,…,xn}和Y={y1,y2,…,yn},即可通過式(16)計(jì)算得到風(fēng)電、負(fù)荷Pearson相關(guān)性系數(shù)。根據(jù)計(jì)算出的相關(guān)系數(shù)大小主要含義,即可判斷風(fēng)電出力與負(fù)荷2變量間的耦合關(guān)系。
為驗(yàn)證本文方法的可行性,選取美國PJM電力市場2015~2019年的負(fù)荷與風(fēng)機(jī)出力數(shù)據(jù),采樣間隔為1 h。進(jìn)行缺失值處理等數(shù)據(jù)清洗后,總歷史數(shù)據(jù)長度為40 868 h。負(fù)荷及風(fēng)電數(shù)據(jù)如圖5所示。
圖5 PJM電力市場2015~2019歷史風(fēng)電、負(fù)荷運(yùn)行數(shù)據(jù)Figure 5 PJM electricity market 2015~2019 historical wind power, load operation data
首先利用高斯過程對(duì)歷史數(shù)據(jù)進(jìn)行回歸生成大量模擬運(yùn)行數(shù)據(jù),再對(duì)運(yùn)行數(shù)據(jù)以d為單位進(jìn)行時(shí)間劃分生成基礎(chǔ)場景集合。場景法運(yùn)用的前提是根據(jù)歷史數(shù)據(jù)生成大量的運(yùn)行場景,為了加快計(jì)算速度,本文采取滾動(dòng)回歸的方式進(jìn)行預(yù)測,以每20 d的歷史數(shù)據(jù)作為訓(xùn)練集生成未來5 d的模擬運(yùn)行數(shù)據(jù)。為了增強(qiáng)基礎(chǔ)場景集對(duì)運(yùn)行場景的表征能力,對(duì)生成的模擬運(yùn)行數(shù)據(jù)加入擾動(dòng)ε,ε符合均值為零的高斯分布,其標(biāo)準(zhǔn)差取高斯過程在對(duì)應(yīng)點(diǎn)輸出的預(yù)測值標(biāo)準(zhǔn)差。每個(gè)場景通過一個(gè)對(duì)應(yīng)的維度為(24, 2)的二維向量表示,2個(gè)維度分別表示對(duì)應(yīng)時(shí)間的負(fù)荷數(shù)據(jù)與風(fēng)電數(shù)據(jù)。最終生成的基礎(chǔ)場景集規(guī)模為85 100。部分生成的基礎(chǔ)負(fù)荷場景如圖6、7所示。
由圖6、7可知,負(fù)荷數(shù)據(jù)的波動(dòng)性較弱,且不同場景之間關(guān)聯(lián)性較強(qiáng);而風(fēng)電數(shù)據(jù)的波動(dòng)性強(qiáng),且不同場景之間的關(guān)聯(lián)性較弱。接下來將通過子場景劃分將全區(qū)間調(diào)度場景劃分為幾個(gè)子調(diào)度區(qū)間從而弱化風(fēng)電數(shù)據(jù)的波動(dòng)性,提升聚類有效性。
圖6 部分負(fù)荷基礎(chǔ)場景集Figure 6 Partial load base scenes
圖7 部分風(fēng)電基礎(chǔ)場景集Figure 7 Basic wind power scenes
在對(duì)場景集合進(jìn)行聚類前,需要進(jìn)行子場景劃分,再對(duì)每段子場景分別聚類。子場景數(shù)目越大,典型場景對(duì)原始場景集合的表征效果就越好,但由于笛卡爾積連接將按照指數(shù)級(jí)增加場景數(shù)量,過大的子場景數(shù)目將會(huì)使得總典型場景規(guī)模過大。同時(shí),子場景數(shù)目越小,總典型場景規(guī)模越小,但對(duì)原始場景集合的表征能力就越低。同時(shí)考慮到典型場景集規(guī)模與聚類效果的要求,本文取場景劃分段數(shù)為3。
考慮到03:00為大部分場景的晚間負(fù)荷最低點(diǎn),取場景起點(diǎn)時(shí)間為3,以此保證大部分場景在分界點(diǎn)2端分別保持單調(diào),降低子區(qū)間曲線復(fù)雜度,從而提升聚類效果。為減小單個(gè)子區(qū)間區(qū)間長度,本文取2個(gè)子場景分界點(diǎn)分別為11、19,從而使得3個(gè)子場景等長且均為8。
運(yùn)用典型場景評(píng)價(jià)方法,采用等步長搜索法對(duì)每個(gè)子場景的典型場景數(shù)進(jìn)行優(yōu)化,結(jié)果如圖8所示。
根據(jù)圖8(a)可知,負(fù)荷典型場景表征負(fù)荷原始場景的能力較好,子場景典型場景數(shù)N達(dá)到9后,負(fù)荷功率平均EMD距離低于120,并且隨著典型場景數(shù)增加表征效果提升不明顯;根據(jù)圖8(b)可知,風(fēng)電典型場景表征原始場景的能力不如負(fù)荷數(shù)據(jù),這是由于風(fēng)電本身波動(dòng)性較強(qiáng)的特點(diǎn)導(dǎo)致,但當(dāng)?shù)湫蛨鼍皵?shù)達(dá)到10后,風(fēng)電功率平均EMD距離小于150,且典型場景數(shù)增加帶來的表征效果提升不明顯;根據(jù)圖8(c)可知,當(dāng)子場景典型場景數(shù)達(dá)到7后,風(fēng)電、負(fù)荷功率Pearson相關(guān)性系數(shù)大于0.35,而原始數(shù)據(jù)場景集合中風(fēng)電、負(fù)荷功率相關(guān)系數(shù)為0.424 4,兩者差距不明顯,證明本文生成的典型場景較好地保留了原始場景集中不確定性因素之間的耦合關(guān)系,具有一定科學(xué)性和準(zhǔn)確性。且根據(jù)Pearson相關(guān)性系數(shù)的主要含義,相關(guān)系數(shù)為0.00~1.00時(shí),2變量為正相關(guān),因此風(fēng)電與負(fù)荷功率呈現(xiàn)正相關(guān)。
圖8 典型場景數(shù)對(duì)聚類效果的影響Figure 8 Effect of typical scene number on clustering effect
子典型場景數(shù)達(dá)到10后,場景數(shù)目增加對(duì)于聚類效果的提升能力顯著降低。因此,本文取子典型場景數(shù)為10。笛卡爾積連接后的總場景集合的評(píng)價(jià)指標(biāo)匯總見表1。由表1可得,生成的典型場景集合在不同時(shí)刻點(diǎn)的概率分布與原始數(shù)據(jù)的概率分布差異較小,并且很好的保留了原始數(shù)據(jù)集合中不同不確定因素之間的耦合關(guān)系。
表1 典型場景集效果評(píng)價(jià)指標(biāo)Table 1 Effect evaluation indicators for typical scene sets
本文首先考慮了電網(wǎng)中不確定性因素之間的耦合關(guān)系,在改進(jìn)核函數(shù)的基礎(chǔ)上,利用高斯過程回歸對(duì)電力系統(tǒng)中的多種不確定因素的耦合關(guān)系進(jìn)行建模,生成模擬運(yùn)行數(shù)據(jù)。然后,采用時(shí)序分段典型場景提取方法,劃分總調(diào)度區(qū)間為若干子區(qū)間并分別進(jìn)行中心點(diǎn)聚類,得出子區(qū)間帶權(quán)典型場景并用笛卡爾積連接,生成全調(diào)度區(qū)間典型場景集,在以上基礎(chǔ)上,應(yīng)用EMD方法和超參數(shù)優(yōu)化,進(jìn)行典型場景提取效果評(píng)價(jià)。最后,基于美國PJM電力市場歷史實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行了算例分析,算例表明本文提取的典型場景能夠很好地保留原始基礎(chǔ)場景集合的概率分布特性,同時(shí)保留了風(fēng)電、負(fù)荷等不確定性因素之間的耦合特性。本文方法為解決電力系統(tǒng)規(guī)劃問題奠定了基礎(chǔ),為衡量規(guī)劃方案優(yōu)劣提供了新的途徑。