嚴華江,章堅民,胡瑛俊,張力行,焦田利,,聞 安
(1.國網(wǎng)浙江省電力有限公司電力科學(xué)研究院,杭州 310014;2.杭州電子科技大學(xué) 自動化學(xué)院,杭州 310018;3.國網(wǎng)浙江寧波市鄞州區(qū)供電有限公司,浙江 寧波 315100;4.浙江華云信息科技有限公司,杭州 310012)
大力推進分布式光伏應(yīng)用,已成為新能源重點發(fā)展方向之一[1]。分布式光伏電站大規(guī)模并網(wǎng),使配電網(wǎng)面臨電能質(zhì)量、諧波、經(jīng)濟運行等一系列問題[2-3],因此科學(xué)地進行分布式光伏出力分析和預(yù)測十分必要。
目前,國內(nèi)外學(xué)者對光伏發(fā)電出力預(yù)測問題已做了很多研究。分布式光伏功率預(yù)測不同于集中式光伏電站[4]:一是位置分布分散且裝機容量較?。欢菬o法獲取就地日照和溫度等氣象數(shù)據(jù)。因此分布式光伏出力難以實現(xiàn)基于氣象數(shù)據(jù)的預(yù)測,只能采取基于歷史數(shù)據(jù)來預(yù)測。
目前光伏出力預(yù)測方法主要分為直接預(yù)測法和間接預(yù)測法:
(1)間接預(yù)測法,是基于相關(guān)氣象數(shù)據(jù)的光伏預(yù)測方法。由于日照幅度與光伏出力具有最強的相關(guān)性[5],文獻[6-8]對云團采取分析建模并預(yù)測其演變過程,達到間接預(yù)測光伏所在地日照幅度的目的,為后續(xù)的功率預(yù)測提供參數(shù)支持。文獻[9-10]基于歷史氣象數(shù)據(jù)和天氣預(yù)報數(shù)據(jù),分別采用神經(jīng)網(wǎng)絡(luò)算法和多元線性回歸法對輻照度進行建模分析,進而預(yù)測輸出功率。
(2)直接預(yù)測法,是主要依靠光伏實際出力數(shù)據(jù)實現(xiàn)出力預(yù)測的一種方法,如通過“相似日”出力數(shù)據(jù)時序關(guān)聯(lián)預(yù)測未來出力[11-16],其中關(guān)聯(lián)關(guān)系采取多元線性回歸法[11-12]、灰色理論預(yù)測法[13];文獻[14-16]對相似日數(shù)據(jù)的選擇采用了不同方法,文獻[14]篩選出氣象與出力間呈弱或強相關(guān)的相似日數(shù)據(jù),文獻[15]提出基于粒子群和BP 神經(jīng)網(wǎng)絡(luò)的相似日訓(xùn)練方法,文獻[16]提出基于Kmeans 聚類的相似日分類方法。
氣象作為影響光伏出力的主要因素,在其局部區(qū)域存在相關(guān)性,使該區(qū)域的分布式光伏出力存在空間相關(guān)性[17]。近年來有一系列關(guān)于不同光伏電站相關(guān)性的判定方法研究,如基于不同光伏電站實測出力時間序列以及輻照度數(shù)值的相關(guān)性系數(shù)[18],出力時間序列間的歐氏距離在閾值范圍內(nèi)[19],分布式光伏站點間輻照度的空間相關(guān)KL散度距離[20]??臻g相關(guān)性研究方法主要分為兩類:一類為無氣象數(shù)據(jù)電站建立的與具有氣象數(shù)據(jù)支持電站空間數(shù)據(jù)相關(guān)的“相似電站”,進而通過“相似電站”來進行無氣象數(shù)據(jù)電站的出力預(yù)測[21];另一類是形成具有相似性的電站群,如文獻[22]取距離待預(yù)測目標電站最近的N 個電站作為相關(guān)性從站加入AR 預(yù)測模型中,結(jié)合自身和周圍具有相關(guān)性電站的出力數(shù)據(jù),從而提高預(yù)測精度。
本文作者在文獻[23]提出了一種基于空間相關(guān)性的大規(guī)模分布式光伏群的劃分方法。首先將氣象對光伏出力的影響程度劃分為大氣候和小氣候2 類:前者為日照或5 類天氣類型影響,其中天氣類型依據(jù)光伏實際出力占額定出力的比例來劃分,相應(yīng)地將歷史數(shù)據(jù)時段劃分為5 類天氣類型樣本群;后者為光伏安裝高程、溫度、濕度以及周圍地理環(huán)境等廣義小氣候影響,基于歷史5類天氣類型樣本群,對光伏空間位置進行聚類分析,從而劃分分布式光伏區(qū)域。綜合考慮區(qū)域不合群的光伏點數(shù)量和區(qū)塊的氣象一致性來選擇最優(yōu)地域分塊方案,已達到最少部署氣象站點的目的或為大規(guī)模分布式光伏空間-時間相關(guān)的功率預(yù)測提供依據(jù)。文獻以具有豐富氣候帶地貌特征的某縣級市遍布全境的2 887 個分布式用戶光伏群為案例,很好地驗證所提的方法。
基于文獻[23],本文提出基于空間相關(guān)性和ARIMA 模型的分布式光伏功率預(yù)測方法,首先利用已提出的大規(guī)模區(qū)域分布式光伏分群方法篩選分群電站中與待預(yù)測電站的出力具有空間相關(guān)性的光伏電站,建立不同天氣類型下的ARIMA模型,并與日天氣預(yù)報信息匹配,利用相應(yīng)模型實現(xiàn)光伏功率預(yù)測。
廣義天氣類型的分類方法很多,文獻[24]提出了劃分天氣類型的原則,即典型性和代表性。而日照幅度作為光伏出力的影響要素之一且其影響最大[25],譬如晴天的日照幅度最大,相應(yīng)的光伏出力曲線變化平滑且能取到最大值;雨天因云層的遮擋作用,光伏整體出力和波動較??;而多云和陰天時的光伏出力介于兩者之間,光伏出力變化較大且不穩(wěn)定。圖1 反映了不同天氣類型下的光伏出力水平,研究了不同天氣類型下光伏的出力特征,本文將廣義天氣類型分為4 類,分別為晴天、多云、陰天和雨天。
光伏日平均出力是指光伏在可發(fā)電時間內(nèi)發(fā)電的平均值。由實際光伏出力的統(tǒng)計數(shù)據(jù)可得,在理想條件下光伏出力曲線具有對稱的特點,因而光伏日平均出力可反映全天光伏出力水平[26],用公式表示為:
圖1 不同天氣類型的光伏日出力特征曲線
式中:n 為可發(fā)電時間的長度;Pi為第i 時刻光伏的出力值,對廣域分布式光伏用戶,為去除不同裝機容量等量綱對光伏出力造成的差異,應(yīng)首先對Pi標幺化處理。光伏日平均出力的大小直接反映了光伏的發(fā)電效率和天氣狀況的關(guān)系,若光伏的發(fā)電效率高,代表其日出力平均值較高,日照幅度較高,天氣晴朗;反之,發(fā)電效率低代表日出力水平較低,則表明日照幅度較低,天氣狀況較差。
ARIMA(自回歸移動平均)模型是一類常用的擬合平穩(wěn)時間序列的模型,體現(xiàn)了系統(tǒng)對歷史自身狀態(tài)和進入系統(tǒng)的噪聲的記憶,即序列在t時刻的取值是關(guān)于前p 個歷史觀測值和前q 個隨機干擾的多元線性函數(shù),記為ARIMA(p,q):
式中:誤差項εt為均值為零的白噪聲序列代表t時刻的隨機干擾。而ARIMA(p,d,q)模型是d 階差分和ARIMA(p,q)的組合。在數(shù)據(jù)預(yù)處理時,需對序列首先進行平穩(wěn)性檢測,非平穩(wěn)時間序列可通過有限次的差分形成平穩(wěn)時間序列再進行建模。文獻[27]通過觀察自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì)進行模型定階,但這種人為識別的方法具有不確定性,本文使用AIC(赤池信息量準則)來進行定階,選取AIC 值最小時的p,q 作為模型階數(shù),AIC 計算公式如下:
模型參數(shù)可通過最小二乘估計或最大似然估計、矩估計確定,對于足夠長時間序列的訓(xùn)練樣本,3 種方法所得參數(shù)漸進相等,因此本文選用最小二乘估計法,即對目標函數(shù):
之后檢驗殘差序列{εt}的白噪聲,若殘差序列為白噪聲序列,即表明模型參數(shù)提取正確,為有效參數(shù)模型;若非白噪聲序列,則表明序列中還殘余待提取的有用信息,需重新擬合模型。ARIMA模型建模流程如圖2 所示。
圖2 ARIMA 建模步驟
光伏單站的實際出力時間序列按天氣分類后,分別對不同天氣類型的數(shù)據(jù)樣本進行ARIMA模型建模,作為預(yù)測參考模型對比本文提出的引入空間相關(guān)性后的光伏出力預(yù)測模型。
廣域分布式光伏電站因其具有較多且長時間出力序列數(shù)據(jù),歐式距離的計算量較大,因此本文中使用Spearman 秩相關(guān)系數(shù)來計算2 個電站之間的相關(guān)性,公式如下:
提取同一區(qū)域中所有電站同維度的歷史出力數(shù)據(jù),基于不同天氣分類的數(shù)據(jù)樣本,分別計算其與待預(yù)測電站歷史出力數(shù)據(jù)的Spearman 秩相關(guān)性系數(shù),篩選相關(guān)系數(shù)大于某一設(shè)定閾值的電站或值最高的N 個光伏電站作為待預(yù)測電站的相關(guān)性從站。本文以其中一個光伏用戶為例,篩選相關(guān)值大于0.8 的光伏電站作為此用戶的相關(guān)性從站,其地理位置(經(jīng)緯度)及Spearman 秩相關(guān)系數(shù)分布如圖3 所示,其中R 代表待預(yù)測光伏電站,其余為相關(guān)性從站,可得相關(guān)性較高的電站均分布在與待預(yù)測電站地理相近的位置,距離越近相關(guān)性越高,這也驗證了局部氣象的一致性。
圖3 相關(guān)性電站的經(jīng)緯度分布
本文改進了單一時間序列的ARIMA 模型,引入多個相關(guān)性光伏電站實際出力數(shù)據(jù)建立待預(yù)測電站的ARIMA 模型,進而提高了模型的預(yù)測精度。
假設(shè)待預(yù)測電站X 有N 個相關(guān)性光伏電站,p,q 為ARIMA 模型的階數(shù),其出力預(yù)測模型為:
式中:εt是當前時刻的隨機干擾;系數(shù)γ=[α0,α(l,x),β(l,x),α(l,i),β(l,i)],1≤i≤N,0≤l≤Ls;可由最小二乘估計法計算出:
為避免X 矩陣維度過高而導(dǎo)致模型計算復(fù)雜,在匹配相關(guān)性電站時可調(diào)整設(shè)定相關(guān)性系數(shù)的閾值,從而控制相關(guān)性從站數(shù)量,以達到簡化模型計算的目的。
數(shù)據(jù)樣本選自某省份地級市具有豐富天氣類型的6—9 月共92 天的分布式光伏實際出力數(shù)據(jù),截取8:00—18:00 為光伏出力的有效時間,采用文獻[23]基于空間相關(guān)性的大規(guī)模分布式用戶光伏分群方法得到的具有氣象一致性區(qū)域劃分,如圖4 所示;在此基礎(chǔ)上,以其中1 個區(qū)域的232 個光伏用戶為例驗證模型的有效性。
圖4 按空間相關(guān)性光伏分群方法得到的具有氣象一致性區(qū)域劃分
首先對每一個用戶的實際出力數(shù)據(jù)進行標幺化,根據(jù)日出力平均水平劃分天氣類型,基于不同天氣類型的光伏出力數(shù)據(jù),計算待預(yù)測電站與其他電站歷史出力數(shù)據(jù)的秩相關(guān)系數(shù),選取且相關(guān)性最好的5 個電站為相關(guān)性從站引入基于空間相關(guān)性的ARIMA 模型中,建立不同天氣類型的預(yù)測模型,與氣象部門給出的日預(yù)報天氣類型對照,選擇相應(yīng)天氣類型的預(yù)測模型進行出力預(yù)測。若未匹配到相關(guān)性電站,則利用待預(yù)測電站自身出力數(shù)據(jù)劃分天氣類型進行ARIMA 建模。其預(yù)測流程如圖5 所示。
以某區(qū)域某一光伏用戶為例,其歷史最大功率為3.175 9 kW,出力數(shù)據(jù)經(jīng)標幺化后,根據(jù)日出力平均水平對其出力數(shù)據(jù)按天氣分類并分別建立只利用本站出力歷史數(shù)據(jù)而建立的ARIMA 模型(參考模型),其不同天氣類型的分類指標和模型參數(shù)如表1 所示。
表1 天氣類型和對應(yīng)模型參數(shù)
含本站以及空間相關(guān)電站功率歷史數(shù)據(jù)建立的本站ARIMA 功率預(yù)測模型,稱為基于空間相關(guān)性的預(yù)測模型,并將其與參考模型進行對比:圖6(a)給出了某一典型光伏某月31 天實測和預(yù)測功率曲線,圖6(b)顯示了其中某天的實測功率和2 條預(yù)測功率,可得引入空間相關(guān)性后,光伏出力預(yù)測精度有了明顯提高。
圖5 基于空間相關(guān)性的ARIMA 模型預(yù)測框架
圖6 某典型電站預(yù)測與實測功率曲線
從圖6 可得出,某些時刻的相關(guān)性預(yù)測出力仍存在一定的偏差;而日發(fā)電量是光伏電站發(fā)電有效時間出力的累計值,它表征光伏一天的運行狀態(tài)和工作效率,因此本文在此基礎(chǔ)上統(tǒng)計了光伏用戶的日發(fā)電量的預(yù)測結(jié)果,對比曲線如圖7所示,可得在日電量預(yù)測上模型的精度很高,可滿足工程應(yīng)用的需求。
圖7 日發(fā)電量對比曲線
本文研究統(tǒng)計了區(qū)域中所有光伏電站為期一個月的出力預(yù)測誤差,并使用預(yù)測模型中常用的誤差指標來評估模型對于區(qū)域整體的預(yù)測效果,其計算公式如下。
均方根誤差為:
平均絕對誤差為:
引用誤差為:
式中:PE為光伏電站的額定功率。
預(yù)測曲線與實際曲線的相關(guān)性系數(shù)為:
圖8 描述了該區(qū)域232 個電站連續(xù)滾動預(yù)測曲線與實際曲線的多誤差指標按照電站額定功率的對比情況,表2 給出了誤差指標均值和離散度,表3 計算了RMSE 和MAE 2 項指標與電站額定功率的關(guān)聯(lián)關(guān)系,結(jié)合圖8、表2 和表3,可得:
(1)RMSE 和MAE 具有很大的關(guān)聯(lián)性。
(2)在為期31 天的預(yù)測里,陰天和多云天氣占比較多,且2 種天氣下光伏的出力波動較大,從而導(dǎo)致RMSE 和MAE 波動較大。
(3)RMSE 和MAE 隨額定功率增加逐漸增大,且呈現(xiàn)出正相關(guān),因此RMSE 和MAE 作為預(yù)測評價指標較為片面。
(4)引用誤差作為分布式光伏預(yù)測新的評價方法,很好地規(guī)避了在出力較小時刻的誤差影響,體現(xiàn)了高功率輸出的預(yù)測精度,因而更為合適。
圖8 區(qū)域內(nèi)所有電站的月預(yù)測誤差統(tǒng)計
表2 誤差指標均值和離散度
表3 誤差指標相關(guān)度
通過分析,光伏日出力曲線高功率部分的預(yù)測精度更為關(guān)鍵,因此本文提出采取引用誤差作為預(yù)測模型的評價計算方法,且通過與均方根誤差、平均絕對誤差、相關(guān)性系數(shù)進行對比,驗證了引用誤差的優(yōu)勢。
在分布式光伏預(yù)測方面,本文首先基于作者提出的空間相關(guān)性大規(guī)模分布式用戶光伏分群方法劃分氣象一致性區(qū)域;之后基于不同天氣類型下光伏實際出力數(shù)據(jù),選取同一區(qū)域中具有空間相關(guān)性的光伏電站,改進了ARIMA 模型,并結(jié)合算例分析驗證了模型對廣域分布式光伏用戶預(yù)測出力的實用性和準確性。