戚任遠(yuǎn)
(上海市經(jīng)濟(jì)和信息化委員會電力處,上?!?00125)
隨著“互聯(lián)網(wǎng)+”智慧能源穩(wěn)步發(fā)展,信息化系統(tǒng)精準(zhǔn)施策將是電力管理新趨勢,對負(fù)荷預(yù)測實(shí)時性、精準(zhǔn)性要求會更高,自動化預(yù)測為必然趨勢。
氣象因素是影響短期負(fù)荷變化的主要因素,對上海用電影響顯著[1-6],上海用電結(jié)構(gòu)具有第三產(chǎn)業(yè)、城鄉(xiāng)居民生活用電比重較大的特點(diǎn),2016年兩者用電量合計(jì)占比達(dá)44.8%[7]。第三產(chǎn)業(yè)多為商業(yè)和服務(wù)業(yè),與居民用電相似,制冷、取暖用電負(fù)荷占比較大,負(fù)荷易受氣溫變化影響。因此基于氣溫變化,推斷下一個工作日最高用電負(fù)荷成為可能。
上海電網(wǎng)負(fù)荷變化與氣溫變化關(guān)系密切,可基于氣溫變化進(jìn)行短期負(fù)荷預(yù)測[5-6]。氣溫?cái)?shù)據(jù)主要有最高溫度、最低溫度兩項(xiàng),用一元線性回歸模型[8]分析2015年每日最高溫度與最低溫度值(數(shù)據(jù)來源于上海市電力公司調(diào)度日報(bào))相關(guān)性得
TH=1.012TL+5.984
(1)
式中:TH、TL分別為日最高、最低溫度,℃。二者關(guān)系如圖1所示,圖中三角圖標(biāo)代表每日最高(低)溫度數(shù)據(jù)點(diǎn),斜線為回歸線。
圖1 2015年日最高溫度與最低溫度關(guān)系圖
使用t檢驗(yàn)法[8]進(jìn)行線性假設(shè)的顯著性檢驗(yàn),可得線性無關(guān)假設(shè)的拒絕域?yàn)?/p>
(2)
由2015年氣溫?cái)?shù)據(jù)計(jì)得|t|=57.21,取顯著性水平α=0.01,得tα/2(n-2)=2.59,顯然|t|>tα/2(n-2),故拒絕線性無關(guān)假設(shè),認(rèn)為回歸效果顯著,即日最高溫度與最低溫度線性相關(guān)。
多元回歸分析中,若自變量相關(guān)度高會發(fā)生多重共線問題[9],重復(fù)相關(guān)關(guān)系使回歸結(jié)果被歪曲,喪失可靠性。因此不能同時將日最高溫度、最低溫度作為自變量供預(yù)測用。
由于上海電網(wǎng)夏季最高用電負(fù)荷多在午峰(14:00左右),其他三季多在早峰(10:30左右),所對應(yīng)的氣溫值接近最高溫度,因此選日最高溫度為氣溫特征供負(fù)荷預(yù)測用。
上海最高用電負(fù)荷短期變化受制冷取暖需求影響顯著,與室內(nèi)溫度變化直接相關(guān),受建筑物熱惰性、儲能等特性作用,建筑物內(nèi)溫度變化往往滯后于外界溫度變化,需要綜合考量近期氣溫值,這是短期負(fù)荷預(yù)測需要考慮氣溫累積效應(yīng)的主要原因。
采用預(yù)測當(dāng)日最高溫度與前兩日最高氣溫加權(quán)平均法分析日最高用電負(fù)荷預(yù)測中氣溫累積效應(yīng),觀察加權(quán)平均后氣溫與負(fù)荷相關(guān)性變化。預(yù)測當(dāng)日最高溫度經(jīng)加權(quán)平均修正后:
T=aT0+bT1+cT2
(3)
滿足:a+b+c=1,a,b,c≥0。式中:T為修正后的預(yù)測當(dāng)日最高溫度;T0為預(yù)測當(dāng)日最高溫度;T1為前一天最高溫度;T2為前二天日最高溫度;a、b、c為權(quán)重參數(shù)。
考慮負(fù)荷預(yù)測工作重點(diǎn)預(yù)測夏、冬兩季用電高峰期最高用電負(fù)荷,因此取電力迎峰度夏(冬)期間工作日負(fù)荷與溫度數(shù)據(jù)(源于上海市電力公司調(diào)度日報(bào),電力迎峰度夏期間為2015年6月15日至9月22日,電力迎峰度冬期間為2014年12月15日至2015年3月24日),分析最高溫度修正后與日最高用電負(fù)荷相關(guān)性是否增強(qiáng)。
首先分析夏季負(fù)荷,以每日最高用電負(fù)荷、最高溫度為數(shù)據(jù)點(diǎn)(三角圖標(biāo))繪制散點(diǎn)圖(圖2)。由于日最高用電負(fù)荷氣象變化量隨日最高溫度的升高而增加[4],因此考慮采用多項(xiàng)式進(jìn)行曲線擬合:
(4)
式中:Lm為日最高用電負(fù)荷;T0為當(dāng)日最高溫度;b0、b1、b2為參數(shù),用二元線性回歸模型[8]可算得相應(yīng)參數(shù)值,回歸線如圖2中曲線所示。
圖2 迎峰度夏期間日最高用電負(fù)荷與最高溫度關(guān)系圖
采用窮舉法二維搜索參數(shù)a、b、c全局最優(yōu)值,使日最高用電負(fù)荷與修正后的日最高溫度相關(guān)度最大。即a從0到1范圍搜索,b從0到1-a范圍搜索,c=1-a-b,步進(jìn)0.01。編程算法過程如下:
① 參數(shù)a從0到1范圍搜索,每次步進(jìn)0.01;
② 參數(shù)b從0到1-a范圍搜索,每次步進(jìn)0.01;
③ 參數(shù)c取值 1-a-b;
④ 用公式(3)對日最高溫度進(jìn)行修正;
⑤ 采用二元線性回歸模型對日最高用電負(fù)荷與修正后的日最高溫度數(shù)據(jù)進(jìn)行多項(xiàng)式曲線擬合;
⑥ 計(jì)算擬合后的剩余平方和(殘差的平方和)并與歷次剩余平方和最小值進(jìn)行比較,如果本次計(jì)得結(jié)果較小,用本次結(jié)果替代剩余平方和最小值;
⑦ 重復(fù)第2步,至搜索結(jié)束;
⑧ 重復(fù)第1步,至搜索結(jié)束;
⑨ 最優(yōu)參數(shù)值為剩余平方和最小值所對應(yīng)的a、b、c值。
算得參數(shù)最優(yōu)值:a=0.5,b=0.33,c=0.17,以此修正日最高溫度。修正后相關(guān)性變化如圖3所示,數(shù)據(jù)點(diǎn)與回歸曲線的距離較修正前(圖2)更為緊密。以相關(guān)指數(shù)為擬合精度分析指標(biāo),相關(guān)指數(shù)[2]:
(5)
式中:Q為剩余平方和;Lyy為總偏差平方和;修正前相關(guān)指數(shù)R2為0.74,修正后提升至0.79,可見相關(guān)性得到了增強(qiáng)。
圖3 迎峰度夏期間日最高用電負(fù)荷與修正后的最高溫度關(guān)系圖
以圖2中右上方空心三角圖標(biāo)數(shù)據(jù)點(diǎn)為例,修正前日最高溫度在37.4~37.8 ℃,基本相同,但最高用電負(fù)荷值迥異,最小2 649萬 kW,最大2 981.9萬kW,相差332.9萬kW。負(fù)荷變化與氣溫基本不相關(guān),若不修正日最高溫度將無法準(zhǔn)確預(yù)測用電負(fù)荷。
比較空心三角圖標(biāo)數(shù)據(jù)點(diǎn)前兩日氣溫發(fā)現(xiàn),負(fù)荷值高的點(diǎn)前期氣溫較高,負(fù)荷值低的點(diǎn)前期氣溫略低,如負(fù)荷值最小點(diǎn)前兩日最高溫度為34.5 ℃、36.5 ℃,而最大點(diǎn)前兩日最高溫度為38 ℃、37.9 ℃。因?yàn)榻ㄖ锏臒岫栊允故覂?nèi)溫度變化滯后于外界溫度變化,準(zhǔn)確推斷制冷用電負(fù)荷變化需要綜合前期氣溫狀況。修正后的數(shù)據(jù)點(diǎn)如圖3空心三角圖標(biāo)所示,綜合前兩日氣溫特點(diǎn)后,日最高溫度能更好體現(xiàn)制冷用電需求差異,負(fù)荷與氣溫呈現(xiàn)明顯的相關(guān)性,這有利于提高負(fù)荷預(yù)測水平。
采取同樣的方法分析電力迎峰度冬期間工作日數(shù)據(jù),并剔除春節(jié)前后因部分工廠停工、公司歇業(yè)等造成負(fù)荷偏低的數(shù)據(jù)點(diǎn)。由于冬季取暖設(shè)備用能多樣化,因此使用一元線性回歸模型進(jìn)行曲線擬合。計(jì)得參數(shù)最優(yōu)值:a=0.44,b=0.24,c=0.32,以此修正日最高溫度。
修正前后相關(guān)性變化如圖4、圖5所示,修正后數(shù)據(jù)點(diǎn)與回歸線的距離更為緊密,相關(guān)指數(shù)也從0.52提升至0.76,相關(guān)性得到了明顯增強(qiáng)。
圖4 迎峰度冬期間日最高用電負(fù)荷與最高溫度關(guān)系圖
圖5 迎峰度冬期間日最高用電負(fù)荷與修正后的最高溫度關(guān)系圖
以圖4中左上方空心三角圖標(biāo)數(shù)據(jù)點(diǎn)為例,最高用電負(fù)荷值從小到大分別為2 148.8萬kW、2 175.5萬kW、2 220.2萬kW,有明顯差別,但修正前日最高溫度相同(8.8 ℃),無法有效分辨冬季取暖用電負(fù)荷變化。
比較空心三角圖標(biāo)數(shù)據(jù)點(diǎn)前兩日氣溫發(fā)現(xiàn),負(fù)荷值高的點(diǎn)前期氣溫偏低,負(fù)荷值低的點(diǎn)前期氣溫較高,如負(fù)荷值最小點(diǎn)前兩日最高溫度為10 ℃、8.4 ℃,而最大點(diǎn)前兩日最高溫度為7.7 ℃、6.2 ℃。因此準(zhǔn)確推斷取暖用電負(fù)荷變化需要綜合前期氣溫狀況。修正后的數(shù)據(jù)點(diǎn)如圖5空心三角圖標(biāo)(箭頭所指位置)所示,綜合前兩日氣溫特點(diǎn)后,日最高溫度能更好體現(xiàn)取暖用電需求差異,負(fù)荷與氣溫相關(guān)性明顯提升。
為防止過擬合,參照“近大遠(yuǎn)小”原則[2],即離預(yù)測日越近,權(quán)重越大。本文取a=0.5,b=0.3,c=0.2為全年氣溫累積效應(yīng)的權(quán)重參數(shù)。并通過計(jì)算2015年每月工作日最高用電負(fù)荷與最高溫度的相關(guān)系數(shù),分析參數(shù)設(shè)定是否適用于全年。相關(guān)系數(shù)ρLT按以下公式計(jì)算:
(6)
式中:Cov(L,T)為最高用電負(fù)荷與最高溫度的協(xié)方差;D(L)為最高用電負(fù)荷的方差;D(T)為最高溫度的方差。計(jì)算結(jié)果如表1所示。
表1 日最高用電負(fù)荷與最高溫度相關(guān)系數(shù)表
可知,除9月份略有下降外,最高溫度修正后各月相關(guān)性得到了較好的提升,尤其是夏冬用電高峰兩季。因此采用上述參數(shù)值對當(dāng)日最高氣溫進(jìn)行修正,有助于提升日最高負(fù)荷與最高氣溫值之間的相關(guān)性,將有利于負(fù)荷預(yù)測的精度。
此外,各月份日最高用電負(fù)荷與最高溫度相關(guān)程度迥然不同,季節(jié)性差異顯著。5~10月日最高用電負(fù)荷與最高溫度呈現(xiàn)正相關(guān),其他月份呈現(xiàn)負(fù)相關(guān)。
本文基于日最高用電負(fù)荷變化與最高溫度變化相關(guān),采用決策樹模型[10-12],選取2014、2015年市電力公司調(diào)度日報(bào)數(shù)據(jù)生成訓(xùn)練集,進(jìn)行監(jiān)督學(xué)習(xí)生成決策樹,后預(yù)測2016年日最高用電負(fù)荷,并與實(shí)際值比較分析誤差。
先按公式(3)修正2014、2015年日最高溫度,后篩選工作日負(fù)荷數(shù)據(jù)。篩去由偶發(fā)因素引起日最高用電負(fù)荷突變的記錄,剔除春節(jié)前后因部分工廠停工、公司歇業(yè)等造成負(fù)荷偏低的記錄,去除不符合月度正(負(fù))相關(guān)性規(guī)律的歷史記錄,保證監(jiān)督學(xué)習(xí)的準(zhǔn)確性。
以月份、日最高氣溫變化量為自變量,日最高用電負(fù)荷變化量為因變量生成訓(xùn)練樣本,建立訓(xùn)練集。日最高氣溫變化量取與前一工作日的日最高溫度差,日最高用電負(fù)荷變化量取與前一工作日的日最高用電負(fù)荷差。
決策樹的生成采用二分遞歸方式,算法如下:
在根節(jié)點(diǎn)輸入訓(xùn)練集,并調(diào)用生成樹方法;
① 計(jì)算結(jié)點(diǎn)訓(xùn)練集中樣本因變量的均值、方差;
② 若結(jié)點(diǎn)訓(xùn)練集不可劃分,則直接返回(結(jié)束);
③ 從結(jié)點(diǎn)訓(xùn)練集中選擇最優(yōu)劃分變量和劃分點(diǎn),將訓(xùn)練集一分為二;
④ 生成左右子節(jié)點(diǎn),并導(dǎo)入相應(yīng)訓(xùn)練集;
⑤ 調(diào)用生成樹方法處理左子結(jié)點(diǎn);
⑥ 調(diào)用生成樹方法處理右子結(jié)點(diǎn);
⑦ 返回(結(jié)束)。
訓(xùn)練集劃分涉及負(fù)荷、氣溫等連續(xù)值變量處理。采用方差來度量訓(xùn)練集純度,劃分后信息增益(純度提升):
I(P)=D(P)-qD(L)-(1-q)D(R)
(7)
式中:D(P)為父結(jié)點(diǎn)訓(xùn)練集因變量的方差;D(L)、D(R)分別為劃分后左右子結(jié)點(diǎn)訓(xùn)練集因變量的方差,q為權(quán)重系數(shù),按訓(xùn)練集中樣本劃入左子結(jié)點(diǎn)的比例計(jì)。自變量候選劃分點(diǎn)采用二分法[13],最優(yōu)劃分變量和劃分點(diǎn)按劃分后信息增益最大化選取。結(jié)點(diǎn)訓(xùn)練集不可劃分條件設(shè)為樣本個數(shù)小于2或因變量方差小于100。取葉結(jié)點(diǎn)均值與前一工作日最高用電負(fù)荷之和為預(yù)測結(jié)果。
預(yù)測前采用后剪枝策略[10]降低過擬合風(fēng)險(xiǎn)。選取預(yù)測日前15個工作日數(shù)據(jù)為驗(yàn)證集,強(qiáng)化近期負(fù)荷與氣溫相關(guān)性特點(diǎn),用遞歸方法做剪枝標(biāo)記。算法如下:
根據(jù)劃分條件輸入驗(yàn)證集,并調(diào)用剪枝方法:
①若無子結(jié)點(diǎn),結(jié)點(diǎn)預(yù)測誤差按樣本因變量與當(dāng)前結(jié)點(diǎn)均值的絕對偏差之和計(jì),并返回(結(jié)束);
②調(diào)用剪枝方法處理左子結(jié)點(diǎn);
③調(diào)用剪枝方法處理右子結(jié)點(diǎn);
⑤計(jì)算剪去左(右)子結(jié)點(diǎn)后驗(yàn)證集預(yù)測誤差,即左(右)子節(jié)點(diǎn)驗(yàn)證集因變量與當(dāng)前結(jié)點(diǎn)均值的絕對偏差之和;
⑤若剪枝后預(yù)測誤差小,做剪枝標(biāo)記;反之,則保留;
⑥當(dāng)前結(jié)點(diǎn)預(yù)測誤差以剪枝后最小預(yù)測誤差計(jì);
⑦返回(結(jié)束)。
本次預(yù)測結(jié)束后,清除剪枝標(biāo)記供下次預(yù)測用。
圖6為2016年工作日最高用電負(fù)荷預(yù)測結(jié)果:
圖6 2016年工作日最高用電負(fù)荷預(yù)測誤差分布圖
相對誤差按公式(8)計(jì):
dn=Lp-Lr/Lr×100%
(8)
式中:dn為第n次預(yù)測相對誤差;Lp為負(fù)荷預(yù)測值;Lr為負(fù)荷實(shí)際值。預(yù)測準(zhǔn)確率按公式(9)計(jì)算:
(9)
與傳統(tǒng)決策樹模型相比,考慮氣溫累積效應(yīng)后,文中通過增加兩個環(huán)節(jié)提升氣溫與負(fù)荷相關(guān)性:①按負(fù)荷氣溫正負(fù)相關(guān)性篩選訓(xùn)練集數(shù)據(jù);②與前兩日氣溫值加權(quán)平均修正日最高溫度。傳統(tǒng)決策樹2016年工作日最高用電負(fù)荷預(yù)測結(jié)果如圖7所示。
圖7 2016年工作日最高用電負(fù)荷預(yù)測誤差分布圖(傳統(tǒng)方法)
對比圖6、7可知,考慮氣溫累積效應(yīng)后全年預(yù)測最大相對誤差由17.46%下降至16.54%,平均相對誤差由2.85%下降至2.33%,預(yù)測準(zhǔn)確率由96.1%上升至96.7%??梢娍紤]氣溫累積效應(yīng)可整體提高負(fù)荷預(yù)測水平。
氣溫累積效應(yīng)對負(fù)荷預(yù)測的影響顯著體現(xiàn)在夏冬兩季,7、8月份平均相對誤差由3.29%下降至2.70%;1、2月份平均相對誤差由3.22%下降至1.91%。但對春秋兩季負(fù)荷預(yù)測影響不明顯,相對誤差相近。
此外,負(fù)荷預(yù)測誤差產(chǎn)生有偶發(fā)因素,如產(chǎn)業(yè)結(jié)構(gòu)調(diào)整、部分停工或突發(fā)事件等。最大相對誤差在8月30日,當(dāng)日最高用電負(fù)荷驟降,與氣溫變化無關(guān)。其他氣象因素對負(fù)荷變化也有影響,如降水、濕度、風(fēng)速等,若有相關(guān)數(shù)據(jù),可相應(yīng)修正預(yù)測結(jié)果[5]。
節(jié)假日最高用電負(fù)荷變化規(guī)律較為固定,尤其是春節(jié)、國慶等長假,負(fù)荷預(yù)測可參照歷年同期規(guī)律進(jìn)行預(yù)判。
上海用電負(fù)荷預(yù)測中考慮氣溫累積效應(yīng),能有效增強(qiáng)負(fù)荷與氣溫的相關(guān)性,提高預(yù)測準(zhǔn)確度。經(jīng)實(shí)驗(yàn),基于決策樹模型預(yù)測下一工作日最高用電負(fù)荷取得較好結(jié)果,可供管理部門自動化預(yù)測用。
[1]牛東曉, 曹樹華, 盧建昌, 等. 電力負(fù)荷預(yù)測技術(shù)及其應(yīng)用[M].2版. 北京: 中國電力出版社, 2009.
[2]康重慶, 夏清, 劉梅. 電力系統(tǒng)負(fù)荷預(yù)測[M].2版. 北京: 中國電力出版社, 2017.
[3]華蘊(yùn)芳. 上海氣溫變化對用電負(fù)荷的影響[J]. 上海節(jié)能, 2007(2): 14-15.
[4]賀芳芳, 史軍. 上海地區(qū)夏季氣溫變化對用電負(fù)荷的影響[J]. 長江流域資源與環(huán)境, 2011, 20(12): 1462-1467.
[5]王鵬, 邰能靈, 王波, 等. 針對氣象因素的短期負(fù)荷預(yù)測修正方法[J]. 電力系統(tǒng)自動化, 2008, 32(13): 92-96.
[6]忻建華, 翟海青, 葛佳男, 等. 上海市用電負(fù)荷與溫度敏感系數(shù)[J]. 華東電力, 2012, 40(10):1754-1758.
[7]上海市經(jīng)濟(jì)和信息化委員會. 全社會用電量. [2017-5-7]. www.datashanghai.gov.cn(上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)).
[8]盛驟, 謝式千, 潘承毅. 概率論與數(shù)理統(tǒng)計(jì)[M]. 3版. 北京:高等教育出版社, 2002.
[9]姚春艷, 趙寅珠, 王雙副. 統(tǒng)計(jì)學(xué)[M]. 哈爾濱: 哈爾濱工業(yè)大學(xué)出版社, 2015.
[10]周志華. 機(jī)器學(xué)習(xí)[M]. 北京:清華大學(xué)出版社, 2016.
[11]Wu X, Kumar V, Ross Quinlan J, et al. Top 10 algorithms in data mining[J]. Knowledge and Information Systems, 2008, 14(1): 1-37.
[12]Breiman L, Friedman J H, Olshen R A, et al. Classification and regression trees[M]. Wadsworth, Belmont, 1984.
[13]Quinlan J R. C4.5: Programs for machine learning[M]. Morgan Kaufmann, San Mateo, CA., 1993.