楊劍文 朱 林 林凌雪 吳子龍 陳元櫸 陳展綸
(1.華南理工大學(xué) 電力學(xué)院,廣州 510640;2.廣東電網(wǎng)有限責(zé)任公司 廣州供電局,廣州 510600)
長期負(fù)荷預(yù)測是電力公司系統(tǒng)規(guī)劃活動的基礎(chǔ)[1],能引導(dǎo)電力公司以經(jīng)濟(jì)有效的方式規(guī)劃長期的基礎(chǔ)設(shè)施升級或改造.配網(wǎng)饋線長期預(yù)測是其中的重要一環(huán)[2-3],必須加以重視.國內(nèi)外對長期負(fù)荷預(yù)測進(jìn)行了大量的研究,文獻(xiàn)[4]提出了一種堆疊長短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)模型,對多尺度的負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測,文獻(xiàn)[5]提出了一種基于歷史天氣的區(qū)域電網(wǎng)負(fù)荷預(yù)測模型,文獻(xiàn)[6]采用元胞自動機(jī)技術(shù)對農(nóng)村用電負(fù)荷進(jìn)行預(yù)測,文獻(xiàn)[7]基于有序充電思路利用非線性規(guī)劃算法對居民區(qū)電動汽車進(jìn)行中長期充電負(fù)荷預(yù)測,文獻(xiàn)[8]采用支持向量機(jī)和改進(jìn)灰色GM(1,1)模型實(shí)現(xiàn)了中長期氫負(fù)荷預(yù)測.
總的來說,長期負(fù)荷預(yù)測方法可分為自上而下和自下而上兩種模式.自上而下預(yù)測模式側(cè)重于預(yù)測整體層面的用電量.例如,文獻(xiàn)[9-11]采用單變量回歸模型ARIMA 模型來直接分析負(fù)荷變化趨勢,但忽略了經(jīng)濟(jì)、人口和天氣等外部變量的驅(qū)動力.為了解決這一不足,也有學(xué)者引入多元回歸模型分析這些外部變量與負(fù)荷變化之間的關(guān)系,如模糊神經(jīng)網(wǎng)絡(luò)(FNN)[12-15],BP神經(jīng)網(wǎng)絡(luò)[16-17]和隨機(jī)森林模型[18-19]等.此類方法適合預(yù)測區(qū)域負(fù)荷整體水平的場景,但沒有考慮饋線的特征信息,故而應(yīng)用于配電饋線預(yù)測時(shí)會存在一定不足,例如在整體負(fù)荷分配給各個(gè)饋線的過程中,無法明確各饋線之間的關(guān)系,而配電線路峰值需求受負(fù)荷的影響較大,這樣必然與整體負(fù)荷有較大偏差.因此,針對配網(wǎng)饋線的長期負(fù)荷預(yù)測需求,自上而下的預(yù)測模式只能為具體饋線的預(yù)測和調(diào)整提供整體參考.自下而上的預(yù)測模式通過收集底層饋線負(fù)載信息來進(jìn)行[20].負(fù)載信息通過直接統(tǒng)計(jì)用戶負(fù)荷來獲得,通過新負(fù)荷的預(yù)期大小來估計(jì)每年饋線負(fù)荷變化,實(shí)際工作中會聚焦對饋線負(fù)荷變化影響巨大的大客戶負(fù)載變化,但客戶信息不可靠或預(yù)測期間客戶計(jì)劃的變化均會影響預(yù)測結(jié)果.文獻(xiàn)[21-22]提出了一種基于部分負(fù)荷預(yù)測的方法,即先將部分負(fù)荷分別預(yù)測,然后再聚合到整體進(jìn)行集群預(yù)測,但該方法依然沒有考慮到外部因素對負(fù)荷變化的影響.
由上述分析可知,面對饋線長期負(fù)荷預(yù)測采用單一預(yù)測模式均會存在不足:自上而下的預(yù)測模式會忽略饋線的特征信息,只能為具體饋線的峰值預(yù)測提供整體參考;而自下而上的預(yù)測模式又缺乏考慮外部因素對負(fù)荷的驅(qū)動作用.事實(shí)上,將兩種模式下的特征以及歷史負(fù)荷數(shù)據(jù)有效地融合,是打破目前工作瓶頸的有效途徑.
本文提出了一種基于RNN-RBM 模型的配網(wǎng)饋線長期負(fù)荷預(yù)測方法,基本思路如圖1所示.
圖1 配網(wǎng)饋線長期負(fù)荷預(yù)測基本思路
輸入數(shù)據(jù)包括自上而下特征(經(jīng)濟(jì)、人口和溫度等)、自下而上特征(大客戶負(fù)荷和饋線負(fù)載組成)以及歷史負(fù)荷數(shù)據(jù).首先,通過參考文獻(xiàn)[23]的方法對歷史負(fù)荷數(shù)據(jù)進(jìn)行缺失值插值和異常數(shù)據(jù)剔除,完成相關(guān)數(shù)據(jù)預(yù)處理工作.其次,將不同類型的特征歸一化到同一數(shù)值尺度,再運(yùn)用主成分分析對相關(guān)特征進(jìn)行降維,提高模型訓(xùn)練效率,避免過擬合問題,提出虛擬饋線方法解決負(fù)荷轉(zhuǎn)移問題.再次,通過模型評估和網(wǎng)絡(luò)參數(shù)調(diào)整,建立RNN-RBM 預(yù)測模型.然后,將處理好的數(shù)據(jù)和特征輸入模型進(jìn)行預(yù)測.最后,根據(jù)選用的評價(jià)指標(biāo)進(jìn)行預(yù)測結(jié)果分析.
特征選擇是建立預(yù)測模型的第一步,目的是分析和選擇與問題相關(guān)的原始特征.本文從自上而下和自下而上兩個(gè)方面選擇了與配電饋線需求相關(guān)的特征.
2.1.1 自上而下的特征
自上而下的特征描述了預(yù)測區(qū)域的總體驅(qū)動因素,會考慮年經(jīng)濟(jì)、人口和溫度特征.其中,歷史和未來的經(jīng)濟(jì)和人口特征通??梢詮恼畽C(jī)構(gòu)公開的信息獲得,而歷史溫度來自氣象統(tǒng)計(jì)數(shù)據(jù).
1)經(jīng)濟(jì)特征:與短期電力需求不同,長期電力需求與當(dāng)?shù)亟?jīng)濟(jì)密切相關(guān).本文主要考慮年實(shí)際地區(qū)生產(chǎn)總值增長率(%)特征和總就業(yè)增長率(%)特征.
2)人口特征:人口規(guī)模顯著影響住宅負(fù)荷增長.即使經(jīng)濟(jì)放緩,穩(wěn)定的人口規(guī)模仍然可以支撐穩(wěn)定的住宅負(fù)荷水平.此外,人口增長可能導(dǎo)致住宅開發(fā),進(jìn)而促進(jìn)電力發(fā)展.而且作為人口的一部分,勞動力反過來影響經(jīng)濟(jì)活動,并與總就業(yè)增長有關(guān).因此,本文選擇人口增長率(%)作為人口特征.
3)溫度特征:一般選擇夏季最高溫度或者冬天最低溫度.因?yàn)橄募居秒姼叻搴投居秒姼叻迮c制冷和制熱用電的極端溫度相一致.考慮到制冷幾乎全是依賴于電力能源,但制熱可能依賴于其他能源,比如天然氣,所以本文采用夏季最高溫度作為溫度特征.
2.1.2 自下而上的特征
自下向上的特性描述了詳細(xì)的饋線層信息,本文將考慮大客戶凈負(fù)荷變化和饋線負(fù)荷組成.
1)大客戶凈負(fù)荷變化:指的是饋線上所有大客戶的預(yù)計(jì)凈負(fù)荷變化,即饋線上來自大客戶的所有報(bào)告的負(fù)荷變化的總和.其中大客戶包括工廠、購物中心、辦公樓和新住宅區(qū).
2)饋線負(fù)載組成:配電饋線上有不同類型的負(fù)載,考慮住宅負(fù)載、商業(yè)負(fù)載和工業(yè)負(fù)載3類.其中,住宅負(fù)荷與溫度和人口的關(guān)系更大,工業(yè)負(fù)荷與經(jīng)濟(jì)的關(guān)系更大.
饋線住宅峰值負(fù)荷百分比Z的計(jì)算見式(1):
式中:PF是前一年的饋線高峰負(fù)荷為住宅負(fù)荷i在前一年饋線峰值時(shí)刻的負(fù)荷;n是此饋線上住宅負(fù)載的總數(shù).
饋線商業(yè)峰值負(fù)荷百分比S的計(jì)算見式(2):
式中:PF是前一年的饋線高峰負(fù)荷為商業(yè)負(fù)荷i在前一年饋線峰值時(shí)刻的負(fù)荷;m是此饋線上商業(yè)負(fù)載的總數(shù).
工業(yè)負(fù)荷百分比G可由式(3)計(jì)算得出:
最終,初步選擇的特征見表1.
表1 模型初選特征
特征處理是將以上討論的原始特征轉(zhuǎn)化為合適的特征,以便輸入到之后的訓(xùn)練模型中.其目的是消除數(shù)據(jù)噪聲,降低模型復(fù)雜度,提高模型精度.
2.2.1 歸一化處理
上述討論的特征使用不同的單位量綱,它們之間有很大的幅度差異,因此還需要?dú)w一化處理.本文選用最小-最大歸一化方法,見式(4),可將特征歸一化到[0,1]的取值范圍.
式中:特定特征Xnorm是歸一化之后的值;XRaw是歸一化前的值;Xmax是該特征的最大觀測值;Xmin是該特征的最小觀測值.
2.2.2 特征主成分分析
表1中的特征雖然體現(xiàn)在不同領(lǐng)域、不同方面,但是也存在內(nèi)部聯(lián)系.例如,就業(yè)增長可以刺激國內(nèi)生產(chǎn)總值增長,亦導(dǎo)致在人口、可支配收入上的增長.考慮到特征間的關(guān)聯(lián),可以依據(jù)主成分分析來聚合降維,不僅降低特征間的冗余信息,而且可縮短模型訓(xùn)練時(shí)間,提升整體效率.
本文采用文獻(xiàn)[24]所提的主成分分析法,將在常規(guī)正交坐標(biāo)系的變量通過矩陣變換操作映射到另一個(gè)正交坐標(biāo)系中的主元,從而減少了變量間的線性相關(guān)性.設(shè)有n組數(shù)據(jù),每組數(shù)據(jù)有p個(gè)變量.基本步驟如下:
1)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理
在實(shí)際應(yīng)用時(shí),指標(biāo)的量綱往往不同,所以在進(jìn)行主成分計(jì)算之前先要進(jìn)行標(biāo)準(zhǔn)化處理,通過數(shù)據(jù)變換來消除量綱的影響,見式(5):
式中,i=1,2,…,n;j=1,2,…,p.
無論是歌舞音樂還是說唱音樂,其少數(shù)民族音樂都有著十分強(qiáng)烈的民族特性:感情深沉、氣息寬闊、旋律優(yōu)美。就表現(xiàn)形式來看,有豐富的長短調(diào)民歌以及民族歌舞劇、歌舞音樂、說唱音樂等,這些音樂表現(xiàn)形式都具有十分強(qiáng)烈的民族性。就內(nèi)容來看,有著十分豐富的種類,如兒歌、敘事歌、短歌、禮俗歌、思鄉(xiāng)曲、贊歌、狩獵歌;舞蹈有孔雀舞、甩發(fā)舞、蜂桶鼓舞、象腳鼓舞等,這些內(nèi)容將民族音樂特點(diǎn)以及民族文化傳統(tǒng)都淋漓盡致地體現(xiàn)出來。就風(fēng)格來看,其音樂多是旋律明快、節(jié)奏活潑,民族氣息強(qiáng)烈,歌曲的曲風(fēng)表現(xiàn)也非常明顯突出。
2) 建立相關(guān)矩陣R,見式(7):
式中:Y為標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣.
求特征值和特征向量,并將特征向量按照特征值大小進(jìn)行排序,組成特征向量矩陣α:
3)計(jì)算累積方差貢獻(xiàn)率β(k),通過β(k)>95%篩選出k個(gè)獨(dú)立特征:
4)獲得主成分矩陣Z=Yα
利用主成分分析,在累積方差貢獻(xiàn)率為95.85%下可將就業(yè)增長率、GDP 增長率、人口增長率、人均可支配收入這4個(gè)特征壓縮為2個(gè)獨(dú)立特征,見表2.進(jìn)行特征處理后的最終模型輸入特征見表3.
表2 特征主成分分析
表3 最終模型輸入特征
2.2.3 虛擬饋線方法
在實(shí)踐中,影響?zhàn)伨€峰值特性的一種重要數(shù)據(jù)噪聲來自相鄰饋線之間的負(fù)荷轉(zhuǎn)移情況.例如,當(dāng)饋線A 的負(fù)荷接近其容量約束時(shí),會將位于饋線A 的饋線分支上的用戶轉(zhuǎn)移到相鄰的饋線B上,以便饋線A和B 可以繼續(xù)可靠地為其用戶提供服務(wù).這種情況下,負(fù)荷轉(zhuǎn)移使饋線A 的負(fù)荷突然下降,饋線B的負(fù)荷突然上升.這種變化偏離了之前饋線和饋線的負(fù)荷趨勢,與前面討論的自上而下和自下而上的特征無關(guān).
為了解決這一問題,本文提出了虛擬饋線的概念.該方法將保證饋線負(fù)荷特征趨勢的連續(xù)性.對于存在負(fù)荷轉(zhuǎn)移情況的饋線,可以生成一個(gè)虛擬饋線,其負(fù)荷值為發(fā)生負(fù)荷轉(zhuǎn)移事件的相鄰饋線的平均值,見式(11):
其中:PV為虛擬饋線的最大峰值負(fù)荷值;Pi為發(fā)生負(fù)荷轉(zhuǎn)移的第i條饋線的最大峰值負(fù)荷值,p一般為2.
配網(wǎng)饋線長期負(fù)荷預(yù)測問題需要分析輸入的負(fù)荷數(shù)據(jù)和特征信息的高維時(shí)序非線性映射關(guān)系.同時(shí),長期負(fù)荷預(yù)測數(shù)據(jù)大都是以年為計(jì)量單位來統(tǒng)計(jì)的,存在數(shù)據(jù)稀疏問題.
RNN 有著強(qiáng)大的記憶功能,方便處理任意時(shí)序的輸入序列,可以捕獲多變量時(shí)間序列之間的時(shí)間自相關(guān)特征;而RBM 有強(qiáng)大的無監(jiān)督學(xué)習(xí)能力,能夠描繪數(shù)據(jù)中復(fù)雜的規(guī)則,可以有效擬合離散分布.可以結(jié)合RNN 和RBM 的特點(diǎn)來構(gòu)造出RNN-RBM模型[25],該模型不僅可以更全面地分析特征與負(fù)荷變化的內(nèi)在聯(lián)系,而且還可以將離散特征序列映射到連續(xù)空間來評估下一樣本出現(xiàn)的概率,從而解決數(shù)據(jù)稀疏的問題.可見,RNN-RBM 模型的優(yōu)勢非常契合配網(wǎng)饋線長期負(fù)荷預(yù)測的場景需求.
將第2節(jié)處理好的負(fù)荷數(shù)據(jù)和特征輸入給RNN網(wǎng)絡(luò),由RNN 網(wǎng)絡(luò)來進(jìn)行時(shí)序特征處理,輸出值作為RBM 的輸入.利用RBM 強(qiáng)大的描繪復(fù)雜分布的能力,以無監(jiān)督的模式訓(xùn)練輸入進(jìn)來的樣本,從而生成新的樣本空間,最終進(jìn)行預(yù)測.RNN-RBM 模型如圖2所示.
圖2 RNN-RBM 模型
在圖2所示的結(jié)構(gòu)圖中,紅色框內(nèi)是沿時(shí)序展開的RNN 網(wǎng)絡(luò),每一個(gè)藍(lán)色框內(nèi)是一個(gè)RBM.模型中,h(T),v(T)和分別為RBM 隱藏層、RBM 可 見層和RNN 網(wǎng)絡(luò)中包含的神經(jīng)元個(gè)數(shù)為RBM隱藏層的偏置向量為RBM 可見層的偏置向量;W為RBM 隱藏層和可見層之間的權(quán)重;W2為RBM 可見層與RNN 網(wǎng)絡(luò)中相對應(yīng)神經(jīng)元之間的權(quán)重;W3為RNN 網(wǎng)絡(luò)中神經(jīng)元之間的權(quán)重;W'為RBM 隱藏層與RNN 網(wǎng)絡(luò)神經(jīng)元之間的權(quán)重;W″為RBM 可見層與RNN 網(wǎng)絡(luò)神經(jīng)元之間的權(quán)重.
從圖中可以看出,模型當(dāng)前時(shí)間步長的輸出不僅基于當(dāng)前輸入,而且還基于之前的時(shí)間步長信息,非常適用于預(yù)測問題.正如饋線長期負(fù)荷預(yù)測問題,當(dāng)前的電力需求往往不僅與當(dāng)年有關(guān),還與過去幾年的條件和勢頭有關(guān).
h和v之間相互生成的條件概率,見式(12)、(13):
其 中:σ為sigmoid函 數(shù).
RNN-RBM 的聯(lián)合概率分布見式(14):
式中:P(v(t),h(t)|A(t))代表第t個(gè)RBM 的聯(lián)合概率,參數(shù)由式(15)~(17)定義:
式中:A(t)為所有t時(shí)刻之前的{v,h}集合,其中為h(t)的平均值.
RNN 部分就是一個(gè)單層的沿時(shí)序展開的RNN網(wǎng)絡(luò),隱藏層單元計(jì)算式見式(18):
針對配電網(wǎng)饋線長期負(fù)荷中多特征變量的時(shí)間序列特點(diǎn),本文采用交叉熵作為模型的損失函數(shù),見式(19).
其中:X為輸入數(shù)據(jù)的分布;為擬合模型重構(gòu)數(shù)據(jù)的分布.
該損失函數(shù)通過計(jì)算輸入數(shù)據(jù)與RNN-RBM 模型重構(gòu)數(shù)據(jù)之間的概率分布差異,可以量化模型在訓(xùn)練集中的準(zhǔn)確性.
為了評估預(yù)測的性能,本文設(shè)置平均絕對百分比誤差EMAP為評價(jià)指標(biāo),見式(20):
式中:n為預(yù)測總次數(shù);xact(i)和xpred(i)分別為i時(shí)刻的負(fù)荷真實(shí)值和預(yù)測值.
為了驗(yàn)證本文所提RNN-RBM 模型的有效性和準(zhǔn)確性,算例以廣州市某地區(qū)2009—2020年475條饋線最大峰值負(fù)荷和年度經(jīng)濟(jì)以及氣象數(shù)據(jù)為數(shù)據(jù)集.其中184條存在負(fù)荷轉(zhuǎn)移情況,轉(zhuǎn)換為84條虛擬饋線,有291條饋線不存在負(fù)荷轉(zhuǎn)移情況;選用如表3所示的特征,進(jìn)行負(fù)荷預(yù)測;最后在同一數(shù)據(jù)集的基礎(chǔ)上,將仿真結(jié)果與隨機(jī)森林模型以及LSTM 網(wǎng)絡(luò)模型預(yù)測結(jié)果進(jìn)行對比分析,證明本文所提模型預(yù)測結(jié)果的準(zhǔn)確率更高.
工作站硬件處理器為Intel Xeon E5,內(nèi)存為64 GB,采用Tensorflow 軟件框架(版本1.12.1).模型參數(shù)的具體設(shè)置見表4.
表4 模型參數(shù)設(shè)置
選用文獻(xiàn)[26-29]方法,設(shè)置兩種對比模型的參數(shù).其中,隨機(jī)森林模型中決策樹個(gè)數(shù)為100,最大特征數(shù)為8;而LSTM 循環(huán)神經(jīng)網(wǎng)絡(luò)中隱藏神經(jīng)元24個(gè),輸出神經(jīng)元16個(gè).
對上述模型進(jìn)行訓(xùn)練,限于篇幅,這里僅展示了RNN-RBM 模型的情況,其損失函數(shù)下降曲線如圖3所示.可以看出,RNN-RBM 已經(jīng)訓(xùn)練收斂.另外兩個(gè)模型均也訓(xùn)練收斂.
圖3 RNN-RBM 模型損失函數(shù)下降圖
本文對2020年的饋線負(fù)荷進(jìn)行長期負(fù)荷預(yù)測,圖4為不同算法模型預(yù)測值與實(shí)際值的對比圖,其中圖4(a)為所有饋線預(yù)測值與實(shí)際值的對比圖,圖4(b)為其中節(jié)選的20條饋線的預(yù)測值與真實(shí)值的對比圖.圖5為某條饋線歷史數(shù)據(jù)與預(yù)測年(2020年)真實(shí)數(shù)據(jù)、各模型預(yù)測結(jié)果構(gòu)成的對比圖.從圖中可以看出,通過對樣本特征的深層挖掘與學(xué)習(xí),本文所提的RNN-RBM 模型預(yù)測精度最高.
圖4 不同模型饋線預(yù)測值與實(shí)際值對比圖
圖5 2020年某條饋線歷史數(shù)據(jù)與預(yù)測值對比圖
將不同算法模型下的預(yù)測值與實(shí)際值進(jìn)行匯總比較,并考察引入的EMAP指標(biāo),結(jié)果見表5.可以看出,本文所提模型的精準(zhǔn)度最高.
表5 不同模型預(yù)測結(jié)果
本文提出了一種基于RNN-RBM 網(wǎng)絡(luò)混合模型的配電饋線長期負(fù)荷預(yù)測方法,并在實(shí)際配電網(wǎng)中進(jìn)行了驗(yàn)證,結(jié)果表明:
1)混合采用自上而下和自下而上兩種模式,通過主成分分析來壓縮冗余關(guān)聯(lián),通過虛擬饋線方法解決負(fù)荷轉(zhuǎn)移問題,所構(gòu)造的特征信息可滿足配電網(wǎng)饋線長期負(fù)荷預(yù)測需求.
2)通過RNN-RBM 模型可挖掘負(fù)荷數(shù)據(jù)時(shí)序性和復(fù)雜特征關(guān)系的內(nèi)在關(guān)聯(lián),提升了饋線長期負(fù)荷預(yù)測的精度.
在未來的研究中,本文的相關(guān)研究還可以擴(kuò)展到其他類型的預(yù)測問題上,為配電網(wǎng)的設(shè)計(jì)規(guī)劃和高級分析等提供數(shù)據(jù)基礎(chǔ).