劉金源 王壽喜,2 李 嬋. 西南石油大學(xué)石油與天然氣工程學(xué)院, 四川 成都 60500; 2. 西安石油大學(xué)石油工程學(xué)院, 陜西 西安 70065;
3. 中國(guó)石油天然氣股份有限公司天然氣銷售廣東分公司, 廣東 廣州 510330
城市燃?xì)馊肇?fù)荷預(yù)測(cè)是燃?xì)庹{(diào)度系統(tǒng)安全運(yùn)行和管網(wǎng)設(shè)計(jì)優(yōu)化的根基。準(zhǔn)確的日負(fù)荷預(yù)測(cè),不僅關(guān)系到城市燃?xì)夤芫W(wǎng)的儲(chǔ)氣調(diào)峰和規(guī)劃設(shè)計(jì),也為天然氣長(zhǎng)輸管線的投資效益提供了經(jīng)濟(jì)保障,對(duì)未來(lái)燃?xì)庑袠I(yè)的發(fā)展具有非常重要的現(xiàn)實(shí)意義[1]。
近年來(lái),隨著燃?xì)猱a(chǎn)業(yè)的飛速發(fā)展,我國(guó)天然氣消費(fèi)情況始終保持供不應(yīng)求的局面,特別是在2017年冬季國(guó)家“煤改氣”政策的實(shí)施,部分地區(qū)因儲(chǔ)量不足和調(diào)度不及時(shí)等問(wèn)題,大面積出現(xiàn)“氣荒”現(xiàn)象。自此引發(fā)的日用氣量預(yù)測(cè)方法及預(yù)測(cè)準(zhǔn)確性問(wèn)題,開(kāi)始成為當(dāng)前急需解決的難點(diǎn)和熱點(diǎn),正不斷引起社會(huì)各方的緊密關(guān)注[2]。
我國(guó)在城市燃?xì)馊肇?fù)荷預(yù)測(cè)方面的研究正處于逐年增長(zhǎng)階段,得益于人工智能在全球范圍內(nèi)的廣泛應(yīng)用,越來(lái)越多的科研工作者開(kāi)始嘗試將不同種類的人工智能算法以某種方式進(jìn)行組合或優(yōu)化,從而取得較傳統(tǒng)預(yù)測(cè)方法更好的預(yù)測(cè)效果。Demirel O F等人[3]分別采用五種模型對(duì)土耳其某氣源的天然氣消費(fèi)量進(jìn)行預(yù)測(cè),結(jié)果顯示BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果最好;余鳳[4]采用改進(jìn)型粒子群算法(ACLSPSO)對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,得到了更為滿意的結(jié)果;李楠[5]將RBF神經(jīng)網(wǎng)絡(luò)和多元時(shí)間序列法進(jìn)行優(yōu)化組合,提高了某市中長(zhǎng)期負(fù)荷預(yù)測(cè)的精度;曾南[6]利用改進(jìn)的遺傳算法優(yōu)化調(diào)整人工神經(jīng)網(wǎng)絡(luò)的連接權(quán)重和連接開(kāi)關(guān)參數(shù),實(shí)驗(yàn)結(jié)果顯示比BP神經(jīng)網(wǎng)絡(luò)或標(biāo)準(zhǔn)遺傳算法調(diào)節(jié)的帶開(kāi)關(guān)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果準(zhǔn)確;為了提高城市燃?xì)夤芫W(wǎng)短期負(fù)荷預(yù)測(cè)精度,龔承柱等人[7]建立了基于經(jīng)驗(yàn)?zāi)B(tài)分解、相空間重構(gòu)和最小二乘支持向量機(jī)(EMD-PSR-LSSVM)的組合預(yù)測(cè)模型,取得了預(yù)期效果。
人工智能組合預(yù)測(cè)法為預(yù)測(cè)學(xué)科的發(fā)展注入了新鮮血液,推動(dòng)了預(yù)測(cè)領(lǐng)域的發(fā)展和進(jìn)步。本文綜合考慮BP神經(jīng)網(wǎng)絡(luò)、GM灰色預(yù)測(cè)理論和PCA主成分分析三種人工智能算法的優(yōu)缺點(diǎn),提出了將三者優(yōu)勢(shì)進(jìn)行整合的新型組合預(yù)測(cè)模型,通過(guò)對(duì)南樂(lè)縣某氣源的供氣日負(fù)荷進(jìn)行預(yù)測(cè)可知,該組合模型克服了單一預(yù)測(cè)模型的局限性,達(dá)到了進(jìn)一步提升預(yù)測(cè)精度的目的[8-9]。
目前,關(guān)于城市燃?xì)馊肇?fù)荷預(yù)測(cè)的方法較多,除了早期的專家系統(tǒng)法、時(shí)間序列法、多元線性回歸、模糊理論和GM灰色預(yù)測(cè)理論外,BP神經(jīng)網(wǎng)絡(luò)、SVM支持向量機(jī)以及深度學(xué)習(xí)等人工智能算法也被逐步應(yīng)用于預(yù)測(cè)領(lǐng)域的實(shí)驗(yàn)研究。表1選取了時(shí)間序列、GM灰色預(yù)測(cè)模型、BP神經(jīng)網(wǎng)絡(luò)和SVM支持向量機(jī)四種應(yīng)用最為廣泛的城市燃?xì)馊肇?fù)荷預(yù)測(cè)方法進(jìn)行特征對(duì)比分析[10-11]。
表1日負(fù)荷預(yù)測(cè)方法特征對(duì)比表
對(duì)比特征SVM支持向量機(jī)BP神經(jīng)網(wǎng)絡(luò)GM灰色預(yù)測(cè)模型時(shí)間序列異常數(shù)據(jù)修正能力無(wú)無(wú)累加修正法較弱樣本數(shù)量中等較多最少較少是否考慮影響因素是是否否學(xué)習(xí)能力一般較強(qiáng)挖掘數(shù)據(jù)發(fā)展規(guī)律能力較強(qiáng)較弱預(yù)測(cè)結(jié)果擬合度中等擬合度較好規(guī)律性較強(qiáng)規(guī)律性不足
通過(guò)表1對(duì)比分析可知,時(shí)間序列和SVM支持向量機(jī)在樣本數(shù)量和異常數(shù)據(jù)修正能力方面較弱,學(xué)習(xí)能力和預(yù)測(cè)結(jié)果均處于中等水平;相比之下,GM灰色預(yù)測(cè)模型所需樣本數(shù)量最少,擅長(zhǎng)挖掘燃?xì)馊肇?fù)荷數(shù)據(jù)的發(fā)展規(guī)律,預(yù)測(cè)結(jié)果規(guī)律性較強(qiáng),且擁有一定的異常數(shù)據(jù)修正能力;BP神經(jīng)網(wǎng)絡(luò)擁有較強(qiáng)的學(xué)習(xí)能力,可以考慮不同因素對(duì)燃?xì)馊肇?fù)荷值造成的影響,對(duì)預(yù)測(cè)結(jié)果擬合度較好。因此,本文考慮將GM灰色預(yù)測(cè)模型和BP神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢(shì)進(jìn)行整合,試圖創(chuàng)建一種能夠有效提升日負(fù)荷預(yù)測(cè)精度的新型組合預(yù)測(cè)模型[12]。
經(jīng)過(guò)篩選得到的GM灰色預(yù)測(cè)模型和BP神經(jīng)網(wǎng)絡(luò)模型均有其各自的優(yōu)勢(shì)和局限性,但當(dāng)考慮的日負(fù)荷影響因子較多時(shí),組合后的模型依然面臨網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜和訓(xùn)練時(shí)間過(guò)長(zhǎng)等問(wèn)題。因此,為了更好地提高日負(fù)荷預(yù)測(cè)精度,本文引入具有降維特性的PCA主成分分析模型,并對(duì)三種模型的應(yīng)用特征進(jìn)行具體分析[13]。
1)PCA主成分分析模型:可以在盡可能多地保留原始變量信息的前提下,把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合性指標(biāo),使新構(gòu)成的主成分比原始變量具有某些更優(yōu)越的反應(yīng)問(wèn)題實(shí)質(zhì)的性能。
2)BP神經(jīng)網(wǎng)絡(luò)模型(Back Propagation Neural Network,BPNN):對(duì)于燃?xì)馊肇?fù)荷呈現(xiàn)的非線性規(guī)律具有分布式信息記憶、自學(xué)習(xí)、自適應(yīng)以及優(yōu)化計(jì)算等功能,可以充分考慮多種因素的影響并對(duì)輸出誤差進(jìn)行反饋校正,但當(dāng)網(wǎng)絡(luò)輸入層影響因子較多,且數(shù)據(jù)變化不規(guī)律時(shí),都會(huì)導(dǎo)致模型的預(yù)測(cè)精度降低[14]。
3)GM灰色預(yù)測(cè)模型:無(wú)法考慮燃?xì)馊肇?fù)荷的其他影響因素,忽略了燃?xì)馊肇?fù)荷值隨溫度、天氣、日期類型等呈現(xiàn)的周期性變化特征,對(duì)樣本數(shù)據(jù)缺乏學(xué)習(xí)能力,信息處理能力較弱,但其所需數(shù)據(jù)量少和預(yù)測(cè)結(jié)果規(guī)律性強(qiáng)等優(yōu)點(diǎn)為組合預(yù)測(cè)模型提供了可能[15]。
綜上所述,本文在綜合考慮各模型優(yōu)缺點(diǎn)及應(yīng)用特征的基礎(chǔ)上,對(duì)三種模型進(jìn)行組合,具體組合方式如下:
1)GM和BPNN組合:考慮到GM灰色預(yù)測(cè)模型的預(yù)測(cè)結(jié)果呈指數(shù)曲線穩(wěn)定變化,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)輸入層影響因子隨機(jī)性較強(qiáng),存在易陷入局部極小值等問(wèn)題。因此,將變化趨勢(shì)穩(wěn)定的GM灰色預(yù)測(cè)結(jié)果作為BP神經(jīng)網(wǎng)絡(luò)輸入層影響因子的校正序列輸入神經(jīng)網(wǎng)絡(luò),以改善網(wǎng)絡(luò)容易陷入局部極小值等問(wèn)題[16]。
2)PCA和GM-BPNN組合:影響因子數(shù)量較多意味著模型結(jié)構(gòu)更加復(fù)雜,訓(xùn)練需要更多的時(shí)間。此外,若影響因子之間存在一定的相關(guān)性,如溫度和天氣之間的某種關(guān)系勢(shì)必造成輸入層神經(jīng)元個(gè)數(shù)的冗余。因此,考慮對(duì)包括校正序列在內(nèi)的影響因子進(jìn)行PCA降維處理,以達(dá)到在簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu)的同時(shí)提升模型預(yù)測(cè)精度的目的[17]。
圖1 PCA-GM-BPNN組合算法流程
針對(duì)建模情況的具體分析,城市燃?xì)馊肇?fù)荷PCA-GM-BPNN組合預(yù)測(cè)模型的求解步驟如下:
1)確定日負(fù)荷數(shù)據(jù)的時(shí)間序列長(zhǎng)度n,生成初始數(shù)列X(0):
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}
(1)
2)為了弱化燃?xì)庳?fù)荷數(shù)據(jù)的波動(dòng)性和隨機(jī)性,對(duì)日負(fù)荷數(shù)列X(0)進(jìn)行一次累加處理,生成新數(shù)列X(1):
X(1)={x(1)(1),x(1)(2),…,x(1)(n)}
(2)
其中:
(3)
3)利用累加生成的數(shù)列建立一階白化微分方程:
(4)
(5)
其中:
(6)
Y由燃?xì)鈿v史負(fù)荷數(shù)據(jù)序列構(gòu)成:
Y=[x(0)(2),x(0)(3),…,x(0)(n)]T
(7)
4)利用求得的參數(shù)a、u求解白化微分方程式(4),得到累加數(shù)列X(1)的GM灰色預(yù)測(cè)模型式(8),通過(guò)對(duì)其進(jìn)行累減還原得到原始數(shù)列GM灰色預(yù)測(cè)模型[19]:
(8)
(9)
5)等維新息處理。通過(guò)等維新息處理法對(duì)GM灰色預(yù)測(cè)模型進(jìn)行優(yōu)化,建立GM優(yōu)化模型,使預(yù)測(cè)結(jié)果更貼合實(shí)際負(fù)荷值,隨后預(yù)測(cè)出BP神經(jīng)網(wǎng)絡(luò)所需的樣本校正序列。
6)PCA降維。利用PCA主成分分析模型對(duì)包括校正序列在內(nèi)的日負(fù)荷影響因子進(jìn)行降維處理,求出相應(yīng)的主成分得分矩陣及主成分貢獻(xiàn)率。
9)訓(xùn)練函數(shù)優(yōu)化。利用MATLAB軟件工具箱的五種訓(xùn)練函數(shù)分別對(duì)燃?xì)馊肇?fù)荷值進(jìn)行預(yù)測(cè),篩選出最適合日負(fù)荷預(yù)測(cè)系統(tǒng)的訓(xùn)練函數(shù)。
10)結(jié)果預(yù)測(cè)。對(duì)樣本集進(jìn)行反復(fù)訓(xùn)練直到總誤差達(dá)到預(yù)設(shè)精度為止。通過(guò)訓(xùn)練得到最佳神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),從而求出最終預(yù)測(cè)值[20]。
為了驗(yàn)證城市燃?xì)馊肇?fù)荷PCA-GM-BPNN組合預(yù)測(cè)模型是否具有更高的預(yù)測(cè)精度,本文采用南樂(lè)縣某氣源2017年9月1日~10月31日供氣的日負(fù)荷數(shù)據(jù)進(jìn)行試驗(yàn),對(duì)2017年11月1日~10日的日負(fù)荷值進(jìn)行預(yù)測(cè),并與其他四種模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比。南樂(lè)縣某氣源日供氣量柱狀圖見(jiàn)圖2。
圖2 南樂(lè)縣某氣源日供氣量柱狀圖
由圖2可知,南樂(lè)縣某氣源2017年9月1日~10月31日的供氣負(fù)荷峰值81 199 m3,峰谷值52 386 m3,差值28 813 m3,占供氣峰值的三分之一,燃?xì)庳?fù)荷波動(dòng)性較小。此外,由圖2還可看出,南樂(lè)縣某氣源的日供氣量趨勢(shì)以周為單位穩(wěn)定變化,說(shuō)明南樂(lè)縣在該段時(shí)間內(nèi)的用戶發(fā)展情況變化不大,基本用戶穩(wěn)定性較高。
針對(duì)南樂(lè)縣地域特征和居民用氣習(xí)慣,本文通過(guò)中國(guó)氣象網(wǎng)和某長(zhǎng)輸管線SCADA系統(tǒng)對(duì)可能引起該縣燃?xì)馊肇?fù)荷值變化的日期類型、管線壓力溫度、日最高、日最低以及日平均溫度共計(jì)7種影響因子的數(shù)據(jù)進(jìn)行收集整理,利用GM優(yōu)化模型預(yù)測(cè)出BP神經(jīng)網(wǎng)絡(luò)所需的樣本校正序列,通過(guò)PCA主成分分析模型對(duì)包括校正序列在內(nèi)的8個(gè)影響因子進(jìn)行降維處理,求出和燃?xì)馊肇?fù)荷值相關(guān)的主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率,日負(fù)荷主成分貢獻(xiàn)率見(jiàn)表2。
表2日負(fù)荷主成分貢獻(xiàn)率表
主成分序列特征值貢獻(xiàn)率/(%)累計(jì)貢獻(xiàn)率/(%)M14.176 852.209 52.211M21.563 919.54971.759M31.192 114.90186.659M40.735 59.19495.854M50.196 52.45698.309M60.090 11.12599.434M70.045 30.566100M83.69 E-324.62 E-31100
表3訓(xùn)練函數(shù)預(yù)測(cè)效果
優(yōu)化方法trainlmtraingdatraing-dmtraingdtraingdxMAPE/(%)4.067.166.558.125.69
PCA-GM-BPNN組合預(yù)測(cè)模型的預(yù)測(cè)效果見(jiàn)圖3~4和表4。
圖3 日負(fù)荷預(yù)測(cè)結(jié)果對(duì)比
圖4 日負(fù)荷預(yù)測(cè)誤差走勢(shì)
表4PCA-GM-BPNN組合預(yù)測(cè)模型日負(fù)荷預(yù)測(cè)效果
日期實(shí)際值/m3預(yù)測(cè)值/m3相對(duì)誤差/(%)2017-11-0164 05172 312.150.342017-11-0268 78167 546.1973.152017-11-0369 83385 936.0088.322017-11-0467 21171 556.8070.542017-11-0571 74882 592.3255.112017-11-0681 19971 040.6284.262017-11-0768 50871 791.5114.502017-11-0879 26981 772.4083.782017-11-0972 29075 162.3594.782017-11-1074 04379 220.8955.76
為了充分說(shuō)明PCA-GM-BPNN組合預(yù)測(cè)模型的合理性和準(zhǔn)確性,本文分別對(duì)GM灰色預(yù)測(cè)模型、GM灰色預(yù)測(cè)優(yōu)化模型、BP神經(jīng)網(wǎng)絡(luò)模型、BP神經(jīng)網(wǎng)絡(luò)優(yōu)化模型(對(duì)BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元個(gè)數(shù)和訓(xùn)練函數(shù)進(jìn)行優(yōu)化后的模型)和PCA-GM-BPNN組合預(yù)測(cè)模型進(jìn)行編程,得出五種模型的預(yù)測(cè)結(jié)果和誤差走勢(shì),見(jiàn)圖5~6。對(duì)五種模型預(yù)測(cè)結(jié)果的平均相對(duì)誤差(MAPE)、平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)進(jìn)行對(duì)比分析,五種模型預(yù)測(cè)效果見(jiàn)表5。
圖5 五種模型預(yù)測(cè)結(jié)果對(duì)比
圖6 五種模型預(yù)測(cè)誤差走勢(shì)
表5五種模型預(yù)測(cè)效果表
指標(biāo)GM灰色預(yù)測(cè)模型GM優(yōu)化模型BP模型BP優(yōu)化模型PCA-GM-BPNN組合預(yù)測(cè)模型MAPE/(%)15.0314.979.318.134.06MAE11 582.0911 533.096 308.616 140.9743 159.449RMSE12 586.9612 500.217 788.236 769.1713 643.995
本文將PCA、GM和BPNN進(jìn)行結(jié)合,構(gòu)建了城市燃?xì)馊肇?fù)荷PCA-GM-BPNN組合預(yù)測(cè)模型,并利用南樂(lè)縣某氣源的日負(fù)荷數(shù)據(jù)進(jìn)行了實(shí)例分析。通過(guò)五種模型的預(yù)測(cè)結(jié)果及其MAPE、MAE、RMSE值的比較得出以下主要結(jié)論:
1)城市燃?xì)馊肇?fù)荷PCA-GM-BPNN組合預(yù)測(cè)模型的預(yù)測(cè)精度明顯優(yōu)于單一的GM灰色預(yù)測(cè)模型和BP神經(jīng)網(wǎng)絡(luò)模型及其優(yōu)化模型,充分證明了新型組合模型在日負(fù)荷預(yù)測(cè)方面的優(yōu)越性。
2)利用PCA、GM和BP算法獲取城市燃?xì)夤芫W(wǎng)原始負(fù)荷序列及其影響因子蘊(yùn)藏的特征信息,合理解決了BP神經(jīng)網(wǎng)絡(luò)建模過(guò)程中輸入層元素、隱含層參數(shù)及訓(xùn)練函數(shù)的選取問(wèn)題,具有較強(qiáng)的適應(yīng)能力和泛化能力。