文/牟曉霞
為適應(yīng)我國(guó)能源結(jié)構(gòu)和市場(chǎng)需求變化,提供決策參考,預(yù)測(cè)電煤價(jià)格至關(guān)重要。本文從煤炭供給、消耗、行業(yè)發(fā)展、新能源、氣溫等方面收集了200個(gè)影響因素,建立基于AdaBoost分類器的隨機(jī)森林和決策樹模型對(duì)全國(guó)及山西地區(qū)的未來(lái)1、2、3用電煤價(jià)格進(jìn)行預(yù)測(cè)。結(jié)果顯示,預(yù)測(cè)模型效果優(yōu)于隨機(jī)森林、極端隨機(jī)樹、線性回歸和決策樹模型,預(yù)測(cè)結(jié)果可為煤炭消耗型企業(yè)購(gòu)煤決策提供參考。
近年來(lái),隨著國(guó)家能源結(jié)構(gòu)調(diào)整、供給側(cè)改革的深入推進(jìn),煤炭消費(fèi)量有所下降,但我國(guó)“富煤、貧油、少氣”的國(guó)情和所處的發(fā)展階段并未改變,煤炭在我國(guó)能源消費(fèi)中仍占主導(dǎo)地位。在維護(hù)能源安全和托底保供方面,煤炭仍發(fā)揮著“壓艙石”的作用。預(yù)測(cè)電煤價(jià)格有助于理解突發(fā)事件對(duì)價(jià)格的影響機(jī)理,為煤炭企業(yè)決策提供參考。
本文綜合考慮了200個(gè)影響電煤價(jià)格的因素指標(biāo),確定影響因素指標(biāo)包括:各地區(qū)和各行業(yè)煤炭產(chǎn)量、用電量、發(fā)電量、生鐵產(chǎn)量、水泥產(chǎn)量和氣溫,煤產(chǎn)品進(jìn)口量,電廠供、耗、存。本文數(shù)據(jù)源于Wind數(shù)據(jù)庫(kù),選取全國(guó)以及山西地區(qū)的電煤市場(chǎng)價(jià),以2013年10月至2022年1月為時(shí)間窗口,進(jìn)行預(yù)測(cè)和分析。利用Excel對(duì)原始數(shù)據(jù)進(jìn)行清理,綜合分析皮爾遜系數(shù)結(jié)果、格蘭杰因果檢驗(yàn)結(jié)果和特征重要性三個(gè)結(jié)果,剔除相關(guān)性和顯著性較低的指標(biāo),完成變量的篩選。
本文采用Adaboost分類器,訓(xùn)練多個(gè)弱分類器,并將它們集成為一個(gè)更強(qiáng)的最終分類器,構(gòu)建基于六種模型的預(yù)測(cè)模型,包括AdaRF(自適應(yīng)隨機(jī)森林)、Adatree(自適應(yīng)樹)、RF(隨機(jī)森林)、ExtraTrees(極端隨機(jī)樹)、LR(線性回歸)和Tree(決策樹)。本文將交叉驗(yàn)證與網(wǎng)格搜索相結(jié)合,以MSE最小化為參數(shù)優(yōu)選的目標(biāo),避免抽樣隨機(jī)性對(duì)模型性能的影響。
以全國(guó)和山西省的電煤價(jià)格為研究對(duì)象,對(duì)全國(guó)以及山西省的月度電煤價(jià)格和各影響因素的指標(biāo)值進(jìn)行收集。綜合考慮全國(guó)及山西的六種預(yù)測(cè)方法的結(jié)果,得到全國(guó)及山西的未來(lái)三個(gè)月的電煤價(jià)格,全國(guó)1月后572.96元/噸,2月后573.52元/噸,3月后574.46元/噸,山西1月后486.87元/噸,2月后488.17元/噸,3月后489.55元/噸。當(dāng)電煤消耗量平穩(wěn)的狀態(tài)下,當(dāng)預(yù)測(cè)到電煤價(jià)格上升時(shí),地區(qū)甚至國(guó)家應(yīng)該增加短期內(nèi)購(gòu)買量,采購(gòu)燃料補(bǔ)充庫(kù)存。在電煤價(jià)格預(yù)測(cè)的指導(dǎo)下,保證每次的燃料采購(gòu)價(jià)格最優(yōu),年度燃料采購(gòu)價(jià)格最小,年度燃料庫(kù)存及損耗成本能夠得到有效地降低。為評(píng)價(jià)模型的預(yù)測(cè)性能,選擇均方差(MSE)、平均絕對(duì)誤差(MAE)作為預(yù)測(cè)評(píng)價(jià)指標(biāo)。根據(jù)圖2的全國(guó)電煤價(jià)格預(yù)測(cè)模型效果對(duì)比,Adatree的預(yù)測(cè)效果最佳,各項(xiàng)誤差值均相對(duì)最小;AdaRF的預(yù)測(cè)效果次之,各項(xiàng)誤差值的較小。由于收集數(shù)據(jù)的限制,山西電煤預(yù)測(cè)模型效果與全國(guó)的模型相比較差,但是預(yù)測(cè)穩(wěn)定性達(dá)到較高水平。
圖1 全國(guó)(左)和山西(右)預(yù)測(cè)模型誤差
本文建立AdaRF、Adatree、RF、ExtraTrees、LR、Tree六種模型,對(duì)全國(guó)和山西的1、2、3月后的煤價(jià)進(jìn)行短期預(yù)測(cè)。通過(guò)實(shí)驗(yàn)對(duì)比各模型的預(yù)測(cè)誤差,證明該方法能夠根據(jù)各個(gè)影響因素的指標(biāo)值對(duì)電煤價(jià)格進(jìn)行有效預(yù)測(cè),且預(yù)測(cè)準(zhǔn)確率較高。本文對(duì)優(yōu)化燃料采購(gòu),降低燃料庫(kù)存及損耗成本提供參考。