石雪梅,葛斐,肖夕林
(1.國網(wǎng)安徽省電力公司經(jīng)濟技術研究院,安徽合肥 230022;2.合肥工業(yè)大學管理學院,安徽合肥 230009)
基于K-L信息量法的安徽省工業(yè)用電量預測
石雪梅1,葛斐1,肖夕林2
(1.國網(wǎng)安徽省電力公司經(jīng)濟技術研究院,安徽合肥230022;2.合肥工業(yè)大學管理學院,安徽合肥230009)
針對區(qū)域工業(yè)用電量與經(jīng)濟指標的相關性,運用K-L信息量法,在月度尺度上篩選出能夠指示區(qū)域工業(yè)用電量變化趨勢的經(jīng)濟先行指標,并獲得各先行指標的先行期數(shù)。以經(jīng)濟先行指標為自變量、區(qū)域工業(yè)用電量為被因變量建立多元回歸模型,根據(jù)AIC準則和BIC準則選取最佳擬合方程,得到工業(yè)用電量預測模型。運用模型預測安徽省2014年5月-12月的月用電量,結(jié)果顯示預測精度較高,預測方法可以用于工業(yè)用電量預測。
經(jīng)濟先行指標;K-L信息量法;用電量預測;安徽省
對于省級電力公司來說,提高區(qū)域用電量預測的科學性和精確度,具有重要意義。電力消費對國民經(jīng)濟變動非常敏感,宏觀經(jīng)濟運行狀況對于區(qū)域用電量具有一定的指示作用[1-5]。為了從經(jīng)濟指標中挖掘與用電量變化有關的信息,基于統(tǒng)計學方法的數(shù)據(jù)挖掘技術受到廣泛應用[6-8]。從已有文獻來看,傳統(tǒng)的預測方法已經(jīng)很難做出改進,只有改進月度用電量的預測模式,盡可能多地引入最新的經(jīng)濟信息參與預測,才能進一步提高預測精度。
但是,對經(jīng)濟先行指標篩選,以及建模過程中指標的篩選過于依靠主觀判斷等問題。本研究將延續(xù)以上思路,基于經(jīng)濟先行指標和多元回歸模型建立區(qū)域用電量預測模型,但在指標選取、先行期數(shù)判斷和多元回歸模型構(gòu)建方面提出改進方案,以增強模型的全面性、科學性和模型預測結(jié)果的精確性。
K-L信息量法是在20世紀50年代由Kull-back和Leibler提出[9],用以衡量2個概率分布的相似程度,即度量他們之間的距離,越小即代表兩者越接近越相似。其原理是以基準序列為理論分布,備選指標為樣本分布,不斷變化備選指標與基準序列時差,計算K-L信息量。K-L信息量最小時對應的時差數(shù)確定為備選指標的最終時差。
對于離散變量,設基準指標為y={y1,y2,…,yn},由于任意滿足Pi>0,Σpi=1的序列p均可視為某隨機變量的概率分布序列,因此,基準指標序列記為p,即
設備選指標為x={x1,x2,…,xn},序列記為q,即
K-L信息量的計算公式為
當備選指標序列x與基準指標序列y完全一致時,K-L信息量等于0;指標x與基準指標y越接近,KL信息量絕對值越小,越接近于0。
本研究以安徽省工業(yè)用電量為基準指標,在全球、全國和區(qū)域尺度大范圍搜集月度經(jīng)濟指標,并運用K-L信息量法篩選安徽省工業(yè)用電量的經(jīng)濟先行指標,并建立預測模型。
2.1模型框架
圖1所示為預測模型的概念框架,根據(jù)框架,模型建立的步驟如下:1)選取區(qū)域、全國及世界經(jīng)濟的指標,作為備選指標,獲取經(jīng)濟指標的月度數(shù)據(jù),將數(shù)據(jù)分為兩部分,一部分數(shù)據(jù)用于建模,另一小部分進行預測檢驗。2)以區(qū)域用電量指標為基準指標,扣除季節(jié)性因素的影響,對所有備選指標進行-12階~+12階的滯后處理,計算基準指標與所有備選指標不同滯后項的K-L信息量,對每個備選指標選擇最小的K-L信息量所對應的滯后階數(shù),得到該備選指標與基準指標對應的最佳滯后階數(shù)。如果某指標最佳滯后階數(shù)小于0,從概率上說,該指標更有可能超前于基準指標發(fā)生變化,可認為是基準指標的先行指標。3)對先行指標進行滯后處理,然后計算其與基準指標的相關性系數(shù),保留顯著相關的先行指標。4)以區(qū)域用電量指標為因變量,以先行指標的最佳滯后項為解釋變量,建立時間序列多元回歸模型,根據(jù)AIC與BIC等準則,以及對解釋變量的方差膨脹因子的控制,選取最優(yōu)模型。5)根據(jù)算例分析,對模型進行檢驗與評價,根據(jù)所選取的最優(yōu)模型,進行擬合與預測檢驗,判斷模型預測結(jié)果的精確度。
2.2模型優(yōu)選法
準則函數(shù)方法是最常用的模型優(yōu)選方法,例如AIC(Akaike information criterion)準則[10]和BIC(Bayesian information criterion)準則[11]。通常在應用準則函數(shù)進行模型選擇時,將準則值最小的候選模型作為最優(yōu)模型。在一般的情況下,AIC值可以由式(4)計算得到:
式中:k為參數(shù)的數(shù)量;L為似然函數(shù)。假設條件是模型的誤差服從獨立正態(tài)分布。AIC值越小,模型越好,越值得考慮,這就是所謂的AIC準則。一般情況下,當參數(shù)數(shù)量k增加時,對數(shù)似然函數(shù)也將增加,從而使AIC值變小。但當k過大時,對數(shù)似然函數(shù)增速減緩,導致AIC值反而增加,使得模型變壞,可見AIC準則有效且合理地控制了參數(shù)的數(shù)量k。
與AIC準則相同,BIC準則是衡量統(tǒng)計模型擬合優(yōu)良性的另一種標準。BIC值的計算式為:
式中:L為在該模型下的最大似然;n為數(shù)據(jù)數(shù)量;k為模型的變量個數(shù)。同AIC值相似,模型的BIC值越小,越值得考慮。
多重共線性是指線性回歸模型中的解釋變量之間由于存在精確相關關系或高度相關關系而使模型估計失真或難以估計準確。方差膨脹因子VIF(variance inflation factor)是刻畫多重共線性的方法之一,如果VIFi≥100,則剔除Xi,否則予以保留。最終得到的模型必然存在各個自變量VIF<100,這是在自變量個數(shù)較多、且只做短期預測時所能接受的。
圖1 預測模型框架Fig.1 Framework of forecasting model
3.1指標初選
依據(jù)全面性、精煉性、可靠性、敏感性、穩(wěn)定性、時效性原則,選取經(jīng)濟領域內(nèi)的備選指標。根據(jù)安徽省對外公布的經(jīng)濟統(tǒng)計資料,選取以下指標類型:1)區(qū)域經(jīng)濟總體指標;2)財政類;3)投資類:固定資產(chǎn)投資總額、各行業(yè)固定資產(chǎn)投資完成額、房地產(chǎn)投資額;4)分行業(yè)工業(yè)增加值;5)分品種居民消費額;6)進出口貿(mào)易;7)工業(yè)品產(chǎn)量。此外,由于安徽省地處長三角地區(qū),經(jīng)濟發(fā)展可能受到長三角經(jīng)濟波動的影響,因此,選取同處于長三角地區(qū)、經(jīng)濟發(fā)達、對外開放程度更高的上海市的部分經(jīng)濟指標,作為區(qū)域經(jīng)濟指標。
選取的國內(nèi)指標類型有:1)制造業(yè)指數(shù);2)非制造業(yè)指數(shù);3)貨幣供應量;4)國際貿(mào)易與國際投資;5)交通運輸量;6)行業(yè)景氣指數(shù)。
國際指標類型有:1)美日歐進出口貿(mào)易額;2)美日歐失業(yè)率。
最終選取出國際國內(nèi)140個經(jīng)濟指標,作為經(jīng)濟先行指標的備選指標。分別獲取140個備選經(jīng)濟指標2011年1月—2014年6月的月度數(shù)據(jù)。同時,獲取安徽省工業(yè)用電量2011年1月—2014年6月期間的月度數(shù)據(jù)。根據(jù)價格指數(shù)對價值量指標進行可比價格調(diào)整,轉(zhuǎn)化為2014年6月可比價格。并運用季節(jié)性調(diào)整模型,對所有數(shù)據(jù)進行季節(jié)調(diào)整,扣除季節(jié)因素的影響。
3.2指標篩選
對安徽省工業(yè)用電量與140項經(jīng)濟指標進行KL信息量分析,篩選出工業(yè)用電量的經(jīng)濟先行指標,結(jié)果及其參數(shù)見表1。
經(jīng)過K-L信息量法和考慮滯后階數(shù)的相關性檢驗,發(fā)現(xiàn)有安徽省地方財政支出等21個指標,可作為安徽省工業(yè)用電量的先行指標,且時差相關性均在0.01的水平上顯著,相關性系數(shù)均大于0.4。由此可見,安徽省工業(yè)用電量與這些經(jīng)濟先行指標存在顯著的相關性,可用于構(gòu)建預測模型。
3.3預測模型
對篩選出的若干先行指標按照其最佳滯后階數(shù)進行變換,作為解釋變量,以安徽省工業(yè)用電量為因變量,建立回歸模型??紤]到指標數(shù)據(jù)的公布有一定的滯后性,只考慮超前基準指標2期以上發(fā)生變化的經(jīng)濟先行指標,用于模型的解釋變量。運用全指標模型、基于AIC準則選擇出的最佳模型、基于BIC準則選出的最佳模型3種篩選原則分別選取最優(yōu)回歸模型,再根據(jù)3種模型的擬合情況,選取擬合誤差最小的模型,輸出模型參數(shù)與擬合結(jié)果。經(jīng)過比較,基于BIC準則選擇出的最優(yōu)模型成為安徽省工業(yè)用電量預測最優(yōu)模型,模型變量及參數(shù)見表2。
表1 安徽省工業(yè)用電量的先行指標Tab.1 Leading indicators of industrial electricity consumption in Anhui
建模結(jié)果顯示,股份合作企業(yè)工業(yè)增加值(皖)等11個指標成為多元回歸模型的自變量,大部分自變量都通過了t檢驗,模型通過了方差膨脹因子小于100的檢驗。
對模型進行檢驗,判斷模型的擬合殘差是否符合白噪聲特征。此外,為了檢驗模型的擬合與預測效果,進行擬合與預測的誤差分析。模型擬合的殘差分布見圖2,模型的擬合結(jié)果見圖3。結(jié)果顯示,擬合殘差符合白噪聲特征,擬合結(jié)果與實際值變化趨勢保持一致,擬合平均誤差率為2.2%。擬合效果較好,因此,該模型可以用來預測安徽省的工業(yè)用電量。
表2 最優(yōu)模型參數(shù)Tab.2 Parameters of the best model
圖2 模型擬合殘差圖Fig.2 Residual plot of the model
圖3 模型擬合圖Fig.3 Fitting chart of the model
3.4用電量預測
運用篩選出的最優(yōu)回歸模型,預測2014年1月—6月的安徽省工業(yè)用電量。預測結(jié)果與實際值進行比較,得到預測誤差(平均誤差率為取絕對值后求平均),結(jié)果見圖4。
圖4 安徽省工業(yè)用電量預測及其誤差率Fig.4 Forecast and error of industrial electricity consumption in Anhui
模型預測結(jié)果顯示,模型對安徽省工業(yè)用電量的預測精確度較高,預測誤差率較穩(wěn)定,2014年1—6月,預測誤差率在-4%~5%之間波動,預測6個月的平均誤差率為3.4%。
區(qū)域用電量指標與經(jīng)濟指標的密切聯(lián)系受到了研究者們的廣泛肯定。本研究基于K-L信息量法,從145個國內(nèi)外經(jīng)濟指標中篩選出安徽省工業(yè)用電量的經(jīng)濟先行指標,發(fā)現(xiàn)指標間存在一定的時差相關關系,基于相關性較強的經(jīng)濟先行指標建立回歸模型,用于預測安徽省工業(yè)用電量,取得了較好的預測效果。預測誤差率較為穩(wěn)定,均值為3.4%左右,因此可用作月度工業(yè)用電量預測。本研究建立模型所選取的指標,涵蓋了區(qū)域工業(yè)產(chǎn)值、產(chǎn)品產(chǎn)量、全國行業(yè)景氣指數(shù)、美國失業(yè)率等多個方面的指標,反映了區(qū)域經(jīng)濟與全國經(jīng)濟乃至世界經(jīng)濟的關聯(lián)性,也進一步論證了經(jīng)濟發(fā)展與用電量的密切關系。
近年來,大數(shù)據(jù)研究技術的出現(xiàn),為區(qū)域用電量預測提供了新的思路:自變量與因變量也許并不存在因果關系,而可能是同為結(jié)果的關系,但指標間只要存在一定的時差相關性,就可以用來建立預測模型。同時,在大數(shù)據(jù)時代,數(shù)據(jù)搜集、存儲和更新的成本更低,為復雜動態(tài)模型研究提供了條件,而指標數(shù)量越多,包含的信息越豐富[13-15]。本研究正是遵循了大數(shù)據(jù)研究的理念,略去了指標間的因果關系研究,同時,盡可能多地搜集備選指標,以保證各方面信息的完整性。此外,運用K-L信息量法篩選的先行指標并不是固定不變的,能夠不斷更新、改進。隨著經(jīng)濟社會不斷發(fā)展,需要對數(shù)據(jù)和模型進行更新,以保證該預測方法長期有效。
[1]THOMA M.Electrical energy usage over the business cycle[J].Energy Economics,2004,(26):463-485.
[2]葛斐,榮秀婷,石雪梅,等.基于經(jīng)濟、氣象因素的安徽省年最大負荷預測方法研究[J].中國電力,2015,48(3):84-87.GE Fei,RONG Xiuting,SHI Xuemei,et al.The Anhui annual maximum load forecasting method research based on economic and meteorological factors[J].Electric Power,2015,48(3):84-87(in Chinese).
[3]肖欣,周渝慧,張寧,等.城鎮(zhèn)化進程與電力需求增長的關系研究[J].中國電力,2015,48(2):145-149.XIAO Xin,ZHOU Yuhui,ZHANG Ning,et al.Study on the relationship between urbanization process and electricity demand growth[J].Electric Power,2015,48(2):145-149(in Chinese).
[4]黃永高,盧毅.基于小波分析和灰色模型的用電量預測[J].電網(wǎng)與清潔能源,2011,27(3):34-37.HUANG Yonggao,LU Yi.Electricity consumption forecasting based on wavelet analysis and gray model[J].Power Systemand Clean Energy,2011,27(3):34-37(in Chinese).
[5]卓元志,劉家軍,王明軍,等.基于熵值法的組合模型用電量預測方法研究[J].電網(wǎng)與清潔能源,2011,27(5):47-50.ZHUO Yuanzhi,LIU Jiajun,WANG Mingjun,et al.A combination model based on entropy method for annual electricity consumption forecasting[J].Power System and Clean Energy,2011,27(5):47-50(in Chinese).
[6]劉暢,高鐵梅.中國電力行業(yè)周期波動特征及電力需求影響因素分析——基于景氣分析及誤差修正模型的研究[J].資源科學,2011,33(1):169-177.LIU Chang,GAO Tiemei.Characteristics of electricity industry cycle fluctuation and influentialfactors of electricity demand based on business analysis and the error correction model[J].Resources Science,2011,33(1):169-177(in Chinese).
[7]崔巍,劉洋,張米爾,等.基于經(jīng)濟先行指標的省級電力市場需求分析[J].水電能源科學,2012,30(5):191-195.CUI Wei,LIU Yang,ZHANG Mi’er,et al.Analysis of provincial power market demand based on economic leading indicators[J].Water Resources and Power,2012, 30(5):191-195(in Chinese).
[8]張維,范玉宏,周小兵.全社會用電量預警指標研究[J].電力需求側(cè)管理,2012,14(2):7-12.ZHANG Wei,F(xiàn)AN Yuhong,ZHOU Xiaobing.Research on early warring index system of social electricity consumption[J].Power Demand Side Management,2012,14(2):7-12(in Chinese).
[9]KULLBACK S,LEIBLER R A.On information and sufficiency[J].Annals of Mathematical Statistics,1951,22(1):79-86.
[10]AKAIKE H.Information theory and an extension of the maximum likelihood principle[C]//Second International Symposium on Information Theory.Tsahkadsor,Armenia:Petrov B N,Csaki F,1973:267-281.
[11]SCHWARZ G.Estimating the dimension of a model[J].The Annals of Statistics,1978,6(2):461-464.
[12]謝家安.基于體感溫度的電力系統(tǒng)負荷分類及負荷預測[J].電網(wǎng)與清潔能源,2012,28(8):24-28.XIE Jiaan.Load classification and load forecasting of power system based on apparent temperature[J].Power System and Clean Energy,2012,28(8):24-28(in Chinese).
[13]李國杰,程學旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考[J].中國科學院院刊,2012(6):647-657.LI Guojie,CHENG Xueqi.Research status and scientific thinking of big data[J].Bulletin of the Chinese Academy of Sciences,2012(6):647-657(in Chinese).
[14]俞立平.大數(shù)據(jù)與大數(shù)據(jù)經(jīng)濟學[J].中國軟科學,2013(7):177-183.YU Liping.Big data and big data economics[J].China Soft Science,2013(7):177-183(in Chinese).
[15]宋亞奇,周國亮,朱永利.智能電網(wǎng)大數(shù)據(jù)處理技術現(xiàn)狀與挑戰(zhàn)[J].電網(wǎng)技術,2013,37(4):927-935.SONG Yaqi,ZHOU Guoliang,ZHU Yongli.Present status and challenges of big data processing in smart grid[J].Power System Technology,2013,37(4):927-935(in Chinese).
(編輯黃晶)
Forecasting Industrial Electricity Consumption of Anhui Province Based on K-L Information Method
SHI Xuemei1,GE Fei1,XIAO Xilin2
(1.Institute of Economic and Technology,State Grid Anhui Electric Power Company,Hefei 230022,Anhui,China;2.School of Management,Hefei University of Technology,Hefei 230009,Anhui,China)
In view of the correlation between the regional industrial electricity consumption and economic indicators,the K-L information method is used to select the leading economic indicators which can indicate the change trend of regional electricity consumption on the monthly scale and the leading time of each leading indicator is calculated.Taking the economic leading indicator as the independent variable,the regional industrial electricity consumption as the dependent variable the multiple regression model is established and the best fitting equation is selected according to the AIC criterion and BIC criterion and the industrial electricity consumption forecast model is obtained.The model is used to predict monthly electricity consumption in Anhui Province from May 2014 to December 2014,and the results show that the prediction accuracy is high,the forecasting method can be used for industrial electricity consumption forecast.
economic leading indicators;K-L information method;electricity consumption forecasting;Anhui province
1674-3814(2015)11-0058-05
TM732
A
2015-09-11。
石雪梅(1977—),女,碩士學歷,高級工程師,主要從事電網(wǎng)規(guī)劃及電力經(jīng)濟關系研究工作;
葛斐(1972—),男,碩士學歷,高級工程師,長期從事能源電力經(jīng)濟及預測分析方面的技術研究與管理工作;
肖夕林(1992—),男,研究生,研究方向為管理科學。