曾 嘉,李 潔
(1.廣東金融學院 國際教育學院,廣州510521;2.深圳大學 中國經(jīng)濟特區(qū)研究中心,廣東 深圳518060)
長期以來,政府政策的制定和實施始終以宏觀經(jīng)濟發(fā)展趨勢為基本參考,并根據(jù)這些預測趨勢對現(xiàn)有政策體制作出針對性的調整。但學術界對于提升GDP數(shù)據(jù)頻率而提出的大部分方法都是以及時獲得宏觀GDP數(shù)據(jù)為基礎條件,具有一定的局限性。而估測模型中往往存在投資指數(shù)、經(jīng)濟周期變化等因素,模型的準確性難以保證,運用這些方法進行GDP估測存在滯后性。然而,與宏觀經(jīng)濟數(shù)據(jù)不同,一些工業(yè)數(shù)據(jù)在數(shù)據(jù)總量和計算時間上具有天然優(yōu)勢,具備相當?shù)募皶r性和可靠性,并且可以從不同角度反映其與宏觀經(jīng)濟之間的具體關系,因此學術界逐漸將焦點放在此類數(shù)據(jù)的研究上,其中電力大數(shù)據(jù)的發(fā)展與利用逐漸成為中國學者們關注與研究的焦點之一。
中國學者對GDP的估測進行了很多有益研究。唐成千和莫旋(2016)結合中國經(jīng)濟周期性波動的實際數(shù)據(jù),通過構建混合頻率數(shù)據(jù)抽樣模型,對中國宏觀經(jīng)濟進行了探討和短期預測[1]。索澤輝和冼軍(2015)將Lomb-Scargle周期圖法運用到GDP的預測中,并建立了Lomb-Scargle周期圖法的指數(shù)預測模型,從而明顯提高了預測精度[2]。楊利雄和張春麗(2018)以組合預測理論、無偏性和有效性檢驗以及時域—頻域分析為基礎,對中國季度GDP初步核算數(shù)據(jù)的準確度進行了評估[3]。張勁帆和剛健華(2018)等人利用中國宏觀經(jīng)濟指標構建了基于貝葉斯估計的混合頻率向量自回歸模型,同時利用該模型檢驗了中國宏觀經(jīng)濟的運行情況[4]。楊少文和熊啟泉(2014)提出了以GDP份額預測經(jīng)濟開放程度的研究方法,并對中國1994—2011年期間的各年度經(jīng)濟開放度進行測算,其實證結果較好地反映了中國經(jīng)濟的變動情況[5]。仝冰(2017)利用DSGE模型對GDP數(shù)據(jù)進行貝葉斯估計,發(fā)現(xiàn)參數(shù)估計結果出現(xiàn)了系統(tǒng)性偏差,而使用年度的支出法消費和投資數(shù)據(jù)進行估計,則模型的樣本外預測績效總體更優(yōu)[6]。
對于電力大數(shù)據(jù)與宏觀經(jīng)濟之間的關系,近年學術界也展開了激烈的討論。馮永晟(2014)利用微觀數(shù)據(jù)研究得出了中國居民的長期電力需求函數(shù),并指出了其與宏觀經(jīng)濟的波動聯(lián)系,為居民電價政策評估提供了基礎依據(jù)[7]。潘竟虎和李俊峰(2016)以中國大陸為研究對象,從不同時間、空間角度對省級、地級和縣級單元的電力消耗量變化趨勢和空間集聚程度進行了分析,這在一定程度上反映了不同地區(qū)的宏觀經(jīng)濟情況[8]。
根據(jù)上文可知,工業(yè)電力大數(shù)據(jù)與GDP聯(lián)系緊密,表明電力大數(shù)據(jù)與GDP之間存在正向關系方程,根據(jù)正向關系方程倒向解構,即利用參數(shù)估計值反向倒推,便可實現(xiàn)對宏觀GDP數(shù)據(jù)的估測,并且最終根據(jù)本研究所得結果亦可反驗證此方法的科學性和有效性。本研究所用倒向回歸方程由正向回歸方程解構而來,研究分以下幾步:第一,說明對電力數(shù)據(jù)的基本處理方式,以此提升可得數(shù)據(jù)的有效性和準確性;第二,以江蘇省工業(yè)電力大數(shù)據(jù)為基礎,運用漸次回歸逐步構建電量與GDP增長率的方程,并引入與GDP有關聯(lián)的影響因子,建立倒向回歸模型;第三,考慮到不同地區(qū)和時間的產業(yè)特征,通過設定窗口期對模型因子進行動態(tài)調整,提升GDP測算的準度和精度,最終得出研究結論。
最小平方法(OLS法),采用最小化誤差的平方方式尋找數(shù)據(jù)的最佳函數(shù)匹配。本研究使用OLS法進行漸次回歸,構建工業(yè)企業(yè)用電量與GDP增長率等變量關系的線性公式:
公式(1)中,y代表工業(yè)用電量增長率,g表示GDP的增長率,x為其他自變量。
以(1)式為結構基礎,利用倒向回歸推導出g關于y的方程,通過頻率較高和及時性特征的工業(yè)用電大數(shù)據(jù)進行方程推導,可消除GDP估測的時滯性并提升頻率。并在推導出的倒向公式中,引入高頻率的工業(yè)企業(yè)用電量數(shù)據(jù)來構建關于宏觀經(jīng)濟增長率的測算模型。即將影響因子和異頻工業(yè)企業(yè)用電量增長率的真實數(shù)據(jù)代入所得方程,以此獲得當下時間區(qū)間的g的估測結果。在此通過以下幾步進行模型構建:
首先,在回歸方程中代入自變量和因變量。
基于前文說明,在此使用因變量為工業(yè)企業(yè)用電量增長率yt,自變量為GDP增長率gt。則式(2)為代入時間t的工業(yè)企業(yè)用電量增長率的計算方程,式(3)為代入時間t的GDP增長率的計算方程。
將影響工業(yè)企業(yè)用電量的影響因子代入基礎方程中,由于影響工業(yè)企業(yè)用電量的因素有很多,根據(jù)學術界普遍認同的工業(yè)電力數(shù)據(jù)的影響因素,在此選取季度氣溫的平均漲幅、PPI增長率、產業(yè)發(fā)展程度、城鎮(zhèn)人口增減幅度和相關虛擬變量作為控制變量。
其中,PPI指數(shù)在一定程度上反映特定時間內生產環(huán)境的價格升降狀況,在國民經(jīng)濟領域中是必不可少的指數(shù)依據(jù)。根據(jù)電力用量與PPI的相互關系[9],在此用 pt表示t時間的 PPI指數(shù),式(4)為代入時間t的計算公式。
產業(yè)發(fā)展程度It表示了各產業(yè)在國民經(jīng)濟中貢獻GDP的多少。由于各產業(yè)的特性和發(fā)展差異,不同產業(yè)的企業(yè)用電量增速有明顯差異。而城鎮(zhèn)人口增減幅度Rt會對產業(yè)的人員數(shù)量產生影響,與產業(yè)規(guī)模和產業(yè)用電量有關。因此,將產業(yè)發(fā)展程度和城鎮(zhèn)人口增減幅度作為影響因子,即作為因變量代入倒向方程。
由于產業(yè)生產環(huán)境和家居環(huán)境的制約,氣溫的平均上升程度與用電量有著天然的聯(lián)系,相關研究認為平均氣溫與用電量顯著相關[10],且由于季節(jié)性的氣溫差異,用電量和平均氣溫的關系呈現(xiàn)顯著的周期性變化。因此,以當季度氣溫的平均上升程度wt作為控制變量,并加入溫度相關的虛擬變量,即高溫季W(wǎng)H和低溫季W(wǎng)L。若此季度為高溫季,則有WH=1;若為非高溫季,則有WH=0。若此季度為低溫季,則有WL=1;若為非低溫季,則有WL=0。通常的高溫季為一年中的第三季度,低溫季為一年中的第一季度。式(5)為溫度的平均上升程度的計算公式。
對于工業(yè)企業(yè)用電量,必須考慮節(jié)假日的影響。例如春節(jié)、十一國慶等長假期間,企業(yè)用電量會大幅縮減,長假結束后的設備啟用也需要一段時間,因此引入季度內的節(jié)假日時間變量Jt與假期相關的虛擬變量JS。若季度內存在5天以上假期,則有JS=1;若季度內不存在5天以上假期,則有JS=0。
由于官方的相關數(shù)據(jù)大部分為每季度公布一次,因此本研究大部分變量以季度為單位,其中PPI和城鎮(zhèn)人口增減幅度以年度為單位。表1為變量說明,其中包含自變量、因變量、控制變量和虛擬變量。
表1 變量說明
將各變量代入,則有:
上式中的變量數(shù)據(jù)獲得以季度為單位,其中由于Pt和Rt這兩個變量的公布頻率以年為單位,在此為了便于計算,設定這兩個變量數(shù)據(jù)在一年的期間內變化幅度為平均上升或平均下降,在代入公式的過程中,以年度幅度的四分之一作為季度內的有效數(shù)據(jù)。
然后,運用漸次回歸方式進行參數(shù)因子估計,并檢驗最初變量的回歸系數(shù),即α1-α9,從中選出顯著影響工業(yè)企業(yè)用電量數(shù)據(jù)的相關變量。在(6)式中,包括初始參數(shù)α0及9個變量的回歸參數(shù),運用經(jīng)濟學軟件MATLAB進行OLS估計,得到回歸系數(shù)的具體估計數(shù)值α0-α9,再對各變量分別檢驗,以決定該變量是否應被引入模型中,理論上剔除影響并不顯著的變量,進而確定最終的回歸方程。
本研究的目的是利用工業(yè)企業(yè)用電量數(shù)據(jù)的及時性與高頻率等特性,測算宏觀經(jīng)濟增長的數(shù)據(jù),即由方程(6)倒向回歸構建出GDP增長率與工業(yè)企業(yè)用電量的關系方程,進而估計得到高頻率的GDP數(shù)據(jù)。最終的回歸方程如下:
由上式可得,GDP增長率的估測數(shù)據(jù)gt是在工業(yè)企業(yè)用電量增長率與其回歸系數(shù)α1之比的基礎上,通過保留非顯著影響因素而得到的,因此可以通過工業(yè)企業(yè)用電量增長率及一些重要影響變量,倒向解構得到高頻GDP的增長率。
本研究采集2007—2018年12年內每個季度的江蘇省工業(yè)電力數(shù)據(jù)、省內GDP、平均溫度、假期天數(shù)、PPI指數(shù)、城鎮(zhèn)人口數(shù)量和產業(yè)發(fā)展程度數(shù)據(jù)進行分析。其中,省內溫度數(shù)據(jù)來自江蘇省氣象局;GDP及PPI等數(shù)據(jù)來自中經(jīng)數(shù)據(jù)庫;其他數(shù)據(jù)如江蘇省工業(yè)用電量,從江蘇省供電系統(tǒng)網(wǎng)站采集取得,由官方數(shù)據(jù)抽調并整合。
工業(yè)企業(yè)用電信息采集平臺需要對工業(yè)企業(yè)電量數(shù)據(jù)進行一定的數(shù)據(jù)集成,通常包括收集、存儲和剔除整合等處理步驟。電力企業(yè)利用光纖網(wǎng)絡將采集到的數(shù)據(jù)由集成器輸送到中央主控系統(tǒng),頻率為6次/分,最大程度地消除數(shù)據(jù)滯后現(xiàn)象。主控系統(tǒng)通過數(shù)據(jù)的分散存儲,將數(shù)據(jù)轉移到主控系統(tǒng)下的分設備內儲存,形成各個分散的小數(shù)據(jù)庫,使數(shù)據(jù)得到高效率運算。分系統(tǒng)會自動識別重復和無意義的非工業(yè)企業(yè)數(shù)據(jù),實現(xiàn)相關數(shù)據(jù)的挖掘整合,為最終的回歸分析打下基礎。利用Golden Gate對平臺的基礎數(shù)據(jù)進行提取,存儲到多個分塊節(jié)點內,在各分塊儲存器內部進行一定的計算和剔除,將各分塊儲存器的最終數(shù)據(jù)整合到MapReduce中進行高級運算,并對數(shù)據(jù)進行相關排序,最終得到2007—2018年的工業(yè)企業(yè)電力數(shù)據(jù),其數(shù)據(jù)趨勢如圖1。
圖1 2007—2018年江蘇省工業(yè)用電量和GDP的季度趨勢
根據(jù)圖1,可以得出江蘇省的工業(yè)用電量及GDP數(shù)據(jù)總體上呈現(xiàn)上升趨勢,其中工業(yè)用電量的平均年增長率為2.31%,GDP的平均季度增長率為4.25%。江蘇省工業(yè)用電量的增長速度相對緩慢,GDP的增長幅度則逐步提升,這表明GDP與工業(yè)企業(yè)用電量之間并非單純的相互影響,兩者在交互影響中也受到其他影響因素的作用。
為了確保數(shù)據(jù)的可用性和有效性,有必要對數(shù)據(jù)進行平穩(wěn)性檢驗。在此用擴展的迪克富勒檢驗方法(ADF)對江蘇省工業(yè)企業(yè)用電量和季度GDP的時間序列進行穩(wěn)定程度檢驗。這兩個時間序列取ln值,分別用Ly和Lg表示;對Ly和Lg進行ADF檢驗,根據(jù)結果判斷這兩個序列的穩(wěn)定性,表2為ADF檢驗結果。
由表2可得知,Ly和Lg的時間原始序列的t統(tǒng)計量概率值大于0.05,表明兩個原始時間序列不具備平穩(wěn)性。但是ΔLy和ΔLg的t統(tǒng)計量概率值為0,證明兩個原始序列的一階差分序列具備穩(wěn)定性,即工業(yè)用電量增長率和GDP增長率的時間序列具備穩(wěn)定性??傻贸鼋Y論,GDP的增長率比GDP數(shù)據(jù)本身更具備估測價值,因此對增長率進行回歸分析具備可靠性和有效性。
日尼神山腳下,村莊依著山勢次第攤開。幽藍的炊煙下,民舍和莊稼才剛被雨水清洗過,在正午的陽光下分外清麗。
表2 ADF檢驗結果
對工業(yè)企業(yè)用電量增長率和GDP增長率兩個序列進行漸次回歸,并在回歸過程中對其他控制變量進行觀測篩選,剔除影響不顯著的變量,最終使模型的結構達到最優(yōu)。利用Matlab對變量進行OLS回歸,最終得到10個回歸系數(shù)。利用顯著性區(qū)分法,去掉P值最高的回歸系數(shù)的對應變量,保留其他變量,再重復進行此操作,對剩余變量進行漸次篩選,最終得到自變量顯著效果最佳且對應度最高的模型。
通過利用Matlab的逐步OLS回歸,發(fā)現(xiàn)工業(yè)用電量增長率的二階滯后自相關性較高,在(6)式引入y的滯后參數(shù),即yt-2,得到回歸方程:
對(8)式采用最小二乘法回歸,得到季度內溫度的平均上升程度wt的回歸系數(shù)P值最高,為0.980;去除季度內的氣溫平均上升程度變量,再對其余的變量進行回歸,逐步去除低溫季W(wǎng)L和高溫季W(wǎng)H。由于去掉的變量均與氣溫相關,由此可知氣溫對工業(yè)企業(yè)的生產較難產生顯著影響;溫度浮動與工業(yè)企業(yè)用電行為并不顯著相關,其對用電量的影響作用體現(xiàn)在家庭的個人行為。經(jīng)過漸次回歸,得到的自變量和保留的控制變量均影響顯著。表3為漸次回歸過程結果。
表3 漸次回歸過程結果
在保留影響顯著的變量后,得到下式:
以江蘇省 2007—2018年的工業(yè)用電量及GDP數(shù)據(jù)為基礎對(9)式進行正向回歸,表4為正向回歸結果。
表4 正向回歸結果
將表4的所得的回歸系數(shù)結果代入(9)式,獲得GDP增長率的估測方程:
而針對GDP的數(shù)值估測,可由下式獲得:
上文得到的模型方程是在回歸系數(shù)長期維持不變的基礎上獲得的,但隨著時間線延長,宏觀經(jīng)濟狀況與工業(yè)用電之間的具體作用會根據(jù)產業(yè)發(fā)展狀況的變化有著相應的動態(tài)調整,因此回歸系數(shù)并不是一成不變的。為了提升GDP數(shù)值的準確度,本研究通過設定窗口期,在動態(tài)中實現(xiàn)模型的擬合回歸。
本研究選用的數(shù)據(jù)時間跨度為12年,每年包括4個季度,通常來說,3年內的經(jīng)濟狀況和技術革新情況相對而言不會產生顯著變化,在此將窗口期的時間跨度定義為10個單位季度,先對初始窗口期的數(shù)據(jù)進行參數(shù)估計,將估計結果作為下個時間期的GDP增速測度基礎,到下個時間期的時候,將窗口向后推移,刪除最初的季度數(shù)據(jù),增加后一個新季度數(shù)據(jù),因此窗口期的時間季度始終維持在特定值。以此類推,通過窗口期的漸次移動,最終構建出測算GDP的動態(tài)測度模型,即根據(jù)特定窗口期時間的非固定參數(shù)構建模型。
由于使用的用電量數(shù)據(jù)遲滯一個季度,季度樣本共43個,窗口期為滾動的10個樣本,在此正向方程的回歸過程共33次。抽取2011年一季度至2018年二季度的所有點位進行GDP測度,并將測度結果與官方公布的實際值進行對比。圖2為官方GDP增速數(shù)據(jù)與GDP增速測度結果的趨勢對比,圖3為官方GDP數(shù)值與GDP測度結果的趨勢對比,可得出官方數(shù)據(jù)與測度結果的擬合程度。
圖2 官方GDP增速數(shù)據(jù)與GDP增速測度結果的趨勢對比
圖3 官方GDP數(shù)值與GDP測度結果的趨勢對比
倒向回歸得到的GDP增速與官方公布的GDP增速數(shù)值在符號上保持一致,且兩者的趨勢差異較小,擬合程度較高。擬合程度最接近的是2012年第四季度,差值百分比為0.30%。圖2和圖3更加明顯地反映了兩者之間的擬合程度。圖2中2011年一季度到2018年第二季度期間,GDP增長率的估測結果與官方數(shù)值趨勢整體相同、整體差異較小,證實了本文使用的通過工業(yè)企業(yè)用電量數(shù)據(jù)倒向測度GDP增速的方式是可靠有效的,測度數(shù)值的擬合程度較高。
以上文得到的季度GDP增速的測度結果為基礎,估測2011—2017年間的年度 GDP增速。將測度結果與官方公布的實際值進行對比,圖4(見下頁)為官方年度GDP數(shù)值與年度GDP測度結果的趨勢對比。
圖4 官方年度GDP數(shù)值與年度GDP測度結果的趨勢對比
可以看出,年度估測結果與季度估測結果相比,與官方給出的數(shù)據(jù)擬合程度更高,差異更小,且年度測度結果與官方數(shù)值的平均誤差在2%以下,說明得到的年度估測結果一定程度上消除了季度估測的偏離差異,使得年度估測與官方實際數(shù)據(jù)的擬合程度更高。由圖4可看出,年度測度結果與官方實際數(shù)據(jù)之間的擬合波動較小,其偏差程度要優(yōu)于季度估測趨勢對比,這再次證明了本研究使用的倒向解構測度方法的可靠性,不僅可有效提升GDP頻率,還在消除滯后性的同時縮小了測度數(shù)與官方數(shù)據(jù)的擬合差距。
現(xiàn)實中往往需要更高頻率的以月度甚至周為單位的GDP數(shù)據(jù)。在此對江蘇省每天的工業(yè)企業(yè)用電量數(shù)據(jù)進行收集并處理,代入上文模型,估測出每天的GDP增速,在此基礎上進而估測得到月度乃至周度的GDP增速,并估測出月度GDP和周度GDP的具體數(shù)值。利用2013—2017年的實際數(shù)據(jù)估測得到的日度GDP增速來倒推季度和年度的GDP增速,并將其與公布的實際數(shù)據(jù)進行趨勢對比。圖5為季度GDP實際增速與GDP增速估測結果的對比,圖6為年度GDP實際增速與GDP增速估測結果的對比。
圖5 江蘇省季度GDP實際增速與GDP增速估測結果的對比
圖6 江蘇省年度GDP實際增速與GDP增速估測結果的對比
根據(jù)圖5及圖6,可得出基于工業(yè)電力數(shù)據(jù)估測得出的季度及年度GDP增速和數(shù)值均與實際數(shù)據(jù)深度擬合,且擬合差異較小,甚至在2015年度GDP估測值與官方數(shù)據(jù)趨于一致。將年度數(shù)據(jù)與季度數(shù)據(jù)作對比,就GDP增速和數(shù)值來看,年度數(shù)據(jù)的擬合狀況更優(yōu)于季度數(shù)據(jù)。因此得出結論,根據(jù)工業(yè)電力大數(shù)據(jù)估測出的不同頻率的GDP數(shù)值,其趨勢走向及數(shù)值均與實際數(shù)值較為接近,表明本文采用的方法可以實現(xiàn)對宏觀經(jīng)濟可行且可靠的預測。
本文基于工業(yè)電力大數(shù)據(jù),通過構建動態(tài)倒向回歸方程,實現(xiàn)對GDP數(shù)據(jù)的精準測算。通過對2007—2018年間的電力數(shù)據(jù)進行估測,發(fā)現(xiàn)無論基于季度還是年度的時間區(qū)間,利用倒向回歸得到的GDP增速均與官方公布的GDP增速數(shù)值在符號上保持一致,且兩者的趨勢差異較小,擬合程度較高,表明利用江蘇省的工業(yè)電力大數(shù)據(jù)可以實現(xiàn)當期省內GDP的增速估測,且利用此方法對宏觀經(jīng)濟進行預測是可行且可靠的。而由于電力數(shù)據(jù)平臺的完備與及時性,較容易得到月度、周度乃至日度的電力大數(shù)據(jù),再通過倒向構建回歸方程即能估測出更高頻率的GDP數(shù)值,進而能大幅提升政府、企業(yè)團體及公民個人的金融規(guī)劃效率。
本文的創(chuàng)新之處在于,利用工業(yè)電力數(shù)據(jù)的及時性和高頻特性,通過倒向回歸方程實現(xiàn)對GDP的精準預測,在很大程度上突破了GDP數(shù)據(jù)的低頻和時滯約束。同時,通過對原始數(shù)據(jù)的耦合和分散處理,盡量避免了由于數(shù)據(jù)樣本偏差影響測度結果精準度的情況,并且通過設置固定時間周期的窗口期,實現(xiàn)了回歸模型參數(shù)在非固定時間周期內的動態(tài)變化。