汪志紅
(廣東金融學院 金融數(shù)據(jù)與統(tǒng)計學院,廣東 廣州 510521)
近年來,SARS、新冠肺炎疫情和各種自然災害等突發(fā)事件對人們生活和社會經濟造成不同程度的沖擊,階段性地影響著人們日常生活和社會發(fā)展。鐵路作為我國重要交通工具,其客運量變化能夠較為直觀地體現(xiàn)某些突發(fā)事件對人民生活的影響,研究分析其沖擊程度和發(fā)展趨勢有利于更好地預防和應對將來可能引起的影響,這也是各級應急管理機構重點關注的問題之一。
突發(fā)事件對鐵路客運量的影響實際上是一個突發(fā)事件的干預問題,這種干預可以運用干預模型來進行定量分析。學者們通常從2 個方面基于時間序列構建突發(fā)事件干預模型并進行干預分析:一類是將某些影響因素和政策措施作為時間序列的干預因素[1-2],分析其干預常規(guī)變量對社會經濟影響程度的大小,對其干預趨勢進行研究。該類方法將鐵路客運量分解為ARIMA 模型擬合值與突發(fā)事件干預因素,一定程度上忽視了干預因素與ARIMA 模型內部可能存在的關系。另一類是用脈沖函數(shù)或階梯函數(shù)將某一突發(fā)事件作為干預因素,研究突發(fā)事件或政策干預的程度大小,同時研究其干預趨勢,其研究過程為在識別時間序列異常值和最優(yōu)ARIMA 模型基礎上,對異常值進行基于脈沖函數(shù)或階梯函數(shù)的虛擬變量針對性設計,確定干預過程的傳遞函數(shù),與最優(yōu)ARIMA 模型結合,構建時間序列的干預模型,這是當前國外時間序列干預研究的主流方法[3-5],如Habib[5]等以現(xiàn)代避孕措施的三階段作為階段干預因素,對加納和坦桑尼亞的公共衛(wèi)生事件進行試驗研究,得出帶控制組的時間序列干預模型能夠較為全面地分析公共衛(wèi)生事件干預的變化過程。在該類方法的實際應用中,學者們更多地將干預因素作為時間序列干預模型整體的一部分進行研究,相對第一類方法更能體現(xiàn)模型設計的系統(tǒng)性,但對干預因素類型選擇缺乏理論依據(jù),同時缺乏對趨勢干預過程的比較分析。時間序列模型在鐵路客運量實際應用研究方面,X-13ARIMASEATS 或ARIMA 等時間序列模型更多地應用于鐵路客運量的預測過程[6-9],如錢名軍等[6]運用SARIMA-GARCH 融合模型、SARIMA、ARIMA和NAR 動態(tài)神經網絡模型對鐵路月度客運量進行預測比較研究,認為SARIMA-GARCH 融合模型進行鐵路客運量預測精度更高,但基于時間序列干預模型對鐵路客運量的突發(fā)事件干預分析略顯不足,可以在干預分析的基礎上進一步細化鐵路客運量預測過程,提高預測精度。
在此,針對突發(fā)事件對鐵路客運量干預分析過程的不完善問題,應用X-13ARIMA-SEATS 季節(jié)調整方法中的自動檢測突發(fā)事件離群值(異常值)功能,將離群值與脈沖函數(shù)或階梯函數(shù)進行特征比較分析,科學確定突發(fā)事件虛擬變量類型,運用設計的虛擬變量在確定突發(fā)事件影響程度大小的同時,基于ARMA 干預傳遞函數(shù)分析突發(fā)事件對鐵路客運量的沖擊趨勢,在總體上提升時間序列干預分析的科學性和系統(tǒng)性的同時,拓展時間序列干預分析在工程上的應用。
在X-13ARIMA-SEATS 季節(jié)調整中,通常將離群值分為4 種類型,第1 類為突發(fā)可加(Additive Outlier,AO)離群值點,是在某一時刻T受到異常突發(fā)事件沖擊;第2 類為水平漂移(Level Shift,LS)離群值點,是從某時刻T瞬間變化到一個新的水平,并一直保持這一水平;第3 類為暫時變化(Temporary Change,TC)離群值點,為干預經過指數(shù)衰減回到原來水平;第4 類為斜線上升(Ramp Effect,RP)離群值點,為從T1時刻開始以線性速度逐漸變化到新的水平T2[10]。各離群值點表示形式如下。
式中:AOt為t時刻的突發(fā)可加離群值;t為突發(fā)事件干預發(fā)生的時間變量;T為突發(fā)事件干預時間點;LSt為t時刻的水平漂移離群值;TCt為t時刻的暫時變化離群值;α為經指數(shù)衰減回到原始水平的速率;RPt為t時刻的斜線上升離群值;T1為線性速率逐漸變化起點;T2為線性速率逐漸變化終點。
在時間序列干預模型中,將干預函數(shù)分為2 種類型,一種是在T時刻短期影響的暫時的脈沖函數(shù),一種是從T時刻長期影響的持續(xù)的階梯函數(shù),干預函數(shù)各類型公式如下。
根據(jù)離群值和干預函數(shù)表示形式,并結合兩者表現(xiàn)形式特點,使用干預函數(shù)構建離群值干預變量,此時,Pt(T)和St(T)被稱為虛擬變量。根據(jù)干預過程影響時間的持續(xù)性特征,使用ARMA 模型表示干預傳遞函數(shù)。
假設干預為AO 離群值類型的暫時性干預,即只在T時刻(或滯后q階)影響時間序列均值函數(shù),則干預大小表示為
式中:Xt為干預大?。粀為干預函數(shù)系數(shù);B為滯后算子;q為算子滯后階數(shù)。
以公式 ⑼ 為干預一般表示形式,結合離群值特點,4類離群值干預變化過程的傳遞函數(shù)表示如下[1-2]。
(1)AO 離群值導致干預發(fā)生,干預傳遞函數(shù)顯示在T時刻(或干預滯后q階)產生w的干預沖擊。AO 離群值干預傳遞函數(shù)XtAO表示為
(2)LS 離群值導致的干預突然發(fā)生,使時間序列均值發(fā)生永久性變化,其干預傳遞函數(shù)表示在T時刻(或干預滯后q階)處突然產生w的永久性干預。LS 離群值干預傳遞函數(shù)XtLS表示為
(3)TC 離群值導致干預開始,使時間序列均值產生短暫影響,干預傳遞函數(shù)顯示在T時刻(或干預滯后q階)處從干預w以指數(shù)級δ p逐漸回歸到原來水平。TC 離群值干預傳遞函數(shù)XtTC表示為
式中:δ為自回歸多項式系數(shù)。
(4)RP 離群值導致干預發(fā)生,并產生永久性新水平變化,其干預傳遞函數(shù)顯示在沖擊的滯后q階處從w1+w2以指數(shù)級δ p逐漸變化到新水平w2水平。RP 離群值干預傳遞函數(shù)XtRP表示為式中:w1與w2分別為滑動平均多項式系數(shù)。
將以上各類干預傳遞函數(shù)作為季節(jié)調整識別的最優(yōu)ARIMA 模型的外生傳遞函數(shù)變量,即可得到如下時間序列干預模型。
式中:?d為d階非季節(jié)差分;?SD為季節(jié)周期為S(此處周期為12)的D階差分;Yt為鐵路客運量時間序列;θ1,θ2,…,θq為殘差非季節(jié)移動平均系數(shù);?1,?2,…,?Q為殘差季節(jié)移動平均系數(shù);QS為季節(jié)移動平均滯后階數(shù);φ1,φ2,…,φp為殘差非季節(jié)自回歸系數(shù);φ1,φ2,…,φP為殘差季節(jié)自回歸系數(shù);PS為季節(jié)自回歸滯后階數(shù);εt為零均值白噪音序列。
公式 ⒁ 中,前一部分為干預傳遞函數(shù);后一部分為ARMA 模型部分,分子為q階移動平均(MA)和QS階移動平均季節(jié)多項式乘積,分母為p階自回歸(AR)和PS階自回歸季節(jié)多項式乘積。
研究分析2002 年1 月—2020 年8 月鐵路客運量數(shù)據(jù),鐵路客運量時間序列分布曲線如圖1 所示。根據(jù)圖1,鐵路客運量表現(xiàn)出較強的季節(jié)性特征,且在2002 年與2020 年出現(xiàn)急劇下滑現(xiàn)象,說明有突發(fā)事件對鐵路客運量造成重大激冷沖擊。
圖1 鐵路客運量時間序列分布曲線Fig.1 Time-series distribution curve of railway passenger volume
根據(jù)數(shù)據(jù)季節(jié)性特征顯著、異常值凸顯和月度數(shù)據(jù)特點,在考慮季節(jié)性、周期性、發(fā)展趨勢和異常值影響等條件下,采用主要分析月度尺度和季度尺度時間序列的X-13ARIMA-SEATS 模型對其進行季節(jié)調整、最優(yōu)ARIMA 模型識別和離群值檢測。X-13ARIMA-SEATS 模型是X-12ARIMA 季節(jié)調整模型和TRAMO-SEATS 季節(jié)調整模型的結合,其優(yōu)點一是增加X-12ARIMA 季節(jié)調整中Reg-ARIMA 模塊的延展時間序列、自動識別ARIMA模型和檢測離群值能力,增加移動假日(如中國春節(jié)等)和交易日效應及預測能力;二是使用SEATS程序和X-11 非參數(shù)調整方法,產生基于季節(jié)因素建模的ARIMA 預調整和預測方法[11-12]。
研究主要應用X-13ARIMA-SEATS 模型的最優(yōu)ARIMA 模型自動識別、離群值檢測和預測功能進行干預模型的設計與分析,得到季節(jié)調整結果。鐵路客運量的X-13ARIMA-SEATS 季節(jié)調整結果如表1 所示。
表1 鐵路客運量的X-13ARIMA-SEATS 季節(jié)調整結果Tab.1 X-13ARIMA-SEATS seasonal adjustment results of railway passenger volume
根據(jù)表1 季節(jié)調整結果顯示,去除季節(jié)效應和離群值的最優(yōu)ARIMA 模型為ARIMA (0,1,1)×(0,1,1)12,殘差季節(jié)性(QS= 1.021)、相關性(Box-Ljung= 35.00)和正態(tài)性檢驗(Shapiro= 0.975)通過無季節(jié)性、無自相關性和正態(tài)性檢驗,模型各個統(tǒng)計量的綜合Q統(tǒng)計量為0.740,值小于1,模型有效,該ARIMA 模型可用。模型結果顯示,非季節(jié)與季節(jié)移動平均系數(shù)顯示強顯著性,體現(xiàn)外部環(huán)境對鐵路客運量影響顯著,季節(jié)效應顯示鐵路客運量具有顯著的閏年正效應和工作日負效應,檢測到影響顯著的5 個離群值。根據(jù)歷年影響鐵路客運量的重大突發(fā)事件信息,2003 年5 月離群值(AO2003.May)為SARS 疫情對鐵路客運量的顯著激冷沖擊,2014 年12 月離群值(AO2014.Dec)為客票實名制全面實施的政策性顯著正向沖擊,2020 年2 月離群值(AO2020.Feb,LS2020.Feb)為新冠肺炎疫情初期引起的顯著負向沖擊,2020 年5 月離群值(LS2020.May)為新冠肺炎疫情解禁令對鐵路客運量引起的顯著正向沖擊。造成沖擊的離群值主要分為2 類,一類為突然發(fā)生且瞬間變化到某一水平的可加AO離群值,另一類為從某時刻瞬間變化到一個新水平的LS 離群值。在檢測到各異常值顯著性沖擊特征存在的條件下,需要對離群值干預趨勢作進一步研究,以分析其沖擊變化特點。
根據(jù)表1 中檢測的離群值特點,AO2003.May離群值為2003 年5 月SARS 疫情的暫時沖擊,其干預傳遞函數(shù)可以使用公式 ⑽ 表示,考慮其干預減弱趨勢,采用具有變化趨勢的公式 ⑿ 體現(xiàn)其干預和變化趨勢;同理,AO2014.Dec 離群值為2015 年1 月實施的鐵路客票實名制政策的前置短暫干預影響,其干預傳遞函數(shù)可以用公式 ⑿ 表示;AO2020.Feb 與LS2020.Feb 離群值為2020 年2 月新冠肺炎疫情對鐵路客運量的干預,該干預存在短暫強沖擊和后期持續(xù)弱沖擊,可以采用公式 ⑾ 和公式 ⑿ 的綜合沖擊函數(shù)表示;LS2020.May 離群值干預為2020 年4 月新冠肺炎疫情解禁令實施的長期影響,可以使用公式 ⑾ 表示。將離群值的干預傳遞函數(shù)替換表1 季節(jié)調整模型中檢測出的離群值變量,作為干預模型中突發(fā)事件干預部分。
對于閏年效應和工作日效應,將其作為不需傳遞變換變量放入模型,其閏年和工作日效應變化借鑒X-13ARIMA-SEATS 閏年效應和工作日效應虛擬變量的構造方式[13]。
相對于表1 中X-13ARIMA-SEATS 季節(jié)調整基礎模型,該模型不僅能體現(xiàn)離群值代表的突發(fā)事件的影響程度大小,更能通過自回歸模式顯示其突發(fā)事件的影響變化過程[14-15]。干預模型算法使用R語言實現(xiàn)[16-17]。
根據(jù)構建的鐵路客運量干預模型(公式 ⒄),對鐵路客運量進行基于表1 最優(yōu)季節(jié)調整模型(ARIMA (0,1,1)×(0,1,1)12) 的干預分析,得到季節(jié)調整的干預模型分析結果。鐵路客運量干預模型分析結果如表2 所示。根據(jù)表2,在模型ARIMA (0,1,1)×(0,1,1)12基礎上,添加的各干預變量都表現(xiàn)出強顯著性影響,相對模型未添加干預因素的(0,1,1)×(0,1,1)12,該模型AIC值和極大似然估計值分別為-387.93 和205.97,顯示出更優(yōu)的模型擬合效果。
表2 鐵路客運量干預模型分析結果Tab.2 Analysis results of intervention model for railway passenger volume
根據(jù)表2,閏年效應(LeapYear)和工作日效應(Workday)顯著性影響程度變化不大,與季節(jié)調整模型結果基本一致;季節(jié)(sma1)和非季節(jié)(ma1)滑動平均部分系數(shù)由表1 中的正顯著影響變?yōu)樨擄@著影響,體現(xiàn)出客運量本身的外在隨機影響因素影響變小;離群值作為干預變量后,以激冷沖擊為主的離群值對模型隨機部分的負向影響加大,模型體現(xiàn)離群值表征的突發(fā)事件對鐵路客運量的影響更顯著。
根據(jù)表2,SARS 疫情對鐵路客運量表現(xiàn)出顯著性負影響,并以0.437p的指數(shù)形式逐漸減弱,SARS 疫情在滯后的第2 期顯示出較強的恢復趨勢,季節(jié)與非季節(jié)一階差分鐵路客運量離群值干預與恢復趨勢比較如表3 所示,在沖擊滯后的第5 ~ 6 期鐵路客運量基本得到恢復,8 ~ 9期后基本完全恢復,這與智研咨詢調查結果基本一致[18]。從2002 年12月SARS 疫情出現(xiàn)初期到2003 年4 月疫情基本控制,鐵路客運量未受到很大的沖擊,直到2003 年4 月,一些省市(如廣東省)取消一系列團體旅行,同時世界衛(wèi)生組織發(fā)出SARS 疫情的全球警告,我國鐵路客運量在2003 年5 月(突發(fā)期)開始驟然下滑,5 月同比下降61.18%,7 月開始回穩(wěn),8 月增速回正,2004 年1 月(滯后8 期)完全恢復。
表3 季節(jié)與非季節(jié)一階差分鐵路客運量離群值干預與恢復趨勢比較Tab.3 Comparison of intervention and recovery trend of outliers in seasonal and non-seasonal first-order differential railway passenger volumes
新冠肺炎疫情初期首先對鐵路客運量以w3=-1.784 的強永久性顯著負影響,同時疊加以w4=-0.996 的顯著性負影響,之后以0.550p的指數(shù)形式逐漸減弱。根據(jù)其恢復趨勢,在2020 年12 月(滯后10 期),疫情初期帶來的巨大激冷沖擊只恢復到35.73%,疫情解禁令對鐵路客運量帶來的w5= 0.289的正向永久的顯著影響持續(xù)存在,與疫情初期影響合并,在2020 年12 月(滯后10 期),疫情初期帶來的巨大激冷沖擊恢復到46.12%。
與疫情帶來的負向顯著影響不同,鐵路客票實名制政策對鐵路客運量顯著性影響是正負波動性逐漸減弱過程,體現(xiàn)出政策具有較強的社會性,在實施過程中還會出現(xiàn)一定的不穩(wěn)定性,且該政策對客運量影響時間較短。從2015 年1 月1 日全國全面實施鐵路客票實名制政策,受政策利空影響,2014 年12 月提前出現(xiàn)鐵路客運量大幅增加的激熱效應,具體實施實名制后,客運量出現(xiàn)小幅波動,在2015 年3 月(滯后3 期)基本完全恢復,體現(xiàn)出鐵路部門前期宣傳、試點工作很深入,廣大旅客能夠很快適應政策的變化。
根據(jù)以上分析結果,得到的各離群值干預影響的趨勢變化,各種離群值對鐵路客運量干預比較圖如圖2 所示。圖2 直觀顯示出SARS 疫情與鐵路客票實名制政策對鐵路客運量影響時間比較短,分別在6 個月和4 個月后波動基本趨向為0;新冠肺炎疫情初期影響波動較大,2020 年2 月為沖擊最大點,后期開始緩慢恢復,在2020 年4 月解禁令和復工復產等利好政策的推動下,新冠肺炎疫情初期突發(fā)性帶來的激冷沖擊基本完全釋放,當前,處于新冠肺炎疫情防控措施和解禁令帶來的永久效應影響,這種效應會在較長時間內持續(xù)存在。
圖2 各種離群值對鐵路客運量干預比較圖Fig.2 Comparison chart of various outliers intervening railway passenger volume
對季節(jié)調整模型與基于離群值特征的干預模型擬合值進行相對誤差比較分析,季節(jié)調整模型與干預模型絕對相對誤差比較如表4所示。分析結果顯示,干預模型絕對相對誤差相對季節(jié)調整模型低10%,顯示干預模型擬合結果與實際值更接近,對數(shù)據(jù)的擬合更有效。因此,將離群值作為干預變量進行分析能夠提高鐵路客運量的擬合精度。季節(jié)調整曲線、干預模型擬合曲線與原始曲線比較如圖3 所示。
根據(jù)圖3,季節(jié)調整曲線消除各類季節(jié)效應的影響,調整曲線相對原始曲線光滑很多,可以較為客觀地體現(xiàn)鐵路客運量的整體發(fā)展趨勢;干預模型擬合曲線與原始曲線基本重合,可以更好地體現(xiàn)干預模型對鐵路客運量的信息解釋程度。在當前新冠肺炎疫情管控條件下,疫情對鐵路客運量沖擊在逐漸減小,鐵路客運量逐漸回暖,總體處于上升趨勢。
研究基于SARS、新冠肺炎疫情和鐵路客票實名制政策等主要干預事件構建我國鐵路客運量干預模型,從干預理論和可視化過程2 個方面分析突發(fā)事件的沖擊過程,在一定程度上能夠厘清突發(fā)事件對我國鐵路客運量干預的發(fā)展趨勢,該方法可以拓展到我國交通系統(tǒng)突發(fā)事件干預的多個方面。在實際研究過程中,由于數(shù)據(jù)的不可獲得性,沒有考慮鐵路線路增加和區(qū)域特點對鐵路客運量的影響,在不影響整體發(fā)展趨勢的條件下一定程度上會弱化或強化突發(fā)事件干預因素的干預強度,這也是當前不能深入進行這方面干預分析的難題所在。