范傳棋
(西南財(cái)經(jīng)大學(xué) 中國西部經(jīng)濟(jì)研究中心,成都 611130)
Rule在研究1866年到1911年英國的人口死亡率和教堂舉行婚禮次數(shù)關(guān)系時(shí)發(fā)現(xiàn)二者具有很高的相關(guān)關(guān)系。如果將1950年到2011年間俄羅斯的人口數(shù)量與中國的人口數(shù)量進(jìn)行回歸,我們會(huì)得出同樣的結(jié)論。在時(shí)間序列中分析中,如果對(duì)兩個(gè)獨(dú)立的時(shí)序列建立回歸模型,我們有時(shí)會(huì)得出兩個(gè)序列之間具有很高擬合度的結(jié)論,各個(gè)回歸參數(shù)也具有統(tǒng)計(jì)學(xué)意義,這種現(xiàn)象稱為謬誤回歸,在統(tǒng)計(jì)上也稱為無意義相關(guān)。當(dāng)出現(xiàn)謬誤回歸時(shí),回歸參數(shù)的估計(jì)特征異于經(jīng)典單方程回歸模型中各個(gè)參數(shù)的估計(jì)特征,同時(shí)相關(guān)統(tǒng)計(jì)量的分布不再滿足正態(tài)分布特征。國內(nèi)外學(xué)者在一元謬誤回歸方面做了大量的研究,1974年Granger and Newbold針對(duì)回歸方程各個(gè)系數(shù)在統(tǒng)計(jì)學(xué)上顯著,可決系數(shù)R2值接近1,而DW統(tǒng)計(jì)量接近0的現(xiàn)象做了分析,他們利用蒙特卡羅模擬方法證明了即使是兩個(gè)獨(dú)立的隨機(jī)游走序列在做回歸的時(shí)候也會(huì)出現(xiàn)謬誤回歸現(xiàn)象;1986年P(guān)hillips運(yùn)用泛函中心極限定理從理論上揭示了謬誤回歸的表現(xiàn),推導(dǎo)出了兩個(gè)獨(dú)立的隨機(jī)游走變量回歸時(shí)幾個(gè)常用統(tǒng)計(jì)量的極限分布,指出謬誤回歸的t和F統(tǒng)計(jì)量的分布都是發(fā)散的;2004年Kim,Lee and Newbold研究發(fā)現(xiàn)謬誤回歸現(xiàn)象不僅僅發(fā)生在非平穩(wěn)時(shí)間序列中,也存在于獨(dú)立的趨勢(shì)平穩(wěn)時(shí)間序列中。張凌翔,張曉峒運(yùn)用蒙特卡羅模擬方法對(duì)結(jié)構(gòu)突變平穩(wěn)過程與隨機(jī)趨勢(shì)過程中的謬誤回歸進(jìn)行了研究,指出出現(xiàn)謬誤回歸時(shí)F統(tǒng)計(jì)量的極限分布是發(fā)散的,DW統(tǒng)計(jì)量以概率收斂于0,R2具有不退化的極限分布,并且在有限樣本條件下謬誤回歸發(fā)生的概率較大。本文將Granger and Newbold的謬誤回歸理論以及Phillips泛函中心極限定理結(jié)合起來,利用蒙特卡羅模擬方法考察OLS下出現(xiàn)謬誤回歸時(shí)相關(guān)參數(shù)及常用統(tǒng)計(jì)量的極限分布。
考察如下兩個(gè)隨機(jī)游走時(shí)間序列{yt}和{xt}:
其中W(t)是在C[0,1]上一個(gè)獨(dú)立的維納過程,對(duì)于序列{yt}上式的推導(dǎo)同樣成立,序列{yt}中的維納過程用V(t)表示,當(dāng)T→∞時(shí),式(2)中的各個(gè)系數(shù)與統(tǒng)計(jì)量滿足
下列特征:
本文用于研究的數(shù)據(jù)均由式(1)生成,檢驗(yàn)水平設(shè)置為5%;為了考察隨著樣本容量的增加,各個(gè)相關(guān)參數(shù)以及統(tǒng)計(jì)量呈現(xiàn)出的變化規(guī)律與分布特征,將樣本分為十位樣本、百位樣本以及千位樣本,百位樣本選取T=20,40,60,80 ,100;千位樣本選取T=200,400,600,800,1000;萬位樣本選取T=2000,4000,6000,8000,10000。
R2是衡量回歸方程擬合優(yōu)度的統(tǒng)計(jì)量,在判別謬誤回歸中R2是一個(gè)很重要的判別指標(biāo)。在出現(xiàn)謬誤回歸時(shí),其分極限分布與樣本特征異于經(jīng)典回歸方程中的R2分布形式與樣本特征,其極限分布見圖1(圖1中縱坐標(biāo)為當(dāng)解釋變量的t統(tǒng)計(jì)量顯著時(shí)R2的頻數(shù)F,橫坐標(biāo)為R2值),R2的樣本特征見表1。
圖1 10000次模擬的R2極限分布圖
從圖1中可以看出,盡管隨機(jī)游走序列{yt}和{xt}之間是相互獨(dú)立的,但是在解釋變量的t統(tǒng)計(jì)量顯著時(shí),R2>0.5的頻數(shù)F=1631次,即在10000次模擬回歸中R2>0.5出現(xiàn)了1631次,從理論上來講,在這10000次模擬回歸中R2的值都應(yīng)該為零,因此可以認(rèn)定此次模擬回歸出現(xiàn)了謬誤回歸。此時(shí)R2極限分布的偏度S=0.859>0,峰度K=2.685<3,JB=1271.4(數(shù)據(jù)見表1),其不滿足正態(tài)分布特征,R2極限分布呈現(xiàn)低峰、薄尾、右偏的分布特征,具有一個(gè)不退化的極限分布。
表1 10000次模擬R2的樣本特征
表1給出了出現(xiàn)謬誤回歸時(shí),R2隨著樣本的增加而表現(xiàn)出的樣本特征??梢钥闯鲭S著樣本的增加,標(biāo)準(zhǔn)差Std、偏度S、峰度K以及JB統(tǒng)計(jì)量變化不大,基本上保持穩(wěn)定,而F值隨著樣本容量的增加而遞增,也就是說在謬誤回歸中R2的分布是穩(wěn)定的,其并不隨著樣本的增加而發(fā)生改變,同時(shí)樣本容量的增加不但未能弱化謬誤回歸反而增加了出現(xiàn)謬誤回歸的可能性。
DW統(tǒng)計(jì)量是利用殘差構(gòu)成的統(tǒng)計(jì)量來推斷誤差項(xiàng)是否存在自相關(guān),DW統(tǒng)計(jì)值的范圍為[0,4],其為0的情況是很罕見的。下文給出了10000次模擬DW統(tǒng)計(jì)量的極限分布圖,見圖2,以及DW統(tǒng)計(jì)量的樣本特征,見表2。
圖2 DW統(tǒng)計(jì)量的極限分布圖
從圖2中可以看出,DW統(tǒng)計(jì)量值都小于0.01,DW統(tǒng)計(jì)量偏度S=1.402>0,峰度K=6.193>3,JB=7527(見表2),DW統(tǒng)計(jì)量的極限分布不滿足正態(tài)分布特征,呈現(xiàn)高峰、厚尾、右偏的分布特征。
表2 DW統(tǒng)計(jì)量的樣本特征
表2為在出現(xiàn)謬誤回歸時(shí),DW統(tǒng)計(jì)量隨著樣本的增加而表現(xiàn)出的樣本特征。DW統(tǒng)計(jì)量的標(biāo)準(zhǔn)差和均值均隨著樣本的增加而不斷的趨近于0,當(dāng)樣本無窮大時(shí),DW統(tǒng)計(jì)量以概率收斂于0;DW統(tǒng)計(jì)量的偏度隨著樣本的增加并沒有發(fā)生太大的變化,而DW統(tǒng)計(jì)量的峰度和JB統(tǒng)計(jì)量隨著樣本的增減而遞增,其高峰、厚尾、右偏的分布特征并未隨著樣本的增加而改變。
t(α)為歸方程中常數(shù)項(xiàng)的t統(tǒng)計(jì)量,出現(xiàn)謬誤回歸時(shí),其極限分布與參數(shù)特征也同樣會(huì)發(fā)生改變。
從圖3中可知 t(α)為一個(gè)對(duì)稱分布,其偏度S=-0.0145<0,峰度K=3.3347>3(見表3),其極限分布不滿足正態(tài)分布的特征,呈現(xiàn)高峰、厚尾、左偏的分布特征。
圖3 t(α)的極限分布圖
表3 t(α)的樣本特征
從表3中可知,在謬誤回歸的前提下,t(α)的標(biāo)準(zhǔn)差是隨著樣本的增加而不斷遞增的,也就是說t(α)是發(fā)散的,并未收斂于某個(gè)值;t(α)的偏度隨著樣本的增加并未呈現(xiàn)出較強(qiáng)的規(guī)律性,但S值始終大于0,JB統(tǒng)計(jì)量隨著樣本的增加呈現(xiàn)遞增的趨勢(shì),可以肯定的是t(α)的極限分布不再服從正態(tài)分布。
α為回歸方程中常數(shù)項(xiàng)系數(shù),在發(fā)生謬誤回歸時(shí),其相關(guān)參數(shù)與各個(gè)統(tǒng)計(jì)量隨著樣本容量的增加發(fā)生著不同的變化,見表4,隨著樣本的增加,α的均值絕對(duì)值不斷遞增,同時(shí)α的標(biāo)準(zhǔn)差隨著樣本的增加也在不斷地遞增,也就是說α隨著樣本容量的增加而發(fā)散,并不會(huì)收斂與某一值。由于S不等于0、K不等于3,所以α的極限分布不再服從正態(tài)分布,但是在樣本為10000時(shí)α的S值有趨近于0,K值有趨近于3的趨勢(shì),隨著樣本的無限擴(kuò)展α是否會(huì)近似服從正態(tài)分布這一論點(diǎn)需要更高級(jí)的計(jì)算機(jī)進(jìn)行模擬論證。但是本文傾向隨著樣本的無限擴(kuò)展,α仍然不會(huì)近似服從正態(tài)分布這一觀點(diǎn)。
t(β)是判別解釋變量系數(shù)是否顯著異于0的指標(biāo),在經(jīng)典單方程回歸中t(β)是服從正態(tài)分布的,在發(fā)生謬誤回歸時(shí),其分布也發(fā)生了顯著的變化。從圖4中可以看出|t(β)|>1.96的頻數(shù)非常高,這意味著在對(duì)兩個(gè)獨(dú)立的隨機(jī)游走序列作模特卡羅模擬時(shí),出現(xiàn)了謬誤回歸。t(β)的偏度S=0.02>0,峰度K=3.75>3(見表5),其極限分布為一個(gè)對(duì)稱分布,不再滿足正態(tài)分布的特征,呈現(xiàn)高峰、厚尾、右偏的分布特征。
表4 α的樣本特征
圖4 t(β)的極限分布圖
從表5中可以看出P值隨著樣本的增加而增加,也就是說隨著樣本的增加,出現(xiàn)謬誤回歸的可能性也在增加。
t(β)的標(biāo)準(zhǔn)差隨著樣本的增加不斷增大,可以認(rèn)定t(β)不會(huì)收斂于某一個(gè)值,也就是說 t(β)是發(fā)散的;t(β)的偏度、峰度以及JB統(tǒng)計(jì)量并不隨著樣本的增加有過多的改變。
β為回歸方程的系數(shù),在出現(xiàn)謬誤回歸后,β的偏度S隨著樣本的增加時(shí)而為正時(shí)而為負(fù),峰度K值和JB統(tǒng)計(jì)量值呈不斷遞減的趨勢(shì),S值有趨近于0的趨勢(shì)、K不斷趨近于3。在樣本為10000的模擬條件下,β的分布呈現(xiàn)高峰、厚尾、右偏的分布特征,但是隨著樣本的無限增加,其分布是否會(huì)出現(xiàn)近似正態(tài)分布的特征,這就需要更高級(jí)、運(yùn)算速度更快的計(jì)算機(jī)進(jìn)行模擬。本文傾向隨著樣本無限擴(kuò)展,β仍然不會(huì)近似服從正態(tài)分布這一觀點(diǎn)。
表6 β的樣本特征
β的均值呈現(xiàn)不斷遞增的趨勢(shì),也就是回歸方程中解釋變量的系數(shù)異于0的趨勢(shì)在增強(qiáng),β的標(biāo)準(zhǔn)差并未隨著樣本的增加有太大的變化,可以認(rèn)定β會(huì)收斂于某個(gè)常數(shù)。
綜合理論分析與Monte Carlo模擬結(jié)果可以得出以下結(jié)論:
(1)出現(xiàn)謬誤回歸時(shí),R2的極限分布不再服從正態(tài)分布,而是呈現(xiàn)低峰、薄尾、右偏的分布特征;R2的極限分布不會(huì)隨著樣本的增加而有所改變,但是R2>0.5的頻數(shù)會(huì)隨著樣本的增加而遞增,所以樣本容量的增加不但不會(huì)弱化或者消除謬誤回歸現(xiàn)象,反而會(huì)增加出現(xiàn)謬誤回歸的可能性。
(2)出現(xiàn)謬誤回歸時(shí),DW統(tǒng)計(jì)量的極限分布不再滿足正態(tài)分布,而是呈現(xiàn)高峰、厚尾、右偏的分布特征;DW統(tǒng)計(jì)量的極限分布并未受到樣本增加的影響;當(dāng)樣本無限大時(shí),DW統(tǒng)計(jì)量依概率收斂于0。
(3)出現(xiàn)謬誤回歸時(shí),隨著樣本容量的增加α不會(huì)收斂于某一個(gè)常數(shù),也就是說α是發(fā)散的;隨著樣本的無限擴(kuò)展α是否會(huì)近似服從正態(tài)分布這一論點(diǎn)需要更高級(jí)的計(jì)算機(jī)進(jìn)行模擬論證,但是本文傾向認(rèn)同即使樣本無窮大α仍然不會(huì)近似服從正態(tài)分布這一觀點(diǎn)。t(α)的極限分布不再滿足正態(tài)分布而是呈現(xiàn)高峰、厚尾、左偏的分布特征,隨著樣本的增加,t(α)不會(huì)收斂于某個(gè)常數(shù),同樣可以認(rèn)定t(α)是發(fā)散的。
(4)出現(xiàn)謬誤回歸時(shí),在樣本為10000的模擬條件下,β的分布呈現(xiàn)高峰、厚尾、右偏的分布特征,但是樣本無窮大的情況下,其分布是否會(huì)出現(xiàn)近似正態(tài)分布的特征,這就需要更高級(jí)、運(yùn)算速度更快的計(jì)算機(jī)進(jìn)行模擬,本文傾向即使樣本無窮大,β仍然不會(huì)近似服從正態(tài)分布這一觀點(diǎn);t(β)的極限分布為一個(gè)對(duì)稱分布,同樣不再滿足正態(tài)分布,而是呈現(xiàn)高峰、厚尾、右偏的分布特征,t(β)的標(biāo)準(zhǔn)差隨著樣本容量的增加而不斷增大,所以t(β)不會(huì)收斂于某個(gè)常數(shù),也就是說t(β)是發(fā)散的。
[1]Phillips P C B.Understanding Spurious Regression in Econometrics[J].Journals of Econometrics,1986,33(3).
[2]Kim T H,Lee Y S,Newbold P.Spurious Regressions with Stationary Processes Around Linear Trends[J].Economics letters,2004,83(2).
[3]Granger C W J.Hyung W,Jeon Y.Spurious Regressions with Stationary Series[J].Escholarship,1998,(3).
[4]張曉峒,王貴鵬,聶巧平.一般序列相關(guān)下面板謬誤回歸研究—估計(jì)量的漸進(jìn)分布和小樣本性質(zhì)[J].南開經(jīng)濟(jì)研究,2006,(2).
[5]張凌翔,張曉峒.結(jié)構(gòu)突變趨勢(shì)平穩(wěn)過程與隨機(jī)趨勢(shì)過程的謬誤回歸研究[J].統(tǒng)計(jì)研究,2011,(28).
[6]樊歡歡,李嫣怡,陳勝可.EViews統(tǒng)計(jì)分析與應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2011.