○姜欣
(沈陽工程學(xué)院 遼寧 沈陽 110136)
從1994年我國中央財政停止向銀行透支以來,財政赤字主要依靠發(fā)行國債來彌補(bǔ),國債發(fā)行額迅速增加。1998年以來,我國施行積極的財政政策,中央財政的赤字額不斷擴(kuò)大,同時促進(jìn)了國債發(fā)行額的迅速膨脹,國債發(fā)行額的不斷擴(kuò)大,必然導(dǎo)致還本付息的壓力不斷增加,反過來推動財政赤字的急劇攀升。隨著財政赤字和國債的不斷增加,我國財政的赤字依存度和國債依存度也在不斷地增加著。赤字依存度是指財政赤字占財政支出的比重。國債依存度是指當(dāng)年國債發(fā)行額占當(dāng)年財政支出的比重。國際上公認(rèn)的國債依存度警戒線是20%。
本文就國債依存度超過國際警戒線的概率進(jìn)行分析,找到logistic曲線的拐點(diǎn),即當(dāng)赤字依存度超過多少時,國債依存度超過警戒線的概率會大幅增加。
本文所要估計的是國債依存度超過國際警戒線的概率,這是一個二分類因變量的分析問題,雖然線性回歸模型在定量分析的實(shí)際研究中是最流行的統(tǒng)計分析方法,但是線性概率模型(LMP)的OLS估計和預(yù)測中存在許多問題,因此對于二分類因變量的分析應(yīng)使用非線性回歸分析,在非線性回歸分析中Logist回歸模型是最流行的模型。
本文的logist模型的推導(dǎo)方法是借鑒王濟(jì)川和郭志剛合著的《Logistic回歸模型——方法與應(yīng)用》一書中的Logistic模型的推導(dǎo)方法,因?yàn)閘ogist模型用的是logistic曲線,因此logist模型和logistic模型具有相同的形式,故而有些人稱這個模型是logist,也有人稱其為logistic。
假設(shè)連續(xù)反應(yīng)變量yi代表事件發(fā)生的可能性,當(dāng)yt的值跨越一個臨界點(diǎn)(比如c=0),便導(dǎo)致事件發(fā)生。于是有:
當(dāng)yt>0時,yi=1
其他情況下,yi=0
這里yt是實(shí)際觀察到的反應(yīng)變量,yi=1表示事件發(fā)生,yi=0表示事件未發(fā)生。
假設(shè)反應(yīng)變量yt和自變量xt之間存在一種線性關(guān)系,即:
由式(1)得到:
假設(shè)ui服從Logistic分布,為了得到一個累積分布函數(shù)(CDF),一個變量的概率需小于特定值。因?yàn)長ogistic分布是對稱的,所以式(2)可以改寫為:
假設(shè)ui的方差為π2/3≈3.29,所以得到Logistic函數(shù):
由式(4)可得Logist回歸模型:
假設(shè)Pi是第i個案例發(fā)生事件的概率,1-Pi則是不發(fā)生事件的概率:
圖1 國債依存度的散點(diǎn)圖
圖2 赤字依存度的散點(diǎn)圖
圖3 國債依存度與赤字依存度之間的關(guān)系
那么,Logist回歸模型就可以轉(zhuǎn)換為:
式(7)就是我們所要回歸的模型,在對Logistic函數(shù)做了對數(shù)變換的好處就在于式(7)具有很多線性模型的性質(zhì)。
(1)數(shù)據(jù)的來源及處理。本文中1981—2009年的財政收入和財政支出摘自《中國衛(wèi)生統(tǒng)計年鑒2010》,1981—2005年的國債發(fā)行額摘自《中國財政年鑒2007》,2005—2009年的國債發(fā)行額摘自《中國統(tǒng)計摘要2010》。
在Logist回歸模型中,要求自變量和因變量之間存在非線性函數(shù)關(guān)系。圖1是國債依存度的散點(diǎn)圖,圖2是赤字依存度的散點(diǎn)圖,兩個圖的橫坐標(biāo)都是年份,圖3是國債依存度與赤字依存度的關(guān)系圖,橫坐標(biāo)是赤字依存度,縱坐標(biāo)是國債依存度,從圖1和圖2可以看出國債依存度與赤字依存度存在著相關(guān)關(guān)系,從圖3可以看出國債依存度與赤字依存度存在著非線性的函數(shù)關(guān)系,這正好符合了Logist回歸模型的假設(shè),所以可以用Logist模型對國債依存度與赤字依存度的關(guān)系進(jìn)行回歸。
由于Logist回歸模型估計中要求因變量必須是二分量,這個變量只能取0或1,并且該模型沒有對自變量的分布做任何要求,即自變量可以是連續(xù)變量,也可以是離散變量,還可以是虛擬變量。因?yàn)楸疚囊芯繃鴤来娑瘸^警戒線的概率,國際上通用的國債依存度的警戒線是20%,所以本文中的因變量國債依存度超過20%的為1,其他情況為0。
(2)模型的建立。由于模型中因變量考察的是國債依存度超過國際警戒線的概率,所以因變量的二分類變量在國債依存度大于20%時取值為1,在小于20%的情況下取值為0即:
當(dāng)DEBTi≥20%時,y=1
當(dāng)DEBTi≤20%時,y=0
其中,DEBi表示國債依存度的值,單位是百分比。
根據(jù)式(7)可以得到Logist回歸模型:
其中,自變量DEFIi表示赤字依存度,Pi表示國債依存度超過國際警戒線的概率。
(3)模型估計。本文所采用的Logist回歸是非線性回歸模型,因?yàn)樽畲笏迫还烙嫹瓤捎糜诰€性模型估計,也可用于非線性模型的估計,故本文所采用的模型估計方法是最大似然估計法。
根據(jù)式(8)和相關(guān)數(shù)據(jù),利用SPSS 17.0進(jìn)行模型回歸估計,得到的結(jié)果如下。
首先給出的是模型不含任何自變量,而只有常數(shù)項(xiàng)(即無效模型)時的輸出結(jié)果。此時的模型為:
表1 方程中的變量
表1輸出的是僅含有常數(shù)項(xiàng)的模型的輸出結(jié)果,輸出結(jié)果中B為模型中未引入自變量時的常數(shù)項(xiàng)的估計值,S.E.為標(biāo)準(zhǔn)誤,Wald是對總體回歸系數(shù)是否為0進(jìn)行的統(tǒng)計檢驗(yàn)。df表示自由度,Sig為相應(yīng)的p值,Exp(B)為e的β0次方,其實(shí)際意義是國債依存度中超過國際警戒線的概率與未超過國際警戒線的概率的比值。根據(jù)表1中僅含有常數(shù)項(xiàng)模型的計算結(jié)果,可預(yù)測國債依存度超過國際警戒線的概率是48.3%。
表2 分類表a,b
表2輸出的是模型中僅含常數(shù)項(xiàng)時計算的預(yù)測分類結(jié)果,從表2中可以看出,SPSS預(yù)測國債依存度低于國際警戒線的概率是51.7%,所以國債依存度高于國際警戒線的概率是48.3%,和模型計算的結(jié)果一樣。因此當(dāng)模型中不包含自變量時,國債依存度的所有觀測值都被預(yù)測為超過國際警戒線,總的預(yù)測準(zhǔn)確率為48.3%。
表3 不在方程中的變量
表3輸出了未引入模型中的變量的得分檢驗(yàn),其意義為向當(dāng)前不含自變量的模型中引入自變量赤字依存度時,該變量回歸系數(shù)是否等于0的得分檢驗(yàn)。從Sig值的大小可以看出,要拒絕回歸系數(shù)為0的原假設(shè),即加入自變量赤字依存度后,其回歸系數(shù)不為0。
表4 分類表a
基于僅含有常數(shù)項(xiàng)的無效模型,現(xiàn)在開始引入自變量赤字依存度。表4是在引入了自變量赤字依存度后重新擬合的回歸模型進(jìn)行預(yù)測的分類表格,從中可以看出表4與表2的不同,在這里既有對國債依存度超過國際警戒線的預(yù)測,也有對國債依存度低于國際警戒線的預(yù)測,預(yù)測的總準(zhǔn)確率是79.3%,顯著高于僅含有常數(shù)項(xiàng)時預(yù)測的準(zhǔn)確率。
表5 方程中的變量
表5輸出了模型中個自變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)誤、Wald、自由度、p值及Exp(B)的值??山ogist回歸方程如下:
(4)模型的檢驗(yàn)。為了能對Logist回歸模型進(jìn)行有意義的解釋,就要求模型中所包含的自變量必須對因變量有顯著的解釋能力,即含有自變量的模型必須要比僅含常數(shù)項(xiàng)的模型要好,因此在對模型進(jìn)行檢驗(yàn)的時候就只檢驗(yàn)含有自變量的模型即可,否則就沒有意義了。
第一,Wald 檢驗(yàn)。Wald 檢驗(yàn)是通過比較回歸系數(shù)值進(jìn)行的,它是基于回歸系數(shù)值服從正態(tài)分布的假設(shè),首先求出系數(shù)值的標(biāo)準(zhǔn)誤,然后基于正態(tài)分布原理求出P值。從表5 的回歸結(jié)果中可以看出,赤字依存度的P值是0.017,常數(shù)項(xiàng)的P值是0.028,這兩個參數(shù)的P值都是小概率事件,所以拒絕系數(shù)為0的原假設(shè)。
第二,似然比檢驗(yàn)(Likelihood Ratio Test)。本文中的Logit模型的估計采用的是最大似然法,可以用似然比進(jìn)行檢驗(yàn)。似然比檢驗(yàn)的基本原理是使模型的似然函數(shù)L 達(dá)到最大值。在回歸結(jié)果中-2 對數(shù)似然值(-2lnL)被稱為偏差(Deviance)記為D,模型預(yù)測效果越好,則L 越大,D值也越大。從表6可以看出D值很大,這就表示模型的預(yù)測效果很好。
表6 模型匯總
第三,比分檢驗(yàn)(Score Test)。比分檢驗(yàn)是以未包含一個(或幾個)參數(shù)的模型為基礎(chǔ),保留模型中參數(shù)的估計值,并假設(shè)新增加的參數(shù)為0,計算似然函數(shù)的一階偏導(dǎo)數(shù)(又稱有效比分)及信息矩陣,兩者相乘即為比分檢驗(yàn)統(tǒng)計量S。該檢驗(yàn)最常用于篩選變量表3即比分檢驗(yàn)的輸出結(jié)果,可以看出,加入自變量赤字依存度是可行的。
以上三種檢驗(yàn),似然比檢驗(yàn)是基于整個模型的擬合情況進(jìn)行的,結(jié)果最為可靠,似然比檢驗(yàn)結(jié)果表明模型預(yù)測效果很好;比分檢驗(yàn)的結(jié)果是應(yīng)該在模型中加入自變量;檢驗(yàn)結(jié)果最不可靠的就是Wald檢驗(yàn),它考慮各因素的綜合作用,當(dāng)因素間存在共線性的時候,結(jié)果不可靠,但是本文只含有一個自變量,所以Wald檢驗(yàn)具有可信性。從檢驗(yàn)的結(jié)果來看,本文中的回歸模型擬合得較好,同時模型預(yù)測的預(yù)測效果也很好。
(5)回歸結(jié)果分析。在logist模型中αi并不是邊際系數(shù),即DEFI增加1%所帶來的DEB超過20%的概率增加α2%,因此在logist模型中要想知道DEFI的增加量對DEB超過20%的概率的影響就要單獨(dú)計算。
根據(jù)張曉峒老師所講授的離散選擇模型與受限因變量模型一章中內(nèi)容,可知,Logist模型中邊際系數(shù)的求解公式如下:
其中,α0=-2.079,α1=31.731
由于logist模型的圖形是S型曲線,在不同的點(diǎn)曲線的斜率即邊際系數(shù)不同,所以要想知道哪個點(diǎn)的邊際系數(shù),就要單獨(dú)求。筆者根據(jù)相關(guān)數(shù)據(jù)計算了各年份的的邊際系數(shù)。從計算結(jié)果可知,當(dāng)赤字依存度高時,它使得國債依存度超過國際預(yù)警線的概率就高,反之,則較低。
另外還有一種方法可以表示國債依存度超過國際預(yù)警線的概率與赤字依存度的關(guān)系,那就是如果我們以pi=0.5為分界線,求出此時的赤字依存度為DEFI=6.56%,這就表示當(dāng)DEFI大于6.56%時,DEB大于20%的概率就大于50%,可以看成是確定性事件,即DEB一定會大于20%。
從上面的實(shí)證分析中可以看出,我國的赤字依存度對國債依存度的影響很大,因?yàn)槟壳拔覈嘧种饕堪l(fā)行國債來彌補(bǔ),這種情況的出現(xiàn)在一定程度上是由我國當(dāng)前的國情決定的。從國際上來看我國的赤字依存度與發(fā)達(dá)國家相比還不算太高,但是國債依存度卻很高,我國的國債依存度是發(fā)達(dá)國家的3—10倍。因此,我國應(yīng)該控制國債依存度,但是控制國債依存度并不一定非得控制國債總量。要既能降低國債依存度,又能充分發(fā)揮我國國債規(guī)模的潛力。具體怎樣能夠發(fā)揮我國國債規(guī)模的潛力,又能降低國債依存度,還要進(jìn)行研究才能找到合適的方法。
[1]張瀾:我國國債規(guī)??刂萍皣H比較[J].合作經(jīng)濟(jì)與科技,2010(3).
[2]陳建奇:對《馬約》赤字率、債務(wù)率參考標(biāo)準(zhǔn)的反思[J].廣東商學(xué)院學(xué)報,2009(9).
[3]王濟(jì)川、郭志剛:Logistic回歸模型——方法與應(yīng)用[M].北京:高等教育出版社,2001.
[4]張文彤、董偉:SPSS統(tǒng)計分析高級教程[M].北京:高等教育出版社,2004.
[5]路萬忠、董逢谷、李凍菊:影響我國中央政府國債依存度因素的實(shí)證分析[J].財經(jīng)研究,2003,29(9).
[6]張裕民:關(guān)于我國財政赤字政策的幾點(diǎn)思考[J].科技信息,2010(4).
[7]林雙林:中國財政赤字和政府債務(wù)分析[J].經(jīng)濟(jì)科學(xué),2010(3).