鄒靈,吳東晟,楊宜平
(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,經(jīng)濟(jì)社會(huì)應(yīng)用統(tǒng)計(jì)重慶市重點(diǎn)實(shí)驗(yàn)室,重慶400067)
面板數(shù)據(jù)模型越來(lái)越廣泛應(yīng)用于經(jīng)濟(jì)、環(huán)境、生物等領(lǐng)域,是近20年計(jì)量經(jīng)濟(jì)學(xué)模型的重要模型之一.關(guān)于模型的參數(shù)估計(jì),大多數(shù)采用最小二乘法對(duì)興趣參數(shù)進(jìn)行估計(jì).當(dāng)數(shù)據(jù)出現(xiàn)尖峰、厚尾、異方差、異常點(diǎn)等情況時(shí),最小二乘法不再適用.為了解決該問(wèn)題,Koenker和Bassett[1]首次提出分位數(shù)回歸的方法,分位數(shù)回歸以其穩(wěn)健的性質(zhì)已經(jīng)在醫(yī)學(xué)和經(jīng)濟(jì)領(lǐng)域得到廣泛的應(yīng)用.目前已有一些學(xué)者對(duì)面板數(shù)據(jù)分位數(shù)回歸進(jìn)行相關(guān)研究.Koenker[2]通過(guò)正則化的方法將分位數(shù)回歸用于面板數(shù)據(jù)當(dāng)中;羅幼喜和田茂再[3]討論了固定效應(yīng)的面板數(shù)據(jù)模型的三種分位數(shù)回歸方法并使用蒙特卡洛進(jìn)行模擬;Canay[4]通過(guò)數(shù)據(jù)轉(zhuǎn)化消除固定效應(yīng),提出一種簡(jiǎn)單的面板數(shù)據(jù)分位數(shù)回歸方法;Billger和Lamarche[5]使用面板數(shù)據(jù)分位數(shù)回歸的方法對(duì)英國(guó)和美國(guó)的移民收入分配進(jìn)行研究;Galvao和Kato[6]研究了面板數(shù)據(jù)分位數(shù)回歸的固定效應(yīng)問(wèn)題.
從上述可以看出,面板數(shù)據(jù)分位數(shù)回歸的使用越來(lái)越廣泛,以上研究都是基于協(xié)變量是外生變量的情況下討論的面板數(shù)據(jù)分位數(shù)回歸.但在實(shí)際應(yīng)用中,很多變量都具有內(nèi)生性.如:在研究外商直接投資對(duì)環(huán)境污染的影響時(shí),外商直接投資作為解釋變量具有內(nèi)生性[7];在討論城鎮(zhèn)居民人均消費(fèi)支出和人均可支配收入時(shí),通過(guò)豪斯曼檢驗(yàn)證實(shí)了城鎮(zhèn)居民人均可支配收入是具有內(nèi)生性的[8].然而當(dāng)前關(guān)于含內(nèi)生變量的面板數(shù)據(jù)的分位數(shù)回歸的研究卻很少.因此促使本文討論面板數(shù)據(jù)分位數(shù)回歸模型的工具變量估計(jì).
本文討論含有內(nèi)生變量的面板數(shù)據(jù)模型,為了解決協(xié)變量的內(nèi)生性問(wèn)題,引入工具變量消除協(xié)變量的內(nèi)生性,再通過(guò)組內(nèi)中心化消除面板數(shù)據(jù)個(gè)體效應(yīng)項(xiàng),采用分位數(shù)回歸的方法估計(jì)回歸系數(shù),并證明其漸近性質(zhì).最后對(duì)Naive最小二乘估計(jì)、Naive分位數(shù)回歸、兩階段最小二乘估計(jì)和分位數(shù)回歸的工具變量估計(jì)進(jìn)行模擬研究,比較四種方法在不同分布下的估計(jì)效果.
討論如下面板數(shù)據(jù)模型
其中Yit是響應(yīng)變量,Xit是p維內(nèi)生協(xié)變量,Zit是q維外生協(xié)變量,(θ,β)是未知參數(shù),αi是不可測(cè)量的個(gè)體固定效應(yīng),εit表示隨機(jī)誤差項(xiàng).為了模型可識(shí)別,假定
由于解釋變量Xit具有內(nèi)生性,已有估計(jì)不再適用.為了消除內(nèi)生變量對(duì)參數(shù)θ估計(jì)的影響,假定存在一個(gè)工具變量ωit,且滿(mǎn)足
其中Γ是p × k的未知參數(shù)矩陣,ωit是k ×1的工具變量,且與隨機(jī)誤差項(xiàng)εit不相關(guān),并滿(mǎn)足E(eit|ωit)=0.
下面討論(θ,β)的分位數(shù)回歸估計(jì).首先,由(2.2)可以得到Γ的估計(jì),即
其中Xi=(Xi1,Xi2,...,XiT),ωi=(ωi1,ωi2,...,ωiT),則=那么模型(2.1)轉(zhuǎn)化為:
由于αi未知,通過(guò)組內(nèi)變化消除αi的影響,即
其中ρτ(s)=τs?sI(s<0).
下面討論(θ,β)的估計(jì)的漸近性質(zhì),需如下正則條件:
(C1)?是正定矩陣,其中
定理3.1如果(C1)和(C2)成立,則有
其中ψ(τ)=E(η+f(0)eTθ)2,η=(I(0)?τ).
其中由Knight[9]中等式(2-13),我們有
首先,考慮BN,
其中ηit=(I(≤0)?τ).則有
本節(jié)通過(guò)模擬研究所提出方法的有限樣本性質(zhì).考慮如下含有內(nèi)生變量的面板數(shù)據(jù)模型:
該模型中θ=1.5,β=2,Γ=1,其中Xit是內(nèi)生性變量,Zit是外生性變量,Zit~N(0,1),ωit~N(0,1),eit~N(0,0.42),εit=eit+δit.分別討論服從以下分布,具體如下:δit~0.5N(0,1),δit~0.2t(1),δit~0.2C(0,1).我們計(jì)算了偏差(Bias)和標(biāo)準(zhǔn)差(SD),分別取樣本量為50、100和150.模擬研究比較了四種方法:Naive 最小二乘估計(jì)(NLS)、Naive分位數(shù)回歸估計(jì)(NQR)、兩階段最小二乘估計(jì)(2SLS)和分位數(shù)回歸的工具變量估計(jì)(IVQR)的估計(jì)效果,其中分位數(shù)回歸給出的是分位點(diǎn)為0.5的估計(jì).重復(fù)試驗(yàn)次數(shù)1000次.模擬研究結(jié)果如表4.1所示.
根據(jù)表4.1可以看出,無(wú)論模型誤差分布是何種情形,對(duì)θ的估計(jì),NLS和NQR0.5是有偏的.由于Naive估計(jì)忽略了內(nèi)生變量的影響,直接用內(nèi)生變量估計(jì),所得的估計(jì)是有偏.對(duì)模型誤差是正態(tài)分布時(shí),2SLS和IVQR0.5兩者差別并不大,但是,當(dāng)模型誤差分布為非正態(tài)分布時(shí),2SLS方法的Bias和SD都很大,效果不好,而本文提出的IVQR0.5仍表現(xiàn)出良好的效果.隨著樣本量的增加,本文提出的IVQR0.5偏差和標(biāo)準(zhǔn)差變小.因此,本文提出的估計(jì)方法消除了內(nèi)生變量對(duì)估計(jì)造成的偏差,同時(shí),估計(jì)不受模型誤差分布的影響.
為了驗(yàn)證本文提出的分位數(shù)回歸的工具變量估計(jì)的漸近正態(tài)性,圖4.1和圖4.2分別給出了樣本量N=100,不同誤差分布情形下參數(shù)θ和β的Q-Q圖.
表4.1 四種估計(jì)方法下參數(shù)估計(jì)的偏差與標(biāo)準(zhǔn)差
圖4.1 參數(shù)θ的Q-Q圖
從圖4.1,圖4.2可以看出,圖上的點(diǎn)近似地在一條直線上.因此,所提出的IVQR估計(jì)具有漸近正態(tài)性.
圖4.2 參數(shù)β的Q-Q圖