羅登菊 戴家佳 羅興甸
摘 要:在縱向數(shù)據(jù)處理中,隨機(jī)效應(yīng)模型是使用頻率非常高的模型之一。本文主要采用復(fù)合分位數(shù)回歸估計(jì)的方法,在對其參數(shù)進(jìn)行估計(jì)的同時,證明了此估計(jì)漸近正態(tài)性。經(jīng)模擬研究,比對了中位數(shù)回歸估計(jì)、傳統(tǒng)最小二乘估計(jì)和復(fù)合分位數(shù)回歸估計(jì)三種估計(jì)的精度,模擬結(jié)果顯示,在樣本有限的情況下,本文所提出的方法對隨機(jī)效應(yīng)模型的參數(shù)估計(jì)是有效的,尤其當(dāng)模型誤差項(xiàng)不遵循高斯分布時,復(fù)合分位數(shù)回歸估計(jì)的實(shí)用性是明顯的。
關(guān)鍵詞:隨機(jī)效應(yīng)模型; 復(fù)合分位數(shù)回歸估計(jì); 最小二乘估計(jì); 分位數(shù)回歸估計(jì)
中圖分類號:U491
文獻(xiàn)標(biāo)識碼: A
隨機(jī)效應(yīng)模型的一般形式為:
yit=xTitβ+αi+εit(1)
其中xit=(xit,1,xit,2,…,xit,p)T為p維協(xié)變量,β=(β1,β2,…,βp)為回歸系數(shù)向量,yit為響應(yīng)變量,αi稱為隨機(jī)效應(yīng),是用來刻畫一些不可觀測的因素引起的個體間差異,εit是隨機(jī)誤差。在隨機(jī)效應(yīng)模型中,一般假設(shè)E(αi)=0,Var(αi)=σ2α相互獨(dú)立的同時,與εit相互獨(dú)立;E(εit)=0,Var(εit)=σ2ε,且相互獨(dú)立。
模型(1)的主要優(yōu)點(diǎn)在于,在一定條件下提供了對個體進(jìn)行統(tǒng)計(jì)推斷的可能性。為了解決此模型估計(jì)的參數(shù)估計(jì)問題,大部分的文獻(xiàn)通過普通最小二乘和加權(quán)最小二乘等方式來解決此問題,舉例說,最小二乘估計(jì)計(jì)算簡單,其得到的結(jié)果擁有令人滿意的表達(dá)式,尤其是在誤差項(xiàng)遵循常態(tài)分布的前提下,最小二乘估計(jì)是有效的,而且是一致最小方差無偏估計(jì)。但是實(shí)際數(shù)據(jù)往往不滿足方差相等、獨(dú)立并服從正態(tài)分布等嚴(yán)苛條件。隨著互聯(lián)網(wǎng)的高速發(fā)展以及各種行業(yè)之間相互影響,我們所面臨的數(shù)據(jù)維度不僅大還結(jié)構(gòu)復(fù)雜,通過最小二乘估計(jì)無法滿足現(xiàn)階段所需理想的統(tǒng)計(jì)結(jié)果。
于是,加拿大學(xué)者KOENKER提出了一種回歸估計(jì),就是分位數(shù)回歸估計(jì),目的是為了擺脫最小二乘估計(jì)的局限性,更廣泛的將中位數(shù)回歸應(yīng)用于所有的分位數(shù)中。使用條件分位數(shù)來進(jìn)行建模,使最小二乘估計(jì)最小化平方誤差的思想變?yōu)樽钚』訖?quán)的絕對誤差,該方法可以刻畫解釋變量隨響應(yīng)變量變動的大體特征,呈現(xiàn)響應(yīng)變量在不同分位點(diǎn)下的條件分布函數(shù)。分位數(shù)回歸有眾多優(yōu)勢,它既不需要誤差項(xiàng)服從正態(tài)分布,也對異常值不敏感,甚至可以擬合響應(yīng)變量任何分位點(diǎn)的回歸方程,因此具有很好的穩(wěn)健性,在各個模型的估計(jì)中被廣泛運(yùn)用,例如,WU[1]在研究單指標(biāo)模型的估計(jì)問題時,使用了分位數(shù)回歸估計(jì);YANG[2]應(yīng)用分位數(shù)回歸研究了變系數(shù)單指標(biāo)模型的參數(shù)估計(jì)和變量選擇問題;KONEKER[3]更是史無前例的將分位數(shù)回歸方法應(yīng)用到縱向數(shù)據(jù)中,并指出對于固定效應(yīng)模型,在進(jìn)行分位數(shù)回歸時,將L1懲罰項(xiàng)加入到目標(biāo)函數(shù)中,并在估計(jì)未知參數(shù)時使用懲罰函數(shù)法;WANG[4]在探究面板數(shù)據(jù)中固定效應(yīng)模型的經(jīng)驗(yàn)似然估計(jì)值的過程中,分位數(shù)得分函數(shù)被平滑經(jīng)驗(yàn)似然估計(jì)過程所替代,從而得到經(jīng)驗(yàn)對數(shù)似然率和極大經(jīng)驗(yàn)似然函數(shù)。CANAY[5]在去除面板數(shù)據(jù)模型中的固定效應(yīng)時,采用了一種簡潔的數(shù)據(jù)轉(zhuǎn)換,之后利用分位數(shù)回歸預(yù)估模型中的參數(shù),同時還驗(yàn)證了該估計(jì)量的一致性和漸進(jìn)正態(tài)性;KATO[6]以與非線性面板數(shù)據(jù)的研究相似為前提,研究面板數(shù)據(jù)下固定效應(yīng)分位數(shù)回歸模型估計(jì)的一致性和漸進(jìn)正態(tài)性條件,得出一個結(jié)論,即參數(shù)估計(jì)量的一致性;何曉霞等[7]利用分位數(shù)回歸研究了縱向數(shù)據(jù)下回歸模型的參數(shù)估計(jì)和變量選擇問題。根據(jù)以上文獻(xiàn)得知,即便分位數(shù)回歸可以融合多條曲線,但在實(shí)際問題中卻存在部分分位點(diǎn)偏離過大的問題,因此,ZOU和YUAN[8]通過綜合考慮將多個分位點(diǎn),第一次提出了復(fù)合分位數(shù)回歸估計(jì),得到了回歸系數(shù)β一個精度更高的估計(jì)。王琪鋒[9]將復(fù)合分位數(shù)回歸應(yīng)用到線性時間序列數(shù)據(jù)中;王江峰[10]在左截?cái)鄶?shù)據(jù)下研究了非參數(shù)模型的復(fù)合分位數(shù)回歸估計(jì);呂亞召[11]利用復(fù)合分位數(shù)回歸研究了部分線性單指標(biāo)模型的變量選擇問題;JIANG[12]將復(fù)合分位數(shù)回歸應(yīng)用到DTARCH模型中;JIANG[13]將復(fù)合分位數(shù)回歸應(yīng)用到具有重尾自相關(guān)誤差的線性模型中;CHEN[14]利用復(fù)合分位數(shù)回歸估計(jì)半?yún)?shù)模型中的未知函數(shù)與參數(shù);JIANG[15]將加權(quán)復(fù)合分位數(shù)回歸估計(jì)引入到部分線性變系數(shù)模型中;徐潔和楊宜平[16]首次將復(fù)合分位回歸應(yīng)用到縱向數(shù)據(jù)中,研究了固定效應(yīng)模型的復(fù)合分位數(shù)回歸估計(jì),在一定正則條件的前提下,證明了該估計(jì)的大樣本漸近正態(tài)性質(zhì)。
本文基于復(fù)合分位數(shù)回歸方法研究了縱向數(shù)據(jù)下隨機(jī)效應(yīng)模型的參數(shù)估計(jì),首先,給出該估計(jì)的定義與在該模型下的目標(biāo)函數(shù);再次,證明了在隨機(jī)效應(yīng)模型下的復(fù)合分位數(shù)回歸估計(jì)的大樣本漸近正態(tài)性質(zhì);最后,通過模擬研究了該估計(jì)量的有限樣本性質(zhì),同時,與最小二乘估計(jì)、中位數(shù)估計(jì)結(jié)果的精度做比較。
4 結(jié)論
本文通過引入了復(fù)合分位數(shù)回歸方法來估計(jì)隨機(jī)效應(yīng)模型的未知參數(shù),得出的結(jié)論如下:
(1)在隨機(jī)效應(yīng)模型中,利用復(fù)合分位數(shù)回歸估計(jì)來估計(jì)未知參數(shù),滿足大樣本性質(zhì)。
(2)在樣本量相同的情況下,復(fù)合分位數(shù)回歸比中位數(shù)回歸和均值回歸的精度高,效果優(yōu)。隨著樣本量的增加,所有估計(jì)的精度均增加,但是復(fù)合分位數(shù)回歸效果最好。隨著復(fù)合分位點(diǎn)的增加,復(fù)合分位數(shù)回歸的精度也隨著增加。
參考文獻(xiàn):
[1]WU ?T ?Z, YU ?K, YU ?Y. Single-index quantile regression. Journal of Multivariate Analysis, 2010, 101(3): 1607-1621.
[2]YANG J, YANG H. Quantile regression and variable selection for single-index varying-coefficient models[J]. Communications in Statistics-Theory and Methods, 2016, 3(8): 1532-1543.
[3]KOENKER R. Quantile Regression for Longitudinal Data[J]. Journal of Multivariate Analysis.2004,91(2):74-89.
[4]WANG H X, ZHU Z Y. Empirical likelihood for quantile regression models with longitudinal data[J]. Journal of Statistical Planning and Inference, 2011, 141(4):1603-1615.
[5]CANAY A. A simple approach to quantile regression for panel data[J].The Econometrics Journal, 2011,14(3):368-386.
[6]KATO K, GALVAO A F, MONTES-ROJAS G V. Asymptotics for panel quantile regression models with individual effects[J]. Journal of Econometrics, 2012,170(1):76-91.
[7]何曉霞, 徐偉, 李緩, 等. 面板數(shù)據(jù)分位數(shù)回歸模型的參數(shù)估計(jì)與變量選擇[J]. 數(shù)學(xué)雜志, 2017,37(5):1101-1110.
[8]ZOU H, YUAN M. Composite quantile regression and the oracle model selection theory[J]. The annals of statistics, 2008,36(3):1108-1126.
[9]王琪鋒. 復(fù)合分位數(shù)回歸在線性時間序列下的應(yīng)用[D]. 大連:大連理工大學(xué),2015.
[10]王江峰, 田曉敏, 張慧增, 等. 左截?cái)鄶?shù)據(jù)下非參數(shù)回歸模型的復(fù)合分位數(shù)回歸估計(jì)[J]. 高校應(yīng)用數(shù)學(xué)學(xué)報(bào)A輯, 2015, 30(1):71-83.
[11]呂亞召, 張日權(quán), 趙為華, 等. 部分線性單指標(biāo)模型的復(fù)合分位數(shù)回歸及變量選擇[J]. 中國科學(xué):數(shù)學(xué), 2014,28(12):1299-1322.
[12]JIANG J, JIANG X, SONG X. Weighted composite quantile regression estimation of DTARCH models[J]. Econometrics Journal, 2014, 17(1):1-23.
[13]JIANG Y, LI H . Penalized weighted composite quantile regression in the linear regression model with heavy-tailed autocorrelated errors[J]. Journal of the Korean Statistical Society, 2014, 43(4):531-543.
[14]CHEN Y, TANG M L, TIAN M. Semiparametric hierarchical composite quantile regression[J]. Communications in Statistics, 2015, 44(5):996-1012.
[15]JIANG R, QIAN W M, ZHOU Z R. Weighted composite quantile regression for partially linear varying coefficient models[J]. Communications in Statistics-Simulation and Computation, 2017, 3(5): 1532-1543.
[16]徐潔, 楊宜平. 面板數(shù)據(jù)復(fù)合分位數(shù)回歸模型的估計(jì)[J]. 統(tǒng)計(jì)與決策, 2018,34(5):19-21.
[17]Knight, Keith. Limiting distributions for L1 regression estimators under general conditions[J]. The Annals of Statistics, 1998, 26(2):755-770.
(責(zé)任編輯:于慧梅)