劉 鋒,李 飛,喬靜然
(重慶理工大學數(shù)學與統(tǒng)計學院,重慶 400054)
可加模型是Ezekiel首先提出來的一種重要的非參數(shù)模型。Breiman和 Friedman、Bujia、Hastie和 Tibshiran、Ansley和 Kohn以及 Opsomer和 Ruppert等[1-8]諸多學者研究了向后擬合算法的收斂速度。Stone[9]估計了可加模型的最優(yōu)收斂速度。Wand[10]證明了局部多項式向后擬合算法估計量的中心極限定理。近幾年來,也有許多學者致力于可加模型的研究,比如Jiang和Li給出了可加模型非參數(shù)部分的2階段局部M-估計。綜上所述,目前對于可加模型的研究都集中在模型的估計和收斂速度方面。在對模型進行估計之前,對模型進行序列相關(guān)性檢驗是十分必要的[11]。
對于一個擬合得好的模型,一般要求模型的殘差項是一列獨立同分布的白噪聲,只有滿足此假定,方可對模型進行估計。本文正是基于這方面的考慮,引入了VT,P方法對可加模型中的序列相關(guān)問題進行檢驗,得到了零假設(shè)下VT,P檢驗統(tǒng)計量的漸近分布,并用數(shù)值模擬驗證了檢驗的功效。
考慮如下的部分線性單指標模型:
其中(X,Y)是獨立同分布的隨機變量。Xj(j=1,…,d)是X的第j個分量。X∈Rd,fj是未知函數(shù)。為了滿足模型的可識別要求,令E(fj(Xj))=0,容易看出當fj(Xj)=βjXj時,式(1)其實就是多元線性回歸模型。
本文用VT,P檢驗方法對模型(1)的序列相關(guān)性進行檢驗。首先構(gòu)造VT,P檢驗統(tǒng)計量,令
記T=n-p,根據(jù)Hu的研究得到了如下的VT,P檢驗統(tǒng)計量。但該式中含有未知函數(shù)fj(·),因而不能直接用于統(tǒng)計推斷。這時,在零假設(shè)下分別用它們的估計(·)來代替。令
對于未知函數(shù)fj(·)的估計,采用局部多項式向后擬合算法來計算,其正規(guī)方程為
Sj是依賴于Xj1,…,Xjn的n階局部多項式平滑器矩陣。當式(3)中的逆矩陣的維數(shù)比較大時,直接利用正規(guī)方程在普通的計算機上難以執(zhí)行,于是本文采用局部多項式向后擬合算法來實現(xiàn),步驟如下:
3)重復步驟2),直到收斂為止。
本研究為了得到主要結(jié)果,需要如下條件:
(A3)fj,i=1,…,d 是 p+1 階連續(xù)可導的;
(A4)概率密度函數(shù) fX1,X2,…,Xd和 fX1,fX2,…,fXd都是有界連續(xù)的,有緊支撐,并且
(A5)核函數(shù)K在它的支撐上是有界連續(xù)的,并且一階偏導數(shù)大于0;
在上述條件下,有如下定理:
定理1 在條件A1~A6及零假設(shè)下,當T→∞時,有(0,σ2Ip),其中Ip是 p×p的單位矩陣,σ2=
通過一些數(shù)值模擬來考慮VT,P檢驗的有限樣本性質(zhì)。為了簡單起見,考慮下面的模型:
其中:ε與 X1、X2相互獨立;Z1和 Z2服從U(-1,1);X1=Z1+Z2,X2=Z1- βZ2;β 為 Z1和Z2的相關(guān)系數(shù)。
假定誤差εi分別服從如下模型:
對于誤差模型1和2,樣本量分別選為50,100,200,顯著性水平選為0.05;對于誤差模型3和4,樣本量分別選為100,200,400,顯著性水平選為0.05,均做1000次模擬。模擬結(jié)果在表1~4中給出。
表1 檢驗size和功效,誤差服從AR(1)模型
表2 檢驗size和功效,誤差服從MA(1)模型
表3 檢驗size和功效,誤差服從AR(2)模型
表4 檢驗size和功效,誤差服從MA(2)模型
從表1~4中可以看出:當樣本量小時,檢驗的size有偏大的現(xiàn)象,但是隨著樣本量的增加,檢驗的size迅速收斂到給定顯著性水平;而在備擇假設(shè)下,檢驗的功效都很好。同時也可以看出,在樣本容量n相同的情況下,隨著模型誤差相依程度的不斷加大,這2種檢驗方法的功效也隨之提高,在各種情況下,都有好的檢驗功效。
在證明過程中,由于T=n-p,因此本文不區(qū)別Op(n)和Op(T)等。假定C為絕對常數(shù),在不同的地方取值不同。為了證明定理1,先給出幾個引理。
引理1 在條件A1~A6和零假設(shè)下,有
證明見文獻[10]。
其中(j1,j2,…,jn)是(1,2,…,n)的任意排列。
引理3 設(shè) εi,i=1,2,…,n 是獨立隨機變量序列,滿足 Eεi=0<∞,則有
且對于(1,2,…,n)的任何一個置換(j1,j2,…,jn),有
證明見文獻[5]。
因為
故對任意的整數(shù)k(1≤k≤p),有:
由Gramer-Wold方法,根據(jù)m步相依隨機變量中心極限定理可得
定理1得證。
[1]Ansley C F,Kohn R.Convergence of the backfitting algorithm for additive models[J].Journal of the Australian Mathematical Society,Series A,1994,57:316-329.
[2]Buja A,Hastie T J,Tibshirani R.Linear smoothers and additive models[J].The Annals of Statistics,1989,17:453-510.
[3]Ezekiel A.A method of handling curvilinear correlation for any number of variables[J].Journal of American Statistical Association,1924,19:431-453.
[4]Fan J,Hardle W,Manmen E.Direct estimation of low-dimensional conponents in additive models[J].The Annals of Statistics,1998,26:943-971.
[5]Gao J T.Asymptotic theory for partly linear models[J].Communications in Statistic-Theory and Methods,1995,24:1985-2010.
[6]Hu X M,Liu F,Wang Z Z.Testing serial correlation in semiparametric varying coefficient partial linear errors-invariables models[J].Jrl Syst Sci Complexity,2006,22:483-494.
[7]Jiang J,Li J.Two-stage local M-estimation of additive models[J].Science in China,Series A:Mathematics,2008,51:1315-1338.
[8]Opsomer J D,Ruppert D.Fitting a bivariate additive model by local polynomialregression[J].The Annals of Statistics,1997,25:186-211.
[9]Stone C J.Additive regression and other nonparametric models[J].The Annals of Statistics,1985,13,689-705.
[10]Wand M P.A central limit theorem for local polynomial backfitting estimators[J].Journal of Multivariate Analysis,2000,70:57-65.
[11]劉鋒,陳敏,鄒捷中.部分線性模型序列相關(guān)的經(jīng)驗似然比檢驗[J].應用數(shù)學學報,2006,29:577-586.