徐 燕,陳平雁
(南方醫(yī)科大學(xué) 公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系,廣州 510515)
時(shí)間序列分析在生物、醫(yī)學(xué)、氣象、天文、地質(zhì)、經(jīng)濟(jì)等領(lǐng)域廣泛應(yīng)用,尤其是在經(jīng)濟(jì)金融領(lǐng)域,如匯率、股票價(jià)格、收益率等。由于各時(shí)刻的條件均值和方差難以滿足常數(shù)的假設(shè),Engle(1982)提出自回歸條件異方差模型,條件均值和方差分別依賴于t時(shí)刻之前的觀察值和誤差平方,并表示為過(guò)去值的函數(shù),這意味著其條件方差非常數(shù),從而滿足了要求。
Hagan和Leonhard(1976)在正態(tài)分布中引入刻畫(huà)偏度的形態(tài)參數(shù)而得到新的分布稱為Skew Normal Distribution,簡(jiǎn)稱SN分布,處理偏態(tài)數(shù)據(jù)效果良好[1]。
本文首先介紹SN分布概念,然后給出SN-ARCH(q)模型及參數(shù)中位數(shù)無(wú)偏估計(jì),最后報(bào)道實(shí)驗(yàn)結(jié)果。
近年來(lái)基于某些對(duì)稱分布的偏斜分布族被大量研究,如正態(tài)分布、t分布、Cauchy分布等[1,2,3]。這類問(wèn)題的關(guān)鍵在于引入偏斜參數(shù)后得到參數(shù)方程的分布形式及參數(shù)估計(jì)。
引理1[1]令f0是一維零對(duì)稱概率密度函數(shù),G是一維分布函數(shù),G'存在并且是一個(gè)零對(duì)稱密度函數(shù),則對(duì)任一奇函數(shù)w(˙),有
是一個(gè)概率密度函數(shù)。
由此引理,對(duì)任意零對(duì)稱密度函數(shù)f0,可以通過(guò)擾動(dòng)函數(shù)得到一個(gè)新的密度函數(shù) f,并且 f0是 f的特殊情況,即取w(x)≡0時(shí)。
Azzzlini(1985)取w(y)=αy,α是常數(shù),即得到單變量SN分布。
定義1[1]令Y是一個(gè)連續(xù)隨機(jī)變量,?和Φ是N(0,1)密度函數(shù)和分布函數(shù)。若Y的密度函數(shù)滿足:
則稱Y服從帶參數(shù)a,a∈?,的SN分布,記為y~SN(a)。
稱a,a∈?,為形狀參數(shù),其決定了概率密度函數(shù)的形狀,a>0時(shí)Y正偏,a<0時(shí)Y負(fù)偏, ||a增加偏度隨之增加。當(dāng)a=0時(shí),即N(0,1)。文獻(xiàn)[1]有SN分布與正態(tài)分布的關(guān)系的研究。
一般的,令Z~SN(a),且Y=ξ+ωZ,其中ξ∈?,ω>0,則Y的概率密度函數(shù)是:
Pewsey(2000,2006)給出SN分布重新參數(shù)化后的矩估計(jì),Arellano等(2008)給出重新參數(shù)化和原始參數(shù)兩種形式下的Fisher信息矩陣。下面綜述文獻(xiàn)[3,4]給出SN分布參數(shù)矩估計(jì)。
設(shè)Y~SN(ξ,ω2,a),則
重新參數(shù)化后記為(μ ,σ2,γ1),由(4)得
其中γ1表示偏度系數(shù)。
解方程(5)(6)(7),得
將(11)帶入(8)(9)(10),即得參數(shù)(ξ,ω2,a)的矩估計(jì)
定義2(ARCH(q)模型)[5]設(shè)是零均值序列無(wú)關(guān)過(guò)程,如果
Engel(1982)給出ARCH模型參數(shù)極大似然估計(jì)的Newton-Raphson算法,此算法缺點(diǎn)在于不能保證每一步輸出值非負(fù)性;Weiss(1984,)和Ling(2000)分別在四階矩和二階矩條件下給出ARCH模型參數(shù)極大似然估計(jì)的漸進(jìn)性質(zhì);Lee等(1993)采用得分函數(shù)得到模型檢驗(yàn);Hong(1996)用譜方法給出ARCH模型的單邊檢驗(yàn)。Shi等(2003)給出一定條件下的ARCH(0,1)中位數(shù)無(wú)偏估計(jì)[6]。下面構(gòu)造SN-ARCH(q)的中位數(shù)無(wú)偏估計(jì)。
簡(jiǎn)單的,考慮SN-ARCH(1),即
其中V是與Y1,…,Yn獨(dú)立的隨機(jī)變量,且滿足P(V=0)=P(V=1)=Y(1),…,Y(n)即Y1,…,Yn的次序統(tǒng)計(jì)量。
基于R統(tǒng)計(jì)軟件,對(duì)S&P500收益率序列(2001.02.01至2012.02.01,N=3280,0.004±0.0220)在0.05的檢驗(yàn)水準(zhǔn)下進(jìn)行Bera-Jarque正態(tài)性檢驗(yàn),拒絕正態(tài)分布假設(shè)(B-J=1011.000,P<0.001),偏度(Skewness=-0.2320)顯著小于 0。自相關(guān)函數(shù)以偏離零均值的形式震蕩,以正弦曲線形式緩慢衰減。ARCH-Mcleod-Li殘差檢驗(yàn),當(dāng)殘差平方自相關(guān)系數(shù)的滯后階數(shù)從1到27時(shí)檢驗(yàn)全部顯著(P均小于0.01),存在條件異方差性。建立SN-ARCH模型,模型參數(shù)估計(jì)如表1所示。
表1 S&P500收益率序列擬合模型參數(shù)估計(jì)
對(duì)上述模型殘差進(jìn)行McLeod-Li檢驗(yàn),殘差及殘差平方序列在多項(xiàng)滯后時(shí)的統(tǒng)計(jì)結(jié)果接受原假設(shè),說(shuō)明SN-ARCH(1)模型能夠很好的消除原序列的異方差性。
對(duì)模型分布進(jìn)行Pearson擬合優(yōu)度檢驗(yàn)[7],比較理論分布與實(shí)際分布的接近程度。在0.05的檢驗(yàn)水平下不拒絕原假設(shè)(χ2=31.675,P=0.891),即模型選擇合理。
本文從實(shí)際序列不服從正態(tài)分布的前提假設(shè)入手,在ARCH模型中引入SN分布,建立SN-ARCH(q)模型,給出參數(shù)中位數(shù)無(wú)偏估計(jì),實(shí)驗(yàn)結(jié)果通過(guò)Pearson擬合優(yōu)度檢驗(yàn),證明模型選擇合理。
SN分布的參數(shù)估計(jì)是比較麻煩的問(wèn)題,它多了一個(gè)參數(shù)且密度函數(shù)不對(duì)稱,因此對(duì)于傳統(tǒng)的取對(duì)數(shù)變換,然后對(duì)參數(shù)求偏導(dǎo)數(shù),從而得到極大似然估計(jì)的方法效果不佳。對(duì)于ARCH模型破壞了方差不變的前提假設(shè),故采用了非參數(shù)的中位數(shù)估計(jì),與傳統(tǒng)的Yule-Walker估計(jì)和條件最小二乘估計(jì)相比更準(zhǔn)確有效。
[1]Azzalini A.A Class of Distribution which Includes the Normal Ones[J].Scand.J.Statist.,1985,12(2).
[2]Shaun A.Bond.A Review of Asymmetric Conditional Density Functions in Autoregressive Conditional Heteroskedasticity Models[Z].2002.
[3]Pewsey A.Modelling Asymmetrically Distributed Circular Data Using the Wrapped Skew Normal Distribution[J].Environ.Ecol.Stat.,2006,(13).
[4]Pewsey A.Problems of Inference for Azzalini,s Skew-normal Distribution[J].J.Appl.Stat.,2000,(27).
[5]Jonathan D.Cryer,Kung-Sik Chan.Time Series Analysis with Applications in R[M].New York:Springer Science Business Media,2008.
[6]Shi N.Z.Wang D.H.Median Unbiased and Maximum Likelihood Estimations of ARCH(0,1)Coefficient[Z].Statistics Simulation and Computation,2003.
[7]Palm F.C.,Vlaar P.J.G.Simple Diagnostics Procedures for Modelling Financial Time Series[J].Allgemeines Statistisches Archiv,1997,(81).