宋文選
(浙江工商大學(xué)統(tǒng)計與數(shù)學(xué)學(xué)院,浙江杭州 310018)
加權(quán)核密度估計及其在滬深300股指收益率上的應(yīng)用
宋文選
(浙江工商大學(xué)統(tǒng)計與數(shù)學(xué)學(xué)院,浙江杭州 310018)
由于金融數(shù)據(jù)的特殊性,對于其時變概率密度的估計和相應(yīng)的累計分布函數(shù)的估計,可以通過非參數(shù)運用加權(quán)的核密度估計來捕捉每個時刻金融收益率的密度變化情況,這種方法中的重要參數(shù),如帶寬,可以通過最大似然函數(shù)和交叉檢驗進行估計.診斷檢驗可以通過向前一步預(yù)測的累計分布函數(shù)進行驗證.對于這種追蹤時變密度變化的方法,適用那些密度變化相對緩慢的數(shù)據(jù)上,并且該方法可以結(jié)合濾波進行遞推估計.本文最后將此方法運用在滬深300股指.
加權(quán)核密度估計;時變累計分布;時變分位數(shù)
金融收益率的研究主要著眼于傳統(tǒng)的參數(shù)統(tǒng)計方法,這種方法大多數(shù)是將收益率數(shù)據(jù)放在正態(tài)分布的框架下進行研究的,但是不論從相關(guān)的理論研究還是實踐的角度上看,金融數(shù)據(jù)收益率的分布并不服從正態(tài)分布的簡單假設(shè),更多的是存在明顯的尖峰厚尾的現(xiàn)象[1].像這種很難假定它服從某一固定分布的金融收益率,其更多的情況下分布是隨時間變化的.對于這樣時變的密度函數(shù)和分布函數(shù)我們可以運用非參數(shù)方法中的核密度估計.由于金融數(shù)據(jù)與時間有關(guān),且傳統(tǒng)的非參數(shù)是將每一個觀測值等權(quán)重的看待,這樣如果一味的照搬原來的理論方法將會使得非參數(shù)在刻畫金融收益率的時變密度函數(shù)和時變累計分布函數(shù)時顯的力不從心,也就是很難準(zhǔn)確的追蹤收益率的分布變化.因此借鑒于金融時間序列加權(quán)方法,結(jié)合核密度估計時變的分布的優(yōu)勢,本文試圖運用加權(quán)的核密度估計來刻畫金融收益率的變化情況.
由核密度估計理可知,對于來自特定分布F(y)的樣本量為T的觀測值,其核密度估計在點y處的密度估計值為:
其中K(·)是核函數(shù),h是帶寬,通常核函數(shù)是關(guān)于原點對稱且積分為1,主要的核函數(shù)有以下四種[2-3]:
從定義上看核密度估計的優(yōu)劣取決于核函數(shù)和帶寬的選取上,事實上帶寬的選取要遠(yuǎn)比核函數(shù)的選取重要.對于帶寬的選取有很多種方法,如Silverman提出的拇指法則,Sheather和Jones提出的Plug-in方法,以及交叉核實(cross-validation)等.本文將采用最大釋然估計的方法估計帶寬.
在選定核函數(shù)后就可以敲定密度函數(shù),竟而核密度估計下的累計分布函數(shù)也可以相應(yīng)的確定下來,具體如下:
其中H(·)作為分布核可以通過對密度核函數(shù)積分獲得.
為了更能準(zhǔn)確的刻畫每個時刻的密度函數(shù),在傳統(tǒng)核密度理論的基礎(chǔ)上進行核密度加權(quán),則(1)式變?yōu)?
相應(yīng)的累計分布函數(shù)為:
同樣在平滑估計中時變密度函數(shù)的形式如下:
時變累計分布函數(shù)為:
對于模型中的兩個重要參數(shù)帶寬和平滑因子,我們將采用最大似然估計的方法使參數(shù)達(dá)到最優(yōu)估計,濾波估計中參數(shù)的對數(shù)的似然函數(shù)為[5]:
其中wt,i(w)為公式(1)中的權(quán)重.變量m是估計前事先給定的值,該值主要依賴樣本的大小,例如在估計時可以定義m為總樣本的估計時平滑因子w必須定義在曲江(0,1]上,帶寬h必須滿足h>0,由于對數(shù)中的數(shù)必須要等于零,所以當(dāng)ft+1|t(·)需要選為非負(fù)的核密度函數(shù),如高斯核,可以在理論上保證ft+1|t(yt+1)>0,在估計時會遇到點y超出樣本范圍,這樣會使得ft+1|t(yt+1)=0,在這種情況下,可以令ft+1|t(·)等于一個很小的正數(shù)值[6].以確保對數(shù)下的密度值有意義.
對于平滑估計中的參數(shù)估計,需要最大化交叉核實準(zhǔn)則即[7]:
其中wt,T,i(w)與公式(3)中的權(quán)重相同.
整個方法的估計過程是先通過最大似然估計或交叉核實準(zhǔn)則求出最優(yōu)參數(shù):平滑因子w和窗寬h.然后在用公式(3)、(4)和(5)、(6)分別求出每個時刻下濾波和平滑的時變密度和時變累計分布函數(shù).最后通過時變累計分布函數(shù)求出時變分位數(shù).
通過對收益率原始數(shù)據(jù)的進行最大似然估計,得到濾波的最優(yōu)參數(shù):w~=0.98823218,~h= 0.04406595,平滑估計下的最優(yōu)參數(shù):w^=0.97274846,~h=0.04405622.進行加權(quán)核密度估計時我們采用的是Epanechnikov核,圖2顯示了τ=0.05,0.25,0.50,0.75,0.95的滬深300股指收益率的時變分位數(shù),從圖像上可以看出加權(quán)后核密度估計能夠很好的刻畫分為數(shù)的變化,并且根據(jù)整個樣本的信息來刻畫分位數(shù)變化的平滑估計要比只是根據(jù)t時刻之前的信息進行的濾波估計好.
ARMA-GARCH殘差
為了進行預(yù)處理我們選擇學(xué)生t分布下的GARCH(1,1)的MA(1)模型.運用R軟件對原始收益率進行GARCH估計,得到MA(1)參數(shù),GARCH項參數(shù),以及學(xué)生t分布的自由度的分別為Coefficient(s):
圖1
圖2
圖3
同樣收益率經(jīng)過GARCH模型轉(zhuǎn)化后,對GARCH標(biāo)準(zhǔn)殘差進行最大似然估計,得到濾波的最優(yōu)參數(shù)=0.99863512,~=0.04182415,平滑估計下的最優(yōu)參數(shù)=0.99251618=0.04003711.
圖4描述了GARCH標(biāo)準(zhǔn)殘差的τ=0.01,0.05,0.25,0.50,0.75,0.95,0.99的時變分位數(shù),正如預(yù)期所料,基本上每一個時刻分位數(shù)保持不變,也就是說殘差基本上來自于一個固定的分布函數(shù).
經(jīng)過預(yù)處理后,從圖5中可以看出,殘差的PIT在絕對值和平方都不在具有較強的相關(guān)性,并且與圖3中的PIT直方圖相比,殘差PIT的直方圖表現(xiàn)出了均勻的形態(tài),不在是以往的凸峰形態(tài),也進一步說明了殘差PIT滿足均勻分布.
最后我們通過離差(dispersion)和偏度(skewness)[9]兩個指標(biāo)來觀察每個時刻的離差(dispersion)和偏度(skewness)的變化近而刻畫每個時刻的分布變化情況.
Dispersion指標(biāo)定義如下:
圖4
圖5
偏度(Skewness)指標(biāo)定義如下:
如圖6τ=0.01時離差(dispersion)指標(biāo)基本上為4.0.τ=0.05時離差(dispersion)指標(biāo)基本上為2.6,注意標(biāo)準(zhǔn)正態(tài)分布的這兩個值分別為3.45和2.66,所以可認(rèn)為GARCH標(biāo)準(zhǔn)殘差基本上接近標(biāo)準(zhǔn)正態(tài)分布.偏度(Skewness)指標(biāo)最大值是1,此時分布函數(shù)右偏,最小值為-1,密度函數(shù)左偏.當(dāng)該值等于零時,分布函數(shù)是對稱的,從偏度(skewness)圖上可以看出,GARCH標(biāo)準(zhǔn)殘差的分布基本上是對稱的.
圖6
該種方法估計的時變分位數(shù)也可以應(yīng)用在Copulas的有關(guān)理論中,比如我們要計算出兩個不同金融市場的同時出現(xiàn)在某一分位數(shù)一下的概率,便可以采用加權(quán)核密度的方法估計出如圖7,藍(lán)色圈標(biāo)記的表示分位數(shù)低于0.05分位數(shù)的狀態(tài),當(dāng)然這只是針對單一金融市場標(biāo)出的記號,對于多個金融市場可以同樣類似的進行.
本文將核密度估計與時間序列的特性有效的結(jié)合在一起,構(gòu)造了加權(quán)核密度估計的方法,并將其應(yīng)用在滬深300股指收益率上.從以上的研究結(jié)果可以看出該種方法很好的捕捉了密度函數(shù)的變化.同時對于時變分為數(shù)的估計也提出了很好的方法,相比由進行排序計算分位數(shù)的方法而言,該種分位數(shù)的計算不會產(chǎn)生交叉,并且能夠較好的包絡(luò)金融收益率的變化.當(dāng)然這種方法的不足之處就是,它只能描述那些密度函數(shù)變化緩慢的金融序列.對于有些金融數(shù)據(jù)波動性的突然增加,我們需要通過GARCH模型對收益率進行調(diào)整,才能更好的應(yīng)用此種方法.加權(quán)核密度估計在收益率的應(yīng)用或許能夠為證券期貨市場的研究和投資提供很好的借鑒意義.
圖7
[1]鎮(zhèn)志勇,李軍.非參數(shù)核密度估計在恒生指數(shù)收益率分布的應(yīng)用[J].統(tǒng)計與決策,2011(9):22-24.
[2]陳希孺,柴根象.非參數(shù)統(tǒng)計教程(第一版)[M].上海:華東師范大學(xué)出版社,1993.
[3]葉阿忠.非參數(shù)計量經(jīng)濟學(xué)(第一版)[M].天津:南開大學(xué)出版社,2003.
[4]朱紅偉.加權(quán)核密度估計及對我國消費支出的分析[J].山西財經(jīng)大學(xué)學(xué)報,2006,28(2):40-41.
[5]E.J.Wegman.Nonparametric Probability Density Estimation[J].Technometrics,1972(14):533-546.
[6]區(qū)詩德,等.股票收益率密度的非參數(shù)估計及投資策略[J].統(tǒng)計與決策,2006(3):4-6.
[7]Azzalini A.A note on the estimation of a distribution function and quantilesby a kernelmethod[J].Biometrika,1981,68(1):326-328.
[8]Berkowitz J.Testing density forecasts,with applications to risk management[J].Journal of Business and Economic Statistics,2001,19 (4):465-474.
[9]Sheather S.J.,Marron J.s.Kernel quantile estimators[J].Journal of the American Statistical Association,1990,85(410):410-416.
Weighted Kernel Density Estimation and Its Application in Hu Shen 300 Index Futures
SONGWen-xuan
(School of Statistics and Mathematics,Zhejiang Gong Shang University,Hangzhou,310018,China)
Due to the particularity of financial time series,a time-varying probability density function and the corresponding cumulative distribution function can be estimated by using a kernel and the weighted time series data.There are two important parameters,including the bandwidth and smoothing factor,which can be estimated respectively bymaximum likelihood and Cross validation.Diagnostic checks can be conducted by predictive cumulative distribution function.If the density of time series changed quickly,thismethod will fail to capture the characteristics of the series.Without doubt,this technique can be combined with a filter for scale.Finally,this paper applied thismethod to data on the index futures of Hu Shen 300.
weighted kernel density estimation;time-varying cumulative distribution;time-varying quantiles
F224;F832
A
1672-2590(2015)03-0057-08
2015-03-23
宋文選(1988-),男,河南信陽人,浙江工商大學(xué)統(tǒng)計與數(shù)學(xué)學(xué)院碩士研究生.