何成潔, 杜雪樵, 葉緒國
(1.安徽奇瑞汽車銷售有限公司,蕪湖 241009; 2.合肥工業(yè)大學(xué)數(shù)學(xué)學(xué)院,合肥 230009;3.凱里學(xué)院理學(xué)院,貴州凱里 556011)
含噪音高頻數(shù)據(jù)動態(tài)整合估計(jì)波動率的方法
何成潔1, 杜雪樵2, 葉緒國3
(1.安徽奇瑞汽車銷售有限公司,蕪湖 241009; 2.合肥工業(yè)大學(xué)數(shù)學(xué)學(xué)院,合肥 230009;3.凱里學(xué)院理學(xué)院,貴州凱里 556011)
時(shí)間域和狀態(tài)域方法是兩種常見的非參數(shù)估計(jì)方法.前者主要使用的是最近的歷史數(shù)據(jù),而后者則主要依賴于過去的歷史信息.本文在時(shí)間域上,通過對含噪音高頻數(shù)據(jù)采用雙時(shí)間尺度方法獲得其波動率,進(jìn)而獲得經(jīng)動態(tài)整合后的波動率.
動態(tài)整合;時(shí)間域;狀態(tài)域;雙時(shí)間尺度;波動率
高頻數(shù)據(jù)指日與日內(nèi)的數(shù)據(jù),主要以小時(shí)、分鐘或秒為采集頻率的、按時(shí)間先后順序排列的數(shù)據(jù).高頻數(shù)據(jù)分析是對波動率的估計(jì)和預(yù)測.在金融市場上,信息是連續(xù)性的影響證券價(jià)格過程,離散數(shù)據(jù)必然會造成信息的丟失,數(shù)據(jù)頻率越低,則信息丟失越多,所以高頻數(shù)據(jù)包含更多的信息.對高頻數(shù)據(jù)的分析,Andersen和Bollerslev等人提出了已實(shí)現(xiàn)波動率[1-3]度量資產(chǎn)價(jià)格波動的方法.Christensen針對已實(shí)現(xiàn)波動率的缺陷提出了已實(shí)現(xiàn)極差[4]的方法.文獻(xiàn)[5]利用雙時(shí)間尺度的方法得到波動率的估計(jì),F(xiàn)an通過時(shí)間和狀態(tài)域[6]上的整合對波動率給予了估計(jì).國內(nèi)王春峰、唐勇[7,8]等分別從不同角度對高頻數(shù)據(jù)做了理論及實(shí)證上的研究.本文在考慮噪音的情況下,運(yùn)用雙時(shí)間尺度的方法,引入動態(tài)權(quán)對波動率進(jìn)行整合估計(jì),得出了含噪音高頻數(shù)據(jù)的動態(tài)整合估計(jì).
在金融市場中,如果我們要預(yù)測未來的事情或做出一個(gè)投資計(jì)劃,那么要考慮兩種有用的信息:時(shí)間域上的信息和狀態(tài)域上的信息.Fan Jian-qing引入了動態(tài)權(quán)ωt(0≤ωt≤1)對兩個(gè)漸進(jìn)獨(dú)立的估計(jì)進(jìn)行了動態(tài)整合(參看[6]Theorem),并定義產(chǎn)生的整合估計(jì)為
這里分別表示時(shí)間域、狀態(tài)域波動率估計(jì)量.整合估計(jì)的方差最小化,這樣估計(jì)效果最佳,從而得到最佳的動態(tài)權(quán)為
本文在文獻(xiàn)[6]的基礎(chǔ)上,在時(shí)間域上增加了噪音因素,得到了在含噪音高頻數(shù)據(jù)下的動態(tài)整合估計(jì)波動率的方法.
我們考慮收益過程r,服從伊騰微分方程:
W t是一個(gè)Wiener過程.假設(shè)現(xiàn)在時(shí)刻為t,我們有從(2)中獲得的T時(shí)間段內(nèi)取樣間隔是Δ的歷史數(shù)據(jù),目的是估計(jì)波動率≡σ2(rt).
設(shè)Y i=Δ-1/2(-)=+,其中為在t i時(shí)刻的觀測值,是歷史數(shù)據(jù)是真實(shí)值.是i.i.d微觀結(jié)構(gòu)噪音,滿足
且與獨(dú)立.
1.狀態(tài)域.
對于狀態(tài)域,由文獻(xiàn)[6],設(shè)
w(·)表示核函數(shù),則局部線性估計(jì)可表示為
這里Ri={Y i-f()}2表示條件項(xiàng)平方(squared residuals).其漸近方差為
這里我們不妨設(shè)εi~N(0,1)時(shí),
2.時(shí)間域.
對波動率采用移動平均模型MA來估計(jì)
其中[r,r]T表示在[0,T]時(shí)段上r的二次變差.
我們分兩種情況來看:一種是噪音存在但被忽略了,另一種情況是考慮了噪音因素.
(i)噪音存在但被忽略.
假定市場微觀結(jié)構(gòu)噪音存在,但在估計(jì)波動率時(shí),噪音被忽略了,即我們用觀值作為來估計(jì)波動率,由模型(5)有
其中[R,R表示在[0,T]時(shí)段上,R取得所有觀測值時(shí)的二次變差.
事實(shí)上,在=+下,觀測值有如下的二次變差
給定(3),我們可知[R,R在r下的條件期望為
(7)的證明參見文獻(xiàn)[5].
(ii)考慮噪音因素.
當(dāng)市場微觀結(jié)構(gòu)噪音存在時(shí),表示如果考慮了噪音因素,則對于收益模型Rti=rti+uti,我們采用雙時(shí)間尺度的方法來獲得[r,r]T的估計(jì).
其中[r,r]T表示[r,r]T的估計(jì)量,[R,R表示在[0,T]時(shí)段上,R對所有觀測值子格取樣平均下的二次變差.
k表示子格數(shù).(相關(guān)概念和定義參見附錄).
(8)的證明見附錄.
(9)的證明參見文獻(xiàn)[5].
3.整合估計(jì).
在上面兩種情況下,我們分別得到相應(yīng)的動態(tài)權(quán)及整合估計(jì).
由(1),(4),(7),全部數(shù)據(jù)的經(jīng)典的滑動平均整合估計(jì)的動態(tài)權(quán)為
從而得到整合估計(jì)
由(1),(4),(9),雙時(shí)間尺度的滑動平均整合估計(jì)的動態(tài)權(quán)為
1.定理:當(dāng)n無限大時(shí),雙時(shí)間尺度的滑動平均估計(jì)的均方誤差總是比全部數(shù)據(jù)所獲得的經(jīng)典的滑動平均估計(jì)的均方誤差小.(證明見附錄)
2.通過模擬,我們會發(fā)現(xiàn),在存在微觀市場結(jié)構(gòu)噪音情況下,雙時(shí)間尺度整合估計(jì)較經(jīng)典的滑動平均整合估計(jì)優(yōu)越.
估計(jì)量 均方誤差ME 根均方誤差RSME^σ2I,t -1.3200e-003 6.0741e-003^σ*2I,t 1.0501e-004 1.4208e-003
說明:對2004年美國短期國庫券收益取樣,樣本量為1000,重復(fù)取樣1158次,對估計(jì)量的均方誤差及根均方誤差進(jìn)行模擬比較.在這種模擬下,我們看到的均方誤差及根均方誤差比的小,因此可以認(rèn)為效果好.
附錄
定義1 全格:全格是包含所有觀測點(diǎn)的集合,即G={t0,…,tn}.
定義2 子格:對于一個(gè)任意格H,H?G.如果ti∈H,ti,-,ti,+分別表示H中位于t i之前和之后的元素,而ti仍然是全格G中第i個(gè)元素,則稱H為G的子格.
定義3 二次變差:對在任意子格H?G上的隨機(jī)過程X,我們定義二次變差[X,X]如下
在全格G上X的二次變差可以寫成
通常情況下,若特別強(qiáng)調(diào)在某個(gè)格上,X的二次變差
定義4 二次協(xié)變差:類似二次變差的定義,我們定義二次協(xié)變差,設(shè)Z=X+Y,X,Y,Z表示隨機(jī)過程,[Z,Z]t=[X,X]t+2[X,Y]t+[Y,Y]t.
引理假設(shè)r是形如(2)的It?過程,若R與r的關(guān)系如(3),且對?i,ti,ti+1不在同一個(gè)子格中,則在條件r下有
證明見文獻(xiàn)[2].
引理(過濾的描述) 對任意p,x=(x(1),x(2),…,x(p))是多維連續(xù)的P局部鞅,因此Ft是包含σ(x s,s≤T)和N的最小σ-代數(shù),其中N是σ(x s,s≤T)中的所有空集,有
其中η是某個(gè)常數(shù),Zdiscrete是與r獨(dú)立的標(biāo)準(zhǔn)正態(tài)分布.
證明見文獻(xiàn)[2].
(8)的證明
定理當(dāng)n無限大時(shí),雙時(shí)間尺度的滑動平均估計(jì)的均方誤差總是比全部數(shù)據(jù)所獲得的經(jīng)典滑動平均估計(jì)的均方誤差小.
證由(6),(7),全部數(shù)據(jù)所獲得的經(jīng)典的滑動平均估計(jì)的均方誤差為
[1]Andersen T G.Bollerslev T et al.Exchange rate returns standardized by realized volatility are(nearly)Gaussian[J].Multinational Finance Journal,2000,4:159-179.
[2]Andersen T G.Bollerslev T et al.The distribution of realized exchange rate volatility[J].Journal of American Statistical Association,2001,96(453):42-55.
[3]Andersen T G.Bollerslev T et al.The distribution of realized stock return volatility[J].Journal of Financial Economics,2001,61(1):43-76.
[4]Christensen K,Podolskij M.Asymptotic theory for range-based estimation of integrated variance of a continuous semi-martingale[R].A arhus School of Business,2005.
[5]Zhang L,P A Mykland,Y Ait-Sahalia.A tale of two time scales:determining integrated volatility with noisy high-frequency data[J].Journal of the American Statistical Association,2005,100(472):1394-1411.
[6]Fan J,F(xiàn)an Y,Jiang J.Dynamic integration of time-and state-domain methods for volatility estimation[J/L].http:∥arxiv.org/abs/math.St/0506029,2005-06-02.
[7]王春峰,等.高頻數(shù)據(jù)下投資組合風(fēng)險(xiǎn)預(yù)測模型比較[J].系統(tǒng)工程,2007,25(3):23-28.
[8]唐勇,張世英.高頻數(shù)據(jù)的加權(quán)已實(shí)現(xiàn)極差波動及其實(shí)證分析[J].系統(tǒng)工程,2006,24(8):52-57.
Dynamic Integration Methods for Volatility Estimation with Noisy High-Frequency Data
HECheng-jie1,DUXue-qiao2,YEXu-guo3
(1.Anhui Chery Automobile Sales Co.,Ltd.,Wuhu 241009,China;2.Department of Mathematics,Hefei University of Technology,Hefei 230009,China;3.School of Science and Physics,Kaili University,Kaili,Guizhou 556011,China)
Time-and state-domain methods are two common approaches for nonparametric prediction.The former predominantly uses the data in the recent history while the latter mainly relies on historical information.The paper adds the affect of noisy in time-domain,and obtains the volatility of noisy high frequency data by two time scales method,then get the dynamic integration volatility.
dynamic integration;time-domain;state-domain;two time scales;volatility
O212.2
A
1672-1454(2011)04-0108-05
2008-09- ;[修改日期]2009-06-19