【摘要】基于高頻數(shù)據(jù)的金融分析與建模研究目前已成為金融工程研究領域的一大熱點。在金融資產(chǎn)價格波動率的刻畫上,金融高頻波動率有著低頻波動率無法比擬的信息優(yōu)勢,能夠較為準確地刻畫金融市場波動率的相關特征,并對金融市場波動率的變化做出較為精確的預測。本文選擇基于高頻數(shù)據(jù)的滬深300指數(shù)為樣本,通過構建已實現(xiàn)波動率和已實現(xiàn)極差的長記憶性模型去研究高頻數(shù)據(jù)建模預測中的方法,以對比研究的形式分析了已實現(xiàn)波動率和已實現(xiàn)極差在波動率預測中的能力大小,為高頻數(shù)據(jù)波動率預測研究提供了參考和借鑒。
【關鍵詞】高頻數(shù)據(jù) 已實現(xiàn)波動率 已實現(xiàn)極差 波動率預測
一、引言
隨著科技進步尤其是電子計算機技術的發(fā)展,對高頻數(shù)據(jù)的記錄、收集、存儲和操作的時間和金錢成本都大大下降,20實際90年代以來,高頻數(shù)據(jù)的分析與建模得到了迅速的發(fā)展,并廣泛運用與金融市場微觀結構理論的實證研究中。高頻數(shù)據(jù)能精確到交易日日內(nèi)分時收盤價,充分保證重要的市場信息不被丟失,使得基于高頻數(shù)據(jù)估計的波動率包含更加豐富的波動信息。高頻波動率與低頻波動率的特點不同,呈現(xiàn)出時間序列的負相關性、周期性U型日歷效應和長記憶性等,而現(xiàn)有的基于低頻數(shù)據(jù)的ARCH類或SV類模型并不能很好的描述這些統(tǒng)計特征。對高頻波動率的研究已經(jīng)成為計量經(jīng)濟學領域的一個熱點。深入研究日內(nèi)高頻數(shù)據(jù)波動率的性質(zhì),選擇合適的波動率預測模型和金融資產(chǎn)收益率分布來度量中國股票市場的風險,分析市場微觀結構對高頻波動率的影響,從而為金融機構和監(jiān)管當局的風險監(jiān)控提供一種有效的理論方法參考和政策建議具有重大意義。
本文通過選取滬深300指數(shù)5分鐘交易數(shù)據(jù),通過構建目前廣泛用于高頻數(shù)據(jù)分析的已實現(xiàn)波動率和已實現(xiàn)極差兩個序列,通過R/S法計算Hurst指數(shù),確定兩個序列的長記憶性,進而對兩者構建了長記憶性的ARFIMA模型,并用這一模型進行了波動率估計,再采用均方根誤差和絕對平均誤差兩個指標對兩個模型的預測結果進行了評價。
二、文獻綜述
Engle(2000)為超高頻數(shù)據(jù)或交易的建模應用提供了新的思路。通過選取的52144條IBM股票的交易數(shù)據(jù)去為交易的時機建模并測量分析它對價格波動的影響,將ACD模型引入去估計到達比率的相關點過程,同時采用了半?yún)?shù)法去估計調(diào)和均數(shù)。實證結果說明對于更長的持續(xù)期和更長的預期持續(xù)期,其波動會相應的更小。Andersen(2001)等采用道瓊斯工業(yè)指數(shù)中獲取的日內(nèi)高頻交易數(shù)據(jù)對從已實現(xiàn)日股票收益波動率和相關系數(shù)進行研究,他們發(fā)現(xiàn)實現(xiàn)方差和協(xié)方差的非條件分布是高度右偏,然而實現(xiàn)對數(shù)標準差和相關系數(shù)卻近似于高斯分布,已實現(xiàn)波動率與相關系數(shù)表現(xiàn)出了較強的短暫相關性,即所謂的長記憶性。Andersen(2003)等構建了一個集高頻日內(nèi)數(shù)據(jù)測量、建模和每日預測和低頻收益波動與收益分布的體系,大部分有關金融資產(chǎn)收益波動率、相關性和分布的建模與預測是基于多元ARCH或者隨機波動率模型的潛在限制性和復雜的參數(shù),相比之下,使用由高頻日內(nèi)收益所計算得出的已實現(xiàn)波動率使得建模與預測允許采用傳統(tǒng)時間序列方法。在構造連續(xù)時間無套利價格理論與二次方差理論的基礎上,他們提出了已實現(xiàn)波動率與條件協(xié)方差矩陣的關系。通過德國馬克兌美元和日元兌美元的10年以上的匯率數(shù)據(jù)的實證分析,他們發(fā)現(xiàn)簡單的長記憶高斯向量回歸對數(shù)日已實現(xiàn)波動率在預測上的表現(xiàn)優(yōu)于許多ARCH類模型與更復雜的高頻數(shù)據(jù)模型。近年來,許多學者開拓了新的研究高頻數(shù)據(jù)的思路,成果也不斷涌現(xiàn)。唐勇和張世英(2006)通過選取深圳成指的高頻數(shù)據(jù)進行實證分析,通過對比已實現(xiàn)極差與已實現(xiàn)波動率這兩個波動估計量,證明了實現(xiàn)極差在波動估計上優(yōu)于已實現(xiàn)波動率。此外,在高頻數(shù)據(jù)的“日歷效應”問題上,提出了加權已實現(xiàn)極差,并與實現(xiàn)極差作比較,證實了加權已實現(xiàn)極差在估計波動方面更為優(yōu)秀,為在高頻數(shù)據(jù)中將極差應用于估計波動率拓展了一個新的思路。Sun(2009)等采用ARMA(1,1)-GARCH(1,1)模型這一參數(shù)模型,選取了德國DAX指數(shù)的高頻數(shù)據(jù)并融入于列維過程去計算風險價值,并將運用這一方法計算所得的VaR和標準的非參數(shù)法計算所得的VaR進行對比,結果顯示這一參數(shù)法獲得了更好的結果。Lu(2010)等分析了當2005年7月21日人民幣再調(diào)整時相關貨幣兌美元的1分鐘高頻數(shù)據(jù)的變動,數(shù)據(jù)分析顯示人民幣再調(diào)整時匯率數(shù)據(jù)中存在一個大的跳躍,在這一跳躍之后,匯率的收益率存在著大的波動率,此外,外匯數(shù)據(jù)中一些大的跳躍伴隨著這一跳躍發(fā)生。Thanos和Owain(2010)提出了一種處理超高頻金融市場數(shù)據(jù)中樣本外預測的多維算法。在數(shù)據(jù)統(tǒng)計分析中,對金融時間序列的統(tǒng)計特征采用穩(wěn)健的平均絕對偏差法去分析,并提出將價位,價格波動和收益分布同時考慮進市場微觀結構算法的原理中。唐勇和劉微(2013)推導出了已實現(xiàn)極差多冪次變差族中最優(yōu)的波動估計量,根據(jù)無偏性和有效性原則作了相應的加權處理,得出了加權估計量,將這些估計量與已實現(xiàn)GARCH相結合,并對此模型進行了拓展。通過實證分析說明已實現(xiàn)極差四冪次變差是已實現(xiàn)極差多冪次變差族中最優(yōu)的波動估計量,加權已實現(xiàn)極差四冪次變差能消除高頻數(shù)據(jù)中的日內(nèi)效應。雷井生和林莎(2013)改進了統(tǒng)計套利策略,設計了一個新的統(tǒng)計套利策略并進行了實證分析,在新的策略下,運用不同頻率數(shù)據(jù)進行套利統(tǒng)計,分析并得出了新的策略在套利統(tǒng)計上具有良好的績效,并且樣本內(nèi)的盈利對于樣本外的盈利預測性明顯增強。隨著對金融高頻數(shù)據(jù)研究的發(fā)展,由于高頻數(shù)據(jù)本身所具有的特性如日歷效應等,以及使得GARCH模型很難用于高頻數(shù)據(jù)的分析,不同的學者提出與發(fā)展了新的適用于高頻數(shù)據(jù)研究的成果,其中比較突出的成果要屬已實現(xiàn)波動率和已實現(xiàn)極差這兩個被廣泛用于高頻數(shù)據(jù)分析的研究成果。
三、方法簡述
已實現(xiàn)波動率(Realized volatility,簡記為RV)由于其計算簡便,無需進行模型參數(shù)估計(model-free),有助于研究多變量時間序列的波動特征。同已實現(xiàn)波動率RV一樣,已實現(xiàn)極差波動(Realized Range volatility,簡記為RRV)也是具有無需模型(model free)和計算簡便的波動率估計量,Parkinson(1980)提出了構造極差的表達式,在此基礎上Christensen(2005)提出了已實現(xiàn)極差波動。不同學者和研究人員經(jīng)過理論和實證上的對比,認為已實現(xiàn)極差是比已實現(xiàn)波動率更為有效的波動率估計量。下面分別對兩者進行定義。
令Pclose(t,i)為日內(nèi)觀測的收盤價,R(t,i)=In(Pclose(t,i)-Pclose(t,i-1))
Ht,i=■lnp■,L■=■lnp■,
Sp■=H■-L■(t=1,2,,,T,i=1,2,,,N,j=1,2,,,N)
上式中,T為研究天數(shù),N為在[t-1,t]內(nèi)等時間間隔的觀測次數(shù),Δ=■,為將[t-1,t]等分為N個時間段的某個小時間段的時間間隔,N取整數(shù)
則已實現(xiàn)波動率定義為:RV=■R2(t,i),為日內(nèi)對數(shù)收益率平方和的累加。
已實現(xiàn)極差定義為:RRVt=■■Sptj2,為日內(nèi)最高價和最低價對數(shù)平方和的累加。
判定波動率序列是否具有長記憶性的方法主要有時域和頻域兩個兩個方法,本文選擇時域角度,以重標極差法(R/S)計算的Hurst指數(shù)來度量波動率序列的長記憶性。當H≤0.5時,序列{Xt}呈現(xiàn)短記憶性;當H>0.5時,序列{Xt}呈現(xiàn)長記憶性。
針對已實現(xiàn)波動序列{Xt}所具有的長記憶性,本文采用分整自回歸移動平均模型(Autoregressive fractionally moving average model,簡稱為ARFIMA(p,d,q)模型)對已實現(xiàn)類波動率序列進行建模分析。
ARFIMA(p,d,q)模型的具體形式為:φ(L)(1-L)d(Xt-μ)= θ(L)εt
其中,μ為序列{Xt}的均值,εt~i.i.d(0,σ2s),φ(L)為P階平穩(wěn)回歸算子,θ(L)為q階可逆移動平均算子,它們的根都在單位圓外。d為分數(shù)維滯后階數(shù),反映的是序列{Xt}的長記憶性。ARFIMA(p,d,q)的特征主要在于用p+q個參數(shù)來刻畫序列{Xt}的短記憶特性,用參數(shù)d來刻畫{Xt}的長記憶特征。
對于ARFIMA(p,d,q)模型的參數(shù)估計,可以采用兩步參數(shù)法:
首先估計ARFIMA(p,d,q)模型中的分數(shù)維滯后階數(shù)d,并對原序列取分數(shù)維差分,得到新的可用于估計的時間序列。d確定好以后,ARFIMA模型可以當作ARMA模型進行估計,確定剩下的參數(shù)p和q。
由于參數(shù)d和Hurst指數(shù)滿足:d=H-0.5,因此可以通過R/S法計算所得的Hurst指數(shù)確定參數(shù)d,再將模型當作ARMA模型,進行剩下的參數(shù)估計。
四、實證過程
本文選擇滬深300指數(shù)作為研究樣本,樣本選取的區(qū)間為2011年4月1日至2014年3月5日,選取的高頻數(shù)據(jù)頻率為5分鐘的高頻數(shù)據(jù),數(shù)據(jù)來源于Wind資訊金融終端,在計算得到的已實現(xiàn)波動率RV和已實現(xiàn)極差RRV后,開始進行實證分析。實證部分主要用matlab軟件進行。下表為已實現(xiàn)波動率RRV和已實現(xiàn)極差的描述性統(tǒng)計:
描述性統(tǒng)計結果
從上表可以看出,無論是已實現(xiàn)波動率RV還是已實現(xiàn)極差RRV,都呈現(xiàn)出尖峰厚尾的特征,相應的JB統(tǒng)計量和括號內(nèi)的P值都表明上述序列不服從正態(tài)分布,且根據(jù)偏度和峰度值來看,都呈現(xiàn)出右偏厚尾的特性。下面對兩個序列進行單位根檢驗,結果如下:
單位根檢驗結果
從上表的結果來看,RV和RRV兩個序列檢驗的t統(tǒng)計量在99%的置信水平上都拒絕了原假設,其P值都是足夠小的值,因此RV序列和RV序列都通過了檢驗,這兩個序列都是平穩(wěn)的。下面對兩個序列進行長記憶性檢驗,結果如下
RV和RRV的長記憶性檢驗
從上表可以看出,RV和RRV的Hurst指數(shù)0.5 RV序列的估計過程中,通過AIC和SC準則確定的(p,q)為(1,1),則所得到的RV-ARFIMA(1,0.264,1)的具體形式為: (1-0.064L)(1-L)0.264(RV-μ)=(1-0.95L)εt (1.466) (-66.643) RRV序列通過AIC和SC準則確定模型的(p,q)選擇為(1,2),則得到的RRV-ARFIMA(1,0.467,2)的具體形式為: (1-0.62L)(1-L)0.467(RRV-μ)=(1-1.362L+0.4L2)εt (7.689) (-12.71609)(5.1173) 括號內(nèi)為相應參數(shù)的t統(tǒng)計量。 在構建完所有的模型后,我們對各模型進行波動率預測能力上的比較,比較的標準選擇均方根誤差(RMSE)和絕對平均誤差(MAE)兩個指標: RMSE=■■(MV-FV)■■ MAE=■■(MV-FV)■ 其中,MV表示實際的波動率,F(xiàn)V表示模型預測的波動率。設定預測期為100,就可以得到向前預測100期的預測值,再采用上述兩個方法對波動率預測的結果進行評價,兩個模型預測的評價結果如下: 波動率預測評價 對比RRV和RV序列構建的ARFIMA模型在波動率預測上的結果,我們可以發(fā)現(xiàn)無論從均方根誤差還是絕對平均誤差的角度,RRV序列的預測誤差都小于RV序列的預測誤差,這也從實證上印證了本文在理論上分析RV和RRV在波動率估計上的優(yōu)劣區(qū)別。 五、結論 本文通過選取滬深300指數(shù)的高頻交易數(shù)據(jù),分別構建了目前高頻數(shù)據(jù)研究中流行的已實現(xiàn)波動率和已實現(xiàn)極差兩個方法變量,并對兩個序列采用R/S法計算了序列的Hurst,結果表明兩個序列都呈現(xiàn)長記憶性。在隨后構建長記憶性模型并進行波動率估計的對比研究中,通過RMSE和MAE兩個指標的判定,表明已實現(xiàn)極差是優(yōu)于已實現(xiàn)波動的波動率估計量,這主要是因為已實現(xiàn)極差是基于日內(nèi)價格的最高價和最低價而構建的,包含的市場信息較多,而已實現(xiàn)波動率是基于日內(nèi)收盤價而構建的波動率估計量,會在一定程度上遺漏市場信息。
從本文的研究可以發(fā)現(xiàn),金融市場的交易連續(xù)不斷,其日內(nèi)高頻數(shù)據(jù)包含的信息也有一定的差別,除了考慮收盤價這一要素外,日內(nèi)觀測到的最高價、最低價、成交量等因素也要納入對金融市場的分析中,這樣可以獲得比單獨采用收盤價這一因素進行波動率研究更準確的研究結果。
參考文獻
[1]Torben G.Andersen,Tim Bollerslev,F(xiàn)rancis X.Diebold,Heiko Ebens.The distribution of realized stock return volatility[J].Journal of Financial Economics,2001,61,43-67.
[2]Robert F.Engle.The Econometrics of Ultra- high-frequency data[J].Econometrica,2000,68(1):1-22.
[3]Torben G.Andersen,Tim Bollerslev,F(xiàn)rancis X.Diebold,Paul Labys.Modeling and Forecasting Realized Volatility[J].Econometrica,2003,71,529-626.
[4]Wei Sun,Svetlozar Rachev,F(xiàn)rank J.Fabozzi. A New Approach for Using Levy Processes for Determining High-Frequency Value-at-Risk Predictions[J].European Financial Management,2009,15(2):340-361.
[5]XinHong Lu,Ken-Ichi Kawai,Koichi Maekawa. Estimating Bivariate GARCH-Jump model Based on High Frequency Data:The Case of Revaluation of The Chinese Yuan in July 2005[J].Journal of Operational Research,2010,27(2):287-300.
[6]Thanos Verousis,Owain ap Gwilym.An improved algorithm for cleaning Ultra High-Frequency data[J].Journal of Derivatives & Hedge Fundes,2010,15(4):323-340.
[7]Christian M.Hafner.Cross-correlating wavelet coefficients with applications to high-frequency financial time series[J].Journal of Applied Statistics,2012,39(6):1363-1381.
[8]雷井生,林莎.基于高頻數(shù)據(jù)的套利統(tǒng)計策略及實證研究[J].科研管理,2013,6(34):138-146.
[9]唐勇,張世英.已實現(xiàn)波動和已實現(xiàn)極差波動的比較研究[J].系統(tǒng)工程學報,2007,22(4):437-443.
[10]邵錫棟,殷煉乾.基于實現(xiàn)極差和實現(xiàn)波動率的中國金融市場風險測度研究[J].金融研究,2008,336(6):109-121.
[11]唐勇,張世英.高頻數(shù)據(jù)的加權已實現(xiàn)極差波動及其實證分析[J].系統(tǒng)工程,2006,24(8):52-60.
[12]唐勇,劉微.加權已實現(xiàn)極差四次冪變差分析及其應用[J].系統(tǒng)工程理論與實踐,2013,33(11):2766-2776.
[13]張瑞鋒,汪同三.基于高頻數(shù)據(jù)的金融市場波動溢出分析[J].財經(jīng)理論與實踐(雙月刊),2013,34,21-26.
作者簡介:陳杰(1990-),男,漢族,浙江財經(jīng)大學金融學院研究生,研究方向:金融工程。