張?jiān)平?/p>
摘要:本文以具有代表性的9個(gè)中國股市指數(shù)的高頻價(jià)格和每日收盤價(jià)(時(shí)間窗口是2013年至2018年)作為數(shù)據(jù)源,比較廣義自回歸條件異方差模型(簡稱GARCH模型,下同)和high-frequency-basedvolatilitymodels(簡稱HEAVY模型,Shephard和Sheppard(2010),下同)的預(yù)測精度。把整體數(shù)據(jù)源分為樣本內(nèi)數(shù)據(jù)和樣本外數(shù)據(jù),樣本內(nèi)數(shù)據(jù)用于參數(shù)估計(jì),樣本外數(shù)據(jù)用于模型預(yù)測。然后通過損失函數(shù)計(jì)算損失值,損失函數(shù)值越小,則模型的預(yù)測效果越好。最后通過Diebold-Mariano檢驗(yàn)統(tǒng)計(jì)量判定兩個(gè)模型優(yōu)劣的顯著性。結(jié)果是HEAVY模型整體比GARCH模型預(yù)測效果要好。
關(guān)鍵詞:GARCH ?HEAVY ?最大似然估計(jì) ?損失函數(shù) ?Diebold-Mariano檢驗(yàn)統(tǒng)計(jì)量
一、引言
20世紀(jì)90年代以后,隨著信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,市場交易信息和資產(chǎn)價(jià)格信息獲取也更加方便和及時(shí)。因此,通過信息技術(shù)的幫助,研究人員可以獲得高頻的交易數(shù)據(jù),例如10分鐘、5分鐘、1分鐘的交易數(shù)據(jù)。同理,獲取數(shù)據(jù)的頻率越高,獲取的交易信息就越多,分析者做出精準(zhǔn)預(yù)測的把握性就越大,使得研究結(jié)果更精確、更有說服力,可以提高相關(guān)領(lǐng)域的風(fēng)險(xiǎn)管理能力。金融風(fēng)險(xiǎn)的大小通常是由標(biāo)的資產(chǎn)價(jià)格或收益的波動(dòng)率來衡量的,而潛在風(fēng)險(xiǎn)是需要預(yù)測相關(guān)資產(chǎn)的波動(dòng)率來衡量的。本文波動(dòng)率預(yù)測模型主要是Shephard和Sheppard(2010)引進(jìn)的high-frequency-basedvolatilitymodels(簡稱HEAVY模型,下同)。以GARCH模型(見Bollerslev(1986))作為參照,對(duì)中國股市的代表性指數(shù)數(shù)據(jù)分別進(jìn)行GARCH模型和HEAVY模型建模,分析并對(duì)比它們各自的預(yù)測值和預(yù)測精度,為相關(guān)風(fēng)險(xiǎn)投資者和決策者提供更加科學(xué)、精準(zhǔn)的預(yù)測方法。
二、文獻(xiàn)回顧
(一)GARCH模型研究
資產(chǎn)的波動(dòng)率被廣泛地應(yīng)用在期權(quán)定價(jià)、風(fēng)險(xiǎn)管理中。這種指標(biāo)的確立促進(jìn)了自回歸條件異方差模型(簡稱ARCH模型,Engle(1982)和GARCH模型的發(fā)展。GARCH模型是在ARCH模型的基礎(chǔ)上增加了異方差函數(shù)的P階自相關(guān)性。在GARCH模型的結(jié)構(gòu)里,關(guān)鍵成分就是條件方差。當(dāng)GARCH模型中自回歸多項(xiàng)式部分存在單位根時(shí),就可以將模型變成intergratedGARCH(簡稱IGARCH模型),見Engle和Bollerslev(1986)。其他的對(duì)GARCH模型的研究可以參見Bollerslev(2010).
(二)已實(shí)現(xiàn)測度模型研究
標(biāo)準(zhǔn)的GARCH模型采用每日收益的平方值來刻畫目前資產(chǎn)的波動(dòng)率水平,比較適合波動(dòng)率低頻變化的情況,不適合用于波動(dòng)率快速變化的情形,因?yàn)樵谟泻芏嗥诓▌?dòng)率變化時(shí),GARCH模型擬合波動(dòng)率變化就很慢,見Andersenetal.(2003)。隨著日間交易數(shù)據(jù)越來越多,一些研究者提出一系列用于度量日間波動(dòng)率的指標(biāo)realizedmeasures(已實(shí)現(xiàn)測度,簡稱RM,下同)。本文主要使用其中的一種,即已實(shí)現(xiàn)方差(realizedvariance,簡稱RV,下同)。Andersen和Bollerslev(1998)選擇已實(shí)現(xiàn)測度為RV的波動(dòng)率模型來研究噪音的方差和波動(dòng)率之間的關(guān)系。Andersenetal.(2001)使用高頻數(shù)據(jù)研究不同國家匯率的波動(dòng)率和相關(guān)性,認(rèn)為存在著持續(xù)的波動(dòng)率和相關(guān)性的動(dòng)態(tài)變化,且波動(dòng)率和相關(guān)性是已實(shí)現(xiàn)的指標(biāo)而不是潛在的指標(biāo)。Barndorff-Nielsen和Shephard(2002)使用已實(shí)現(xiàn)測度RV來研究收益的隨機(jī)性,得出了RV誤差的漸近分布特性,通過這些特性來估計(jì)模型中的待估參數(shù)。
(三)基于高頻數(shù)據(jù)的波動(dòng)率預(yù)測模型研究
隨著已實(shí)現(xiàn)測度模型的快速發(fā)展,波動(dòng)率預(yù)測模型的發(fā)展也日新月異,呈現(xiàn)出豐富發(fā)展態(tài)勢。Engle(2002)在估計(jì)GARCHX類型的模型時(shí),在GARCH方程右側(cè)加入一個(gè)RM指標(biāo),但他的模型是不完整的,不能夠呈現(xiàn)收益率和波動(dòng)率在超過一個(gè)周期之外的情形。Engle和Gallo(2006)引進(jìn)了第一個(gè)完整的波動(dòng)率預(yù)測模型,這個(gè)模型對(duì)每一個(gè)RM都確定一個(gè)GARCH結(jié)構(gòu)。Corsi(2009)提出了HAR-RV預(yù)測模型來研究已實(shí)現(xiàn)波動(dòng)率的長期記憶性特征,波動(dòng)率在不同的時(shí)間段中有著不同的成分,結(jié)果顯示了金融資產(chǎn)收益率具有厚尾、長期性、自相關(guān)性的特點(diǎn)。Shephard和Sheppard(2010)引進(jìn)了另一個(gè)完整的模型,即HEAVY模型,相比于傳統(tǒng)的GARCH模型,HEAVY模型融進(jìn)了多重潛在的波動(dòng)過程,包含高頻價(jià)格信息,即能得出高頻的波動(dòng)率水平,可以進(jìn)一步發(fā)現(xiàn)RM中的額外信息,能夠產(chǎn)生樣本外的收益。
三、模型介紹
(一)GARCH模型形式
經(jīng)典的GARCH模型(GARCH1):
(1)
具有單位根的GARCH模型(GARCH2):
(2)
(二)HEAVY模型形式
計(jì)算RV的公式:
表示第t天交易的第j個(gè)時(shí)段的個(gè)體。是第t天,時(shí)刻交易價(jià)格的對(duì)數(shù)值,是相鄰兩個(gè)時(shí)刻指數(shù)交易價(jià)格取對(duì)數(shù)值的差,即時(shí)刻收益率。
HEAVY1模型主要公式:
(3)
(4)
是第t天收益率的條件方差,是第t天已實(shí)現(xiàn)測度的條件期望值。是t-1時(shí)刻的信息集,包含低頻的收益率(,,…,)和高頻的已實(shí)現(xiàn)測度(,,…,)。方程(3)中限制條件為ω,α≥0,β∈[0,1);方程(4)中的限制條件為,,≥0,+∈[0,1)。
HEAVY2模型(reparameterization)主要公式:
(5)
(6)
在和穩(wěn)態(tài)的條件下,,。那么我們可以把截距與期望值聯(lián)系起來,這是HEAVY2的特點(diǎn)。。我們先用均值來估計(jì),和,即,,。這樣,HEAVY1可以通過目標(biāo)參數(shù)化轉(zhuǎn)換成HEAVY2。方程(6)的限制條件為。HEAVY2模型與HEAVY1模型的差別只是方程結(jié)構(gòu)和待估參數(shù)發(fā)生了變化,估計(jì)模型和預(yù)測模型與HEAVY1模型完全一致。
HEAVY3模型(單位根條件下的HEAVY1)主要公式:
(7)
(8)
(4)在單位根條件下變成了(8)。其中,0<<1。Shephard和Sheppard(2010)引入HEAVY3,是為了提高模型多期預(yù)測的能力。
(三)HEAVY參數(shù)估計(jì)模型
方程(3)使用高斯擬似然函數(shù)來估計(jì):
;
其中設(shè)定
方程(4)也使用類似于方程(3)的方式來估計(jì):
;
其中設(shè)定
在HEAVY1參數(shù)估計(jì)模型中通過方程的迭代最優(yōu)化,獲得擬似然函數(shù)的最大值。令θ=(ω,,,),當(dāng)θ=時(shí),擬似然函數(shù)達(dá)到最大值。同理,HEAVY2和HEAVY3的參數(shù)估計(jì)模型也通過上述方法進(jìn)行構(gòu)建、求解。
(四)預(yù)測模型
GARCH的預(yù)測模型:
以t時(shí)刻為預(yù)測原點(diǎn),向前一步預(yù)測:
(11)
則,其中,為低頻信息集,包含低頻的收益率(,,…,)。s>1,向前多步預(yù)測為:
(12)
HEAVY的預(yù)測模型:
一步向前預(yù)測為(由t-1時(shí)刻預(yù)測t時(shí)刻):
(13)
由Shephard和Sheppard(2010)可知,多步向前預(yù)測的一般式為(s≥1):
(14)
其中,δ=(),s=4時(shí),表示向前一周波動(dòng)率預(yù)測的總和、當(dāng)s=21時(shí),表示向前一個(gè)月的波動(dòng)率預(yù)測總和。
(五)損失函數(shù)
參照Shephard和Sheppard(2010),我們使用擬似然損失函數(shù)(QLIK)。在一步或多步向前預(yù)測中,對(duì)于每個(gè)s值:
;
此處=(,)′,通過似然函數(shù)可以算出三組參數(shù)的估計(jì)值,分別為(,)。公式(15)適用于GARCH類模型、HEAVY類模型,本文用樣本外收益率的平方代替真實(shí)波動(dòng)率,即用代替真實(shí)的波動(dòng)率,是各個(gè)模型向前一步預(yù)測或多步預(yù)測的波動(dòng)率值,最后求出損失函數(shù)的累積值。
(六)顯著性水平檢測
判斷兩個(gè)模型預(yù)測精度的顯著性水平,是通過計(jì)算Diebold-Mariano檢驗(yàn)統(tǒng)計(jì)量(Diebold和Mariano,1995)的值,再與臨界值比較。例如A預(yù)測模型與B預(yù)測模型,定義它們各期損失函數(shù)之差的均值:。loss(A)表示A模型的累積損失值,loss(B)表示B模型的累積損失值,p表示向前預(yù)測的個(gè)數(shù),為第t天A與B模型損失函數(shù)的差值。則模型的原假設(shè)為
DM統(tǒng)計(jì)量的構(gòu)造如下:(16)
公式(16)中的表示的標(biāo)準(zhǔn)差的一致性估計(jì)值,由異方差和自相關(guān)一致(HAC)(Newey和West,1987)的標(biāo)準(zhǔn)誤差計(jì)算得到。當(dāng)統(tǒng)計(jì)值小于臨界值時(shí),則顯著,拒絕原假設(shè)。(10%、5%的顯著性水平臨界值分別是-1.28、-1.65)
四、實(shí)證分析
(一)數(shù)據(jù)來源和實(shí)證步驟
本文先從RESSET/DB(高頻數(shù)據(jù)庫)中下載了2013-2018年滬深300指數(shù)等9個(gè)指數(shù)集的實(shí)時(shí)成交價(jià)(頻率為5分鐘、10分鐘、15分鐘),再從RESSET/DB(低頻數(shù)據(jù)庫)中下載了相應(yīng)的交易日收盤價(jià)。
首先獲取各指數(shù)2013-2018年高頻條件下的交易價(jià)格,通過每日的高頻數(shù)據(jù)集和RV計(jì)算公式可以得出每日已實(shí)現(xiàn)測度,最后匯成所有年份已實(shí)現(xiàn)測度集。然后把已實(shí)現(xiàn)測度集分成兩部分,前一部分作為樣本內(nèi)數(shù)據(jù),后一部分作為樣本外數(shù)據(jù)。樣本內(nèi)數(shù)據(jù)進(jìn)行參數(shù)擬合,即帶入高斯擬似然函數(shù),通過求似然函數(shù)的最大值,可以得出各個(gè)模型的待估參數(shù)值,GARCH1模型中包括三個(gè)參數(shù)();GARCH2模型中包括兩個(gè)參數(shù)();HEAVY1模型中包括六個(gè)參數(shù)(ω,α,β,,,);HEAVY2模型中包括四個(gè)參數(shù)(α,β,,);HEAVY3模型中包括四個(gè)參數(shù)(,α,β,)。樣本外數(shù)據(jù)進(jìn)行模型的預(yù)測。以各模型對(duì)5分鐘頻率條件下的上證B股指數(shù)向前一步預(yù)測為例,上證B股指數(shù)的預(yù)測結(jié)果如下圖4-1所示:
圖4-1 上證B股指數(shù)各模型的預(yù)測結(jié)果
由圖4-1可看出5個(gè)模型的波動(dòng)率預(yù)測效果很接近,分辨不出哪個(gè)模型好,因此,需要損失函數(shù)模型判斷模型的優(yōu)劣,需要Diebold-Mariano檢驗(yàn)統(tǒng)計(jì)量確定模型的優(yōu)劣程度。
將各個(gè)模型的預(yù)測值帶入損失函數(shù)模型中得出損失函數(shù)值,損失函數(shù)的值越小,預(yù)測模型效果越好(此時(shí)與預(yù)測值相對(duì)應(yīng)的r^2作為真實(shí)值、對(duì)照值)。最后,通過Diebold-Mariano檢驗(yàn)統(tǒng)計(jì)量判斷兩個(gè)模型優(yōu)劣的顯著性水平。
在獲得上述5個(gè)模型的損失值之后,從GARCH模型中找出損失函數(shù)最小值對(duì)應(yīng)的模型代表GARCH模型,同理,HEAVY模型也一樣。匯總了涵蓋滬深兩市代表性的9個(gè)樣本指數(shù)的5分鐘、10分鐘、15分鐘三種交易頻率和向前1步預(yù)測、5步預(yù)測、10步預(yù)測三種預(yù)測幅度的GARCH和HEAVY模型的Diebold-Mariano檢驗(yàn)統(tǒng)計(jì)量。結(jié)果如下表4-1所示:
(二)結(jié)果分析
通過表4-1中的數(shù)據(jù)可以得出以下結(jié)論:一是就顯著性來說,顯著的都是負(fù)數(shù),因此,HEAVY模型比GARCH模型的預(yù)測精度明顯更高、更好。二是就1步預(yù)測來看,大部分值是負(fù)數(shù),除了純滬市指數(shù)的上證綜指和上市A股指數(shù),因此,對(duì)于各指數(shù)向前1步預(yù)測而言,HEAVY模型的預(yù)測效果明顯比GARCH模型更好。三是就5步預(yù)測來說,除了純滬市指數(shù)的上證綜指、上證A股和上證B股,剩余指數(shù)的DM統(tǒng)計(jì)值幾乎都是負(fù)數(shù)。因此整體來看,還不能確定兩個(gè)模型中哪個(gè)模型更好。但是分開來看,純滬市指數(shù)向前5步預(yù)測,GARCH模型預(yù)測更好,除了純滬市指數(shù)外其他指數(shù),HEAVY模型預(yù)測效果更好。四是就10步預(yù)測來說,絕大部分的DM統(tǒng)計(jì)值都為負(fù)數(shù),除了上證B股指數(shù)(不顯著)。因此,對(duì)于各指數(shù)向前10步預(yù)測而言,HEAVY模型的預(yù)測效果明顯比GARCH模型更好,且顯著。五是從交易頻率來看,標(biāo)記“*”的統(tǒng)計(jì)值,大部分處在頻率為10分鐘和15分鐘,僅滬深300指數(shù)的5分鐘、10步預(yù)測的統(tǒng)計(jì)值達(dá)到“*”水平。因此,頻率為10分鐘和15分鐘的HEAVY模型比GARCH模型更加精確,更加顯著。六是通過純滬市指數(shù)的上證綜指、上證A股指數(shù)和上證B股指數(shù)的DM統(tǒng)計(jì)值來看,暫時(shí)還分辨不出兩類模型的優(yōu)劣,因?yàn)榻y(tǒng)計(jì)值有正、有負(fù),沒有規(guī)律。
五、總結(jié)與建議
(一)總結(jié)
本文通過兩類波動(dòng)率預(yù)測模型GARCH模型(兩種)與HEAVY模型(三種)對(duì)滬深兩市具有代表性的9種指數(shù)進(jìn)行建模分析。文章中另外兩個(gè)維度分別是交易頻率和預(yù)測步長,是為了更好地從縱向和橫向?qū)Ρ鹊贸龈鱾€(gè)模型的優(yōu)劣。本文用前三年的數(shù)據(jù)預(yù)測后三年的波動(dòng)率,再和代替真實(shí)波動(dòng)率的r^2進(jìn)行比較,確定損失值。在參數(shù)估計(jì)和預(yù)測過程中,先通過RV公式計(jì)算出已實(shí)現(xiàn)測度集,分成樣本內(nèi)和樣本外兩部分,樣本內(nèi)數(shù)據(jù)用于參數(shù)估計(jì),樣本外數(shù)據(jù)用于波動(dòng)率預(yù)測。然后將各個(gè)模型得出的預(yù)測值帶入損失函數(shù)方程中,得出累積損失值。最后通過Diebold-Mariano檢驗(yàn)統(tǒng)計(jì)量的正負(fù)值判斷兩類模型預(yù)測精度的優(yōu)劣,通過顯著性水平判斷,確定某個(gè)模型是否比另一個(gè)模型預(yù)測效果明顯要好。主要結(jié)果就是由表4-1得出的6條結(jié)論,整體而言,HEAVY模型比GARCH模型的預(yù)測精度更高,尤其是在10步預(yù)測,10分鐘或15分鐘的頻率下更加顯著,預(yù)測效果更好。
(二)建議
由表4-1可知,除了最后三個(gè)純滬市指數(shù)之外,其他所有指數(shù)的DM統(tǒng)計(jì)量幾乎都是負(fù)值,可以表明HEAVY模型是優(yōu)于GARCH模型的,呈現(xiàn)顯著性的地方更能說明這一點(diǎn)??墒?,通過最后三個(gè)指數(shù)還得不出哪類模型效果好,在不同的維度下,各有各的薄弱優(yōu)勢,因?yàn)閹缀醵疾伙@著。建議:對(duì)于證券投資者和風(fēng)險(xiǎn)投資者而言,若是目標(biāo)對(duì)象是非純滬市指數(shù)標(biāo)的組合(即上證指數(shù)),則使用HEAVY模型進(jìn)行指數(shù)波動(dòng)率預(yù)測比GARCH模型效果更好,且很明顯,無論處在何種維度條件下,這個(gè)結(jié)論幾乎都成立。改進(jìn)方向:一是擴(kuò)大指數(shù)范圍,再加入滬深兩市、科創(chuàng)板、創(chuàng)業(yè)板、中小板等比較有代表性的指數(shù)進(jìn)行波動(dòng)率預(yù)測。二是擴(kuò)大頻率范圍,再引入20分鐘和30分鐘交易頻率的數(shù)據(jù)。三是加大預(yù)測步數(shù),由于預(yù)測步數(shù)越長,損失值越大,預(yù)測越不精確,因此只增加一種向前22步預(yù)測即可。四是進(jìn)行數(shù)據(jù)清理,對(duì)發(fā)現(xiàn)極端值的情況下,進(jìn)行閾值約束。
參考文獻(xiàn):
[1]AndersenTG,BollerslevT.Answeringtheskeptics:Yes,standardvolatilitymodelsdoprovideaccurateforecasts[J].Internationaleconomicreview,1998,39(4):885-905.
[2]AndersenTG,BollerslevT,DieboldFX,etal.Thedistributionofrealizedexchangeratevolatility[J].JournaloftheAmericanstatisticalassociation,2001,96(453):42-55.
[3]AndersenTG,BollerslevT,DieboldFX,etal.Modelingandforecastingrealizedvolatility[J].Econometrica,2003,71(2):579-625.
[4]BollerslevT.Generalizedautoregressiveconditionalheteroscedasticity[J].Journalofeconometrics,1986,31(3):307-327.
[5]BollerslevT.GlossarytoARCH(GARCH),InT.Bollerslev,J.Russell,andM.Watson(eds.),VolatilityandTimeSeriesEconometrics:EssaysinHonorofRobertEngle.2020,oxfordUniversityPress.
[6]BarndorffNielsenOE,ShephardN.Econometricanalysisofrealizedvolatilityanditsuseinestimatingstochasticvolatilitymodels[J].JournaloftheRoyalStatisticalSociety:SeriesB(StatisticalMethodology),2002,64(2):253-280.
[7]CorsiF.Asimpleapproximatelongmemorymodelofrealizedvolatility[J].JournalofFinancialEconometrics,2009,7(2):174-196.
[8]Dieblod,F(xiàn).,andR.Mariano.1995.ComparingPredictiveAccuracy.JournalofBusinessandEconomicStatistics,vol.13,253-265.
[9]EngleRF.AutoregressiveconditionalheteroscedasticitywithestimatesofthevarianceofUnitedKingdominflation[J].Econometrica:JournaloftheEconometricSociety,1982:987-1007.
[10]Engle,R.F.andT.Bollerslev.ModelingthePersistenceofConditionalVariances[J].EconometricReviews,1986,5,1-50.
[11]Engle,R.F.2002.NewfrontiersforARCHmodels.journalofAppliedEconometrics17:425-446.
[12]EngleRF,GalloGM.Amultipleindicatorsmodelforvolatilityusingintra-dailydata[J].JournalofEconometrics,2006,131(1):3-27.
[13]Newey,WandK.West.1987.ASimple,PositiveSemi-Definite,HeteroskedasticityandAutocorrelationConsistentCovarianceMatrix.Econometrica,vol.55,703–708.
[14]ShephardN,SheppardK.Realisingthefuture:forecastingwithhigh-frequency-based volatility(HEAVY)models[J].JournalofAppliedEconometrics,2010,25(2):197-231.
作者單位:首都經(jīng)濟(jì)貿(mào)易大學(xué)