張玉鵬,洪永淼
1 華東師范大學(xué) 金融與統(tǒng)計(jì)學(xué)院,上海 200241 2 廈門大學(xué) 王亞南經(jīng)濟(jì)研究院,廈門 361005
基于廣義譜和MCS檢驗(yàn)的VaR模型預(yù)測績效評估
張玉鵬1,洪永淼2
1 華東師范大學(xué) 金融與統(tǒng)計(jì)學(xué)院,上海 200241 2 廈門大學(xué) 王亞南經(jīng)濟(jì)研究院,廈門 361005
條件VaR模型的正確設(shè)定檢驗(yàn)等價(jià)于檢驗(yàn)均值化的“撞擊序列”是否服從鞅差分序列,然而通常的反饋檢驗(yàn)方法只檢驗(yàn)了該序列的部分性質(zhì)。采用對該鞅差分性質(zhì)進(jìn)行直接檢驗(yàn)的廣義譜檢驗(yàn)方法,全面考察中國股票市場(香港恒生指數(shù)、上證綜合指數(shù)和臺灣加權(quán)指數(shù))上各參數(shù)、非參數(shù)和半?yún)?shù)共22個VaR模型在采用滾動窗口預(yù)測機(jī)制時(shí)的樣本外預(yù)測績效。鑒于條件VaR模型正確設(shè)定檢驗(yàn)無法反映超過某VaR水平的尾部風(fēng)險(xiǎn)信息,為避免極端損失的發(fā)生以及增加結(jié)果的穩(wěn)健性,同時(shí)采用模型置信集檢驗(yàn)方法。研究結(jié)果表明,采用通常的反饋檢驗(yàn)方法常會得出錯誤的結(jié)論;在1%和5%置信水平,與歷史模擬法、極值理論模型、CAViaR模型和CARE模型相比,誤差項(xiàng)為t分布的GARCH模型族在金融危機(jī)期間具有較好的樣本外預(yù)測績效;漲跌停板制度對于選取預(yù)測績效最優(yōu)的VaR模型具有重要影響。
VaR模型;預(yù)測績效;漲跌停板制度;廣義譜檢驗(yàn);MCS檢驗(yàn)
始于2007年的國際金融危機(jī)再次引發(fā)人們對于金融風(fēng)險(xiǎn)管理問題的關(guān)注,其中一個關(guān)鍵問題是政府監(jiān)管部門和金融機(jī)構(gòu)能否準(zhǔn)確有效地測度金融風(fēng)險(xiǎn)。風(fēng)險(xiǎn)價(jià)值(value-at-risk, VaR)模型自被引入風(fēng)險(xiǎn)管理領(lǐng)域以來,因其直觀、易計(jì)算的特點(diǎn),已成為金融市場風(fēng)險(xiǎn)測量的主流方法。根據(jù)是否假設(shè)資產(chǎn)收益率的概率分布函數(shù),VaR模型可分成參數(shù)、半?yún)?shù)和非參數(shù)3類方法,3類方法從不同的側(cè)面對VaR進(jìn)行建模,各類模型相互補(bǔ)充。在實(shí)際應(yīng)用時(shí),若采用單一的VaR模型測度金融風(fēng)險(xiǎn)會產(chǎn)生模型風(fēng)險(xiǎn),并可能導(dǎo)致嚴(yán)重的經(jīng)濟(jì)損失。因此,選取科學(xué)嚴(yán)謹(jǐn)?shù)腣aR模型預(yù)測評估方法,準(zhǔn)確評價(jià)各VaR模型在不同資產(chǎn)組合中的樣本外預(yù)測績效,對于政府監(jiān)管部門和金融機(jī)構(gòu)有效地測度金融風(fēng)險(xiǎn)具有重要的實(shí)踐意義。
對各VaR模型的預(yù)測績效進(jìn)行評估,國內(nèi)外學(xué)者進(jìn)行了深入的研究。一些學(xué)者研究發(fā)現(xiàn)基于GARCH模型的參數(shù)化VaR模型具有最優(yōu)的樣本外預(yù)測績效[1-3]。還有學(xué)者認(rèn)為半?yún)?shù)VaR模型具有最優(yōu)的樣本外預(yù)測績效,如基于極值理論的半?yún)?shù)VaR模型[4-5]、半?yún)?shù)CAViaR模型[6-7]、半?yún)?shù)CARE模型[8-9]、基于濾波歷史模擬法的半?yún)?shù)VaR模型[10-11]。對比這些研究可發(fā)現(xiàn),在評估VaR模型的樣本外預(yù)測績效時(shí),關(guān)于何種模型具有最優(yōu)的樣本外預(yù)測績效這一問題,學(xué)術(shù)界尚未形成一致性的結(jié)論,導(dǎo)致其結(jié)論差異性的主要原因在于研究者們選取了不同的樣本數(shù)據(jù)、不同的VaR模型估計(jì)方法以及不同的VaR模型預(yù)測評估方法。實(shí)際應(yīng)用時(shí),研究者?;谄溲芯康木唧w目標(biāo)而選擇不同的樣本數(shù)據(jù),因此由數(shù)據(jù)問題導(dǎo)致的實(shí)證結(jié)論不同是其研究目標(biāo)差異性的必然結(jié)果。但重要的是,當(dāng)根據(jù)研究目標(biāo)確定了樣本數(shù)據(jù)后,研究者能否采用科學(xué)嚴(yán)謹(jǐn)?shù)腣aR模型預(yù)測評估方法從廣泛的VaR模型估計(jì)方法集合中選取最優(yōu)的VaR預(yù)測模型。
由于已有研究采用VaR模型預(yù)測評估方法存在如下3個理論缺陷,會使研究者從VaR備擇模型集合中選取錯誤的最優(yōu)VaR預(yù)測模型。①已有研究采用的反饋檢驗(yàn)方法,如Kupiec[12]的似然比(likelihood ratio,LR)檢驗(yàn)、Christoffersen[13]的LR檢驗(yàn)和Engle等[14]的動態(tài)分位數(shù)(dynamic quantile, DQ)檢驗(yàn),都只檢驗(yàn)條件VaR模型正確設(shè)定內(nèi)涵的部分性質(zhì)。根據(jù)Berkowitz等[15]的結(jié)論,條件VaR模型的正確設(shè)定檢驗(yàn)等價(jià)于檢驗(yàn)均值化的“撞擊序列”是否服從鞅差分序列。Christoffersen[13]的LR檢驗(yàn)事先假定均值化的“撞擊序列”服從一階馬爾科夫過程,因而無法檢驗(yàn)均值化“撞擊序列”的高階相依性質(zhì)。Engle等[14]的DQ檢驗(yàn)將均值化“撞擊序列”對常數(shù)項(xiàng)、因變量的滯后項(xiàng)以及當(dāng)期VaR預(yù)測值進(jìn)行線性回歸,然后檢驗(yàn)回歸系數(shù)的聯(lián)合顯著性,其不足之處是僅檢驗(yàn)了均值化“撞擊序列”滯后階數(shù)有限情形以及因變量與解釋變量之間的一階序列相關(guān)性。由于上述方法只檢驗(yàn)了均值化“撞擊序列”的部分性質(zhì),這將導(dǎo)致相應(yīng)檢驗(yàn)具有較差的勢績效,即不能正確檢測出錯誤的VaR預(yù)測模型。②上述反饋檢驗(yàn)方法都沒有考慮參數(shù)估計(jì)效應(yīng)對檢驗(yàn)統(tǒng)計(jì)量的影響,由于均值化“撞擊序列”中存在未知參數(shù),為構(gòu)建檢驗(yàn)統(tǒng)計(jì)量,需要用參數(shù)估計(jì)值代替未知參數(shù),此時(shí)參數(shù)估計(jì)效應(yīng)將導(dǎo)致均值化“撞擊序列”不再服從鞅差分序列,忽略參數(shù)估計(jì)效應(yīng)將導(dǎo)致相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量具有較差的水平績效,即可能會拒絕真實(shí)的VaR預(yù)測模型。③Abad等[2]采用的損失函數(shù)法和Bao等[1]采用的Hansen[16]超預(yù)測能力(superior predictive ability, SPA)檢驗(yàn)屬于VaR模型多元預(yù)測評估方法,對模型進(jìn)行兩兩比較的損失函數(shù)法并不適合VaR模型集較大的情形,通過該方法選擇最優(yōu)模型會存在“數(shù)據(jù)挖掘”的問題。Bao等[1]采用的SPA檢驗(yàn)需要事先確定基準(zhǔn)模型,實(shí)際應(yīng)用時(shí),如果將模型集合中的所有模型依次選為基準(zhǔn)模型進(jìn)行模型評價(jià)會違背SPA檢驗(yàn)解決“數(shù)據(jù)挖掘”問題的初衷。
為克服國內(nèi)外研究中VaR模型預(yù)測評估方法的不足,本研究進(jìn)行如下兩方面擴(kuò)展。①本研究采用Hong等[17]的廣義譜檢驗(yàn)考察條件VaR模型的正確設(shè)定內(nèi)涵。區(qū)別于Berkowitz等[15]的譜檢驗(yàn)方法,Hong等[17]的廣義譜檢驗(yàn)是對均值化“撞擊序列”鞅差分序列性質(zhì)的直接檢驗(yàn),該檢驗(yàn)充分利用樣本數(shù)據(jù)中的條件信息,而且明確考慮參數(shù)估計(jì)效應(yīng)對檢驗(yàn)統(tǒng)計(jì)量的影響。因此,與其他的反饋檢驗(yàn)方法相比,廣義譜方法具有較好的水平績效和勢績效,本研究的實(shí)證結(jié)果進(jìn)一步驗(yàn)證了廣義譜檢驗(yàn)對VaR模型選擇的優(yōu)越性。②由于所有的條件VaR模型正確設(shè)定檢驗(yàn)僅關(guān)注收益率分布的某個分位點(diǎn)(如1%或5%),無法反映超過分位點(diǎn)的尾部風(fēng)險(xiǎn)信息,在實(shí)際應(yīng)用時(shí)可能存在多個具有不同尾部風(fēng)險(xiǎn)的VaR模型通過該檢驗(yàn)。為避免極端損失的發(fā)生以及增加結(jié)果的穩(wěn)健性,本研究采用Hansen等[18]的模型置信集(model confidence set, MCS)預(yù)測檢驗(yàn)方法。為將MCS檢驗(yàn)應(yīng)用于VaR模型的預(yù)測績效評估,研究者須事先設(shè)定損失函數(shù),本研究同時(shí)考慮Koenker等[19]的非對稱線性損失函數(shù)和Lopez[20]的幅度損失函數(shù)。與Hansen[16]的SPA檢驗(yàn)相比,MCS檢驗(yàn)不需要預(yù)先設(shè)定一個基準(zhǔn)模型,并且MCS檢驗(yàn)給出了VaR模型集合中未被其他模型顯著超越的全部集合特征。
為測度中國大陸股票市場的成熟度以及漲跌停板制度對股票市場風(fēng)險(xiǎn)特征的影響,基于本研究構(gòu)建的VaR模型預(yù)測評估方法,選取包含2007年至2010年國際金融危機(jī)時(shí)期的上證綜指、香港恒生指數(shù)和臺灣加權(quán)指數(shù)數(shù)據(jù),全面考察金融危機(jī)期間各參數(shù)法、半?yún)?shù)法和非參數(shù)法VaR模型(具體包括歷史模擬法、濾波歷史模擬法、GARCH模型、極值理論模型、CAViaR和CARE模型,共22個模型)在采用滾動窗口預(yù)測機(jī)制時(shí)的樣本外預(yù)測績效。本研究選取國際金融危機(jī)時(shí)期為預(yù)測區(qū)間,主要考慮到金融危機(jī)為考察大陸股市的成熟度提供了絕佳的試驗(yàn)場(對大陸以及成熟的香港和臺灣股市而言,國際金融危機(jī)沖擊都來自外部且其影響較大),且漲跌停板制度(樣本期間大陸和臺灣的漲跌幅限制分別為10%和7%,而香港不實(shí)行漲跌停板制度)對股市風(fēng)險(xiǎn)特征的影響在金融危機(jī)期間可能會表現(xiàn)的更加明顯。
選擇合適的VaR模型對于風(fēng)險(xiǎn)管理者而言是十分重要的工作,只有當(dāng)VaR模型能準(zhǔn)確地預(yù)測風(fēng)險(xiǎn),該模型才是有用的。對VaR模型的預(yù)測績效評估主要包括樣本內(nèi)和樣本外方法,從VaR方法的最終目標(biāo)看,樣本外預(yù)測績效的優(yōu)劣是評價(jià)一個VaR模型是否合理的標(biāo)準(zhǔn)。為了評估各VaR模型的樣本外預(yù)測績效,本研究將T個樣本觀測值分為R個樣本內(nèi)數(shù)據(jù)和P個樣本外數(shù)據(jù),并且使用滾動窗口預(yù)測機(jī)制估計(jì)模型參數(shù),VaR模型的預(yù)測評估主要基于其樣本外向前一步預(yù)測能力。下面具體介紹Hong等[17]的廣義譜檢驗(yàn)和Hansen等[18]的MCS預(yù)測檢驗(yàn)。
假設(shè)收益率序列{Yt}為嚴(yán)格平穩(wěn)的時(shí)間序列過程,t為時(shí)間,其真實(shí)條件分位數(shù)VaRt(α)可表示為
Prob(Yt (1) 為了檢驗(yàn)H0是否成立,Hong等[17]提出了條件VaR模型正確設(shè)定的廣義譜檢驗(yàn)。該方法充分利用樣本中的數(shù)據(jù)信息,并且考慮了參數(shù)估計(jì)效應(yīng)對檢驗(yàn)統(tǒng)計(jì)量的影響。因而,與其他VaR模型正確設(shè)定檢驗(yàn)方法相比,廣義譜檢驗(yàn)更為有效。具體地,其檢驗(yàn)統(tǒng)計(jì)量可表示為 (2) (3) (4) (5) Hansen等[18]的MCS預(yù)測檢驗(yàn)依賴于損失函數(shù)的準(zhǔn)確選擇。本研究將同時(shí)考慮Koenker等[19]的非對稱線性損失函數(shù)(TLoss)和Lopez[20]的幅度損失函數(shù)(QLoss)。Koenker等[19]的非對稱線性損失函數(shù)為 (6) Lopez[20]的幅度損失函數(shù)為 (7) 區(qū)別于Koenker等[19]的非對稱線性損失函數(shù),幅度損失函數(shù)既考慮了損失發(fā)生的次數(shù),又考慮了極端尾部事件的幅度,因而該損失函數(shù)更符合經(jīng)濟(jì)學(xué)意義。Lopez[20]的模擬結(jié)果表明幅度損失函數(shù)能夠較好地識別最適合的VaR模型。 MCS預(yù)測檢驗(yàn)的主要思想是:考慮一個包含了m0個VaR模型的集合M0,根據(jù)損失函數(shù)的選擇,模型m在t時(shí)刻的損失定義為Lm,t。對于所有的m∈M0,n∈M0,定義相對預(yù)測績效變量為dmn,t,dmn,t≡Lm,t-Ln,t。對集合M0中的所有模型進(jìn)行等預(yù)測能力檢驗(yàn),即 H0:E(dmn,t)=0m∈M0,n∈M0 (8) 在金融計(jì)量中,常常假設(shè)收益率序列{Yt}滿足如下的波動形式:Yt=μt+σtεt,μt為Yt的條件均值,σt為Yt的方差函數(shù),εt為滿足獨(dú)立同分布性質(zhì)的誤差項(xiàng),服從均值為0、方差為1的標(biāo)準(zhǔn)化概率密度函數(shù)fε(·;λ),λ為密度函數(shù)中的參數(shù)向量?;趖時(shí)刻的信息,向前一步的VaR預(yù)測值可表示為 (9) GARCH模型族是最具代表性的VaR模型參數(shù)估計(jì)方法。為了刻畫收益率序列{Yt}的序列自相關(guān)性,假設(shè)μt=ρYt-1,ρ為自回歸參數(shù)。本研究采用滾動窗口預(yù)測機(jī)制,對于每個滾動窗口,首先對收益率序列進(jìn)行零均值化處理,因此沒有對條件均值部分設(shè)定常數(shù)項(xiàng)。為刻畫收益率序列的波動聚類效應(yīng)以及波動的非對稱性,本研究采用GARCH(1,1)模型、Glosten等[21]的GJR-GARCH(1,1)模型和Sentana[22]的Q-GARCH(1,1)模型。Chen等[6]和Sener等[23]研究發(fā)現(xiàn),與對稱GARCH模型相比,基于非對稱GARCH模型得到的VaR估計(jì)值具有更好的樣本外預(yù)測績效??紤]到收益率序列的非正態(tài)分布特點(diǎn),本研究考慮3種概率密度函數(shù)fε,即標(biāo)準(zhǔn)正態(tài)分布、t分布和廣義非對稱t分布。Abad等[2]和Polanski等[24]研究發(fā)現(xiàn),與正態(tài)分布相比,基于尖峰厚尾性質(zhì)的t分布函數(shù)所構(gòu)建的VaR估計(jì)值具有更好的預(yù)測績效。Cheng等[25]和Polanski等[24]的研究進(jìn)一步發(fā)現(xiàn),刻畫收益率序列的偏態(tài)性質(zhì)對于VaR的準(zhǔn)確估計(jì)也十分重要。具體地,本研究考慮GARCH-N、GARCH-T、GJRGARCH-N、GJRGARCH-T、QGARCH-N、QGARCH-T和GARCH-GAT模型,這里GARCH、GJRGARCH和QGARCH分別表示收益率條件均值和方差函數(shù)服從AR(1)-GARCH(1,1)模型、AR(1)-GJR-GARCH(1,1)模型和AR(1)-Q-GARCH(1,1)模型,N、T和GAT表示各模型的誤差項(xiàng)分別服從標(biāo)準(zhǔn)正態(tài)分布、t分布和廣義非對稱t分布(此分布函數(shù)可刻畫收益率序列的偏態(tài)性質(zhì))。 歷史模擬法(HS)用資產(chǎn)組合收益率數(shù)據(jù)的樣本分位數(shù)估計(jì)VaR值,該方法計(jì)算較為簡單。后續(xù)研究中,學(xué)者們對HS進(jìn)行了各種改進(jìn),以使其更好地估計(jì)VaR值,其中表現(xiàn)最優(yōu)異的是濾波歷時(shí)模擬法(FHS)。Angelidis等[10]、Kuester等[4]和Marimoutou等[11]研究發(fā)現(xiàn),與其他VaR估計(jì)方法相比,基于FHS得到的VaR估計(jì)值具有較好的樣本外預(yù)測績效。 Yt=ρYt-1+σtεt t=1,2,… (10) 極值理論主要關(guān)注收益率尾部值的分布,而不必通過直接用于估計(jì)整個收益率的分布來推斷尾部值,因此通過極值理論對VaR進(jìn)行估計(jì)可以很好地揭示出收益率數(shù)據(jù)在極端狀況下風(fēng)險(xiǎn)的大小。本研究采用對數(shù)據(jù)量要求較少且能有效使用有限極端觀察值的POT模型估計(jì)VaR,具體模型介紹參考Bao等[1]的研究。 Engle等[14]把分位數(shù)回歸模型思想應(yīng)用于求解VaR,提出條件分位數(shù)自回歸VaR,即CAViaR模型。其主要思想是將研究的問題由對收益率分布的研究轉(zhuǎn)為直接對分位數(shù)的研究,與GARCH模型的建模方法類似,他們用自回歸的方法確定分位數(shù)隨時(shí)間的變化規(guī)律。具體地,考慮如下4個模型。 (1)對稱絕對值模型(CAViaRSymAbs) Qt(α)=δ0+δ1Qt-1(α)+δ2|Yt-1| (11) (2)非對稱模型(CAViaRAsymSlope) Qt(α)=δ0+δ1Qt-1(α)+δ2max[Yt-1,0]+ δ3max[-Yt-1,0] (12) (3)間接GARCH(1,1)模型(CAViaRIndGARCH) Qt(α)=[1-2I(α<0.500)][δ0+δ1Qt-1(α)2+ (13) (4)間接AR(1)-GARCH(1,1)模型(CAViaRIndARGARCH) Qt(α)=aYt-1+[1-2I(α<0.500)]· {δ0+δ1[Qt-1(α)+aYt-2]2+ (14) 其中,(δ0,δ1,δ2,δ3,a)為未知參數(shù)向量。 為估計(jì)CAViaR模型中的未知參數(shù),可采用Koenker等[19]提出的分位數(shù)回歸方法,即 (15) 基于分位數(shù)VaR方法(如CAViaR)的一個不合意性質(zhì)就是它對極端損失的大小不敏感,無法反映超過分位點(diǎn)的尾部風(fēng)險(xiǎn),因而基于分位數(shù)的VaR方法會使人們忽略了小概率的巨額損失情形甚至是金融危機(jī)事件。Newey等[27]定義的expectile能夠很好地解決這一問題,與分位數(shù)相比,expectile能夠更好地反映不同收益率整體分布函數(shù)的差異?;趀xpectile概念,Taylor[8]和Kuan等[28]提出了形式類似的CARE模型。 與CAViaR模型相對應(yīng),考慮如下4個CARE模型。 (1)對稱絕對值模型(CARESymAbs) vt(τ)=φ0+φ1vt-1(τ)+φ2|Yt-1| (16) (2)非對稱模型(CAREAsymSlope) vt(τ)=φ0+φ1vt-1(τ)+φ2max[Yt-1,0]+ φ3max[-Yt-1,0) (17) (3)間接GARCH(1,1)模型(CAREIndGARCH) vt(τ)=[1-2I(τ<0.500)]· (18) (4)間接AR(1)-GARCH(1,1)模型(CAREIndARGARCH) vt(τ)=bYt-1+[1-2I(τ<0.500)]{φ0+ φ1[vt-1(τ)+bYt-2]2+ (19) 其中,(φ0,φ1,φ2,φ3,b)為未知參數(shù)向量。 為估計(jì)CARE模型中的未知參數(shù),本研究采用Newey等[27]提出的非對稱最小二乘法,即 本研究的數(shù)據(jù)樣本區(qū)間選取及其區(qū)間劃分方法主要基于兩點(diǎn)考慮。首先,國際金融危機(jī)為考察大陸股市成熟度提供了絕佳的試驗(yàn)場?;诒狙芯康臉颖緝?nèi)和樣本外區(qū)間劃分標(biāo)準(zhǔn),上證綜指、香港恒生指數(shù)和臺灣加權(quán)指數(shù)的預(yù)測區(qū)間分別始于2006年11月22日、2006年12月11日和2006年12月26日,在這些時(shí)間點(diǎn)始于2007年的國際金融危機(jī)尚未發(fā)生。通過綜合比較2007年至2010年國際金融危機(jī)期間大陸股票市場與香港、臺灣成熟股票市場的風(fēng)險(xiǎn)特征,可在一定程度上說明大陸股票市場的發(fā)展程度。其次,中國大陸、香港和臺灣實(shí)行的是不同的漲跌停板制度,大陸和臺灣的漲跌幅限制分別為10%和7%,而香港不實(shí)行漲跌停板制度。因而,本研究的樣本區(qū)間劃分有利于分析國際金融危機(jī)期間不同漲跌停板制度對中國各股票市場風(fēng)險(xiǎn)特征的差異性影響,即在金融危機(jī)期間,相對于大陸和臺灣股票市場,不實(shí)行漲跌停板制度的香港股票市場是否更有可能發(fā)生極端損失。 表1給出了所有股指日收益率在樣本內(nèi)和樣本外區(qū)間的基本統(tǒng)計(jì)特征。①上證綜指、香港恒生指數(shù)和臺灣加權(quán)指數(shù)都有正的平均收益,上證綜指和恒生指數(shù)的平均收益明顯高于臺灣加權(quán)指數(shù)。②無論是在樣本內(nèi)區(qū)間還是在樣本外區(qū)間,相對于上證綜指和臺灣加權(quán)指數(shù),香港恒生指數(shù)都具有更小的最小值,說明不實(shí)行漲跌停板制度的香港股市更有可能發(fā)生極端損失風(fēng)險(xiǎn)。③上證綜指和香港恒生指數(shù)具有大小和趨勢基本相同的樣本內(nèi)和樣本外標(biāo)準(zhǔn)差,而臺灣加權(quán)指數(shù)的標(biāo)準(zhǔn)差則相對穩(wěn)定。這在一定程度上說明,相對于大陸與臺灣股票市場的聯(lián)動性,大陸與香港股票市場的聯(lián)動性更強(qiáng)。④樣本外區(qū)間各股指收益率的偏度都不為0,上證綜指和臺灣加權(quán)指數(shù)的偏度為負(fù),而香港恒生指數(shù)的偏度為正。說明金融危機(jī)期間香港恒生指數(shù)的主體集中在分布函數(shù)的左側(cè),而上證綜指和臺灣加權(quán)指數(shù)的主體集中在分布函數(shù)的右側(cè),因而不實(shí)行漲跌停板制度的香港股市在金融危機(jī)期間會有更大的概率發(fā)生極端損失風(fēng)險(xiǎn)。⑤樣本外區(qū)間,香港恒生指數(shù)比上證綜指和臺灣加權(quán)指數(shù)具有更高的峰度,同樣說明無漲跌停板制度的香港股市在金融危機(jī)期間會產(chǎn)生更為極端的尾部風(fēng)險(xiǎn)(峰度更高,兩端的尾部更厚,也就是極值更多)。⑥所有的收益率序列都有顯著的一階和二階序列自相關(guān),表明所有收益率序列存在明顯的序列自相關(guān)和波動聚類效應(yīng)。 表1 收益率序列的描述性統(tǒng)計(jì)Table 1 The Descriptive Statistics of the Return Series 注:JB統(tǒng)計(jì)量為Jarque-Bera正態(tài)性檢驗(yàn);LB(m1)和LB2(m1)為收益率序列和其平方序列滯后m1期的Ljung-Box檢驗(yàn)統(tǒng)計(jì)量;*為相應(yīng)檢驗(yàn)統(tǒng)計(jì)量在10%的顯著性水平下顯著,**為相應(yīng)檢驗(yàn)統(tǒng)計(jì)量在5%的顯著性水平下顯著,***為相應(yīng)檢驗(yàn)統(tǒng)計(jì)量在1%的顯著性水平下顯著。 5.2.1 在1%置信水平下VaR模型的預(yù)測績效評估 由表2可知,對于上證綜指,當(dāng)考慮HWZ檢驗(yàn)時(shí),根據(jù)其經(jīng)驗(yàn)p值結(jié)果,除GARCH-T、GJRGARCH-T和QGARCH-T模型外,該檢驗(yàn)在10%的顯著性水平下拒絕了所有其他模型;DQ檢驗(yàn)結(jié)果與HWZ檢驗(yàn)一致;LR檢驗(yàn)在10%的顯著性水平下只拒絕了10個模型,該結(jié)果佐證了LR檢驗(yàn)通常具有較差的勢績效。上述條件VaR模型正確設(shè)定檢驗(yàn)結(jié)果表明,為了預(yù)測上證綜指1%置信水平的VaR值,刻畫收益率序列的波動集聚效應(yīng)、波動非對稱性和厚尾性質(zhì)是十分重要的。當(dāng)損失函數(shù)為TLoss時(shí),在10%的顯著性水平下MCS包含所有VaR模型中的21個模型,MCS包含更多模型的主要原因是,TLoss損失函數(shù)并沒有彌補(bǔ)條件VaR正確設(shè)定檢驗(yàn)未能考慮極端尾部風(fēng)險(xiǎn)的不足,因此基于TLoss的MCS預(yù)測檢驗(yàn)不能在HWZ的檢驗(yàn)結(jié)果基礎(chǔ)之上提供額外有價(jià)值的信息;而當(dāng)考慮QLoss時(shí),在10%的顯著性水平下MCS包含3個模型,這3個模型都包含在損失函數(shù)為TLoss時(shí)的MCS中,說明兩個損失函數(shù)的選擇具有一定的合理性,QLoss導(dǎo)致MCS中模型較少的原因是這一損失函數(shù)對極端風(fēng)險(xiǎn)給予了更大的懲罰因子,一定程度上彌補(bǔ)了條件VaR正確設(shè)定檢驗(yàn)未能考慮極端尾部風(fēng)險(xiǎn)的問題。與QLoss所對應(yīng)的MCS中的3個模型就是HWZ檢驗(yàn)在10%的顯著性水平下沒有拒絕的GARCH-T、GJRGARCH-T和QGARCH-T模型,該結(jié)果證實(shí)了Lopez[20]的結(jié)論,即QLoss損失函數(shù)能夠很好地識別正確設(shè)定的VaR模型。根據(jù)SPA檢驗(yàn)結(jié)果,在10%的顯著性水平下,當(dāng)考慮TLoss時(shí),SPA檢驗(yàn)沒有拒絕RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè)(經(jīng)驗(yàn)p值為0.520),且該模型包含在此時(shí)的MCS置信集中;當(dāng)考慮QLoss時(shí),SPA檢驗(yàn)拒絕了RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè)(經(jīng)驗(yàn)p值為0.002),并且該模型也沒有包含在MCS集中。SPA檢驗(yàn)結(jié)果與MCS檢驗(yàn)結(jié)果相一致,這在一定程度上佐證了MCS檢驗(yàn)的合理性。需要強(qiáng)調(diào)的是,在實(shí)際應(yīng)用時(shí),不能采用SPA檢驗(yàn)將備擇模型依次選為基準(zhǔn)模型來進(jìn)行模型評價(jià),這會違背SPA檢驗(yàn)解決“數(shù)據(jù)挖掘”問題的初衷。 對于香港恒生指數(shù),當(dāng)考慮HWZ檢驗(yàn)時(shí),根據(jù)其經(jīng)驗(yàn)p值結(jié)果,除GARCH-T、GJRGARCH-T、QGARCH-T、GARCH-T-EVT、GARCH-GAT-EVT和CARESymAbs模型外,該檢驗(yàn)在10%的顯著性水平下拒絕了所有其他模型;在10%的顯著性水平下,DQ檢驗(yàn)拒絕了廣義譜檢驗(yàn)中統(tǒng)計(jì)上不顯著的QGARCH-T模型,導(dǎo)致該結(jié)果的原因是DQ檢驗(yàn)沒有考慮參數(shù)估計(jì)效應(yīng)對檢驗(yàn)統(tǒng)計(jì)量的影響(即參數(shù)估計(jì)效應(yīng)使均值化的“撞擊序列”不再服從鞅差分序列,可能存在序列相關(guān)性),因而對無序列相關(guān)原假設(shè)的DQ檢驗(yàn)會錯誤拒絕最適合的模型。此外,在10%的顯著性水平下,DQ檢驗(yàn)并沒有拒絕廣義譜檢驗(yàn)中統(tǒng)計(jì)上顯著的CAViaRAsymSlope模型、CAREAsymSlope模型和CAREIndGARCH模型,導(dǎo)致該結(jié)果的原因是DQ檢驗(yàn)僅檢驗(yàn)了均值化“撞擊序列”滯后階數(shù)有限情形以及因變量與解釋變量之間的一階序列相關(guān)性,因而具有較差的勢績效;LR檢驗(yàn)在10%的顯著性水平下只拒絕了3個模型,該結(jié)果佐證了LR檢驗(yàn)通常具有較差的勢績效。鑒于LR檢驗(yàn)和DQ檢驗(yàn)具有較差的有限樣本績效,本研究將采用Hong等[17]的廣義譜檢驗(yàn)結(jié)果。上述條件VaR模型正確設(shè)定檢驗(yàn)結(jié)果表明,為了預(yù)測香港恒生指數(shù)1%置信水平下的VaR值,刻畫收益率序列的波動集聚效應(yīng)、波動非對稱性和厚尾性質(zhì)是重要的,此外極值理論模型和同時(shí)考慮損失概率與損失幅度的CARESymAbs模型也可用來對該指數(shù)1%置信水平下的VaR進(jìn)行建模。當(dāng)損失函數(shù)為TLoss時(shí),在10%的顯著性水平下MCS包含了所有VaR模型中8個模型,這8個模型中包含了HWZ檢驗(yàn)中在10%的顯著性水平下沒有拒絕的6個模型中的GJRGARCH-T、QGARCH-T和CARESymAbs模型;當(dāng)考慮QLoss時(shí),在10%的顯著性水平下MCS包含5個模型,除GARCH-T模型,其余4個模型都包含在損失函數(shù)為TLoss時(shí)的MCS中。與QLoss對應(yīng)的MCS中的5個模型中包含HWZ檢驗(yàn)中在10%的顯著性水平下沒有拒絕的6個模型中的GARCH-T、GJRGARCH-T、QGARCH-T和CARESymAbs模型。根據(jù)SPA檢驗(yàn)結(jié)果,當(dāng)分別考慮QLoss和TLoss時(shí),SPA檢驗(yàn)統(tǒng)計(jì)量的經(jīng)驗(yàn)p值分別為0.026和0.009,在10%的顯著性水平下SPA檢驗(yàn)都拒絕了RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè),且MCS置信集在10%的顯著性水平下都沒有包含RiskMetrics模型,說明SPA檢驗(yàn)結(jié)果與MCS檢驗(yàn)結(jié)果一致,在一定程度上佐證了MCS檢驗(yàn)的合理性。需強(qiáng)調(diào)的是,SPA檢驗(yàn)只能考察單一基準(zhǔn)模型是否比其他備擇模型具有更好的預(yù)測績效。 表2 在1%置信水平下各股指VaR模型的預(yù)測績效評估Table 2 The Predictive Performance Evaluation of Each Stock Index at 1% Level by VaR Model 對于臺灣加權(quán)指數(shù),當(dāng)考慮HWZ檢驗(yàn)時(shí),根據(jù)其經(jīng)驗(yàn)p值結(jié)果,除GJRGARCH-T和QGARCH-T外,該檢驗(yàn)在10%的顯著性水平下拒絕了所有其他模型;在10%的顯著性水平下,DQ檢驗(yàn)并沒有拒絕廣義譜檢驗(yàn)中統(tǒng)計(jì)上顯著的所有CAViaR模型以及CARESymAbs模型和CAREIndARGARCH模型;LR檢驗(yàn)也只拒絕了10個模型,該實(shí)證結(jié)果佐證了DQ檢驗(yàn)和LR檢驗(yàn)通常具有較差的勢績效。上述條件VaR正確設(shè)定檢驗(yàn)結(jié)果表明,為了預(yù)測臺灣加權(quán)指數(shù)1%置信水平下的VaR值,刻畫收益率序列的波動集聚效應(yīng)、波動的非對稱性和厚尾性質(zhì)是十分重要的。當(dāng)損失函數(shù)為TLoss時(shí),在10%的顯著性水平下MCS包含所有VaR模型中的12個模型;而當(dāng)考慮QLoss時(shí),在10%的顯著性水平下MCS包含2個模型,且這2個模型都包含在損失函數(shù)為TLoss時(shí)的MCS中。與QLoss所對應(yīng)的MCS中的2個模型就是HWZ檢驗(yàn)在10%的顯著性水平下沒有拒絕的GJRGARCH-T和QGARCH-T模型。根據(jù)SPA檢驗(yàn)結(jié)果,當(dāng)分別考慮QLoss和TLoss時(shí),SPA檢驗(yàn)統(tǒng)計(jì)量的經(jīng)驗(yàn)p值分別為0.000和0.091,SPA檢驗(yàn)在10%的顯著性水平下都拒絕了RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè),并且MCS置信集在10%的顯著性水平下都沒有包含RiskMetrics模型,說明SPA檢驗(yàn)結(jié)果與MCS檢驗(yàn)結(jié)果一致,在一定程度上佐證了MCS檢驗(yàn)的合理性。需強(qiáng)調(diào)的是,SPA檢驗(yàn)只能考察單一基準(zhǔn)模型是否比其他備擇模型具有更好的預(yù)測績效。 5.2.2 在5%置信水平下VaR模型的預(yù)測績效評估 由表3可知,對于上證綜指,當(dāng)考慮HWZ檢驗(yàn)時(shí),根據(jù)其經(jīng)驗(yàn)p值結(jié)果,除GARCH-T、GJRGARCH-T、QGARCH-T、CAREAsymSlope和CAREIndGARCH模型外,該檢驗(yàn)在10%的顯著性水平下拒絕了所有其他模型;在10%的顯著性水平下,DQ檢驗(yàn)并沒有拒絕廣義譜檢驗(yàn)結(jié)果中統(tǒng)計(jì)上顯著的RiskMetrics模型、服從正態(tài)分布的GARCH模型族、所有的CAViaR模型和CARE模型;LR檢驗(yàn)也只拒絕了6個VaR預(yù)測模型,該結(jié)果佐證了DQ檢驗(yàn)和LR檢驗(yàn)通常具有較差的勢績效。上述條件VaR正確設(shè)定檢驗(yàn)結(jié)果表明,為了預(yù)測上證綜指5%置信水平的VaR值,刻畫收益率序列的波動集聚效應(yīng)、波動非對稱性和厚尾性質(zhì)是十分重要的,此外同時(shí)考慮損失概率和損失幅度的半?yún)?shù)模型CAREAsymSlope和CAREIndGARCH模型也可以很好地刻畫該指數(shù)5%置信水平的VaR值。當(dāng)損失函數(shù)為TLoss時(shí),在10%的顯著性水平下MCS包含所有VaR模型中的16個模型,這16個模型中包含HWZ檢驗(yàn)中在10%的顯著性水平下沒有拒絕的全部5個模型。與HWZ檢驗(yàn)結(jié)果相比,基于TLoss的MCS預(yù)測檢驗(yàn)未能提供各VaR模型預(yù)測績效的更多有價(jià)值信息。而當(dāng)考慮QLoss時(shí),在10%的顯著性水平下MCS只包含了2個模型,且這2個模型都包含在損失函數(shù)為TLoss時(shí)的MCS中;與QLoss所對應(yīng)的MCS中的2個模型是HWZ檢驗(yàn)在10%的顯著性水平下沒有拒絕的5個模型中的GARCH-T和GJRGARCH-T模型。根據(jù)SPA檢驗(yàn)結(jié)果,在10%的顯著性水平下,當(dāng)考慮TLoss時(shí),SPA檢驗(yàn)沒有拒絕RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè)(經(jīng)驗(yàn)p值為0.903),且該模型包含在MCS置信集中;當(dāng)考慮QLoss時(shí),SPA檢驗(yàn)拒絕了RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè)(經(jīng)驗(yàn)p值為0.000),并且該模型也沒有包含在MCS集中。SPA檢驗(yàn)結(jié)果與MCS檢驗(yàn)結(jié)果一致,這在一定程度上佐證了MCS檢驗(yàn)的合理性。 對于香港恒生指數(shù),當(dāng)考慮HWZ檢驗(yàn)時(shí),根據(jù)其經(jīng)驗(yàn)p值結(jié)果,除GARCH-T、GJRGARCH-T和QGARCH-T模型外,該檢驗(yàn)在10%的顯著性水平下拒絕了所有其他模型;在10%的顯著性水平下,DQ檢驗(yàn)并沒有拒絕廣義譜檢驗(yàn)結(jié)果中統(tǒng)計(jì)上顯著的GARCH-N模型、QGARCH-N模型、除CAViaRIndARGARCH以外所有其他CAViaR模型、CARESymAbs模型和CAREIndGARCH模型;LR檢驗(yàn)也只拒絕了5個VaR預(yù)測模型。上述條件VaR正確設(shè)定檢驗(yàn)結(jié)果表明,為了預(yù)測香港恒生指數(shù)5%置信水平的VaR值,刻畫收益率序列的波動集聚效應(yīng)、波動的非對稱性和厚尾性質(zhì)是重要的。當(dāng)損失函數(shù)為TLoss時(shí),在10%的顯著性水平下MCS包含了所有VaR模型中14個模型。當(dāng)考慮QLoss時(shí),在10%的顯著性水平下MCS包含了3個模型,且其中的GJRGARCH-T和QGARCH-T兩個模型包含在損失函數(shù)為TLoss的MCS中;與QLoss所對應(yīng)的MCS中的3個模型就是HWZ檢驗(yàn)中在10%的顯著性水平下沒有拒絕的GARCH-T、GJRGARCH-T和QGARCH-T模型。根據(jù)SPA檢驗(yàn)結(jié)果,當(dāng)分別考慮QLoss和TLoss時(shí),SPA檢驗(yàn)統(tǒng)計(jì)量的經(jīng)驗(yàn)p值分別為0.001和0.016,SPA檢驗(yàn)在10%的顯著性水平下都拒絕了RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè),并且MCS置信集在10%的顯著性水平下都沒有包含RiskMetrics模型。說明SPA檢驗(yàn)結(jié)果與MCS檢驗(yàn)結(jié)果一致,在一定程度上佐證了MCS檢驗(yàn)的合理性。 表3 在5%置信水平下各股指VaR模型的預(yù)測績效評估Table 3 The Predictive Performance Evaluation of Each Stock Index at 5% Level by VaR Model 對于臺灣加權(quán)指數(shù),當(dāng)考慮HWZ檢驗(yàn)時(shí),根據(jù)其經(jīng)驗(yàn)p值結(jié)果,除了GJRGARCH-T、QGARCH-T和CAViaRAsymSlope模型外,該檢驗(yàn)在10%的顯著性水平下拒絕了所有其他模型;在10%的顯著性水平下,DQ檢驗(yàn)并沒有拒絕廣義譜檢驗(yàn)結(jié)果中統(tǒng)計(jì)上顯著的RiskMetrics模型、服從正態(tài)分布的GARCH模型族、所有的CAViaR模型以及除了CAREIndARGARCH模型以外其他CARE模型;LR檢驗(yàn)也只拒絕了7個模型。上述條件VaR正確設(shè)定檢驗(yàn)結(jié)果表明,為了預(yù)測臺灣加權(quán)指數(shù)5%置信水平的VaR值,刻畫收益率序列的波動集聚效應(yīng)、波動的非對稱性和厚尾性質(zhì)是重要的。當(dāng)損失函數(shù)為TLoss時(shí),在10%的顯著性水平下MCS包含所有VaR模型中的15個模型;而當(dāng)考慮QLoss時(shí),在10%的顯著性水平下MCS只包含了1個模型,且這1個模型包含在損失函數(shù)為TLoss時(shí)的MCS中。與QLoss所對應(yīng)的MCS中的這個模型是HWZ檢驗(yàn)在10%的顯著性水平下沒有拒絕的3個模型中的GJRGARCH-T模型。根據(jù)SPA檢驗(yàn)結(jié)果,在10%的顯著性水平下,當(dāng)考慮TLoss時(shí),SPA檢驗(yàn)沒有拒絕RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè)(經(jīng)驗(yàn)p值為0.641),且該模型包含在MCS置信集中;當(dāng)考慮QLoss時(shí),SPA檢驗(yàn)拒絕了RiskMetrics模型具有最優(yōu)預(yù)測效果的原假設(shè)(經(jīng)驗(yàn)p值為0.000),并且該模型也沒有包含在MCS集中。SPA檢驗(yàn)結(jié)果與MCS檢驗(yàn)結(jié)果一致,這在一定程度上佐證了MCS檢驗(yàn)的合理性。 綜上所述,結(jié)合Hong等[17]的廣義譜檢驗(yàn)和基于QLoss損失函數(shù)的Hansen等[18]的MCS預(yù)測檢驗(yàn)的實(shí)證結(jié)果,在1%置信水平下,上證綜指的最優(yōu)VaR預(yù)測模型為GARCH-T、GJRGARCH-T和QGARCH-T,香港恒生指數(shù)的最優(yōu)預(yù)測模型為GARCH-T、GJRGARCH-T、QGARCH-T和CARESymAbs,臺灣加權(quán)指數(shù)的最優(yōu)VaR預(yù)測模型為GJRGARCH-T和QGARCH-T;在5%置信水平下,上證綜指的最優(yōu)VaR預(yù)測模型為GARCH-T和GJRGARCH-T,香港恒生指數(shù)的最優(yōu)預(yù)測模型為GARCH-T、GJRGARCH-T和QGARCH-T,臺灣加權(quán)指數(shù)的最優(yōu)預(yù)測模型為GJRGARCH-T。需要說明的是,在1%置信水平下,香港恒生指數(shù)的最優(yōu)VaR預(yù)測模型包含了CARESymAbs模型,而上證綜指和臺灣加權(quán)指數(shù)的最優(yōu)VaR預(yù)測模型并沒有包含CARESymAbs模型。該結(jié)果表明,對于不實(shí)行漲跌停板制度的香港股票市場而言,采用能夠測度小概率巨額損失情形甚至是金融危機(jī)事件的CARE模型是十分重要的。 本研究采用更加嚴(yán)謹(jǐn)和穩(wěn)健的Hong等[17]的VaR模型正確設(shè)定的廣義譜檢驗(yàn)和Hansen等[18]的MCS多元預(yù)測檢驗(yàn)方法,全面考察中國股票市場(上證綜指、恒生指數(shù)和臺灣加權(quán)指數(shù))上各參數(shù)、半?yún)?shù)和非參數(shù)VaR模型(共22個模型)在采用滾動窗口預(yù)測機(jī)制時(shí)的向前一步預(yù)測績效。實(shí)證結(jié)果表明,在1%和5%置信水平下,同時(shí)刻畫收益率的波動集聚效應(yīng)、波動非對稱性和厚尾性質(zhì)的GARCH模型族可以很好地預(yù)測上證綜指、香港恒生指數(shù)和臺灣加權(quán)指數(shù)在國際金融危機(jī)期間的風(fēng)險(xiǎn)特征,這在某種程度上表明經(jīng)過20多年的發(fā)展,隨著監(jiān)管體系的逐步完善、機(jī)構(gòu)投資者的日益壯大、證券品種結(jié)構(gòu)的日趨合理和發(fā)行規(guī)模的不斷擴(kuò)大,大陸股票市場與香港、臺灣成熟股票市場的風(fēng)險(xiǎn)特性越來越接近;此外,在1%置信水平下,香港恒生指數(shù)的最優(yōu)VaR預(yù)測模型包含CARESymAbs模型,說明是否實(shí)行漲跌停板制度對于選取最優(yōu)的VaR預(yù)測模型具有重要的影響。 由于通常的反饋檢驗(yàn)方法只檢驗(yàn)條件VaR模型正確設(shè)定內(nèi)涵(即均值化的“撞擊序列”應(yīng)服從鞅差分序列)的部分性質(zhì),在實(shí)際應(yīng)用時(shí)采用這些方法常會得出錯誤的結(jié)論。為避免極端損失的發(fā)生以及增加結(jié)果的穩(wěn)健性,政府監(jiān)管部門和金融機(jī)構(gòu)在測度或預(yù)測市場風(fēng)險(xiǎn)時(shí),可結(jié)合Hong等[17]的條件VaR模型正確設(shè)定的廣義譜檢驗(yàn)和Hansen等[18]的MCS多元預(yù)測檢驗(yàn)方法。 與GARCH模型族相比,對各股票指數(shù)的VaR值進(jìn)行建模的復(fù)雜模型(如經(jīng)過濾波的極值理論模型)和簡單模型(如各種歷史模擬法模型)具有相對較差的預(yù)測績效?;诖藢?shí)證結(jié)論,建議監(jiān)管部門和金融機(jī)構(gòu)在金融危機(jī)期間,為了準(zhǔn)確地預(yù)測未來的市場風(fēng)險(xiǎn),不應(yīng)該采用過度參數(shù)化和較簡單的VaR模型,通常GARCH模型族會具有較為穩(wěn)健的樣本外預(yù)測能力。對于政府監(jiān)管部門和金融機(jī)構(gòu)而言,準(zhǔn)確有效地測度金融風(fēng)險(xiǎn)是風(fēng)險(xiǎn)管理中非常重要的工作。本研究為VaR模型預(yù)測績效評價(jià)工作提供有益的理論借鑒和具有操作性的實(shí)證方法,可采用本研究的方法考察不同VaR水平下各種股指收益率或資產(chǎn)組合在不同市場表現(xiàn)情況(如牛市或熊市)下的風(fēng)險(xiǎn)特征。 本研究尚有不足之處。①本研究只考慮了各VaR模型的樣本外向前一步預(yù)測能力,實(shí)際應(yīng)用時(shí),政府監(jiān)管部門和金融研究機(jī)構(gòu)常需了解未來一段時(shí)間內(nèi)各股指收益率或資產(chǎn)組合的風(fēng)險(xiǎn)特征,因而采用本研究的預(yù)測評估方法考察各VaR模型的樣本外多步預(yù)測能力將是未來的一項(xiàng)重要研究內(nèi)容;②本研究雖然考察了各參數(shù)、半?yún)?shù)和非參數(shù)VaR模型(共22個模型)的樣本外預(yù)測績效,但是仍有一些模型尚未納入其中,如Ergün等[29]的高階矩模型、Yu等[30]的CAViaR擴(kuò)展模型等(更詳細(xì)的VaR模型估計(jì)方法見Abad等[31]的文獻(xiàn)綜述文章),未來將進(jìn)一步考察這些VaR模型在中國股票市場中的樣本外預(yù)測績效。 [1]Bao Y,Lee T H,Saltoglu B.Evaluating predictive performance of value-at-risk models in emerging markets:A reality check[J].Journal of Forecasting,2006,25(2):101-128. [2]Abad P,Benito S.A detailed comparison of value at risk estimates[J].Mathematics and Computers in Simulation,2013,94:258-276. [3]淳偉德,陳王,潘攀.典型事實(shí)約束下的上海燃油期貨市場動態(tài)VaR測度研究[J].中國管理科學(xué),2013,21(2):24-31. Chun Weide,Chen Wang,Pan Pan.A study on dynamic VaR predicting models for oil futures market of Shanghai[J].Chinese Journal of Management Science,2013,21(2):24-31.(in Chinese) [4]Kuester K,Mittnik S,Paolella M S.Value-at-risk prediction:A comparison of alternative strategies[J].Journal of Financial Econometrics,2006,4(1):53-89. [5]林宇,黃登仕,魏宇.胖尾分布及長記憶下的動態(tài)EVT-VaR測度研究[J].管理科學(xué)學(xué)報(bào),2011,14(7):71-82. Lin Yu,Huang Dengshi,Wei Yu.Study on financial markets dynamic EVT-VaR measuring based on fated-tail distribution and long memory volatility[J].Journal of Management Sciences in China,2011,14(7):71-82.(in Chinese) [6]Chen C W S,Gerlach R,Lin E M H,Lee W C W.Bayesian forecasting for financial risk management,pre and post the global financial crisis[J].Journal of Forecasting,2012,31(8):661-687. [7]張穎,張富祥.分位數(shù)回歸的金融風(fēng)險(xiǎn)度量理論及實(shí)證[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2012,29(4):95-109. Zhang Ying,Zhang Fuxiang.The theory and empirical research of quantile regression in financial risk measurement[J].The Journal of Quantitative & Technical Economics,2012,29(4):95-109.(in Chinese) [8]Taylor J W.Estimating value at risk and expected shortfall using expectiles[J].Journal of Financial Econometrics,2008,6(2):231-252. [9]鐘山,傅強(qiáng).基于CARE模型的金融市場VaR和ES度量[J].預(yù)測,2014,33(3):40-44. Zhong Shan,Fu Qiang.The estimation of value at risk and expected shortfall in financial market based on CARE models[J].Forecasting,2014,33(3):40-44.(in Chinese) [10] Angelidis T,Benos A,Degiannakis S.A robust VaR model under different time periods and weighting schemes[J].Review of Quantitative Finance and Accounting,2007,28(2):187-201. [11] Marimoutou V,Raggad B,Trabelsi A.Extreme value theory and value at risk:Application to oil market[J].Energy Economics,2009,31(4):519-530. [12] Kupiec P H.Techniques for verifying the accuracy of risk measurement models[J].The Journal of Derivatives,1995,3(2):73-84. [13] Christoffersen P F.Evaluating interval forecasts[J].International Economic Review,1998,39(4):841-862. [14] Engle R F,Manganelli S.CAViaR:Conditional autoregressive value at risk by regression quantiles[J].Journal of Business & Economic Statistics,2004,22(4):367-381. [15] Berkowitz J,Christoffersen P,Pelletier D.Evaluating value-at-risk models with desk-level data[J].Management Science,2011,57(12):2213-2227. [16] Hansen P R.A test for superior predictive ability[J].Journal of Business & Economic Statistics,2005,23(4):365-380. [17] Hong Y,Wang S,Zhang W.Testing for conditional quantile models in time series with application to value at risk[R].Ithaca,NY:Cornell University,2011. [18] Hansen P R,Lunde A,Nason J M.The model confidence set[J].Econometrica,2011,79(2):453-497. [19] Koenker R,Bassett G,Jr.Regression quantiles[J].Econometrica,1978,46(1):33-50. [20] Lopez J A.Methods for evaluating value-at-risk estimates[J].Federal Reserve Bank of San Francisco Economic Review,1999(2):3-17. [21] Glosten L R,Jagannathan R,Runkle D E.On the relation between the expected value and the volatility of the nominal excess return on stocks[J].The Journal of Finance,1993,48(5):1779-1801. [22] Sentana E.Quadratic ARCH models[J].The Review of Economic Studies,1995,62(4):639-661. [23] Sener E,Baronyan S,Mengütürk L A.Ranking the predictive performances of value-at-risk estimation methods[J].International Journal of Forecasting,2012,28(4):849-873. [24] Polanski A,Stoja E.Incorporating higher moments into value-at-risk forecasting[J].Journal of Forecasting,2010,29(6):523-535. [25] Cheng W H,Hung J C.Skewness and leptokurtosis in GARCH-typed VaR estimation of petroleum and metal asset returns[J].Journal of Empirical Finance,2011,18(1):160-173. [26] Diebold F X,Schuermann T,Stroughair J D.Pitfalls and opportunities in the use of extreme value theory in risk management[J].The Journal of Risk Finance,2000,1(2):30-35. [27] Newey W K,Powell J L.Asymmetric least squares estimation and testing[J].Econometrica,1987,55(4):819-847. [28] Kuan C M,Yeh J H,Hsu Y C.Assessing value at risk with CARE,the conditional autoregressive expectile models[J].Journal of Econometrics,2009,150(2):261-270. [29] Ergün A T,Jun J.Time-varying higher-order conditional moments and forecasting intraday VaR and expected shortfall[J].The Quarterly Review of Economics and Finance,2010,50(3):264-272. [30] Yu P L H,Li W K,Jin S.On some models for value-at-risk[J].Econometric Reviews,2010,29(5/6):622-641. [31] Abad P,Benito S,López C.A comprehensive review of value at risk methodologies[J].The Spanish Review of Financial Economics,2014,12(1):15-32. EvaluatingPredictivePerformanceofValue-at-RiskModelsBasedonGeneralizedSpectrumandMCSTests Zhang Yupeng1,Hong Yongmiao2 1 School of Finance and Statistics, East China Normal University, Shanghai 200241, China 2 The Wang Ya′nan Institute for Studies in Economics, Xiamen University, Xiamen 361005, China Conditional VaR models′ correct specification test is equivalent to testing the de-meaned hit sequence following a martingale difference sequence (m.d.s), however the commonly used backtesting techniques only test some properties of the sequence. Using generalized spectral test which directly tests the m.d.s property of the de-meaned hit sequence, we evaluate the out-of-sample predictive performance of various parametric, nonparametric and semi-parametric VaR models with a total of 22 models calculated by using rolling predictive method for China′s stock markets including Shanghai Composite Index, Hang Seng Index and Taiwan Weighted Index. Because conditional VaR models′ correct specification test can not reflect the tail risk information exceeding one specific VaR level, in order to avoid the occurrence of extreme losses as well as to increase the robustness of the results, we adopt MCS (model confidence set) test simultaneously by selecting the asymmetric loss functions proposed by Koenker and Bassett and the magnitude loss function proposed by Lopez. Comparing with SPA(Superior Predictive Ability) test, the main advantage of MCS test is that it does not require a benchmark model to be specified as is the case for SPA tests. It characterizes the entire set of models that are not significantly outperformed by other models, while a test for SPA only provides evidence about the relative performance of a single model (the benchmark). The empirical results imply the following three conclusions:①it would cause wrong results using the commonly applied backtesting techniques such as Kupiec likelihood ratio test, Christoffersen likelihood ratio test and Engle and Manganelli dynamic quantile test. However adopting generalized spectral test and MCS test with Lopez loss function simultaneously would give us more accurate and robust results. ②Comparing with historical simulation models, extreme value theory models, CAViaR and CARE models, the out-of-sample predictive performance of the GARCH family with student-t distribution is the best at 1% and 5% significant level during the financial crisis for these three stock indexes. This implies that the risk characteristics of mainland stock market is getting closer and closer to the mature stock markets of Hong Kong and Taiwan after more than 20 years development. ③At 1% significant level, the optimal VaR predictive models of Hang Seng Index include one of the CARE models which can be used to measure extreme loss situation with small probability. This implies that price limit system implemented by Hong Kong yet not by mainland and Taiwan will make Hong Kong′s stock market face more risk during the financial crisis. VaR model;predictive performance;price limit system;generalized spectral test;MCS test Date:January 5th, 2015 DateApril 19th, 2015 FundedProjectSupported by the National Natural Science Foundation of China(71301053) and the Humanity and Social Sciences Research of Ministry of Education(13YJC790211) Biography:Zhang Yupeng(1980-, Native of Yantai, Shandong), Doctor in Economics and is a Lecturer in the School of Finance and Statistics at East China Normal University. His research interests include financial econometrics, international finance and macroeconomic policy, etc.E-mail:ypzhang@sfs.ecnu.edu.cn F830.91 A 10.3969/j.issn.1672-0334.2015.04.010 1672-0334(2015)04-0108-12 2015-01-05修返日期2015-04-19 國家自然科學(xué)基金(71301053);教育部人文社會科學(xué)研究青年基金項(xiàng)目(13YJC790211) 張玉鵬(1980-),男,山東煙臺人,經(jīng)濟(jì)學(xué)博士,華東師范大學(xué)金融與統(tǒng)計(jì)學(xué)院講師,研究方向:金融計(jì)量經(jīng)濟(jì)學(xué)、國際金融與宏觀經(jīng)濟(jì)政策等。E-mail:ypzhang@sfs.ecnu.edu.cn □3.2 MCS預(yù)測檢驗(yàn)
4 VaR預(yù)測模型
4.1 GARCH模型族
4.2 歷史模擬法
4.3 極值理論模型
4.4 CAViaR模型
4.5 CARE模型
5 實(shí)證分析
5.1 數(shù)據(jù)描述
5.2 實(shí)證結(jié)果
6 結(jié)論