王永茂,楊曉婷
(燕山大學(xué) 理學(xué)院 河北 秦皇島 066004)
巨災(zāi)損失的分布擬合在巨災(zāi)保險(xiǎn)損失建模和風(fēng)險(xiǎn)評(píng)估中占有基礎(chǔ)性的地位。巨災(zāi)保險(xiǎn)損失分布廣且不均,既有大量的小額損失,也有少量的大額損失,其分布常呈現(xiàn)厚尾形態(tài)。在較早的文獻(xiàn)中多運(yùn)用伽馬分布、對(duì)數(shù)正態(tài)分布、威布爾分布等單一分布擬合巨災(zāi)損失,無法準(zhǔn)確擬合出巨災(zāi)損失的厚尾特點(diǎn)[1-2]。近年的文獻(xiàn)中提出了組合分布模型的思路[3-6]。部分學(xué)者基于極值理論對(duì)巨災(zāi)受災(zāi)人數(shù)進(jìn)行分布擬合[7-8],并且部分文獻(xiàn)更多地注重了巨災(zāi)損失的厚尾特點(diǎn)[9-10]。
在構(gòu)建組合分布模型的建模思路下,任何兩個(gè)分布都可以按需構(gòu)成組合分布模型,從而得到比單一分布模型更精準(zhǔn)的擬合效果。本文運(yùn)用對(duì)數(shù)廣義誤差分布代替對(duì)數(shù)正態(tài)分布,并結(jié)合廣義帕累托分布構(gòu)建組合分布模型,同時(shí)采用Bakar提出的混合權(quán)重方法來計(jì)算權(quán)重,構(gòu)建出了LogGED-GPD的組合分布模型。對(duì)全球洪水巨災(zāi)損失數(shù)據(jù)進(jìn)行了實(shí)證分布擬合,得到了LogGED-GPD的組合分布模型的擬合效果優(yōu)于單一的LogGED和對(duì)數(shù)正態(tài)分布(Lognormal)模型,在一定程度上為今后全球洪水巨災(zāi)損失的分布擬合方法提供了參考依據(jù)。
正態(tài)分布和對(duì)數(shù)正態(tài)分布在概率和統(tǒng)計(jì)的理論和應(yīng)用中都發(fā)揮了重要作用,尾部比正態(tài)分布更厚的對(duì)數(shù)正態(tài)分布已被廣泛用于風(fēng)險(xiǎn)管理、信用風(fēng)險(xiǎn)評(píng)估等領(lǐng)域。對(duì)數(shù)廣義誤差分布是對(duì)數(shù)正態(tài)分布的自然擴(kuò)展,在對(duì)數(shù)正態(tài)分布應(yīng)用的領(lǐng)域,對(duì)數(shù)廣義誤差分布可以有更好的擬合效果。對(duì)數(shù)廣義誤差分布的定義如下。
設(shè)ξ為遵循標(biāo)準(zhǔn)廣義誤差分布的隨機(jī)變量,其中υ>0。令η=exp(ξ),則ξ遵循以υ為參數(shù)的對(duì)數(shù)廣義誤差分布,記為η~LogGED(υ)。當(dāng)υ=1時(shí),LogGED退化為對(duì)數(shù)拉普拉斯分布;當(dāng)υ=2時(shí),LogGED退化為對(duì)數(shù)正態(tài)分布。
McNeil首次提出了使用廣義帕累托分布對(duì)超過高閾值的數(shù)據(jù)進(jìn)行建模的理論,他的分析中指出了對(duì)數(shù)正態(tài)分布的尾部較薄,無法準(zhǔn)確擬合出超過高閾值的大損失數(shù)據(jù)[11]。在討論起賠點(diǎn)和保費(fèi)計(jì)算時(shí),普通帕累托分布導(dǎo)致擬合結(jié)果過于不切實(shí)際,因此尾部區(qū)域位于對(duì)數(shù)正態(tài)分布和帕累托分布之間的廣義帕累托分布,更適用于擬合超過高閾值的大損失數(shù)據(jù)。設(shè)G(x)為廣義帕累托分布的分布函數(shù),則
Bakar等提出了一種新的構(gòu)建雙參數(shù)組合模型的方法[5],即混合權(quán)重φ和閾值θ兩個(gè)參數(shù)由組合模型中的其他參數(shù)表示。設(shè)f(x)為組合模型的密度函數(shù),
結(jié)合本文提出的LogGED-GPD組合分布模型,根據(jù)對(duì)數(shù)廣義誤差分布和廣義帕累托分布的密度函數(shù)和分布函數(shù),將參數(shù)φ寫成公式,
可以將LogGED-GPD組合分布模型的密度函數(shù)重新參數(shù)化。
當(dāng)0 當(dāng)θ 最后,整理后可得LogGED-GPD組合分布模型的密度函數(shù)為 本文數(shù)據(jù)來源于達(dá)特茅斯洪水觀測臺(tái)提供的全球大型洪水災(zāi)害事件檔案(http://www.dartmouth.edu/~floods/Archives/index.html),檔案中提供的信息來自新聞、政府、儀器和遙感監(jiān)測,依據(jù)全球洪水事件的發(fā)生實(shí)時(shí)更新,詳細(xì)記錄了每次洪水事件的時(shí)間、地點(diǎn)、損失等數(shù)據(jù),目前記載了從1985—2010年全球發(fā)生的3 703件洪水事件。依據(jù)美國保險(xiǎn)服務(wù)所將巨災(zāi)定義為損失金額超過2 500萬美元以上的巨大經(jīng)濟(jì)損失和人員傷亡的事件,本文提取了全球大型洪水事件檔案中損失金額超過2 500萬美元的全球洪水巨災(zāi)樣本共計(jì)494條。 表1反映了全球洪水損失的描述性統(tǒng)計(jì)特征。由全球洪水損失的描述性統(tǒng)計(jì)量可以分析出,樣本數(shù)據(jù)的75%分位數(shù)遠(yuǎn)小于平均值,方差很大,說明存在少量異常大的極端損失;偏度值為15.04,分布右側(cè)尾部有更明顯的拉長趨勢;峰度值為262.73,遠(yuǎn)大于標(biāo)準(zhǔn)正態(tài)分布的峰度值,樣本的分布曲線坡度更大,曲線兩側(cè)的尾部較厚,直觀反映出了尖峰厚尾的特點(diǎn)。偏度值和峰度值的標(biāo)準(zhǔn)誤差都較小,反映出采樣數(shù)據(jù)的平均值和總體的平均值差別較小,抽樣誤差較小,可靠性高。 表1 全球洪水損失描述性統(tǒng)計(jì)量 厚尾分布通常可以通過Q-Q圖驗(yàn)證。Q-Q圖是根據(jù)變量的分位數(shù)對(duì)應(yīng)于理論分布的分位數(shù)繪制的散點(diǎn)圖,若經(jīng)驗(yàn)分布與理論分布一致,則Q-Q圖中的點(diǎn)將落在45°對(duì)角線上。若Q-Q圖的中部為直線,上端向右偏離該直線,呈向下傾斜趨勢,則該分布的上尾具有厚尾性;若Q-Q圖的中部為直線,下端向左偏離該直線,呈向上傾斜趨勢,則該分布的下尾具有厚尾性。運(yùn)用SPSS做出全球洪水巨災(zāi)樣本的對(duì)數(shù)Q-Q圖,見圖1。從圖1中的Q-Q圖中可以看出,全球洪水損失數(shù)據(jù)具有厚尾分布的特點(diǎn),滿足LogGED-GPD模型對(duì)數(shù)據(jù)的基本要求。 圖1 樣本的對(duì)數(shù)Q-Q圖 由于不同等級(jí)的洪水巨災(zāi)造成的損失數(shù)量級(jí)差異較大,直接使用原始數(shù)據(jù)會(huì)影響擬合精度,因此在數(shù)據(jù)預(yù)處理階段采用取對(duì)數(shù)的方法,消除原始數(shù)據(jù)在數(shù)量級(jí)上的差異,提高擬合精度。 將所得參數(shù)分別帶回LogGED-GPD分布的分布函數(shù)中,并與單一的LogGED和Lognormal分布做擬合比較。通過K-S檢驗(yàn)和卡方檢驗(yàn),驗(yàn)證樣本數(shù)據(jù)的總體分布是否與擬合的分布存在顯著差異。 在進(jìn)行卡方檢驗(yàn)時(shí),對(duì)全球洪水巨災(zāi)損失取對(duì)數(shù)。全球洪水巨災(zāi)損失原始數(shù)據(jù)分布在區(qū)間[25 000 000,210 000 000 000]內(nèi),涵蓋了例如1998年中國特大洪災(zāi)等世界迄今為止損失金額最大的洪澇巨災(zāi),取對(duì)數(shù)后分布在[17.034 386,26.070 343]內(nèi),因此以全球洪水巨災(zāi)損失取對(duì)數(shù)后的1為區(qū)間寬度進(jìn)行等距分組,共分為10組,則自由度為9。分別對(duì)全球洪水巨災(zāi)損失擬合的三種分布模型進(jìn)行K-S檢驗(yàn)和卡方檢驗(yàn),檢驗(yàn)結(jié)果見表2。 表2 全球洪水巨災(zāi)損失擬合分布的參數(shù)估計(jì)值和檢驗(yàn)值 由表2可知,在卡方檢驗(yàn)中,當(dāng)p=0.05時(shí),χ2(9)=16.919 0,LogGED-GPD、LogGED、Lognormal三種分布模型均能夠通過卡方檢驗(yàn)。在K-S檢驗(yàn)中,當(dāng)p=0.05時(shí),D(n,p)=D(494,0.05)=0.061 189 29,Lognormal分布未能通過K-S檢驗(yàn),LogGED-GPD和LogGED兩種分布模型均通過K-S檢驗(yàn),且LogGED-GPD的組合分布模型的擬合效果優(yōu)于LogGED的單一分布模型。 本文基于文獻(xiàn)中常用的對(duì)數(shù)正態(tài)分布、對(duì)數(shù)廣義誤差分布、廣義帕累托分布等單一分布模型的基礎(chǔ)上,結(jié)合組合分布模型可變權(quán)重的方法,設(shè)計(jì)了可變權(quán)重的對(duì)數(shù)廣義誤差-廣義帕累托組合分布模型。運(yùn)用組合分布模型對(duì)全球洪水巨災(zāi)損失做了實(shí)證分布擬合,驗(yàn)證了LogGED-GPD組合分布模型對(duì)全球洪水巨災(zāi)損失的擬合效果更優(yōu),一定程度上為今后巨災(zāi)損失分布的擬合方法提供了參考依據(jù)。2 洪水巨災(zāi)損失的實(shí)證分布擬合
2.1 數(shù)據(jù)來源
2.2 描述性統(tǒng)計(jì)特征
2.3 厚尾性檢驗(yàn)
2.4 參數(shù)估計(jì)和數(shù)據(jù)分析
3 結(jié)論