房婷婷,竇 燕
(新疆財(cái)經(jīng)大學(xué), 烏魯木齊 830012)
信度理論是一種重要的經(jīng)驗(yàn)估費(fèi)方法,精算師利用過(guò)去n年的索賠數(shù)據(jù)預(yù)測(cè)第n+1年的最優(yōu)保費(fèi),而研究信度保費(fèi)最重要的環(huán)節(jié)是關(guān)于損失數(shù)據(jù)X=(X1,X2,…,Xn)的分布的討論。
經(jīng)驗(yàn)表明:由于歷史數(shù)據(jù)的不穩(wěn)定性很難給出索賠數(shù)據(jù)的分布,有學(xué)者提出采用在更一般的分布框架下建立信度模型,這樣可以使估計(jì)結(jié)果具有更強(qiáng)的通用性和穩(wěn)健性。例如, Hassan Zadeh等[1]研究了Phase-type分布下的貝葉斯保費(fèi)和信度保費(fèi)。其次,經(jīng)典信度模型中使用的對(duì)稱損失函數(shù)僅關(guān)注了估計(jì)值的精確度,忽略了擬合度的重要性。因此,許多學(xué)者致力于研究非對(duì)稱損失函數(shù)下的信度保費(fèi)。例如,溫利民等[2-3]分別在指數(shù)損失函數(shù)及Linex損失函數(shù)下推導(dǎo)了信度保費(fèi);王娜娜[4]在熵?fù)p失函數(shù)下推導(dǎo)了信度保費(fèi);張強(qiáng)等[5]在加權(quán)平衡損失函數(shù)下推導(dǎo)了信度保費(fèi);房婷婷等[6]在Mlinex損失函數(shù)下推導(dǎo)了信度保費(fèi)。此外,在經(jīng)典信度模型中常假設(shè)索賠數(shù)據(jù)服從某個(gè)分布,實(shí)際上,歷史索賠數(shù)據(jù)X1,X2,…,Xn分布通常是未知的。在此情況下,胡瑩瑩等[7-8]研究了最大熵方法下的信度估計(jì)及純穩(wěn)健信度估計(jì)。章溢等[9]討論了概率密度函數(shù)的信度模型。李新鵬等[10]推導(dǎo)了具有風(fēng)險(xiǎn)相依效應(yīng)的信度模型。
經(jīng)典信度理論中,確定合適的Xij|θi的分布是十分困難的,這是因?yàn)閭€(gè)體經(jīng)驗(yàn)數(shù)據(jù)不能用某個(gè)特定的分布描述。因此,采用具有多樣性結(jié)構(gòu)的分布將使預(yù)測(cè)結(jié)果更加精確。進(jìn)一步地,在索賠數(shù)據(jù)分布未知情況下,需要討論如何計(jì)算信度保費(fèi)才更符合實(shí)際要求。而在建立信度模型時(shí),使用非對(duì)稱損失函數(shù)可以避免由對(duì)稱損失函數(shù)引起的高保費(fèi)征收問(wèn)題,尋找合適的非對(duì)稱損失函數(shù)尤為必要。結(jié)合以上問(wèn)題,本文以具有多樣性結(jié)構(gòu)的Phase-type分布為基礎(chǔ),首先討論了帶通貨膨脹因子的單合同信度保費(fèi)和精確信度;再將信度估計(jì)結(jié)果推廣到多合同情況;最后,推導(dǎo)了平衡損失函數(shù)下的多合同信度保費(fèi)及精確信度形式;最后進(jìn)行數(shù)值模擬部分,展示模型的穩(wěn)健性。
Phase-type分布描述了具有有限個(gè)瞬時(shí)態(tài)和一個(gè)吸收態(tài)的馬爾可夫過(guò)程進(jìn)入吸收態(tài)的時(shí)間分布。Phase-type分布有許多優(yōu)秀的性質(zhì),其一,它可以近似為任何一種分布;其二,用PH分布代替指數(shù)分布,使得其在算法上更易求出顯式解。這些性質(zhì)使得PH分布廣泛應(yīng)用于衛(wèi)生保健、金融、運(yùn)輸?shù)阮I(lǐng)域,但在保險(xiǎn)精算方面的研究卻少之又少。
考慮一個(gè)有n+1個(gè)狀態(tài)的連續(xù)時(shí)間馬氏鏈{X(t),t≥0},其中{1,2,…,n}為瞬時(shí)態(tài), {n+1}為吸收態(tài)。另外,假設(shè)n+1個(gè)狀態(tài)的初始概率為(π,πn+1),這里πn+1=1-π′1,1是元素為1的列向量。記無(wú)窮小生成元Q為
這里D0為n×n的矩陣,d1為n×1的列向量。由于Q為馬氏鏈的生成元,所以有
Dij≥0, for 1≤i≠j≤n
Dii<0, for 1≤i≤n
和
D01+d1=0
定義1[1]若馬氏鏈進(jìn)入吸收態(tài){n+1}的時(shí)間分布為
X(t)=inf{t≥0,X(t)=n+1}
則稱X(t)為PH分布,記作X~PH(π,D0)。
根據(jù)定義,隨機(jī)變量X的概率密度函數(shù)有以下形式:
引理1[1]若X~PH(π,D0),則X的概率密度函數(shù)為
f(x)=π′exp(D0x)d1,x≥0
不失一般性地,D0可以寫成
P=I+(1/θ)D0
這里矩陣I為n階單位陣。因此,P可以寫作
(1)
且
引理2[1]X|θ~PH(π,D0)的密度函數(shù)可以寫成無(wú)窮個(gè)Erlang分布密度函數(shù)的和:
qn+1=π′Pn(I-P)1≥0,n=0,1,…
(2)
在經(jīng)典信度理論中,給定風(fēng)險(xiǎn)參數(shù)Θ=θ時(shí),索賠X1,X2,…,Xn是獨(dú)立同分布的,并且E(Xi|Θ)=μ(Θ),Var(Xi|Θ)=υ(Θ)。然而,每年的索賠數(shù)據(jù)會(huì)受到通貨膨脹因子的影響。因此,需要建立帶通貨膨脹因子的信度模型。假設(shè)某保單n年的索賠數(shù)據(jù)為X=(X1,X2,…,Xn),這些索賠數(shù)據(jù)的風(fēng)險(xiǎn)參數(shù)為Θ,Θ的先驗(yàn)分布為π(θ)。本節(jié)的目的是預(yù)測(cè)第n+1年的索賠。首先假設(shè)給定Θ=θ時(shí),X1,X2,…,Xn條件獨(dú)立同分布,且
E(Xj|Θ)=rjμ(Θ)
Var(Xj|Θ)=r2jσ2(Θ)
j=1,2,…,n
(3)
其中r為每年的通貨膨脹因子,并記
(4)
定理1在假設(shè)條件(3)(4)下,Xn+1的最優(yōu)線性信度估計(jì)為
(5)
證明:
為得到Xn+1的最優(yōu)線性信度估計(jì),首先最小化下式
(6)
對(duì)(6)關(guān)于α0和αj求偏導(dǎo)并令結(jié)果為0,有
基于式(3)(4),可得
(7)
(8)
聯(lián)立式(7)(8),有
因此,可得
綜上,定理1得證。
根據(jù)式(5),假設(shè)隨機(jī)變量Xi|Θ服從PH分布,則它可以寫成N個(gè)參數(shù)為Θ的指數(shù)分布的和,即
Xn+1=Y1+…+YN
(9)
這里Yj,j=1,2,…,N是相互獨(dú)立的指數(shù)分布。N表示馬氏鏈到達(dá)吸收態(tài)的轉(zhuǎn)移數(shù)且N~PHd(π,P),P如式(1)所示。則Xn+1的條件均值和條件方差可以寫成
rn+1μ(Θ)=E(Xn+1|Θ)=E(Y1|Θ)E(N)=
Θ-1E(N)
r2(n+1)υ(Θ)=Var(Xn+1|Θ)=
Θ-2(Var(N)+E(N))
(10)
因?yàn)镹~PHd(π,P),易計(jì)算出式(10)的前半部分。特別地,若風(fēng)險(xiǎn)參數(shù)Θ~Γ(Κ,γ),即
那么式(10)的后部分可以寫成
綜上,信度保費(fèi)(5)可表示為
接下來(lái)討論帶通貨膨脹因子的精確信度。
Jewell[11]證明了在均方損失函數(shù)下,若給定Θ=θ時(shí),損失X1,X2,…,Xn服從參數(shù)為θ的指數(shù)分布,且Θ的先驗(yàn)分布π(θ)服從指數(shù)分布族,則貝葉斯保費(fèi)具有信度保費(fèi)的形式。對(duì)于帶通貨膨脹因子的信度模型,得到的結(jié)論如下。
定理2在假設(shè)條件(3)(4)下,給定Θ=θ時(shí),若條件密度函數(shù)fXj|Θ(xj|θ)有線性指數(shù)分布族的形式:
且共軛先驗(yàn)分布為
(11)
其中π(θ0)=π(θ1)=0,那么精確信度存在。
證明:
因?yàn)镋(μ(Θ))=μ且
下面有
(q(θ))-k*e-θμ*k*
即葉斯保費(fèi)E(Xn+1|X)具有信度保費(fèi)的形式,精確信度存在。
下面討論P(yáng)H分布下的精確信度形式。由式(9),有
Xi=Yi1+…+Yi,Ni,i=1,…,n+1
假設(shè)X1,X2,…,Xn+1相應(yīng)的嵌入式馬爾可夫鏈為U1,U2,…,Un+1,參數(shù)記為(π,D0)。給定Θ=θ時(shí),變量U1,U2,…,Un+1是條件獨(dú)立的。另外假定:
1) 給定Θ=θ和i時(shí),Yij,j=1,…,Ni為條件獨(dú)立同指數(shù)分布的隨機(jī)變量。
2)Ni,i=1,…,n+1為獨(dú)立同分布的隨機(jī)變量,且與Θ獨(dú)立。
3)Θ服從如式(11)所示的先驗(yàn)分布。
因此,給定Θ=θ時(shí),損失X1,X2,…,Xn+1獨(dú)立同分布且服從參數(shù)為(π,D0)的PH分布。那么
(12)
因?yàn)棣?X1,X2,…,Xn)是H的子集,在(12)兩邊取關(guān)于X1,X2,…,Xn的條件期望后會(huì)有
E(Yn+1,1|X1,X2,…,Xn)=
又因?yàn)?/p>
因此,
(13)
此時(shí), 貝葉斯保費(fèi)可以寫成如下形式
以上結(jié)果可以推廣到多合同情形。類似地,假設(shè)給定Θi=θi時(shí),Xi1,…,Xin,i=1,…,m獨(dú)立同分布,且有E(Xij|Θi)=rjμ(Θi),Var(Xij|Θi)=r2jυ(Θi)。另外,記μ=E(μ(Θi)),υ=E(υ(Θi)),a=Var(μ(Θi))。由此易得帶有通貨膨脹因子的多合同模型下的信度保費(fèi)及精確信度,下文不再贅述。
假設(shè)某保險(xiǎn)公司有m份保單,第i份保單的索賠數(shù)據(jù)記作Xi=(Xi1,Xi2,…,Xin)′,i=1,…,m。每份保單的風(fēng)險(xiǎn)參數(shù)記為Θi,先驗(yàn)分布為π(θ)。本節(jié)的目標(biāo)是預(yù)測(cè)下一年的保費(fèi),即μn+1(Θi)=E(Xi,n+1|Θi)。下面給出一些假設(shè)條件和記號(hào):
假設(shè)1給定Θi=θi時(shí),Xi1,Xi2,…,Xin,i=1,2,…,m條件獨(dú)立同分布,并有
E(Xij|Θi)=μ(Θi),Var(Xij|Θi)=σ2(Θi)
假設(shè)2{(Xi,Θi),i=1,2,…,m}相互獨(dú)立,Θ1,…,Θm獨(dú)立同分布。并記
E(δ0i)=E(μ(Θi))=μ, Cov(δ0i,Xij)=si
Var(μ(Θi))=τ2,E(σ2(Θi))=σ2
其中δ0i(x)為第i份保單的目標(biāo)保費(fèi)。
由Zellner[12]定義的平衡損失函數(shù)
(14)
可以得出如下結(jié)論。
定理3根據(jù)假設(shè)條件1、2及平衡損失函數(shù)(14),μ(Θi)的最優(yōu)線性非齊次估計(jì)為
證明:
由假設(shè)1、2易知,E(Xij)=μ,Var(Xij)=τ2+σ2,且
Cov(Xij,Xij′)=τ2,Cov(Xij,Xi′j′)=0,i≠i′,j≠j′
Cov(μ(Θi),Xij)=τ2,Cov(μ(Θi),Xi′j)=0,i≠i′
令
(15)
對(duì)式(15)關(guān)于α0求偏導(dǎo)并令結(jié)果為0,有
將α0代入Φ,那么
(16)
對(duì)式(16)關(guān)于αij′求偏導(dǎo)并令結(jié)果為0,則有
因此可得
則在平衡損失函數(shù)下,μ(Θi)的最優(yōu)線性非齊次估計(jì)為
綜上,定理3得證。
假定Xij|Θi~PH(π,D0),那么Xij可以寫成:
Xij=Yij1+Yij2+…+YijN
(17)
這里給定Θi=θi時(shí),Yijl,l=1,2,…,N獨(dú)立同分布且服從參數(shù)為θi的指數(shù)分布。N表示馬氏鏈到達(dá)吸收態(tài)的轉(zhuǎn)移數(shù),N~PHd(π,P)。
定理4假設(shè)給定Θi=θi時(shí),隨機(jī)變量Xi1|Θi,…,Xin|Θi獨(dú)立同分布且服從PH(π,D0)。 若Θi服從如下分布
(18)
則基于平衡損失函數(shù)式(14)得到信度保費(fèi)估計(jì)為
證明:
Xij|Θi的條件均值和方差可以表示為
μ(Θi)=E(Xij|Θi)=
σ2(Θi)=Var(Xij|Θi)=
E2(Yij1|Θi)Var(N)+
E(N)Var(Yij1|Θi)=
所以有
又因?yàn)镹~PHd(π,P),則
E(N)=π′(I-P)-11
E(N(N-1))=2π′P(I-P)-21
那么,
Var(N)+E(N)=E(N2)-E2(N)+E(N)=
E(N(N-1))+2E(N)-E2(N)=
2π′P(I-P)-21+2π′(I-P)-11-
(π′(I-P)-11)2=2π′(I-P)-21-
(π′(I-P)-11)2
另一方面,Θi服從式(18)所示分布,顯然有
綜上定理4得證。
溫利民等[13]得出了在平衡損失函數(shù)下精確信度存在的結(jié)論,即
由式(17),這里有
Xi,n+1=Yi,n+1,1+Yi,n+1,2+…+Yi,n+1,Nn+1
假設(shè)Xi1,Xi2,…,Xin+1相應(yīng)的嵌入式馬爾可夫鏈為Ji1,Ji2,…,Jin+1,參數(shù)是(π,D0)。給定Θi=θi,變量Ji1,Ji2,…,Jin+1是條件獨(dú)立的。此外,本文還假設(shè):
1) 給定i,j及Θi=θi時(shí),Yijk,k=1,2,…,Nj為條件獨(dú)立同分布且服從指數(shù)分布。
2)Nj,j=1,…,n+1為獨(dú)立同分布隨機(jī)變量,并獨(dú)立于Θi。
3)Θi,i=1,…,k服從(18)的先驗(yàn)分布。
基于以上假設(shè)條件,有
E(Yi,n+1,1|H)=
(19)
這里H=σ(Y1,1,1,…,YK,n,Nn,N1,…,Nn)??紤]在式(19)兩邊求關(guān)于Xi1,Xi2,…,Xin的條件期望。那么
E(Yi,n+1,1|Xi1,Xi2,…,Xin)=
進(jìn)一步地,
E(Nn+1)E(Yi,n+1,1|H)
因此, 貝葉斯保費(fèi)可以寫成
因?yàn)?/p>
E(N)=π′(I-P)-11
Var(N)+E(N)=2π′(I-P)-21-
(π′(I-P)-11)2
則
E(N)=2.06,Var(N)+E(N)=4.93
圖1 信度保費(fèi)的MSE曲線
由圖1可以看出MSE隨著θ的增加而減小,如:
θ=187.78時(shí),MSE=0.000 38
θ=241.58時(shí),MSE=0.000 31
預(yù)測(cè)結(jié)果具有較高精度。
例2 取式(11)中Gamma先驗(yàn)分布的參數(shù)為γ=1,K=2,通貨膨脹因子r=1.02。矩陣P為
令MSE1,MSE2分別表示定理1的信度保以及經(jīng)典信度保費(fèi)的均方誤差,分別取n=5、10、15完成5 000次模擬,所得結(jié)果如表1所示。
表1 定理1的信度保以及經(jīng)典信度保費(fèi)的均方誤差
由表1可知:PH分布下的信度保費(fèi)的精確度遠(yuǎn)高于經(jīng)典信度保費(fèi),這是因?yàn)镻H分布具有多樣性結(jié)構(gòu),提高了索賠數(shù)據(jù)分布的擬合度。
1) 由于服從PH分布的隨機(jī)變量的構(gòu)成特點(diǎn),單合同的索賠數(shù)據(jù)是穩(wěn)定的并易于預(yù)測(cè)。
2) 考慮通貨膨脹因素的信度模型,預(yù)測(cè)的保費(fèi)更符合實(shí)際情況。
3) 帶有非對(duì)稱損失函數(shù)的信度模型擬合優(yōu)度高,估計(jì)結(jié)果更準(zhǔn)確。
在帶有通脹因子和非對(duì)稱損失函數(shù)的信度模型的背景下,假設(shè)索賠數(shù)據(jù)對(duì)風(fēng)險(xiǎn)是獨(dú)立的。然而在大多數(shù)情況下,索賠之間具有很強(qiáng)的依賴關(guān)系[14-15]。因此,在今后的工作中,可以針對(duì)索賠數(shù)據(jù)的相依性進(jìn)行研究。