摘 要:文章簡單分析了傳統(tǒng)非壽險精算方法存在的缺陷,引入了非壽險精算的經(jīng)典模型——廣義線性模型,并通過R語言對實例進(jìn)行了分析,并給出廣義線性模型在車險定價中的一般步驟。
關(guān)鍵詞:非壽險;廣義線性模型;車險定價
廣義線性模型(Generalized Linear Models,簡稱GLM)是1972年由Nelder和Wedderburn提出的,通過對經(jīng)典線性回歸模型進(jìn)行了進(jìn)一步的推廣,建立了統(tǒng)一的理論和計算框架,推進(jìn)了回歸模型在統(tǒng)計學(xué)中的發(fā)展。繼20世紀(jì)80年代Nelder和MaCullagh將GLM引入到精算學(xué)后,20世紀(jì)90年代,英國的精算師首次將廣義線性模型引入到非壽險定價中,這大大解決了傳統(tǒng)的非壽險定價方法--單項分析法所面臨的局限性,直至現(xiàn)在汽車保險和商業(yè)保險等非壽險仍舊使用這一方法。近年來,GLM在理論和應(yīng)用方面都得到了快速的發(fā)展,包括在拓展模型,模型的診斷以及參數(shù)估計方法等方面的研究都不斷趨近于成熟,適用與GLM的計算機(jī)軟件也日益增多,包含GLM專用程序GLIM(Genneralized Linear Interactive Modelling),SAS統(tǒng)計軟件(Genmod模塊),統(tǒng)計軟件R中相應(yīng)的程序包也可以完成GLM常見模型的估計和假設(shè)檢驗問題。在中國車險定價中,得益于保監(jiān)會在2010年出臺的《關(guān)于在深圳開展商業(yè)車險定價機(jī)制改革試點的通知》,為廣義線性模型在車險定價方面提供了制度上的保障。
1 傳統(tǒng)的非壽險定價方法
1.1 單項分析法(One-Way Analysis)
單項分析法是指每次僅計算一個費率因子對其保險產(chǎn)品價格的影響。由于忽略各個費率因子之間的相互關(guān)系,容易導(dǎo)致定價結(jié)果的嚴(yán)重扭曲,只有當(dāng)各個費率因子之間是相互獨立的,這種方法所得到的結(jié)論才是穩(wěn)定可靠的。例如,在汽車保險定價中,對車齡進(jìn)行單項分析,結(jié)果表明汽車時間越長,保險成本越高。但是導(dǎo)致這一現(xiàn)象的很大原因可能是女性駕駛員駕駛舊車,這才導(dǎo)致了舊車的保險成本較高。而根據(jù)車齡和駕駛員性別的單項分析結(jié)果來厘定車險費率,將會重復(fù)使用駕駛員性別對車險費率的影響,導(dǎo)致對女性駕駛員收取過高的保險費。在競爭日益激烈的非壽險市場下,單項分析這一傳統(tǒng)方法明顯過于簡單。
1.2 最小偏差法(Minimum Bias Method)
最小偏差法是19世紀(jì)60年代發(fā)展的一種分類費率厘定的方法,可同時確定兩個或兩個以上分類變量的相對費率。這一方法需要通過方程組建立損失數(shù)據(jù)和各個費率因子之間的關(guān)系,通過迭代的方法求解未知參數(shù)的最優(yōu)解。在僅有兩個費率因子的情況下,
其中eij為費率單元(i,j)的風(fēng)險單位數(shù),mij為權(quán)數(shù),?琢i,?茁i分別為相應(yīng)費率因子在不同水平的相對費率,yij為觀測值。相比于單項分析法,最小偏差法雖然解決了因忽略各費率因子之間的相互關(guān)系所可能導(dǎo)致的定價結(jié)果扭曲,但是僅有兩個費率因子的情況下,迭代都是十分復(fù)雜的,更何況實際情況下不止兩個費率因子,所以這一方法依然無法形成一個完整的統(tǒng)計框架。
2 廣義線性模型(GLM)基本理論
廣義線性模型可以解決以上兩種傳統(tǒng)方法存在的問題,同時考慮多個費率因子,并處理整個指數(shù)族分布。廣義線性模型基于傳統(tǒng)的線性回歸模型的一系列假設(shè)之上,放寬對這些假設(shè)的要求,廣義線性模型的假設(shè)一般由三部分組成:隨機(jī)成分、系統(tǒng)成分和連結(jié)函數(shù)。
2.1 隨機(jī)成分
隨機(jī)成分是指因變量Y或誤差項的概率分布。y1,y2,…,yn是因變量Y的相互獨立樣本,服從指數(shù)分布族的其中一種分布,指數(shù)分布族包含正態(tài)分布、泊松分布、伽馬分布、逆高斯分布等分布。指數(shù)分布族的概率密度為:
2.3 連結(jié)函數(shù)
連結(jié)函數(shù)是人們在一般線性模型中常常忽略的部分,在一般線性模型中連結(jié)函數(shù)是單位連結(jié)函數(shù),而廣義線性模型的連結(jié)函數(shù)是嚴(yán)格單調(diào)并可微的,將變量Y的期望與系統(tǒng)成分連接起來,此時E(Y)=g-1(?濁),這里g是一個單調(diào)可微的函數(shù)。
文章主要通過R軟件的相關(guān)函數(shù),完成廣義線性模型的相關(guān)統(tǒng)計分析,鑒于篇幅有限,相關(guān)程序代碼就不一一列出,只給出模型檢驗的最終結(jié)果。
3 廣義線性模型的實證分析
3.1 數(shù)據(jù)說明及模型構(gòu)建
廣義線性模型對數(shù)據(jù)量的要求較大,這是要保證較多風(fēng)險類別對結(jié)果影響的可信度,所以廣義線性模型一般使用原始數(shù)據(jù),文章采用某保險公司公開的機(jī)動車第三方責(zé)任險數(shù)據(jù),可從網(wǎng)站(www.statsci.org)上直接下載。樣本數(shù)據(jù)共有7個變量,我們考慮4個影響索賠額的費率因子:
(1)年均里程數(shù)kilometres,共分5個水平:K1,K2,K3,K4,K5;(2)行車區(qū)域zones,共分7個水平:Z1,Z2,Z3,Z4,Z5,Z6,Z7;(3)無賠款折扣等級bonus,共分7個水平:B1,B2,B3,B4,B5,B6,B7;(4)車型make,共分9個水平:M1,M2,M3,M4,M5,M6,M7,M8,M9。
此樣本共有5×7×7×9=2205個風(fēng)險類別,除去23個風(fēng)險暴露數(shù)(沒有被保險人)為0的,剩下2182個風(fēng)險類別。
我們首先對索賠次數(shù)和索賠額進(jìn)行了傳統(tǒng)的多元線性回歸,結(jié)果發(fā)現(xiàn)索賠次數(shù)和索賠強(qiáng)度的擬合結(jié)果出現(xiàn)了負(fù)值,這顯然是不合理的。
下面建立廣義線性模型,
這里Yijkl和mijkl分別表示單元(i,j,k,l)的索賠強(qiáng)度和索賠次數(shù),i,j,k,l分別代表上述4個費率因子的各個水平,即i=1,2,…,5,j=1,2,…,7,k=1,2,…,7,l=1,2,…,9。
由于索賠次數(shù)的建模方式與索賠強(qiáng)度一致,此處就不再重復(fù)表達(dá)。由索賠頻率=索賠次數(shù)/風(fēng)險暴露數(shù),可以得到索賠頻率的結(jié)果,則純保費為索賠頻率的期望與索賠強(qiáng)度期望的乘積。
3.2 對模型進(jìn)行實證分析
(1)索賠次數(shù)
在估計索賠次數(shù)時,常用泊松分布和負(fù)二項分布假設(shè)下,用對數(shù)連結(jié)函數(shù)建立廣義線性模型,這是為了保證各個費率因子之間是乘積關(guān)系。下面運用R軟件的glm()語句對數(shù)據(jù)進(jìn)行擬合(表1),從表中可以看到負(fù)二項分布的離差小,對數(shù)似然值大,AIC值小,表明負(fù)二項分布的擬合優(yōu)度較好。
(2)索賠強(qiáng)度
在估計索賠強(qiáng)度時,常用伽馬分布和逆高斯分布假設(shè)下,用對數(shù)連結(jié)函數(shù)建立廣義線性模型。下面運用R軟件的glm()語句對數(shù)據(jù)進(jìn)行擬合(表3),從表中可以看出伽馬分布的離差小,對數(shù)似然值和AIC與逆高斯分布的AIC值相差不大,可知伽馬分布假設(shè)下的模型擬合效果相對較好。
3.3 結(jié)束語
根據(jù)模型的擬合效果,我們選擇負(fù)二項分布GLM對索賠次數(shù)進(jìn)行分析,選擇伽馬分布GLM對索賠強(qiáng)度進(jìn)行分析。在實證分析中我們發(fā)現(xiàn),有些費率等級擬合效果并不顯著,可考慮將進(jìn)行等級的合并,精算師在實際運用廣義線性模型進(jìn)行費率厘定時,應(yīng)充分考慮建模本身的風(fēng)險,模型參數(shù)的風(fēng)險以及隨機(jī)誤差的風(fēng)險等。目前,隨著廣義線性模型不斷程度的加深應(yīng)用,多種統(tǒng)計軟件也日益完善成熟,鑒于R軟件不斷更新,包含GLM以及GLM的許多拓展模型如:GAM,GAMLSS等,也可以在R中找到相關(guān)函數(shù),可通過www.jstatsoft.org找到最新研究成果。
參考文獻(xiàn)
[1]王新軍,王亞娟.基于廣義線性模型的車險費率費率厘定研究[J].保險研究,2013(9):43-56.
[2]張連增,呂定海.廣義線性模型在非壽險費率分析中的應(yīng)用[J].數(shù)理統(tǒng)計與管理,2013,32(5).
[3]孟生旺.廣義線性模型在汽車保險定價的應(yīng)用[J].數(shù)理統(tǒng)計與管理,2007,26(1).
[4]薛毅,陳立萍.統(tǒng)計建模與R軟件[M].北京:清華大學(xué)出版社,2007.
[5]De Jong P,Heller G.Generalized Linear Models for Insurance Data[M].New York:Cambridge University Press,2008.
[6]McCullagh P,Nelder J A.Generalized Linear Models[M].Londen: Chapman&Hall,1989.
作者簡介:張?zhí)焓妫?991-),女,滿族,遼寧省興城市,遼寧師范大學(xué),碩士,應(yīng)用統(tǒng)計。