武亦文 李墨文
【摘要】現代意義上的經驗分析是建立在有大量經驗數據上的一種精準定價的新理念。隨著保險數據越來越完善,數據量越來越大,尋找更好的統計分析方法對經驗分析工作至關重要,本文結合廣義線性模型的特點詳細介紹了其在經驗分析中的具體應用。對優(yōu)化經驗分析方法具有一定借鑒意義。
【關鍵詞】廣義線性模型;保險精算;定價;評估
一、廣義線性模型簡介
廣義線性模型是在傳統線性回歸方法上衍生出來的一套有著完整統計分析理論的方法,傳統線性回歸的假設比較嚴格:因變量Y服從參數為(μ=βX+b,σ)的正態(tài)分布,也就是說自變量的線性組合是因變量的期望,而廣義線性模型擴展了因變量的分布假設,其分布只要屬于均值函數為βX+b的指數分布族即可。由于在建立模型時因變量分布確定,自變量的線性組合作用于因變量的分布的參數,所以廣義線性模型的參數估計一般采用極大似然估計的方法。
二、廣義線性模型在經驗分析中的應用
經驗分析是在精算循環(huán)系統中非常重要的環(huán)節(jié),其主要目的就是用實際的保險理賠經驗來校驗當初在定價時所用的各種假設是否準確,是否符合發(fā)生的實際,如果實際發(fā)生經驗偏離了預期,要及時總結分析原因,并及時運用分析的結果去更新定價假設,這種評估方式主要是建立在定價的邏輯上的,即經驗評估的風險單元的劃分要盡可能的和定價的單元劃分一致,一般在各個風險單元下求均值來達到評估的目的。
現代意義上的經驗分析是建立在有大量經驗數據上的一種精準定價的新理念,作為傳統經驗分析的一種延伸,能夠更充分的挖掘出經驗數據中所蘊含的相關關系。隨著保險數據越來越完善,數據量越來越大,我們可以根據實際的經驗數據設計更精準的定價方案,進一步細分風險以防范逆選擇的出現同時也能更好的實現風險管控,在這種情況下廣義線性模型的優(yōu)勢就越發(fā)的突顯出來了,并且在財險和健康險領域有著很廣泛的應用,主要由于這類險種經營期限短,多為一年期,及時且合理的經驗分析結果可以為各個險種更新價格提供一個合理且充足的依據。
廣義線性模型在經驗分析中作為研究對象的因變量主要分為以下幾種。
(一)發(fā)生率的預測
主要集中在壽險領域,由于壽險賠付金額固定,所以所有的經驗分析就集中在發(fā)生率的預測上,具體分為死亡率,退保率,重疾發(fā)生率,意外發(fā)生率等。發(fā)生率一般選用兩點分布。
(二)發(fā)生頻數(frequency)的預測
多集中在財險和健康險等短期的險種上,由于這類保險理賠次數有可能多于一次,所以主要預測平均索賠次數。一般假設因變量服從泊松分布或者負二項分布。
(三)索賠強度(severity)的預測
多數集中在財險和健康險領域,特別注意的是,索賠強度是在已知發(fā)生索賠下的條件下的平均索賠金額,所以使用的數據主要就是理賠數據而不是保單數據,根據經驗一般選擇伽馬分布進行擬合。
自變量的選取要根據實際數據的情況,因變量的類型,險種類型,經驗,定價假設的需要等情況進行選擇和適當的分級,保證在不同的風險分級下能有足夠的暴露數。
壽險類險種常用的自變量有:年齡,性別,地域,職業(yè),保額,保單年,吸煙與否
健康險類常用的自變量有:年齡,性別,職業(yè),地域,保單限額,保單免賠額
三、具體建模步驟
(一)風險單元的劃分
在自變量的選取上要根據現有數據的條件以及實際經驗,并且還要分析不同取值對因變量影響的顯著性檢驗,同時風險細分要保證每個風險單位下的風險暴露數能達到完全信度理論下所要求的數量,確保每一個自變量的取值對因變量的影響都是顯著的,最關鍵的是還要考察不同自變量之間的關系以避免多重共線性的問題,所以一定要重點考察自變量之間的相關系數矩陣,盡量選取相關系數低的自變量。
(二)前期數據整理工作
對于基本的數據清洗工作這里不再贅述,關鍵是要根據經驗分析的目的整理數據的格式使得成為可以使用的變量,另外還要將理賠數據和保單數據連接在一起,根據實際情況構造因變量的值,比如說如果是對發(fā)生率進行經驗分析,那么發(fā)生過理賠的保單的因變量可以設為1,否則設為0,如果對頻數進行經驗分析,則要匯總每個保單所對應的索賠次數作為因變量的取值。
(三)因變量的分布假設模型選取
根據因變量的特點選取相應的合適的分布函數,由于廣義線性模型突破了線性回歸方差為常數的限制,有時候需要根據數據的方差和期望的分析結果及經驗選取合適的分布,比如如果頻數方差期望基本一致,且索賠頻數分布多集中在0,1,2的取值上,這時選取泊松分布進行建模就比較合理,根據所選的分布再選取相應的聯結函數,聯結函數一般都比較固定和通用,在很多統計軟件中可以對各種不同的分布假設下得出各自的擬合結果,方便使用者對各種分布和聯結函數的擬合結果進行評價分析。
(四)廣義線性分析
將處理好的數據和模型導入統計軟件,得出相應假設下的參數估計值,根據各個估計值的統計分析結果得出擬合效果分析結果,如果結果不滿意要從之前的各個步驟對模型進行調整指導得出滿意的結果。
(五)根據各個廣義線性分析結果繪制新的費率表
并就新的費率表與之前的定價費率進行比較,分析差異的原因。由于廣義線性模型是乘法模型,隨著自變量取值的增多,最終的費率表更適合基礎費率結合各個維度的風險分級的調整因子的方式來呈現。