趙慧卿,王漢章
(天津商業(yè)大學經(jīng)濟學院,天津300134)
汽車保險是財產(chǎn)保險中的主要險種,其盈虧直接關系到整個財產(chǎn)保險行業(yè)的經(jīng)濟效益。2003年以前,國內(nèi)保險公司的車險業(yè)務采用保監(jiān)會制定的統(tǒng)一條款和費率體系,較高的費率不但違背了費率厘定和市場競爭的公平原則,而且使得行業(yè)缺乏競爭力。隨著國外保險公司的紛紛進入,我國車險市場的競爭愈加激烈。
我國與國外汽車保險條款的差異主要是費率制定的原則不同。我國采取的是“從車原則”,而國外則廣泛采用“從人原則”。條款制定的差異使得中國車輛保險中的“逆向選擇”和“道德風險”遠遠高于國外同行,這顯然不利于我國車險的發(fā)展。因此,我國在進行車險費率厘定時應借鑒國外經(jīng)驗,糾正這種“對車不對人”的做法。另外,我國保險費率厘定在“從地因素”上仍然考慮得比較粗略。綜合考慮“從車、從人、從地”的因素勢必會給車險厘定提供更加公平合理的依據(jù)。因此,尋求科學、公平的費率厘定方法,對推動費率市場化改革,促使我國車險行業(yè)健康發(fā)展,具有積極而深遠的意義。
廣義線性模型最早是由Nelder和Wedderburn[1]定義的,該模型是傳統(tǒng)線性模型的拓展。Duncan Anderson[2]討論了廣義線性模型的兩種檢驗:標準差檢驗和離差分析檢驗,同時他還指出,廣義線性模型已經(jīng)成為個人車險、其他個險險種以及部分商業(yè)險種定價的指導性方法。
國內(nèi)對車險費率厘定的研究大多引用國外保險發(fā)達國家的車險費率厘定變量,在此基礎上對我國機動車輛保險的費率厘定變量提出一些建議。在我國將廣義線性模型用于非壽險費率厘定的研究始于20世紀70年代。
毛澤春等[3]簡要介紹了廣義線性模型,并將其應用于保險的風險分類中,用車險理賠的歷史數(shù)據(jù)分析各個風險分類的費率,最終得到保費點數(shù)計價系統(tǒng)。曾輝、范興華[4]對我國當前使用的影響費率厘定因素提出質(zhì)疑,使用方差分析方法探討城區(qū)與郊區(qū)、不同的城市,年度對費率厘定的影響是否顯著,結論是把城市作為厘定費率因素是科學合理的。盧志義和劉樂平[5]提出使用廣義線性模型估計保險費率,一般要從索賠頻率和平均索賠額兩個方面建立模型,并假設單元中的各個風險單位是同質(zhì)的,同時認為同一風險單位事故發(fā)生的頻率不受前期索賠的影響,單元中各個風險單位相互獨立。
要對機動車輛保險進行厘定,首先需要確定車險費率與哪些影響因素有關,一般將影響機動車輛費率的因素分為車、人和環(huán)境三方面。車輛影響因素主要有:車輛種類、車輛用途、車齡、里程數(shù)、生產(chǎn)廠商、車輛型號和行駛區(qū)域。人的影響因素依次為:年齡、性別、駕齡、婚姻狀況、職業(yè)、肇事記錄、是否續(xù)保、被保險人類型。環(huán)境風險因素又可以分為地理環(huán)境風險因素和社會環(huán)境風險因素。[6]這些因素在車險費率厘定的過程中都是需要考慮的,但是沒有必要全部納入費率厘定系統(tǒng)中。具體到不同保險公司,主要考慮哪些風險是最顯著的。一般來說,車輛廠商、型號、被保險人年齡、駕齡、行車里程數(shù)等因素是最重要的,都會納入到費率厘定系統(tǒng)。
最小偏差法是傳統(tǒng)分類費率厘定中普遍使用的一種方法,用于同時確定兩個或兩個以上分類變量的相對費率。該方法通過一個方程組建立損失數(shù)據(jù)和各個費率因子之間的關系,并通過迭代法求解未知參數(shù)的最優(yōu)解。在最小偏差法中,首先需要確定偏差函數(shù),即最小化的目標函數(shù),常用的偏差函數(shù)有邊際總和函數(shù)、最小二乘函數(shù)、最小x2函數(shù)等,不同的偏差函數(shù)得到的相對費率可能存在差異。
最小偏差法的特點是在求各個風險因子相對數(shù)時,必須設定某一初始值并進行反復迭代,以求解方程得到最優(yōu)解,計算頗為復雜,其結果的精確度也有待于進一步探討。20世紀末以來,廣義線性模型廣泛應用于分類費率厘定中,并且已經(jīng)成為某些國家厘定分類費率的行業(yè)標準。
廣義線性模型是一種基于指數(shù)族分布,用于評估和分析響應變量和解釋變量之間相關關系的模型。廣義線性模型假設任何一個響應變量的波動都可以分為兩部分波動的綜合影響:一是響應變量與解釋變量之間具有某種顯著性的相關關系而造成的系統(tǒng)波動;另一個是自身隨機波動的影響。通過一個適當?shù)暮瘮?shù)聯(lián)結這兩者就可以比較準確地反映響應變量真實的波動情況。
廣義線性模型在形式上與經(jīng)典回歸模型完全類似,定義如下:已知Y為指數(shù)分布族響應變量,X1,X2…,Xn為解釋變量,μ =E(Y),η =g(μ),有
其中:g(·)稱為聯(lián)結函數(shù),β0,β1,…βr為待估參數(shù),該模型即為廣義線性模型。每一個廣義線性模型都包括以下三個要素:
(1)隨機成分,即響應變量Y或誤差項的概率分布。響應變量會受到自身隨機成分的影響。廣義線性模型允許響應變量的隨機波動呈現(xiàn)指數(shù)族分布特征,即
指數(shù)族分布包括許多常見分布,如正態(tài)分布、泊松分布、逆高斯分布、二項分布、伽瑪分布等。
(2)系統(tǒng)成分,即自變量的線性組合。響應變量和解釋變量之間具有某種顯著的相關關系,而且假設這種相關關系可以用解釋變量的線性組合來表示
(3)聯(lián)結函數(shù),有機地聯(lián)接隨機成分和系統(tǒng)成分之間的關系,這種連接的構造通過描述yi的期望和線性預測ηi之間的關聯(lián)獲得,即
可見,廣義線性模型對響應變量的預測值并不直接等于解釋變量的線性組合,而是該線性組合的一個函數(shù)變換。
使用極大似然法進行參數(shù)估計,共涉及r+2個參數(shù),其中 r+1 個是回歸參數(shù) β0,β1,…,βr,一個是離散參數(shù)φ。在總體分布已知的情況下,離散參數(shù)φ已知。
廣義線性模型的似然函數(shù)為
對數(shù)似然函數(shù)為
通過聯(lián)結函數(shù)的作用(1)中θi和a(θi)分別是β0,β1,…,βr的函數(shù),使 l(β,φ)達到最小的 β^0,β^1,…,β^
r即為 β0,β1,…,βr的極大似然估計值。
對廣義線性模型的極大似然估計進行一階近似,可以發(fā)現(xiàn)其近似等于線性方程g(Y)=Xβ的加權最小二乘估計。推導計算得出β的最小二乘估計值為權重 W 為
在廣義線性模型中,響應變量的方差是其均值的函數(shù),這一特點很適合保險公司的數(shù)據(jù)。在車險費率厘定過程中,一般需要估計索賠次數(shù)、索賠頻率、次均賠款和續(xù)保率等,根據(jù)這些數(shù)據(jù)各自的特點,所采用的廣義線性模型也不盡相同。
在估計索賠次數(shù)或索賠頻率時,典型的廣義線性模型是泊松乘法模型;在估計次均賠款時,典型的廣義線性模型是伽瑪乘法模型;在估計續(xù)保率和新業(yè)務的轉換率時,典型的廣義線性模型是Logistic模型。
我國多數(shù)保險公司保單信息不完整,數(shù)據(jù)庫系統(tǒng)中的部分影響因素數(shù)據(jù)缺乏,因此不能對上述提到的全部影響因素進行建模,只能挑選其中重要因素進行分析。本文以國內(nèi)某保險公司2006年機動車輛保險中非運營車輛的簡單歷史理賠資料為樣本,對數(shù)據(jù)進行初步的統(tǒng)計整理后發(fā)現(xiàn),影響車險費率的因素主要有四類,分別是:車輛行駛里程數(shù)、車型、被保險人的年齡、車輛所屬地區(qū)。
4.2.1 從車因素
(1)車輛行駛里程數(shù)分為五個水平:a1~a5分別代表:年行駛10 000千米以下、10 000~15 000、15 000~20 000、20 000~25 000、25 000千米以上;
(2)車型分為七個水平:b1~b7分別代表7種類型的機動車,由于原始數(shù)據(jù)中車型太多,在進行數(shù)據(jù)整理的過程中使用車輛價格作為分類標準,b1~b7所代表的車的價格分別為5萬以下、5~10、10~20、20~30、30~40、40~50、50萬以上。
4.2.2 從人因素
駕駛人年齡分為七個水平:c1~c7代表的年齡段分別為20歲以下、20~24、25~29、30~34、35~39、40 ~49、50歲以上。
4.2.3 從地因素
車輛所屬地區(qū)分為七個水平:原始數(shù)據(jù)中的車輛分別取自我國內(nèi)地31個省市,根據(jù)各省會氣候地理位置、人口密度、經(jīng)濟發(fā)展水平等因素,將31個省市分為7個水平,d1~d2分別代表人口密度逐步遞減的7個水平,其中d1包括上海、北京、廣州、福建、湖北、江蘇,d2包括天津、河南、四川、陜西、山東,d3包括安徽、江西、海南、河北、遼寧、湖南,d4包括山西、貴州、浙江、重慶、吉林,d5包括廣西、青海、云南、甘肅,d6包括黑龍江、烏魯木齊、寧夏、內(nèi)蒙古,d7僅為西藏。
使用廣義線性模型估計保險費率,一般從索賠頻率和索賠額度兩個方面建立模型,下面分別介紹。
4.3.1 索賠頻率模型
對索賠頻率數(shù)據(jù)使用SAS的GENMOD過程構建廣義線性模型[7],分布函數(shù)分別使用正態(tài)分布和泊松分布,連接函數(shù)為對數(shù)連接。不同分布下的擬合優(yōu)度比較見表1。
從表1可以看出,正態(tài)分布假設下索賠頻率的離差比泊松分布假設下大得多,所以擬合優(yōu)度比較差,因此在使用索賠頻率數(shù)據(jù)進行廣義線性模型分析時應選擇泊松分布假設。
將整理后的數(shù)據(jù)導入SAS系統(tǒng)構建廣義線性模型,使用GENMOD過程得到下面的估計結果:
表2 索賠頻率的估計結果
表2顯示,參數(shù)各個水平的估計結果絕大多數(shù)都能通過置信水平為1%的顯著性檢驗,只有地區(qū)因素中第四個水平的P值為0.08,其P值較大,可能是選取的樣本中這個地區(qū)的數(shù)據(jù)比較少??傮w來說選擇的模型能較好地擬合該公司的歷史數(shù)據(jù),并能據(jù)此厘定車險費率。
可以看到四個參數(shù)最后一個水平的自由度均為0,導致這一現(xiàn)象的原因可能是由于模型矩陣中對應于該參數(shù)的列與該參數(shù)之前的那個參數(shù)對應的列是相關的,因此SAS運行的結果會指定該參數(shù)為零自由度,此時參數(shù)估計和標準誤差均為0。除去這一情況我們對四個參數(shù)的其他各個水平的估計結果進行分析:
(1)行駛里程數(shù)在15 000~20 000千米,20 000~25 000千米這兩個段中的估計值明顯大于前面兩個段的估計值,這是因為機動車輛行駛里程越大,車輛的磨損就越嚴重,所導致的出險概率也會越高。
(2)車價越高,索賠頻率的估計值越小,這是因為車價越高一般來說車的性能也越好,出險概率會越低。表2中10~20萬的車輛索賠頻率的估計值為0.103 9,在這6個水平中最低,這可能是因為選取的數(shù)據(jù)中這個價格段的車輛比較多。
(3)從駕駛員年齡看,20歲以下的駕駛員索賠頻率的估計值為1.480 6,是6個水平中出險頻率最高的,這與年少者逞強好勝的心理、開車速度快有很大關系,30~34歲估計值最小,此后隨著年齡的增長,生理機能逐漸衰退,應對突發(fā)事件的反應不如年輕人敏捷,所以風險也越大。
(4)從地區(qū)因素看,d1~d7各個地區(qū)的人口密度逐步遞減,損失頻率也基本上呈現(xiàn)遞減的趨勢,第一類城市都是人口密度大、交通擁堵現(xiàn)象比較明顯的地區(qū),它的估計值明顯超出后面幾個水平。
4.3.2 索賠額度模型
對索賠額度數(shù)據(jù)使用SAS的GENMOD過程構建廣義線性模型,連接函數(shù)為對數(shù)連接,分布函數(shù)分別使用伽瑪分布和逆高斯分布。不同分布下的擬合優(yōu)度比較見表3:
表3 索賠額度兩種假設分布下的擬合優(yōu)度比較
表3顯示,逆高斯分布假設下的離差比伽瑪分布假設大得多,因此伽瑪分布假設下模型的擬合優(yōu)度較好,所以在使用索賠額度數(shù)據(jù)進行廣義線性模型分析時應選擇伽瑪分布假設。
同樣將整理后的數(shù)據(jù)導入SAS系統(tǒng)構建廣義線性模型,使用GENMOD過程得到下面的估計結果:
表4 索賠額度的參數(shù)估計值
在初次估計結果中,一些因素水平?jīng)]能通過顯著性檢驗,所以上面的估計結果是經(jīng)過多次數(shù)據(jù)合并后估計得到的。由上面的估計結果可以看出雖然有些因素水平的P值較大,但基本上都通過了95%的顯著性檢驗。下面對四個因素各個水平的估計結果進行分析:
(1)行駛里程越少,參數(shù)估計結果越小,這是由于車輛行駛磨損越小,出險的情況就越少,索賠的額度也相應越小。
(2)車價越高,索賠額度的估計值越大。這是因為一旦出現(xiàn)事故,高價車所需的修理費用是很高的,因此索賠額度也高。
(3)29歲以下的年輕人索賠額度較大,30~39歲之間的較小,因為此年齡段相對的平均損失成本較小,之后隨著年齡的增大,駕駛的平均損失成本隨之增大,所以40歲以上的駕駛員索賠額度又呈上升趨勢。
(4)人口稠密地區(qū)索賠額度較小;人口稀少地區(qū)索賠額度較大。這是因為人口稠密地區(qū)多是經(jīng)濟發(fā)達地區(qū),這些地區(qū)城市建設較好,路況相對來說也比較理想,所以機動車輛雖然由于交通擁堵出險概率較高,但是損失額度相對較小。
[1]Nelder J A,Wedderburn R W M.Generalized Linear Model[J].Journal of the Royal Statistical Society A,1972,135:370 -384.
[2]Anderson D.A Practitioner’s Guide to Generalized Linear Models[R].Discussion Paper on Applying and Evaluating Generalized Linear Models,2004:4 -82.
[3]毛澤春,劉錦尊.廣義線性模型與保費點數(shù)計價系統(tǒng)[J].統(tǒng)計研究,2002(6):23-25.
[4]曾輝,范興華.關于我國機動車輛保險費率厘定因素的思考[J].經(jīng)濟師,2003(2):22 -26.
[5]盧志義,劉樂平.廣義線性模型在非壽險精算中的應用及其研究進展[J].統(tǒng)計與信息論壇,2007(4):26 -29.
[6]孫佳美.對我國機動車輛保險費率厘定因素的思考[J].保險研究,2004(11):34-37.
[7]吳平,黃燕.SAS統(tǒng)計分析及應用[M].北京:機械工業(yè)出版社,2002.