四川大學(xué)錦城學(xué)院計(jì)算機(jī)與軟件學(xué)院 黎 磊 楊 杉
以四川人壽保險(xiǎn)續(xù)保數(shù)據(jù),對(duì)續(xù)保人員的各項(xiàng)信息數(shù)據(jù)結(jié)合大數(shù)據(jù)進(jìn)行營(yíng)銷(xiāo)策略的制定,對(duì)不同條件情況的客戶(hù)采取最合適且有利的保險(xiǎn)措施。采用spss對(duì)不同情況的客戶(hù)進(jìn)行分析對(duì)比,可以更加直觀的總結(jié)出不同情況的客戶(hù)更適合于哪種類(lèi)型的保險(xiǎn)與四川人壽保險(xiǎn)公司續(xù)??蛻?hù)中的客戶(hù)畫(huà)像,使四川仁壽保險(xiǎn)公司做出更利于提高續(xù)保率的調(diào)整與盡可能避免大金額賠付情況的出現(xiàn),實(shí)現(xiàn)公司利益最大化。
保險(xiǎn),作為國(guó)民經(jīng)濟(jì)的一個(gè)重要組成部分,是社會(huì)再生產(chǎn)中一個(gè)不可缺少的環(huán)節(jié),保險(xiǎn)市場(chǎng)的發(fā)展,是與國(guó)家的經(jīng)濟(jì)、政治與社會(huì)發(fā)展?fàn)顩r緊密相連的,并滲透到經(jīng)濟(jì)社會(huì)的各個(gè)領(lǐng)域。而伴隨著中國(guó)經(jīng)濟(jì)的快速發(fā)展,我國(guó)公民的保險(xiǎn)意識(shí)也越來(lái)越高,保險(xiǎn)行業(yè)進(jìn)入了一個(gè)快速發(fā)展的階段,人壽保險(xiǎn)作為保險(xiǎn)業(yè)中重要的一員,也得到了大力發(fā)展。目前,隨著保險(xiǎn)業(yè)的地位越來(lái)越重要,人們對(duì)人身保險(xiǎn)的需求也日益增多。在快速發(fā)展的時(shí)代中,每位公民都或多或少的都了解或購(gòu)買(mǎi)過(guò)不同險(xiǎn)種的保險(xiǎn)來(lái)保障自己的基本安全。人身保險(xiǎn)可以在人們面臨各種重大風(fēng)險(xiǎn)或因意外事故造成損失時(shí),作為一種經(jīng)濟(jì)保障制度及時(shí)給予經(jīng)濟(jì)上的補(bǔ)償,分散了人們面臨的各種風(fēng)險(xiǎn),且彌補(bǔ)了人們的不幸損失,對(duì)人們未來(lái)生活的焦慮起到消除或緩解作用。而為了應(yīng)對(duì)種種突發(fā)情況的產(chǎn)生以及賠付金的產(chǎn)生,需要通過(guò)對(duì)不同的客戶(hù)進(jìn)行合適的辦理保險(xiǎn)前的準(zhǔn)備,并在續(xù)保階段進(jìn)行合適的調(diào)整,公司以保障客戶(hù)雙方的利益最大化。
以四川人壽保險(xiǎn)續(xù)保數(shù)據(jù)為研究對(duì)象,對(duì)該保險(xiǎn)公司某年度的客戶(hù)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。采用spss對(duì)不同年齡段,不同性別,不同婚姻狀況,不同險(xiǎn)種,不同費(fèi)用類(lèi)型與不同總保費(fèi)等數(shù)據(jù)進(jìn)行分析對(duì)比,對(duì)不同的客戶(hù)個(gè)體采取適當(dāng)?shù)谋kU(xiǎn)實(shí)施條件,采取針對(duì)性的措施避免客戶(hù)流失,提高客戶(hù)的續(xù)保率,實(shí)現(xiàn)公司與客戶(hù)雙方利益最大化。
數(shù)據(jù)來(lái)源于四川人壽保險(xiǎn)年度客戶(hù)數(shù)據(jù),覆蓋了21余萬(wàn)條保險(xiǎn)數(shù)據(jù),數(shù)據(jù)表中包含了機(jī)構(gòu)、險(xiǎn)種、案件號(hào)、保單號(hào)、賠款金額、賠款時(shí)間、出險(xiǎn)原因、費(fèi)用類(lèi)型、費(fèi)用金額、總保費(fèi)、保額、客戶(hù)號(hào)、性別、年齡、婚姻狀況、過(guò)去三年平均年收入與職業(yè)16個(gè)字段,數(shù)據(jù)大小17.4M。
在數(shù)據(jù)表中,存在許多我們分析所使用不到的數(shù)據(jù)和一些錯(cuò)誤數(shù)據(jù)?,F(xiàn)實(shí)世界中臟數(shù)據(jù)無(wú)處不在,數(shù)據(jù)不正確或者多個(gè)會(huì)嚴(yán)重影響數(shù)據(jù)分析的結(jié)果,從而產(chǎn)生消極作用。所以在進(jìn)行數(shù)據(jù)分析前需要進(jìn)行對(duì)臟數(shù)據(jù)的處理,刪除與本次分析無(wú)較大的關(guān)系的索引列。
3.1.1 數(shù)據(jù)處理
由于續(xù)保數(shù)據(jù)中各條續(xù)保數(shù)據(jù)的年齡不同且有一定的差異,無(wú)法將每一個(gè)年齡設(shè)置為一個(gè)參數(shù),所以在進(jìn)行系統(tǒng)分析之前,需要將年齡索引列進(jìn)行一定的處理:將年齡依據(jù)所有年齡數(shù)據(jù)的四分位數(shù)進(jìn)行劃分。分別分為四個(gè)年齡階段:年齡年齡區(qū)間一:最低年齡至35歲;年齡年齡區(qū)間二:36歲至39歲;年齡年齡區(qū)間三:40歲至45歲;年齡年齡區(qū)間四:46歲至最高年齡。
3.1.2 探索分析
通過(guò)使用探索分析,分析得出保額與年齡之間的關(guān)系。
3.1.3 結(jié)果分析
由分析結(jié)果可以明顯得出,4組數(shù)據(jù)偏度均大于0,為右偏分布(均值大于中位數(shù)大于眾數(shù)),說(shuō)明同組處于高保額的人較少,大部分人的保額低于平均保額。且4組數(shù)據(jù)峰度均大于0,說(shuō)明數(shù)據(jù)處于尖峰分布,樣本之間差異較大,高保額區(qū)域中的極端值較多,保費(fèi)更多的集中在保額數(shù)據(jù)的眾數(shù)周?chē)?。年齡區(qū)間一四分位距最大,說(shuō)明保費(fèi)獲得情況最為離散,年齡區(qū)間四的四分位距最小,說(shuō)明保費(fèi)獲得的情況最為集中。
可以得出,在續(xù)保數(shù)據(jù)中年齡區(qū)間三的保額平均值最大,年齡區(qū)間四的保額平均值最小。我們由常理可知,保額與總保費(fèi)有一定的正相關(guān)關(guān)系,且與險(xiǎn)種有一定的關(guān)系。我認(rèn)為可以從中看出年齡區(qū)間三的客戶(hù)在選擇續(xù)保的時(shí)候,所繳納總保費(fèi)是較高的,且選擇續(xù)保的險(xiǎn)種是屬于可獲得保額較多的一類(lèi),由此可以看出:處于年齡區(qū)間三的客戶(hù)對(duì)于自身的人身保險(xiǎn)是比較看重的,而從我們的年齡劃分區(qū)間中我們可以看出,年齡區(qū)間三的客戶(hù)正好處于上有老養(yǎng),下有兒育的情況,而自己很有可能就是家里的頂梁柱,所以為了避免意外情況的發(fā)生,自己進(jìn)行續(xù)保保額較大的保險(xiǎn)來(lái)保障自己家庭的安全。
3.2.1 數(shù)據(jù)處理
由于在續(xù)保數(shù)據(jù)當(dāng)中,存在保額為空或者總保費(fèi)為空,去除掉空數(shù)據(jù)后再進(jìn)行數(shù)據(jù)分析。而為了探索保額與總保費(fèi)之間的關(guān)系,所以使用相關(guān)性分析分析總保費(fèi)與保額之間的關(guān)系。
3.2.2 相關(guān)分析
雙變量相關(guān)性分析分析保額與總保費(fèi)的關(guān)系,得出總保費(fèi)與保額之間的皮爾遜相關(guān)性為0.271,阿爾法值為0.01的情況下,雙尾顯著性為0<0.01,可以得出保額與總保費(fèi)之間有較強(qiáng)的正相關(guān)關(guān)系,客戶(hù)在續(xù)保時(shí)所繳納的總保費(fèi)金額越大,得到保障的保額金額也就越大。
3.2.3 結(jié)果分析
當(dāng)客戶(hù)在續(xù)保時(shí),所繳納的總保費(fèi)與得到保障的保額金額存在較強(qiáng)的正相關(guān)關(guān)系,所以在客戶(hù)進(jìn)行續(xù)保的辦理時(shí),可以針對(duì)與客戶(hù)的期望保額來(lái)推薦應(yīng)該繳納的總保費(fèi)。由于現(xiàn)在知道保額與總保費(fèi)之間有較大的正相關(guān)關(guān)系,那么是否可以使用一定的表達(dá)式來(lái)得出不同年齡,不同險(xiǎn)種,繳納不同的總保費(fèi)所受保障的保額有多少。
3.3.1 數(shù)據(jù)處理
線(xiàn)性回歸分析需要所有參數(shù)都是屬于數(shù)字型的,所以需要將險(xiǎn)種列轉(zhuǎn)換為數(shù)字型,使用自動(dòng)重新編碼將險(xiǎn)種列轉(zhuǎn)換為數(shù)字型的新列,再進(jìn)行線(xiàn)性回歸分析。
3.3.2 線(xiàn)性分析
使用線(xiàn)性回歸分析,將總保費(fèi)、年齡、險(xiǎn)種(數(shù)字型)放入自變量區(qū)域中,將保額放入因變量區(qū)域中,進(jìn)行分析。可以得出在線(xiàn)性回歸方程中的常量為22386.551;總保費(fèi)的系數(shù)為1.905;年齡的系數(shù)為-128.045;險(xiǎn)種(數(shù)字型)的系數(shù)為-236.037;所以我們可以得出下列線(xiàn)性方程:保額=22386.551+1.905×總保費(fèi)-128.045×年齡-236.037×險(xiǎn)種(數(shù)字型),從上述式子中我們可以看出,保額與總保費(fèi)是正相關(guān)關(guān)系,與年齡與險(xiǎn)種是負(fù)相關(guān)關(guān)系。驗(yàn)證了上述我們分析的兩個(gè)關(guān)系,并且用更加直觀的方式展示了其中的關(guān)系。
3.3.3 結(jié)果分析
由上述分析中,我們可以得出在續(xù)保時(shí),客戶(hù)繳納的總保費(fèi)、年齡、選擇的險(xiǎn)與最終收到保障的保額之間的關(guān)系??梢赃\(yùn)用這個(gè)式子在續(xù)保時(shí),針對(duì)客戶(hù)的各項(xiàng)指標(biāo)與他隨繳納的總保費(fèi)得出他可以獲得保障的保額,而客戶(hù)也可以通過(guò)自己的各項(xiàng)數(shù)據(jù)據(jù)和想要得到的保額的數(shù)據(jù)推出自己需要繳納多少的總保費(fèi)。
3.4.1 數(shù)據(jù)處理
刪除無(wú)意義列:刪除教育程度和家庭人口列,再進(jìn)行下列數(shù)據(jù)處理。先將所需分析的數(shù)據(jù)列進(jìn)行自動(dòng)重新編碼將所有的數(shù)據(jù)值轉(zhuǎn)換為數(shù)字類(lèi)型并將它們?cè)O(shè)為標(biāo)度類(lèi)型,便于后續(xù)的分析進(jìn)行。
3.4.2 相關(guān)分析
通過(guò)相關(guān)分析出與總保費(fèi)相關(guān)性較高的變量(如表1所示)。
表1 相關(guān)性分析
從表1中我們可以明顯看出,其中相關(guān)性系數(shù)較高的變量有:險(xiǎn)種、繳費(fèi)方式、性別、婚姻狀況、職業(yè)、保額、年齡、過(guò)去三年平均年收入、繳費(fèi)期限;相關(guān)性系數(shù)較低的有:投保份數(shù)。其中為正向相關(guān)的有:保額、年齡、過(guò)去三年平均年收入、險(xiǎn)種、繳費(fèi)方式、婚姻狀況;為負(fù)向相關(guān)的有:繳費(fèi)期限、性別、職業(yè)。
3.4.3 線(xiàn)性回歸
(1)使用線(xiàn)性回歸方法判斷因變量(總保費(fèi))與自變量(險(xiǎn)種、繳費(fèi)方式、性別、婚姻狀況、職業(yè)、保額、年齡、等變量相關(guān)性系數(shù)較高的變量)的線(xiàn)性關(guān)系。
(2)得出模型摘要表進(jìn)行分析(如表2所示)。
表2 線(xiàn)性回歸分析
分析可得:第5、6、7、8種模型R方最大,且第8種模型標(biāo)準(zhǔn)估算的錯(cuò)誤最小,所以通過(guò)兩樣數(shù)據(jù)的綜合,采取第8種模型進(jìn)行建模。
(3)得出方差分析表。
表3 方差分析表
分析可得:從表中可分析得出表中的顯著性都小于0.01,說(shuō)明這些變量能夠去建立有效模型。
(4)得出系數(shù)表(如表4所示)。
表4 系數(shù)表
在系數(shù)表中我們可以得出:保額的系數(shù)為:0.047 ;繳費(fèi)期限的系數(shù)為:-91.884;繳費(fèi)方式的系數(shù)為:102.563 ;過(guò)去三年平均收入的系數(shù)為:0.011 ;年齡的系數(shù)為:21.415 ;性別的系數(shù)為:-71.775;婚姻狀況的系數(shù)為:15.556常數(shù)項(xiàng)為:-398.289。
分析可得:可以看出表中顯著性值都小于0.01且為0,說(shuō)明回歸方程模型為有效模型。
3.4.4 結(jié)果分析
由上述的分析中,我們可以得出:可以有效的建立線(xiàn)性關(guān)系模來(lái)表示總保費(fèi)與其余索引的線(xiàn)性關(guān)系:總保費(fèi)=保額×0.047 +繳費(fèi)期限×(-91.884)+繳費(fèi)方式×-398.289 +過(guò)去三年平均收入×0.011 +年齡×21.415 +性別×(-71.775)+婚姻狀況×15.556-398.289 。在以后的風(fēng)險(xiǎn)評(píng)估中可以使用上述提供的線(xiàn)性關(guān)系進(jìn)行較為粗略的估計(jì)運(yùn)算,及時(shí)在續(xù)保階段做出最有利于雙方的調(diào)整,以保障雙方的利益最大化。
四川人壽保險(xiǎn)公司在續(xù)保階段時(shí),可以針對(duì)于客戶(hù)的年齡、婚姻狀況等數(shù)據(jù)進(jìn)行適當(dāng)?shù)恼{(diào)整,針對(duì)于老年人也可以推行出一些新的更加適合于老年人的保險(xiǎn)以供他們進(jìn)行續(xù)保,不但有益于提高續(xù)保率,也可以最大化的增加彼此的收益。而在進(jìn)行續(xù)保時(shí),可以先咨詢(xún)客戶(hù)的理想保額,再通過(guò)客戶(hù)的自身數(shù)據(jù)推出他應(yīng)該繳納的總保費(fèi)(通過(guò)保額、年齡、險(xiǎn)種推出應(yīng)該繳納的總保費(fèi)),在得出滿(mǎn)足條件的總保費(fèi)以后再通過(guò)線(xiàn)性回歸方程,算出客戶(hù)大概率繳納的總保費(fèi)(通過(guò)客戶(hù)的職業(yè)、險(xiǎn)種、婚姻狀況等變量推算出客戶(hù)大概率會(huì)繳納的總保費(fèi))。通過(guò)兩者的比較,可以及時(shí)的做出調(diào)整,以達(dá)到提高續(xù)保率,是雙方利益達(dá)到最大化。