湯宏順 楊杉
隨著我國(guó)人民保險(xiǎn)意識(shí)的逐步提升,國(guó)家加大了對(duì)保險(xiǎn)市場(chǎng)的政策支持力度,保險(xiǎn)公司迎來(lái)了更多的發(fā)展機(jī)遇,同時(shí)也面臨著全新的挑戰(zhàn)。如何在競(jìng)爭(zhēng)激烈開(kāi)放的環(huán)境中獲得競(jìng)爭(zhēng)優(yōu)勢(shì)和持續(xù)成長(zhǎng)能力成為保險(xiǎn)公司經(jīng)營(yíng)管理的核心問(wèn)題。續(xù)保數(shù)據(jù)對(duì)于保險(xiǎn)公司來(lái)說(shuō)十分重要,續(xù)保率是決定財(cái)產(chǎn)保險(xiǎn)公司經(jīng)營(yíng)業(yè)績(jī)的一個(gè)重要指標(biāo)。保險(xiǎn)公司可通過(guò)續(xù)保數(shù)據(jù)對(duì)公司業(yè)務(wù)進(jìn)行調(diào)整,以提高用戶(hù)對(duì)于公司業(yè)務(wù)的信賴(lài)以及粘性。本文主要利用SPSS軟件對(duì)某保險(xiǎn)公司的續(xù)保數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果給出建議。
分析工具
SPSS(Statistical Product and Service solutions),稱(chēng)為統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案。2000年以前稱(chēng)為“社會(huì)科學(xué)統(tǒng)計(jì)軟件包”(Statistical Package for the Social Science),是IBM公司推出的能夠提供統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測(cè)分析和決策支持任務(wù)的一種集成化計(jì)算機(jī)數(shù)據(jù)處理應(yīng)用軟件。EXCEL,在EXCEL中,數(shù)據(jù)的計(jì)算與處理都可以通過(guò)公式工具,實(shí)現(xiàn)自動(dòng)化處理,在數(shù)據(jù)處理工作中呈現(xiàn)出極大的便捷性。本文首先使用excel對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后利用SPSS將處理后的數(shù)據(jù)導(dǎo)入,進(jìn)行分析。
分析思路
以某保險(xiǎn)公司的續(xù)保數(shù)據(jù)為研究對(duì)象,先利用EXCEL對(duì)這些數(shù)據(jù)進(jìn)行預(yù)處理,主要是刪除掉一些臟數(shù)據(jù)。再用SPSS軟件對(duì)其21萬(wàn)條數(shù)據(jù)做分析。針對(duì)性別,過(guò)去三年年年收入,總保費(fèi),保額等運(yùn)用獨(dú)立樣本T檢驗(yàn)、區(qū)間估計(jì)、單因素方差、散點(diǎn)圖等方法分析該數(shù)據(jù)得出結(jié)論,提出建議。
數(shù)據(jù)來(lái)源
數(shù)據(jù)來(lái)源于某保險(xiǎn)公司。續(xù)保的這份數(shù)據(jù)共有21萬(wàn)條,16個(gè)字段,分別記錄了機(jī)構(gòu)、險(xiǎn)種、投保時(shí)間、繳費(fèi)、繳費(fèi)期限、投保份數(shù)、總保費(fèi)、保額、客戶(hù)號(hào)、性別、年齡、婚姻、過(guò)去三年平均年收入、教育程度、職業(yè)、家庭人口。其中婚姻狀態(tài)中的D是離婚、S是單身、M是結(jié)婚、R是再婚、W是喪偶、X是缺失??偙YM(fèi)是指投保人一共需要向保險(xiǎn)公司繳納的總額,保額是指保險(xiǎn)公司理賠的最高額度。對(duì)于過(guò)去三年的平均年收入做了脫敏處理,此數(shù)據(jù)并非真實(shí),可能是*0.5或縮小了其他的倍數(shù)(一般為降低收入)但總體趨勢(shì)相同。
數(shù)據(jù)清洗
因?yàn)樵摂?shù)據(jù)集數(shù)據(jù)量比較大可能會(huì)有一定的臟數(shù)據(jù)會(huì)對(duì)我們的分析產(chǎn)生影響。因此我通過(guò)運(yùn)用excel工具的定位條件判斷是否有空值并進(jìn)行刪除。通過(guò)對(duì)年齡進(jìn)行升序排序,運(yùn)用高級(jí)篩選功能對(duì)每一列的數(shù)據(jù)進(jìn)行查看查找出不合理的數(shù)據(jù)值做刪除處理,比如年齡為1,嬰幼兒,年收入?yún)s為30000元等等。通過(guò)簡(jiǎn)單的數(shù)據(jù)清洗后可以從數(shù)據(jù)中提取出更有意義的信息。
性別與過(guò)去三年年收入的關(guān)系
通過(guò)獨(dú)立樣本T檢驗(yàn)探究性別與于過(guò)去三年年收入關(guān)系分析。由組統(tǒng)計(jì)得: 男性的個(gè)案數(shù)為109361,平均值為14009.4023,標(biāo)準(zhǔn)偏差為47234.18995,標(biāo)準(zhǔn)誤差平均值為142.83191。女性的個(gè)案數(shù)為109117,平均值為13596.5685,標(biāo)準(zhǔn)偏差為58153.57646,標(biāo)準(zhǔn)誤差平均值為176.04765。由獨(dú)立樣本檢驗(yàn)中可得顯著性為0.069,大于0.05,則方差齊。顯著性>0.05,則性別與過(guò)去三年年收入在0.05顯著水平下不呈現(xiàn)差異。研究采用獨(dú)立樣本t檢驗(yàn)判斷性別與過(guò)去三年年收入的關(guān)系,結(jié)果顯示性別與過(guò)去三年年收入在0.05顯著性水平下不呈現(xiàn)差異,進(jìn)一步比較均值發(fā)現(xiàn),男性過(guò)去三年年收入平均值是大于女性過(guò)去三年年收入的,不過(guò)相差不多。所以性別與過(guò)去三年年收入關(guān)系并不大。
婚姻狀況與總保費(fèi)的關(guān)系
采用區(qū)間估計(jì)的數(shù)據(jù)方法分析婚姻狀況與總保費(fèi)的關(guān)系。對(duì)于婚姻狀況的不同,是否會(huì)影響總保費(fèi)。針對(duì)這一問(wèn)題,采用區(qū)間估計(jì)方法分析,由于這是一個(gè)比較分散的數(shù)據(jù),所以剔除500000以上的極大值來(lái)重新分析該箱型圖。
D(離婚)的總保費(fèi)整體是在一個(gè)偏低的水平集中,數(shù)據(jù)分布是在中位數(shù)以上分布的,中位數(shù)以上分布的較為密集,說(shuō)明總保費(fèi)較高的人差距是不大的。M(結(jié)婚)的總保費(fèi)整體是在一個(gè)偏高的水平集中,數(shù)據(jù)分布是在中位數(shù)以上分布的,中位數(shù)以上分布的較為稀疏,說(shuō)明總保費(fèi)較高的人差距是較大的。S(單身)的總保費(fèi)整體是在一個(gè)偏高的水平集中,數(shù)據(jù)分布是在中位數(shù)以上分布的,中位數(shù)以上分布的較為稀疏,說(shuō)明總保費(fèi)較高的人差距是較大的。W(喪偶)的總保費(fèi)整體是在一個(gè)偏高的水平集中,數(shù)據(jù)分布是在中位數(shù)以上分布的,中位數(shù)以上分布的較為密集,說(shuō)明總保費(fèi)較高的人差距是不大的。X(缺失)的總保費(fèi)整體是在一個(gè)偏高的水平集中,數(shù)據(jù)分布是在中位數(shù)以上分布的,中位數(shù)以上分布的較為稀疏,說(shuō)明總保費(fèi)較高的人差距是較大的。
通過(guò)區(qū)間估計(jì)的方法,說(shuō)明了婚姻狀況與總保費(fèi)之間有顯著差異。M(已婚)和X(缺失)的總體的總保費(fèi)較高,而D(離婚)和R(再婚)以及W(喪偶)的總保費(fèi)偏低。
年齡與保額的關(guān)系
利用單因素方差分析探究不同年齡段與保額之間的關(guān)系,首先對(duì)年齡、保額和進(jìn)行描述統(tǒng)計(jì),發(fā)現(xiàn)年齡跨度比較大,因而需對(duì)年齡進(jìn)行分段。分段依據(jù)為,18歲以下為一組,18-34歲為一組,35-59歲為一組,60歲以上為一組。
在方差齊性檢驗(yàn)下,發(fā)現(xiàn)顯著性值小于0.05(置信度為95%)。因而,方差不具有齊次性,所以要拒絕原假設(shè),在檢驗(yàn)多重性比較中選擇塔姆黑尼T2作為判斷參考依據(jù)。同時(shí)在方差分析信息表中,對(duì)不同年齡段的保額水平是否有顯著性差異進(jìn)行分析。發(fā)現(xiàn)顯著性值都小小于0.05。因而拒絕原假設(shè):不同年齡段的保額水平?jīng)]有顯著性差異,因此所以至少有兩種不同年齡段的保額水平是有顯著性差異的。