許菁
續(xù)保即投保人在原合同期滿前或期滿時(shí)與保險(xiǎn)人重新約定保險(xiǎn)權(quán)利義務(wù)關(guān)系,簽訂協(xié)議并收取保險(xiǎn)費(fèi),一般被理解為繼續(xù)投?;蚶m(xù)簽合同。續(xù)保率從一定程度可以反映出一家保險(xiǎn)公司的業(yè)務(wù)穩(wěn)定程度和對(duì)原有客戶的保留能力。作為車險(xiǎn)這一獨(dú)特的險(xiǎn)種來說,續(xù)保率并不十分理想。為爭奪客戶,許多保險(xiǎn)公司甚至出現(xiàn)了虧本經(jīng)營的現(xiàn)象。但在利潤虧損的情況下續(xù)保率依舊不高。因此,在信息化技術(shù)飛速發(fā)展的現(xiàn)代,續(xù)保率的提升需要采用更加科學(xué)的數(shù)字化手段通過構(gòu)建和分析模型來解決。
針對(duì)問題一,通過對(duì)歷史客戶數(shù)據(jù)的可視化操作和相關(guān)性檢驗(yàn),對(duì)影響因素做出判斷并構(gòu)建相關(guān)蟻群神經(jīng)網(wǎng)絡(luò)模型,應(yīng)用蟻群算法對(duì)神經(jīng)網(wǎng)絡(luò)的待求參數(shù)進(jìn)行優(yōu)化求解,并據(jù)此對(duì)用戶屬性以及續(xù)保率做出精準(zhǔn)預(yù)測(cè);
針對(duì)問題二,在現(xiàn)實(shí)生活中由于保險(xiǎn)公司的優(yōu)惠政策,很多車主在自己的車險(xiǎn)快到期或已到期時(shí)便在轉(zhuǎn)保與續(xù)保之間徘徊。在得出續(xù)保用戶的判斷的基礎(chǔ)上,利用用戶的相關(guān)參數(shù)分析,預(yù)測(cè)出不同用戶群體的續(xù)保情況,并分析其中未續(xù)保客戶與續(xù)??蛻舻牟町?,引入基于負(fù)二項(xiàng)模型改進(jìn)的獎(jiǎng)懲系統(tǒng),從而吸引客戶進(jìn)行長期續(xù)保,進(jìn)而達(dá)到提升客戶續(xù)保率的效果。
一、問題重述
目前,車險(xiǎn)一般可占財(cái)險(xiǎn)公司業(yè)務(wù)的70%到80%,車險(xiǎn)市場歷來是財(cái)險(xiǎn)公司的兵家必爭之地。以往,財(cái)險(xiǎn)公司為了贏得市場,往往采取低價(jià)、折扣等方式來爭搶客戶。但是此舉使得利潤急劇下降,甚至有些企業(yè)呈現(xiàn)虧損狀態(tài)。因此大多數(shù)車企為了提高利潤率開始重視承保車輛的質(zhì)量,此做法,其實(shí)是險(xiǎn)企科學(xué)發(fā)展觀的重要體現(xiàn),也是市場競爭下的企業(yè)合理行為。此舉在一定程度上展現(xiàn)對(duì)故障率小的客戶不公平對(duì)待,極大的影響客戶的續(xù)保率。
由此可以預(yù)見未來車險(xiǎn)行業(yè)的幾大發(fā)展趨勢(shì):
(一)車險(xiǎn)價(jià)格與駕駛行為密切相關(guān)
未來的車險(xiǎn)定價(jià)將逐漸變?yōu)椤皬娜酥髁x”。車險(xiǎn)的定價(jià)因素將直接與駕駛?cè)说鸟{駛習(xí)慣與行駛里程掛鉤,通過駕駛行為來判定車險(xiǎn)價(jià)格。一個(gè)具有良好駕駛習(xí)慣的車主,則會(huì)在原本保費(fèi)的基礎(chǔ)上繼續(xù)上漲。
(二)同價(jià)位車型車險(xiǎn)價(jià)格完全不同
國內(nèi)傳統(tǒng)的汽車保險(xiǎn)定價(jià),通常是以車型和其購置價(jià)為主要依據(jù)。未來中國車險(xiǎn)業(yè),同樣的一款車,不同的人開,保費(fèi)價(jià)格會(huì)完全不同。
信息時(shí)代的到來,可以通過數(shù)字化技術(shù)來更加精準(zhǔn)地了解客戶,制定營銷和服務(wù)方案。以此信息建立模型,解答以下問題:
1.建立合理的數(shù)學(xué)模型,對(duì)相關(guān)數(shù)據(jù)中的客戶進(jìn)行精準(zhǔn)畫像,給出客戶的續(xù)保概率。
2.從保險(xiǎn)實(shí)務(wù)角度看,人們更關(guān)心保費(fèi)和索賠額的折現(xiàn)價(jià)值、投保者的初
始保費(fèi)等級(jí)等因素,為了提高續(xù)保概率,針對(duì)不同的客戶設(shè)計(jì)不同的優(yōu)惠和福利方案。
二、問題分析
通過對(duì)相關(guān)數(shù)據(jù)分析,發(fā)現(xiàn)有一些因素對(duì)續(xù)保率影響不大,所以需采用互信息熵以篩選出對(duì)續(xù)保率影響相對(duì)較為顯著的影響屬性。熵是信息論的中心概念,是變量的不確定性的度量?;バ畔⑹切畔⒄摾镆环N有用的信息度量,指兩個(gè)事件集合之間的相關(guān)性。因此常用于計(jì)算語言學(xué)模型分析,度量兩個(gè)對(duì)象之間的相互性。
在確定影響元素后,對(duì)客戶續(xù)保概率進(jìn)行預(yù)測(cè)。BP神經(jīng)網(wǎng)絡(luò)是是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),目前多應(yīng)用于用輸入向量和相應(yīng)的輸出向量訓(xùn)練一個(gè)網(wǎng)絡(luò)逼近一個(gè)函數(shù)。但是也存在一些主要缺陷首先是其學(xué)習(xí)速度慢,即使是一個(gè)簡單的問題,一般也需要幾百次甚至上千次的學(xué)習(xí)才能收斂,其次是容易陷入局部極小值。但蟻群算法具有全局最優(yōu)化以及啟發(fā)式尋優(yōu)的特征,可以達(dá)到神經(jīng)網(wǎng)絡(luò)模型的全局尋優(yōu)目的。
在上述預(yù)測(cè)客戶續(xù)保率的基礎(chǔ)上,要最終達(dá)到提高續(xù)保率的目的,需根據(jù)其影響因素對(duì)投保人進(jìn)行分組,形成若干個(gè)相對(duì)同質(zhì)的風(fēng)險(xiǎn)集合,并厘定各組的先驗(yàn)保費(fèi);在此基礎(chǔ)上根據(jù)投保人的索賠記錄對(duì)其每年的續(xù)保保費(fèi)進(jìn)行調(diào)整,該制度即為傳統(tǒng)意義上的獎(jiǎng)懲系統(tǒng)。保費(fèi)厘定涉及兩個(gè)方面:一是確定基本保費(fèi),二是確定續(xù)期保費(fèi),其中續(xù)期保費(fèi)由獎(jiǎng)懲系統(tǒng)決定。因而一個(gè)公平的獎(jiǎng)懲制度至關(guān)重要。然而BMS保費(fèi)的確定只是依賴于以往各年度的索賠總次數(shù),卻與索賠各年度的分布情況無關(guān)。這中對(duì)信息利用的不充分,會(huì)使某些客戶對(duì)車險(xiǎn)公司的保費(fèi)累計(jì)遠(yuǎn)超其他客戶,從而造成不公平對(duì)待,使得續(xù)保率無法提高甚至下降。
對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析,保單中的索賠次數(shù)分布為具有參數(shù)的負(fù)二項(xiàng)分布并采用負(fù)二項(xiàng)模型并對(duì)其改進(jìn),建立公平BMS,在各個(gè)因素充分考慮的情況下,保證具有相同情況的客戶在相同投保期限內(nèi)對(duì)車企公司有相同的保費(fèi)積累,情況有所差異的客戶在相同投保期限內(nèi)對(duì)車企公司有相同的保費(fèi)積累,從而達(dá)到客戶之間的公平對(duì)待,以保證續(xù)保率。
三、模型假設(shè)
(一)假設(shè)蟻群算法的開始全部蟻群從蟻巢出發(fā)去尋找食物;
(二)假設(shè)所有車險(xiǎn)續(xù)保率的影響因素均已由附件給出;
(三)假設(shè)在得出關(guān)聯(lián)度之前所有的屬性之間均為相互獨(dú)立的;
(四)假設(shè)保單組合中的每份保單的索賠頻率不相同;
(五)忽略貨幣的時(shí)間價(jià)值因素。
四、模型的建立與求解
(一)模型一的建立與求解
根據(jù)客戶數(shù)據(jù)信息,首先對(duì)用戶信息進(jìn)行數(shù)據(jù)預(yù)處理——空缺值補(bǔ)全以及非數(shù)值屬性數(shù)據(jù)信息編碼。在補(bǔ)全的過程中,對(duì)于部分空缺值根據(jù)具體的取值含義填充為0,或根據(jù)需要填充眾數(shù);在屬性數(shù)據(jù)時(shí),應(yīng)先提取出數(shù)據(jù)的幾種不同取值,根據(jù)需要填充相應(yīng)的數(shù)字,為了保證數(shù)據(jù)的有效性,應(yīng)該在填充后對(duì)數(shù)據(jù)進(jìn)行歸一化到區(qū)間[0,1]中以方便處理,歸一化公式如下:
對(duì)于所用28維數(shù)據(jù),按照以下幾條原則和方法對(duì)于數(shù)據(jù)進(jìn)行了屬性選擇以及維度規(guī)約:
1.根據(jù)數(shù)據(jù)本身的特征,去除影響因素:“保單號(hào)”、“起保日期”、“終止日期”、“風(fēng)險(xiǎn)類別”;
2.根據(jù)常見汽車保險(xiǎn)知識(shí),去除影響因素:“品牌”、“車系”。
經(jīng)過上述數(shù)據(jù)規(guī)約以及清洗,通過相似性度量算法對(duì)于剩余的22個(gè)屬性分
別與“是否續(xù)?!边M(jìn)行計(jì)算,取互信息值最大前10個(gè)影響因素作為接下來蟻群神經(jīng)網(wǎng)絡(luò)模型的輸入進(jìn)行預(yù)測(cè)。
由于不同屬性的熵值變化較大。對(duì)于給定的問題沒有統(tǒng)一的衡量標(biāo)準(zhǔn),較難設(shè)定一個(gè)準(zhǔn)確的閾值來真正反映出這樣的信息,故將X、Y的互信息重新定義如下:
根據(jù)計(jì)算結(jié)果可得,最終選定排名前5的影響因素分別為:
表5.1 最終影響因素
根據(jù)以上結(jié)果,初步將處理后計(jì)算結(jié)果合理,故可以將最終影響因素作為輸入數(shù)據(jù)輸入到蟻群神經(jīng)網(wǎng)絡(luò)中。
BP網(wǎng)絡(luò),即用逆誤差傳播(error BackPropagation,簡稱BP)算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)。若用E表示神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集上的誤差,則它顯然是關(guān)于連接權(quán)重w和閾值的一個(gè)函數(shù)。此時(shí)對(duì)于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程可看作一個(gè)參數(shù)尋優(yōu)的過程,即在參數(shù)空間中,尋找一組最優(yōu)參數(shù)使得E最小,常用的求解方法是使用梯度下降法搜索最優(yōu)值。關(guān)于局部極小的定義如下:若對(duì)于和,存在使得:都有成立,則為局部極小解。
蟻群神經(jīng)網(wǎng)絡(luò)通過引用蟻群算法,可以有效地解決這一問題。在求解中,初始化蟻群數(shù)目等于訓(xùn)練集中數(shù)據(jù)的實(shí)例數(shù),同時(shí)根據(jù)相關(guān)研究:螞蟻數(shù)目大于30并逐漸增大時(shí),蟻群算法尋找最優(yōu)解的性能雖仍在不斷改善,但改善效果并不是特別明顯。當(dāng)城市節(jié)點(diǎn)數(shù)為螞蟻數(shù)目的1.5倍時(shí),蟻群算法的全局收斂性和收斂速度都比較好。
在設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)時(shí),考慮到經(jīng)驗(yàn)公式。本實(shí)驗(yàn)中,隱含層的數(shù)目應(yīng)該為[4,13]之間;利用Matlab設(shè)計(jì)一個(gè)隱含層神經(jīng)元數(shù)目可變的BP網(wǎng)絡(luò),隱含層和輸出層的激活函數(shù)為sigmoid函數(shù)經(jīng)過反復(fù)試驗(yàn),得出最佳隱含層數(shù)目為8??紤]到模型效率和精確度的問題,在實(shí)驗(yàn)中給定,隱層神經(jīng)元數(shù)目。
(二)模型二的建立與求解
對(duì)于問題二,在模型一求解的基礎(chǔ)上,根據(jù)續(xù)保率的影響因素及其互信息值對(duì)傳統(tǒng)的BMS模型進(jìn)行改進(jìn)。而保人年齡、性別等續(xù)保率的影響因素,最終會(huì)以索賠次數(shù)以及金額的形式展現(xiàn)出,所以在對(duì)BMS模型改進(jìn)時(shí)僅考慮其索賠次數(shù)各年度分布情況最優(yōu),以及索賠額大小最優(yōu)。
首先對(duì)于索賠頻率最優(yōu),首先需確定保單變化規(guī)律為服從參數(shù)負(fù)二項(xiàng)分布。對(duì)于一個(gè)第一次投保的客戶,因無各年度的索賠頻率記錄,由此可按照如下公式將其保費(fèi)進(jìn)行初步估計(jì)定價(jià)。
在客戶從第二年至(n+1)年有相同保費(fèi)累計(jì)的情況下,據(jù)上述分析該次估計(jì)定價(jià)應(yīng)為,此次累計(jì)保費(fèi)為,則該次續(xù)保費(fèi)用計(jì)算公式為:
其次考慮索賠額大小最優(yōu),據(jù)數(shù)據(jù)分析得知,每份保單服從參數(shù)為的指數(shù)分布,在每一組保單中的值有差異,分別服從α2和β2的伽瑪分布,則保單索賠額服從如下Pareto分布
對(duì)于一個(gè)第一次投保的客戶,因無各年度的索賠頻率記錄,可根據(jù)Pareto分布的均值進(jìn)行初步預(yù)測(cè)估計(jì),其中α2和β2可由保單組合中歷史記錄進(jìn)行估計(jì)。由Bayes定理,根據(jù)保單的k此索賠記錄,可計(jì)算出保單的后驗(yàn)分布,如下式所示其中,為安全附加系數(shù)。
綜上所述,車險(xiǎn)企業(yè)在設(shè)計(jì)優(yōu)惠方案時(shí)應(yīng)注重以下幾個(gè)方面的改進(jìn):
1.同價(jià)位車型車險(xiǎn)價(jià)格根據(jù)其他影響因素有所差別
根據(jù)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理得知,傳真正影響索賠額的索賠概率缺主要依賴于不同客戶本身的駕駛行為,以及客戶本身的年齡、性別等因素。因此在制定方案時(shí)應(yīng)相應(yīng)地為駕駛行為良好的客戶降低保費(fèi)。
2.考慮索賠額因素
目前我國很少有企業(yè)考慮其索賠金額,如此以來也會(huì)造成對(duì)索賠金額少的客戶不公平對(duì)待,導(dǎo)致客戶流失續(xù)保率下降。建議可以規(guī)定一個(gè)臨界值,界上和界下區(qū)別對(duì)待。
五、誤差分析
通過實(shí)驗(yàn),將模型一與原始的BP神經(jīng)網(wǎng)絡(luò)在同一訓(xùn)練集和測(cè)試集上進(jìn)行對(duì)比,結(jié)果如下表:
由此可見,模型一在實(shí)現(xiàn)了續(xù)保率預(yù)測(cè)的基礎(chǔ)上提升了原有BP神經(jīng)網(wǎng)絡(luò)的收斂效率,在解決了局部最優(yōu)問題的基礎(chǔ)上降低了樣本誤差。模型訓(xùn)練誤差基本滿足要求,模型可行。 (作者單位:西北師范大學(xué))