• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于貨運(yùn)車輛高速通行數(shù)據(jù)保險(xiǎn)風(fēng)險(xiǎn)評估研究

      2024-12-11 00:00:00吳學(xué)寧朱倩倩劉英男蔡建軍
      時(shí)代汽車 2024年23期

      摘 要:貨運(yùn)車輛承載公路貨物運(yùn)輸是貨物供應(yīng)鏈中的關(guān)鍵運(yùn)輸環(huán)節(jié),與我國國民經(jīng)濟(jì)運(yùn)行、產(chǎn)業(yè)鏈條銜接、居民生活水平提升等有緊密關(guān)聯(lián)性。而貨運(yùn)車輛的高速通行數(shù)據(jù)是能夠記載貨運(yùn)車輛主要行駛行為的信息記錄。在車險(xiǎn)定價(jià)方面,貨運(yùn)車輛高速通行數(shù)據(jù)可以幫助保險(xiǎn)公司提升對貨運(yùn)車輛車險(xiǎn)的定價(jià)精算化,有助于提升保險(xiǎn)公司的營利性。本文主要研究方向聚焦于數(shù)據(jù)應(yīng)用的微觀方面,即貨運(yùn)車輛高速通行數(shù)據(jù)的在貨運(yùn)車輛保險(xiǎn)場景的應(yīng)用。

      關(guān)鍵詞:高速通行數(shù)據(jù) 貨運(yùn)車 車險(xiǎn)

      1 緒論

      在保險(xiǎn)行業(yè),一直以來,市場出現(xiàn)營運(yùn)貨車投保難引起廣泛關(guān)注。于此同時(shí),隨著車險(xiǎn)市場迅速發(fā)展,車險(xiǎn)產(chǎn)品配置逐漸達(dá)到飽和狀態(tài),且車險(xiǎn)產(chǎn)品同質(zhì)化現(xiàn)象較為嚴(yán)重,車險(xiǎn)市場亟待創(chuàng)新破局。當(dāng)前,從監(jiān)管到企業(yè),從外部到內(nèi)部,行業(yè)變化趨勢持續(xù)推動(dòng)商業(yè)車險(xiǎn)改革。

      當(dāng)前,對于保險(xiǎn)企業(yè)而言,因貨運(yùn)車輛的原有問題導(dǎo)致保險(xiǎn)公司對于商用車產(chǎn)品推廣、車險(xiǎn)定價(jià)和反欺詐等方面,存在薄弱環(huán)節(jié),限制了保險(xiǎn)企業(yè)對該類“邊緣市場”的滲透力度和發(fā)展規(guī)模。為解決該問題,本報(bào)告嘗試引入貨運(yùn)車輛高速通行數(shù)據(jù)結(jié)合其他已有數(shù)據(jù)嘗試進(jìn)行研究分析。

      2 數(shù)據(jù)來源及處理

      2.1 數(shù)據(jù)來源

      2.1.1 車輛理賠數(shù)據(jù)

      已經(jīng)獲取某保險(xiǎn)公司近一年的理賠數(shù)據(jù),其中包括理賠類型、理賠原因、地域分布等數(shù)據(jù),其利用保險(xiǎn)公司出險(xiǎn)數(shù)據(jù)持續(xù)優(yōu)化出險(xiǎn)模型。

      2.1.2 高速通行數(shù)據(jù)

      高速通行數(shù)據(jù)來源于交通運(yùn)輸部采集的動(dòng)態(tài)數(shù)據(jù),具有全覆蓋、實(shí)時(shí)性、真實(shí)性等特點(diǎn)[1]。覆蓋全國范圍高速通行車輛數(shù)據(jù),借助地面道路固定通信設(shè)施實(shí)現(xiàn)車輛與道路間的信息交互數(shù)據(jù),更新頻率從T+1和實(shí)時(shí)兩種頻率,具有較高的開放程度。因開放程度較高可以彌補(bǔ)保險(xiǎn)企業(yè)和行業(yè)內(nèi)數(shù)據(jù)共享不充分等問題。貨運(yùn)車輛高速通行數(shù)據(jù)整體來看,以2021年為例,全國超過3292萬輛貨車產(chǎn)生了20.74億條高速出入站通行記錄(不含門架通行記錄),月均超過2.1億條通行記錄,一型貨車高速通行次數(shù)占比達(dá)到42%。全國高速路網(wǎng)共計(jì)超過3292萬輛貨車產(chǎn)生貨物周轉(zhuǎn)量為2.78萬億噸公里??梢姅?shù)據(jù)量龐大,對于保險(xiǎn)場景的貨運(yùn)車輛基本可以實(shí)現(xiàn)全覆蓋。

      具體貨運(yùn)車輛高速通行數(shù)據(jù)包含的內(nèi)容包括入口通行數(shù)據(jù),出口通行數(shù)據(jù),門架通行數(shù)據(jù)。具體字段如下。

      入口通行數(shù)據(jù)包括的字段:通行標(biāo)識、通行介質(zhì)和OBU編碼即用于標(biāo)識通行車輛的編碼,入口標(biāo)簽時(shí)間和日期等時(shí)間字段,入口車輛型號、車牌、車型代碼、車種代碼和軸數(shù)等車輛信息,入口車輛的載重?cái)?shù)等車輛營運(yùn)信息,入口站名等入口站信息。

      出口通行數(shù)據(jù)包括的字段:通行標(biāo)識、通行介質(zhì)和OBU編碼即用于標(biāo)識通行車輛的編碼,出口標(biāo)簽時(shí)間和日期等時(shí)間字段,出口車輛型號、車牌、車型代碼、車種qz61b+UBxIffdcd6zrQM1HBk/J1yH6RW66BmBaEWcoU=代碼和軸數(shù)等車輛信息,出口車輛的載重?cái)?shù)等車輛營運(yùn)信息,出口站名等入口站信息。

      門架通行數(shù)據(jù)包括的字段:通行標(biāo)識、通行介質(zhì)和OBU編碼即用于標(biāo)識通行車輛的編碼,通過門架的時(shí)間和日期等時(shí)間字段,門架通過時(shí)的車輛型號、車輛編號、車牌、車型代碼、車種代碼和軸數(shù)等車輛信息,行駛速度、計(jì)費(fèi)里程數(shù)等車輛營運(yùn)信息,門架類型、門架編號等門架信息。

      2.2 數(shù)據(jù)處理

      數(shù)據(jù)處理主要包含兩方面工作,缺失值處理與異常值處理。數(shù)據(jù)缺失是數(shù)據(jù)分析與建模經(jīng)常遇到的問題,缺失值一般分為真缺失與假缺失,在處理缺失值的時(shí)候就要根據(jù)具體需求而定。具體采用如下幾種方法進(jìn)行處理:

      均值/中位數(shù)補(bǔ)救法:對于數(shù)值型字段,可以使用樣本均值或中位數(shù)補(bǔ)救;對于分類型字段,可以使用中位數(shù)補(bǔ)救。

      頻度最高值補(bǔ)救法:對于分類型字段,使用出現(xiàn)頻度最高的類別補(bǔ)救;對于數(shù)值型字段,可以通過先分箱,然后使用出現(xiàn)頻度最高的分箱的均值或者中位數(shù)進(jìn)行補(bǔ)救。

      統(tǒng)計(jì)方法補(bǔ)救法:針對數(shù)值型字段,可以使用諸如基于聚類的均值補(bǔ)救或者基于分類的插值補(bǔ)救等先進(jìn)方法進(jìn)行處理。

      3 貨運(yùn)車輛高速通行風(fēng)險(xiǎn)模型研究

      3.1 貨車車輛高速通行風(fēng)險(xiǎn)特征因子

      貨運(yùn)車輛高速通行數(shù)據(jù)包括僅依據(jù)貨運(yùn)車輛高速通行數(shù)據(jù)形成特征因子,依據(jù)貨運(yùn)車輛高速通行數(shù)據(jù)形成的駕駛習(xí)慣特征因子主要如表1所示。

      3.2 模型建立(XGBoost模型)

      XGBoost(eXtreme Gradient Boosting)極度梯度提升樹,是一種基于梯度提升樹的機(jī)器學(xué)習(xí)算法。XGBoost結(jié)合了梯度提升框架和決策樹模型,通過迭代地訓(xùn)練一系列的決策樹來逐步改進(jìn)預(yù)測性能。它的目標(biāo)是優(yōu)化損失函數(shù),使得預(yù)測值與實(shí)際值之間的誤差最小化。XGBoost的參數(shù)主要分為三類:通用參數(shù)、Booster參數(shù)和學(xué)習(xí)目標(biāo)參數(shù)。[2]

      3.2.1 通用參數(shù)

      這些參數(shù)用來控制XGBoost的宏觀功能,在這里主要介紹通用參數(shù)中的重點(diǎn)參數(shù)。

      1)booster[default=gbtree]

      booster的基礎(chǔ)樹模型,包括三種 :gbtree, gblinear or dart,其中g(shù)btree與dart的應(yīng)用效果較為一致,dglinear應(yīng)用效果稍差。

      2)verbosity [default=1]

      訓(xùn)練中是否打印信息,0 (silent), 1 (warning), 2 (info), 3 (debug)。

      3.2.2 Booster參數(shù)

      1)eta [default=0.3, alias: learning_rate]; range[0,1]

      相當(dāng)于神經(jīng)網(wǎng)絡(luò)中的學(xué)習(xí)率,與二叉樹的分裂有關(guān),可以增加XGBoost的穩(wěn)定性。

      2)gamma [default=0, alias: min_split_loss]

      子葉節(jié)點(diǎn)分裂所需要的最小損失,gamma越大,算法越保守(魯棒性)。

      3)max_depth [default=6]

      樹的深度,深度越大,XGBoost的越復(fù)雜越容易過擬合。

      4)subsample [default=1]

      訓(xùn)練每一顆新的樹時(shí)候的采樣率,有點(diǎn)類似與神經(jīng)網(wǎng)絡(luò)中的批量訓(xùn)練,每次訓(xùn)練新的二叉樹時(shí)使用數(shù)據(jù)在全數(shù)據(jù)集中的占比。

      5)sampling_method [default= uniform]

      采樣采用的概率模型:uniform 正態(tài)分布 gradient_based。

      6)lambda [default=1]

      權(quán)重的L2正則化項(xiàng)。這個(gè)參數(shù)是用來控制XGBoost的正則化部分的。

      7)alpha [default=1]

      權(quán)重的L1正則化項(xiàng)。 能夠應(yīng)用在很高維度的狀況下,使得算法的速度更快。

      3.2.3 學(xué)習(xí)目標(biāo)參數(shù)

      這類參數(shù)用來控制理想的優(yōu)化目標(biāo)和每一步結(jié)果的度量方法。

      1)objective[default=reg:linear]

      這個(gè)參數(shù)定義需要要被最小化的損失函數(shù)。最經(jīng)常使用的值有:binary:logistic二分類的邏輯回歸,返回預(yù)測的幾率; multi:softmax使用softmax的多分類器,返回預(yù)測的類別。

      2)eval_metric[默認(rèn)值取決于objective參數(shù)的取值]

      對于有效數(shù)據(jù)的度量方法。 對于回歸問題,默認(rèn)值是rmse,對于分類問題,默認(rèn)值是error。

      seed(default=0)

      隨機(jī)數(shù)的種子設(shè)置它能夠復(fù)現(xiàn)隨機(jī)數(shù)據(jù)的結(jié)果,也能夠用于調(diào)整參數(shù)。

      3.3 模型驗(yàn)證

      3.3.1 模型效果

      對模型表現(xiàn)的評估,基于Kolmogorov-Smirnov(K-S)和基尼(Gini)或ROC系數(shù)這兩個(gè)統(tǒng)計(jì)值,Gini = 2*AUC - 1, AUC是ROC曲線下面積,經(jīng)常用作衡量分類模型質(zhì)量的指標(biāo)。Kolmogorov-Smirnov(K-S)值和基尼系數(shù)(Gini)用來衡量模型區(qū)分好壞的能力,也就是模型的預(yù)測能力[3]。通過兩者的計(jì)算來驗(yàn)證模型的預(yù)測能力,如下圖1所示。

      KS值由多種因素決定,如:

      ·數(shù)據(jù)源和數(shù)據(jù)信息的可獲取度

      ·數(shù)據(jù)的質(zhì)量

      ·產(chǎn)品類型

      ·群體的穩(wěn)定性

      3.3.2 模型驗(yàn)證

      貨運(yùn)車風(fēng)險(xiǎn)識別除了結(jié)合貨運(yùn)車輛高速通行數(shù)據(jù)風(fēng)險(xiǎn)因子之外,還增加相關(guān)風(fēng)險(xiǎn)因子,例如車牌車架一致性;兩客一危判定;超載超限黑名單;套牌車識別等數(shù)據(jù),通過對風(fēng)險(xiǎn)因子賦權(quán),形成車輛級的模型評分,評分區(qū)間為1-100分,其中1-10分為E類高風(fēng)險(xiǎn)車輛,11-30分為D類高風(fēng)險(xiǎn)車輛,31-60分為C類風(fēng)險(xiǎn)車輛,61-80分為B類優(yōu)質(zhì)車輛,81-100分為A類優(yōu)質(zhì)車輛。不同的評分對應(yīng)不同的風(fēng)險(xiǎn)等級。最終輸出營運(yùn)車輛的風(fēng)險(xiǎn)等級,將車輛劃分為A\B優(yōu)質(zhì)車輛,C類風(fēng)險(xiǎn)車輛,D\E類高風(fēng)險(xiǎn)車輛。應(yīng)用于營運(yùn)貨車的風(fēng)險(xiǎn)識別中。

      通過結(jié)合保險(xiǎn)公司賠付數(shù)據(jù)分析。該模型評分對保前業(yè)務(wù)將有較高區(qū)分度。評分為E檔業(yè)務(wù)賠付率高達(dá)136%,E檔與A檔賠付率相差3.3倍以上。如圖2所示。

      4 總結(jié)

      本文對基于貨運(yùn)車輛高速通行數(shù)據(jù)保險(xiǎn)風(fēng)險(xiǎn)評估進(jìn)行研究。通過對行業(yè)已論證的車輛風(fēng)險(xiǎn)要素與貨運(yùn)車輛高速通行數(shù)據(jù)特征因子的關(guān)系進(jìn)行實(shí)證分析,提出差異化車險(xiǎn)產(chǎn)品,在最大化體現(xiàn)公平性的原則的前提下驗(yàn)證了本文研究結(jié)果的創(chuàng)新性,并為后續(xù)開展不同客戶的車險(xiǎn)定價(jià)提供了參考借鑒價(jià)值。本研究通過貨運(yùn)車輛高速通行數(shù)據(jù)獲取與車輛風(fēng)險(xiǎn)定價(jià)相關(guān)的數(shù)據(jù)信息,并納入到風(fēng)險(xiǎn)因素和定價(jià)模型分析范疇,以期實(shí)現(xiàn)保險(xiǎn)定價(jià)模型的精確性。然而,本研究也存在一些局限性,如數(shù)據(jù)集的選擇和算法的局限性,隨著高速通行數(shù)據(jù)進(jìn)一步的應(yīng)用與拓展和貨運(yùn)車輛市場的不斷擴(kuò)大,我們預(yù)期將有更多的數(shù)據(jù)和技術(shù)可供利用。未來結(jié)合國內(nèi)外相關(guān)研究成果創(chuàng)新性構(gòu)建車險(xiǎn)定價(jià)模型,并通過聯(lián)動(dòng)機(jī)制對車險(xiǎn)費(fèi)率進(jìn)行調(diào)整,動(dòng)態(tài)反映出不同車輛及其通行行為所呈現(xiàn)的潛在風(fēng)險(xiǎn)性,減少保險(xiǎn)公司與客戶之間的信息不對稱情況的發(fā)生,從而提高保險(xiǎn)行業(yè)的交易效率。

      阿坝| 花垣县| 马尔康县| 宁强县| 滦平县| 安远县| 中阳县| 拜泉县| 高台县| 锦州市| 兴山县| 亚东县| 天津市| 凯里市| 福安市| 宜昌市| 沐川县| 齐齐哈尔市| 平武县| 康平县| 闵行区| 麻城市| 阜新| 酉阳| 呼图壁县| 宣汉县| 盘山县| 合山市| 莆田市| 九龙城区| 南木林县| 门源| 定襄县| 长沙市| 阿克| 五大连池市| 中西区| 竹山县| 望谟县| 大同市| 韶山市|