• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      電子商務平臺用戶信用消費風險評估方法

      2019-05-22 10:29:16陳浩
      商場現(xiàn)代化 2019年3期
      關鍵詞:風險評估電子商務

      摘 要:本文基于國內(nèi)某電子商務平臺的用戶購買行為數(shù)據(jù),分別利用邏輯回歸、支持向量機、隨機森林和Xgboost建立信用評估模型,通過AUC值和F1得分比較各個模型的優(yōu)劣,最終對表現(xiàn)優(yōu)異的模型進行再次融合,從而提高電子商務平臺風險評估效率。

      關鍵詞:電子商務;信用消費;風險評估;Xgboost;模型融合

      一、引言

      基于信息技術誕生的電子商務,極大地豐富了人們的消費方式。電子商務平臺的出現(xiàn)打破了傳統(tǒng)商務模式中區(qū)域以及國界的各種壁壘,與三方支付平臺的有效結合將傳統(tǒng)商務模式的購買行為變得更加高效便捷,還產(chǎn)生了像“花唄”這樣的信用消費產(chǎn)品。與此同時也產(chǎn)生了一些問題,電子商務的虛擬化雖然令各類信息更加易得,但各種虛假信息摻雜其中,尤其在信用消費中,不少用戶忽視規(guī)則使用信用消費導致不能按時還款,甚至給了一些不法分子惡意消費的機會。因此本文基于電子商務平臺用戶消費行為數(shù)據(jù)構建信用評估模型給用戶提供合理信用消費權限。

      二、模型選擇

      本文分別利用邏輯回歸、支持向量機、隨機森林建立信用評估模型,通過AUC值和F1得分比較各個模型的優(yōu)劣,最終對表現(xiàn)優(yōu)異的模型進行再次融合,從而提高互聯(lián)網(wǎng)金融用戶風險評估效率。

      三、數(shù)據(jù)處理和模型評價

      1.數(shù)據(jù)描述

      本文選取了國內(nèi)某電子商務平臺的用戶購買和支付行為數(shù)據(jù)作為研究目標。數(shù)據(jù)集包括Master、Log_Info、Userupdate_Info三個部分。Master表中包含了用戶的學歷學籍、社交行為等字段,Log_Info表中主要有用戶終端日常操作行為字段,Userupdate_Info表里存儲了用戶修改相關信息的行為字段,三部分基礎數(shù)據(jù)集共包含228個特征信息。

      2.數(shù)據(jù)處理

      對缺失值的處理,總的來說分為刪除法和插補法。在征信領域,用戶信息的完整程度可能會影響該用戶的評級。本文分別從用戶屬性缺失率(按行)和特征缺失率(按列)兩個角度對缺失數(shù)據(jù)進行了處理。

      特征缺失率是指對于某個特定屬性,缺失樣本數(shù)占總樣本數(shù)的比率。圖1顯示的是存在缺失的屬性及對應的缺失比率。指標WeblogInfo_3及WeblogInfo_1變量的缺失率為0.967,這兩列屬性能夠提供的信息量極少,可以直接剔除。UserInfor_11、UserInfor_12、UserInfor_13三個變量的缺失率為0.63,這三個變量均為分類變量,這種情況下可以將缺失值用當作分類變量的一個類別處理。

      用戶屬性缺失率指的是對于某個具體用戶而言其所有指標中缺失指標數(shù)占總指標數(shù)的比率。本文統(tǒng)計了訓練樣本及測試樣本中每個用戶的缺失屬性個數(shù),并且按照缺失個數(shù)進行排序,以排序序號為橫軸缺失個數(shù)為縱軸,畫出圖2,從圖中可以看出,屬性缺失個數(shù)呈現(xiàn)階梯裝上升的特點,說明缺失個數(shù)這個特征可以有效的將用戶群體區(qū)分開。本文將缺失個數(shù)作為一個離散變量加入到訓練集中。

      其中x是原始數(shù)據(jù),μ是x的均值,μ是x的標準差,歸一化之后的數(shù)據(jù)由于對方差進行了統(tǒng)一,這時候每個維度的量綱其實已經(jīng)等價了,避免了不同量綱的選取對距離計算產(chǎn)生的巨大影響。本文對分類變量采用獨熱編碼處理。

      數(shù)據(jù)挖掘算法需要基于豐富的特征空間才能發(fā)揮良好的性能,單用原始數(shù)據(jù)的特征空間進行建模往往達不到理想的效果。本文針對Log_Info、Userupdate_Info兩表,從中提取用戶修改個人信息的特征以及登陸狀態(tài)特征如:修改次數(shù)、修改時間、登陸天數(shù)等。特征提取完成之后又對數(shù)據(jù)特征進行了組合。

      3.分類模型評價

      精確率、召回率、AUC、F1等都是用來評價二分類模型好壞的指標,參照表1,精確率的計算方式為TP/(TP+FP),即為在預測為壞人的人中,預測正確的人占比。召回率的計算方式為TP/(TP+FN),即為在實際為壞人的人中,預測正確的人占比。F1值是精確率和召回率的調(diào)和均值,即F1=2PR/(P+R),相當于精確率和召回率的綜合評價指標。

      四、實驗結果和分析

      實驗利用python語言實現(xiàn),模型的表現(xiàn)采用AUC值和F1分數(shù)來衡量。其中LR、SVM、RF模型借助Scikit-Learn機器學習庫進行訓練,Xgboost模型是借助xgboost庫進行訓練。其中在訓練Xgboost模型時,先通過網(wǎng)格尋參法確定一組良好的參數(shù)得到模型XGB_1,接著結合bagging思想,對這組參數(shù)施加一個小范圍的隨機干擾,得到另外兩組模型XGB_2、XGB_3。最終將LR、SVM、RF、XGB_1、XGB_2、XGB_3六組模型進行融合得到Model_all。從下表中模型表現(xiàn)來看,集成學習方法和模型融合方法對信用評估效果有顯著的提高。

      五、結束語

      本文基于電子商務平臺用戶消費和支付行為數(shù)據(jù),使用單個模型、集成模型、模型融合三種方式對訓練數(shù)據(jù)集進行擬合得到6組模型,并計算了每個模型的AUC值和F1得分,對比實驗結果可以發(fā)現(xiàn):集成學習算法的信用評估效果要優(yōu)于單個模型;對模型進行再次融合能進一步提高預測的效果。

      參考文獻:

      [1]朱曉明,劉治國.信用評分模型綜述[J].統(tǒng)計與決策,2007(2):103-105.

      [2]Altman E I. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy[J].The Journal of Finance,1968,23(4):589-609.

      [3]WIGINTON J C. A note on the comparison of logic and discriminate models of consumer credit Behavior[J].Journal of Financial & Quantitative Analysis,1980,15(3):757-770.

      作者簡介:陳浩(1993- ),男,漢族,江蘇南通人,單位:南京郵電大學經(jīng)濟學院,2016級研究生,應用統(tǒng)計專業(yè)

      猜你喜歡
      風險評估電子商務
      2025年我國農(nóng)村電子商務交易額達到2.8萬億元
      《電子商務法》如何助力直銷
      電子商務
      網(wǎng)絡安全風險評估的關鍵技術
      鉛銻冶煉污染場地周邊土壤鉛污染特征及潛在生態(tài)危害評價
      價值工程(2016年29期)2016-11-14 00:22:34
      我國養(yǎng)老保險基金投資運營的風險評估
      時代金融(2016年23期)2016-10-31 13:25:28
      天然氣開采危險有害因素辨識及風險評估管理
      大眾理財顧問(2016年8期)2016-09-28 13:55:43
      中小企業(yè)財務管理問題研究
      關于加快制定電子商務法的議案
      宿迁市| 蒙自县| 海城市| 大足县| 平原县| 兴隆县| 梁平县| 琼海市| 华池县| 玛曲县| 安溪县| 法库县| 凤山县| 内江市| 清原| 安庆市| 普格县| 澳门| 镇赉县| 曲沃县| 新郑市| 上饶县| 博乐市| 绥化市| 永修县| 峡江县| 余干县| 三亚市| 卫辉市| 大庆市| 延吉市| 芦山县| 麻江县| 宣武区| 宁河县| 准格尔旗| 金山区| 如东县| 大同市| 定结县| 濮阳市|