• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      關(guān)于金融機構(gòu)個人貸款的需求預(yù)測

      2020-09-10 10:37:28陳方圓
      商業(yè)2.0-市場與監(jiān)管 2020年2期
      關(guān)鍵詞:線性回歸信用貸款互聯(lián)網(wǎng)金融

      摘要:金融機構(gòu)小額信用貸款產(chǎn)品是個人金融業(yè)務(wù)的一種,以其方便、快捷的特性深受用戶喜愛。該產(chǎn)品通過預(yù)審批機制為用戶提供特定額度的貸款服務(wù),金融機構(gòu)除了要評估用戶的風(fēng)險之外,還需要預(yù)測用戶的借款需求,以此來準(zhǔn)備合適的額度,降低資金占用成本,同時提升用戶使用體驗。本文借助于大數(shù)據(jù)的專業(yè)技術(shù)手段,通過引入一些數(shù)據(jù)挖掘算法,嘗試對用戶的信貸需求進(jìn)行準(zhǔn)確的預(yù)測,旨在用互聯(lián)網(wǎng)金融的思路為上述問題提供理性地判斷和一種科學(xué)解決方案。

      關(guān)鍵詞:個人貸款;信用貸款;互聯(lián)網(wǎng)金融;大數(shù)據(jù);線性回歸;GBDT

      1.研究背景

      近年來,針對個人用戶的小額信用貸款已成為一項成熟的業(yè)務(wù),目前發(fā)展勢頭良好。此類業(yè)務(wù)多通過手機客戶端來進(jìn)行操作,一些金融機構(gòu),如銀行、互聯(lián)網(wǎng)金融機構(gòu)利用個人用戶預(yù)留的基本信息和一些歷史信息等來對用戶的個人征信及貸款額度進(jìn)行評估,自動生成貸款方案,多數(shù)情況下不需要人為介入。此項業(yè)務(wù)由于辦理快捷、流程簡單,深受廣大用戶特別是年輕用戶的青睞。其業(yè)務(wù)規(guī)模不斷擴大,同時競爭亦日益加深。

      “某借”是某金融機構(gòu)旗下的一款小額信用貸款產(chǎn)品,該產(chǎn)品使用起來簡單、快捷,申請人只需要經(jīng)過少量的操作即可進(jìn)行在線貸款申請。在開展這類信貸業(yè)務(wù)的時候,除了要評估用戶的信貸風(fēng)險之外,還需要預(yù)測用戶的借款需求。只有盡可能的給有借款需求的用戶分配合適的額度,才能最大限度的增加資金利用率,降低成本并增加收益。精準(zhǔn)的對目標(biāo)客戶進(jìn)行匹配,預(yù)測用戶的信貸需求是此類產(chǎn)品運營的核心問題之一。

      本文將通過對“某借”中用戶的基本信息和歷史操作等信息進(jìn)行整合,運用線性回歸、決策樹、提升算法等數(shù)據(jù)挖掘方法,建立有效的模型,對未來一個月內(nèi)該平臺用戶的借款總金額進(jìn)行預(yù)測,并將預(yù)測結(jié)果同真實值進(jìn)行比較,確定模型的效果。

      2.數(shù)據(jù)描述及特征建立

      本文的目的是基于可獲取的客戶信息,如基本信息、歷史信息等,來對未來短時間內(nèi)不確定的需求進(jìn)行預(yù)測。本文的數(shù)據(jù)從某金融平臺獲取,包含用戶的基本信息和部分其他信息。本文的目的是預(yù)測下個月每個用戶的借款總額,由于目標(biāo)是數(shù)量型特征,使用均方誤差(MSE)作為模型效果的評估標(biāo)準(zhǔn)。通過對數(shù)據(jù)的整理,構(gòu)建了如表1所示的特征。其中用戶ID和次月借款合計不參與模型構(gòu)建,用戶ID僅用于標(biāo)識客戶,次月借款合計用于評估模型效果。

      3.利用線性回歸構(gòu)建模型

      在本文中,因變量為次月借款合計,由于因變量為數(shù)量型特征,可以考慮從較為簡單的回歸模型入手。線性回歸模型是一種基礎(chǔ)的統(tǒng)計模型,模型要求數(shù)據(jù)必須滿足基本假設(shè),即因變量符合正態(tài)性、等方差性及獨立性。另外線性回歸模型受異常值和多重共線性影響較大,建模之前需要先去掉異常值點及多重共線性變量。

      經(jīng)檢查,數(shù)據(jù)基本符合正態(tài)分布鐘形曲線的形狀,可使嘗試使用線性回歸模型進(jìn)行分析。直接將特征數(shù)據(jù)帶入逐步線性回歸模型。第一次回歸后,去掉性別特征后AIC下降最多,因此去掉該特征繼續(xù)計算回歸系數(shù)。同理依次去掉歷史借款中值、年齡段2項特征,待AIC不再下降時,得到最終的回歸方程。

      在結(jié)果中,回歸系數(shù)基本都通過了檢驗,總體p值接近于0,模型效果尚可。其中初始額度、歷史借款合計、歷史消費合計和頁面點擊次數(shù)對因變量是正相關(guān)的,其余特征都為負(fù)相關(guān)。對此的理解是直觀的,用戶的額度越高、歷史借款量越大、歷史消費越多、相關(guān)頁面瀏覽次數(shù)越多,可能發(fā)生的借款金額就會越大。

      接下來對線性回歸模型的基本假設(shè)做一些分析,如圖1所示。數(shù)據(jù)中的異常點幾乎緊靠數(shù)據(jù)的主體部分,因此可以認(rèn)為這些只是數(shù)據(jù)中的一些極端數(shù)值,并未達(dá)到異常的水平。可以看出模型的殘差有一個明顯的旋轉(zhuǎn),若無旋轉(zhuǎn),殘差是基本滿足正態(tài)性、同方差性和獨立性的。這主要是因為數(shù)據(jù)中借款合計為0的用戶比較多,約占總數(shù)據(jù)量的2/3,在建模時這部分?jǐn)?shù)據(jù)對回歸直線有很明顯的下拉作用,導(dǎo)致回歸直線發(fā)生旋轉(zhuǎn),進(jìn)而造成殘差旋轉(zhuǎn)。并且模型對這部分用戶的預(yù)測值基本上都大于0,因此殘差都為負(fù)數(shù),這就造成了其余殘差基本都大于0,形成了圖2中左邊兩幅圖細(xì)線條和粗線段帶分離的情況。

      通過計算,得到線性回歸模型的MSE=3.343997。處理類似本文中帶偏折的數(shù)據(jù)時,采用分位數(shù)回歸一般可改善效果,但經(jīng)過建模得到分位數(shù)回歸模型的MSE=3.694761,效果不如線性回歸模型。這可能是因為借款總額為0的用戶占更大部分,在分位數(shù)回歸扭正殘差的同時,擴大了這部分用戶預(yù)測的殘差。面對如此復(fù)雜的數(shù)據(jù),線性回歸模型肯定達(dá)不到最好的效果,繼續(xù)嘗試改進(jìn)模型。

      4.利用GBDT建立模型

      GBDT模型是此類問題的一個優(yōu)良的解決方案。GBDT模型有迭代次數(shù)和優(yōu)化步長兩個比較重要的參數(shù)。迭代次數(shù)表示模型繼續(xù)計算的最大次數(shù)M,優(yōu)化步長表示模型每次擬合時對殘差擬合的細(xì)度。一般情況下先設(shè)定一個比較大的迭代次數(shù)和比較小的優(yōu)化步長,通過觀察殘差的變化來選擇最合適的參數(shù)數(shù)值。

      無論優(yōu)化步長取何值,殘差都是隨著迭代次數(shù)的增加先下降后上升的,存在最低點。隨著優(yōu)化步長的減少,殘差達(dá)到最低點需要的迭代次數(shù)越來越多,并且殘差能達(dá)到的最小值也在逐漸下降。隨著模型的迭代次數(shù)繼續(xù)增加及優(yōu)化步長繼續(xù)減少,殘差的最小值會不斷下降,但下降的幅度越來越少,并且計算代價呈平方關(guān)系上升。實踐中會選取殘差、迭代次數(shù)和優(yōu)化步長都在可接受范圍內(nèi)的數(shù)值建立模型,使得模型可在有限時間內(nèi)計算出結(jié)果,殘差也較為接近理論最小值。

      設(shè)定迭代次數(shù)為3000,優(yōu)化步長為0.01建立GBDT模型。當(dāng)?shù)螖?shù)達(dá)到2095次時,模型殘差達(dá)到最小。由于優(yōu)化步長已設(shè)置為較小的數(shù),且計算時間可以接受,本文就使用2095的迭代次數(shù)和0.01的優(yōu)化步長建立模型。生成模型后,帶入特征數(shù)據(jù)計算所有用戶次月借款合計預(yù)測值,與實際值進(jìn)行比較,計算MSE=3.20099,效果較回歸模型有所提高。

      5.總結(jié)

      本文從小額信用貸款這樣一個具體的、實際的業(yè)務(wù)出發(fā),對產(chǎn)品運營中客戶需求這個核心問題進(jìn)行研究,目的在于利用已有的基本信息和歷史信息,對用戶將來潛在的需求進(jìn)行預(yù)測。本文根據(jù)數(shù)據(jù)的特征,首先采用了較為簡單的線性回歸模型,并通過GBDT模型進(jìn)行優(yōu)化,使得預(yù)測效果得到提高,取得了良好的效果。

      隨著金融市場化的不斷推進(jìn),依托大數(shù)據(jù)和互聯(lián)網(wǎng)金融的發(fā)展,傳統(tǒng)的人工作業(yè)模式越來越被市場所淘汰,取而代之的是更精準(zhǔn)、更高效的客戶營銷機制。本文通過對一系列數(shù)據(jù)挖掘算法的引入,既考慮到大數(shù)據(jù)的應(yīng)用,通過智能算法精準(zhǔn)定制產(chǎn)品,提升用戶的使用體驗,同時也展現(xiàn)了理論模型在實際數(shù)據(jù)中的表現(xiàn)。更重要的是,本文為金融機構(gòu)關(guān)心的增加資金利用率、降低成本并增加收益等問題,提供了一個解決問題的思路。

      參考文獻(xiàn):

      [1]L.I.Breiman,J.H.Friedman,R.A.Olshen,and C.J. Stone. Classification and Regression Trees (CART). Encyclopedia of Ecology,40(3):582-588, 1984.

      [2]Mayo Foundation Terry M.Therneau, Elizabeth J. Atkinson.An Introduction to Recursive Partitioning Using the RPART Routines. CRAN, 2018.

      [3]Jerome H.Friedman. Greedy Function Approximation: A Gra- dient Boosting Machine. Annals of Statistics, 29(5):1189-1232,2001.

      [4]Greg Ridgeway.Generalized Boosted Models:A guide to the gbm package.CRAN,2018.

      [5]Tianqi Chen and Carlos Guestrin.XGBoost: A Scalable Tree Boosting System. pages 785-794,2016.

      [6]Guolin Ke,Qi Meng,Thomas Finely, Taifeng Wang, Wei Chen, Weidong Ma,Qiwei Ye,and Tie-Yan Liu.LightGBM:A Highly Efficient Gradient Boosting Decision Tree.2017.

      [7]張瀟,韋增欣,楊天山.GBDT組合模型在股票預(yù)測中的應(yīng)用. 海南師范大學(xué)學(xué)報,(1),2018.

      [8]馬曉君,沙靖嵐,牛雪琪.基于LightGBM 算法的 P2P 項目信用評級模型的設(shè)計及應(yīng)用.數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,(5), 2018.

      作者簡介:陳方圓(1989.6-),女,研究生,研究方向:金融學(xué)。

      猜你喜歡
      線性回歸信用貸款互聯(lián)網(wǎng)金融
      互聯(lián)網(wǎng)消費金融的風(fēng)險管理研究
      時代金融(2017年18期)2017-07-31 00:23:01
      中小企業(yè)信用貸款困難問題分析
      商業(yè)銀行中小額信用貸款全流程外包研究
      國道公路養(yǎng)護管理與規(guī)劃研究
      互聯(lián)網(wǎng)金融的風(fēng)險分析與管理
      互聯(lián)網(wǎng)金融理財產(chǎn)品分析
      互聯(lián)網(wǎng)金融對傳統(tǒng)金融的影響
      影響上市公司股票價格的微觀因素分析
      商(2016年13期)2016-05-20 09:12:44
      企業(yè)退休金收支平衡的研究
      科技視界(2016年9期)2016-04-26 12:16:25
      企業(yè)退休金收支平衡的模型分析
      科技視界(2016年1期)2016-03-30 09:21:51
      潼关县| 北海市| 八宿县| 房产| 黎川县| 同心县| 三台县| 鹤岗市| 安顺市| 盘锦市| 驻马店市| 政和县| 子长县| 招远市| 永胜县| 枝江市| 宁明县| 定州市| 蒙阴县| 河曲县| 繁峙县| 神农架林区| 台东市| 宁安市| 东明县| 武山县| 涿鹿县| 收藏| 定西市| 扎兰屯市| 林芝县| 迭部县| 崇左市| 容城县| 富阳市| 呼玛县| 扎兰屯市| 临夏市| 汉中市| 奉新县| 德庆县|