• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      網(wǎng)貸平臺(tái)數(shù)據(jù)的隨機(jī)森林預(yù)測(cè)模型實(shí)證分析

      2019-02-09 09:35:02楊曉偉劉倩倩
      宜賓學(xué)院學(xué)報(bào) 2019年12期
      關(guān)鍵詞:借款人借款借貸

      楊曉偉,劉倩倩,余 芳

      (巢湖學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽巢湖238000)

      關(guān)于網(wǎng)貸平臺(tái)起源的主流看法有兩種:一種認(rèn)為其起源于北美的華人社會(huì),是屬于個(gè)人信貸的一種;另一種認(rèn)為是受了“鄉(xiāng)村銀行”影響而形成的[1].世界上第一家網(wǎng)絡(luò)借款平臺(tái)ZOPA 于2005 年在英國(guó)成立,2006 年P(guān)rosper 在美國(guó)成立. 由于受到國(guó)外發(fā)展模式的影響,據(jù)不完全統(tǒng)計(jì),國(guó)內(nèi)網(wǎng)絡(luò)借貸平臺(tái)到2016年底共有2 448家.隨著科學(xué)文明的進(jìn)步,原有的金融體制已經(jīng)不能夠滿足當(dāng)今社會(huì)的發(fā)展,一種新的借貸方式應(yīng)運(yùn)而生,即基于互聯(lián)網(wǎng)的一種創(chuàng)新型直接借貸模型,又稱P2P 網(wǎng)絡(luò)借貸. Lin 認(rèn)為P2P 網(wǎng)絡(luò)借貸的主體主要是在個(gè)體之間,相比于傳統(tǒng)的借貸方式具有借貸風(fēng)險(xiǎn)分散的特點(diǎn)[2].P2P網(wǎng)絡(luò)借貸規(guī)??梢院w到極大部分傳統(tǒng)金融行業(yè)不能涵蓋的人員,例如中低收入者、個(gè)體工商戶、學(xué)生、初始創(chuàng)業(yè)的企業(yè)家等,所以有利于緩解中小企業(yè)“融資難”的問題[3]. 互聯(lián)網(wǎng)的特性使得借款人可以在貸款平臺(tái)上發(fā)布與自己相關(guān)的借款需求信息,貸款人也可以對(duì)這些信息進(jìn)行分析,進(jìn)而更好地對(duì)借款人進(jìn)行鑒別.陳東宇研究信任和風(fēng)險(xiǎn)這兩個(gè)因素對(duì)貸款交易意愿的影響,結(jié)果表明這兩個(gè)因素對(duì)借款意愿都有影響,不過(guò)信任的影響要更顯著一些[4]. 陳建中的研究表明,獲得借款成功的概率與婚姻狀態(tài)、信用等級(jí)、年齡、學(xué)歷、住房情況密切相關(guān)[5]. 李悅雷通過(guò)研究,分析出對(duì)貸款成功率有重要影響的因素為借款人的基本特征、借款項(xiàng)目的基本特征和社會(huì)資本[6]. 廖理經(jīng)過(guò)研究發(fā)現(xiàn),借款者的貸款成本的高低與信用評(píng)級(jí)掛鉤[7].Pope經(jīng)過(guò)研究表明,在其余條件類似的情況下,白種人借款的成功率要高于其他人種[8]. 周玉琴等人研究發(fā)現(xiàn),女性由于比男性保守的天性,因而更趨向于選擇借款利率較高,風(fēng)險(xiǎn)較小的借款者[9].Puro在以往研究基礎(chǔ)上,開發(fā)出了一種能夠預(yù)測(cè)借款者是否可以按時(shí)還款以及按時(shí)還款概率的工具[10].在P2P借貸公司平臺(tái)上,交易雙方即投資人和借款人的交易進(jìn)行過(guò)程是自行交易,平臺(tái)存在的最主要的目的就是為雙方提供必要的信息.而平臺(tái)本身并不參與此借貸關(guān)系的發(fā)生上,因此不會(huì)成為雙方的利益相關(guān)點(diǎn),這樣就可以保證一定的獨(dú)立性與公平性. P2P 的特點(diǎn)是廣泛參與性、準(zhǔn)入門檻低、便捷高效性.

      我國(guó)運(yùn)用P2P 平臺(tái)進(jìn)行借貸的人多為“低信用用戶”群體.同樣,平臺(tái)上很大一部分投資者也缺乏較為優(yōu)秀的風(fēng)險(xiǎn)識(shí)別能力和風(fēng)險(xiǎn)承受能力. 因此,如何解決這一問題以提高平臺(tái)借款的成功率、各變量影響程度,這些問題已成為解決P2P 平臺(tái)發(fā)展問題的當(dāng)務(wù)之急.故而本文將對(duì)此進(jìn)行一定的深入分析. 由于傳統(tǒng)的分析方法具有一定的局限性,不能夠?qū)Ω饔绊懸蛩剡M(jìn)行有效的分析和研究.因此本文采用一種新的分析方法——隨機(jī)森林.隨機(jī)森林算法可以通過(guò)R軟件的編程來(lái)實(shí)現(xiàn)建模.隨機(jī)森林是2001 年由Breiinan 所研究提出的理論,其在本質(zhì)上是一種以機(jī)器學(xué)習(xí)理論為基礎(chǔ)的組合分類算法.而這個(gè)算法的優(yōu)點(diǎn)在于能簡(jiǎn)便、高效率地處理大樣本及多維度的數(shù)據(jù),其擁有極強(qiáng)的抗干擾能力且能夠估計(jì)哪些特征變量更為重要.近幾年我國(guó)更是將隨機(jī)森林算法應(yīng)用到了醫(yī)學(xué)、農(nóng)業(yè)、金融等各個(gè)領(lǐng)域.在醫(yī)學(xué)方面,對(duì)于基因篩選可以利用隨機(jī)森林進(jìn)行分析研究[11];在農(nóng)業(yè)方面,隨機(jī)森林模型可以用來(lái)模擬分析山體滑坡的適應(yīng)性[12];在金融方面,對(duì)于客戶分類管理的研究隨機(jī)森林算法要比神經(jīng)網(wǎng)絡(luò)構(gòu)建的模型誤差更小[13]. 隨機(jī)森林的好處就是在提高樣本預(yù)測(cè)精度的基礎(chǔ)上,并沒有過(guò)多的增加計(jì)算復(fù)雜度. 即使原始數(shù)據(jù)存在缺失或原始數(shù)據(jù)結(jié)構(gòu)不平衡,采用隨機(jī)森林算法,其穩(wěn)健性實(shí)驗(yàn)也能通過(guò),而且預(yù)測(cè)精度也不會(huì)因?yàn)樽宰兞扛哌_(dá)數(shù)千個(gè)就受到影響,故而,隨機(jī)森林的方法作為機(jī)器學(xué)習(xí)中一種優(yōu)良算法被廣泛應(yīng)用于各個(gè)領(lǐng)域.

      1 隨機(jī)森林理論

      1.1 Bootstrap方法概述

      Bootstrap方法的基本步驟如下:

      第一步:抽取一定數(shù)量的樣本,從含有N個(gè)樣本的原始數(shù)據(jù)中,以有放回、重復(fù)抽樣地進(jìn)行;

      第二步:提取每個(gè)樣本的概率是P=1-(1-1/N),對(duì)產(chǎn)生的新樣本計(jì)算其統(tǒng)計(jì)量T,重復(fù)以上步驟N次(一般情況下選取M大于1 000次);

      第三步:計(jì)算出M個(gè)樣本中對(duì)應(yīng)的統(tǒng)計(jì)量T;

      第四步:先計(jì)算M 個(gè)T 的樣本方差,再估計(jì)總體統(tǒng)計(jì)量的方差,并進(jìn)行區(qū)間估計(jì).

      1.2 隨機(jī)森林算法原理

      隨機(jī)森林實(shí)質(zhì)是一種類似于將多棵樹進(jìn)行分類的機(jī)器算法[14],其根本思路是首先對(duì)原始樣本數(shù)據(jù)集進(jìn)行Bootstrap 重復(fù)抽樣,然后利用其中多次采集的樣本分別建立其對(duì)應(yīng)的分類器,生成各種分類結(jié)果.最后,利用這些結(jié)果對(duì)待定分類項(xiàng)進(jìn)行投票,確定其分類結(jié)果.其工作流程如圖1所示.

      圖1 隨機(jī)森林的工作流程

      1.3 隨機(jī)森林變量重要性評(píng)分

      隨機(jī)森林算法能夠在處理與分析數(shù)據(jù)的同時(shí)給出變量重要性評(píng)分(VIM). 現(xiàn)假設(shè)有變量X1,X2,X3,…,XN,需要計(jì)算N個(gè)VIM得分統(tǒng)計(jì)量.常規(guī)的VIM計(jì)算方法有兩種,即利用Gini指數(shù)和袋外數(shù)據(jù)(OOB)錯(cuò)誤率進(jìn)行計(jì)算得出,分別用VIM(Gini)j和VIM(OOB)j表示變量Xj得分統(tǒng)計(jì)量.

      1.3.1 Gini指數(shù)

      Gini指數(shù)計(jì)算方法如下:

      其中:fi為第i類的概率值;IGt( f )、IGr( f )表示兩個(gè)新節(jié)點(diǎn)的Gini值;n為隨機(jī)森林分類樹的數(shù)量.

      1.3.2 OOB錯(cuò)誤率

      為了構(gòu)建訓(xùn)練集,需要先利用Bootstrap 方法從隨機(jī)森林的每棵樹中提取樣本. 同時(shí),充分計(jì)算口袋數(shù)據(jù),預(yù)測(cè)其錯(cuò)誤率.然后隨機(jī)改變參數(shù)Xj,為觀察者再次構(gòu)建決策樹提供數(shù)據(jù)支持,計(jì)算出新的OOB預(yù)測(cè)錯(cuò)誤率.最后,兩個(gè)OOB錯(cuò)誤率做差并進(jìn)行標(biāo)準(zhǔn)化處理得出排列變量Xj的重要性:

      1.3.3 隨機(jī)森林法優(yōu)點(diǎn)

      ①可以處理高緯度數(shù)據(jù)及其輸出變量的重要程度;②可以用來(lái)降低數(shù)據(jù)的維度,使模型更有效率,從而達(dá)到進(jìn)一步提高模型預(yù)測(cè)精度的目的;③可以平衡數(shù)據(jù),且當(dāng)數(shù)據(jù)出現(xiàn)缺失情況時(shí),隨機(jī)森林算法也不會(huì)受影響,仍然會(huì)有很高的預(yù)測(cè)精度.

      2 模型構(gòu)建與實(shí)證分析

      2.1 評(píng)估網(wǎng)貸成功率的模型及標(biāo)準(zhǔn)

      2.1.1 Logistic回歸模型

      Logistic 回歸模型具有使用穩(wěn)定、運(yùn)用廣泛的特點(diǎn). 其中運(yùn)用最多的就是二值型Logistic,即因變量Y的值只有兩個(gè)類別,例如:男或者女,晉級(jí)或淘汰.

      Logistic模型具體形式為:

      其中,Pi為借款成功的概率,βn為待估參數(shù),Xi為自變量,εi為隨機(jī)誤差項(xiàng).

      2.1.2 隨機(jī)森林算法評(píng)估模型

      為了解決傳統(tǒng)統(tǒng)計(jì)假設(shè)與現(xiàn)實(shí)數(shù)據(jù)不吻合的問題,機(jī)器方法和數(shù)據(jù)挖掘做出了很大貢獻(xiàn),被廣泛應(yīng)用于不同領(lǐng)域的預(yù)測(cè)與分析,并取得了良好的效果.為更好地對(duì)P2P網(wǎng)絡(luò)借貸成功率進(jìn)行評(píng)估,本文將采用機(jī)器學(xué)習(xí)中隨機(jī)森林法進(jìn)行建模與實(shí)證分析.

      2.1.3 各個(gè)模型評(píng)價(jià)標(biāo)準(zhǔn)

      為了評(píng)價(jià)出每個(gè)模型效果的好壞,本文將選取三個(gè)指標(biāo)作為評(píng)價(jià)的標(biāo)準(zhǔn),分別為特異性指標(biāo)、靈敏性指標(biāo)、準(zhǔn)確度指標(biāo). 準(zhǔn)確度是指正確分類占總樣本的百分比,其模型效果的好壞與其所占比例的大小成正相關(guān).靈敏度是指所有正類被正確劃分的比率,其數(shù)值越大說(shuō)明分類方法對(duì)正類的識(shí)別能力越強(qiáng). 特異性是指所有負(fù)類被正確劃分的比率,特異性越高說(shuō)明分類方法對(duì)負(fù)類的識(shí)別能力越強(qiáng).這三個(gè)指標(biāo)的數(shù)值大小也與其模型效果的好壞成正相關(guān).三個(gè)指標(biāo)的計(jì)算如下:

      其中TP為被正確劃分為貸款成功的個(gè)數(shù),TN為被正確劃分為貸款失敗的數(shù)目,F(xiàn)P為錯(cuò)誤劃分貸款成功的個(gè)數(shù),F(xiàn)N為錯(cuò)誤劃分貸款失敗的數(shù)目.

      接著,在混淆矩陣中給出正類和反類,正類即為中關(guān)注的那一類數(shù)據(jù),也就是貸款成功的樣本,其他的則稱為反類,具體分類如表1所示.

      表1 混淆矩陣

      2.2 變量描述和模型構(gòu)建

      2.2.1 變量的選擇

      通過(guò)查閱文獻(xiàn),將借款人的借貸喜好及基本特征等與網(wǎng)絡(luò)借貸的成功率聯(lián)系起來(lái).

      借款人的基本特征:借款人性別、年齡、婚姻狀況等. 此外,多數(shù)的研究顯示借款人的基本特征與借款行為之間存在著極高的線性相關(guān)性.

      貸款人的歷史信息:借款人嚴(yán)重逾期的筆數(shù)、歷史借貸成功率等.

      貸款的基本特征:貸款用途、貸款金額、貸款利率等.

      認(rèn)證信息包括:工作認(rèn)證、收入認(rèn)證等.

      2.2.2 數(shù)據(jù)來(lái)源與變量說(shuō)明

      以“人人貸”2016 年第一季度數(shù)據(jù)(https://www.renrendai.com/)作為研究樣本,貸款次數(shù)共計(jì)56 615 次,失敗46 063 次,成功10 552 次. 表2 為2016年部分P2P網(wǎng)絡(luò)借貸原始數(shù)據(jù).

      從原始數(shù)據(jù)中提取33個(gè)解釋變量,每個(gè)變量的信息如表3所示.

      2.2.3 數(shù)據(jù)預(yù)處理

      在建模之前,對(duì)樣本進(jìn)行檢測(cè)可知,缺失值為29 261 個(gè). 去掉這些缺失值后剩下的有效樣本是27 353. 其中9 522 人借款成功,17 831 人借款失敗.

      由表4 可以看出,借款成功率與缺失變量個(gè)數(shù)成反比. 當(dāng)缺失變量為0 的時(shí)候,總樣本為27 353 個(gè),其中成功的樣本為9 252 個(gè),失敗樣本為17 831 個(gè);當(dāng)缺失變量個(gè)數(shù)為1 時(shí),總樣本為9 263 個(gè),其中成功樣本為797 個(gè),失敗樣本為8 466 個(gè);當(dāng)缺失變量個(gè)數(shù)為2 時(shí),總樣本為4 229 個(gè),其中成功樣本為158個(gè),失敗樣本為4 071個(gè);當(dāng)缺失變量個(gè)數(shù)為3時(shí),總樣本為969 個(gè),其中成功樣本為73 個(gè),失敗樣本為14 799 個(gè);而在3 以后,就會(huì)變的越來(lái)越低. 這時(shí)在總樣本為14 801 個(gè)中成功樣本只有2 個(gè),失敗樣本卻達(dá)到了14 799個(gè).

      表2 2016年部分P2P平臺(tái)網(wǎng)絡(luò)借款數(shù)據(jù)

      表3 變量信息

      把樣本數(shù)據(jù)集進(jìn)行分類,具體步驟如下:

      (1)為了對(duì)最后的預(yù)測(cè)集進(jìn)行外推,將在所有的有效樣本中任意選取其20%的樣本數(shù)據(jù)進(jìn)行測(cè)試.

      (2)用其余的80%的樣本進(jìn)行平衡抽樣,并應(yīng)用Smote 算法,將訓(xùn)練集之外的兩個(gè)數(shù)據(jù)集中的樣本按照借款成功與借款失敗1∶3的比例進(jìn)行平衡.

      表4 樣本中缺失變量個(gè)數(shù)統(tǒng)計(jì)表

      (3)在平衡后的樣本中,將訓(xùn)練集和測(cè)試集按照2∶1的比例進(jìn)行分配.

      2.2.4 特征描述

      為了獲得不同類型借款者的貸款成功率,將借款人的信用等級(jí)、性別、年齡分別與借款成功率進(jìn)行了交叉分析,計(jì)算結(jié)果如圖2所示.

      圖2 不同性別、年齡、信用等級(jí)與貸款成功率的交叉分析結(jié)果

      從圖2 中的不同性別貸款成功率,可以看出男性的成功率為3.85%,而女性的成功率為3.92%,由此可知,網(wǎng)貸的成功率與其借貸人的性別并無(wú)明顯關(guān)系.不同年齡中年齡小于30歲的成功率為3.20%;年齡30-40歲的成功率在5.35%;年齡在40-50歲的成功率為4.13%;而大于50 歲的成功率為3.17%. 故分析出借款成功率在30-40歲和40-50歲這兩個(gè)區(qū)間顯示比較高,而在30歲以下和50歲以上的群體中相對(duì)較低,可能是因?yàn)?0-50 歲這個(gè)年齡段的人收入比較穩(wěn)定,相對(duì)有經(jīng)濟(jì)基礎(chǔ),認(rèn)定的信用等級(jí)也會(huì)更高一點(diǎn).不同信用等級(jí)中,等級(jí)為AA的成功率為0;等級(jí)為B 的成功率為16.67%;等級(jí)為C 的成功率為37.50%;等級(jí)為D的成功率為40%;等級(jí)為E的成功率為62.73%;而等級(jí)為HR 的成功率只有不到3%,顯示出等級(jí)為HR 的人在P2P 平臺(tái)借款相當(dāng)困難,也就是說(shuō)網(wǎng)上借貸平臺(tái)和傳統(tǒng)金融行業(yè)都不待見等級(jí)為HR的借款人,同時(shí)在其他等級(jí)中,不能得出等級(jí)越高借款越容易的說(shuō)法.

      下面分別從收入、婚姻狀況和學(xué)歷的角度分析P2P平臺(tái)借款人在社會(huì)中的分布情況.

      (1)收入狀況. 從圖3 中可以看出,借款人的收入在5 000-10 000元這個(gè)區(qū)間的人數(shù)所占的比例最多,而在1 000元以下這個(gè)區(qū)間所占的比例最少.很明顯,借款人的收入在2 000-20 000元比較集中,低于2 000 元和高于50 000 元的人所占的比例較低.說(shuō)明收入處于中間階段的借款人更有創(chuàng)業(yè)的需求.由于缺乏資金才會(huì)前往P2P平臺(tái).

      圖3 借款人的收入分布狀況

      (2)婚姻狀況.由圖4知,借款人中已婚的最多,這部分人占了總?cè)藬?shù)的67.49%,其次就是未婚和離異的人,它們所占的比例分別為21.52%、10.55%. 而喪偶的人數(shù)所占的比率是最少的,只有不到百分之一. 產(chǎn)生這種情況可能是由社會(huì)中婚姻狀況造成的,實(shí)際上離異和喪偶的人群本來(lái)占比就小.

      圖4 借款人的婚姻分布狀況

      (3)學(xué)歷狀況. 從關(guān)于借款人學(xué)歷的分布狀況圖5中可得,大專學(xué)歷的借款人占的比例比較高,占比48.55%;學(xué)歷在研究生及以上的占的最少,只有2%;本科學(xué)歷的借款人所占比例也比較高. 產(chǎn)生這種比例的原因可能是:研究生及以上學(xué)位的人找到的工作收入比較可觀,能保障自己的生活;大專和本科學(xué)歷的人不容易滿足基本的薪資收入,想要借款投資創(chuàng)業(yè)改善生活狀態(tài).

      圖5 借款人的學(xué)歷分布狀況

      2.3 實(shí)證分析

      2.3.1 指標(biāo)體系確定

      通過(guò)篩選合適變量構(gòu)建評(píng)估模型來(lái)減小變量間的相關(guān)性,達(dá)到降低對(duì)模型預(yù)測(cè)精度的影響,為借貸平臺(tái)被借款者提供有利參考. 為確定各個(gè)變量在P2P 網(wǎng)貸平臺(tái)對(duì)其借貸成功率影響的大小,采用隨機(jī)森林啟發(fā)式算法進(jìn)行判別分析,結(jié)果如表5所示.

      表5 變量重要性

      從表5 中可以發(fā)現(xiàn),首先,借款人的基本特征、歷史信息、貸款的基本特征以及認(rèn)證信息中都存在著對(duì)因變量借貸成功率較為重要的解釋變量.其中歷史借貸成功率和未還清借款數(shù)量對(duì)因變量產(chǎn)生的影響最大.其次,收入認(rèn)證、工作認(rèn)證和信用認(rèn)證也是認(rèn)證信息中對(duì)因變量影響較大的;同樣在貸款的基本特征中,貸款金額和借款成本比其他的解釋變量顯得尤為重要,因此它們的作用是不容忽視的.

      選取具有顯著影響的排序中前6 個(gè)、前10 個(gè)等自變量分別建立隨機(jī)森立預(yù)測(cè)模型(見表6).

      由表6 可知,靈敏度并不是隨著輸入變量個(gè)數(shù)的增加而提高的,在訓(xùn)練集中第三個(gè)模型的靈敏度沒有第二個(gè)的高,但在預(yù)測(cè)集中兩個(gè)模型的靈敏度也都表示為100. 與此同時(shí),第二個(gè)模型和第三個(gè)模型的靈敏度都比第四個(gè)模型要高,證明了建模前對(duì)影響因素進(jìn)行篩選是有一定必要的. 對(duì)表6 進(jìn)行深入分析可看出,輸入變量為前10 個(gè)時(shí)構(gòu)建的模型,其預(yù)測(cè)集靈敏度相比較其他的模型是最高的,在準(zhǔn)確度這個(gè)指標(biāo)上也是優(yōu)于前6個(gè)變量所構(gòu)建的模型的,雖然其在特異性這個(gè)指標(biāo)上并不是表現(xiàn)最好的,但是綜合考慮下來(lái),該模型的精度還是較高的. 因此認(rèn)為以歷史借貸成功率、貸款金額、逾期金額、未還清借款數(shù)量、信用等級(jí)、借款成本、身份認(rèn)證、信用認(rèn)證、工作認(rèn)證和收入認(rèn)證這10個(gè)變量建立模型是最合理的.

      2.3.2 模型結(jié)果及解釋

      由上文中已確定的10 個(gè)變量構(gòu)建隨機(jī)森林預(yù)測(cè)模型,同時(shí)選取除隨機(jī)森林以外的5 種計(jì)算方法進(jìn)行對(duì)比分析,交叉驗(yàn)證其優(yōu)良性,得到表7結(jié)果.

      表6 不同輸入變量評(píng)價(jià)指標(biāo)

      表7 不同模型的比較

      從表7可看出,與其他模型相比,隨機(jī)森林法構(gòu)建的模型各項(xiàng)指標(biāo)明顯更優(yōu)一些. 而根據(jù)向量機(jī)(PSV)所建立的模型,雖然在靈敏度方面上比較突出,但是其他兩個(gè)指標(biāo)相比較隨機(jī)森林而言效果都要遜色一些. 此外,隨機(jī)森林在準(zhǔn)確度和特異性這兩個(gè)指標(biāo)上表現(xiàn)的最好,表明該模型對(duì)于成功借款的預(yù)測(cè)準(zhǔn)確度要高于其他方法建立的模型,而且對(duì)于失敗借款樣本的識(shí)別能力也非常強(qiáng).

      3 結(jié)語(yǔ)

      基于網(wǎng)貸平臺(tái)數(shù)據(jù),本文構(gòu)建了相對(duì)應(yīng)的隨機(jī)森林預(yù)測(cè)模型,并與其他五種模型算法進(jìn)行了比對(duì),得出了隨機(jī)森林模型是最優(yōu)的.利用隨機(jī)森林啟發(fā)式算法對(duì)模型進(jìn)行檢測(cè)與分析,其結(jié)果表明借款人的歷史借款成功率、貸款金額、收入認(rèn)證、工作認(rèn)證這四個(gè)因素分別是影響貸款成功率重要性排序分別為第一、二、三、四的因素. 此外,選取表6 中對(duì)應(yīng)的前6個(gè)、前10個(gè)、前14個(gè)和前18個(gè)自變量,分別建立其隨機(jī)森林模型,得出各自的評(píng)價(jià)指標(biāo),并進(jìn)行了交叉分析,結(jié)果表明由重要性排序表格中的前10個(gè)自變量構(gòu)建的模型效果最優(yōu).此外,本文構(gòu)建的P2P平臺(tái)借款成功率的隨機(jī)森林評(píng)估模型能高效的幫助投資者們選取出成功率較高的訂單,同時(shí)避免了大量復(fù)雜的計(jì)算過(guò)程,因此該模型非常適合P2P 等網(wǎng)貸平臺(tái)關(guān)于不斷增加的網(wǎng)上訂單的處理,對(duì)今后網(wǎng)貸平臺(tái)能夠快速、高效運(yùn)轉(zhuǎn)具有重要的理論指導(dǎo)作用.

      本文以“人人貸”2016 年第一季度真實(shí)數(shù)據(jù)為基礎(chǔ),應(yīng)用隨機(jī)森林算法對(duì)其構(gòu)建了借款成功率影響因素的模型,并發(fā)現(xiàn)該方法的預(yù)測(cè)精度比其他傳統(tǒng)方法更高.采用隨機(jī)森林算法研究了多個(gè)變量對(duì)網(wǎng)貸成功率的影響程度,且計(jì)算速度快、穩(wěn)定性高.另外文中選取了多達(dá)33個(gè)自然變量進(jìn)行研究,考慮因素較為全面,對(duì)網(wǎng)貸平臺(tái)的數(shù)據(jù)分析更加精準(zhǔn).但并未完全克服隨機(jī)森林算法自身的局限性,即容易過(guò)于擬合.因此在后續(xù)工作中將對(duì)此類模型選擇會(huì)進(jìn)行更深入的研究.

      猜你喜歡
      借款人借款借貸
      借款捆綁婚姻關(guān)系致訴訟
      不一樣的借款保證人
      中東鐵路與三喇嘛借款
      鄉(xiāng)城流動(dòng)借款人信用風(fēng)險(xiǎn)與空間收入差異決定
      小微企業(yè)借款人
      領(lǐng)導(dǎo)決策信息(2017年13期)2017-06-21 10:10:43
      商業(yè)銀行對(duì)借貸人貸后監(jiān)控與風(fēng)險(xiǎn)治理
      民間借貸對(duì)中小企業(yè)資本運(yùn)作的影響
      信息不對(duì)稱下P2P網(wǎng)絡(luò)借貸投資者行為的實(shí)證
      影響P2P借貸成功率的借款人信息要素研究
      金融法苑(2014年2期)2014-10-17 02:53:27
      博罗县| 志丹县| 广宁县| 凉城县| 兴城市| 阿坝县| 吉林省| 淄博市| 读书| 阳东县| 舟曲县| 封开县| 荣昌县| 岫岩| 沂南县| 禄丰县| 潼南县| 岳池县| 河源市| 荔波县| 浦北县| 金塔县| 布拖县| 康平县| 岱山县| 石阡县| 长寿区| 庆云县| 红安县| 娄底市| 重庆市| 临夏市| 景泰县| 花莲市| 尉犁县| 元阳县| 清丰县| 太和县| 铁岭市| 黄陵县| 芜湖市|