P2P網(wǎng)貸(Peer-to-Peer Lending)是指從事點(diǎn)對(duì)點(diǎn)服務(wù)的網(wǎng)貸平臺(tái),不依靠傳統(tǒng)的銀行服務(wù)而直接通過(guò)網(wǎng)絡(luò)平臺(tái)來(lái)完成貸款業(yè)務(wù)的模式[6]。這種模式便捷高效,打造了更為直接透明的交易平臺(tái),是實(shí)現(xiàn)普惠金融的有效手段。P2P網(wǎng)貸興起于英國(guó)發(fā)展于美國(guó),逐漸在世界范圍內(nèi)得到認(rèn)可和發(fā)展。2005至2007年間成立的四家P2P網(wǎng)貸平臺(tái)(Zopa、Kiva、Prosper、Lending Club)普遍面向居民和中小企業(yè),創(chuàng)造出多種資信評(píng)級(jí)方式,成為全球P2P借貸行業(yè)的引導(dǎo)。2007年6月,我國(guó)第一家P2P網(wǎng)貸公司——拍拍貸在上海成立,該模式提高了社會(huì)閑散資金的利用率,解決了借款人小額貸款的繁瑣,引領(lǐng)我國(guó)P2P網(wǎng)貸事業(yè)的發(fā)展。近年來(lái)我國(guó)P2P網(wǎng)貸行業(yè)經(jīng)歷了“野蠻生長(zhǎng)”的過(guò)程后逐步進(jìn)入正軌,在政府干預(yù)市場(chǎng)后走向規(guī)范化。由于社會(huì)信用體系不夠完善等原因,平臺(tái)仍普遍存在征信問(wèn)題,中國(guó)人民銀行已開(kāi)放個(gè)人信用查詢,但全國(guó)范圍內(nèi)仍在試行階段,易形成信息不對(duì)稱,易造成損失。在不斷的探索中,當(dāng)前形成了借款人主動(dòng)提供個(gè)人信息和貸款平臺(tái)開(kāi)展驗(yàn)證式調(diào)查的方式,部分情況下還會(huì)實(shí)地勘探。造成諸多人力浪費(fèi),資信評(píng)級(jí)的準(zhǔn)確和流通也有諸多欠缺。
因此需要對(duì)借款人的信用情況進(jìn)行一個(gè)合理的評(píng)估,各界學(xué)者對(duì)P2P網(wǎng)貸平臺(tái)及其信用評(píng)級(jí)進(jìn)行了廣泛研究。王會(huì)娟(2014)從信息不對(duì)稱的理論框架出發(fā),發(fā)現(xiàn)信用評(píng)級(jí)越高,借款成功率越高且借款成本越低;楊龍光(2016)針對(duì)國(guó)內(nèi)信用評(píng)級(jí)研究面臨的違約率數(shù)據(jù)缺失的問(wèn)題,提出了一種綜合回歸思路與聚類的算法[17]他們提出的方法不會(huì)因?yàn)榭疾鞂?duì)象和考察時(shí)間的變化而變化,為信用評(píng)級(jí)方法提供參考唐國(guó)雷(2016)構(gòu)建了logistic模型和BP神經(jīng)網(wǎng)絡(luò)模型,進(jìn)行對(duì)比分析,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)模型能夠更好的應(yīng)用于評(píng)估P2P 網(wǎng)絡(luò)借貸中借款人的信用風(fēng)險(xiǎn)[10]。
本文通過(guò)構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)對(duì)借款人的信用評(píng)級(jí),該模型可以對(duì)平臺(tái)的風(fēng)險(xiǎn)管理起到一定作用,綜合國(guó)內(nèi)外的研究分析影響平臺(tái)借款人信用優(yōu)良程度的評(píng)級(jí)指標(biāo)與主要因素,從信用風(fēng)險(xiǎn)的角度出發(fā),結(jié)合我國(guó)發(fā)展較為成熟的商業(yè)銀行借貸評(píng)級(jí)信用模式與我國(guó)P2P網(wǎng)貸平臺(tái)已有的借款人信用評(píng)級(jí)指標(biāo)選取合適的指標(biāo)作為建模的基礎(chǔ),選取國(guó)內(nèi)較有代表性的拍拍貸數(shù)據(jù),采用動(dòng)量項(xiàng)的方法進(jìn)行算法優(yōu)化,對(duì)于豐富和完善我國(guó)現(xiàn)有的信用評(píng)級(jí)方法也起到了促進(jìn)的作用。
構(gòu)建P2P網(wǎng)貸平臺(tái)的借款人信用評(píng)級(jí)是一個(gè)嚴(yán)謹(jǐn)?shù)倪^(guò)程。以往P2P網(wǎng)貸平臺(tái)使用的借款人信用評(píng)級(jí)方法大多為專家分析法,即專家通過(guò)分析借款人的財(cái)務(wù)分析、經(jīng)營(yíng)信息、經(jīng)濟(jì)環(huán)境等因素,來(lái)對(duì)借款人的資信、品質(zhì)等進(jìn)行評(píng)判,以確定評(píng)級(jí)結(jié)果,目前得到了世界上大多數(shù)國(guó)家的認(rèn)可和采納。在選取指標(biāo)的過(guò)程中主要考慮到全面性、代表性、相對(duì)穩(wěn)定性、可行性和穩(wěn)定性。比如經(jīng)典的年齡,性別,居住地,婚姻狀況,文化水平、職業(yè)性質(zhì),行業(yè)收益,發(fā)展前景、經(jīng)濟(jì)實(shí)力等指標(biāo)。隨著P2P網(wǎng)貸方式和互聯(lián)網(wǎng)的普及。部分平臺(tái)開(kāi)始加入歷史紀(jì)錄等直接可靠的指標(biāo),避免了一些信息滯留造成的重復(fù)損失。
我國(guó)運(yùn)營(yíng)良好的P2P網(wǎng)貸平臺(tái)要求借款人提供的信息大致包括借款人的基本信息、資產(chǎn)信息和工作信息三大類,每個(gè)平臺(tái)可以自行制定借款人需上傳的指標(biāo)數(shù)據(jù),以能夠證明借款人有能力償還債務(wù)為目的填寫(xiě)相關(guān)信息,再由網(wǎng)貸平臺(tái)使用自身的信用評(píng)價(jià)機(jī)制對(duì)其進(jìn)行信用評(píng)級(jí),將結(jié)果公布到平臺(tái)上以供投資者進(jìn)行放貸參考。我國(guó)傳統(tǒng)銀行要求借款人提供的個(gè)人信息相差不大,有相對(duì)較完整的指標(biāo)體系。
本文通過(guò)對(duì)國(guó)內(nèi)部分網(wǎng)貸平臺(tái)進(jìn)行研究和對(duì)比,根據(jù)P2P網(wǎng)貸線上評(píng)估,直接融資,中介把關(guān)的特點(diǎn),參考中國(guó)建設(shè)銀行的個(gè)人貸款信用評(píng)價(jià)指標(biāo)體系,結(jié)合以前的個(gè)人信用評(píng)價(jià)指標(biāo)體系的研究成果和方法,得出P2P網(wǎng)貸借款人的信用評(píng)價(jià)指標(biāo)體系。選取六個(gè)指標(biāo)作為后續(xù)建模的基礎(chǔ),分別為:年齡、文化程度、婚姻狀況、年收入、現(xiàn)居地以及歷史信用,并將各個(gè)指標(biāo)進(jìn)行科學(xué)量化。
BP神經(jīng)網(wǎng)絡(luò)是指誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),該模型的特點(diǎn)是信息向前傳遞,誤差反向傳遞,即每一層的神經(jīng)元只會(huì)影響下一層神經(jīng)元的輸出狀態(tài),一般為三層感知器,所謂三層包括了輸入層、隱藏層和輸出層。正向傳播時(shí),輸入樣本從輸入層傳入,經(jīng)各隱藏層處理后,傳向輸出層,如果輸出層沒(méi)有得到預(yù)期的輸出,則進(jìn)行誤差反向傳遞,誤差反傳是將輸出誤差以某種形式通過(guò)隱藏層逐層反傳,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號(hào),此誤差信號(hào)即作為修正各單元權(quán)值的依據(jù)。這種信號(hào)正向傳播與誤差反向傳播的各層權(quán)值調(diào)整過(guò)程是周而復(fù)始地進(jìn)行的。權(quán)值不斷調(diào)整的過(guò)程,也就是網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過(guò)程。這一過(guò)程反復(fù)進(jìn)行,直到輸出值與期望值相等后訓(xùn)練結(jié)束,得出模型。
拍拍貸在我國(guó)也具有代表性且口碑信譽(yù)良好。本文從拍拍貸信息平臺(tái)爬取150組借款人的信息數(shù)據(jù)作為本文 P2P網(wǎng)貸借款人的信用評(píng)估樣本,其中120組數(shù)據(jù)作為訓(xùn)練組,剩下的30組數(shù)據(jù)作為參照組,來(lái)對(duì)模型優(yōu)化的結(jié)果進(jìn)行驗(yàn)證,使用MATLAB進(jìn)行仿真訓(xùn)練。
訓(xùn)練函數(shù)的選擇。選用Sigmoid作為轉(zhuǎn)移函數(shù),其優(yōu)點(diǎn)在于輸出范圍有限,為(0,1),所以數(shù)據(jù)在傳遞的過(guò)程中不容易發(fā)散。并且這個(gè)函數(shù)具有連續(xù)可導(dǎo)和非線性的特點(diǎn),計(jì)算起來(lái)相對(duì)簡(jiǎn)單。
輸入層和輸出層的設(shè)計(jì)。輸入層單元數(shù)為特征數(shù)量,本文選取了6個(gè)指標(biāo),所以輸入層數(shù)為6。
輸出層單元數(shù)為目標(biāo)數(shù)量,本文輸出層的設(shè)計(jì)為一個(gè)單元數(shù)。
隱藏層的設(shè)計(jì)。本文需要處理的數(shù)據(jù)不是很繁瑣,因此建立一個(gè)隱藏層即可。隱藏層節(jié)點(diǎn)數(shù)的作用是從樣本中提取并儲(chǔ)蓄其內(nèi)在規(guī)律,每個(gè)隱節(jié)點(diǎn)有若干個(gè)權(quán)值,而每個(gè)權(quán)值都是增強(qiáng)網(wǎng)絡(luò)映射能力的一個(gè)參數(shù)。隱節(jié)點(diǎn)數(shù)目如果太少,則網(wǎng)絡(luò)難以收斂,數(shù)目如果過(guò)多,則容易造成網(wǎng)絡(luò)訓(xùn)練時(shí)間變長(zhǎng),網(wǎng)絡(luò)的穩(wěn)定性就會(huì)降低。本文選擇試湊法來(lái)確定最佳隱節(jié)點(diǎn)數(shù)目,初始化隱層單元數(shù)m滿足
其中n為輸入層節(jié)點(diǎn)數(shù),在本文中n=6。進(jìn)一步確定隱藏層單元數(shù),并進(jìn)行反復(fù)驗(yàn)證來(lái)尋找最優(yōu)隱藏單元數(shù)。在初始化隱藏層單元數(shù)的基礎(chǔ)上,逐漸增加隱節(jié)點(diǎn)數(shù),用同一樣本集進(jìn)行訓(xùn)練,從中確定網(wǎng)絡(luò)誤差最小時(shí)對(duì)應(yīng)的隱節(jié)點(diǎn)數(shù)。
初始權(quán)值的設(shè)計(jì)。網(wǎng)絡(luò)權(quán)值的初始化決定了網(wǎng)絡(luò)的訓(xùn)練從誤差曲面的哪一點(diǎn)開(kāi)始,因此初始化方法對(duì)縮短網(wǎng)絡(luò)的訓(xùn)練時(shí)間至關(guān)重要。本文對(duì)隱層初始權(quán)值設(shè)定足夠小,但不全置為0,因?yàn)槿脼?后每次更新權(quán)重都會(huì)是一樣的結(jié)果。
如果輸出層權(quán)值太小,會(huì)使隱層權(quán)值在訓(xùn)練初期的調(diào)整量變小,因此采用使初始值為十1和一1的權(quán)值數(shù)相等的方法。按以上方法設(shè)置的初始權(quán)值可使每個(gè)神經(jīng)元一開(kāi)始都工作在其轉(zhuǎn)移函數(shù)變化最大的位置。
增加動(dòng)量項(xiàng)。標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)算法在調(diào)整權(quán)值時(shí),只按t時(shí)刻誤差的梯度下降調(diào)整,而沒(méi)有考慮t時(shí)刻以前的梯度方向,從而使訓(xùn)練過(guò)程發(fā)生震蕩,收斂緩慢。為了提高網(wǎng)絡(luò)的訓(xùn)練速度,可以在權(quán)值調(diào)整公式中增加一動(dòng)量項(xiàng)。即從前一次權(quán)值調(diào)整量中取出一部分迭加到本次權(quán)值調(diào)整量中,動(dòng)量項(xiàng)反映了以前積累的調(diào)整經(jīng)驗(yàn),對(duì)于t時(shí)刻的調(diào)整起阻尼作用。當(dāng)誤差曲面出現(xiàn)驟然起伏時(shí),可減少震蕩趨勢(shì),提高訓(xùn)練速度。
本文利用MATLAB軟件建立BP神經(jīng)網(wǎng)絡(luò)算法模型,進(jìn)行標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)算法計(jì)算時(shí)發(fā)現(xiàn)模型正確率最高為74%,加入動(dòng)量項(xiàng)優(yōu)化后使模型可以自行修正權(quán)值和閾值,根據(jù)試湊法確定最佳隱藏層節(jié)點(diǎn)數(shù)目,選擇學(xué)習(xí)率為0.1的情況下,分別設(shè)置隱藏層節(jié)點(diǎn)數(shù)為3、4、5、6、7、8、9、10、11、12、13、14、15,對(duì)每一種不同的隱藏層節(jié)點(diǎn)數(shù)進(jìn)行15次訓(xùn)練,在確定最大訓(xùn)練次數(shù)為3500次的情況下記錄損失函數(shù)值以及對(duì)應(yīng)的正確率,根據(jù)結(jié)果可以看出當(dāng)選擇隱藏層節(jié)點(diǎn)數(shù)為3時(shí),模型正確率最高且損失值最小,因此此模型的隱層數(shù)選擇為3。由誤差分析圖可以看出此模型的擬合度較優(yōu)。
用剩余30組數(shù)據(jù)作為對(duì)照組進(jìn)行模型的檢驗(yàn),結(jié)果驗(yàn)證表明,BP神經(jīng)網(wǎng)絡(luò)模型具有良好的自適應(yīng)性,能夠較準(zhǔn)確地輸出期望值與實(shí)際相符,能對(duì)借款人的信用情況做出高效的評(píng)價(jià)。
本文首先引入普惠金融的理念介紹了P2P網(wǎng)貸的概念,通過(guò)對(duì)國(guó)外資深網(wǎng)絡(luò)金融平臺(tái)的興起與運(yùn)作模式深入了解整個(gè)行業(yè)的發(fā)展歷程。從國(guó)內(nèi)P2P網(wǎng)貸行業(yè)真實(shí)數(shù)據(jù)出發(fā)了解到存在的征信問(wèn)題,并通過(guò)爬蟲(chóng)技術(shù)收集網(wǎng)貸平臺(tái)公開(kāi)的真實(shí)數(shù)據(jù),分析我國(guó)運(yùn)營(yíng)良好的P2P網(wǎng)貸平臺(tái)以及我國(guó)傳統(tǒng)商業(yè)銀行的評(píng)級(jí)指標(biāo),以中國(guó)建設(shè)銀行為基本,選取六個(gè)與借款人信用程度相關(guān)性強(qiáng)的指標(biāo)。通過(guò)對(duì)BP神經(jīng)網(wǎng)絡(luò)算法的研究,對(duì)模型的整體思路有詳細(xì)的闡述。BP神經(jīng)網(wǎng)絡(luò)的各層結(jié)構(gòu)的確定有明確的方法,由梯度下降和誤差曲面展開(kāi),通過(guò)增加動(dòng)量項(xiàng)的方法對(duì)模型進(jìn)行優(yōu)化,發(fā)現(xiàn)可以有效減少了訓(xùn)練過(guò)程的震蕩幅度,加快模型收斂速度,相對(duì)于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)算法,有著更高效的可操作性,更適用于構(gòu)建借款人的信用評(píng)級(jí)。
(中國(guó)計(jì)量大學(xué),浙江 杭州 310018)