張穎+黃潔婷+賀正楚
摘要:針對(duì)P2P網(wǎng)貸平臺(tái)現(xiàn)金流較大、利潤率較低和財(cái)務(wù)數(shù)據(jù)獲取困難的特點(diǎn),構(gòu)建基于平臺(tái)交易真實(shí)數(shù)據(jù)的危機(jī)預(yù)警評(píng)價(jià)指標(biāo)體系和組合預(yù)測(cè)模型。將傳統(tǒng)的財(cái)務(wù)評(píng)價(jià)指標(biāo)轉(zhuǎn)換成網(wǎng)貸平臺(tái)交易數(shù)據(jù)指標(biāo),運(yùn)用鄰域粗糙集屬性約簡(jiǎn)的方法對(duì)采集的數(shù)據(jù)指標(biāo)進(jìn)行降噪和約減處理,再基于機(jī)器學(xué)習(xí)理論引入神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和Logit回歸等模型對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練。通過分組進(jìn)行單模型和組合模擬預(yù)測(cè),提高了新的破產(chǎn)指標(biāo)下各模型預(yù)測(cè)的準(zhǔn)確率。
關(guān)鍵詞: P2P網(wǎng)貸;危機(jī)預(yù)警;組合模型;神經(jīng)網(wǎng)絡(luò);支持向量機(jī)
中圖分類號(hào):F832;F424文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):10037217(2017)06002306
一、導(dǎo)論
P2P網(wǎng)貸平臺(tái)作為一個(gè)新興的個(gè)人對(duì)個(gè)人的投資借貸平臺(tái)正處在一個(gè)快速成長階段,現(xiàn)有監(jiān)管大多為事后監(jiān)管,對(duì)于事前預(yù)測(cè)特別是基于網(wǎng)貸平臺(tái)外部數(shù)據(jù)的科學(xué)預(yù)測(cè)理論和應(yīng)用準(zhǔn)備不足\[1\]。網(wǎng)貸平臺(tái)具有擠兌風(fēng)險(xiǎn),貸款逾期發(fā)生時(shí),P2P網(wǎng)貸平臺(tái)會(huì)出現(xiàn)暫時(shí)的流動(dòng)性不足,一旦放款人之間協(xié)調(diào)失敗就會(huì)導(dǎo)致平臺(tái)出現(xiàn)擠兌風(fēng)險(xiǎn)[2,3]。P2P網(wǎng)貸平臺(tái)陷入經(jīng)營困境的整個(gè)過程是動(dòng)態(tài)發(fā)生的,若能在P2P平臺(tái)陷入經(jīng)營困境早期就發(fā)現(xiàn)征兆,并能預(yù)測(cè)生存狀況惡化的一系列動(dòng)態(tài)過程,這對(duì)于平臺(tái)的經(jīng)營者、投資者和行業(yè)監(jiān)管者,都將有著非凡的意義。
現(xiàn)有文獻(xiàn)當(dāng)中,潘莊晨等梳理債權(quán)產(chǎn)品和產(chǎn)權(quán)產(chǎn)品的信用風(fēng)險(xiǎn)評(píng)價(jià)模型,認(rèn)為互聯(lián)網(wǎng)金融企業(yè)更加適合偏重定價(jià)功能的產(chǎn)權(quán)產(chǎn)品風(fēng)險(xiǎn)評(píng)價(jià)模型\[4\];周少甫對(duì)2 193家網(wǎng)貸平臺(tái)使用Logit模型進(jìn)行研究,認(rèn)為網(wǎng)貸平臺(tái)能夠提供良好的資金保障、具備健全的資金托管制度和流動(dòng)性較高的債權(quán)轉(zhuǎn)讓方式,可有效降低平臺(tái)出現(xiàn)重大經(jīng)營問題\[5\]。常用的風(fēng)險(xiǎn)預(yù)警模型主要有多元判別分析、Logistic回歸模型、神經(jīng)網(wǎng)絡(luò)、FR模型、STV截面回歸模型和KLR信號(hào)分析模型等。由于Logistic回歸模型對(duì)變量的分布、變量之間的協(xié)方差沒有過多的假設(shè)要求,因此被廣泛用在信用風(fēng)險(xiǎn)預(yù)警,且國外的許多研究都表明Logistic回歸模型比較有效\[6,7\]。龐素林等利用Logistic回歸模型構(gòu)建風(fēng)險(xiǎn)預(yù)警模型,并以實(shí)證研究證明模型的高效性\[8-10\]。
現(xiàn)有文獻(xiàn)對(duì)P2P平臺(tái)經(jīng)營困境的預(yù)警研究較少,具有一定的研究?jī)r(jià)值。本文主要研究通過使用最新的前沿信息技術(shù),構(gòu)建科學(xué)的評(píng)價(jià)體系和危機(jī)預(yù)警模型,識(shí)別問題網(wǎng)貸平臺(tái),預(yù)測(cè)P2P網(wǎng)貸平臺(tái)的危機(jī)風(fēng)險(xiǎn)。
二、P2P網(wǎng)貸平臺(tái)危機(jī)預(yù)警指標(biāo)選擇與約簡(jiǎn)
本文針對(duì)P2P網(wǎng)貸平臺(tái)的特點(diǎn),提出基于真實(shí)交易數(shù)據(jù)的評(píng)價(jià)思路,以交易數(shù)據(jù)代替財(cái)務(wù)數(shù)據(jù)保證數(shù)據(jù)真實(shí)性。一方面,從理論基礎(chǔ)、國內(nèi)外文獻(xiàn)及國內(nèi)主管部門監(jiān)管指導(dǎo)意見選擇能反映P2P網(wǎng)貸平臺(tái)運(yùn)營和風(fēng)險(xiǎn)的相關(guān)指標(biāo);另一方面,根據(jù)P2P網(wǎng)貸平臺(tái)所具有的互聯(lián)網(wǎng)大數(shù)據(jù)特性,通過業(yè)內(nèi)門戶網(wǎng)站、網(wǎng)貸之家、網(wǎng)貸天眼收集。同時(shí),將數(shù)據(jù)指標(biāo)進(jìn)行科學(xué)處理,并對(duì)結(jié)果進(jìn)行檢驗(yàn),從而盡可能的保證風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)的科學(xué)性、可信性。力求用最少的可觀測(cè)指標(biāo),盡量多的反映平臺(tái)運(yùn)營風(fēng)險(xiǎn)信息。
(一)危機(jī)預(yù)警原始評(píng)價(jià)指標(biāo)選擇
本文將能夠觀測(cè)到的P2P網(wǎng)貸平臺(tái)微觀指標(biāo)納入評(píng)價(jià)范圍,盡量確保評(píng)價(jià)指標(biāo)的完整性。使用的各項(xiàng)指標(biāo)數(shù)據(jù)來源于P2P網(wǎng)貸平臺(tái)第三方統(tǒng)計(jì)
網(wǎng)站,所有數(shù)據(jù)都能夠做到逐月更新,其中大多數(shù)數(shù)據(jù)能夠做到逐日更新,保證了經(jīng)過建模處理過的風(fēng)險(xiǎn)值能夠每月(每日)連續(xù)輸出。在數(shù)據(jù)采集過程中,抓取的信息包括:平臺(tái)每日成交量、平均利率、投資人數(shù)、平均貸款期限、借款人數(shù)、累計(jì)待還金額等指標(biāo)作為破產(chǎn)預(yù)測(cè)的客觀抓取指標(biāo),如表1所示。
(二)單個(gè)預(yù)測(cè)及組合模型預(yù)測(cè)
1.Logit回歸預(yù)測(cè)。
根據(jù)上文的模型介紹,應(yīng)用IBM SPSS Statistics V21.0中的二元Logistic回歸預(yù)測(cè)進(jìn)行分析,將80個(gè)選定的模擬樣本錄入SPSS工作表格中,10個(gè)指標(biāo)屬性值為協(xié)變量,問題情況(即前文提及的決策屬性,問題取值為1,正常取值為0)作為因變量。用EXCEL編輯函數(shù)來計(jì)算概率P,并最終計(jì)算得出Logit模型預(yù)測(cè)結(jié)果的準(zhǔn)確率,如表5所示。
由表5可以看出,經(jīng)過測(cè)試樣本的檢驗(yàn),所建立的Logit回歸模型總體預(yù)測(cè)準(zhǔn)確率僅為56.98%,這個(gè)水平屬于偏低的預(yù)測(cè)正確率,這個(gè)正確率還有很大的水平可以提高,因此,此Logit模型不是一個(gè)理想的預(yù)測(cè)模型。
2.神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)。
運(yùn)用SPSS 軟件中的BP神經(jīng)網(wǎng)絡(luò)的多層感知器預(yù)測(cè)方法來實(shí)現(xiàn)P2P平臺(tái)問題與否的預(yù)測(cè)工作。選用樣本的原則與上文一致,即選擇80個(gè)樣本為模擬樣本,86個(gè)樣本為測(cè)試樣本,共166個(gè)樣本。模型訓(xùn)練完成后,生成的神經(jīng)網(wǎng)絡(luò)模型對(duì)測(cè)試樣本數(shù)據(jù)測(cè)試后與實(shí)際比較的結(jié)果正確率如表6所示。
從H表中可以看出對(duì)于P2P實(shí)際出現(xiàn)問題的正確率為73.2%,而P2P實(shí)際運(yùn)行正常的正確率為64.4%,綜合正確率為68.6%,預(yù)測(cè)結(jié)果較Logit回歸預(yù)測(cè)準(zhǔn)確率高,但仍然有很大的提高空間。
3.支持向量機(jī)預(yù)測(cè)。
已有研究表明,高斯核函數(shù)支持向量機(jī)模型的預(yù)測(cè)準(zhǔn)確率最高,而核函數(shù)的選擇是構(gòu)建支持向量機(jī)模型的關(guān)鍵[14],因此高斯核函數(shù)被本文采用。通過對(duì)數(shù)據(jù)結(jié)果的比較,當(dāng)高斯核函數(shù)的閾值δ2=0.7時(shí),支持向量機(jī)程序的準(zhǔn)確率最高。利用libsvm工具箱在MATLAB2014a中運(yùn)行得出檢測(cè)樣本的實(shí)際預(yù)測(cè)結(jié)果如表7所示。
由表7可以看出,經(jīng)過測(cè)試樣本的檢驗(yàn),支持向量機(jī)總體預(yù)測(cè)準(zhǔn)確率為68.6%,介于Logit回歸分析預(yù)測(cè)的準(zhǔn)確率和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確率之間,同樣不是很理想。
(三)基于貝葉斯算法的投票式組合預(yù)測(cè)
通過上面的分析,根據(jù)上述三種模型的預(yù)測(cè)結(jié)果,結(jié)合上文中的方法,應(yīng)用EXCEL得到基于貝葉斯算法的投票式組合endprint
由表8可知,基于貝葉斯算法的投票式組合預(yù)測(cè)中只有13個(gè)預(yù)測(cè)錯(cuò)誤,其中 P2P問題平臺(tái)只有5個(gè)預(yù)測(cè)錯(cuò)誤,而且問題平臺(tái)與正常平臺(tái)的預(yù)測(cè)之間并沒有顯示出明顯的差異。
上文所述的三種預(yù)測(cè)模型各有其優(yōu)缺點(diǎn),其預(yù)測(cè)結(jié)果準(zhǔn)確率也有較大差異,Logit模型預(yù)測(cè)為傳統(tǒng)統(tǒng)計(jì)模型,而神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)應(yīng)用人工智能和機(jī)器學(xué)習(xí)等新興的學(xué)習(xí)方法進(jìn)行預(yù)測(cè)分析,對(duì)比各模型準(zhǔn)確率,如表9所示。
由表9可以看出,傳統(tǒng)統(tǒng)計(jì)模型Logit模型的預(yù)測(cè)準(zhǔn)確率最低,其次為支持向量機(jī)預(yù)測(cè)方法,而預(yù)測(cè)準(zhǔn)確率最高的為BP神經(jīng)網(wǎng)絡(luò),從這一結(jié)果可以看出人工智能領(lǐng)域預(yù)測(cè)方法的優(yōu)勢(shì)之處,傳統(tǒng)的統(tǒng)計(jì)模型因其多個(gè)弊端無法準(zhǔn)確預(yù)測(cè)數(shù)據(jù)的正確率。而結(jié)合三種預(yù)測(cè)方法的投票式組合預(yù)測(cè)方法在本文的應(yīng)用過程中發(fā)揮其優(yōu)勢(shì),綜合了三種預(yù)測(cè)模型的利弊,得出相對(duì)較好的準(zhǔn)確率,且穩(wěn)定性良好。
五、結(jié)論
本文針對(duì)當(dāng)前P2P網(wǎng)貸平臺(tái)內(nèi)部財(cái)務(wù)信息不透明的現(xiàn)狀及政府、投資者對(duì)網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)的現(xiàn)實(shí)需要之間的矛盾,創(chuàng)新性地提出基于網(wǎng)貸平臺(tái)公開交易數(shù)據(jù)的危機(jī)預(yù)警新方法,通過運(yùn)用數(shù)據(jù)采集、去噪技術(shù),結(jié)合支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法進(jìn)行數(shù)據(jù)訓(xùn)練,得到了較好的預(yù)測(cè)結(jié)果。通過研究,得到以下結(jié)論:
1.構(gòu)建了基于網(wǎng)貸平臺(tái)公開交易數(shù)據(jù)的危機(jī)預(yù)警指標(biāo)體系。論文在直接抓取的數(shù)據(jù)中選取平臺(tái)每日成交量、平均利率、投資人數(shù)、平均貸款期限、借款人數(shù)、累計(jì)待還金額等指標(biāo)作為危機(jī)預(yù)警的指標(biāo),通過領(lǐng)域粗糙集進(jìn)行指標(biāo)約簡(jiǎn)后得到相應(yīng)指標(biāo)體系;
2.結(jié)合機(jī)器學(xué)習(xí)技術(shù),對(duì)選擇的P2P網(wǎng)貸平臺(tái)變量和數(shù)據(jù)進(jìn)行約簡(jiǎn)、建模、預(yù)測(cè)。本文選取了三個(gè)準(zhǔn)確率較高的模型:Logit回歸,神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)模型。采用分別建立相應(yīng)的模型,并將采集的數(shù)據(jù)在預(yù)處理后分別代入各單一個(gè)模型,以檢測(cè)各模型的效果,最后將三個(gè)模型的實(shí)際輸出結(jié)果作為輸入,結(jié)合貝葉斯算法構(gòu)建投票式組合預(yù)測(cè)模型,使各模型之間可以相互補(bǔ)充,提高預(yù)測(cè)的精度和穩(wěn)定性。
3.對(duì)166家主流P2P網(wǎng)貸平臺(tái)進(jìn)行實(shí)證研究。通過跟蹤采集“網(wǎng)貸之家”等P2P監(jiān)測(cè)網(wǎng)站交易數(shù)據(jù)組成模擬樣本進(jìn)行模擬和測(cè)試,驗(yàn)證本文提出的P2P網(wǎng)貸平臺(tái)危機(jī)預(yù)警新方法的準(zhǔn)確性。從預(yù)測(cè)結(jié)果來看,采用本文提出的P2P網(wǎng)貸平臺(tái)危機(jī)預(yù)警新指標(biāo)體系,結(jié)合組合式預(yù)測(cè)模型,能得到較好的預(yù)測(cè)效果。
參考文獻(xiàn):
[1]肖萍.互聯(lián)網(wǎng)金融與中小企業(yè)融資困境的化解途徑\[J\].河南師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2015(4):77-80.
\[2\]蔣玉.互聯(lián)網(wǎng)金融的特殊風(fēng)險(xiǎn)和法律規(guī)制\[J\].廣西財(cái)經(jīng)學(xué)院學(xué)報(bào),2015(4):41-46.
\[3\]朱寶.普惠金融體系下互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)溢出效應(yīng)研究\[J\].廣西財(cái)經(jīng)學(xué)院學(xué)報(bào),2017(1):78-85.
\[4\]潘莊晨,邢博,范小云.信用風(fēng)險(xiǎn)評(píng)價(jià)模型綜述及對(duì)我國P2P網(wǎng)絡(luò)借貸平臺(tái)的借鑒\[J\].現(xiàn)代管理科學(xué),2015(1):33-36.
\[5\]周少甫,李逸翔,裴逸杰.P2P網(wǎng)貸平臺(tái)資信因素對(duì)正常經(jīng)營影響的實(shí)證分析\[J\].武漢金融,2016(1):34-36.
\[6\]Vijayakumar P, Naresh R,Deborah L J,et al.An efficient group key agreement protocol for secure P2P communication\[J\].Security and Communication Networks,2016(9):3952-3965.
\[7\]Khan U,SchmidtThieme L,Nanopoulos A.Collaborative SVM classification in scalefree peertopeer networks\[J\].Expert Systems with Applications,2017(1):74-86.
\[8\]龐素琳.Logistic回歸模型在信用風(fēng)險(xiǎn)分析中的應(yīng)用\[J\].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006,36(9):129-137.
\[9\]盧永艷.基于面板數(shù)據(jù)的上市公司財(cái)務(wù)困境預(yù)測(cè)\[D\].大連:東北財(cái)經(jīng)大學(xué),2012.
\[10\]陳曉蘭,任萍.基于Logistic混合模型的企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)研究\[J\].山東財(cái)政學(xué)院學(xué)報(bào),2011(2):90-93.
\[11\]王錦虹.互聯(lián)網(wǎng)金融對(duì)商業(yè)銀行盈利影響測(cè)度研究——基于測(cè)度指標(biāo)體系的構(gòu)建與分析\[J\].財(cái)經(jīng)理論與實(shí)踐,2015,36(1):7-12.
\[12\]Rogers Chris,Clarke Chris. Mainstreamingsocialfinance:the regulation of the peertopeer lending marketplace in the United Kingdom\[J\].British Journal of Poliltics & International Relations,2016(18):930-945.
\[13\]Pokorna Martina, Sponer Miroslav. Social lending and its risks\[J\].19th International Conference Enterprise and Competitive Environment,2016(20):330-337.
\[14\]Khan U,SchmidtThieme L,Nanopoulos A. Collaborative SVM classification in scalefree peertopeer networks\[J\].Expert Systems with Applications,2017(1):74-86.
\[15\]王效俐,劉瀟,蘇強(qiáng).鄰域粗糙集融合貝葉斯神經(jīng)網(wǎng)絡(luò)在醫(yī)療決策中的應(yīng)用研究\[J\].工業(yè)工程與管理,2016(5):141-147.
(責(zé)任編輯:鐘瑤)
Abstract: Based on the characteristics of assetlight, large cash flow, low profit and difficulty in financial data acquisition, evaluation index system and the combination prediction model for crisis prediction based on the real data of platform transaction were constructed. The traditional bankruptcy financial evaluation index was transformed into the net loan transaction data index and the collected data was reduced by the method of neighborhood rough set. On this basis, the data was trained with the machine learning theory which introduced neural network and support vector, logit regression machine model and so on. Finally, the data was divided into single group and combination group for predictive simulation and the accuracy of each model under the new bankruptcy index was obtained.
Key words:P2P; crisis prediction; combination prediction model; neural network; SVMendprint