譚中明 劉媛媛
【摘要】P2P網(wǎng)貸市場各主體產生的信用風險具有特定的生成演化機制。先采用博弈樹對P2P網(wǎng)貸主體的信用風險生成演化進行理論分析,再基于“有限理性”的“最優(yōu)反應動態(tài)”機制,建立P2P網(wǎng)貸過程的得益函數(shù),對信用風險生成機理進行博弈仿真實驗。研究表明,P2P網(wǎng)貸市場信用風險生成主體主要是借款人和P2P平臺,生成大小與P2P平臺年化收益率設定成正比,而與借款人通過網(wǎng)貸所得收益、借款人違約懲罰以及借款人長期守信所獲獎勵成反比。
【關鍵詞】P2P網(wǎng)貸;信用風險;生成機理;博弈樹;博弈仿真
【中圖分類號】F830.5【文獻標識碼】A【文章編號】1004-0994(2019)22-0129-5
【基金項目】國家社會科學基金項目“基于生態(tài)圈視角的P2P網(wǎng)絡借貸信用風險傳導、動態(tài)評測與防控策略研究”(項目編號:16BGL049)
P2P網(wǎng)貸的出現(xiàn)為大量無法獲得銀行借款的小額資金需求者提供了有效的借款渠道,也有利于社會閑散資金的有效配置,進而完善金融資源配置體系。我國P2P網(wǎng)貸經(jīng)歷了最初的爆炸式發(fā)展后,近年開始進入矯正調整階段。2016年8月頒布的《網(wǎng)絡借貸信息中介機構業(yè)務活動管理暫行辦法》,明確界定了P2P網(wǎng)貸平臺信息中介的地位,P2P網(wǎng)貸平臺逐漸回歸互聯(lián)網(wǎng)金融本質。相對于中心化的傳統(tǒng)金融服務而言,P2P網(wǎng)貸這種脫離實體金融中介的純線上信用審核模式會引發(fā)信息不對稱問題,并由此產生逆向選擇和道德風險[1]。網(wǎng)貸市場充斥著違約行為,潛藏著巨大的信用風險,P2P網(wǎng)貸平臺爆雷事件頻發(fā),信用風險大有演化為社會風險之勢。
本文首先對網(wǎng)貸市場中各參與主體的網(wǎng)貸行為進行博弈理論分析,建立博弈樹來分析P2P網(wǎng)貸過程中信用風險生成節(jié)點;然后重點對借款人和投資人的得益函數(shù)進行博弈仿真,進一步探究信用風險生成的影響因素,以期對已有研究成果進行補充,為有效控制P2P網(wǎng)貸行業(yè)信用風險提供依據(jù)。
一、P2P網(wǎng)貸信用風險生成演化:基于不同主體之間的博弈理論分析
P2P網(wǎng)貸業(yè)務涉及多個利益主體,如借款人、P2P平臺、投資人、第三方機構等,這些主體業(yè)務結構和目標各不相同,在決策過程中不可避免地存在非理性和機會主義傾向,可能導致決策失誤、互相欺騙等行為,從而影響網(wǎng)貸市場效率,甚至引發(fā)整個P2P網(wǎng)貸市場的信用風險。借款人是網(wǎng)貸市場中的資金需求者,投資人是資金供給者,兩者之間是資金再分配的關系。投資人與借款人之間的借貸過程主要依賴于P2P平臺開展。P2P平臺既幫助投資人對借款人進行篩選把關,也幫助中小企業(yè)等借款人獲得投資。P2P平臺基于長遠發(fā)展和建立良好聲譽考慮,會對借款人進行資質審查與篩選,可以認為P2P平臺不存在協(xié)助借款人對投資人進行欺騙的行為。投資人有必要在決策前了解借款人情況,從而有選擇性地借出資金。由此可以看出各主體間存在信息不對稱,因此可采用博弈論進行分析。
對P2P網(wǎng)貸市場信用風險生成的博弈分析基于以下假設:①博弈行為主要在借貸流程中的借款人、P2P平臺、投資人三方參與主體間兩兩發(fā)生;②P2P網(wǎng)貸市場借款門檻低,借款人質量不一;③對于資質良好、無虛假資料的借款人,P2P網(wǎng)貸平臺容許其進行交易[2]。
在整個P2P網(wǎng)貸中,三方主體兩兩之間可采取的主要博弈行為如下:①借款人獲得投資后可采取的措施為{守信,違約},借款人的違約行為一定程度上會對P2P平臺是否合規(guī)經(jīng)營產生影響;②P2P平臺針對借款人的借款申請可采取的措施為{信任,不信任},P2P平臺對投資人可采取的措施為{按時支付本息,不按時支付本息},即平臺在經(jīng)營過程中可能會出現(xiàn)不按時支付本息、不合規(guī)履行職責,甚至卷款跑路的情況;③投資人針對借款人的借款申請可采取的措施為{投資,不投資},投資人是否投資的決策也依賴于相關信息的搜集。
借款人與P2P平臺之間的博弈主要在于P2P平臺是否信任對方,若獲得信任且通過平臺獲得投資后借款人是否守約;借款人與投資人之間的博弈借助P2P平臺進行,主要在于投資人是否投資和借款人是否守約;投資人與P2P平臺之間的博弈主要在于投資人是否在該平臺投資,以及P2P平臺是否按時向投資人支付本息。若P2P平臺對借款人選擇“不信任”策略,借款人喪失此借款機會,借貸交易不成立;若P2P平臺對借款人采取“信任”策略,則借款人可在該平臺上申請借款,有機會獲得投資人的投資,此時若投資人采取“投資”策略,則借貸交易發(fā)生;若投資人采取“不投資”策略,則借貸交易不發(fā)生。獲得投資后,借款人也可選擇“守信”或“違約”。當借款人采取“守信”策略時,若P2P平臺選擇“按時支付本息”,則三方共贏,投資人達到賺取利息的投資目的,P2P平臺賺取信息中介費用,借款人可解決資金不足的問題,同時也有機會在P2P平臺上二次借款;若P2P平臺選擇“不按時支付本息”,則P2P平臺獲益,但投資人遭受損失,此時P2P平臺就會產生信用風險。當借款人采取“違約”策略時,則借款人產生信用風險,且將風險傳遞至P2P平臺和投資人,在下一次博弈時,P2P平臺將不再信任該借款人,即使P2P平臺再次給予該借款人借款機會,當其他投資人了解到借款人的信用值時,投資人將不會再次投資。
囚徒困境表明,個體會在潛在的長遠利益與目前的短期利益之間進行權衡,多次博弈可能帶來合作[3]。具體可用下圖的博弈樹表示[4]。
上述博弈分析表明,在借款人、P2P平臺以及投資人的信用風險生成的博弈過程中,信用風險主要產生于借款人自身的主動與被動違約,以及P2P平臺由于技術欠缺、自身財務危機、違規(guī)經(jīng)營等導致無法按時支付本息。
二、P2P網(wǎng)貸信用風險生成演化博弈仿真分析設計
(一)有限理性下P2P網(wǎng)貸主體行為活動規(guī)則設計
傳統(tǒng)的博弈論認為,經(jīng)濟個體具有“完全理性”的特征,但由于決策過程的非理性傾向,“完全理性”的假設是不符合實際情況的。因此本文將基于“有限理性”觀點分析P2P網(wǎng)貸過程中的博弈主體演化規(guī)則?!坝邢蘩硇浴庇^點表明,參與主體可使用最優(yōu)反應動態(tài)機制和復制者動態(tài)機制。前者一般適用于有限理性博弈者之間的策略進化,這些博弈者具有較強的學習能力和較快的反應速度,即該機制的分析總體基于一種假設:機制主體具有較強的學習能力,即使在復雜的情況下難以通過預見性進行準確判斷,但整體具有很強的策略調整能力[5]。
由于主要參與者即借款人、P2P平臺和投資人整體能力都相對較弱,對資源的利用有限,很難獲取事件的詳細信息,無法對其進行更為復雜的、具體的量化分析,因此對P2P網(wǎng)貸信用風險的分析主要是基于最優(yōu)反應動態(tài)的博弈仿真。
根據(jù)上述博弈理論分析可知,信用風險主要來源于借款人與P2P平臺兩個主體。借款人是最大的信用風險來源,P2P平臺主要對借款人進行信息審核,對最終借貸行為是否完成不產生決定性影響,借貸發(fā)生的主體是借款人和投資人。因此,此處基于最優(yōu)反應動態(tài)建立的仿真模型主要是投資人與借款人兩者的博弈仿真,通過對這兩者的博弈仿真來分析P2P網(wǎng)貸業(yè)務信用風險生成的影響因素。本博弈仿真同樣遵循前文理論分析假設,使用的軟件是MATLAB R2014a。
(二)有限理性主體“預定策略”的組合配置
本次博弈仿真是以“最優(yōu)反應”的“預定策略”為原則來為P2P網(wǎng)貸的參與主體事先制定博弈游戲規(guī)則。游戲中每個參與主體都要針對對手上次博弈選擇的行為來確定此次博弈采取的策略。基于“預定策略”的游戲規(guī)則,主體通常依據(jù)“若對方……,則己方……”的行動指引來作出決策。這里需要先作出假設:設定主體只能看到對方前一次選擇策略的結果(先設定參與主體通常記憶長度為一次博弈)。此次仿真規(guī)則設定需要依托美國羅伯特教授所完成的博弈論試驗進行。其中,首次博弈參與者的選擇是隨機的,這里將借款人與投資人的策略統(tǒng)一稱為“守信”或“違約”。當再次博弈時,參與者會依據(jù)對方上一次的策略制定相應的策略。
1.策略與反應策略假設。這里需要對參與者首次選擇守信的概率、對方守信后第二次博弈時依舊選擇守信的概率、對方違約后第二次博弈時選擇守信的概率分別假設為三個參數(shù)P1、P2和P3,且P1,P2,P3∈[0,1],將100%守信或違約的概率限制為非1即0,則概率為1代表“守信”、0代表“違約”。根據(jù)排列組合可以列舉出所有的概率組合,如表1所示:
2.策略解釋。將上述概率組合轉化為策略后,根據(jù)策略和反應策略的假設,暫不考慮初始策略。按照反應策略的選擇,可以把參與者的策略組合歸納成四類。這四類策略組合的意義為:①始終違約策略。參與主體在整個重復博弈中始終采用“違約”策略。②投機取巧策略。參與主體在首次博弈時采用“違約”策略,但在后續(xù)的重復博弈中,始終與對方前一次反應相反。③以牙還牙策略。參與主體在首次博弈時采用“守信”策略,但在后續(xù)的重復博弈中始終與對方前一次反應相同。④始終守信策略。參與主體在整個重復博弈中始終采用“守信”策略,保持對對方的絕對信任。
可以看出,始終違約策略組合與始終守信策略組合實際上對參與者來說并不是有效的。計算機可以把借款人與投資人這兩個主體在基于“最優(yōu)反應”的“預定策略”規(guī)則下的所有博弈選擇情況模擬出來。
以上只分析了投資人一方的初始策略和反應策略,如果把借款人和投資人兩方的策略相結合,將有64種組合策略,限于篇幅在此不進行詳細討論。
三、P2P網(wǎng)貸中借款人與投資人博弈的仿真分析
(一)P2P網(wǎng)貸中Agent、活動規(guī)則以及得益函數(shù)的定義
1. MATLAB仿真的Agent定義。在正式通過計算機實現(xiàn)對借款人和投資人雙方博弈的仿真模擬前,先要定義本次博弈中的Agent。組成經(jīng)濟系統(tǒng)的個體被稱為Agent,它具有認知與適應學習能力,通過簡單的個體行為組合形成了復雜多變的經(jīng)濟現(xiàn)象[6]。根據(jù)P2P網(wǎng)貸有限理性主體選擇分析,本次博弈仿真參與主體為借款人和投資人,因此在MATLAB R2014a中把借款人和投資人當作兩種Agent。這兩者可能的策略應由雙方初始策略和博弈后的反應策略進行組合,即:
C={(1,1),(1,0),(0,1),(0,0)}+{始終違約策略,投機取巧策略,以牙還牙策略,始終守信策略}
2. P2P網(wǎng)貸中借款人與投資人得益函數(shù)的定義。假定借款人籌資額為L,P2P平臺支付給投資人的年化收益率為r0,借款人通過該筆投資所得收益為R,借款人的違約懲罰(借款人由于違約導致無法再次通過P2P網(wǎng)貸獲得融資的損失)為T,長期信用良好借款人獲得的獎勵為Y。由于P2P網(wǎng)貸提供信息中介服務,需要協(xié)助投資人對借款人進行審核,因此需要考慮P2P平臺收取的費用,所以同時假定獲益后P2P平臺收取的投資服務費占投資人投資收益的比例為t,借款人的融資服務費和質保??羁傤~占籌資額的比例為y。以上各變量的約束條件為:變量均大于0,且Lr0(1-t)>0。根據(jù)投資人與借款人雙方的策略選擇可以得到兩者的得益函數(shù)i(k)和b(k),具體如表2所示。
(二)P2P網(wǎng)貸信用風險生成演化的博弈數(shù)值仿真實例分析
1.博弈仿真設定。盡管理論上投資人和借款人雙方可進行無限次合作(進行無限次博弈),但P2P網(wǎng)貸實際借貸過程存在一定期限,在現(xiàn)實中這種合作最多保持到4~5輪,故此次雙方博弈仿真只進行到第四輪。為了對P2P網(wǎng)貸信用風險生成機理進行更為準確的研究,下面將對借款人和投資人的博弈矩陣給出數(shù)值實例進行分析。
2.博弈仿真樣本選取。本次仿真以信融財富平臺針對普通用戶的P2P網(wǎng)貸業(yè)務中各相關指標數(shù)據(jù)作為樣本,設定指標如下:籌資額L=100,年化收益率r0=10%,獲益后P2P平臺收取的投資服務費占投資人投資收益的比例t=10%,借款人的融資服務費和質保??羁傤~占籌資額的比例y=6%,借款人通過此筆投資可得到的收益R=20,借款人的違約懲罰T=60,借款人保持長期信用良好所獲得的獎勵Y= 0.2。
3.博弈仿真過程與結果。通過MATLAB R2014a進行四次博弈仿真后得到相應結果,如表3所示。
從表3可以看到,P2P網(wǎng)貸過程中,當投資人選擇[1,1,1,1]策略,而借款人選擇[0,0,0,0]策略時,表明在雙方連續(xù)四次博弈過程中,投資人始終“信任”借款人,而借款人對此始終選擇“違約”,在此情況下,投資人活動的累計得益最少;當投資人選擇的策略為[0,1,1,1],借款人對應的選擇策略是[1,0,0,0]和[0,0,0,0]時,此時在投資人對借款人信任的三次博弈中,借款人都選擇“違約”,投資人累計得益次少。以上分析結果符合實際現(xiàn)狀,可見本模型仿真結果符合邏輯且具有可靠性。接下來將對其生成機理進行進一步分析。在實際P2P網(wǎng)貸過程中,此博弈仿真模型中的部分變量是在事先確定后保持不變的,包括:投資額L、借款人的融資服務費和質保專款總額占籌資額的比例y以及P2P平臺收取的投資服務費占投資人投資收益的比例t。由此再對剩余變量的影響狀況進行分析。剩余變量包括:年化收益率r0、借款人從此筆投資中得到的收益R、借款人的違約懲罰T以及借款人保持長期良好信用所獲得的獎勵Y。
(1)P2P網(wǎng)貸過程中剩余變量的變化規(guī)律。對于r0,在我國金融環(huán)境下,正常民間借貸年利率規(guī)定必須低于基準利率的4倍(約24%)。當前網(wǎng)貸監(jiān)管下P2P網(wǎng)貸的年化收益率并不是隨機的,正規(guī)的網(wǎng)貸平臺參考年化率默認在7%至12%之間。通過上述博弈所得的得益函數(shù)可以看出,借款人選擇“守信”所得的得益與r0變化趨勢相反,此時借款人選擇“違約”的概率反而提升,不利于控制信用風險。
對于R,借款人通過P2P網(wǎng)貸獲得的投資一般有兩種用途:一是普通借款人將獲得的借款用于消費;二是中小型或初創(chuàng)企業(yè)利用獲得的投資進行經(jīng)營。兩種情況中R都可以視為其獲得的額外利潤,其可能為正也可能為負,大部分情況下達到40%就被看作獲得高收益。此處對R的上限進行設定,假設借款人通過借款獲得的收益最高為投資額的1.4倍,即Rmax=140。
對于T,借款人的違約懲罰沒有明確的范圍限制。為約束其違約行為,借款人違約后受到的懲罰T越大越好。
對于Y,為了鼓勵借款人長期保持信用良好,Y的值通常越大越好,且Y大于0,可以確定獎勵值的增加對降低信用風險具有正向作用,此處不對Y的取值進行多次仿真。
(2)仿真分析剩余變量對P2P網(wǎng)貸信用風險的影響。在MATLAB R2014a中分別按照以下規(guī)則更改取值進行四次博弈仿真,就能分別得到新的仿真結果,通過四次仿真結果可以對P2P網(wǎng)貸過程中信用風險生成的影響因素進行分析。
將其他變量均視為常量,令R=140(原為20)。可以看出,隨著R增加,投資人的得益始終沒有受到影響,但借款人在獲得投資額時得益明顯增加。選擇極端情況進行分析,當投資人選擇[1,1,1,1]策略,而借款人選擇[0,0,0,0]策略時,兩者各自的累計得益數(shù)值為(-400,720),借款人的得益數(shù)值由初始的240增加到720??梢钥闯?,借款人越容易獲得信任和投資,就能獲得越高的累計得益。為獲得最大化利益,當借款人意識到保持“守信”能夠獲得更高收益時,會受到鼓勵以獲取更多投資,進一步誘導企業(yè)保持“守信”。因此,從P2P平臺和投資人的角度來看,選擇那些獲利能力強的借款人能夠使還款概率更加穩(wěn)定,有利于降低信用風險。
將其他變量均視為常量,令T=100(原為60)。根據(jù)仿真結果可以發(fā)現(xiàn),借款人的違約懲罰T增加帶來的結果表現(xiàn)為:當投資人的選擇策略為[1,1,1,1],對應借款人的策略為[0,0,0,0]時,兩者的累計得益數(shù)值由(-400,240)變?yōu)椋?400,80),可見借款人若始終違約最終會導致其得益減少。
將其他變量均視為常量,令T=200。增加T到200時再次進行博弈仿真模擬,得到的結果表明,當投資人的選擇策略為[1,1,1,1],對應借款人的選擇策略為[0,0,0,0]時,兩者的累計得益數(shù)值為(-400,-320),借款人始終違約所帶來的得益進一步減少,甚至變?yōu)樨撝担藭r借款人不會再選擇“違約”策略來損害自身利益。因此若對違約的借款人采取嚴格的違約懲罰措施,加大懲罰力度能夠從借款人角度降低信用風險生成的可能性。
四、結論
本文主要采用博弈理論與博弈仿真實驗相結合的方法,對P2P網(wǎng)貸信用風險產生的根源和產生節(jié)點進行分析。主要貢獻在于將P2P網(wǎng)貸信用風險的生成聚焦于網(wǎng)貸市場各個主體之間。理論上,由于各主體之間存在信息不對稱,因此從信息經(jīng)濟學角度,先對借款人、P2P平臺以及投資人三個主體之間的關系進行博弈分析,并建立博弈樹,發(fā)現(xiàn)P2P網(wǎng)貸各主體相互作用時信用風險產生的節(jié)點多數(shù)在于借款人和P2P平臺。
在仿真實驗中,基于“有限理性”的“最優(yōu)反應動態(tài)”機制,以信融財富平臺的相關指標數(shù)據(jù)作為樣本,對借款人和投資人的得益函數(shù)進行四次博弈仿真,檢驗發(fā)現(xiàn)該模型所反映的關系是符合現(xiàn)實邏輯的。再通過幾個變量做數(shù)值變化,進行多次仿真,證明當只考慮借款人、P2P平臺以及投資人時,信用風險大小與P2P平臺年化收益率設定成正比,而與借款人從此筆投資中得到的收益、借款人的違約懲罰以及借款人保持長期信用良好獲得的獎勵成反比。這也與理論分析中在不同主體間的信用風險生成影響因素相吻合。這些結論可為P2P網(wǎng)貸信用風險的控制提供參考。
主要參考文獻:
[1]盧馨,李慧敏..P2P網(wǎng)絡借貸的運行模式與風險管控[J]..改革,2015(2):60~68..
[2]俞林,康燦華,王龍..互聯(lián)網(wǎng)金融監(jiān)管博弈研究:以P2P網(wǎng)貸模式為例[J]..南開經(jīng)濟研究,2015(5):126~139..
[3]張發(fā),宣慧玉..重復囚徒困境博弈中社會合作的仿真[J]..系統(tǒng)工程理論方法應用,2004(2):112~ 115..
[4]曹寶瑞..我國P2P網(wǎng)貸資金存管制度影響因素研究——基于博弈理論視角[J]..技術經(jīng)濟與管理研究,2018(9):69~73..
[5]劉建美,馬壽峰..基于有限理性的個體出行路徑選擇進化博弈[J]..控制與決策,2009(10):1450~ 1454..
[6]李群,宣慧玉..基于Agent仿真技術在經(jīng)濟建模中的應用[J]..系統(tǒng)工程理論方法應用,2001(3):221~225..
作者單位:江蘇大學財經(jīng)學院,江蘇鎮(zhèn)江212013