李雨蔓 衛(wèi)恒軍
摘 要:隨著“互聯(lián)網(wǎng)+”的發(fā)展,人工智能不僅為傳統(tǒng)金融業(yè)帶來了機(jī)遇和挑戰(zhàn),同時也為商業(yè)銀行的信用貸款業(yè)務(wù)創(chuàng)造出新的機(jī)會。傳統(tǒng)商業(yè)銀行信貸審批流程中的人工決策存在非理性因素,在不同風(fēng)險場景下存在的貸款決策行為偏差無法消除,從而出現(xiàn)偏離客觀的決策。人工智能方法能夠有效避免信貸審批中的主觀性和盲目性從而提高決策效率。本文分析了人工智能算法在貸款審批中的應(yīng)用,根據(jù)算法分類對算法及其應(yīng)用進(jìn)行了闡述,并對智能信貸審批作出了總結(jié)和展望。
關(guān)鍵詞:信貸貸款;人工智能;神經(jīng)網(wǎng)絡(luò);支持向量機(jī);決策樹
本文索引:李雨蔓,衛(wèi)恒軍.<變量 1>[J].中國商論,2021(18):-132.
中圖分類號:F275.5 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-0298(2021)09(b)--03
1 引言
金融科技方興未艾,隨著人工智能和互聯(lián)網(wǎng)金融的迅速發(fā)展,傳統(tǒng)金融業(yè)的生存基礎(chǔ)受到了沖擊,商業(yè)銀行也在不斷通過探索和運(yùn)用人工智能等新技術(shù)進(jìn)行創(chuàng)新。商業(yè)銀行的貸款審批也可以通過多種人工智能方法獲得性能更優(yōu)、預(yù)測更準(zhǔn)確的模型。
信用評級與預(yù)測對商業(yè)銀行貸款決策有著顯著的影響。個人信貸業(yè)務(wù)擴(kuò)展的同時也為銀行帶來一定的風(fēng)險。
2 人工智能在銀行中的應(yīng)用
信貸服務(wù)是一種普遍的金融服務(wù),也是商業(yè)銀行的主要利潤來源。傳統(tǒng)信貸服務(wù)依賴于人工,對于中小企業(yè)和個人用戶貸款的審批流程復(fù)雜且周期長,使得小微企業(yè)和中產(chǎn)以下群體融資難成為世界難題。人工智能技術(shù)增強(qiáng)了商業(yè)銀行的風(fēng)控能力,對于龐大非銀行人群的海量特征數(shù)據(jù)進(jìn)行定量風(fēng)險分析,得到連續(xù)的風(fēng)險定價從而提供相應(yīng)的金融產(chǎn)品與服務(wù)。
國內(nèi)杭州銀行的“云抵貸”已經(jīng)率先使用智能化抵押房屋貸款,將審批時間縮短到最短3分鐘,放款時間24小時之內(nèi)。百度金融、螞蟻花唄和京東白條等互聯(lián)網(wǎng)金融企業(yè)紛紛開展信貸業(yè)務(wù),利用大數(shù)據(jù)和人工智能算法進(jìn)行信用評分。以京東白條為例,其信用評估根據(jù)用戶消費(fèi)歷史數(shù)據(jù)進(jìn)行風(fēng)險評估,不良率為0.48%,遠(yuǎn)低于商業(yè)銀行平均水平。
Florian K?nigstorfe分析了人工智能在商業(yè)銀行中的應(yīng)用,其中支持向量機(jī)、決策樹和神經(jīng)網(wǎng)絡(luò)方法在信貸審批中的應(yīng)用范圍較廣;Dorota Witkowska比較了在商業(yè)貸款審批中使用不同的人工智能算法進(jìn)行決策的準(zhǔn)確度。
國內(nèi)學(xué)者對人工智能在銀行信貸中的應(yīng)用也展開了大量的研究:吳沖等(2009)將模糊神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等多種人工智能方法運(yùn)用到信貸風(fēng)險評估中;王春鋒等(1999)對神經(jīng)網(wǎng)絡(luò)模型和Logistic判別分析等方法對商業(yè)銀行信用貸款風(fēng)險評估進(jìn)行分析。
人工智能在商業(yè)銀行貸款審批中的應(yīng)用如表1所示。
不難看出,人工智能算法在商業(yè)銀行貸款中的應(yīng)用主要集中在貸款預(yù)測和信用評分評級中,而應(yīng)用較廣的算法是神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和決策樹。
3 應(yīng)用于銀行信貸的人工智能算法
目前流行的人工智能算法主要屬于機(jī)器學(xué)習(xí)分類,根據(jù)功能可以將其分成分類、回歸和聚類三種類型。人工智能在信貸審批中的應(yīng)用主要通過大量數(shù)據(jù)訓(xùn)練做出智能決策,其相關(guān)研究主要為分類和回歸兩類。
分類算法預(yù)測標(biāo)簽,而回歸算法是預(yù)測數(shù)值。分類算法和回歸算法都屬于監(jiān)督學(xué)習(xí)的范疇。監(jiān)督學(xué)習(xí)訓(xùn)練過程為獲取數(shù)據(jù)→特征提取→監(jiān)督學(xué)習(xí)→評估;而預(yù)測過程則根據(jù)模型進(jìn)行預(yù)測。分類算法的目標(biāo)是從已有的數(shù)個可能的分類標(biāo)簽中預(yù)測一個樣本所屬的分類,其樣本數(shù)據(jù)是離散的。決策樹、支持向量機(jī)、線性回歸等回歸算法的目標(biāo)是預(yù)測一個連續(xù)的數(shù)(浮點(diǎn)型)。
3.1 分類
分類算法用于分類變量的建模及預(yù)測,通常適用于類別的預(yù)測。常見的分類算法有五種類型:
(1)邏輯回歸。邏輯回歸通過邏輯函數(shù)將預(yù)測映射到0~1的區(qū)間,從而判定屬于某一類別的概率。
(2)分類樹。分類樹通常特指決策樹中用作分類的CART算法,其特點(diǎn)是分支條件為二分類問題,即只能形成二叉樹。CART分類樹使用基尼系數(shù)處理離散特征,如果是連續(xù)特征則需要將特征進(jìn)行離散化。
(3)支持向量機(jī)。支持向量機(jī)是一種通用的前饋網(wǎng)絡(luò)類型,其主要思想是建立一個超平面作為決策曲面,使得分開的兩類數(shù)據(jù)點(diǎn)距離分類面最遠(yuǎn)( 圖1)。
支持向量機(jī)是從線性可分情況下的最優(yōu)分類超平面,所謂最優(yōu)超平面就是以最大間隔將兩類樣本正確分開的超平面。
(4)樸素貝葉斯。樸素貝葉斯分類以貝葉斯定理為基礎(chǔ),其核心思想是將給定的訓(xùn)練集假定為特征互相獨(dú)立求取聯(lián)合概率分布得到先驗(yàn)概率,再根據(jù)模型得到后驗(yàn)概率,從而計算出條件概率的方法。
(5)人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)是一類模式匹配的非參數(shù)方法, 常見于銀行信貸審批中的神經(jīng)網(wǎng)絡(luò)有BP神經(jīng)網(wǎng)絡(luò)、模糊神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò)(圖2)。
BP神經(jīng)的基本思想是將神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)輸入/輸出的映射問題轉(zhuǎn)變?yōu)榉蔷€性優(yōu)化問題,使用最優(yōu)化中的梯度下降算法,用迭代運(yùn)算修正網(wǎng)絡(luò)權(quán)值,實(shí)現(xiàn)網(wǎng)絡(luò)輸出與期望輸出間的均方誤差最小化。
模糊神經(jīng)網(wǎng)絡(luò)利用模糊集合,確定模糊隸屬度。常用的模糊推理方法包括M型推理方法和TS型推理方法。模糊神經(jīng)網(wǎng)絡(luò)的一般系統(tǒng)結(jié)構(gòu)包括五層,分別是輸入層、模糊化層、規(guī)則層、反模糊化層和輸出層。
徑向基神經(jīng)網(wǎng)絡(luò)是一種基于徑向基函數(shù)(RBF)的前向神經(jīng)網(wǎng)絡(luò),其神經(jīng)元模型為:
3.2 回歸
回歸算法主要用于連續(xù)型的數(shù)值變量的預(yù)測和建模。常見的回歸算法有三種類型。
(1)線性回歸。利用線性回歸方程的最小平方函數(shù)進(jìn)行建模,其回歸模型如下:
其中θ和c為未知參數(shù),根據(jù)訓(xùn)練集(xi,yi)計算參數(shù),使得h(xi)逼近yi,其誤差值的平方用損失函數(shù)表示:
此方法計算簡單,但對于非線性數(shù)據(jù)的擬合效果不好。
(2)決策樹。在決策樹算法中,數(shù)據(jù)的屬性通常采取樹狀結(jié)構(gòu)構(gòu)建決策模型以實(shí)現(xiàn)分類和回歸。決策樹的生長過程由特征選擇、決策樹的生成和剪枝三個部分組成。特征選擇的衡量標(biāo)準(zhǔn)通常是信息熵、增益率和基尼系數(shù)。
其中,信息熵表示為:
Ent(D)的值越小,則D的純度越高。
增益率表示為:
其中IV(a)為屬性a的固有值,屬性a的類目越多IV(a)越大。
基尼系數(shù)表示為:
基尼系數(shù)反映了屬性的不純度,基尼系數(shù)越小則數(shù)據(jù)集D的純度越高。
決策樹的生成通常是選取信息增益最大的自變量作為根節(jié)點(diǎn),將其他特征值依次選取為內(nèi)部節(jié)點(diǎn),將數(shù)據(jù)集重復(fù)分割成不同的分支。決策樹的集成方法包括隨機(jī)森林或梯度提升樹。
(3)K最鄰近算法。K最鄰近算法的指導(dǎo)思想是“近朱者赤,近墨者黑”,訓(xùn)練數(shù)據(jù)集在已知標(biāo)簽類別的前提下,輸入新數(shù)據(jù)后尋找與新數(shù)據(jù)最相近的k個實(shí)例,將這k個實(shí)例中大多數(shù)的類別確定為新數(shù)據(jù)的類別。即由k個最鄰近的數(shù)據(jù)投票確定新數(shù)據(jù)的類別。
4 針對銀行信貸不同應(yīng)用場景的算法研究
商業(yè)銀行的信貸審批環(huán)節(jié)中人工智能算法主要應(yīng)用于解決分類和回歸兩類問題,具體的分類問題體現(xiàn)在財務(wù)欺詐、信用卡履約、信用評級等方面,回歸問題體現(xiàn)在信用評分、貸款預(yù)測、破產(chǎn)時間預(yù)測、企業(yè)貸款、違約時間預(yù)測等方面。在實(shí)際的信貸審批應(yīng)用中將針對不同的應(yīng)用場景采用不同的算法。
4.1 信用評分和信用評級
信用評分和信用評級是銀行信貸審批中最重要的一個環(huán)節(jié),其最終目的是將貸款人分類為良好貸款人和不良貸款人。
Henley和Hand的研究表明,如果將信用評分的準(zhǔn)確率提高1%,公司將節(jié)約大量的成本。目前信貸審批的相關(guān)技術(shù)大多集中于信用評分的研究,目前已經(jīng)出現(xiàn)了各種各樣的分類技術(shù),例如線性判別分析、邏輯回歸等回歸算法,以及K臨近和決策樹等分類算法。
(1)邏輯回歸。用于信用評級的邏輯回歸主要解決的是二進(jìn)制的響應(yīng)模型,如果客戶是不良貸款人則y=0,如果客戶是優(yōu)質(zhì)貸款人則y=1,假設(shè)x是M個解釋變量的列向量,則邏輯回歸模型采用以下形式:
其中α是截距參數(shù)和βT包含變量系數(shù)。
(2)判別分析。判別分析利用個人消費(fèi)信貸的原始數(shù)據(jù)對個人財務(wù)信用和自然特征等各個方面進(jìn)行分析并賦值,尋找出符合預(yù)測的最佳線性組合。
4.2 企業(yè)破產(chǎn)預(yù)測
人工智能增加了用于信用風(fēng)險評估的數(shù)據(jù)類型和種類。在貸款違約分析方面,人工智能方法可以結(jié)合非傳統(tǒng)數(shù)據(jù)(例如水電費(fèi)、電信數(shù)據(jù)和社交媒體數(shù)據(jù))對貸款人的違約行為進(jìn)行預(yù)測。
(1)神經(jīng)網(wǎng)絡(luò)。企業(yè)破產(chǎn)預(yù)測分析時,首先選取對企業(yè)存亡起關(guān)鍵作用的一些財務(wù)參數(shù),例如營運(yùn)資本、保留收益、利稅前收益、市場價值權(quán)益等。而后在輸入層分別輸入企業(yè)的速動比率和資產(chǎn)利潤率,輸出層為判別值Z,根據(jù)訓(xùn)練集的數(shù)據(jù)計算出判別值的分界值Zc,并以此為分界判定企業(yè)生存或破產(chǎn)。
周毓萍改進(jìn)了BP神經(jīng)網(wǎng)絡(luò)并建立了用于企業(yè)破產(chǎn)預(yù)測的神經(jīng)網(wǎng)絡(luò)模型,能夠有效對企業(yè)破產(chǎn)進(jìn)行預(yù)測。
(2)支持向量機(jī)。使用支持向量機(jī)預(yù)測企業(yè)破產(chǎn)時需要選擇相同數(shù)量的破產(chǎn)和非破產(chǎn)案例,將全部數(shù)據(jù)的80%用于構(gòu)建訓(xùn)練集,對其中的財務(wù)指標(biāo)進(jìn)行分析提純,選擇顯著的變量。通常選擇利潤率、舉債經(jīng)營率、償債能力比率、資產(chǎn)管理比率等變量進(jìn)行分析,然后選擇合適的核函數(shù)和懲罰參數(shù)建立模型。
5 結(jié)語
利用人工智能方法進(jìn)行信貸審批等金融科技手段已成為時代賦予商業(yè)銀行開展信貸實(shí)踐的重要使命。人工智能方法增加了信用風(fēng)險評估數(shù)據(jù)的種類和數(shù)據(jù)量,解決了非財務(wù)信息搜索整合困難的問題,避免人為主觀因素對貸款審批決策的影響。人工智能技術(shù)在商業(yè)銀行中的普及,可以實(shí)現(xiàn)大批量的信貸服務(wù)拓展,從而落實(shí)普惠金融。
從全球范圍來看,中國是人工智能領(lǐng)域的領(lǐng)先國家之一,中國傳統(tǒng)央行征信系統(tǒng)中,征信的真實(shí)覆蓋率只有35%。而經(jīng)過2015年中國大數(shù)據(jù)征信的爆發(fā),基于人工智能的授信模型不斷發(fā)展并形成規(guī)模。
要實(shí)現(xiàn)充分實(shí)現(xiàn)信貸智能審批,需要商業(yè)銀行與科技企業(yè)的深度合作。龐大的數(shù)據(jù)量和海量用戶群體將為商業(yè)銀行的信貸智能審批提供得天獨(dú)厚的優(yōu)勢,強(qiáng)大的金融內(nèi)需將加速智能信貸審批乃至智能金融的發(fā)展。
參考文獻(xiàn)
吳沖,郭英見,夏晗.基于模糊積分支持向量機(jī)集成的商業(yè)銀行信用風(fēng)險評估模型研究[J].運(yùn)籌與管理,2009,18(2):115-119.
王春峰,萬海暉,張維.基于神經(jīng)網(wǎng)絡(luò)技術(shù)的商業(yè)銀行信用風(fēng)險評估[J].系統(tǒng)工程理論與實(shí)踐,1999,19(9):24-32.
張成虎,李育林,吳鳴.基于判別分析的人信用評分模型研究與實(shí)證分析[J].大連理工大學(xué)學(xué)報(社會科學(xué)版),2009,30(1):6-10.
龐素琳,黎榮舟,徐建閩.BP算法在信用風(fēng)險分析中的應(yīng)用[J].控制理論與應(yīng)用,2005,22(1):139–143.
毛義華,劉悅.基于RBF神經(jīng)網(wǎng)絡(luò)的商業(yè)銀行客戶信用評級[J].統(tǒng)計與決策,2010(2):151-153.
Literature Review on the Application of Artificial Intelligence Algorithms in
Bank Credit Loan Business
University of Chinese Academy of Sciences? LI Yuman
China Construction Bank Beijing Branch? WEI Hengjun
Abstract: With the development of "Internet +", artificial intelligence not only brings opportunities and challenges to the traditional financial industry, but also creates new opportunities for the credit loan business of commercial banks. There are irrational factors in the manual decision-making in the credit approval process of traditional commercial banks, and the deviation of loan decision-making behavior in different risk scenarios cannot be eliminated, resulting in deviating from objective decision-making. Artificial intelligence methods can effectively avoid subjectivity and blindness in credit approval and improve decision-making efficiency. This article analyzes the application of artificial intelligence algorithms in loan approval, expounds the algorithms and their applications according to the classification of algorithms, and summarizes and prospects for intelligent credit approval.
Keywords: credit loan; artificial intelligence; neural network; support vector machine; decision tree