■術 業(yè)
在銀行業(yè)務規(guī)??焖僭鲩L背景下,銀行內(nèi)部審計風險導向模式顯得尤為重要,隨著信息技術的迅猛發(fā)展,大數(shù)據(jù)審計應時而生。在銀行授信業(yè)務方面,客戶的信用風險與銀行內(nèi)部的操作風險存在密切的依存關系,信用風險異常高的業(yè)務領域,往往存在極大的操作風險。
在銀行小微客戶群體中,貸款金額100萬元以內(nèi),特別是50萬元左右的貸款,對該類業(yè)務做授信審計時,往往需面對客戶量大、信息少的困境,特別是首次申請貸款的小微客戶,審計抽樣往往需要借助模型實現(xiàn)?,F(xiàn)有文獻對授信客戶風險識別建模一般采用多元線性回歸模型、logistic回歸模型或神經(jīng)網(wǎng)絡模型等,其中l(wèi)ogistic模型在二分類變量數(shù)據(jù)分析中運用較為普遍。但在模型指標選擇方面,基本圍繞財務指標為主,該指標在小微客戶領域基本不適用,其財務數(shù)據(jù)可靠性低,且個體工商戶也基本沒有財務報表。在實務操作中,針對微小客戶的風險評估,更注重其他渠道的信息獲取。如泰隆銀行提出的“貸前三查詢”,包括征信、分戶賬、黑名單查詢,及“三品三表”中的人品信息等。
2013年3月15日,國務院《征信業(yè)管理條例》的出臺,將征信業(yè)推向了歷史舞臺,將征信推向了法制化、規(guī)范化的發(fā)展道路。如今,我國正在部署加快建設社會信用體系,構筑誠實守信的經(jīng)濟社會環(huán)境,征信信息將會越來越受到各方的重視。本文旨在通過挖掘個人征信數(shù)據(jù)中的信息,構建一個小微客戶的風險識別模型,通過模型的批量測算,分析、判斷被審計單位的風險所在及風險程度,把審計資源集中于高風險的審計領域,提高審計效率,保證審計質(zhì)量。
本文實證分析共分三部分:(1)選擇樣本客戶,包含風險客戶和正??蛻魞纱箢?,樣本客戶數(shù)據(jù)均來自泰隆銀行,該銀行的小微客戶具有一定的代表性。(2)初步構建度量指標,然后通過相關性分析和均值比較分析,篩選出顯著性指標。(3)逾期風險的識別和度量,主要為兩分類logistic回歸分析。
在小微客戶貸款調(diào)查時,往往首貸客戶的征信信息顯得更為重要。本次樣本選擇范圍為2013年至2014年首次貸款的個人經(jīng)營類客戶,共隨機抽取660名。樣本客戶分為兩類:第一類為正常客戶,首筆貸款發(fā)放后未出現(xiàn)逾期,該類客戶共360名;第二類客戶為首貸后出現(xiàn)逾期,且逾期天數(shù)超過30天的客戶,該類客戶做為風險客戶,共300名。
1.評價指標選取。
指標的構建主要圍繞征信基本數(shù)據(jù),分五大維度:個人基本信息、貸款信息、信用卡信息、對外擔保信息、被查詢次數(shù)信息。初步共構建19個指標,鑒于單個指標對風險的解釋能力較弱,且指標不一定能服從正態(tài)分布,因此通過相關分析和均值比較分析兩個維度來作為指標篩選的依據(jù)。
兩類客戶通過二維變量(0,1)來表示,0表示正??蛻簦?為風險客戶,且將該變量作為被解釋變量(分組變量),其他指標作為解釋變量。
2.指標分析。
(1)個人信息比較結果。
客戶婚姻狀況差異顯著,性別、年齡和征信查詢總次數(shù)差異較小。風險客戶中婚姻異常情況占比為正??蛻舻膬杀?,占比21%,兩類客戶平均年齡39歲,男性為主,征信平均查詢13次,風險客戶查詢次數(shù)略高。
指標 標示 均值 L.Sig 顯著性EV/N 相關系數(shù) 備注正常 0.11 0.00 0.00 HY 0.14 婚姻狀況0已婚,1(離異、未婚、喪偶)風險 0.21 0.00正常 39.52 0.01 0.65 NL-0.018 客戶年紀風險 39.22 0.66正常 0.817 0.66 0.82 XB 0.009 性別0女性,1男性風險 0.823 0.82正常 12.87 0.02 0.34 CZ 0.037 征信查詢總次數(shù)風險 13.74 0.35
※L.Sig為方差齊次性指標,后面兩個顯著性指標分別為方差齊次和非齊次假設對應的結果。
(2)貸款信息比較結果。
首次貸款出現(xiàn)逾期的客戶,申請金額戶均為32.36萬元,較正??蛻舻?。他行貸款信息差異主要體現(xiàn)在與銀行建立信貸年限、歷次經(jīng)營貸款筆數(shù)及征信貸款查詢銀行家數(shù)情況,未結清貸款信息差異較小。
指標 標示 均值 L.Sig 顯著性EV/N 相關系數(shù) 備注正常 46.36 0.00 0.00 DKJ-0.12 本次申請貸款金額風險 32.36 0.00正常 1.71 0.23 0.61 DD-0.02 他行未結清經(jīng)營貸款比申請貸款金額風險 1.61 0.62正常 1.10 0.08 0.00-0.111 未結清經(jīng)營貸款合作銀行家數(shù)風險 0.88 0.00正常 2.31 0.00 0.00 CD征信貸款查詢銀行家數(shù)DJ 0.202風險 3.26 0.00正常 0.67 0.00 0.00 CDC 0.216 歷次貸款查詢次數(shù)比歷次貸款次數(shù)風險 1.55 0.00正常 9.22 0.00 0.00 LJB-0.254 歷次經(jīng)營(非消費)貸款筆數(shù)風險 4.72 0.00正常 5.77 0.07 0.00 HZ-0.232 與銀行建立信貸合作時長(年)風險 4.10 0.00
正常客戶平均歷次經(jīng)營貸款筆數(shù)為9.22筆,風險客戶平均僅4.72筆;正??蛻襞c銀行建立合作平均年限為5.77年,風險客戶平均為4.10年。兩類客戶他行未結清貸款額度情況差異較小,他行未結清經(jīng)營貸款平均為申請貸款額度的1.7倍,正常類客戶平均經(jīng)營貸款合作銀行1.1家,風險客戶平均0.88家。
(3)對外擔保信息比較結果。
兩類客戶對外擔保規(guī)模均不大,但差異較為明顯,正??蛻魧ν鈸]^風險客戶多。該情況與常理推斷有所不同,但從樣本客戶的貸款申請金額可解釋該現(xiàn)象。本次樣本客戶貸款額度均較小,屬于小微客戶群,該群體較難從銀行獲取貸款,較少形成復雜的資金關系及大的擔保圈情況,且從數(shù)據(jù)來看,客戶擔保規(guī)模整體不大,因此客戶的對外擔??梢宰鳛樽糇C客戶實力的一種信息,且風險客戶通過隱藏風險而獲取擔保資格的動機比獲取貸款小,擔保信息真實性更高。
指標 標示 均值 L.Sig 顯著性EV/N 相關系數(shù) 備注正常 1.86 0.06 0.00 DBJ -0.123 他行擔保金額比我行貸款金額風險 1.06 0.00正常 1.29 0.00 0.00 DBS -0.354 當前對外擔保銀行家數(shù)風險 0.47 0.00正常 2.04 0.00 0.00 CDB -0.315 征信擔保資格查詢銀行家數(shù)風險 0.92 0.00
(4)信用卡信息比較結果。
兩類客戶信用卡持卡張數(shù)相差不大,正??蛻舫挚远啵渌笜司町惷黠@。主要表現(xiàn)為正??蛻艨~度高,但透支率低;信用卡多,但征信信用卡申請查詢銀行家數(shù)少。信用卡信息差異情況與前述擔保分析類似,可以作為客戶實力的佐證。大客戶持有大額貸記卡較為常見,小微客戶大額持卡情況相對較少,特別是風險類小微客戶,獲取大額貸記卡的難度更大。從透支情況來看,風險客戶最近一期透支率高于近6個月平均透支率,可以反映其資金趨于緊張。
指標 標示 均值 L.Sig 顯著性EV/N 相關系數(shù) 備注正常 3.84 0.07 0.17 KZ-0.054 額度1000元以上正常貸記卡張數(shù)貸記卡統(tǒng)計均以該標準風險 3.51 0.17正常 0.26 0.01 0.00 KJ-0.192 單家銀行貸記卡授信比我行貸款金額風險 0.17 0.00正常 2.45 0.00 0.00 CK 0.221 征信信用卡申請總查詢銀行家數(shù)風險 3.84 0.00正常 0.39 0.00 0.01 KTJ 0.104風險 0.47 0.01貸記卡近6個月透支比率正常 0.39 0.00 0.00 KT 0.15 當前貸記卡透支比率風險 0.50 0.00
logistic回歸分析是用于研究變量為二分類或者多分類觀察結果與影響因素之間關系的一種多變量分析方法。logistic回歸分析最早應用于流行病學的研究中,因為這類研究中常常需要分析疾病與各種危險因素之間的定量關系,而疾病往往是二分類變量。隨著logistic回歸分析在流行病學研究中慢慢成熟,其也開始應用于其他方面的二分類目標變量與有關因素的關系的研究中。
借助前面的指標均值比較分析及相關性分析,將前述指標進行逐個帶入模型分析,同時剔除顯著性較差的指標,經(jīng)過試錯測算,確定最終的回歸方程如下:
Observed Percendage Correct 0 1 Predicted Y Step1 Y 0 1 Overall Percentage 287 82 73 218 79.7 72.7 76.5
a.The cutvalue is.500
Variables in the Equation
95.0%C.I.for EXP(B)B S.E. Wald df Sig. Exp(B)Lower Upper Step1 .263 5.720 1 .017 1.877 1.120 3.146 HY DBS CD CDB LJB KZ.630-.397.563-.389-0.67-1.00.127 9.784 1 .002 .673 .525 .862.065 75.087 1 .000 1.756 1.546 1.995.092 18.060 1 .000 .678 .567 .811.017 15.680 1 .000 .935 .904 .967.040 6.325 1 .012 .905 .838 .978
KJ KT LNDKJ Constant-2.484.666-.412 1.425.540 21.173 1 .000 .083 .029 .240.290 5.262 1 .022 1.946 1.102 3.438.127 10.480 1 .001 .662 .516 .850.444 10.300 1 .001 4.159
a.Varialbe(s)entered on step 1:HY、DBS、CD、CDB、LJB、KZ、KJ、KT、LINDKY.
從測算結果來看,模型總體預測準確率達76.5%,逾期客戶辨別率為72.7%,全部指標均顯著相關,且各指標回歸系數(shù)與相關分析結果吻合。
鑒于各指標數(shù)據(jù)之間均值和方差存在差異,無法直接通過模型回歸系數(shù)來比較各指標的影響程度。通過對指標進行標準化處理,以消除各指標之間數(shù)量級差異,通過再次測算得出如下回歸結果:
從模型回歸系數(shù)來看,與風險正相關的因素中,征信貸款查詢銀行家數(shù)影響較大,婚姻狀況和貸記卡透支率影響相對較?。慌c風險負相關的因素中,征信擔保資格查詢銀行家數(shù)影響最大,歷次經(jīng)營貸款筆數(shù)和單家銀行貸記卡額度比申請貸款金額影響其次,貸款申請金額和當前對外擔保銀行家數(shù)影響相對較小。
小微客戶授信業(yè)務非現(xiàn)場審計階段,針對數(shù)量眾多的小額首貸客戶,其資料信息少,信息可靠性不高,因此可重點關注其征信信息。本文通過對首貸客戶的征信數(shù)據(jù)建模分析,模型總體準確度為76.5%。分析的過程中,對小微客戶首貸的風險做以下幾點識別:
1.首次申請貸款后即出現(xiàn)風險逾期的客戶,申請貸款金額往往較小,戶均為32.36萬元,且非已婚的客戶出現(xiàn)風險概率更大。
2.小微客戶適度的對外擔保和持有較大額度的貸記卡可作為其個人實力的一個佐證信息,但對外擔保整體規(guī)模不宜過大,控制在貸款申請額度的2倍以內(nèi),貸記卡透支率不宜過高,當前透支率超過50%,且當前透支率高于近6個月透支水平的客戶須關注其風險。
3.小微客戶經(jīng)營貸款合作銀行一般為1家,其歷史經(jīng)營貸款次數(shù)多,往往信用更穩(wěn)定,但征信因貸款被查詢的銀行家數(shù)不宜過多,查詢銀行3家以上需關注風險,即小微客戶合作銀行家數(shù)不宜過多,或警惕出現(xiàn)被查詢未放貸的情況。
········ 參 考 文 獻 ·····················
[1]董汝杰.基于logit模型的微型企業(yè)信用評價研究[J].區(qū)域金融,2011,(8).
[2]朱建平.應用多元統(tǒng)計分析[M].北京:北京科學出版社,2006.