閆炯智
隨著社交軟件、智能手機和網(wǎng)絡的普及,數(shù)據(jù)呈現(xiàn)爆炸式增長,人們正在步入“大數(shù)據(jù)”時代,這種顛覆性的技術變革對社會、商業(yè)和個人都將產(chǎn)生巨大而深遠的影響。在此背景下,本文闡述了大數(shù)據(jù)的內(nèi)涵及其發(fā)展,介紹了目前在商業(yè)銀行的應用現(xiàn)狀及難點,并提出了大數(shù)據(jù)在商業(yè)銀行風險管理領域深入應用的策略建議。
目前,業(yè)界對“大數(shù)據(jù)”并沒有統(tǒng)一的定義。研究機構Gartner認為,“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)有“4V”的特性,包括“Volume ”“Variety”“Value”“Velocity”。“Volume”是指海量的數(shù)據(jù),并隨著科技的飛速發(fā)展,數(shù)據(jù)量將急劇增長。根據(jù)國際數(shù)據(jù)公司IDC的研究預測,到2020年, 全球范圍內(nèi)將產(chǎn)生的數(shù)據(jù)容量為35ZB,是2011年數(shù)據(jù)容量的近20倍;到2025年,全世界將創(chuàng)建和復制163ZB的數(shù)據(jù),是2016 年所創(chuàng)建數(shù)據(jù)量的十倍。“Variety”是指數(shù)據(jù)的類型豐富多樣,相較于以往文本形式為主的結(jié)構化數(shù)據(jù),大數(shù)據(jù)時代包含了視頻、音頻、圖片、地理位置、網(wǎng)絡日志等眾多類型的非結(jié)構化和半結(jié)構化數(shù)據(jù)。“Value”是指數(shù)據(jù)的價值密度與數(shù)據(jù)總量負相關?!癡elocity”是指快速的數(shù)據(jù)處理速度,海量的數(shù)據(jù)量需要高效率的數(shù)據(jù)處理速度,同時,短時間內(nèi)完成的數(shù)據(jù)處理結(jié)果有助于應用策略的快速制訂及調(diào)整。
在網(wǎng)貸領域, 英國貸款網(wǎng)絡平臺W o n g a首創(chuàng)大數(shù)據(jù)風控。該公司成立于2006年,從事發(fā)薪日貸款(Pa y d a y Loan),可以全天24小時辦理業(yè)務,向用戶提供金額從50英鎊到750英鎊不等的小額在線借款業(yè)務。其獨特的大數(shù)據(jù)自動風控系統(tǒng)克服了傳統(tǒng)征信系統(tǒng)的片面、不注重成長性和效率低下等難點,將征信數(shù)據(jù)節(jié)點提升到8000個,能夠根據(jù)用戶填寫的信息自動進行風險評估,并在20分鐘內(nèi)給出貸款報價,堪稱大數(shù)據(jù)風控的鼻祖。
在征信領域, 美國金融科技公司ZestFinance具有代表性。該公司成立于2009年,在其模型中,往往要用到3500多個數(shù)據(jù)項,從中提取70000多個變量,在傳統(tǒng)信用分數(shù)不到1000個數(shù)據(jù)變量的基礎上發(fā)生了質(zhì)變。該公司引領大數(shù)據(jù)計算和征信技術的前沿,顛覆了延續(xù)半個世紀的傳統(tǒng)征信模式。
在國內(nèi)銀行業(yè),工商銀行、興業(yè)銀行、寧波銀行等在大數(shù)據(jù)風控中取得了長足進展。
工商銀行通過打造大數(shù)據(jù)服務云,支持大數(shù)據(jù)發(fā)展數(shù)據(jù)多樣化、服務能力實時化、算法引擎智能化、基礎平臺云化的趨勢,在信用風險領域成立信用風險監(jiān)控中心,以大數(shù)據(jù)分析技術為手段,集信用風險的分析、監(jiān)測、預警、管控于一體,確立了分析建模、實時監(jiān)測、風險預警、核查管控、跟蹤督辦、反饋優(yōu)化及考核評價的信用風險監(jiān)控工作流程,實時開展融資客戶、融資產(chǎn)品、信貸機構及信貸人員風險的監(jiān)測預警及跟蹤管控。
興業(yè)銀行在風險管理方面大力推動數(shù)據(jù)應用和數(shù)據(jù)挖掘分析的力度,迭代開發(fā)風控搜、核貸寶、黃金眼等創(chuàng)新型大數(shù)據(jù)產(chǎn)品。“風控搜”產(chǎn)品整合了互聯(lián)網(wǎng)風險類信息,供貸前調(diào)查、貸中審批、貸后監(jiān)控等各環(huán)節(jié)的人員使用,旨在成為一款“采集風險—提示風險—撲滅風險”的風控產(chǎn)品?!昂速J寶”通過Python技術自動抓取各重要網(wǎng)站信息,提供一站式查詢服務,可一鍵查多網(wǎng),并智能生成征信報告,促進貸款審核流程的革新;同時,該產(chǎn)品通過對外部數(shù)據(jù)實現(xiàn)電子化存儲,信貸人員在貸款審查審批、放款復核及貸后管理環(huán)節(jié)只需一次性查詢?!包S金眼”以隨機森林算法為核心,利用大數(shù)據(jù)信息技術,結(jié)合網(wǎng)絡爬蟲和搜索引擎,模擬人工查詢和評價數(shù)據(jù)的過程,構建100余條預警規(guī)則和評分模型,利用圖關聯(lián)技術可視化展現(xiàn)客戶的股東、擔保、交易等關聯(lián)關系。
寧波銀行通過整合行內(nèi)各業(yè)務數(shù)據(jù), 引入互聯(lián)網(wǎng)數(shù)據(jù)以及專網(wǎng)數(shù)據(jù),建立了內(nèi)容覆蓋面更廣、風險信息來源更多、預警針對性更強的大數(shù)據(jù)風控平臺。該平臺通過風控模型探測潛在風險信號,在貸前、貸中和貸后三個環(huán)節(jié),向前臺業(yè)務人員及各級審查審批人員提示風險,通過建設企業(yè)級客戶標簽畫像系統(tǒng),全面了解客戶渠道使用、產(chǎn)品購買等信息,為風險控制提供決策支撐。
商業(yè)銀行具備實施大數(shù)據(jù)的基礎,雖然我國很多商業(yè)銀行都建設了數(shù)據(jù)中心, 但離大數(shù)據(jù)的應用要求還有一定距離,應用難點主要表現(xiàn)在以下方面。
人才短缺難點。在商業(yè)銀行應用和推廣大數(shù)據(jù)技術,需要既掌握大數(shù)據(jù)技術和IT技術,又懂業(yè)務邏輯和業(yè)務操作流程, 同時也熟悉銀行內(nèi)控合規(guī)要求等的綜合性人才。然而,現(xiàn)實的人才情況限制著商業(yè)銀行大數(shù)據(jù)技術的發(fā)展。一方面,在大數(shù)據(jù)技術應用和推廣領域中的人才儲備普遍比較短缺;另一方面,隨著互聯(lián)網(wǎng)金融的火熱,商業(yè)銀行的部分金融科技人才逐漸流失,從而限制了銀行大數(shù)據(jù)技術的創(chuàng)新應用。
數(shù)據(jù)整合難點。商業(yè)銀行擁有豐富的、標準化程度較高的客戶數(shù)據(jù),但這些數(shù)據(jù)寶藏往往分布在內(nèi)部各條線、各職能部門、各分支機構之間,而且各信息系統(tǒng)是在不同時期建設的,開發(fā)者也各不相同; 同時,各系統(tǒng)之間的管理要求不同,標準不統(tǒng)一,共享基礎差,業(yè)務信息也不一致。由于難以互聯(lián)互通,缺乏共享機制,形成一座座“信息孤島”,導致在應用數(shù)據(jù)時難以有效整合,許多行內(nèi)數(shù)據(jù)仍然在數(shù)據(jù)庫中“沉默”,未發(fā)揮應有的作用。
合規(guī)或?qū)徤麟y點。大量的數(shù)據(jù)涉及客戶隱私,而且有時候難以確定界限。銀行作為受嚴格監(jiān)管的金融機構,為了符合合規(guī)要求,或者出于保護客戶隱私如手機號、家庭住址、身份證號等敏感信息的需要,抑或?qū)Υ髷?shù)據(jù)技術應用審慎的態(tài)度等原因,對所擁有的海量數(shù)據(jù)開發(fā)程度有限,使得寶貴的數(shù)據(jù)難以發(fā)揮效用。
開發(fā)和應用協(xié)調(diào)難點。由于銀行內(nèi)部各條線、各部門間的合作機制不完善, 又缺乏復合型人才,導致風險部門與開發(fā)部門、風險部門與業(yè)務部門的溝通協(xié)調(diào)成本較高,協(xié)調(diào)數(shù)據(jù)產(chǎn)品的開發(fā)實施周期較長,產(chǎn)品創(chuàng)新及應用推廣與業(yè)務的實際需求難以有效匹配,從而使得創(chuàng)新、開發(fā)、應用難以有效統(tǒng)一。
傳統(tǒng)系統(tǒng)架構適應難點。隨著互聯(lián)網(wǎng)金融、穿戴傳感設備、物聯(lián)網(wǎng)的快速發(fā)展,這些新形態(tài)下產(chǎn)生的數(shù)據(jù)、客戶交易行為記錄,以及包括銀行在內(nèi)所記錄的影像、圖片、音頻等半結(jié)構或非結(jié)構化數(shù)據(jù),都是非常有價值的數(shù)據(jù)信息,都將和結(jié)構化數(shù)據(jù)一并納入數(shù)據(jù)管理和分析范圍。目前,銀行傳統(tǒng)的系統(tǒng)對這類數(shù)據(jù)的處理能力普遍較弱,由于銀行的業(yè)務鏈條較長、各信息系統(tǒng)較為復雜等原因,傳統(tǒng)系統(tǒng)架構距大數(shù)據(jù)技術的應用與推廣還有較大差距。
數(shù)據(jù)挖掘分析難點。由于搜集的數(shù)據(jù)信息可能不完整,無法積累客戶在平時生活中展現(xiàn)的生活習慣、消費傾向等行為數(shù)據(jù),難以與行內(nèi)業(yè)務數(shù)據(jù)結(jié)合以刻畫客戶的消費習慣、風險偏好等。在未進行有效整合的情況下,銀行風控人員很難準確識別客戶的整體風險。特別是對于跨行業(yè)、跨區(qū)域、跨市場的擔??蛻艋蚣瘓F客戶, 客戶或其實際控制人往往存在多處注冊、多頭融資的情況,具有交易復雜、業(yè)務經(jīng)營和資金流動等特征,傳統(tǒng)數(shù)據(jù)分析難以清晰了解客戶的生產(chǎn)經(jīng)營、關聯(lián)關系的全部真實情況,無法發(fā)現(xiàn)虛假信息、交叉違約、關聯(lián)風險等多層復雜風險。
銀行歷經(jīng)了半個多世紀的建模和數(shù)據(jù)分析探索,以信用評級或評分模型為代表,積累了豐富的理論和實踐經(jīng)驗,銀行擁有群體數(shù)量龐大的客戶,擁有海量的客戶數(shù)據(jù)和交易數(shù)據(jù),是一座有待深挖的寶礦。大數(shù)據(jù)的應用為商業(yè)銀行風控帶來了海量的數(shù)據(jù)、更加豐富的風控工具和更加高效的處理能力,具有遠見和雄心的商業(yè)銀行應當早做布局,引領金融科技的發(fā)展。可以從以下方面深化大數(shù)據(jù)的應用。
加強復合型人才的培養(yǎng)。大數(shù)據(jù)思維對銀行風險管理水平的提升無疑具有十分重要的意義,但應該認識到大數(shù)據(jù)不是萬能的,不能代替風險管理專家的作用。因為數(shù)據(jù)信息和模型本身具有局限性,能否最大程度地發(fā)揮數(shù)據(jù)的效用取決于用數(shù)據(jù)的人,因此需要大量培養(yǎng)既懂業(yè)務又懂數(shù)據(jù)和模型的專家,打造一支既對風險有定性分析判斷、潛在風險排查、動態(tài)風險監(jiān)測能力,又掌握數(shù)據(jù)整合挖掘能力、定量風險分析技術、具有風險模型開發(fā)和監(jiān)控能力的復合型風險管理人才隊伍。
建立集中式的風險監(jiān)測預警中心?;诖髷?shù)據(jù)及其挖掘技術,對分散在銀行內(nèi)部各業(yè)務條線、各職能部門、各分支機構、各子系統(tǒng)中的數(shù)據(jù)進行集中,與外部大數(shù)據(jù)進行整合后,實現(xiàn)商業(yè)銀行的事前預警、事中控制、事后監(jiān)測,并通過海量數(shù)據(jù)的核查和判定,及時挖掘、監(jiān)測、預警、管控可能出現(xiàn)的風險點,構建覆蓋“全流程、全客戶、全業(yè)務、全產(chǎn)品、全資產(chǎn)”的全面持續(xù)的集中式非現(xiàn)場監(jiān)測預警體系。力求從數(shù)據(jù)中尋找業(yè)務發(fā)展和決策的依據(jù),提高全流程預警能力和風險管理的信息化、自動化水平。當發(fā)現(xiàn)客戶出現(xiàn)結(jié)算、存款或交易等大幅變動或下降等異常情況時,則通過系統(tǒng)向各條線發(fā)出風險提示或預警,貸前調(diào)查人員應核實相關信息,貸中審查審批人員應據(jù)此作出審查審批意見和決策,貸后管理人員應及時開展現(xiàn)場核查,就風險情況督促客戶改進,或采取壓縮授信額度、提前收回貸款、資產(chǎn)保全等防范措施。同時,進一步完善基于大數(shù)據(jù)信息的集中式風險輔助審查審批體制,補充或校正授信申報機構對客戶風險信息的收集和判斷。運用合理的參數(shù)和模型,結(jié)合大數(shù)據(jù)信息,做出更全面、專業(yè)的分析和判斷,使風險識別、計量、決策、防范更加準確及時。
強化與業(yè)務的聯(lián)動。一方面,開展“請進來”,請業(yè)務部門負責人、一線業(yè)務骨干到風控部門和大數(shù)據(jù)應用項目組, 親身體驗大數(shù)據(jù)智能風控服務,并根據(jù)業(yè)務需要提出相關需求和改進建議,以更契合業(yè)務發(fā)展的需要,更好地提升客戶體驗。另一方面,通過“走出去”,派出懂產(chǎn)品、善介紹的骨干人員,深入到業(yè)務條線和分支機構,開展大數(shù)據(jù)產(chǎn)品宣講、培訓,并搜集業(yè)務方面的反饋意見,完善產(chǎn)品功能及服務,推動大數(shù)據(jù)風控產(chǎn)品的應用,激發(fā)產(chǎn)品創(chuàng)新動力。
深化數(shù)據(jù)挖掘分析。銀行內(nèi)部數(shù)據(jù)具有標準化、價值高的特性,是一座有待持續(xù)深入挖掘的寶藏,隨著銀行擁抱大數(shù)據(jù)進程的加快,內(nèi)外部數(shù)據(jù)的整合將產(chǎn)生更大的潛在價值。銀行應充分利用大數(shù)據(jù)技術對海量數(shù)據(jù)深入挖掘和分析:一是結(jié)合企業(yè)的靜態(tài)和動態(tài)的數(shù)據(jù),既要看企業(yè)資產(chǎn)負債表的靜態(tài)數(shù)據(jù)情況,還要考察企業(yè)交易結(jié)算數(shù)據(jù)等動態(tài)數(shù)據(jù);二是結(jié)合宏觀、中觀和微觀的數(shù)據(jù),綜合考慮宏觀經(jīng)濟、中觀行業(yè)、微觀企業(yè)的情況;三是結(jié)合結(jié)構化和非結(jié)構化的數(shù)據(jù),其中結(jié)構化數(shù)據(jù)包括貸款、存款、交易流水等,非結(jié)構化數(shù)據(jù)包括企業(yè)管理層情況、產(chǎn)品信息、抵質(zhì)押品情況等;四是結(jié)合行內(nèi)數(shù)據(jù)和行外數(shù)據(jù),行內(nèi)數(shù)據(jù)包括信貸數(shù)據(jù)、交易結(jié)算、抵質(zhì)押數(shù)據(jù)等,行外數(shù)據(jù)包括工商稅務、司法環(huán)保、征信海關等方面的數(shù)據(jù)。通過以上幾種結(jié)合,動態(tài)地分析貸前調(diào)查、審查審批、貸后管理、資產(chǎn)保全等全流程的客戶及關聯(lián)關系風險,更好地了解客戶及其行為特征,優(yōu)化風控技術和流程,提高風險評估模型的精準度,進一步提升風險管理的精細化水平。
建立大數(shù)據(jù)信用評分。通過大數(shù)據(jù)信用評分可以緩解傳統(tǒng)征信體系中無征信記錄的企業(yè)、個人,或財務數(shù)據(jù)難以核實的小微企業(yè)的借貸難題。在利用大數(shù)據(jù)建立個人信用評分方面,外部數(shù)據(jù)應涵蓋身份核驗信息、學歷信息、運營商信息、司法信息、工商信息、銀聯(lián)消費信息等,內(nèi)部數(shù)據(jù)應通過與個貸系統(tǒng)、信用卡系統(tǒng)對接,實現(xiàn)內(nèi)外部數(shù)據(jù)的整合。在利用大數(shù)據(jù)建立企業(yè)信用評分方面,一是應用企業(yè)及高管的外部大數(shù)據(jù),涵蓋銀監(jiān)、征信、工商、司法、環(huán)保、稅務、股東或高管投融資信息、公積金、房產(chǎn)指數(shù)、商標專利、外部輿情、學歷認證信息、電商交易數(shù)據(jù)等; 二是應用行內(nèi)的企業(yè)及高管賬戶行為數(shù)據(jù), 包括交易往來、存貸記錄、代發(fā)工資等。通過個人和企業(yè)的大數(shù)據(jù)信用評分,對接各業(yè)務條線生產(chǎn)系統(tǒng),輔助貸前調(diào)查、授信審批、放款核驗、貸后監(jiān)控、預警等工作, 提升授信業(yè)務質(zhì)效,尤其是對于由第三方平臺如電商或支付公司推薦的客戶,基于保護客戶數(shù)據(jù)的考慮,平臺往往不提供詳細的信息,從而難以評價這些客戶的風險。
需要指出的是,大數(shù)據(jù)有其明顯的長處,但也有其不足。一是大數(shù)據(jù)容量越大,其噪音也相應地增加,甚至噪聲增長速度可能快于數(shù)據(jù)量的增速,在大數(shù)據(jù)管理、分析方法尚未完全成熟時,挖掘成本較高。而銀行傳統(tǒng)數(shù)據(jù)含金量高,可以基于比較成熟的數(shù)理統(tǒng)計理論和方法,建立經(jīng)典的數(shù)理模型。二是外部大數(shù)據(jù)往往反映相關關系,而銀行傳統(tǒng)數(shù)據(jù)更容易得到因果關系,只有把兩者互相融合,把傳統(tǒng)數(shù)據(jù)分析方法的完備性、準確性和大數(shù)據(jù)的多維性、及時性融合起來,才能真正提升大數(shù)據(jù)在銀行風控中的實效。
(作者系華夏銀行總行授信運行部總經(jīng)理)