劉小莉
近年來,大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等新技術(shù)的應(yīng)用促進商業(yè)銀行向數(shù)字化轉(zhuǎn)型發(fā)展,金融科技手段在拓展客戶、改進服務(wù)、防控風(fēng)險、增強競爭力等方面發(fā)揮著積極作用。風(fēng)控領(lǐng)域傳統(tǒng)手段存在效率低、精度差、成本高等問題,難以滿足商業(yè)銀行業(yè)務(wù)創(chuàng)新發(fā)展的要求,智能風(fēng)控作為金融科技在金融領(lǐng)域最主要的應(yīng)用之一,在銀行業(yè)受到廣泛重視。智能風(fēng)控平臺以大數(shù)據(jù)為基礎(chǔ)資源,以云計算和人工智能為技術(shù)依托,運用于授信審批、反欺詐等風(fēng)控場景,可以提升風(fēng)控效率和精度,降低風(fēng)控成本,是集數(shù)據(jù)、模型、規(guī)則為一體的風(fēng)控中樞。目前,國內(nèi)大多數(shù)商業(yè)銀行正在積極探索搭建智能風(fēng)控平臺,為智能風(fēng)控的模型開發(fā)、決策分析和場景落地提供系統(tǒng)支持,推動風(fēng)險防控走向智能化時代。
智能風(fēng)控平臺的建設(shè)目標(biāo)
智能風(fēng)控平臺的建設(shè)以構(gòu)建智能化的風(fēng)險管控能力為核心目標(biāo),運用大數(shù)據(jù)計算處理技術(shù)和機器學(xué)習(xí)、深度學(xué)習(xí)模型,實現(xiàn)“數(shù)據(jù)采集和整合->數(shù)據(jù)加工處理->數(shù)據(jù)挖掘與分析->模型部署上線->持續(xù)優(yōu)化迭代”的智能風(fēng)控閉環(huán)管理。
實現(xiàn)風(fēng)險數(shù)據(jù)整合和可視化管理。大部分商業(yè)銀行在IT建設(shè)的歷史過程中,由于前期缺乏數(shù)據(jù)治理和系統(tǒng)建設(shè)科學(xué)規(guī)劃,曾形成多個煙囪式系統(tǒng),大量數(shù)據(jù)分散在不同系統(tǒng)中,雖然商業(yè)銀行通過建設(shè)數(shù)據(jù)倉庫、數(shù)據(jù)集市等基于關(guān)系型數(shù)據(jù)庫的系統(tǒng),一定程度解決了風(fēng)險數(shù)據(jù)分散的問題,但受關(guān)系型數(shù)據(jù)庫存儲成本高、運算能力低、支持?jǐn)?shù)據(jù)類型少等方面的限制,仍有大量風(fēng)險數(shù)據(jù)尚未集中存儲。同時,通過數(shù)據(jù)倉庫、數(shù)據(jù)集市提取數(shù)據(jù)流程較長、加工運算能力較低,缺乏便捷、有效的數(shù)據(jù)管理工具,導(dǎo)致風(fēng)險數(shù)據(jù)利用效率不高,對風(fēng)控決策支持造成制約。因此智能風(fēng)控平臺需要基于大數(shù)據(jù)技術(shù)對內(nèi)、外部風(fēng)險數(shù)據(jù)進一步整合,并實現(xiàn)數(shù)據(jù)的可視化管理,以便開展便捷、高效的數(shù)據(jù)處理,為智能風(fēng)控提供數(shù)據(jù)支撐。
支持基于人工智能技術(shù)的機器學(xué)習(xí)建模。人工智能模型作為智能風(fēng)控的“靈魂”,是商業(yè)銀行應(yīng)掌握的核心風(fēng)控能力。人工智能模型構(gòu)建往往需要復(fù)雜的機器學(xué)習(xí)算法,傳統(tǒng)建模工具通常缺少對機器學(xué)習(xí)算法的直接支持,并且需要大量的人工編碼,對于大部分銀行建模人員來說使用門檻高。因此智能風(fēng)控平臺需支持基于人工智能技術(shù)的機器學(xué)習(xí)建模,以便銀行建模人員實現(xiàn)智能風(fēng)控模型的便捷開發(fā)。
支持風(fēng)控模型快速、靈活的迭代和部署。真正發(fā)揮智能風(fēng)控的作用需要依靠風(fēng)控模型及時迭代優(yōu)化,并進行快速部署運行。商業(yè)銀行以往使用傳統(tǒng)建模工具建模往往效率較低、模型迭代周期較長,同時模型部署通常需要預(yù)先部署決策引擎,再使用人工方式進行參數(shù)配置,操作繁瑣、耗時較長且模型部署的位置不靈活,難以適應(yīng)新形勢下風(fēng)控模型迅速迭代、快速部署的需要。為保證模型的時效性,快速適應(yīng)客群風(fēng)險特征的變化,智能風(fēng)控平臺需具備支持模型及時優(yōu)化更新的能力,并可以將模型快速、靈活部署到模型運行環(huán)境。
智能風(fēng)控平臺建設(shè)的困難和挑戰(zhàn)
系統(tǒng)架構(gòu)和技術(shù)較為復(fù)雜。智能風(fēng)控平臺包括風(fēng)險數(shù)據(jù)整合、數(shù)據(jù)可視化管理、機器學(xué)習(xí)建模、模型發(fā)布和模型應(yīng)用等多個模塊,需要對各模塊進行橫向、縱向銜接以及技術(shù)的融合運用。從縱向看,從底層數(shù)據(jù)源到上層的風(fēng)控應(yīng)用,需要根據(jù)數(shù)據(jù)依賴關(guān)系及業(yè)務(wù)邏輯對系統(tǒng)進行分層設(shè)計。從橫向看,不同功能模塊之間,需要根據(jù)相互調(diào)用關(guān)系進行有效銜接。同時建設(shè)過程中還要考慮分布式計算、機器學(xué)習(xí)、知識圖譜、圖計算等新技術(shù)以及ETL、關(guān)系型數(shù)據(jù)庫等傳統(tǒng)技術(shù)的綜合運用和技術(shù)兼容問題,這些都對平臺建設(shè)構(gòu)成了挑戰(zhàn)。
數(shù)據(jù)處理和數(shù)據(jù)安全管理難度大。數(shù)據(jù)問題既是平臺建設(shè)要解決的問題,也是要面臨的難點。通過智能風(fēng)控平臺進行建模的基礎(chǔ)條件是所整合的風(fēng)險數(shù)據(jù)質(zhì)量有保障,但商業(yè)銀行現(xiàn)有數(shù)據(jù)存在不同程度的數(shù)據(jù)標(biāo)準(zhǔn)不一、數(shù)據(jù)定義不明、數(shù)據(jù)口徑不清以及數(shù)據(jù)缺失等問題,使得智能風(fēng)控平臺建設(shè)過程中的數(shù)據(jù)梳理、口徑統(tǒng)一、數(shù)據(jù)清洗等工作耗時長、難度大。同時,平臺整合行內(nèi)外大量可視化風(fēng)險數(shù)據(jù),為提高數(shù)據(jù)的利用價值,更多數(shù)據(jù)需要向用戶開放,增加了數(shù)據(jù)安全管理的復(fù)雜性。
自主建設(shè)能力存在不足。智能風(fēng)控平臺作為金融科技應(yīng)用的創(chuàng)新實踐方興未艾,大部分商業(yè)銀行由于前期缺乏技術(shù)積累,專業(yè)人才較為匱乏,同類項目建設(shè)經(jīng)驗不足等原因,在探索建設(shè)過程中對平臺的功能邊界、風(fēng)控規(guī)則等難免有認(rèn)知局限。同時,平臺建設(shè)涉及多種風(fēng)控應(yīng)用落地,較難一次性完成,自主實施也存在一定難度。
華夏銀行智能風(fēng)控平臺的建設(shè)實踐
華夏銀行智能風(fēng)控平臺通過外部引智和借鑒業(yè)內(nèi)先進經(jīng)驗,克服了架構(gòu)、技術(shù)、數(shù)據(jù)、應(yīng)用等多方面的困難,共歷時一年多,分兩批投產(chǎn)上線,具備了客戶風(fēng)險畫像、風(fēng)控建模、智能風(fēng)險分析等功能。第一批2019年3月投產(chǎn),完成了行內(nèi)多個數(shù)據(jù)源重要風(fēng)險數(shù)據(jù)的整合,并引入工商數(shù)據(jù)與行內(nèi)客戶數(shù)據(jù)融合,第二批2019年10月投產(chǎn),形成了“天機星”企業(yè)客戶風(fēng)險畫像系統(tǒng)和“天算星”風(fēng)控建模系統(tǒng)兩大核心功能。
建設(shè)“天機星”企業(yè)客戶風(fēng)險畫像系統(tǒng),建立客戶風(fēng)險全景視圖。針對企業(yè)客戶關(guān)聯(lián)關(guān)系存在真實情景復(fù)雜、客戶刻意隱瞞從而難以充分準(zhǔn)確識別等問題,“天機星”系統(tǒng)優(yōu)先著力解決集團客戶風(fēng)險捕捉不全面、過度授信等業(yè)務(wù)痛點,力圖識別每條客戶關(guān)聯(lián)關(guān)系的“天機”。一是構(gòu)建客戶譜系。進行關(guān)系挖掘分析聚合,從投資、擔(dān)保、控制人關(guān)系等多維度構(gòu)建關(guān)系圖譜,網(wǎng)狀呈現(xiàn)客戶在關(guān)系圖譜中所處的位置及角色,區(qū)分強經(jīng)濟圈、最終受益人圈、最終控制人圈、集團圈,識別企業(yè)的實際控制人,有效識別關(guān)聯(lián)風(fēng)險,預(yù)防外源性風(fēng)險傳導(dǎo)。二是生成客戶風(fēng)險畫像。以客戶為中心整合內(nèi)外部風(fēng)險信息,深度刻畫剖析企業(yè)的內(nèi)外部風(fēng)險,形成多維立體的客戶風(fēng)險畫像,實現(xiàn)從“人找信息”到“信息找人”的轉(zhuǎn)變。三是提供智能分析報告。基于客戶風(fēng)險畫像,引入智能評價策略,構(gòu)建客戶、集團、行業(yè)、地域等不同統(tǒng)計維度上的風(fēng)險分析報告體系。
建設(shè)“天算星”風(fēng)控建模系統(tǒng),賦能智能風(fēng)控模型敏捷開發(fā)。“天算星”集成了風(fēng)險數(shù)據(jù)整合、數(shù)據(jù)可視化管理和機器學(xué)習(xí)建模等功能,為開發(fā)建設(shè)智能化風(fēng)控模型提供建模平臺,可極大地提高算力。一是對內(nèi)外部風(fēng)險數(shù)據(jù)進行整合。涉及內(nèi)外部多個信息系統(tǒng)數(shù)據(jù)源,涵蓋了客戶、業(yè)務(wù)、擔(dān)保、財務(wù)、征信、工商及銀保監(jiān)會客戶風(fēng)險信息等多種數(shù)據(jù)。二是實現(xiàn)風(fēng)險數(shù)據(jù)分類管理和權(quán)限管理。既支持?jǐn)?shù)據(jù)資源的可視化訪問,提供多種格式的數(shù)據(jù)導(dǎo)入,大大提高數(shù)據(jù)提取和數(shù)據(jù)利用的便利性,也支持?jǐn)?shù)據(jù)分類管理,實現(xiàn)精細化的數(shù)據(jù)分類和不同數(shù)據(jù)庫之間的數(shù)據(jù)相互調(diào)用。同時支持靈活的數(shù)據(jù)權(quán)限管理,對不同用戶設(shè)置差異化的數(shù)據(jù)讀、寫權(quán)限控制,采用樹狀結(jié)構(gòu)配置數(shù)據(jù)庫和表、用戶組和用戶之間的權(quán)限,實現(xiàn)了數(shù)據(jù)權(quán)限的靈活管理以保障數(shù)據(jù)安全。三是提供了豐富的數(shù)據(jù)處理功能。既支持?jǐn)?shù)據(jù)統(tǒng)計、數(shù)據(jù)拆分、數(shù)據(jù)清洗等預(yù)處理功能以及特征抽取、特征組合等自動化的特征工程,也支持?jǐn)?shù)據(jù)定制化加工,并同時提供菜單式和編碼式的數(shù)據(jù)處理功能,從而大大降低數(shù)據(jù)處理的難度。四是支持機器學(xué)習(xí)建模。引入多種高精度的機器學(xué)習(xí)算法,支持自動、智能、精準(zhǔn)、快速的模型開發(fā),同時具有模型直接發(fā)布部署和模型翻譯功能,大大提高模型開發(fā)、優(yōu)化和部署的效率與靈活性。
采用先進架構(gòu)和技術(shù),提高智能風(fēng)控處理能力與效率。一是采用高內(nèi)聚低耦合的三層系統(tǒng)架構(gòu),便于平臺管理和擴展。高內(nèi)聚低耦合系統(tǒng)架構(gòu)下,每個模塊只聚焦特定的獨立子功能,模塊與模塊之間的聯(lián)系盡量少且接口簡單,相比低內(nèi)聚高耦合的系統(tǒng)架構(gòu),顯著提高了系統(tǒng)穩(wěn)定性和獨立性,更便于平臺管理和擴展。平臺的數(shù)據(jù)整合層專注于構(gòu)建大容量Hadoop數(shù)據(jù)集群,整合和存儲內(nèi)外部數(shù)據(jù),供“天機星”和“天算星”共享。模型構(gòu)建層專注于大數(shù)據(jù)的清洗、加工以及模型構(gòu)建。模型應(yīng)用層專注于通過模型運算輸出模型結(jié)果。各層級功能相對獨立,降低了系統(tǒng)各層級間的相互影響,同時又實現(xiàn)了數(shù)據(jù)共享。二是采用大數(shù)據(jù)處理技術(shù)提升運算性能。采用當(dāng)今業(yè)界前沿的大數(shù)據(jù)處理技術(shù),在分布式框架下將Hive和MapReduce相結(jié)合,用于支撐TB、乃至PB級的大規(guī)模數(shù)據(jù)集并行運算,實現(xiàn)傳統(tǒng)技術(shù)難以支撐的海量數(shù)據(jù)批處理運算。前臺數(shù)據(jù)查詢采用Redis內(nèi)存數(shù)據(jù)庫,搜索引擎采用ElasticSearch,大大提升大數(shù)據(jù)搜索查詢和計算速度。三是利用知識圖譜技術(shù),提升客戶風(fēng)險全景視圖的挖掘探查能力。采用業(yè)界領(lǐng)先的Neo4j圖數(shù)據(jù)庫和Spark GraphX分布式圖處理技術(shù),以圖的結(jié)構(gòu)形式存儲關(guān)聯(lián)數(shù)據(jù),無需全局搜索,僅遍歷查詢有限的局部數(shù)據(jù)就可以得到查詢結(jié)果,并且基于簡潔易用、豐富的圖計算和圖挖掘接口,更加方便地實現(xiàn)對千萬級企業(yè)客戶的關(guān)聯(lián)譜系構(gòu)建和疑似實際控制人識別,較傳統(tǒng)技術(shù)大規(guī)模關(guān)聯(lián)數(shù)據(jù)的查詢和運算速度可提高數(shù)倍乃至數(shù)十倍,并提高開發(fā)效率。
總結(jié)和展望
智能風(fēng)控平臺的建設(shè)和運用為商業(yè)銀行開展智能風(fēng)控提供了更多的工具和手段。但智能風(fēng)控并非無所不能,它無法取代數(shù)據(jù)治理等基礎(chǔ)工作,也無法完全脫離建模人員的專家經(jīng)驗,其在金融領(lǐng)域的應(yīng)用仍處于探索階段,金融場景的復(fù)雜多變也使智能風(fēng)控面臨更多的考驗。同時外部數(shù)據(jù)獲取的穩(wěn)定性、可用性等問題,機器學(xué)習(xí)算法本身的過擬合問題以及外部“黑產(chǎn)”和團伙欺詐手段的不斷升級等因素都可能對智能風(fēng)控實施產(chǎn)生挑戰(zhàn)。未來在合規(guī)運營的前提下,商業(yè)銀行應(yīng)繼續(xù)加強數(shù)據(jù)價值的挖掘,加大風(fēng)控建模專業(yè)隊伍的培養(yǎng),充分利用新技術(shù)的優(yōu)勢,因勢利導(dǎo),不斷加強智能風(fēng)控應(yīng)用的廣度和深度,從而完成智能風(fēng)控“將數(shù)據(jù)轉(zhuǎn)化成信息,將信息轉(zhuǎn)化成知識,將知識轉(zhuǎn)化成能力”的增值過程。
(作者系華夏銀行授信審批部總經(jīng)理)