羅 勇
利率市場化改革的深入和數(shù)字經(jīng)濟的發(fā)展,促使越來越多的服務(wù)向數(shù)字化、線上化遷移,突如其來的新冠肺炎疫情更是加速了這一趨勢,銀行開始謀求業(yè)務(wù)的數(shù)字化轉(zhuǎn)型和突破。2021年《數(shù)據(jù)安全法》與《個人信息保護法》的出臺,與《網(wǎng)絡(luò)安全法》一同形成了數(shù)據(jù)合規(guī)領(lǐng)域的“三架馬車”,監(jiān)管政策強度日趨加大,銀行數(shù)字化轉(zhuǎn)型既要通過海量客戶行為數(shù)據(jù)準確識別客戶、營銷獲客、控制風險,又要確??蛻粜畔踩?,符合數(shù)據(jù)使用的法律規(guī)定,數(shù)據(jù)的保護意識和對數(shù)據(jù)價值挖掘的需求之間的矛盾開始日益凸顯。
在此背景下,隱私計算技術(shù)逐步受到關(guān)注,Gartner在2020年和2021年連續(xù)兩年將隱私增強計算列為最重要的戰(zhàn)略趨勢之一,并預測到2025年,60%的大型企業(yè)機構(gòu)將使用一種或多種隱私增強計算技術(shù);2021年6月,麥肯錫在《Fintech2030:全球金融科技生態(tài)掃描》中認為,自動因子發(fā)現(xiàn)、知識圖譜和圖計算,以及基于隱私保護的增強分析將發(fā)揮更大的價值,并將其列為金融機構(gòu)應關(guān)注的首要技術(shù)趨勢。通過多方安全計算、聯(lián)邦學習、可信執(zhí)行環(huán)境等相關(guān)技術(shù)將數(shù)據(jù)價值連通,推動數(shù)據(jù)安全共享,在多方數(shù)據(jù)融合的基礎(chǔ)上充分發(fā)揮大數(shù)據(jù)所產(chǎn)生的價值,釋放數(shù)據(jù)紅利,正在成為各界實現(xiàn)數(shù)字化轉(zhuǎn)型、推動數(shù)據(jù)要素化發(fā)展的創(chuàng)新解決方案。
近年來,風險控制能力越來越成為金融行業(yè)的隱形門檻。信息不對稱,個人、企業(yè)用戶信用記錄缺失,人工核驗成本高,逾期客戶的風險識別困難等,都對金融機構(gòu)管控風險帶來了很大挑戰(zhàn)。特別是近幾年金融業(yè)務(wù)快速發(fā)展,惡意欺詐、過度消費、重復授信等亂象浮現(xiàn),并且手段越來越專業(yè)化、產(chǎn)業(yè)化、隱蔽化和場景化。而傳統(tǒng)風控手段因維度單一、效率低下、范圍受限等原因,越來越難以滿足復雜的場景應用需求。金融行業(yè)需要各個行業(yè)維度的數(shù)據(jù)去覆蓋各類業(yè)務(wù)產(chǎn)品與風控需求,從而能夠使業(yè)務(wù)人員及時準確地洞察不同來源與業(yè)務(wù)場景的風險行為變化。而大數(shù)據(jù)分析的風控手段又常常依賴于數(shù)據(jù),但數(shù)據(jù)濫用又帶來了數(shù)據(jù)隱私安全問題。同時,并不是有越多的數(shù)據(jù)補充就越能有效提升風控能力。樣本缺失、數(shù)據(jù)質(zhì)量不高、有效數(shù)據(jù)維度欠缺等問題,使得通過挖掘數(shù)據(jù)價值來提升風控模型效果與保證風控數(shù)據(jù)的可用性在雙向平衡性中進退維谷。
傳統(tǒng)的風險控制流程大致經(jīng)歷了兩個階段——傳統(tǒng)風控和大數(shù)據(jù)風控。傳統(tǒng)風控偏向線下,包含人工審核環(huán)節(jié),審核時間長,用戶體驗不太好;大數(shù)據(jù)風控偏向線上,依賴海量的數(shù)據(jù),人工和機器審核相結(jié)合,支持批量和實時處理,用戶體驗較好。然而,隨著互聯(lián)網(wǎng)的高速發(fā)展,大數(shù)據(jù)風控同樣面臨一系列挑戰(zhàn)。
總體而言,數(shù)據(jù)不足,分享不夠。數(shù)據(jù)是大數(shù)據(jù)風控的血液。數(shù)據(jù)的可得性、全面性、準確性決定了大數(shù)據(jù)風控的生命力。金融機構(gòu)可以在大數(shù)據(jù)風控的模型構(gòu)建方面發(fā)揮主動性,也可以自己積累數(shù)據(jù);同時,外部數(shù)據(jù)特別是互聯(lián)網(wǎng)、政務(wù)數(shù)據(jù)也不可或缺。但目前很多政務(wù)等外部數(shù)據(jù)保存在不同地方,聯(lián)通不夠,導致眾多的信息孤島。
數(shù)據(jù)保護意識和數(shù)據(jù)融合矛盾凸顯。隨著數(shù)據(jù)相關(guān)法規(guī)的陸續(xù)出臺,個人隱私保護意識逐步增強,對數(shù)據(jù)的獲取和融合難度也逐漸加大。
易受到隱蔽化、團伙化的攻擊。大數(shù)據(jù)風控的數(shù)據(jù)來源和運營過程都在線上。網(wǎng)絡(luò)攻擊可以在任何時候、任何地點發(fā)動,難以預測,隱蔽性強。這就要求風控策略加快迭代速度、縮短周期,同時還要保證不損失風控精準度。
上述問題是金融行業(yè)風控領(lǐng)域的常見問題,而隱私計算技術(shù)的應用正在成為這些問題的一個有效的技術(shù)解。隱私計算是面向隱私信息全生命周期保護的計算理論和方法,是隱私信息的所有權(quán)、管理權(quán)和使用權(quán)分離時隱私度量、隱私泄漏代價、隱私保護與隱私分析復雜性的可計算模型與公理化系統(tǒng)。它可以在保證數(shù)據(jù)提供方不泄露原始數(shù)據(jù)的前提下,對數(shù)據(jù)進行分析計算,實現(xiàn)數(shù)據(jù)在流通與融合過程中的“可用不可見”。其中,聯(lián)邦學習(Federated Learning)是一種多個參與方在保證各自原始私有數(shù)據(jù)不出數(shù)據(jù)方定義的私有邊界的前提下,協(xié)作完成某項機器學習任務(wù)的機器學習模式,在金融領(lǐng)域更具可用性。
一方面,聯(lián)邦學習技術(shù)可以在保護用戶信息不泄露的前提下將多元、多維度的數(shù)據(jù)納入聯(lián)合風控模型中,從而實現(xiàn)更精細的洞察,構(gòu)建更精準的風控模型。另一方面,金融機構(gòu)與外部機構(gòu)之間也可基于聯(lián)邦學習技術(shù),利用多維度數(shù)據(jù)建立聯(lián)合金融風險模型、擇優(yōu)導流、共享黑名單等,在數(shù)據(jù)沒有離開本地的情況下,擴充多方特征或樣本,提高模型效果(見圖1)。
圖1 聯(lián)邦學習示意圖
在金融風控領(lǐng)域,聯(lián)邦學習技術(shù)主要有如下應用場景:一是擇優(yōu)導流。可基于銀行風險標簽,和合作機構(gòu)的客戶交易、瀏覽等行為數(shù)據(jù)構(gòu)建聯(lián)合風控模型,提高消費貸、小微貸等信貸產(chǎn)品引流的客群質(zhì)量,提升信貸審批通過率,把控貸款風險。二是貸前準入??苫谕獠繑?shù)據(jù)構(gòu)建風控模型及風控規(guī)則作為信貸決策流的補充,提高貸前風控能力。例如,通過稅務(wù)、用電、發(fā)票等數(shù)據(jù)衡量小微企業(yè)的經(jīng)營狀況及風險水平,促進普惠金融。三是貸中預警??舍槍︺y行貸款客戶,與外部機構(gòu)共同構(gòu)建貸中預警模型,量化違約概率,聯(lián)合監(jiān)控貸中違約風險。四是聯(lián)合反洗錢、聯(lián)合反詐。即可與多金融機構(gòu)共建反洗錢、反欺詐模型。五是黑名單共享。即可與多機構(gòu)共享黑名單,而不泄露查詢客戶。
以某銀行的數(shù)據(jù)貸款產(chǎn)品為例,旨在展示銀行無需大范圍改變風險控制流程,但在最小樣本的前提下,基于聯(lián)邦學習、回溯推演等新技術(shù),通過持續(xù)迭代的閉環(huán),實現(xiàn)銀行風險控制策略組合的最優(yōu)化,最大程度提升銀行的獲客精準度和客戶質(zhì)量,有效降低銀行信貸產(chǎn)品的不良率和獲客成本。
聯(lián)邦學習技術(shù)的應用,實質(zhì)上跨越了傳統(tǒng)多方信貸業(yè)務(wù)的數(shù)據(jù)壁壘,為風險策略優(yōu)化提供了可靠的外部數(shù)據(jù)支撐。因此,結(jié)合聯(lián)邦學習的應用特點,風險策略優(yōu)化應采用新的迭代路徑,以期充分利用外部數(shù)據(jù)價值。
新技術(shù)應用的價值體現(xiàn),主要體現(xiàn)在以下幾個方面(見圖2)。
圖2 基于聯(lián)邦學習技術(shù)的風險控制策略組合優(yōu)化
聯(lián)邦學習的技術(shù)價值:客戶KYC、精準畫像與智能導流。聯(lián)邦學習平臺打通了行內(nèi)與行外數(shù)據(jù)可信交換的安全通道,構(gòu)建了銀行通用的數(shù)據(jù)產(chǎn)品庫,助力了銀行數(shù)字化金融轉(zhuǎn)型?;诖似脚_,可在銀行與政務(wù)企業(yè)、互聯(lián)網(wǎng)企業(yè)、其他機構(gòu)之間架設(shè)安全的數(shù)據(jù)橋梁,提升數(shù)據(jù)安全及隱私保護水平;降低金融信息壁壘,激發(fā)業(yè)務(wù)創(chuàng)新;提升金融風險防范能力,促進行業(yè)健康發(fā)展。在聯(lián)合風控方面,可實現(xiàn)擇優(yōu)導流、貸前準入、貸中預警、聯(lián)合反欺詐、黑名單共享等場景應用;在精準營銷方面,可實現(xiàn)獲新、高潛客戶挖掘、交叉營銷等場景應用。
大數(shù)據(jù)風險控制技術(shù)價值:風控策略可視化、可定制及可監(jiān)測。銀行風控系統(tǒng)提供信貸業(yè)務(wù)貸前、貸中、貸后全生命周期的風控業(yè)務(wù)決策結(jié)果輸出,能準確識別客戶和風險,貫穿信貸業(yè)務(wù)全流程,提供一站式解決方案。一是實現(xiàn)風控數(shù)據(jù)特征管理,包括風控策略配置、模型管理以及發(fā)布和測試管理等,同時可實現(xiàn)反欺詐策略、數(shù)據(jù)采集和管理,以及對風控中各類名單的管理;二是實現(xiàn)風控策略的實時調(diào)用和決策,以及支持全自動、半自動、人工審核方式;三是實現(xiàn)風控預警規(guī)則管理和預警處置;四是實現(xiàn)風控運營分析,滿足風控運營管理需求。在數(shù)據(jù)運營方面,聯(lián)邦學習技術(shù)具備完備的數(shù)據(jù)結(jié)構(gòu)體系和完善的運營支撐能力,通過對資產(chǎn)、產(chǎn)品、渠道、營銷、風控等全方位的監(jiān)控和預警,全流程監(jiān)控報表,可視化前端展示,可實現(xiàn)風險及時預警、前瞻性預測,驅(qū)動業(yè)務(wù)和風控的優(yōu)化和提升,滿足互聯(lián)網(wǎng)業(yè)務(wù)的高頻迭代需求。
交易日志回溯技術(shù)價值:策略可回溯,決策有依據(jù),效果可預估。傳統(tǒng)的風控流程往往以串行為主,導致流程節(jié)點靠后的規(guī)則缺乏充分的進件樣本進行分析驗證,策略的調(diào)整甚至下架主要依賴專家經(jīng)驗。銀行風控系統(tǒng)創(chuàng)新性引入了并行化的風控規(guī)則設(shè)計,產(chǎn)品上線以來積累了大量數(shù)據(jù)樣本?;诨厮萃蒲萜脚_,可實現(xiàn)針對歷史生產(chǎn)數(shù)據(jù)的策略回溯功能,根據(jù)歷史積累的樣本和所有規(guī)則集的結(jié)果,推演不同渠道、不同客群、不同策略閾值的通過率、逾期率等業(yè)務(wù)指標的預期表現(xiàn),實現(xiàn)效果可預估、調(diào)整有依據(jù)。可視化的前臺展示為風險人員提供了包括預期通過率、拒絕原因、逾期率表現(xiàn)等在內(nèi)的風險表現(xiàn)分析和相關(guān)報表展現(xiàn),為風險人員的風險決策提供了便利。借助于大數(shù)據(jù)的算力可實現(xiàn)決策流程中決策節(jié)點之間針對大量風險規(guī)則的自動尋優(yōu),尋找階段性最優(yōu)解,并由風險策略人員通過回溯平臺進行策略變更前后的全流程驗證,為智能化風險決策提供依據(jù)。通過此平臺,可改變原有僅通過專家經(jīng)驗進行風險策略迭代的現(xiàn)狀,實現(xiàn)風險策略的快速、智能化迭代,快速提高產(chǎn)品的通過率,提升導流客戶的使用率,從而加大合作機構(gòu)的流量投放,提升機構(gòu)合作意愿,實現(xiàn)雙贏。
在保障數(shù)據(jù)可用不可見的前提下,聯(lián)邦學習技術(shù)的應用作為基礎(chǔ)能力,可以服務(wù)于銀行業(yè)務(wù)部門開展數(shù)字化產(chǎn)品創(chuàng)新,如與客戶開展銀企、銀政等數(shù)據(jù)智能決策方面的合作,核心企業(yè)集團總部與附屬機構(gòu)、上下游企業(yè)開展數(shù)據(jù)共享等場景。在銀行數(shù)字化產(chǎn)品創(chuàng)新方面,基于閉環(huán)的風控能力,可以幫助銀行開展數(shù)字化信貸產(chǎn)品創(chuàng)新,提供數(shù)據(jù)交互、風險決策、貸后監(jiān)控等底層技術(shù)能力;在與客戶開展數(shù)據(jù)智能決策合作方面,面向大流量平臺、政府機構(gòu)等,可以通過聯(lián)合建模的方式提供場景金融服務(wù),有效利用場景數(shù)據(jù)拓寬獲客渠道和收入來源;在服務(wù)數(shù)字化轉(zhuǎn)型方面,可以為一些有數(shù)字化基礎(chǔ)的核心企業(yè)總部,提供金融科技賦能,輔助其整合集團與附屬機構(gòu)、上下游企業(yè)的各類數(shù)據(jù),實現(xiàn)企業(yè)集團內(nèi)部的數(shù)據(jù)共享,提高內(nèi)部管理效率,進而實現(xiàn)數(shù)據(jù)變現(xiàn)。
基于聯(lián)邦學習、回溯推演等新技術(shù),通過持續(xù)迭代,風控策略組合不斷優(yōu)化。經(jīng)過ABTest生產(chǎn)驗證和投產(chǎn)部署,在風險管控上表現(xiàn)亮眼、成績突出。通過分析組合風控策略執(zhí)行前后的有效數(shù)據(jù)樣本,比對前后不同風險維度數(shù)據(jù),風險管控成效重點表現(xiàn)在以下三個方面。
資產(chǎn)規(guī)??焖偬嵘?。在整體流量不變的情況下,依托授信通過率大幅提升420%、件均授信增加10%、資產(chǎn)規(guī)模呈倍數(shù)增長。這在當下數(shù)據(jù)合規(guī)趨嚴的大背景下,降低了有效準入人均數(shù)據(jù)成本,在資產(chǎn)規(guī)模提升的同時,進一步壓降了無效成本的支出。
客群質(zhì)量顯著提升。產(chǎn)品在授信準入時,除滿足風險規(guī)則外,也要滿足一些模型分數(shù)。綜合客戶模型準入率由17.17%提升到51.59%,傳統(tǒng)客戶模型準入率由26.58%提升到59.51%。此外,新增準入的客戶并非集中在通過線上的中低分段,而是在各高分段線性增加,表明客群質(zhì)量在組合風控策略下有明顯提升。
較好捕捉風控規(guī)則。渠道引流通過率低的原因很大程度上是渠道方不知道銀行的準入規(guī)則,但在銀行準入規(guī)則不能泄露的情況下,前篩模型篩選后的客戶能否降低命中規(guī)則成為評判前篩模型的重要標準。目前前篩規(guī)則能夠較好捕捉客戶多頭申請和共債、收入過低、非銀機構(gòu)借貸等維度的規(guī)則,這些維度規(guī)則的命中率平均下降20%。前篩規(guī)則實現(xiàn)了客戶精準畫像,增大了符合銀行準入客戶流量。
綜上,在新技術(shù)下,風險控制策略組合持續(xù)迭代優(yōu)化,實現(xiàn)了精準捕捉客戶畫像、客群質(zhì)量顯著增加和資管成效全面提升。
聯(lián)邦學習技術(shù)是在保障數(shù)據(jù)安全的前提下實現(xiàn)數(shù)據(jù)價值流通的一種重要技術(shù)手段。技術(shù)價值的凸顯和政策環(huán)境的助力,使聯(lián)邦學習技術(shù)在數(shù)據(jù)相關(guān)產(chǎn)業(yè)悄然興起。在算法協(xié)議不斷優(yōu)化、硬件性能逐步增強之下,聯(lián)邦學習技術(shù)的可用性大大提升,越來越多的企業(yè)入局隱私計算的研發(fā)和產(chǎn)品化。金融機構(gòu)利用聯(lián)邦學習技術(shù)可對運營商、政務(wù)、征信等數(shù)據(jù)實現(xiàn)應用場景所需的價值融合,從而為用戶提供安全可信任的聚合金融服務(wù)?;趦?nèi)外部數(shù)據(jù)合作,在聯(lián)合風控方面,可實現(xiàn)擇優(yōu)導流、貸前準入、聯(lián)合反欺詐、黑名單共享等場景應用;在精準營銷方面,可實現(xiàn)獲新、高潛客戶挖掘、交叉營銷等場景應用。
在傳統(tǒng)的銀行風險控制流程基礎(chǔ)上,利用聯(lián)邦學習和回溯推演等新技術(shù),通過持續(xù)迭代的閉環(huán),實現(xiàn)在最小樣本的前提下風險控制策略組合的最優(yōu)化,具有較強的可行性和推廣性。