陳強(qiáng),代仕婭
1. 興業(yè)銀行信息科技部,上海 201201;2. 螞蟻科技國(guó)際事業(yè)群數(shù)據(jù)算法技術(shù)部,上海 200120
商業(yè)銀行會(huì)計(jì)風(fēng)險(xiǎn)案件形式多樣,涵蓋反洗錢、資金詐騙、非法集資、虛假交易、惡意刷單、套現(xiàn)挪用等多種作案手段。隨著商業(yè)銀行業(yè)務(wù)范圍不斷拓展,經(jīng)濟(jì)形勢(shì)復(fù)雜性加劇,會(huì)計(jì)風(fēng)險(xiǎn)案件日趨高發(fā),給商業(yè)銀行及社會(huì)經(jīng)濟(jì)帶來嚴(yán)重的損失,也給金融系統(tǒng)的穩(wěn)定性造成不良影響。除了明確對(duì)反洗錢等金融犯罪行為的打擊防范,監(jiān)管對(duì)銀行資金的使用規(guī)范也日益嚴(yán)格,如《商業(yè)銀行互聯(lián)網(wǎng)貸款管理暫行辦法》明確表示,貸款資金不得用于購(gòu)買房產(chǎn)、股票、金融衍生品等。加強(qiáng)對(duì)會(huì)計(jì)風(fēng)險(xiǎn)案件的防控是新形勢(shì)下銀行風(fēng)險(xiǎn)管理的重要內(nèi)容,具有較大的經(jīng)濟(jì)效益和社會(huì)效益,一是能更好地保障客戶資金的安全,切實(shí)做好維護(hù)客戶利益的本職工作;二是有利于監(jiān)測(cè)并規(guī)范信貸資金的用途,使其切實(shí)用于企業(yè)的經(jīng)營(yíng)發(fā)展,支持與服務(wù)實(shí)體經(jīng)濟(jì);三是能增強(qiáng)反洗錢能力,防范金融犯罪,助力金融系統(tǒng)的穩(wěn)定與社會(huì)經(jīng)濟(jì)健康發(fā)展。而現(xiàn)實(shí)中各類風(fēng)險(xiǎn)事件的作案手法越發(fā)復(fù)雜,內(nèi)外部勾結(jié)、團(tuán)伙合作等形式較難被及時(shí)察覺,傳統(tǒng)事后核查方式的防范效率較低。這些都對(duì)銀行傳統(tǒng)的風(fēng)險(xiǎn)管理模式提出更嚴(yán)峻的挑戰(zhàn),需要借助新技術(shù)、新方法來更有效地應(yīng)對(duì)。
近年來,金融科技蓬勃發(fā)展,驅(qū)動(dòng)金融業(yè)務(wù)經(jīng)營(yíng)與管理模式的創(chuàng)新變革。中國(guó)人民銀行印發(fā)的《金融科技(FinTech)發(fā)展規(guī)劃(2019—2021年)》明確指出,金融科技已成為防范化解金融風(fēng)險(xiǎn)的新利器,是新形勢(shì)下金融風(fēng)險(xiǎn)管理的內(nèi)在需求和重要選擇。金融科技在會(huì)計(jì)非現(xiàn)場(chǎng)監(jiān)控工作中的應(yīng)用能實(shí)現(xiàn)對(duì)會(huì)計(jì)異常數(shù)據(jù)的自動(dòng)監(jiān)控、自動(dòng)預(yù)警、自動(dòng)通知,有效提升會(huì)計(jì)監(jiān)控的效率[1];基于大數(shù)據(jù)、人工智能技術(shù)的反欺詐智能平臺(tái)能對(duì)海量金融交易進(jìn)行監(jiān)測(cè),在降低異常交易預(yù)警的同時(shí),極大地提高了識(shí)別欺詐交易的命中率[2]。為此,商業(yè)銀行積極探索大數(shù)據(jù)、人工智能、知識(shí)圖譜等核心技術(shù)在會(huì)計(jì)案防領(lǐng)域的高效應(yīng)用就顯得格外必要。將傳統(tǒng)的風(fēng)險(xiǎn)業(yè)務(wù)知識(shí)與大數(shù)據(jù)、人工智能技術(shù)結(jié)合,充分發(fā)揮數(shù)據(jù)模型在風(fēng)險(xiǎn)特征挖掘上的能力,構(gòu)建更完善、更精準(zhǔn)的智能化會(huì)計(jì)案件風(fēng)險(xiǎn)防控體系,能有效地提升銀行的風(fēng)險(xiǎn)管理水平,推動(dòng)銀行的高質(zhì)量發(fā)展。
本文引入知識(shí)圖譜相關(guān)技術(shù),提出了結(jié)合關(guān)聯(lián)風(fēng)險(xiǎn)特征的會(huì)計(jì)案防智能化反欺詐策略體系構(gòu)建方案。首先,構(gòu)建了銀行賬戶金融知識(shí)圖譜,并采用多種圖分析技術(shù)挖掘提煉賬戶之間的關(guān)聯(lián)風(fēng)險(xiǎn)特征;其次,將關(guān)聯(lián)風(fēng)險(xiǎn)特征與傳統(tǒng)會(huì)計(jì)案防規(guī)則結(jié)合,形成完整的會(huì)計(jì)案防智能化反欺詐策略體系;最后,基于銀行真實(shí)交易賬戶對(duì)反欺詐策略進(jìn)行檢驗(yàn),檢驗(yàn)結(jié)果表明,該智能化反欺詐策略體系能有效識(shí)別出高風(fēng)險(xiǎn)賬戶。
作為人工智能的重要領(lǐng)域之一,知識(shí)圖譜相關(guān)技術(shù)在金融反欺詐領(lǐng)域的應(yīng)用日益廣泛,對(duì)金融風(fēng)險(xiǎn)防范起到顯著的促進(jìn)作用。姜增明等人[3]認(rèn)為商業(yè)銀行反欺詐的關(guān)鍵在于建立以大數(shù)據(jù)為支撐的風(fēng)控體系,采用知識(shí)圖譜、社交網(wǎng)絡(luò)分析等技術(shù),更有效地防范復(fù)雜模式下的欺詐風(fēng)險(xiǎn)。柴洪峰等人[4]指出依托知識(shí)圖譜強(qiáng)大的知識(shí)推理和邏輯判斷能力,在提升風(fēng)險(xiǎn)監(jiān)管決策準(zhǔn)確性的同時(shí),也能增強(qiáng)其可解釋性。陶睿等人[5]通過構(gòu)建上市公司知識(shí)圖譜,對(duì)企業(yè)風(fēng)險(xiǎn)進(jìn)行智能化監(jiān)控,提升了監(jiān)管穿透性,緩解了監(jiān)管時(shí)滯性;陶士貴等人[6]基于股權(quán)關(guān)系圖譜,采用復(fù)雜股權(quán)關(guān)系路徑算法,有效識(shí)別企業(yè)的最終受益人,實(shí)現(xiàn)反洗錢風(fēng)險(xiǎn)的預(yù)警提示。上述文章主要側(cè)重于從企業(yè)控制人角度出發(fā),采用知識(shí)圖譜挖掘股權(quán)關(guān)系中的風(fēng)險(xiǎn),但這些文章均僅描述了研究思路,并未就具體圖計(jì)算過程和實(shí)驗(yàn)結(jié)果進(jìn)行詳細(xì)闡述。金磐石等人[7]通過構(gòu)建企業(yè)關(guān)聯(lián)圖譜,將企業(yè)畫像特征與從知識(shí)圖譜中提取的企業(yè)關(guān)系特征結(jié)合,并將其作為分類模型的變量輸入,預(yù)測(cè)小微企業(yè)欺詐的概率;王成等人[8]采用知識(shí)圖譜的網(wǎng)絡(luò)嵌入方法預(yù)測(cè)互聯(lián)網(wǎng)借貸的欺詐行為,將網(wǎng)絡(luò)中的節(jié)點(diǎn)嵌入低維的向量空間,以自動(dòng)學(xué)習(xí)網(wǎng)絡(luò)中隱含的關(guān)聯(lián)關(guān)系,增強(qiáng)了欺詐預(yù)測(cè)的性能。這兩篇文章主要將知識(shí)圖譜與AI算法結(jié)合,通過算法模型預(yù)測(cè)信貸業(yè)務(wù)中的欺詐風(fēng)險(xiǎn),但對(duì)于會(huì)計(jì)案防業(yè)務(wù)來說,這種方法不僅欺詐樣本比例較低,影響模型訓(xùn)練效果,而且對(duì)案件發(fā)生邏輯的分析要求高,完全采用機(jī)器學(xué)習(xí)模型預(yù)測(cè)欺詐缺乏相應(yīng)的可解釋性。凡友榮等人[9]基于電信通話知識(shí)圖譜,通過最短路徑算法、PageRank算法、聚類算法等識(shí)別電信通話中的關(guān)聯(lián)路徑、核心人物及社會(huì)關(guān)系,為電信資金詐騙的識(shí)別提供重要線索;魏瑾等人[10]搭建了基于知識(shí)圖譜的欺詐電話智能決策平臺(tái),提升了電信詐騙識(shí)別的準(zhǔn)確率。這兩篇文章采用知識(shí)圖譜技術(shù)提取個(gè)人之間的交互網(wǎng)絡(luò)特征,能獲得更深層次的風(fēng)險(xiǎn)信息,但主要為個(gè)人關(guān)系層面,未涉及賬戶資金交易,場(chǎng)景應(yīng)用上存在較大差異。
為此,本文基于會(huì)計(jì)案防領(lǐng)域的業(yè)務(wù)特點(diǎn),構(gòu)建了一種將行業(yè)知識(shí)與知識(shí)圖譜技術(shù)結(jié)合的智能化反欺詐策略方案,在交易賬戶金融知識(shí)圖譜的基礎(chǔ)上,采用多種圖分析技術(shù),從網(wǎng)絡(luò)結(jié)構(gòu)、賬戶資金流向、資金交易閉環(huán)、賬戶關(guān)聯(lián)強(qiáng)度等多維度進(jìn)行深度挖掘,提煉出賬戶關(guān)聯(lián)風(fēng)險(xiǎn)特征;將賬戶關(guān)聯(lián)風(fēng)險(xiǎn)特征與賬戶基礎(chǔ)特征結(jié)合起來,基于行業(yè)知識(shí)構(gòu)建反欺詐規(guī)則策略集,以實(shí)現(xiàn)對(duì)會(huì)計(jì)案件欺詐風(fēng)險(xiǎn)更精準(zhǔn)的識(shí)別。
在商業(yè)銀行會(huì)計(jì)案防工作中,基于長(zhǎng)期業(yè)務(wù)經(jīng)驗(yàn)積累形成的風(fēng)險(xiǎn)規(guī)則邏輯是識(shí)別欺詐案件的重要行業(yè)知識(shí),但是對(duì)于資金交易閉環(huán)、賬戶穿透轉(zhuǎn)移等關(guān)聯(lián)交易特征,由于涉及主體較多、交易路徑復(fù)雜,人工難以及時(shí)識(shí)別,這也是會(huì)計(jì)案防工作的痛點(diǎn)與難點(diǎn)。知識(shí)圖譜通過將蘊(yùn)含業(yè)務(wù)規(guī)律的、跨系統(tǒng)跨主體的數(shù)據(jù)信息以圖的形式進(jìn)行關(guān)聯(lián)、展示與分析,能夠挖掘出隱含的欺詐風(fēng)險(xiǎn)信息。對(duì)于銀行賬戶交易來說,不同賬戶之間通過資金轉(zhuǎn)移形成了一張交易關(guān)聯(lián)網(wǎng)路,采用知識(shí)圖譜技術(shù)能更及時(shí)、更精準(zhǔn)地提取出賬戶深層的關(guān)聯(lián)交易風(fēng)險(xiǎn)特征,并通過圖可視化技術(shù)進(jìn)行展示,這有助于提升會(huì)計(jì)案防風(fēng)險(xiǎn)識(shí)別的質(zhì)效。
由于會(huì)計(jì)案防欺詐樣本相對(duì)較少,且對(duì)案件發(fā)生邏輯及可解釋性要求很高,會(huì)計(jì)案防核查最終需要基于行業(yè)知識(shí)的風(fēng)險(xiǎn)規(guī)則策略對(duì)案防事件進(jìn)行識(shí)別與確認(rèn)。傳統(tǒng)案防風(fēng)險(xiǎn)策略一般以賬戶的基礎(chǔ)特征為主進(jìn)行構(gòu)建,缺乏賬戶之間的關(guān)聯(lián)網(wǎng)絡(luò)特征。而在本文的智能化反欺詐方案中,將行業(yè)知識(shí)與知識(shí)圖譜結(jié)合起來構(gòu)建出更前瞻、更精準(zhǔn)的風(fēng)險(xiǎn)策略集。一是通過賬戶交易知識(shí)圖譜提煉、挖掘更加豐富的交易網(wǎng)絡(luò)特征,全面獲得賬戶的基礎(chǔ)特征(也可以將其看成賬戶節(jié)點(diǎn)的屬性)與賬戶間隱藏的關(guān)聯(lián)特征,形成更完整的特征規(guī)則集;二是基于會(huì)計(jì)案防行業(yè)知識(shí),對(duì)融合了網(wǎng)絡(luò)關(guān)聯(lián)特征的規(guī)則集進(jìn)行組合配置,形成更加精準(zhǔn)有效的會(huì)計(jì)案件反欺詐策略體系。在整個(gè)過程中,如何通過知識(shí)圖譜技術(shù)挖掘出賬戶之間隱藏的關(guān)聯(lián)特征,是本文研究的重點(diǎn)。智能化反欺詐策略方案的整體架構(gòu)如圖1所示,主要包含指標(biāo)庫(kù)、金融知識(shí)圖譜分析、規(guī)則策略等部分,其中指標(biāo)庫(kù)是指對(duì)會(huì)計(jì)案防規(guī)則進(jìn)行解耦,并加工出賬戶的基本特征,是實(shí)現(xiàn)風(fēng)險(xiǎn)策略可靈活配置應(yīng)用的重要工程化基礎(chǔ);金融知識(shí)圖譜分析部分主要是對(duì)賬戶交易知識(shí)圖譜的構(gòu)建以及關(guān)聯(lián)網(wǎng)絡(luò)特征的提??;規(guī)則策略部分主要是對(duì)融合了賬戶基礎(chǔ)特征和關(guān)聯(lián)網(wǎng)絡(luò)特征的規(guī)則進(jìn)行組合配置,形成不同場(chǎng)景下的會(huì)計(jì)案防反欺詐策略。
會(huì)計(jì)案防業(yè)務(wù)中原始的規(guī)則邏輯大多以文本的形式描述,在應(yīng)用過程中將對(duì)每一條規(guī)則邏輯進(jìn)行獨(dú)立的SQL語句編寫,一旦規(guī)則邏輯發(fā)生任何細(xì)微的改動(dòng),都需要重新編寫SQL規(guī)則語句,這種應(yīng)用方式一方面導(dǎo)致規(guī)則配置及更新迭代的效率較低,另一方面也難以與知識(shí)圖譜等技術(shù)結(jié)合進(jìn)行挖掘分析。為了實(shí)現(xiàn)會(huì)計(jì)案件的智能分析預(yù)警,需要對(duì)規(guī)則文本進(jìn)行進(jìn)一步的拆解,提煉出影響案件性質(zhì)的關(guān)鍵要素,形成指標(biāo)庫(kù),以便通過對(duì)指標(biāo)的靈活組合配置,形成適應(yīng)不同時(shí)間、不同場(chǎng)景的業(yè)務(wù)規(guī)則,對(duì)會(huì)計(jì)風(fēng)險(xiǎn)案件做出更快、更精準(zhǔn)的響應(yīng)。指標(biāo)拆解示例見表1。
同時(shí),對(duì)于一些難以從結(jié)構(gòu)化數(shù)據(jù)中直接提取的規(guī)則指標(biāo),將采用知識(shí)圖譜、機(jī)器學(xué)習(xí)等技術(shù)進(jìn)行相應(yīng)的處理,以更充分地實(shí)現(xiàn)指標(biāo)自動(dòng)化、智能化生成。如在“票據(jù)審查真實(shí)”這條規(guī)則中,傳統(tǒng)票據(jù)審查方式只能靠人工在線下進(jìn)行,在此則依托光學(xué)字符識(shí)別(optical character recognition,OCR)技術(shù)對(duì)承兌人、票面金額等票據(jù)要素進(jìn)行自動(dòng)提取與真實(shí)性判斷;又如,對(duì)于“是否是股東”這條規(guī)則,可以采用自然語言處理(natural language processing,NLP)技術(shù)從股權(quán)變更公告中自動(dòng)提取股權(quán)相關(guān)信息,圖2為指標(biāo)智能化生成方法示例。
表1 指標(biāo)拆解示例
圖1 會(huì)計(jì)案防智能化反欺詐體系架構(gòu)
知識(shí)圖譜具有節(jié)點(diǎn)和邊的概念,節(jié)點(diǎn)表示信息實(shí)體或者實(shí)體的屬性值,邊表示兩個(gè)被連接實(shí)體的關(guān)系或者一個(gè)實(shí)體的某個(gè)屬性[11]。金融知識(shí)圖譜主要針對(duì)金融行業(yè)的業(yè)務(wù)場(chǎng)景,通過大規(guī)模語義網(wǎng)絡(luò),將金融業(yè)務(wù)領(lǐng)域中的結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等不同類型數(shù)據(jù)進(jìn)行整合,將事物或者概念作為實(shí)體,基于實(shí)體之間的語義關(guān)系相互連接,構(gòu)建出網(wǎng)狀的知識(shí)鏈接,形成結(jié)構(gòu)化的語義知識(shí)庫(kù),以更清晰的形式描述金融業(yè)務(wù)中復(fù)雜的關(guān)聯(lián)邏輯[12]。金融知識(shí)圖譜的內(nèi)容和結(jié)構(gòu)根據(jù)具體金融業(yè)務(wù)的不同而不同,對(duì)于會(huì)計(jì)案防領(lǐng)域,防范重點(diǎn)在于資金的違規(guī)流動(dòng),故該領(lǐng)域金融知識(shí)圖譜的重點(diǎn)在于對(duì)賬戶之間資金交易關(guān)系的刻畫,與傳統(tǒng)知識(shí)圖譜相比,賬戶實(shí)體之間的邊增加了表示資金流向的箭頭,邊的粗細(xì)也會(huì)根據(jù)交易量進(jìn)行區(qū)分。
知識(shí)圖譜的構(gòu)建首先是語義框架的設(shè)計(jì),即確定會(huì)計(jì)案防業(yè)務(wù)領(lǐng)域中的實(shí)體,以及實(shí)體之間的語義關(guān)系結(jié)構(gòu);其次是知識(shí)內(nèi)容的構(gòu)建,即根據(jù)語義框架中定義好的實(shí)體及關(guān)系類型,從多源異構(gòu)數(shù)據(jù)中提取出實(shí)體,將實(shí)體、關(guān)系、屬性以三元組的形式存儲(chǔ)在圖數(shù)據(jù)庫(kù)中[13],形成完整的關(guān)聯(lián)圖譜。
采用各類知識(shí)圖譜分析技術(shù)能夠發(fā)掘出圖結(jié)構(gòu)中隱含的業(yè)務(wù)深層聯(lián)系,實(shí)現(xiàn)智慧搜索與智能交互,進(jìn)而增強(qiáng)金融機(jī)構(gòu)的業(yè)務(wù)智能化水平。本方案主要采用圖可視化分析、知識(shí)推理、圖計(jì)算等圖技術(shù),提煉金融知識(shí)圖譜的淺層關(guān)聯(lián)特征、深層關(guān)聯(lián)特征等多層次結(jié)構(gòu)信息,賦能復(fù)雜業(yè)務(wù)經(jīng)驗(yàn)的智能化應(yīng)用,提高欺詐風(fēng)險(xiǎn)識(shí)別的覆蓋率、準(zhǔn)確率。主要的圖分析及特征提取內(nèi)容如圖3所示。
圖2 指標(biāo)智能化生成方法示例
圖3 圖分析和特征提取
3.2.1 圖可視化分析
圖可視化分析主要是將圖結(jié)構(gòu)的數(shù)據(jù)存儲(chǔ)在Neo4j、JanusGraph等圖數(shù)據(jù)庫(kù)中,并結(jié)合Elasticsearch搜索分析引擎,實(shí)現(xiàn)高靈活性、高準(zhǔn)確性、低時(shí)延及大規(guī)模并行化的檢索查詢[14],形成對(duì)圖結(jié)構(gòu)數(shù)據(jù)的可視化關(guān)聯(lián)展示,以提取實(shí)體之間的關(guān)系類型、實(shí)體屬性等基礎(chǔ)的網(wǎng)絡(luò)特征。
3.2.2 圖關(guān)系挖掘
通過圖計(jì)算、知識(shí)推理等分析挖掘技術(shù),提取出圖數(shù)據(jù)結(jié)構(gòu)中的深層關(guān)聯(lián)特征,揭示隱含的欺詐風(fēng)險(xiǎn)。本方案主要采用的圖關(guān)系挖掘方法見表2。
(1)資金交易閉環(huán)分析
找出資金從某一賬戶轉(zhuǎn)出,與其他賬戶交易后又轉(zhuǎn)入原始賬戶的交易閉環(huán),有利于排查虛假交易、洗錢等風(fēng)險(xiǎn)行為。賬戶交易圖譜是有向圖,可采用Tarjan算法識(shí)別交易網(wǎng)絡(luò)中的強(qiáng)連通圖,即圖中任意兩個(gè)頂點(diǎn)可以互相通達(dá),從而挖掘出閉環(huán)交易。Tarjan算法基于深度優(yōu)先搜索進(jìn)行節(jié)點(diǎn)訪問,定義dfn[u]為深度優(yōu)先搜索時(shí)節(jié)點(diǎn)u的時(shí)間戳(即次序編號(hào)),low[u]為u或u的子樹能夠追溯到的最早的棧中節(jié)點(diǎn)的序號(hào)[15]。對(duì)于當(dāng)前節(jié)點(diǎn)u和關(guān)聯(lián)節(jié)點(diǎn)v:若(u,v)為搜索邊,low[u]=min{low[u],low[v]};若(u,v)為回邊,low[u]=min{low[u],dfn[v]}。最終選取low[u]=dfn[u]時(shí),該節(jié)點(diǎn)往上的所有節(jié)點(diǎn)構(gòu)成的強(qiáng)聯(lián)通分量。
表2 圖關(guān)系挖掘方法
(2)賬戶關(guān)聯(lián)強(qiáng)度分析
將兩個(gè)賬戶之間的交易路徑長(zhǎng)度、交易時(shí)間、交易金額、交易次數(shù)等多個(gè)維度綜合起來進(jìn)行評(píng)估,挖掘出有直接或間接交易關(guān)系的賬戶之間的緊密程度。對(duì)于一條交易路徑,如圖4所示,A1、A2兩個(gè)賬戶之間并無直接交易,但通過賬戶B2、B3建立起間接的交易關(guān)系。
圖4 交易路徑示例
用λ表示兩個(gè)直接交易賬戶之間的交易權(quán)重,λi為資金從賬戶A1到A2的整個(gè)交易鏈路中第i段交易的權(quán)重:
其中,Ti表示第i段交易中兩個(gè)賬戶在特定時(shí)間內(nèi)的時(shí)間切片個(gè)數(shù),dt表示第t個(gè)時(shí)間切片,N表示交易次數(shù),M表示交易金額。這里交易權(quán)重主要由單位時(shí)間段的交易次數(shù)以及單次交易的金額這兩個(gè)因素決定。整個(gè)交易鏈條中A1和A2的關(guān)聯(lián)強(qiáng)度R為各段交易權(quán)重的平均值
(3)賬戶分層穿透匹配
分層穿透是指通過層層追溯,找到最終的間接利益關(guān)聯(lián)方[16]。此處主要是對(duì)資金在轉(zhuǎn)出初始賬戶后的交易路徑進(jìn)行層層追蹤,找到資金的最終流向,能有效挖掘出多層復(fù)雜場(chǎng)景下資金通過中間賬戶轉(zhuǎn)移到非法賬戶的風(fēng)險(xiǎn)。推理示例如下:
其中,a、b表示兩個(gè)節(jié)點(diǎn),edge表示存在邊關(guān)系,path表示存在關(guān)聯(lián)路徑,箭頭表示關(guān)系及路徑的方向。
(4)資金轉(zhuǎn)移模式匹配
資金轉(zhuǎn)移模式匹配主要用來判斷“分散轉(zhuǎn)入、集中轉(zhuǎn)出”以及“分散轉(zhuǎn)出、集中轉(zhuǎn)入”這兩種可疑的賬戶交易模式,前者通常隱含非法集資的風(fēng)險(xiǎn),后者則具有典型的洗錢特征。為了更加精準(zhǔn)地評(píng)估某一資金轉(zhuǎn)移與風(fēng)險(xiǎn)交易模式的匹配程度,將賬戶交易的網(wǎng)絡(luò)圖譜轉(zhuǎn)換為賬戶余額隨時(shí)間變化的交易波形圖,用波形的相似程度表示賬戶交易模式的相似程度,從而定量評(píng)估資金轉(zhuǎn)移模式是否具有較高的風(fēng)險(xiǎn)特征。
在波形相似度的衡量上,相關(guān)系數(shù)一般用來衡量波形總體相似程度,容易忽視局部特征的差異[17]。本文在計(jì)算波形相關(guān)系數(shù)的基礎(chǔ)上,選取波形的主波峰值、主波起始點(diǎn)至頂峰的時(shí)間這兩個(gè)主要的波形局部特征,將兩者結(jié)合起來,得到最終相似度,其計(jì)算式為:
其中,W為基礎(chǔ)波形,P為對(duì)比波形,Wt、Pt分別表示在t時(shí)刻兩個(gè)賬戶的金額;分別表示兩個(gè)賬戶在該時(shí)間段內(nèi)的平均金額;H表示主波峰值;T表示主波起始點(diǎn)至頂峰的時(shí)間;β表示權(quán)重。
在實(shí)驗(yàn)中,將實(shí)際金融活動(dòng)中真實(shí)發(fā)生的15起會(huì)計(jì)風(fēng)險(xiǎn)案件作為規(guī)則設(shè)計(jì)的參考藍(lán)本,基于行業(yè)經(jīng)驗(yàn)知識(shí)從中提煉出可疑風(fēng)險(xiǎn)規(guī)則,并對(duì)規(guī)則進(jìn)行拆解,形成基礎(chǔ)指標(biāo)庫(kù),作為賬戶的基礎(chǔ)特征;選取某銀行2019年6月至2020年1月的所有活躍賬戶數(shù)2 900萬個(gè),將其中有歷史管控和確認(rèn)欺詐的賬戶作為欺詐樣本,共6 571個(gè),將賬戶交易情況、企業(yè)及個(gè)人基本信息等作為數(shù)據(jù)基礎(chǔ),構(gòu)建賬戶交易知識(shí)圖譜,提取出賬戶的關(guān)聯(lián)風(fēng)險(xiǎn)特征。
與會(huì)計(jì)案防相關(guān)的完整的指標(biāo)體系涉及的內(nèi)容廣泛。從指標(biāo)對(duì)象來說,涵蓋了客戶、賬戶、交易、員工、營(yíng)業(yè)機(jī)構(gòu)等不同層面的主體,如客戶注冊(cè)地、賬戶開戶地址、是否人工驗(yàn)印、員工操作筆數(shù)、機(jī)構(gòu)開戶數(shù)量等。從指標(biāo)加工的技術(shù)來說,涵蓋了基礎(chǔ)指標(biāo)、統(tǒng)計(jì)指標(biāo)等,基礎(chǔ)指標(biāo)是指客戶或賬戶的基本屬性,統(tǒng)計(jì)指標(biāo)是指經(jīng)數(shù)據(jù)運(yùn)算后的指標(biāo)。表3展示了一些業(yè)務(wù)規(guī)則指標(biāo),將這些指標(biāo)作為賬戶的基礎(chǔ)特征。
本文圖網(wǎng)絡(luò)結(jié)構(gòu)標(biāo)識(shí)的實(shí)體主要包含兩類,一類是賬戶實(shí)體,包含企業(yè)、個(gè)人開立的可發(fā)生資金交易行為的銀行賬戶;另一類是非賬戶實(shí)體,如經(jīng)營(yíng)機(jī)構(gòu)、操作設(shè)備等。對(duì)應(yīng)的實(shí)體之間的關(guān)系也主要分為兩類,一是賬戶與賬戶之間,主要是交易關(guān)系,由是否有資金往來確定,若發(fā)生過轉(zhuǎn)賬、支付等交易行為,則有交易關(guān)系;二是賬戶與非賬戶之間,具體關(guān)系需要根據(jù)非賬戶實(shí)體確定,如賬戶與經(jīng)營(yíng)機(jī)構(gòu)之間是開戶關(guān)系,賬戶與操作設(shè)備之間是使用關(guān)系。在本文賬戶關(guān)聯(lián)圖譜中,實(shí)體用節(jié)點(diǎn)表示,關(guān)系用邊表示,其中交易關(guān)系具有箭頭和粗細(xì)區(qū)分,邊的箭頭由轉(zhuǎn)出賬戶指向轉(zhuǎn)入賬戶,邊的粗細(xì)則主要由交易金額決定;而對(duì)于賬戶與非賬戶之間,未涉及資金流向,其關(guān)系大多是固定的,也是可逆的,如某一賬戶和開戶證件號(hào),可以從賬戶關(guān)聯(lián)到證件號(hào),也可以從證件號(hào)關(guān)聯(lián)到賬戶,可逆關(guān)系無須箭頭和粗細(xì)的區(qū)分[18]。對(duì)于與其他實(shí)體無任何關(guān)聯(lián)的孤立實(shí)體節(jié)點(diǎn),其表示該賬戶無資金交易行為,也無任何基本信息關(guān)聯(lián),將該孤立節(jié)點(diǎn)刪除。最終構(gòu)建形成的金融知識(shí)圖譜由諸多非連通的子圖組成,各個(gè)子圖之間未構(gòu)成關(guān)聯(lián),子圖內(nèi)部的賬戶之間以多種方式進(jìn)行連接。知識(shí)圖譜中涉及的主要實(shí)體及關(guān)系類型見表4。
表3 業(yè)務(wù)規(guī)則指標(biāo)示例
圖5為賬戶交易知識(shí)圖譜的子圖示例。以子圖1為例,A1~A5代表資金賬戶實(shí)體,A1賬戶的資金主要流向A2、A3、A4 3個(gè)賬戶,其中A1→A2的資金交易量最大,連線邊也相應(yīng)較粗,A1→A3的資金交易量最小,連線邊則較細(xì);IP地址、證件等為非賬戶實(shí)體。從圖5可知,賬戶A2、A3、A5關(guān)聯(lián)同一個(gè)證件號(hào)碼,非賬戶實(shí)體與賬戶實(shí)體之間無交易行為,故連接邊為無箭頭的實(shí)線。
4.2.1 淺層關(guān)聯(lián)特征
淺層關(guān)聯(lián)特征主要指可從圖結(jié)構(gòu)中直接查詢得到,無須進(jìn)一步加工計(jì)算的特征,也可以通過圖譜可視化直接讀取,如圖5中的子圖1,A4、A5賬戶對(duì)應(yīng)同一個(gè)對(duì)賬地址,當(dāng)多個(gè)非同名賬戶都對(duì)應(yīng)同一個(gè)對(duì)賬地址時(shí),則存在虛假開戶的風(fēng)險(xiǎn)。表5給出了淺層關(guān)聯(lián)特征示例。
4.2.2 深層關(guān)聯(lián)特征
與淺層關(guān)聯(lián)特征的獲取有所不同,深層關(guān)聯(lián)特征無法從圖結(jié)構(gòu)中直接獲取,需要基于圖計(jì)算等方式深入挖掘提取得到。
表4 知識(shí)圖譜實(shí)體與關(guān)系
圖5 賬戶交易知識(shí)圖譜的子圖示例
表5 淺層關(guān)聯(lián)特征示例
(1)資金交易閉環(huán)分析
如圖6所示,基于前述Tarjan算法挖掘強(qiáng)聯(lián)通分量,可以發(fā)現(xiàn)資金從賬戶A1轉(zhuǎn)出,經(jīng)過賬戶A2、A3、A5路徑,以及賬戶A2、A3、A4、A5路徑,回流至賬戶A1,形成兩條資金閉環(huán),提示存在洗錢或虛假交易等疑似欺詐的行為。
(2)賬戶關(guān)聯(lián)強(qiáng)度分析
當(dāng)兩個(gè)賬戶之間存在多條交易路徑時(shí),對(duì)不同交易路徑下的關(guān)聯(lián)強(qiáng)度進(jìn)行計(jì)算,選取最大值作為最終的關(guān)聯(lián)強(qiáng)度值。如圖7所示,A和B代表賬戶實(shí)體(為了進(jìn)一步區(qū)分,以A表示起始和終點(diǎn)賬戶,B表示中間賬戶);V表示非賬戶實(shí)體,與賬戶間無資金交易關(guān)系,也不影響賬戶關(guān)聯(lián)強(qiáng)度的計(jì)算。A1與A2之間存在兩條關(guān)聯(lián)路徑,分別是A1→B2→B3→A2,以及A1→B1→A2。計(jì)算兩條交易路徑下A1、A2的賬戶關(guān)聯(lián)強(qiáng)度,得到在較長(zhǎng)路徑下,兩者的關(guān)聯(lián)強(qiáng)度反而更大,有助于對(duì)可疑賬戶的高關(guān)聯(lián)賬戶及核心交易路徑進(jìn)行排查。
(3)賬戶分層穿透匹配
如圖8所示,對(duì)賬戶資金流向進(jìn)行層層穿透,可以發(fā)現(xiàn)賬戶A與賬戶D并無直接的資金交易,但經(jīng)過知識(shí)圖譜對(duì)交易層級(jí)的拓展,顯示賬戶A中的資金經(jīng)過B1到Bn,以及C1到Cn這兩條路徑,最終流向了賬戶D這類投資股票、房產(chǎn)的高風(fēng)險(xiǎn)賬戶,屬于違規(guī)使用信貸資金的行為。
(4)資金轉(zhuǎn)移模式匹配
如圖9所示,通過限定資金轉(zhuǎn)入轉(zhuǎn)出特點(diǎn),得到兩種交易模式圖,一種模式是分散轉(zhuǎn)入、集中轉(zhuǎn)出,賬戶X1、X2、X3、X4中的資金先后流向賬戶X中,呈現(xiàn)陸續(xù)分散轉(zhuǎn)入的現(xiàn)象,然后賬戶X再將資金集中轉(zhuǎn)出到賬戶Y中,這有非法集資的風(fēng)險(xiǎn);另一種模式是集中轉(zhuǎn)入、分散轉(zhuǎn)出,與前一種模式正好相反,資金先由賬戶X集中轉(zhuǎn)入賬戶Y中,然后再由賬戶Y陸續(xù)轉(zhuǎn)出到賬戶Y1、Y2、Y3、Y4等賬戶中,這有較嚴(yán)重的洗錢嫌疑。
進(jìn)一步分析不同賬戶的交易波形與欺詐樣本交易波形的相似程度。圖10表示“分散轉(zhuǎn)入、集中轉(zhuǎn)出”模式下某一欺詐賬戶的關(guān)聯(lián)交易模式,圖11為對(duì)應(yīng)的風(fēng)險(xiǎn)交易波形圖;波形一(如圖12所示)和波形二(如圖13所示)分別代表兩類賬戶的交易波形。根據(jù)前述計(jì)算方式,得到波形一、波形二與風(fēng)險(xiǎn)波形的相似度分別為0.423和0.825,表明波形二對(duì)應(yīng)的賬戶交易模式存在與風(fēng)險(xiǎn)波形類似的欺詐特點(diǎn),需要重點(diǎn)排查;波形一與風(fēng)險(xiǎn)波形的相似度較小,表明波形一對(duì)應(yīng)的賬戶交易模式屬于前述欺詐行為的可能性較小。
圖6 資金交易閉環(huán)示例
圖7 賬戶關(guān)聯(lián)強(qiáng)度分析
圖8 賬戶分層穿透
圖9 資金轉(zhuǎn)移模式
圖10 風(fēng)險(xiǎn)交易模式
圖11 風(fēng)險(xiǎn)交易波形
圖12 波形一
圖13 波形二
基于以上分析,本文進(jìn)一步提取出一些具有較高欺詐風(fēng)險(xiǎn)的深層關(guān)聯(lián)特征,見表6,這些深層關(guān)聯(lián)特征和淺層關(guān)聯(lián)特征一起形成了對(duì)賬戶基礎(chǔ)特征的有力補(bǔ)充。
將賬戶基礎(chǔ)特征與從知識(shí)圖譜中提取出的關(guān)聯(lián)風(fēng)險(xiǎn)特征相結(jié)合,搭建了較完整、豐富的風(fēng)險(xiǎn)指標(biāo)集。對(duì)每一指標(biāo)設(shè)置閾值,即相應(yīng)的單點(diǎn)規(guī)則;由于單點(diǎn)業(yè)務(wù)規(guī)則不足以解釋風(fēng)險(xiǎn)現(xiàn)象,需對(duì)其進(jìn)行靈活的搭配形成規(guī)則組合,并輔以指標(biāo)閾值的調(diào)整。最終構(gòu)建出會(huì)計(jì)案防領(lǐng)域反欺詐規(guī)則策略體系,該體系共涵蓋了249條單點(diǎn)規(guī)則,以及425條組合規(guī)則,圖14為規(guī)則配置的示例。
將以上規(guī)則策略集應(yīng)用于選定歷史時(shí)間段的2 900萬個(gè)銀行活躍賬戶,將其中有過歷史管控或確認(rèn)過欺詐的賬戶標(biāo)記為欺詐樣本,共6 751個(gè)。將該數(shù)據(jù)集分為兩組進(jìn)行對(duì)比試驗(yàn),一組采用賬戶基礎(chǔ)特征構(gòu)建的規(guī)則策略進(jìn)行欺詐識(shí)別,另一組采用融合網(wǎng)絡(luò)關(guān)聯(lián)特征后的規(guī)則策略,通過對(duì)比兩組策略的風(fēng)險(xiǎn)識(shí)別結(jié)果,驗(yàn)證知識(shí)圖譜應(yīng)用的效果,實(shí)驗(yàn)結(jié)果見表7。
策略1表示僅使用賬戶基礎(chǔ)特征規(guī)則進(jìn)行欺詐識(shí)別,策略2表示將賬戶基礎(chǔ)特征與關(guān)聯(lián)特征結(jié)合起來形成反欺詐策略。將樣本近乎平均地分配到兩組實(shí)驗(yàn)中,最終策略1篩選出2.1萬個(gè)疑似風(fēng)險(xiǎn)賬戶,其中確認(rèn)為欺詐的共4 230個(gè),確認(rèn)率為20.1%;策略2提示有風(fēng)險(xiǎn)賬戶數(shù)為4 067個(gè),其中屬于欺詐的有2 621個(gè),確認(rèn)率為64.4%;進(jìn)一步從策略2預(yù)警提示的風(fēng)險(xiǎn)賬戶中挑選出規(guī)則命中最多的前100個(gè)賬戶,其中85個(gè)被確認(rèn)為欺詐賬戶,頭部欺詐確認(rèn)率達(dá)到85%。實(shí)驗(yàn)結(jié)果表明,融合了知識(shí)圖譜關(guān)聯(lián)特征后的規(guī)則策略能夠顯著提升會(huì)計(jì)案防欺詐識(shí)別的準(zhǔn)確性,縮小異常賬戶核查的范圍,使風(fēng)險(xiǎn)管理措施集中到最可疑的賬戶中,從而提升會(huì)計(jì)案防工作的質(zhì)效。
表6 深層關(guān)聯(lián)特征示例
本文將會(huì)計(jì)案防領(lǐng)域的行業(yè)知識(shí)與金融知識(shí)圖譜技術(shù)相結(jié)合,構(gòu)建了基于圖譜關(guān)聯(lián)特征的智能化反欺詐策略方案。在實(shí)驗(yàn)中,以行業(yè)真實(shí)會(huì)計(jì)風(fēng)險(xiǎn)案件和銀行內(nèi)部賬戶數(shù)據(jù)為分析基礎(chǔ),對(duì)欺詐經(jīng)驗(yàn)規(guī)則進(jìn)行指標(biāo)化拆解、加工,形成反欺詐基礎(chǔ)規(guī)則指標(biāo)庫(kù);采用圖可視化分析、知識(shí)推理、圖計(jì)算等知識(shí)圖譜技術(shù),對(duì)基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)、賬戶資金流向、資金交易閉環(huán)、賬戶關(guān)聯(lián)強(qiáng)度等進(jìn)行深度挖掘,提取出關(guān)聯(lián)風(fēng)險(xiǎn)特征,最終形成了豐富、靈活的會(huì)計(jì)案防智能化反欺詐規(guī)則策略體系,共包含了249條單點(diǎn)規(guī)則,以及425條組合規(guī)則。將智能化反欺詐規(guī)則策略用于銀行內(nèi)部賬戶的風(fēng)險(xiǎn)核查,挑選其中疑似欺詐程度較高的賬戶進(jìn)一步人工核驗(yàn),最終欺詐確認(rèn)率高達(dá)85%,這充分表明了智能化反欺詐策略在風(fēng)險(xiǎn)識(shí)別上的精確性,能顯著提升會(huì)計(jì)案防工作效率,增強(qiáng)銀行的風(fēng)險(xiǎn)管理能力,也有助于維護(hù)金融系統(tǒng)的穩(wěn)定性。
圖14 規(guī)則配置示例
未來智能化反欺詐策略中將融入更多的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等AI算法,將算法模型的分析預(yù)測(cè)結(jié)果進(jìn)一步納入規(guī)則集中,使反欺詐策略體系更加完善與精細(xì);也將依托大數(shù)據(jù)相關(guān)技術(shù)搭建智能化會(huì)計(jì)案防平臺(tái),以平臺(tái)化運(yùn)作的方式實(shí)現(xiàn)規(guī)則策略的自動(dòng)化加工計(jì)算、組合配置及提示預(yù)警,最終在真實(shí)會(huì)計(jì)案防場(chǎng)景中高效運(yùn)行,助力銀行風(fēng)險(xiǎn)管理的數(shù)字化、智能化轉(zhuǎn)型升級(jí)。
表7 實(shí)驗(yàn)效果對(duì)比