石強(qiáng)
摘 要:本文對(duì)互聯(lián)網(wǎng)金融反欺詐系統(tǒng)中的欺詐用戶和正常用戶的手機(jī)號(hào)數(shù)據(jù)進(jìn)行研究,針對(duì)手機(jī)號(hào)的號(hào)段、歸屬的電信運(yùn)營(yíng)商、省份城市等地域信息展開分析,同時(shí)還詳細(xì)分析了手機(jī)號(hào)對(duì)應(yīng)的手機(jī)設(shè)備上一次插卡的電信運(yùn)營(yíng)商為海外運(yùn)營(yíng)商的特性,將欺詐用戶的畫像更精細(xì)地呈現(xiàn)出來(lái),對(duì)互聯(lián)網(wǎng)反欺詐系統(tǒng)和技術(shù)的優(yōu)化升級(jí)具有較強(qiáng)的實(shí)際應(yīng)用價(jià)值。
關(guān)鍵詞: 反欺詐;特征;電信運(yùn)營(yíng)商;地域
文章編號(hào): 2095-2163(2019)03-0256-04 中圖分類號(hào): TP311.52 文獻(xiàn)標(biāo)志碼: A
0 引 言
近年來(lái),隨著互聯(lián)網(wǎng)金融網(wǎng)絡(luò)借貸的普及和發(fā)展,對(duì)于反欺詐作為風(fēng)控的核心關(guān)鍵問(wèn)題的研究也越來(lái)越深入?;ヂ?lián)網(wǎng)金融中的網(wǎng)絡(luò)借貸由于借款人來(lái)自線上,風(fēng)險(xiǎn)系數(shù)極高,而且目前各借貸平臺(tái)的信息互不共享,借款人的違法騙貸成本極低,故借款人故意欺詐騙貸的概率很高[1]。一旦通過(guò)了欺詐用戶的借款,那么該筆借款的不良逾期風(fēng)險(xiǎn)極高,還款意愿也極低。目前,借款用戶的手機(jī)號(hào)信息作為用戶信息的主要屬性[2],是技術(shù)化防范金融欺詐的重要依據(jù),對(duì)借款用戶的手機(jī)號(hào)進(jìn)行分析,可以發(fā)現(xiàn)欺詐的地域等特性,設(shè)置相關(guān)手機(jī)號(hào)黑名單或者風(fēng)險(xiǎn)概率,有助于業(yè)務(wù)的反欺詐。
本文依據(jù)大量已經(jīng)確定為欺詐的用戶和正常用戶的手機(jī)號(hào)數(shù)據(jù),對(duì)手機(jī)號(hào)的附屬信息,比如地域、運(yùn)營(yíng)商等進(jìn)行詳細(xì)分析,將欺詐的畫像予以更加精細(xì)的呈現(xiàn),依據(jù)結(jié)果和結(jié)論,可以形成一些防范欺詐的手機(jī)號(hào)規(guī)則引擎[3]或者反欺詐模型[4-6],對(duì)行業(yè)的反欺詐應(yīng)用具有重大的實(shí)際價(jià)值。
1 數(shù)據(jù)處理與特征分析
綜合多種借貸產(chǎn)品的用戶數(shù)據(jù),通過(guò)歷史的反欺詐識(shí)別和風(fēng)控驗(yàn)證,獲得了數(shù)十萬(wàn)的欺詐用戶和兩百萬(wàn)左右的普通用戶的手機(jī)號(hào)數(shù)據(jù),對(duì)于每個(gè)手機(jī)號(hào)可以提煉出以下特征:欺詐用戶或正常用戶、手機(jī)號(hào)前2位、手機(jī)號(hào)前3位、手機(jī)號(hào)歸屬的電信運(yùn)營(yíng)商、手機(jī)號(hào)歸屬的省份、手機(jī)號(hào)歸屬的城市、手機(jī)號(hào)所屬手機(jī)上一次插卡是否為海外電信運(yùn)營(yíng)商以及運(yùn)營(yíng)商名稱等。對(duì)各特征、變量或指標(biāo)進(jìn)行單維度或組合維度的分析,可以發(fā)現(xiàn)一些欺詐用戶具有的明顯特性,同時(shí)可以了解目前用戶數(shù)據(jù)情況并確定該特征是否明顯不適合應(yīng)用于反作弊模型。
1.1 手機(jī)號(hào)前2位或前3位的分析
通過(guò)對(duì)手機(jī)號(hào)前2位的分析,可得分析后結(jié)果如圖1所示。由圖1可以發(fā)現(xiàn),17號(hào)段中的欺詐用戶占比明顯較高,欺詐用戶占比為52.3%,正常用戶占比48.7%,17號(hào)段明顯較其它3個(gè)號(hào)段表現(xiàn)異常。18號(hào)段的欺詐用戶占比很少,幾乎可忽略。13號(hào)段和15號(hào)段均存在兩、至三成的欺詐用戶。同時(shí),研究得出了正常用戶和欺詐用戶中不同手機(jī)號(hào)前2位的占比如圖2所示。由圖2中可以看到,從欺詐用戶維度的號(hào)段分布看,大部分欺詐用戶集中在13和17號(hào)段,對(duì)于正常用戶的號(hào)段分布,除了欺詐用戶占比很高的17號(hào)段,正常用戶基本均勻分布在其他三個(gè)號(hào)段,正常用戶分布在13、15、18號(hào)段上的占比均在30%左右。
手機(jī)號(hào)前3位的正常用戶和欺詐用戶數(shù)量如圖3、圖4所示。由圖3和圖4可以發(fā)現(xiàn)手機(jī)號(hào)前3位構(gòu)成的號(hào)段的欺詐屬性可以分為4種檔次,比如第一檔位為高風(fēng)險(xiǎn)檔,主要是170和171號(hào)段,該號(hào)段的欺詐用戶占比極高,170號(hào)段不僅欺詐用戶占比達(dá)87.2%,同時(shí)170號(hào)段的用戶絕對(duì)數(shù)量在所有號(hào)段里面也排第一,但171號(hào)段的用戶絕對(duì)數(shù)量較小。第二檔為中風(fēng)險(xiǎn)檔,包括130、131和132三個(gè)號(hào)段,其中的欺詐用戶占比近五成,而且用戶絕對(duì)數(shù)量也很大,絕對(duì)數(shù)量位于TOP4內(nèi)。第三檔為低風(fēng)險(xiǎn)檔,主要是155和156號(hào)段,欺詐用戶占比近3成。第四檔為無(wú)風(fēng)險(xiǎn)檔,由其他所有號(hào)段構(gòu)成。
1.2 手機(jī)號(hào)歸屬的省份、城市、運(yùn)營(yíng)商
研究可知,欺詐用戶的絕對(duì)數(shù)量較多的省份依次是:廣東、浙江、廣西、山東、四川。欺詐用戶占比較高,且絕對(duì)數(shù)量在一定的可信閾值之上的有:廣西(49%)、浙江(38%)、廣東(34%)、上海和四川(均在25%左右)。欺詐用戶的絕對(duì)數(shù)量較多的城市依次是:深圳、南寧、成都、廣州等,這些城市的欺詐用戶占比在40%~60%區(qū)間。
對(duì)于全體手機(jī)號(hào)集合,不同電信運(yùn)營(yíng)商中的欺詐用戶占比如圖5所示。由圖5中可以發(fā)現(xiàn)中國(guó)電信和中國(guó)移動(dòng)中的欺詐用戶占比較低,中國(guó)聯(lián)通的欺詐用戶占比最高,達(dá)35.1%。從運(yùn)營(yíng)商角度向地域維度看,中國(guó)聯(lián)通的浙江、廣西、廣東和上海的欺詐用戶絕對(duì)數(shù)量最多,并且明顯多于其它省份,廣西南寧、浙江臺(tái)州和廣東深圳是中國(guó)聯(lián)通中欺詐用戶絕對(duì)數(shù)量排前三的城市。中國(guó)移動(dòng)中,廣東省的欺詐用戶絕對(duì)數(shù)量最多,并且遠(yuǎn)遠(yuǎn)多于其它省份,廣東省的深圳城市的欺詐用戶數(shù)量最多。
從省份區(qū)域維度看運(yùn)營(yíng)商,廣西省和浙江省的中國(guó)聯(lián)通的欺詐用戶占比均在60%以上,廣東省的中國(guó)聯(lián)通的欺詐用戶占比也達(dá)30%,比較高。在數(shù)量置信的條件下,廣東、北京和四川的中國(guó)移動(dòng)的欺詐用戶占比在30%左右,是中國(guó)移動(dòng)在全國(guó)省份范圍內(nèi)欺詐用戶占比最高的省份。城市角度,北京在中國(guó)電信和中國(guó)聯(lián)通中不含有欺詐用戶,而中國(guó)移動(dòng)的欺詐用戶占比在26%左右。但是上海卻在中國(guó)電信和中國(guó)移動(dòng)中不含有欺詐用戶,而在中國(guó)聯(lián)通中的欺詐用戶占比一半。武漢的三大運(yùn)營(yíng)商中均不存在欺詐用戶,說(shuō)明按照城市維度,各城市的情況具有多樣性,對(duì)于識(shí)別欺詐用戶可以抽取細(xì)分的維度和規(guī)則去考慮。
1.3 手機(jī)設(shè)備上一次插卡為海外電信運(yùn)營(yíng)商的手機(jī)號(hào)數(shù)據(jù)分析
首先從欺詐的角度總體統(tǒng)計(jì),對(duì)于目前手機(jī)號(hào)所屬手機(jī)設(shè)備上一次插卡為海外電信運(yùn)營(yíng)商的,其中欺詐用戶占比51.5%,正常用戶占比48.5%,雖然在本集合中,欺詐用戶占比與正常用戶的占比相差不大,但是在產(chǎn)品全體手機(jī)號(hào)數(shù)據(jù)集合中,確定的欺詐用戶占比不到26%,也就是說(shuō)目前手機(jī)號(hào)所屬手機(jī)上一次插卡為海外電信運(yùn)營(yíng)商的風(fēng)險(xiǎn)明顯偏高,可能是欺詐集團(tuán)統(tǒng)一從海外收購(gòu)了大批量手機(jī)來(lái)參與欺詐運(yùn)作,本特征可以作為一個(gè)欺詐的高概率性特征。
目前,所屬手機(jī)上一次插卡為海外電信運(yùn)營(yíng)商的手機(jī)號(hào)都會(huì)歸屬不同的電信運(yùn)營(yíng)商,對(duì)于本集合手機(jī)號(hào),中國(guó)電信、中國(guó)聯(lián)通、中國(guó)移動(dòng)中欺詐用戶占比分別為56%、73%、27%;本集合手機(jī)號(hào)絕對(duì)數(shù)量方面,中國(guó)聯(lián)通的數(shù)量也最多,與中國(guó)電信和中國(guó)移動(dòng)的數(shù)量之和相當(dāng)。可以發(fā)現(xiàn)本集合的手機(jī)在轉(zhuǎn)入國(guó)內(nèi)使用時(shí),欺詐用戶會(huì)優(yōu)先使用中國(guó)聯(lián)通。同時(shí),從圖6中可以看到本集合中的欺詐用戶手機(jī)號(hào)分散在聯(lián)通的各號(hào)段,并不僅是在其中的170或171虛擬運(yùn)營(yíng)商號(hào)段,且分布比例相對(duì)均勻,無(wú)明顯的異常占比的特例。對(duì)于本集合中的手機(jī)號(hào)歸屬中國(guó)電信的,欺詐用戶也是均勻分布在電信各號(hào)段,但是對(duì)于歸屬于中國(guó)移動(dòng)的,欺詐用戶集中在170號(hào)段(中國(guó)移動(dòng)僅在170號(hào)段有虛擬運(yùn)營(yíng)商),所有欺詐用戶的40%出現(xiàn)在170號(hào)段,同時(shí)170號(hào)段中正常用戶僅占比10.5%,其它中國(guó)移動(dòng)號(hào)段中正常用戶占比都在80%左右。
正常用戶和欺詐用戶的目前手機(jī)號(hào)所屬手機(jī)上一次插卡為海外電信運(yùn)營(yíng)商的數(shù)量比較結(jié)果如圖7所示。從圖7可以看到,目前手機(jī)號(hào)所屬手機(jī)上一次插卡為海外電信運(yùn)營(yíng)商的前五大運(yùn)營(yíng)商中,只有KDDI中的欺詐用戶比例較少,僅占26.1%,其它的海外電信運(yùn)營(yíng)商中均是欺詐用戶較多。關(guān)于所屬手機(jī)上一次插卡為海外電信運(yùn)營(yíng)商的手機(jī)號(hào)目前的省份和城市分布,欺詐用戶的絕對(duì)數(shù)量較多的省份依次是:廣西、廣東、浙江、山東、上海。欺詐用戶占比較高,大于60%(且絕對(duì)數(shù)量在一定的可信閾值之上)的有:廣西(71%)、浙江(66%)、上海(80%)。欺詐用戶的絕對(duì)數(shù)量較多的城市依次是:南寧、上海、東莞、北京,這些城市的欺詐用戶占比均在80%左右。
如前文所述,通過(guò)對(duì)用戶手機(jī)號(hào)數(shù)據(jù)的深入分析可以發(fā)現(xiàn)虛擬運(yùn)營(yíng)商等存在欺詐用戶的可能性很高,特別是170和171號(hào)段,可以作為判斷為欺詐用戶的高概率特征。更深入地,比如中國(guó)聯(lián)通的浙江、廣西、廣東和上海等較多區(qū)域欺詐風(fēng)險(xiǎn)較高,中國(guó)移動(dòng)的少數(shù)區(qū)域存在欺詐風(fēng)險(xiǎn),且概率不高。所屬手機(jī)設(shè)備上一次插卡為海外電信運(yùn)營(yíng)商的欺詐特性更為明顯,手機(jī)設(shè)備大多來(lái)自距離中國(guó)較近的日本(軟銀運(yùn)營(yíng)商),手機(jī)設(shè)備在轉(zhuǎn)入國(guó)內(nèi)使用時(shí),欺詐用戶會(huì)優(yōu)先使用中國(guó)聯(lián)通,特別是其虛擬運(yùn)營(yíng)商號(hào)段。此外,還可以發(fā)現(xiàn)一些基本不反映欺詐的維度或變量,比如188號(hào)段、中國(guó)電信運(yùn)營(yíng)商等,這些維度在識(shí)別欺詐用戶時(shí)可以建議不予考慮,避免冗余影響。
2 結(jié)束語(yǔ)
本文研究了互聯(lián)網(wǎng)金融反欺詐系統(tǒng)中的欺詐用戶和正常用戶的手機(jī)號(hào)數(shù)據(jù),對(duì)手機(jī)號(hào)的附屬信息,比如地域、運(yùn)營(yíng)商等進(jìn)行詳細(xì)分析,同時(shí)還詳細(xì)研究了手機(jī)號(hào)對(duì)應(yīng)的手機(jī)設(shè)備上一次插卡的電信運(yùn)營(yíng)商為海外運(yùn)營(yíng)商的特性,將欺詐的畫像做出更加精細(xì)的描繪,依據(jù)結(jié)果和高風(fēng)險(xiǎn)維度結(jié)論,可以建立黑名單,可以形成一些防范欺詐的手機(jī)號(hào)規(guī)則引擎或者反欺詐模型,對(duì)互聯(lián)網(wǎng)金融的反欺詐應(yīng)用和優(yōu)化具有很大的實(shí)際價(jià)值。
參考文獻(xiàn)
[1]薛又軒. 大數(shù)據(jù)應(yīng)用在互聯(lián)網(wǎng)金融借貸行業(yè)的實(shí)踐與探索[J]. 銀行家, 2016 (5) :119-121.
[2] 劉揚(yáng), 姬建華. 大數(shù)據(jù)在傳統(tǒng)貸款風(fēng)控中的應(yīng)用 [J]. 科技傳播, 2018, 1(3): 119-120,168.
[3] 丁濛濛. 基于規(guī)則引擎的互聯(lián)網(wǎng)金融反欺詐研究[J]. 電腦知識(shí)與技術(shù), 2018, 14(1): 1-3.
[4] 李赟妮. 神經(jīng)網(wǎng)絡(luò)模型在銀行互聯(lián)網(wǎng)金融反欺詐中的應(yīng)用探索[J]. 金融科技時(shí)代, 2018, 1(8) : 24-28.
[5] 竇路路, 石秀金. 基于深度學(xué)習(xí)的銀行卡交易反欺詐技術(shù)研究[J]. 智能計(jì)算機(jī)與應(yīng)用, 2018, 8 (4): 85-87,91.
[6]? 仵偉強(qiáng), 后其林. 基于機(jī)器學(xué)習(xí)模型的消費(fèi)金融反欺詐模型與方法[J]. 現(xiàn)代管理科學(xué), 2018, 1(10): 51-54.