• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      通信詐騙預(yù)警模型設(shè)計(jì)研究

      2023-11-22 10:28:32馬云海
      江蘇通信 2023年5期
      關(guān)鍵詞:話單話務(wù)反詐

      馬云海

      中國(guó)電信股份有限公司連云港分公司

      0 引言

      近年來(lái)通信詐騙日益泛濫,社會(huì)危害性越來(lái)越大。隨著通信技術(shù)的發(fā)展,數(shù)據(jù)源種類越來(lái)越多,因此而產(chǎn)生的數(shù)據(jù)量呈現(xiàn)指數(shù)級(jí)增加,這也進(jìn)一步加大了反詐工作中詐騙數(shù)據(jù)分析的難度。根據(jù)目前的通信詐騙現(xiàn)狀,國(guó)內(nèi)外學(xué)者進(jìn)行了廣泛的探索,傳統(tǒng)的治理方式主要是結(jié)合已知詐騙號(hào)碼情況對(duì)電話號(hào)碼的結(jié)構(gòu)分析,從而對(duì)疑似號(hào)碼進(jìn)行攔截。也有部分學(xué)者開(kāi)始基于大數(shù)據(jù)挖掘技術(shù)分析詐騙違法行為號(hào)碼,嘗試提前預(yù)測(cè)詐騙行為,并取得了一定的進(jìn)展。對(duì)于我國(guó)的運(yùn)營(yíng)商而言,傳統(tǒng)的防詐技術(shù)很難滿足他們要在很短時(shí)間內(nèi)分析海量數(shù)據(jù)、識(shí)別詐騙號(hào)碼,同時(shí)還要盡可能地減少對(duì)用戶正常通信干擾的需求。本文提出的是一種基于大數(shù)據(jù)挖掘技術(shù)的通信反詐分析模型。該技術(shù)能夠?qū)崿F(xiàn)對(duì)通話情況提取疑似號(hào)碼的話務(wù)特征,利用大數(shù)據(jù)分析挖掘模型快速研判和處置并進(jìn)行有效分析,從而在較短時(shí)間內(nèi)實(shí)現(xiàn)詐騙號(hào)碼的確認(rèn)并進(jìn)行攔截,最終有效防止通信詐騙的發(fā)生。從某種意義上來(lái)講,該模型填補(bǔ)了現(xiàn)有電信攔截技術(shù)的短板,為以后有效防范通信詐騙提供了新的思路。

      1 相關(guān)理論與技術(shù)

      1.1 傳統(tǒng)分類模型

      從判斷通信詐騙的方法上,決策樹(shù)模型和樸素貝葉斯模型這兩類傳統(tǒng)的分類模型有著較為廣泛的使用,但是傳統(tǒng)模型的使用前提是要有獨(dú)立屬性的假定樣本,這和實(shí)際情況嚴(yán)重脫節(jié),所以通過(guò)這些模型得出的結(jié)論較難復(fù)制到實(shí)際生產(chǎn)中。新出現(xiàn)的支持向量機(jī)(SVM:Support Vector Machine)是一種常見(jiàn)的監(jiān)督核學(xué)習(xí)(kernel learning)方法,SVM 可以在使用較少的抽樣數(shù)據(jù)的情況下,通過(guò)非線性分類方法將經(jīng)驗(yàn)風(fēng)險(xiǎn)降到最低,并且能歸納出較好的統(tǒng)計(jì)規(guī)律。能夠避開(kāi)高維度空間是SVM 方法的一個(gè)最大的優(yōu)點(diǎn),借助空間內(nèi)核函數(shù)可以將線性不可分的情況進(jìn)一步轉(zhuǎn)化成線性可分問(wèn)題,然后再通過(guò)對(duì)線性可分問(wèn)題的解決方案,解決相應(yīng)的高維空間難題。使用SVM 對(duì)潛在的通訊詐騙號(hào)碼進(jìn)行檢測(cè),如果選取的號(hào)碼話務(wù)特征僅包含呼叫次數(shù)和呼叫時(shí)長(zhǎng),那么就很難全面的提煉出疑似詐騙號(hào)碼的特征。如果相關(guān)的測(cè)試驗(yàn)證不結(jié)合實(shí)際數(shù)據(jù),就算能夠取得很高的命中率也只是針對(duì)于測(cè)試數(shù)據(jù),很難進(jìn)行實(shí)際應(yīng)用。

      1.2 熵值法

      (1)算法簡(jiǎn)介

      熵值法是一種客觀賦權(quán)法。其根據(jù)各項(xiàng)指標(biāo)觀測(cè)值所提供的信息大小來(lái)確定指標(biāo)權(quán)重。在信息論中,熵和不確定性是一個(gè)正比關(guān)系,與信息量成反比。熵值可以用來(lái)判斷某個(gè)指標(biāo)的離散程度,離散程度越大,那么它對(duì)結(jié)果的影響也越大。因此,信息熵可以在建模中用來(lái)為多指標(biāo)計(jì)算權(quán)重,選擇出那些對(duì)判定影響大的變量。

      (2)熵值法的優(yōu)缺點(diǎn)

      熵值法是一種客觀的賦權(quán)法,是根據(jù)各種指標(biāo)的指標(biāo)值變化程度來(lái)確定相關(guān)指標(biāo)的權(quán)數(shù),它可以避免人為因素帶來(lái)的主觀偏差,但是這種方式忽略了指標(biāo)本身的重要程度,而且熵值法也不能減少評(píng)價(jià)指標(biāo)的維度數(shù)。

      2 通信詐騙預(yù)警建模需求分析

      2.1 本地網(wǎng)防詐現(xiàn)狀

      本地網(wǎng)詐騙攔截工作起始于2017 年,當(dāng)時(shí)公安部下發(fā)的重點(diǎn)監(jiān)控區(qū)域有9 個(gè)地市,要求重點(diǎn)監(jiān)控漫游到以上地區(qū)的用戶呼叫情況。但是通信詐騙的勢(shì)頭并沒(méi)有被遏制住,反而愈演愈烈。因此國(guó)家十三部委聯(lián)合下文整治詐騙號(hào)碼,并在全國(guó)開(kāi)展“斷卡行動(dòng)”。根據(jù)連云港市反詐中心每月通報(bào),連云港市涉詐號(hào)碼數(shù)量在全國(guó)排名較高,曾排名全國(guó)前20,被發(fā)黃牌。中國(guó)電信連云港分公司成立專班開(kāi)展通信詐騙的防范工作。

      2.2 預(yù)警詐騙號(hào)碼難點(diǎn)分析

      目前通信詐騙傳統(tǒng)的治理方法,主要是結(jié)合投訴數(shù)據(jù)對(duì)用戶號(hào)碼的結(jié)構(gòu)進(jìn)行簡(jiǎn)單分析,通過(guò)這種方法來(lái)確定是否是詐騙號(hào)碼,納入灰名單數(shù)據(jù)庫(kù),從而實(shí)現(xiàn)對(duì)疑似號(hào)碼進(jìn)行呼叫攔截。但是隨著詐騙分子不斷升級(jí)更新相關(guān)詐騙手段,通過(guò)對(duì)現(xiàn)有的案例進(jìn)行統(tǒng)計(jì)分析發(fā)現(xiàn),目前的反詐工作存在以下幾個(gè)難點(diǎn):(1)涉詐號(hào)碼均符合實(shí)名制管控的相關(guān)規(guī)范要求,日?;溯^難發(fā)現(xiàn);(2)號(hào)卡涉及買賣和非法收購(gòu);(3)通信詐騙具有跨區(qū)域性、隱蔽性、判定滯后性的特點(diǎn);(4)詐騙號(hào)碼的使用行為不斷升級(jí)更新。

      為了及時(shí)打擊涉詐犯罪分子,減少群眾財(cái)產(chǎn)損失,同時(shí)降低連云港手機(jī)號(hào)碼被舉報(bào)率,公司專班提出主動(dòng)追蹤挖掘詐騙號(hào)碼的需求和設(shè)想:精準(zhǔn)定位疑似號(hào)碼,及時(shí)封停高危號(hào)碼,便捷復(fù)機(jī)申訴通道,消除潛在高危號(hào)卡。

      3 通信詐騙預(yù)警系統(tǒng)總體架構(gòu)

      3.1 整體系統(tǒng)技術(shù)架構(gòu)

      通信詐騙預(yù)警系統(tǒng)主要包含詐騙號(hào)碼識(shí)別、號(hào)碼封停、申述復(fù)機(jī),沉默卡號(hào)處理和白名單等幾個(gè)模塊。系統(tǒng)根據(jù)話單數(shù)據(jù)中主叫異常特征及呼叫頻率來(lái)預(yù)判詐騙號(hào)碼,通過(guò)話務(wù)相似特征來(lái)辨別是否實(shí)施了通信詐騙,使用大數(shù)據(jù)挖掘技術(shù)對(duì)號(hào)碼的歷史通話記錄,辦理的套餐和裝機(jī)時(shí)間等資料進(jìn)行分析研判。目前反詐預(yù)警模型使用的主要是話務(wù)數(shù)據(jù)中的幾個(gè)變量,根據(jù)這幾個(gè)變量運(yùn)用大數(shù)據(jù)篩選,將異常號(hào)碼標(biāo)識(shí)為涉詐號(hào)碼。在話單數(shù)據(jù)、EDA 數(shù)據(jù)中提取疑似詐騙號(hào)碼的所有話務(wù)特征,根據(jù)熵值法和SVM 判斷是否為詐騙號(hào)碼。若判斷為詐騙號(hào)碼,則通過(guò)緊急停機(jī)流程進(jìn)行風(fēng)險(xiǎn)單停,限制號(hào)碼的呼叫功能,從而終止該號(hào)碼的詐騙行為。同時(shí)對(duì)該號(hào)碼同一身份證下的所有號(hào)碼進(jìn)行關(guān)聯(lián)停機(jī),并上報(bào)專班進(jìn)行多維度分析,對(duì)同批辦理的號(hào)碼進(jìn)行篩查,發(fā)現(xiàn)疑似號(hào)碼進(jìn)行相應(yīng)處置。

      3.2 詐騙號(hào)碼的判定模型設(shè)計(jì)

      3.2.1 現(xiàn)有詐騙卡號(hào)特征的大數(shù)據(jù)挖掘

      在通信詐騙預(yù)警模型建立之前,首先從公安機(jī)關(guān)提供的涉案號(hào)碼、用戶投訴的詐騙號(hào)碼以及反詐專班通報(bào)的數(shù)據(jù)中抽取樣本,分析他們的通話行為、裝機(jī)時(shí)間、受理渠道、套餐類型、年齡等特征,確定詐騙號(hào)碼特征判定規(guī)則。根據(jù)分析發(fā)現(xiàn):大部分詐騙電話的入網(wǎng)時(shí)間都較短;詐騙電話基本都是漫游到異地;受理渠道一般是網(wǎng)上渠道;每次通話的時(shí)間較短、撥打的時(shí)間比較集中,被叫話單少、主叫話單多。根據(jù)以上的特征進(jìn)行建模,集中挖掘特定場(chǎng)景下的詐騙行為。

      3.2.2 詐騙電話特征探索

      采用熵值法,首先對(duì)選取的涉案用戶數(shù)據(jù)的卡號(hào)信息、受理信息、當(dāng)月通話情況、歷史通話情況進(jìn)行采集挖掘。采集數(shù)據(jù)如表1 所示。

      表1 數(shù)據(jù)采集

      建模變量需要選用區(qū)分能力強(qiáng)的變量,連續(xù)離散化可以顯著提升變量的區(qū)分能力。將詐騙號(hào)碼入網(wǎng)的時(shí)間、被叫區(qū)號(hào)離散度、主叫話單占比、被叫號(hào)碼離散度等變量根據(jù)熵值法進(jìn)行離散化的處理。然后對(duì)變量進(jìn)行劃分,選取其中總熵值最小的分裂點(diǎn)變量。

      抽取12321 公安偵辦下發(fā)的詐騙號(hào)碼對(duì)主叫話單被叫號(hào)碼離散度進(jìn)行分析,如圖1 所示,基本分布在80%到100%區(qū)間。

      圖1 被叫號(hào)碼離散度

      根據(jù)話務(wù)數(shù)據(jù)篩選,發(fā)現(xiàn)92%的詐騙用戶是在入網(wǎng)一個(gè)月內(nèi)就開(kāi)始實(shí)施詐騙,并且此類用戶很少接聽(tīng)電話,主叫話單占總話單數(shù)的90%以上,這些主叫話單的被叫號(hào)碼均為長(zhǎng)途號(hào)碼,且重復(fù)情況極低,主叫話單中被叫號(hào)碼的離散度大于85%。根據(jù)以往經(jīng)驗(yàn),將用戶的主叫話單占比和被叫號(hào)碼離散度這兩個(gè)變量收入建模變量。根據(jù)對(duì)詐騙號(hào)碼目標(biāo)判定影響大小排序,最后選出被叫區(qū)號(hào)離散度字段對(duì)目標(biāo)變量的判定有著較大影響,數(shù)據(jù)分析結(jié)論如表2 所示。

      表2 數(shù)據(jù)分析結(jié)論

      通過(guò)Python 篩選,主叫話單占比、長(zhǎng)途話單數(shù)量、被叫號(hào)碼離散度、被叫區(qū)號(hào)離散度、主叫撥打頻次這幾個(gè)變量對(duì)判定詐騙號(hào)碼區(qū)分能力較為顯著,可作為建模的變量來(lái)使用。

      3.2.3 建立挖掘模型

      在完成模型變量篩選后,開(kāi)始選擇建模的方法。通過(guò)比對(duì)樸素貝葉斯模型、決策樹(shù)模型、隨機(jī)森林算法和線性回歸算法等方法,根據(jù)評(píng)估的效果,預(yù)警模型選擇了支持向量機(jī)(SVM)這一算法。

      根據(jù)以上對(duì)數(shù)據(jù)變量篩選以及話務(wù)特征的分析,根據(jù)SVM 建立了詐騙號(hào)碼的匹配模型。如表3 所示,詐騙號(hào)碼匹配模型為:異地的長(zhǎng)途話單撥打頻次每小時(shí)主叫大于等于9張,被叫號(hào)碼離散度大于等于0.8,且不同被叫區(qū)號(hào)個(gè)數(shù)大于3 個(gè),標(biāo)記為高度疑似詐騙號(hào)碼;漫游用戶在3 個(gè)小時(shí)內(nèi)主叫話單張數(shù)大于等于20 張,被叫號(hào)碼離散度大于等于0.8,且被叫區(qū)號(hào)個(gè)數(shù)大于3 個(gè),標(biāo)記為高度疑似詐騙號(hào)碼。剔除199 以上主卡、政企行客VPN、名稱包含電信、后三位相同的吉祥號(hào)和攜入用戶等白名單用戶。

      表3 詐騙號(hào)碼匹配規(guī)則

      4 通信詐騙預(yù)警系統(tǒng)功能實(shí)現(xiàn)

      (1)普通話務(wù)小時(shí)模型

      在ORACLE 數(shù)據(jù)庫(kù)中建立定時(shí)任務(wù):LYG.MYH_ZP_XYH_2021_JOB 每30 分鐘運(yùn)行一次,掃描本地網(wǎng)的移動(dòng)詳單表,篩選出掃描時(shí)間點(diǎn)前一個(gè)小時(shí)的主叫話單張數(shù)大于等于9張的用戶SERVID,同時(shí)給這些號(hào)碼標(biāo)識(shí)出被叫號(hào)碼的離散度(不同被叫號(hào)碼個(gè)數(shù)/主叫話單張數(shù)),標(biāo)記為:小時(shí)話務(wù)量異常A 模型。

      (2)基站話務(wù)模型

      在ORACLE 數(shù)據(jù)庫(kù)中建立定時(shí)任務(wù):LYG.MYH_ZPJK_2021JZ_JOB 每天9 點(diǎn)運(yùn)行一次,掃描本地網(wǎng)的移動(dòng)詳單表,篩選已被小時(shí)話務(wù)量異常A 模型標(biāo)記出來(lái)的疑似詐騙號(hào)碼與話務(wù)較為集中的基站ID 是否存在交集,如果存在交集那么可以判斷為有GORP 設(shè)備用于詐騙活動(dòng),該設(shè)備危害性更大,需要及時(shí)反饋給省公司和公安反詐中心。

      5 反詐模塊運(yùn)行情況分析

      通信詐騙和騷擾數(shù)據(jù)分析及大數(shù)據(jù)攔截模型投入運(yùn)行以后,優(yōu)化預(yù)警范圍和準(zhǔn)確度,實(shí)時(shí)攔截疑似的詐騙號(hào)碼,大大提升了處理的及時(shí)性和準(zhǔn)確性。如圖2 所示,反詐模型投入使用后詐騙號(hào)碼迅速?gòu)?021 年4 月份的24 個(gè)降低到2021 年6 月份1 個(gè),反詐效果明顯。經(jīng)過(guò)不斷地優(yōu)化,2022 年上半年更是保持0 個(gè)記錄。同時(shí)通過(guò)運(yùn)用該模型的大數(shù)據(jù)分析協(xié)助公安部門破獲了多起通信詐騙案件,有效控制了連云港詐騙案發(fā)率,讓連云港公司擺脫了被動(dòng)局面,并使該項(xiàng)工作在全省名列前茅。

      圖2 公安偵辦派單

      6 結(jié)束語(yǔ)

      通信詐騙預(yù)警系統(tǒng)設(shè)計(jì)研發(fā)時(shí)間緊任務(wù)重,可以借鑒的經(jīng)驗(yàn)較少,在運(yùn)行期間詐騙分子的詐騙手段還在不斷地升級(jí)更新,所以還需要在應(yīng)用中對(duì)公安部門下發(fā)的漏網(wǎng)詐騙號(hào)碼進(jìn)行進(jìn)一步的分析,對(duì)模型逐步改進(jìn)完善。

      猜你喜歡
      話單話務(wù)反詐
      反詐公益廣告
      法人(2023年9期)2023-12-01 14:50:14
      “反詐”雞蛋 為何上熱搜
      “反詐宣講員被騙18萬(wàn)元”更具警示性
      “反詐宣講員被騙”更具警示性
      人民周刊(2021年11期)2021-07-09 08:28:38
      河北大名話單元音韻母、單字調(diào)及雙音節(jié)非輕聲詞連調(diào)的實(shí)驗(yàn)語(yǔ)音學(xué)初探
      淺析電信話務(wù)控制
      采用大數(shù)據(jù)技術(shù)的移動(dòng)DPI關(guān)聯(lián)算法探索及實(shí)現(xiàn)
      “互聯(lián)網(wǎng)+”高速公路客戶服務(wù)話務(wù)平臺(tái)研究
      GSM-R移動(dòng)交換機(jī)ASN.1話單的解碼
      GPRS按時(shí)長(zhǎng)計(jì)費(fèi)模塊的優(yōu)化與應(yīng)用
      新郑市| 三穗县| 镇原县| 石家庄市| 额尔古纳市| 信宜市| 张家口市| 怀来县| 乐安县| 景德镇市| 雷州市| 鄱阳县| 巨野县| 革吉县| 阿坝县| 惠东县| 长治县| 廊坊市| 广西| 福泉市| 茶陵县| 红安县| 钟山县| 新龙县| 正阳县| 盐亭县| 岱山县| 沁源县| 资溪县| 剑阁县| 阿尔山市| 从江县| 阿城市| 栾城县| 巫溪县| 阿拉善左旗| 瑞丽市| 太仓市| 清远市| 同江市| 东兰县|