• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險(xiǎn)監(jiān)控模型

      2019-04-26 08:56:24李撈扒鄒陽(yáng)曾曉勤
      微型電腦應(yīng)用 2019年4期
      關(guān)鍵詞:電費(fèi)決策樹(shù)軌跡

      李撈扒, 鄒陽(yáng), 曾曉勤

      (河海大學(xué) 計(jì)算機(jī)與信息學(xué)院,南京 211100)

      0 引言

      電費(fèi)資金回收是電網(wǎng)企業(yè)的生命線,電費(fèi)收取的風(fēng)險(xiǎn)不僅會(huì)影響電網(wǎng)企業(yè)的持續(xù)健康發(fā)展,也勢(shì)必會(huì)影響整個(gè)國(guó)民經(jīng)濟(jì)的穩(wěn)定性[1]。隨著國(guó)家電網(wǎng)公司建設(shè)的一體化繳費(fèi)管理平臺(tái)逐漸開(kāi)始支持電網(wǎng)企業(yè)、金融機(jī)構(gòu)和非金融機(jī)構(gòu)等多種繳費(fèi)渠道的接入,為客戶提供了便捷靈活的繳費(fèi)方式,同時(shí)也增加了電費(fèi)資金在從客戶到第三方繳費(fèi)渠道再到電網(wǎng)企業(yè)的流動(dòng)過(guò)程中的收取風(fēng)險(xiǎn)。那么如何加強(qiáng)電費(fèi)資金安全管理技術(shù)應(yīng)用,系統(tǒng)性梳理電費(fèi)流轉(zhuǎn)各環(huán)節(jié)風(fēng)險(xiǎn)點(diǎn),防范各環(huán)節(jié)資金安全風(fēng)險(xiǎn),確保電費(fèi)顆粒歸倉(cāng),已成為電網(wǎng)企業(yè)營(yíng)銷管理部門的重要任務(wù)。

      目前,關(guān)于電費(fèi)資金安全風(fēng)險(xiǎn)監(jiān)控的研究主要集中在防范客戶層面上的拖、欠費(fèi)風(fēng)險(xiǎn),且通常采用的是基于數(shù)學(xué)和統(tǒng)計(jì)學(xué)的方法,少部分研究者已經(jīng)開(kāi)始嘗試將機(jī)器學(xué)習(xí)方法引入到拖、欠費(fèi)風(fēng)險(xiǎn)評(píng)估中。對(duì)于客戶層面的風(fēng)險(xiǎn)監(jiān)控研究已經(jīng)取得了很多實(shí)質(zhì)性的成果并有部分信用評(píng)價(jià)系統(tǒng)、風(fēng)險(xiǎn)評(píng)估系統(tǒng)和欠費(fèi)預(yù)警系統(tǒng)進(jìn)入實(shí)際上線運(yùn)行階段[2],但隨著電力體制改革的不斷深化,繳費(fèi)渠道存在的風(fēng)險(xiǎn)被逐漸暴露出來(lái),然而,目前對(duì)繳費(fèi)渠道風(fēng)險(xiǎn)的研究屈指可數(shù),且仍主要是套用客戶風(fēng)險(xiǎn)研究方法。由于客戶只是電費(fèi)資金流轉(zhuǎn)過(guò)程中的一個(gè)環(huán)節(jié),而目前的電費(fèi)風(fēng)險(xiǎn)監(jiān)控系統(tǒng)又缺乏對(duì)繳費(fèi)渠道存在的風(fēng)險(xiǎn)進(jìn)行系統(tǒng)梳理、有效識(shí)別和精準(zhǔn)防控,所以現(xiàn)有的風(fēng)險(xiǎn)監(jiān)控策略不能形成輻射全過(guò)程的風(fēng)險(xiǎn)防范預(yù)案。

      經(jīng)過(guò)長(zhǎng)期對(duì)電力客戶繳費(fèi)行為軌跡的跟蹤觀測(cè)研究,發(fā)現(xiàn)除電網(wǎng)企業(yè)本身繳費(fèi)渠道外,其他繳費(fèi)渠道均隱藏著潛在的資金流異常,主要表現(xiàn)為收取電費(fèi)后攜款外逃、使用充值卡套取多重手續(xù)費(fèi)、不定時(shí)長(zhǎng)截留電費(fèi)、查繳比偏高、重復(fù)扣款和對(duì)賬不及時(shí)等風(fēng)險(xiǎn)。本文在已明確第三方繳費(fèi)渠道存在的風(fēng)險(xiǎn)類型、成因機(jī)理和表現(xiàn)形式的基礎(chǔ)之上,提出了一個(gè)基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險(xiǎn)監(jiān)控模型。首先對(duì)客戶的繳費(fèi)記錄進(jìn)行定性分析,通過(guò)分析客戶的繳費(fèi)記錄追蹤到其繳費(fèi)行為軌跡,進(jìn)而根據(jù)風(fēng)險(xiǎn)類型識(shí)別模型判斷出該客戶潛在的風(fēng)險(xiǎn)類型;然后確定各風(fēng)險(xiǎn)評(píng)估指標(biāo),建立渠道風(fēng)險(xiǎn)評(píng)估指標(biāo)體系,定量統(tǒng)計(jì)渠道不同風(fēng)險(xiǎn)類型的各評(píng)估指標(biāo)值;最后通過(guò)風(fēng)險(xiǎn)評(píng)估模型得到渠道各風(fēng)險(xiǎn)類型的風(fēng)險(xiǎn)指數(shù)和風(fēng)險(xiǎn)排名。該模型將機(jī)器學(xué)習(xí)方法引入到風(fēng)險(xiǎn)類別識(shí)別模型和風(fēng)險(xiǎn)評(píng)估模型中,同時(shí)將定性指標(biāo)和定量指標(biāo)分開(kāi)考慮,解決了傳統(tǒng)方法中魯棒性較差和機(jī)器學(xué)習(xí)方法中解釋性較差的問(wèn)題,且獲得了可信度較高的風(fēng)險(xiǎn)評(píng)估結(jié)果。

      1 相關(guān)研究

      我國(guó)電力行業(yè)于本世紀(jì)初開(kāi)始引入風(fēng)險(xiǎn)監(jiān)控研究,經(jīng)過(guò)近些年對(duì)電費(fèi)收取風(fēng)險(xiǎn)監(jiān)控的研究與探索,相繼從不同角度分別提出了一些值得借鑒的風(fēng)險(xiǎn)評(píng)估方法和思想。

      起初,風(fēng)險(xiǎn)評(píng)估主要是采用基于數(shù)學(xué)和統(tǒng)計(jì)學(xué)的方法,其中,基于數(shù)據(jù)統(tǒng)計(jì)特征的熵權(quán)法(entropy weight method, EWM)[3],由于忽略了不同評(píng)估指標(biāo)間存在的關(guān)系,所以通常作為評(píng)估指標(biāo)的計(jì)量方法,而不適合作為風(fēng)險(xiǎn)評(píng)估方法;層次分析法(analytic hierarchy process, AHP)[4]是應(yīng)用最廣泛的風(fēng)險(xiǎn)評(píng)估方法,其本質(zhì)是主觀經(jīng)驗(yàn)的客觀標(biāo)量轉(zhuǎn)化,然而由于不同的應(yīng)用場(chǎng)景對(duì)判斷矩陣的一致性要求不同,直接使用CR<0.1缺乏科學(xué)依據(jù)[5],所以實(shí)際評(píng)估效果一般;改進(jìn)了AHP中CR值不確定問(wèn)題的模糊層次分析法(fuzzy analytic hierarchy process, FAHP)[6]是將模糊數(shù)學(xué)理論與AHP相結(jié)合,把判斷矩陣改造成模糊一致矩陣,使用檢驗(yàn)行間對(duì)應(yīng)元素差是否為同一常數(shù)代替判斷矩陣的一致性檢驗(yàn),但FAHP仍需要Delphi專家調(diào)研法和EM標(biāo)度法的支持,計(jì)算復(fù)雜度較高。

      后來(lái),隨著人工神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)的研究熱潮再次掀起,這些方法也逐漸被應(yīng)用到電力行業(yè)風(fēng)險(xiǎn)監(jiān)控的相關(guān)預(yù)測(cè)研究中。文獻(xiàn)[7]利用SVM和BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了對(duì)客戶按風(fēng)險(xiǎn)程度分類,但由于風(fēng)險(xiǎn)評(píng)估指標(biāo)體系中既有定性指標(biāo)又有定量指標(biāo),而此類方法只能進(jìn)行定量分析,所以導(dǎo)致其評(píng)估結(jié)果的解釋性較差,限制了其工程應(yīng)用;文獻(xiàn)[8]嘗試使用決策樹(shù)算法預(yù)測(cè)客戶欠費(fèi)風(fēng)險(xiǎn)類型,但文中并未屏蔽與風(fēng)險(xiǎn)預(yù)測(cè)無(wú)關(guān)的指標(biāo),造成得出的決策樹(shù)結(jié)構(gòu)較復(fù)雜;文獻(xiàn)[9-11]將機(jī)器學(xué)習(xí)中的K-Means聚類算法、Logistic回歸分析法和遺傳算法等應(yīng)用到電費(fèi)收取風(fēng)險(xiǎn)評(píng)估中,但對(duì)于數(shù)據(jù)量較少的渠道風(fēng)險(xiǎn),預(yù)測(cè)的精度往往不是很理想。

      為了解決上述方法中存在魯棒性和解釋性較差的問(wèn)題,同時(shí)為了提高預(yù)測(cè)的準(zhǔn)確率和降低模型的復(fù)雜度,應(yīng)盡量選取與繳費(fèi)行為相關(guān)且客觀可統(tǒng)計(jì)的評(píng)估指標(biāo)。根據(jù)所選的評(píng)估指標(biāo),先使用改進(jìn)的決策樹(shù)算法將客戶按定性指標(biāo)分類,然后定量統(tǒng)計(jì)渠道各風(fēng)險(xiǎn)類型的評(píng)估指標(biāo)值,最后使用回歸分析法(regression analysis)尋求風(fēng)險(xiǎn)評(píng)估指標(biāo)與渠道風(fēng)險(xiǎn)指數(shù)間的關(guān)系。為了解決回歸模型在求解輸入向量與目標(biāo)輸出間的多元函數(shù)表達(dá)式組時(shí)可能出現(xiàn)異方差性問(wèn)題,嘗試使用加權(quán)最小二乘法(weighted least square method, WLS)[12]對(duì)原模型進(jìn)行修正,使得到的參數(shù)估計(jì)量同時(shí)具有無(wú)偏性和有效性。

      2 構(gòu)建渠道風(fēng)險(xiǎn)監(jiān)控模型

      電費(fèi)資金的流轉(zhuǎn)過(guò)程可以簡(jiǎn)單地描述為:用戶通過(guò)第三方渠道繳納電費(fèi),第三方渠道定期將收到的電費(fèi)轉(zhuǎn)給電網(wǎng)企業(yè)。針對(duì)繳費(fèi)渠道在收取電費(fèi)過(guò)程中、收繳時(shí)間差內(nèi)、與電網(wǎng)企業(yè)對(duì)賬時(shí)存在的諸多風(fēng)險(xiǎn)點(diǎn),現(xiàn)通過(guò)構(gòu)建基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險(xiǎn)監(jiān)控模型,以期及時(shí)發(fā)現(xiàn)潛在的風(fēng)險(xiǎn)類型并對(duì)其進(jìn)行有效識(shí)別和精準(zhǔn)預(yù)測(cè),為制定相應(yīng)的防范措施提供決策依據(jù)。

      2.1 追蹤繳費(fèi)行為軌跡

      客戶繳費(fèi)行為軌跡是分析電費(fèi)資金流轉(zhuǎn)各環(huán)節(jié)風(fēng)險(xiǎn)的最直接依據(jù),也是本模型的研究出發(fā)點(diǎn)。如表1所示。

      表1 原始格式的數(shù)據(jù)記錄

      在電費(fèi)營(yíng)銷管理系統(tǒng)中,繳費(fèi)記錄包含渠道號(hào)、網(wǎng)點(diǎn)號(hào)、用戶號(hào)、費(fèi)用周期、賬單編號(hào)、交易流水號(hào)、交易時(shí)間、收費(fèi)類型、繳費(fèi)方式、結(jié)算方式、收費(fèi)金額、滯納金等字段,所以可通過(guò)數(shù)據(jù)庫(kù)中的繳費(fèi)記錄追蹤到客戶的繳費(fèi)行為軌跡,進(jìn)而判斷其可能存在的風(fēng)險(xiǎn)類型。以下將以沖正套現(xiàn)風(fēng)險(xiǎn)點(diǎn)為例對(duì)模型進(jìn)行描述,沖正套現(xiàn)是指第三方渠道以某種手段將客戶繳納電費(fèi)的操作從電力公司的營(yíng)銷管理系統(tǒng)中撤回,電費(fèi)資金將回流到第三方渠道賬戶。

      2.1.1 數(shù)據(jù)格式轉(zhuǎn)換

      為方便追蹤客戶在一個(gè)費(fèi)用周期內(nèi)的繳費(fèi)行為軌跡,需要將其在一個(gè)費(fèi)用周期內(nèi)的所有繳費(fèi)操作歸納成一條記錄,具體的做法是先將數(shù)據(jù)庫(kù)中原始數(shù)據(jù)記錄轉(zhuǎn)換成單條數(shù)據(jù)格式,如表2所示。然后以客戶為單位,按時(shí)間先后排序,最后將單條數(shù)據(jù)格式歸并為單戶數(shù)據(jù)格式,如表3所示。同時(shí)對(duì)收費(fèi)類型、繳費(fèi)方式和結(jié)算方式字段重新編碼,其中,單條數(shù)據(jù)格式包括渠道號(hào)rcv_org_no、網(wǎng)點(diǎn)號(hào)branch、用戶號(hào)cons_id、賬單年月charge_ym、繳費(fèi)時(shí)間charge_date、收費(fèi)類型type_mode、繳費(fèi)方式pay_mode、結(jié)算方式settle_mode和收費(fèi)金額rcv_amt 9個(gè)屬性;單戶數(shù)據(jù)格式包括用戶號(hào)cons_id、賬單年月charge_ym、單條數(shù)據(jù)個(gè)數(shù)refer_id_num、單條數(shù)據(jù)集合refer_id_list 4個(gè)字段,其中的refer_id_list由單條數(shù)據(jù)標(biāo)識(shí)refer_id順序排列并以逗號(hào)分隔而成;編碼策略是將以01開(kāi)頭的0101~0116分別映射到A~P,以02開(kāi)頭的0201~0216分別映射到a~p。

      表2 單條數(shù)據(jù)格式的數(shù)據(jù)記錄

      表3 單戶數(shù)據(jù)格式的數(shù)據(jù)記錄

      2.1.2 簡(jiǎn)化繳費(fèi)行為軌跡序列

      由2.1.1可知,每次繳費(fèi)行為可用收費(fèi)類型、繳費(fèi)方式和結(jié)算方式3個(gè)字段組成的編碼組表示。由于客戶繳費(fèi)行為具有較大的隨意性,所以數(shù)據(jù)中反映出來(lái)的繳費(fèi)軌跡復(fù)雜多樣,因此有必要對(duì)繳費(fèi)行為軌跡進(jìn)行簡(jiǎn)化,提取出關(guān)鍵行為節(jié)點(diǎn)。經(jīng)過(guò)對(duì)沖正套現(xiàn)業(yè)務(wù)的深入分析,得到如下簡(jiǎn)化規(guī)則:

      1)與前一步相同的操作不再加入整體軌跡序列。

      2)反復(fù)進(jìn)行沖正和充值卡繳費(fèi)的操作,合并后僅保留一組序列。

      3)任意一種繳費(fèi)操作和預(yù)收結(jié)轉(zhuǎn)電費(fèi)操作聯(lián)合發(fā)生時(shí),合并后保留其中一個(gè)編碼組。

      4)如果在沖正操作之后發(fā)生預(yù)收結(jié)轉(zhuǎn)電費(fèi),則忽略該條轉(zhuǎn)賬記錄。

      經(jīng)過(guò)上述兩步處理后,可得到簡(jiǎn)化的某客戶在指定費(fèi)用周期內(nèi)有時(shí)序特征的繳費(fèi)行為軌跡序列。那么上例對(duì)應(yīng)簡(jiǎn)化的繳費(fèi)行為軌跡序列為:AAKIAKCAF。

      2.1.3 風(fēng)險(xiǎn)類別識(shí)別

      風(fēng)險(xiǎn)類型識(shí)別是根據(jù)簡(jiǎn)化的客戶繳費(fèi)行為軌跡序列判斷其潛在的風(fēng)險(xiǎn)類型,是定性分析的核心內(nèi)容。在創(chuàng)建風(fēng)險(xiǎn)類型識(shí)別模型之前,需要明確的是沖正套現(xiàn)風(fēng)險(xiǎn)點(diǎn)包含了三種風(fēng)險(xiǎn)類型,如表4所示。

      表4 風(fēng)險(xiǎn)類型

      創(chuàng)建風(fēng)險(xiǎn)類型識(shí)別模型,首先需要構(gòu)造數(shù)據(jù)集。從某省2017年6月到10月的每個(gè)月份中抽取5000個(gè)典型用戶的所有繳費(fèi)記錄,將其軌跡序列作為特征屬性,使用Delphi專家調(diào)研法標(biāo)注對(duì)應(yīng)的風(fēng)險(xiǎn)類型。為了保證樣本占用的存儲(chǔ)空間相等,文中采用稀疏矩陣存儲(chǔ)樣本特征,并使用0來(lái)填充空缺位置,同時(shí)設(shè)置最后一列為目標(biāo)分類結(jié)果。假設(shè)稀疏矩陣的長(zhǎng)度為10,那么上例轉(zhuǎn)化為樣本時(shí)對(duì)應(yīng)的數(shù)據(jù)格式如表5所示。

      表5 數(shù)據(jù)集中的樣本

      由于繳費(fèi)行為軌跡序列具有較強(qiáng)的時(shí)序性,所以選擇機(jī)器學(xué)習(xí)方法中基于信息熵增益的ID3決策樹(shù)算法對(duì)軌跡序列進(jìn)行分類,每次劃分子樹(shù)前,先計(jì)算下一個(gè)編碼組的信息增益,然后選擇信息增益最大的編碼組進(jìn)行分裂,直到遍歷完所有編碼組,其中,信息增益如式(1)。

      (1)

      式中:H表示信息熵,S表示全部樣本,value(i)是第i組樣本的所有取值集合,v是第i組樣本的一個(gè)取值,Sv表示S中第i組值為v的全部樣本,|Sv|表示Sv中包含的樣本數(shù)。

      由于無(wú)法預(yù)知客戶未來(lái)繳費(fèi)行為軌跡序列的最大長(zhǎng)度,所以為了提高識(shí)別模型的精度和決策樹(shù)的泛化能力,使用正則表達(dá)式對(duì)決策樹(shù)進(jìn)行模式匹配和邏輯補(bǔ)充。從數(shù)據(jù)集的每個(gè)月份中隨機(jī)選取4 000條數(shù)據(jù)作為訓(xùn)練集,訓(xùn)練得到如圖1所示的風(fēng)險(xiǎn)類型識(shí)別模型,其中:“0”代表是否存在后續(xù)操作,即繳費(fèi)行為軌跡是否到此終止;“01”、“02”、“03”、“04”分別對(duì)應(yīng)表4中的風(fēng)險(xiǎn)類型編號(hào)。

      2.2 建立風(fēng)險(xiǎn)評(píng)估指標(biāo)體系

      風(fēng)險(xiǎn)評(píng)估指標(biāo)體系是定量統(tǒng)計(jì)的依據(jù),也是風(fēng)險(xiǎn)評(píng)估的前提,將直接影響評(píng)估結(jié)果的合理性。如圖1所示。

      圖1 風(fēng)險(xiǎn)類型識(shí)別模型

      在選取風(fēng)險(xiǎn)評(píng)估指標(biāo)時(shí),應(yīng)遵循精簡(jiǎn)可靠、滿足需求、縱向可比性高且客觀統(tǒng)計(jì)特征強(qiáng)等原則。如前所述,為降低風(fēng)險(xiǎn)類型識(shí)別模型的結(jié)構(gòu)復(fù)雜度、提高定性識(shí)別的準(zhǔn)確率,應(yīng)盡量選取與繳費(fèi)行為相關(guān)度較高的特征屬性,通過(guò)追蹤客戶的繳費(fèi)行為軌跡可判斷出其潛在的風(fēng)險(xiǎn)類型,進(jìn)而可得到某渠道下存在每種風(fēng)險(xiǎn)的風(fēng)險(xiǎn)次數(shù)、風(fēng)險(xiǎn)金額、風(fēng)險(xiǎn)次數(shù)比、風(fēng)險(xiǎn)金額比、風(fēng)險(xiǎn)總時(shí)長(zhǎng)、平均風(fēng)險(xiǎn)時(shí)長(zhǎng)和風(fēng)險(xiǎn)高峰時(shí)段等統(tǒng)計(jì)指標(biāo)。

      參考目前在企業(yè)信用管理中廣泛使用的5C理論和AHP中關(guān)于指標(biāo)體系的討論,結(jié)合電力行業(yè)特點(diǎn)及渠道風(fēng)險(xiǎn)評(píng)估需要,本文建立了一套基于風(fēng)險(xiǎn)類型的、多層次遞階的渠道風(fēng)險(xiǎn)評(píng)估指標(biāo)體系,如圖2所示。

      2.3 渠道風(fēng)險(xiǎn)評(píng)估

      在定性分析確定客戶風(fēng)險(xiǎn)類型和定量統(tǒng)計(jì)得到渠道各風(fēng)險(xiǎn)評(píng)估指標(biāo)值的基礎(chǔ)之上,可使用機(jī)器學(xué)習(xí)方法對(duì)渠道風(fēng)險(xiǎn)進(jìn)行評(píng)估預(yù)測(cè),這樣就可以解決由直接對(duì)原始數(shù)據(jù)使用機(jī)器學(xué)習(xí)方法造成的評(píng)估結(jié)果解釋性較差的問(wèn)題,實(shí)現(xiàn)分類評(píng)估。由渠道風(fēng)險(xiǎn)評(píng)估指標(biāo)體系可知,對(duì)于目標(biāo)層1、2、3、4、5和6,其決策層之間是相互獨(dú)立的,所以可使用回歸分析法構(gòu)建自動(dòng)化的風(fēng)險(xiǎn)評(píng)估模型,計(jì)算各風(fēng)險(xiǎn)類型的風(fēng)險(xiǎn)指數(shù)值,進(jìn)而可得到統(tǒng)計(jì)推斷下的渠道各風(fēng)險(xiǎn)排名。由于不同的風(fēng)險(xiǎn)類型對(duì)應(yīng)著不同的風(fēng)險(xiǎn)評(píng)估模型,但其創(chuàng)建過(guò)程大同小異,所以以下將以截留電費(fèi)風(fēng)險(xiǎn)為例,對(duì)風(fēng)險(xiǎn)評(píng)估模型的創(chuàng)建過(guò)程進(jìn)行描述。

      圖2 渠道風(fēng)險(xiǎn)評(píng)估指標(biāo)體系

      由于Delphi專家調(diào)研法得到的評(píng)估結(jié)果最直接、最具有參考意義,所以通常將其作為回歸分析的參考依據(jù)。本文選取連續(xù)3個(gè)費(fèi)用周期內(nèi)的500個(gè)存在截留電費(fèi)風(fēng)險(xiǎn)的典型渠道作為回歸樣本,為了弱化主觀經(jīng)驗(yàn)對(duì)回歸結(jié)果的影響,使用具有相對(duì)關(guān)系的排名代替具體的風(fēng)險(xiǎn)指數(shù)值。設(shè)樣本P=[p1,…,p500],權(quán)重向量X=[x1,…,x6],風(fēng)險(xiǎn)指數(shù)Y=[y1,…,y500],且yi已按從大到小排序,根據(jù)回歸分析的思想,yi=X·pi,那么yi-yi+1≥0恒成立,故存在多元回歸函數(shù)不等式組成立式(2)。

      (2)

      解出該多元不等式方程組即可得出權(quán)重向量X。

      由于直接求解不等式組難度較大,所以可將上述不等式轉(zhuǎn)化為形式上的等式,即yi-yi+1=ξi,其中ξi為常數(shù)。那么式(2)可寫成式(3)。

      (3)

      用D-1對(duì)原模型進(jìn)行加權(quán),得到式(4)。

      D-1·Y=D-1·X·A+D-1·B

      (4)

      通過(guò)變量替換,令Y*=D-1·Y,X*=D-1·X,B*=D-1·B,式(4)可寫成式(5)。

      Y*=X*·A+B*

      (5)

      此時(shí)(5)的協(xié)方差

      Cov(B*,B*)=E(D-1·B·B·(D-1)T)=

      所以新模型不存在異方差性,再對(duì)新模型使用LSM得到參數(shù)估計(jì)量XWLS=(AT·W-1·A)-1·AT·W-1·Y,此時(shí)的XWLS同時(shí)具有無(wú)偏性和有效性。

      如何求解參數(shù)估計(jì)量XWLS,可以歸結(jié)為如何確定加權(quán)矩陣W的值。首先對(duì)原模型X·A=b運(yùn)用最小二乘法得到誤差項(xiàng)的近似估計(jì)量ei,然后由ei組成加權(quán)矩陣W,那么基于WLS的回歸分析基本流程如下:

      1)求出原模型的最小二乘解(AT·A)-1·AT·b,并計(jì)算誤差項(xiàng)的近似估計(jì)量ei。

      2)利用ei構(gòu)造合適的加權(quán)矩陣W=D·DT。

      3)將D-1左乘原模型的兩邊得到新模型,再求出新模型的最小二乘解(AT·W-1·A)-1·AT·W-1·b。

      綜上,可得到基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險(xiǎn)監(jiān)控模型的算法,偽代碼描述如下:

      算法1:基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險(xiǎn)監(jiān)控算法

      Algorithm1: ChannelMonitor()

      Input: 費(fèi)用周期區(qū)間[t1,t2],截留和延遲時(shí)長(zhǎng)閾值x1

      Output: Map;//String存儲(chǔ)渠道號(hào)c,

      RiskRank包含風(fēng)險(xiǎn)類型t,風(fēng)險(xiǎn)指數(shù)i和風(fēng)險(xiǎn)排名r 3個(gè)屬性

      1)List monthList=splitDate(t1,t2);

      2)foreachpmonthinmonthListdo

      3) String info=getOriRecord(pmonth.getStartDate(),

      pmonth.getEndDate());//獲取原始數(shù)據(jù)

      4) Map userMap=formatData(info); //格式化成單戶數(shù)據(jù)格式

      5)foreach(id,user)inuserMapdo

      6) String paySeq=getPaySeq(user);//追蹤繳費(fèi)行為

      軌跡序列

      7) String keyPaySeq=simplePaySeq(paySeq);//簡(jiǎn)化

      軌跡序列,提取出關(guān)鍵行為節(jié)點(diǎn)

      8) user.setRiskType(cognRiskType(keyPaySeq,x1));

      //根據(jù)簡(jiǎn)化的軌跡序列識(shí)別潛在的風(fēng)險(xiǎn)類型

      9) userMap.put(id,user);

      10)endforeach

      11) Map channelStatsMap= statsData (userMap);//統(tǒng)計(jì)每個(gè)渠道各風(fēng)險(xiǎn)類型的指標(biāo)值

      12)foreachXRiskinRISKTYPELISTdo

      13) XRiskTable channelXRiskData = getXRiskData

      (channelStatsMap);//獲取渠道某風(fēng)險(xiǎn)的數(shù)據(jù)

      14) Map stdXRiskData= preDealData(channelXRiskData);//對(duì)數(shù)據(jù)進(jìn)行過(guò)濾、標(biāo)準(zhǔn)化、做差等預(yù)處理

      15) Map channelXRisk= mXRisk (stdXRiskData);//調(diào)用某風(fēng)險(xiǎn)類型對(duì)應(yīng)的評(píng)估模型

      16) Map channelXRiskRank= rankStgy (channelXRisk);//調(diào)用排序策略

      17)returnchannelXRiskRank;

      18)endforeach

      19)endforeach

      3 實(shí)驗(yàn)結(jié)果及分析

      本部分將對(duì)上述文中提出的基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險(xiǎn)監(jiān)控模型進(jìn)行實(shí)驗(yàn)驗(yàn)證,對(duì)比分析風(fēng)險(xiǎn)類型識(shí)別模型的準(zhǔn)確率和風(fēng)險(xiǎn)評(píng)估模型的合理性,并進(jìn)一步探討其工程實(shí)用性。

      由于精確地預(yù)測(cè)客戶潛在的風(fēng)險(xiǎn)類型是實(shí)現(xiàn)渠道風(fēng)險(xiǎn)監(jiān)控的前提和必要條件,所以為了驗(yàn)證使用ID3決策樹(shù)算法與正則表達(dá)式結(jié)合的方法創(chuàng)建的風(fēng)險(xiǎn)類型識(shí)別模型的準(zhǔn)確率,分別使用ID3決策樹(shù)算法、正則表達(dá)式和ID3決策樹(shù)算法與正則表達(dá)式相結(jié)合的方法創(chuàng)建沖正套現(xiàn)風(fēng)險(xiǎn)類型識(shí)別模型和查繳比異常風(fēng)險(xiǎn)類型識(shí)別模型,將數(shù)據(jù)集中每個(gè)月份剩下的1000條數(shù)據(jù)作為測(cè)試集,對(duì)比不同方法創(chuàng)建的風(fēng)險(xiǎn)類型識(shí)別模型的準(zhǔn)確率,得到每組實(shí)驗(yàn)的準(zhǔn)確率如表6所示。

      表6 風(fēng)險(xiǎn)類型識(shí)別模型的準(zhǔn)確率

      由表6可知,將ID3決策樹(shù)算法與正則表達(dá)式相結(jié)合創(chuàng)建的風(fēng)險(xiǎn)類型識(shí)別模型的準(zhǔn)確率超過(guò)0.987,比單獨(dú)使用ID3決策樹(shù)算法提高了約1.9%,且當(dāng)分類模型越復(fù)雜,準(zhǔn)確率提升越明顯,同時(shí),引入正則表達(dá)式還可以降低風(fēng)險(xiǎn)類型識(shí)別模型的結(jié)構(gòu)復(fù)雜度。

      圖3 渠道排名誤差的絕對(duì)值之和

      表7 渠道排名誤差統(tǒng)計(jì)表

      由表7可知,約96.72%的樣本排名誤差在3個(gè)名次之內(nèi),僅有約0.33%的樣本排名誤差超過(guò)10個(gè)名次,評(píng)估精確度能夠滿足實(shí)際需求,所以引入加權(quán)最小二乘法不僅可以解決回歸模型的異方差性問(wèn)題,還可以提升模型的可信度與合理性。

      為進(jìn)一步探討基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險(xiǎn)監(jiān)控模型的實(shí)用性,分析在不同費(fèi)用周期內(nèi)同一渠道的某風(fēng)險(xiǎn)類型排名變化情況。通過(guò)本模型獲得某省所有第三方渠道在2017年6月到10月連續(xù)5個(gè)費(fèi)用周期內(nèi)的截留電費(fèi)風(fēng)險(xiǎn)相對(duì)排名,然后使用滑動(dòng)窗口法[14]計(jì)算每個(gè)渠道的排名變化,經(jīng)分析發(fā)現(xiàn),渠道的截留電費(fèi)風(fēng)險(xiǎn)排名變化情況整體上符合較為規(guī)則的統(tǒng)計(jì)分布,如圖4所示。

      由圖4可知,大部分渠道的風(fēng)險(xiǎn)排名變化較小,只有少數(shù)渠道的排名變化超過(guò)了20個(gè)名次,這一結(jié)果說(shuō)明部分渠道確實(shí)存在潛在的電費(fèi)收取風(fēng)險(xiǎn),所以構(gòu)建渠道風(fēng)險(xiǎn)監(jiān)控模型是非常有必要的,同時(shí)也說(shuō)明本模型具有一定的實(shí)用性。

      圖4 渠道排名變化分布情況

      4 總結(jié)

      針對(duì)目前電費(fèi)資金流轉(zhuǎn)過(guò)程中的第三方繳費(fèi)渠道仍存在風(fēng)險(xiǎn)監(jiān)控漏洞問(wèn)題,文中提出了一個(gè)基于繳費(fèi)行為軌跡追蹤的渠道風(fēng)險(xiǎn)監(jiān)控模型,并以沖正套現(xiàn)風(fēng)險(xiǎn)點(diǎn)和截留電費(fèi)風(fēng)險(xiǎn)類型為例,對(duì)模型的追蹤繳費(fèi)行為軌跡、構(gòu)建風(fēng)險(xiǎn)評(píng)估指標(biāo)體系和渠道風(fēng)險(xiǎn)評(píng)估三大核心步驟進(jìn)行了討論。實(shí)驗(yàn)驗(yàn)證了使用決策樹(shù)算法與正則表達(dá)式相結(jié)合的方法創(chuàng)建風(fēng)險(xiǎn)類型識(shí)別模型可以獲得更高的準(zhǔn)確率,以及回歸分析時(shí)引入WLS可以提高風(fēng)險(xiǎn)評(píng)估模型的合理性。模型將定性分析與定量統(tǒng)計(jì)分離,實(shí)現(xiàn)了分類評(píng)估,取得了可靠性較高的風(fēng)險(xiǎn)評(píng)估結(jié)果。

      將來(lái)隨著研究的進(jìn)一步深入和模型的不斷完善,會(huì)有更多機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)挖掘方法與技術(shù)被用于風(fēng)險(xiǎn)類型識(shí)別和風(fēng)險(xiǎn)評(píng)估方面,可進(jìn)一步提升電網(wǎng)企業(yè)風(fēng)險(xiǎn)監(jiān)控水平。

      猜你喜歡
      電費(fèi)決策樹(shù)軌跡
      基于ε-SVR模型的日電費(fèi)回收預(yù)測(cè)
      吉林電力(2022年1期)2022-11-10 09:20:40
      軌跡
      軌跡
      一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
      決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      軌跡
      進(jìn)化的軌跡(一)——進(jìn)化,無(wú)盡的適應(yīng)
      基于大用戶電費(fèi)回收的風(fēng)險(xiǎn)管控
      基于決策樹(shù)的出租車乘客出行目的識(shí)別
      關(guān)于縣級(jí)供電企業(yè)電費(fèi)對(duì)賬的研究
      扶沟县| 浪卡子县| 长汀县| 宁陵县| 高平市| 织金县| 茶陵县| 泰州市| 肥乡县| 丹寨县| 平潭县| 大丰市| 连城县| 万全县| 新宁县| 奈曼旗| 库伦旗| 宜兰市| 泽普县| 晋宁县| 东城区| 西和县| 札达县| 凌云县| 丰顺县| 安阳市| 监利县| 延津县| 长垣县| 饶阳县| 合水县| 北碚区| 阿克苏市| 普安县| 水富县| 陵川县| 施秉县| 蕲春县| 特克斯县| 白城市| 石渠县|