• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于關(guān)聯(lián)規(guī)則的銀行內(nèi)部審計(jì)應(yīng)用

      2019-09-10 12:17:39杜海珍楊超
      中國(guó)內(nèi)部審計(jì) 2019年10期
      關(guān)鍵詞:Apriori算法關(guān)聯(lián)規(guī)則內(nèi)部審計(jì)

      杜海珍 楊超

      [摘要]本文采用Apriori算法,以A銀行的實(shí)際業(yè)務(wù)為例,對(duì)具體信貸產(chǎn)品客戶信息與信貸分類(lèi)進(jìn)行關(guān)聯(lián)挖掘分析,證明運(yùn)用關(guān)聯(lián)規(guī)則這類(lèi)數(shù)據(jù)挖掘方法對(duì)商業(yè)銀行內(nèi)部審計(jì)可疑數(shù)據(jù)定位的可行性和有效性,為銀行內(nèi)部非現(xiàn)場(chǎng)審計(jì)的有效開(kāi)展提供決策依據(jù)。

      [關(guān)鍵詞]關(guān)聯(lián)規(guī)則? ? Apriori算法? ? 數(shù)據(jù)挖掘? ? 商業(yè)銀行? ? 內(nèi)部審計(jì)

      年來(lái),國(guó)內(nèi)各大國(guó)有商業(yè)銀行、股份制銀行

      紛紛成立金融消費(fèi)公司,多渠道拓寬個(gè)人消費(fèi)貸款類(lèi)業(yè)務(wù)。隨著業(yè)務(wù)量及貸款金額的不斷攀升,相關(guān)業(yè)務(wù)和客戶的數(shù)據(jù)量也隨之?dāng)U大。由于貸款業(yè)務(wù)的快速發(fā)展及信息不對(duì)稱(chēng)等因素,導(dǎo)致銀行面對(duì)風(fēng)險(xiǎn)的種類(lèi)繁多、形式變幻多樣,不良貸款率隨之上升。在日常內(nèi)部審計(jì)中,如何在海量數(shù)據(jù)中提煉出關(guān)鍵信息,并有針對(duì)性地對(duì)業(yè)務(wù)進(jìn)行審計(jì),降低業(yè)務(wù)風(fēng)險(xiǎn),對(duì)銀行內(nèi)部審計(jì)人員提出了更高要求。傳統(tǒng)的審計(jì)方法只對(duì)數(shù)據(jù)的準(zhǔn)確性、完整性等進(jìn)行簡(jiǎn)單分析,忽略了數(shù)據(jù)之間隱藏的關(guān)聯(lián)關(guān)系,已不能滿足當(dāng)前風(fēng)險(xiǎn)管理的發(fā)展需求。為提升銀行內(nèi)部審計(jì)的科學(xué)性、有效性,提高內(nèi)部審計(jì)質(zhì)量,有必要對(duì)相關(guān)數(shù)據(jù)進(jìn)行知識(shí)獲取、發(fā)現(xiàn)隱藏?cái)?shù)據(jù)間的關(guān)系,并加以研究應(yīng)用,為銀行的業(yè)務(wù)發(fā)展和風(fēng)險(xiǎn)把控提供更好的對(duì)策建議。作為數(shù)據(jù)挖掘中常用的一種方法,關(guān)聯(lián)規(guī)則(Association Rules)重點(diǎn)關(guān)注從大量數(shù)據(jù)中找出事物間內(nèi)在的隱含聯(lián)系,該方法在醫(yī)療數(shù)據(jù)分析、商業(yè)營(yíng)銷(xiāo)分析、語(yǔ)義分析等領(lǐng)域都有廣泛的運(yùn)用。近年來(lái),也有相關(guān)學(xué)者將其應(yīng)用到銀行業(yè)中,分析商業(yè)銀行貸款、信用卡等客戶的信用評(píng)級(jí)。

      一、關(guān)聯(lián)規(guī)則Apriori算法及其適用性分析

      關(guān)聯(lián)規(guī)則是一種能夠反映事物與其他事物之間相互依存和關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法。關(guān)聯(lián)規(guī)則挖掘的典型應(yīng)用為購(gòu)物籃分析,若分析得出35%的客戶購(gòu)買(mǎi)了X產(chǎn)品,這些客戶中的75%還購(gòu)買(mǎi)了Y,該規(guī)則可表示為“X→Y”的蘊(yùn)含式,其中X為前項(xiàng),Y為后項(xiàng)。關(guān)聯(lián)規(guī)則的強(qiáng)度可用支持度(Support)和置信度(Confidence)衡量。支持度表示關(guān)聯(lián)規(guī)則的前項(xiàng)在所有項(xiàng)集中出現(xiàn)的百分比,用來(lái)衡量關(guān)聯(lián)規(guī)則的重要性;置信度表示在前項(xiàng)出現(xiàn)的情況下,后項(xiàng)同時(shí)出現(xiàn)的百分比,代表這條規(guī)則成立的概率。上例中,“X→Y”的規(guī)則支持度為35%,置信度為75%。

      Apriori算法是最常見(jiàn)的關(guān)聯(lián)規(guī)則算法之一,其難點(diǎn)在于需要找到合適的支持度和置信度參數(shù)以產(chǎn)生合理數(shù)量的關(guān)聯(lián)規(guī)則,該過(guò)程可能需要進(jìn)行大量試驗(yàn)與誤差評(píng)估。假設(shè)參數(shù)設(shè)置過(guò)高,會(huì)導(dǎo)致沒(méi)有規(guī)則或規(guī)則過(guò)于普通而無(wú)價(jià)值;另一方面如果閾值太低,可能導(dǎo)致規(guī)則數(shù)量較多,需要運(yùn)行較長(zhǎng)時(shí)間或在學(xué)習(xí)階段耗盡內(nèi)存。Apriori算法主要使用廣度優(yōu)先搜索和哈希樹(shù)結(jié)構(gòu)有效計(jì)算候選項(xiàng)集,其挖掘具體步驟如下:先搜索出候選1-項(xiàng)集及對(duì)應(yīng)的支持度,剪枝去掉低于支持度的1-項(xiàng)集,得到頻繁1-項(xiàng)集;對(duì)剩下的頻繁1-項(xiàng)集進(jìn)行連接,得到候選的頻繁2-項(xiàng)集,篩選去掉低于支持度的候選頻繁2-項(xiàng)集,得到真正的頻繁2-項(xiàng)集;以此類(lèi)推,迭代下去,直到無(wú)法找到頻繁k+1-項(xiàng)集為止,對(duì)應(yīng)的頻繁k項(xiàng)集的集合即為算法的輸出結(jié)果,關(guān)聯(lián)規(guī)則挖掘流程見(jiàn)圖1。運(yùn)用以下公式計(jì)算支持度和置信度:

      在商業(yè)銀行個(gè)人貸款業(yè)務(wù)中,銀行根據(jù)客戶提供的信息數(shù)據(jù)發(fā)放不同額度的貸款,客戶則根據(jù)簽訂的合同按期按額還款。現(xiàn)實(shí)生活中,少數(shù)客戶逾期還款或不還款現(xiàn)象增加了銀行相關(guān)業(yè)務(wù)風(fēng)險(xiǎn),提高了不良貸款率。銀行內(nèi)部審計(jì)理論上應(yīng)該盡可能地識(shí)別出此類(lèi)風(fēng)險(xiǎn),在客戶提供信息時(shí)作出判斷,決定是否對(duì)客戶進(jìn)行進(jìn)一步調(diào)查,以此降低業(yè)務(wù)風(fēng)險(xiǎn)。但僅憑客戶提交的基本信息,從橫向角度進(jìn)行單一分析很難得出有價(jià)值信息,因此需要對(duì)不同數(shù)據(jù)間的相關(guān)性、依賴性進(jìn)行多維度分析。

      二、模型和數(shù)據(jù)處理

      以A銀行某地區(qū)二級(jí)分行實(shí)際個(gè)人貸款業(yè)務(wù)為例。從個(gè)人信貸系統(tǒng)中隨機(jī)選取個(gè)人信用消費(fèi)貸款、個(gè)人綜合消費(fèi)貸款的客戶信息22,328條,數(shù)據(jù)指標(biāo)主要包括:客戶ID、名稱(chēng)、性別、出生日期、最高學(xué)歷、職業(yè)、職務(wù)、職稱(chēng)、貸款分類(lèi)、結(jié)清標(biāo)志、貸款余額、婚姻狀況、教育水平、月收入、住宅類(lèi)型等。其中,貸款五級(jí)分類(lèi)是指該筆貸款目前的狀態(tài),包括正常、關(guān)注、次級(jí)、可疑和損失五種類(lèi)型。鑒于主要分析貸款尚未結(jié)清的數(shù)據(jù),剔除系統(tǒng)錄入錯(cuò)誤、不符合實(shí)際情況的異常值以外,共剩余數(shù)據(jù)13,596條。

      由于關(guān)聯(lián)規(guī)則Apriori算法無(wú)法處理連續(xù)型數(shù)值變量,為了將原始數(shù)據(jù)轉(zhuǎn)換成適合建模的格式,需要對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步處理。根據(jù)各指標(biāo)的實(shí)際意義及分析要求,對(duì)部分指標(biāo)進(jìn)行統(tǒng)計(jì)學(xué)處理,最終選取10項(xiàng)指標(biāo)并作分類(lèi)說(shuō)明,見(jiàn)表1。

      三、關(guān)聯(lián)規(guī)則Apriori算法挖掘

      客戶根據(jù)自身需求向銀行申請(qǐng)貸款,需要提供上述信息給銀行,銀行根據(jù)各項(xiàng)信息指標(biāo),針對(duì)具體客戶進(jìn)行信用評(píng)級(jí),綜合考慮權(quán)衡各方因素,再抉擇是否發(fā)放貸款。綜合上述已發(fā)放貸款業(yè)務(wù)的客戶信息結(jié)果,顯示部分客戶貸款類(lèi)型LOANTYPE為UN狀態(tài)(包括次級(jí)、可疑、損失三類(lèi))。值得關(guān)注的是,具有哪些信息的客戶最有可能成為貸款類(lèi)型LOANTYPE為UN狀態(tài),即哪些指標(biāo)組成的項(xiàng)集對(duì)貸款類(lèi)型為UN的支持度最大。挖掘出這樣的項(xiàng)集,可為審計(jì)人員指明方向,提供識(shí)別可疑不良客戶的相關(guān)線索。

      利用R語(yǔ)言來(lái)實(shí)現(xiàn)Apriori算法,以表1中貸款類(lèi)型為UN的數(shù)據(jù)來(lái)建模,根據(jù)數(shù)據(jù)實(shí)際情況以及統(tǒng)計(jì)學(xué)理論,經(jīng)過(guò)多次分析實(shí)踐,最終將最小支持度和最小置信度分別設(shè)置為0.06和0.75,選取模型結(jié)果中支持度最大的2-項(xiàng)集和3-項(xiàng)集,運(yùn)行輸出的結(jié)果參數(shù)見(jiàn)表2。

      表2中3-項(xiàng)集,{SEX=M,POSITION=ZW2,

      MARITAL=MS2}對(duì){LOANTYPE=UN}的支持度為41.7%,該規(guī)則表明在貸款狀態(tài)為UN的客戶中,職務(wù)為非管理人員、婚姻狀況為已婚的男性概率達(dá)41.7%。{SEX=M,MARITAL=MS2,

      HOUSETYPE=HT2}對(duì){LOANTYPE=UN}的支持度為36.32%,該規(guī)則表明貸款狀態(tài)為UN的客戶中,住宅類(lèi)型為自購(gòu)房屋無(wú)貸款、婚姻狀況為已婚的男性概率達(dá)36.32%。該結(jié)果與2-項(xiàng)集的結(jié)果相吻合,即可以得出推論:在貸款狀態(tài)為UN的客戶中,住宅類(lèi)型為自購(gòu)房屋無(wú)貸款、職務(wù)為非管理人員的已婚男性客戶概率更大。

      為驗(yàn)證上述模型結(jié)果推論的準(zhǔn)確性,以貸款類(lèi)型為N的數(shù)據(jù)再次建模分析,同樣設(shè)置最小支持度和最小置信度為0.06和0.75,并選取支持度最小的項(xiàng)集,模型結(jié)果見(jiàn)表3。

      表3顯示,{CAREER=ZY8,MARITAL=MS2}對(duì){LOANTYPE=N}的支持度最低,為20.04%,該規(guī)則說(shuō)表明在貸款類(lèi)型為N的客戶中,若客戶職業(yè)為其他從業(yè)人員,且為已婚狀態(tài),其概率為20.04%;{SEX=M,POSITION=ZW2,JOBTITILE=T3,INCOME=INc2}對(duì){LOANTYPE=N}的支持度為20.67%,該規(guī)則表明貸款類(lèi)型為N的客戶中,若客戶為男性、無(wú)職稱(chēng)、收入在5000-9999元以及職務(wù)為非管理人員,其概率為20.67%;{SEX=M,MARITAL=MS2,EDUCATION=E1,HOUSETYPE=HT2}對(duì){LOANTYPE=N}的支持度為20.81%,該規(guī)則表明貸款類(lèi)型為N的客戶中,客戶為男性、婚姻狀況為已婚、教育水平為本科及以上(包括大專(zhuān))以及住宅類(lèi)型為自購(gòu)房屋無(wú)貸款的概率為20.81%。將該結(jié)果與表2進(jìn)行比較分析,發(fā)現(xiàn)兩者結(jié)果近似,進(jìn)一步表明在貸款類(lèi)型為UN中,若客戶為男性、住宅類(lèi)型為自購(gòu)房屋無(wú)貸款、職務(wù)為非管理人員以及婚姻狀況為已婚,其概率更大。

      四、結(jié)論與展望

      從關(guān)聯(lián)規(guī)則Apriori算法的兩種建模分析結(jié)果來(lái)看,兩個(gè)結(jié)果大致相同,比較符合實(shí)際情況,即在貸款類(lèi)型為UN的客戶群體中,男性、住宅類(lèi)型為自購(gòu)房屋無(wú)貸款、職務(wù)為非管理人員以及婚姻狀況為已婚的客戶概率更大?,F(xiàn)實(shí)生活中,這類(lèi)群體的生活狀況較穩(wěn)定且基數(shù)大,大多是工作、收入一般的男性群體,整個(gè)家庭擁有一套住房,但由于需要撫養(yǎng)父母子女,日常消費(fèi)金額相對(duì)較大,極易促成個(gè)人消費(fèi)貸款。審計(jì)人員在做個(gè)貸業(yè)務(wù)審計(jì)時(shí),可針對(duì)此類(lèi)貸款客戶的情況進(jìn)行進(jìn)一步研究。

      關(guān)聯(lián)規(guī)則等挖掘算法可以改善銀行內(nèi)部審計(jì)非現(xiàn)場(chǎng)分析過(guò)程存在的針對(duì)性不足問(wèn)題,為業(yè)務(wù)風(fēng)險(xiǎn)把控、客戶風(fēng)險(xiǎn)管理以及內(nèi)部非現(xiàn)場(chǎng)審計(jì)線索提供相關(guān)思路與建議。但由于本文采用的數(shù)據(jù)為客戶信用數(shù)據(jù)中的部分指標(biāo)數(shù)據(jù),對(duì)于已發(fā)放貸款客戶的最終貸款類(lèi)型評(píng)估來(lái)說(shuō),考慮的因素不夠全面,結(jié)果較為粗糙。因此,在實(shí)際內(nèi)審工作中,要綜合考慮多方面因素,同時(shí)結(jié)合其他成熟數(shù)據(jù)挖掘方法,提高評(píng)估的準(zhǔn)確性。

      內(nèi)部審計(jì)是商業(yè)銀行風(fēng)險(xiǎn)管理的第三道防線,是為銀行合規(guī)經(jīng)營(yíng)、高質(zhì)量發(fā)展保駕護(hù)航的關(guān)鍵所在。應(yīng)順應(yīng)發(fā)展趨勢(shì),提升計(jì)算機(jī)輔助審計(jì)技巧。面對(duì)銀行業(yè)積累的海量數(shù)據(jù),應(yīng)及時(shí)融入大數(shù)據(jù)技術(shù),如建設(shè)數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘平臺(tái)等。同時(shí),應(yīng)結(jié)合銀行內(nèi)部審計(jì)的需要,不斷推進(jìn)數(shù)據(jù)挖掘技術(shù)的實(shí)際應(yīng)用,將數(shù)據(jù)挖掘結(jié)果應(yīng)用到實(shí)際工作中,提升非現(xiàn)場(chǎng)挖掘可疑數(shù)據(jù)的有效性和準(zhǔn)確性,為現(xiàn)場(chǎng)審計(jì)提供技術(shù)支撐,實(shí)現(xiàn)審計(jì)的精準(zhǔn)定位。

      (作者單位:中國(guó)郵政儲(chǔ)蓄銀行審計(jì)局南昌分局,

      郵政編碼:330038,電子郵箱:819860249@qq.com)

      主要參考文獻(xiàn)

      施文君.基于關(guān)聯(lián)規(guī)則的線上線下雙層耦合社交網(wǎng)絡(luò)信息傳播規(guī)律研究[D].蚌埠:安徽財(cái)經(jīng)大學(xué), 2018

      王明哲,基于數(shù)據(jù)挖掘技術(shù)的信用卡客戶的信用評(píng)價(jià)[J].商場(chǎng)現(xiàn)代化, 2007(8):77-78

      許荻迪.基于關(guān)聯(lián)規(guī)則挖掘的商業(yè)銀行信貸產(chǎn)品交叉營(yíng)銷(xiāo)研究[J].商業(yè)經(jīng)濟(jì), 2017(3):103-106

      顏龍杰.關(guān)聯(lián)規(guī)則挖掘在銀行客戶信用評(píng)估中的應(yīng)用研究[D].武漢:中南民族大學(xué), 2015

      楊親瑤.交互可視化關(guān)聯(lián)規(guī)則挖掘的研究與實(shí)現(xiàn)[D].廣州:華南理工大學(xué), 2010

      猜你喜歡
      Apriori算法關(guān)聯(lián)規(guī)則內(nèi)部審計(jì)
      基于Hadoop平臺(tái)的并行DHP數(shù)據(jù)分析方法
      基于Apriori算法的高校學(xué)生成績(jī)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
      基于云平臺(tái)MapReduce的Apriori算法研究
      關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評(píng)價(jià)體系中的應(yīng)用
      現(xiàn)代企業(yè)內(nèi)部審計(jì)制度研究
      淺析SAP系統(tǒng)在石化企業(yè)內(nèi)部審計(jì)中的運(yùn)用
      新常態(tài)下集團(tuán)公司內(nèi)部審計(jì)工作研究
      關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
      基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)入侵檢測(cè)方法
      辛集市| 山阳县| 枞阳县| 峨山| 喀喇| 湘潭县| 晋城| 常山县| 鄢陵县| 鸡东县| 棋牌| 玛曲县| 林甸县| 丹东市| 茌平县| 德庆县| 自贡市| 榕江县| 沙雅县| 汽车| 林芝县| 长子县| 蒙山县| 平潭县| 集安市| 姜堰市| 怀仁县| 涟源市| 太仓市| 霍州市| 白水县| 沅陵县| 广元市| 江都市| 锡林浩特市| 客服| 新沂市| 庆安县| 普安县| 沙河市| 临湘市|