• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數據挖掘技術的外匯管理內部審計方法探索

      2020-07-26 14:28褚偉金岳成林志永何潯麗汪東平
      中國內部審計 2020年7期
      關鍵詞:分類管理聚類分析數據挖掘

      褚偉 金岳成 林志永 何潯麗 汪東平

      [摘要]本文以企業(yè)貨物貿易分類管理有效性審計為例,運用SAS軟件中的分類相關模型,通過對以往的企業(yè)分類情況進行訓練形成分類規(guī)則,實現(xiàn)模擬業(yè)務人員進行企業(yè)分類篩選,將模擬篩選的企業(yè)與現(xiàn)實分類企業(yè)作比,對不一致的企業(yè)進行現(xiàn)場審計分析,以發(fā)現(xiàn)分類管理中存在的風險。

      [關鍵詞]數據挖掘 ? ?聚類分析 ? ?分類管理 ? ?內部審計

      近年來,外匯局不斷推進“數字外管”建設,已開發(fā)20多個業(yè)務系統(tǒng)、采集海量業(yè)務與管理數據,同時,外匯局內審人員短缺,現(xiàn)有分支局少有內審專設機構,支局內審人員多為兼職,內部審計項目主要依靠總局、分局開展。為緩解審計人員少、審計任務多之間的矛盾,外匯局嘗試利用數據挖掘技術,在審計項目實施過程中,通過對現(xiàn)有外匯管理信息系統(tǒng)進行數據挖掘、分析,快速發(fā)現(xiàn)審計重點,合理配置審計資源,提升內部審計效率,更好發(fā)揮內部審計增加組織價值的作用。

      一、數據挖掘的概念及相關方法

      1995年,數據挖掘概念在美國計算機年會上被提出,這一概念的主要內容是從大量的、模糊的、有噪聲的現(xiàn)實數據中,提取人們不知道但又包含其中并可以被人們利用的知識和信息的過程,內含數據準備、數據處理、結果分析和評估等步驟。通過數據挖掘,可以讓模糊無關聯(lián)的數據,經過整理、加工、改造成清晰識別的狀態(tài),從而發(fā)現(xiàn)背后隱藏的邏輯關系。其中,聚類以及分類預測是數據挖掘過程中使用的關鍵方法。

      聚類分析最本質的思想是實現(xiàn)“物以類聚”。聚類分析要解決的問題是事先不知道所研究的對象應分為幾類,更不知道觀測個體的具體分類情況,其目的是通過對觀測數據進行分析,選擇一種能夠度量個體間接近程度的統(tǒng)計量,從而確定分類數目,建立一種有效的分類方法,并按接近程度對觀測個體給出合理的分類。分類和預測可以用于提取描述重要數據類的模型以及預測數據未來的趨勢。SAS軟件中實現(xiàn)聚類以及分類預測常用的模型有以下幾種:一是決策樹(Decision Tree),主要用于數據分類,通常包括特征選擇、決策樹生成以及決策樹的剪枝等過程,最后通過決策樹形成規(guī)則,再把規(guī)則運用到新事物的分類中去;二是人工神經網絡(Neural Networks),即從結構上模仿生物中的神經網絡,通過訓練來學習的非線性預測模型,運用在數據挖掘中進行分類、聚類特征采掘等;三是隨機森林(Random Forest),作為決策樹的一種拓展,但不同于決策樹,具有雙重隨機性,即達到數據樣本采樣的隨機性以及數據特征的隨機性;四是支持向量機(Support Vector Machine),即一類按監(jiān)督學習方式對數據進行二元分類的廣義線性分類器,具有穩(wěn)健性和稀疏性等特點,廣泛運用在人像識別、文本分類等模式識別中。

      二、數據挖掘在外匯局內部審計中的可行性分析

      (一)外匯局信息化建設為內部審計數據挖掘提供可能

      外匯局不斷加強信息化建設頂層制度設計,完善適應外匯管理信息系統(tǒng)的軟硬件環(huán)境和技術路線,并從“技術支持業(yè)務改革”向“技術引導業(yè)務改革”方向發(fā)展,逐步加強技術推動和引導業(yè)務改革。根據宏觀調控決策、微觀分析預測和外匯業(yè)務管理的需要,外匯局一方面加強外匯監(jiān)管和統(tǒng)計手段的信息化建設,提升監(jiān)管業(yè)務水平;另一方面探索逐步實現(xiàn)內審內控電子化與系統(tǒng)化,強化內部管控能力。目前,已開發(fā)使用銀行結售匯統(tǒng)計、貨物貿易、服務貿易、資本項目信息管理等20多個業(yè)務管理系統(tǒng)(見表1)以及適用于內審內控項目的實施、測評分析與整改的內控風險測評系統(tǒng)。至此,建立起覆蓋外匯統(tǒng)計、信息管理、內部管控等全方位、多方面的系統(tǒng)平臺,基本形成以數據采集、業(yè)務監(jiān)管、網上服務為基礎支撐的信息系統(tǒng)架構。

      (二)外匯管理理念轉變?yōu)閮炔繉徲嫈祿诰蛱峁┲С?/p>

      2009年以來,外匯局大力實踐外匯管理理念和方式“五個轉變”,從傳統(tǒng)的依賴審批和核準的管理方式轉變?yōu)橹攸c加強跨境資金流動的監(jiān)測分析和預警,從重事前監(jiān)管、行為管理轉變?yōu)閺娬{事后核查、主體監(jiān)管;從“有罪假設”轉變?yōu)椤盁o罪假設”,從“正面清單”轉變?yōu)椤柏撁媲鍐巍钡?,新一階段的外匯管理工作開展著力于改善服務,側重于科學監(jiān)測和風險防控。為更好地滿足“五個轉變”的履職需要,外匯管理人員快速轉變理念、改進方式、提高素質,尤其在監(jiān)測分析方面實現(xiàn)了質的飛躍,在數據資源的監(jiān)測、分析、利用取得了較好成效。因此,把數據挖掘技術運用到外匯管理內審工作中,通過大數據挖掘和分析提升內審工作效率,既十分必要也頗為可行。

      三、貨物貿易分類管理有效性審計思路

      (一)外匯局貨物貿易分類管理現(xiàn)狀

      2012年,外匯局取消原先的核銷制度,推行以分類管理為核心的貨物貿易外匯管理改革。為保證企業(yè)貿易外匯收支,購匯結匯具有真實、合法的交易背景,與真實貨物進出口情況一致,外匯局采集企業(yè)收支數據及貨物流數據,建立了進出口貨物流與收付匯資金流匹配的核查機制,對企業(yè)貿易外匯收支進行非現(xiàn)場總量核查和監(jiān)測。

      實務操作中,所有發(fā)生貨物貿易外匯收支的企業(yè)都需提前到外匯局進行名錄登記,不在名錄的企業(yè)不能辦理貿易外匯收支業(yè)務。對于所有進入名錄企業(yè)庫的企業(yè),外匯局將其分成A、B、C三類。其中A類企業(yè)是按照無罪假設推定的,所有進入名錄企業(yè)庫的企業(yè)經過3個月輔導期后,都歸類為A類企業(yè)。B/C類企業(yè)是外匯局分類監(jiān)管的重點,外匯局監(jiān)管部門需要根據采集到的企業(yè)收支信息和海關貨物流信息,通過非現(xiàn)場核查和現(xiàn)場核查的方式來分析判斷可能存在的異?;蜻`規(guī)行為,據此對企業(yè)進行降級處理,并對落入到B/C類的企業(yè)采取不同的監(jiān)管措施。

      對于B/C類企業(yè)的確定,外匯局采用“系統(tǒng)指標+人工核查”的方式。外匯局對于貨物貿易企業(yè)日常監(jiān)管依靠“貨物貿易外匯監(jiān)測系統(tǒng)”,系統(tǒng)通過指標對異常企業(yè)進行預警。現(xiàn)有貨物貿易監(jiān)測指標包括總量差額、總量差額率、資金貨物比等。各地監(jiān)測人員按照地區(qū)實際設置指標閾值,并將閾值報備外匯管理總局,監(jiān)測人員不能隨意更改閾值設置。對于超過系統(tǒng)閾值的企業(yè),系統(tǒng)會將上述企業(yè)落入“重點監(jiān)測庫”,由監(jiān)測人員對其進行二次篩選。二次篩選過程中,需要結合各個指標,依靠監(jiān)測人員經驗,通過非現(xiàn)場核查和現(xiàn)場核查,進行B/C類企業(yè)的最終確定。

      (二)企業(yè)分類監(jiān)管中的審計要點

      分類監(jiān)管是貨物貿易外匯管理改革的核心,分類準確性在貨物貿易日常管理中起至關重要的作用??梢哉f,分類的準確與否關系到日常監(jiān)管是否有效乃至貨物貿易改革成敗。但在實際監(jiān)管中,分類監(jiān)管也存在風險,一是由于企業(yè)眾多,落入重點監(jiān)測庫的企業(yè)也很多,對企業(yè)的分類篩選工作量極大,以A分局為例,該分局轄內共有名錄企業(yè)6萬多家,一般指標篩選后落入重點監(jiān)測庫的企業(yè)在6000家左右,監(jiān)管人員要對這些企業(yè)進行二次篩選,工作量很大,可能存在工作疏忽,致使應納入B/C類的企業(yè)沒有納入;二是可能存在廉政風險,監(jiān)管人員在日常監(jiān)管中,出于人情等原因,把應納入B/C類的企業(yè)沒有納入。

      傳統(tǒng)內部審計方式難以有效發(fā)現(xiàn)上述問題。一般而言,監(jiān)管人員只能發(fā)現(xiàn)不應納入B/C類而被納入的企業(yè),因為對此類企業(yè),操作規(guī)程要求監(jiān)測人員留有分類資料,而對應納入B/C類未納入的企業(yè),往往不留存任何監(jiān)測資料。同時,二次篩選過程是監(jiān)測人員根據多個指標依靠經驗綜合把握的,審計人員無法提供有利證據證明應納入B/C類而沒有納入的企業(yè)。

      (三)基于分類和聚類數據挖掘的審計思路

      對于企業(yè)分類監(jiān)管的審計,關鍵是尋找那些應納入B/C類而沒有納入的企業(yè)。最好的方法是模擬審計對象日常監(jiān)測人員自己的行為模式,運用計算機數據挖掘功能學習該模式,并將該模式運用到實際數據中,從而找到要找的企業(yè)。因此可以使用SAS中的分類相關模型,通過對以往的企業(yè)分類情況進行訓練,從而構筑有效的分析模型,實現(xiàn)模擬業(yè)務人員對企業(yè)進行分類篩選。將計算機通過模擬篩選出來的企業(yè)與現(xiàn)實分類得到的企業(yè)作比,對不一致的企業(yè)進行現(xiàn)場審計分析,找到審計重點,發(fā)現(xiàn)被審計單位的風險。

      四、案例分析:在B分局監(jiān)管數據與分類模型基礎上建立審計模型

      (一)分類模型的建立

      對審計對象B分局分類模型運用SAS軟件中的決策樹、人工神經網絡、隨機森林、支持向量機等模型來實現(xiàn)對企業(yè)群組的分析和異常企業(yè)篩查,并通過對比不同分類算法來選取準確率最好的分類模型。監(jiān)管指標及特征值選取過程中,對于貨物貿易企業(yè)收支行為的判斷與分析需要以貨物流與資金流數據為依托。為此,通過被審計單位監(jiān)測業(yè)務人員評估,確定9類基礎數據指標(見表2),并在這9類基礎指標基礎上加工形成10個輸入指標作為SAS模型構建的特征值(見表3)。其中,總量差額、資金貨物規(guī)模2個指標為總量數值型指標,反映對象企業(yè)的整體收支規(guī)模和業(yè)務體量;總量差額率、資金貨物比、貿易信貸報告余額比率、進口付匯率、出口收匯率5個指標為比例型數值指標,反映對象企業(yè)的外匯收支特征及貨物資金流動特征,是進行企業(yè)聚類分析的重要判斷基礎;企業(yè)分類信息為枚舉型指標,以貨物貿易監(jiān)測系統(tǒng)中登記分類信息作為初始依據。

      (二)數據采集及加工

      審計對象B分局轄內共有4830家已名錄登記的貨物貿易企業(yè),為有效過濾短期數據中的噪音和無意義波動,在此所有企業(yè)相關基礎數據均以2017年1月至2018年6月之間的累計加總數據作為基礎變量。剔除在此期間未發(fā)生任何收支行為的企業(yè)1041家,共構建3789條企業(yè)基礎信息集合。為有效驗證分類預測效果,根據數據挖掘的目標,采用分類抽樣的方式,從3789條中隨機選取1895條信息作為訓練集,并將3789條全部數據作為評分測試集合。

      在數據挖掘過程中,缺失值及異常值會導致最終挖掘結果的偏差,甚至造成混亂的挖掘結果,在建立基礎數據集合后需要對缺失元素的數據對象進行缺失值填充,并修正會對挖掘結果產生較大影響的異常值。在實際對數據預處理的過程中發(fā)現(xiàn),因為現(xiàn)有業(yè)務數據已經進行了標準統(tǒng)一,無需數據清洗,僅將缺失數據進行補0處理。同時針對貨物貿易企業(yè)分類規(guī)則,將A類企業(yè)標識為0,B/C類企業(yè)標識為1,作為建模的目標變量。

      (三)基于SAS的模型實現(xiàn)過程

      在模型實現(xiàn)過程中,主要應用了SASEG和SASEM兩個主要功能模塊,其中通過SASEG實現(xiàn)對原始基礎數據集的整理,并變換為標識的SAS數據文件,在SASEM中實現(xiàn)分類模型的構建,選取50%的數據記錄作為樣本訓練,新建EM流程,選取決策樹、人工神經網絡、隨機森林、支持向量機等備選算法構筑模型,并對算法的效果進行匹配比較。通過運行流程,得出不同算法間的效果比較,最終結果顯示隨機森林算法要優(yōu)于其他算法類型,并將其作為模型構建的基礎。構建的SAS模型會通過訓練集生成相應的分類規(guī)則,根據訓練的規(guī)則對完整評分數據集進行評分,并輸出分析結果。

      (四)模型運行結果及效果評價

      在B分局評分集合的3789條企業(yè)數據中,已登記確認為B/C類企業(yè)的數量為149個。在分類模型預測中,評分前60的企業(yè)中確認B/C類企業(yè)57家,占比95%;在評分前100的企業(yè)中確認B/C類企業(yè)81家,占比81%;評分前200的企業(yè)中確認B/C類企業(yè)100家,占比50%,占現(xiàn)有已登記B/C類企業(yè)總數149個的67.6%;評分前500的企業(yè)中確認B/C類企業(yè)113家,占比22.6%,占已登記B/C類企業(yè)總數的67.6%。

      可見,一是模型生產的分類規(guī)則能夠有效覆蓋大多數潛在異常企業(yè)特征,并生成有效的評分規(guī)則(見表4);二是審計人員可以重點關注未納入B/C類企業(yè)的原因,特別是可將前100名中沒有納入B/C類企業(yè)的19家企業(yè)作為審計重點,審查是否存在疏忽或廉政風險。

      五、數據挖掘在外匯局內部審計中的運用展望

      數據挖掘作為一種當今流行的技術手段,在外匯局內部審計中具有廣闊的運用前景。一是不僅在貨物貿易管理審計中可以運用,在外匯檢查、資本項目管理等業(yè)務管理領域同樣適用。如在外匯檢查領域,外匯檢查業(yè)務是外匯局相對風險較高的業(yè)務領域,外匯局具有檢查權的分支機構眾多,但外匯局內審人員有限,因此需要尋找高風險分支機構優(yōu)先開展審計,通過數據挖掘篩選重點分支機構不失為一條可行的路徑。相對于隨機抽取分支機構開展審計,可依托于外匯案件信息管理系統(tǒng)的海量數據,先對全國有檢查權的外匯局進行一次聚類分析。按照行政代碼提取全國已完成行政處罰的外匯案件數據,通過效果性指標(處罰筆數、處罰金額)、效率指標(立案時間與完結時間差、立案時間與處罰時間差)、規(guī)模指標(結售匯、收支額、違規(guī)金額)等按照行政代碼進行聚類,尋找規(guī)模大但效果差、效率低的分支機構優(yōu)先開展內部審計。二是數據挖掘手段不僅有聚類、分類預測,還可以運用關聯(lián)分析、時間序列分析、孤立點分析等工具。外匯局收集的數據大多按時間采集,具有時間序列特征,且匯率、國際收支、進出口、外匯管理履職等方面具有明顯的關聯(lián),因此通過時間序列分析、關聯(lián)分析等可以有效考查審計對象履職績效水平。如外匯檢查案件同案不同罰的情況,可通過案件編號提取罰沒款金額、違規(guī)金額等數據,以孤立點分析技術尋找罰款比例明顯高于同類的案件,確定審計重點。三是數據挖掘不僅可以提升外匯局內審工作效率,還可以增強內審工作的科學性、針對性、有效性,切實服務外匯管理中心大局。如國際收支平衡管理是外匯局的中心任務,內審部門可通過數據挖掘手段檢驗國際收支平衡管理成效,提出決策建議,切實發(fā)揮內審咨詢服務和價值增值作用。

      (作者單位:國家外匯管理局上海市分局,郵政編碼:200120,電子郵箱:jin_yue_cheng@126.com)

      猜你喜歡
      分類管理聚類分析數據挖掘
      分類管理背景下浙江省民辦高校政府財政扶持探析
      數據挖掘綜述
      軟件工程領域中的異常數據挖掘算法
      我國外貿企業(yè)客戶分類管理探析
      利益相關者視角下四川省實施民辦高校分類管理的研究
      對西部醫(yī)學院校教師進行分類管理的思考
      農村居民家庭人均生活消費支出分析
      基于省會城市經濟發(fā)展程度的實證分析
      基于聚類分析的互聯(lián)網廣告投放研究
      基于R的醫(yī)學大數據挖掘系統(tǒng)研究
      海阳市| 金湖县| 铁岭县| 衢州市| 元阳县| 七台河市| 浑源县| 沿河| 商水县| 宾阳县| 淮阳县| 青海省| 临沧市| 盐城市| 天津市| 北川| 会东县| 曲沃县| 从江县| 牙克石市| 广东省| 东丰县| 鹤庆县| 陵水| 新干县| 日喀则市| 乌拉特后旗| 东光县| 万源市| 安龙县| 遂平县| 社会| 北安市| 清远市| 塔城市| 射阳县| 武山县| 永清县| 石城县| 兰西县| 绥中县|