• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      聚類分析在內(nèi)部審計(jì)中的應(yīng)用研究

      2019-02-16 11:38杜潔李芹潘媛李玲璠孫銀博何加攀
      中國(guó)管理信息化 2019年1期
      關(guān)鍵詞:means算法聚類分析內(nèi)部審計(jì)

      杜潔 李芹 潘媛 李玲璠 孫銀博 何加攀

      [摘 要] 聚類分析的目的是將收集到的數(shù)據(jù)按照某一特征進(jìn)行分類,形成相似元素的集合。在內(nèi)部審計(jì)中的應(yīng)用是通過(guò)收集各個(gè)業(yè)務(wù)領(lǐng)域的數(shù)據(jù),運(yùn)用聚類分析,發(fā)現(xiàn)同類數(shù)據(jù)間的差距,根據(jù)差異分析出疑點(diǎn)數(shù)據(jù),從而提出審計(jì)意見(jiàn),解決了傳統(tǒng)審計(jì)管理效率低、實(shí)施難等問(wèn)題。實(shí)驗(yàn)結(jié)果表明,通過(guò)該算法能夠快速高效地發(fā)現(xiàn)各業(yè)務(wù)領(lǐng)域的疑點(diǎn)數(shù)據(jù),為審計(jì)工作提供了依據(jù)和新的方式,提高了工作效率和收益。

      [關(guān)鍵詞] 聚類分析;k-means算法;疑點(diǎn)數(shù)據(jù);內(nèi)部審計(jì)

      doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 01. 001

      [中圖分類號(hào)] F239.45 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2019)01- 0004- 03

      0 引 言

      聚類分析應(yīng)用于醫(yī)學(xué)、市場(chǎng)分析、信息安全、金融等多個(gè)領(lǐng)域。目前,在內(nèi)部審計(jì)中的應(yīng)用主要是在企業(yè)和同業(yè)間的差距分析,很少針對(duì)業(yè)務(wù)數(shù)據(jù)存在的問(wèn)題進(jìn)行分析,傳統(tǒng)的內(nèi)部審計(jì)限于單一的看賬、查賬,難以發(fā)現(xiàn)數(shù)據(jù)底層的潛在問(wèn)題,為了讓內(nèi)部審計(jì)有一個(gè)質(zhì)的提升,采用聚類對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分析與挖掘去發(fā)現(xiàn)深層次的問(wèn)題,所以面對(duì)不同的業(yè)務(wù)數(shù)據(jù)采用不同的分析手段成為當(dāng)前研究的熱點(diǎn)與難題,但很少在內(nèi)部審計(jì)方面應(yīng)用。本文針對(duì)內(nèi)部審計(jì)的業(yè)務(wù)數(shù)據(jù)采用k-means聚類方法對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分析,并取得了不錯(cuò)的結(jié)果,填補(bǔ)了對(duì)內(nèi)部審計(jì)業(yè)務(wù)數(shù)據(jù)分析的空白。

      1 聚類分析的原理及分類

      1.1 聚類分析的原理

      聚類分析的基本原理是,根據(jù)對(duì)象自身屬性,運(yùn)用統(tǒng)計(jì)方法根據(jù)某種差異性和相似性,得到對(duì)象間的相似性關(guān)系,按照相似性關(guān)系對(duì)對(duì)象進(jìn)行分組聚類,可能提供多個(gè)分析結(jié)果解,需要根據(jù)實(shí)際情況提供主觀判斷和后續(xù)的分析。

      1.2 聚類分析的分類

      目前聚類方式有三類:一是系統(tǒng)聚類,用于對(duì)小樣本的對(duì)象間聚類以及對(duì)變量聚類。二是有序樣品聚類,對(duì)有排序次序的樣本的對(duì)象間聚類,要求是次序相鄰的對(duì)象才能聚為一類。三是動(dòng)態(tài)聚類,適用于樣本量大時(shí)對(duì)象間的聚類,一般用k-means法處理。由于內(nèi)部審計(jì)一般依靠歷史數(shù)據(jù),提出有價(jià)值的工作建議,所以由于涉及內(nèi)部審計(jì)的業(yè)務(wù)數(shù)據(jù)量較大,所以本文采用第三種聚類分析方式。

      2 聚類方法k-means算法

      2.1 k-means算法基本原理

      k指的是將數(shù)據(jù)集分為簇的個(gè)數(shù),means指的是簇內(nèi)對(duì)象的均值。如果簇內(nèi)的相似性越大,簇間的差別性越大,那么聚類效果就越好。相似度是根據(jù)聚類對(duì)象的平均值進(jìn)行計(jì)算,其算法步驟如下:

      (1)從數(shù)據(jù)集中任意選取k個(gè)點(diǎn)作為初始質(zhì)心,即每個(gè)簇的均值,其中,質(zhì)心的計(jì)算方法是:除去第一次質(zhì)心手動(dòng)指定外,以后的質(zhì)心都是由計(jì)算均值獲得。

      (2)根據(jù)數(shù)據(jù)點(diǎn)到質(zhì)心的距離將剩余的每個(gè)對(duì)象收歸到最近的質(zhì)心所在的簇中。

      (3)根據(jù)分類結(jié)果重新計(jì)算每個(gè)簇(有變化)的質(zhì)心或平均值。重復(fù)進(jìn)行(2)、(3)步驟,直到質(zhì)心不再改變,即準(zhǔn)則算法函數(shù)收斂,采用平方誤差準(zhǔn)則:

      2.2 k-means過(guò)程示意圖

      2.3 k-means算法優(yōu)缺點(diǎn)分析

      k-means算法的時(shí)間復(fù)雜度為:O(nkt)。其中,k指聚類簇?cái)?shù),t指迭代次數(shù),n指對(duì)象數(shù),所以對(duì)于處理大數(shù)據(jù)集時(shí),具有高效性,而且實(shí)現(xiàn)方式簡(jiǎn)單、快速。通過(guò)實(shí)驗(yàn)表明,k-means對(duì)于處理簇接近高斯分布時(shí),效果更好。因?yàn)閗-means需要事先指定k作為初始質(zhì)心,對(duì)k的選取會(huì)導(dǎo)致不同的分析結(jié)果,所以對(duì)于一些事先需要分類的數(shù)據(jù)分析效果不好,影響最終分析結(jié)果。對(duì)“噪聲”和孤立點(diǎn)數(shù)據(jù)較為敏感,容易對(duì)均值產(chǎn)生較大影響,且分析只能保證局部最優(yōu),不能保證全局最優(yōu)。

      3 內(nèi)部審計(jì)的應(yīng)用

      3.1 R語(yǔ)言實(shí)現(xiàn)k-means算法

      由于內(nèi)部審計(jì)涉及的營(yíng)銷、財(cái)務(wù)等多個(gè)業(yè)務(wù),所以本文針對(duì)以紅河建水居民用電量為例子使用R語(yǔ)言實(shí)現(xiàn)k-means算法進(jìn)行分析,來(lái)體現(xiàn)聚類算法在內(nèi)部審計(jì)中的應(yīng)用。具體實(shí)現(xiàn)流程如下。

      3.1.1 標(biāo)準(zhǔn)化處理

      分析數(shù)據(jù)可能存在量綱不同的情況,如體重和身高,它們量綱不同,體重可能在40-60kg間,身高可能在140-170cm之間,那么就需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理。若直接用原數(shù)據(jù)分析,可能會(huì)加強(qiáng)數(shù)值較高的指標(biāo)在分析結(jié)果的作用,削弱數(shù)值較低的指標(biāo)在分析結(jié)果的作用。數(shù)據(jù)標(biāo)準(zhǔn)化公式:

      3.1.2 輪廓系數(shù)

      3.2 實(shí)驗(yàn)結(jié)果

      經(jīng)過(guò)k-means聚類分析得到疑點(diǎn)數(shù)據(jù)表(見(jiàn)表1)。

      從疑點(diǎn)數(shù)據(jù)表中可知:在重度用電客戶簇中,有一個(gè)疑點(diǎn)用戶,在輕度用電客戶簇中有9個(gè)疑點(diǎn)用戶都可能存在偷電等情況的發(fā)生。經(jīng)過(guò)實(shí)際有關(guān)人員對(duì)這些用戶的調(diào)查,確實(shí)發(fā)現(xiàn)存在問(wèn)題。實(shí)驗(yàn)結(jié)果表明該算法能夠?yàn)閮?nèi)部審計(jì)提供審計(jì)依據(jù),提高了工作效率。

      4 結(jié) 論

      聚類分析算法在內(nèi)部審計(jì)涉及數(shù)據(jù)分析與挖掘方面都可能用到,傳統(tǒng)的內(nèi)部審計(jì)的分析都是通過(guò)Excel、SQL等方式進(jìn)行分析,對(duì)于復(fù)雜且數(shù)據(jù)量大的數(shù)據(jù)分析過(guò)程會(huì)變得相對(duì)復(fù)雜,而使用R語(yǔ)言實(shí)現(xiàn)的聚類分析能夠快速高效地得出分析結(jié)果。為審計(jì)人員提供了直接、高效的審計(jì)依據(jù)。本文主要是針對(duì)大工業(yè)用電的電費(fèi)與電量進(jìn)行分析,證明算法的簡(jiǎn)單、高效與實(shí)用性強(qiáng),但只考慮了接近高斯分布類型的數(shù)據(jù),在實(shí)際應(yīng)用中,會(huì)涉及不同的數(shù)據(jù)類型,有很多針對(duì)不同數(shù)據(jù)類型的改進(jìn)算法,需要進(jìn)一步研究。

      主要參考文獻(xiàn)

      [1]方匡南.基于數(shù)據(jù)挖掘的分類和聚類算法研究及R語(yǔ)言實(shí)現(xiàn)[D].廣州:暨南大學(xué),2007.

      猜你喜歡
      means算法聚類分析內(nèi)部審計(jì)
      農(nóng)村居民家庭人均生活消費(fèi)支出分析
      淺析SAP系統(tǒng)在石化企業(yè)內(nèi)部審計(jì)中的運(yùn)用
      新常態(tài)下集團(tuán)公司內(nèi)部審計(jì)工作研究
      基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
      圖書館內(nèi)部控制建設(shè)的深度思考
      基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
      基于K—Means聚類算法入侵檢測(cè)系統(tǒng)研究
      基于Weka的Apriori算法在原油產(chǎn)量預(yù)測(cè)中的應(yīng)用
      “縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營(yíng)統(tǒng)計(jì)一套”表輔助決策模式研究
      基于HSI顏色空間的小麥粉精度自動(dòng)識(shí)別研究
      潢川县| 得荣县| 茶陵县| 老河口市| 亳州市| 乐亭县| 沙湾县| 精河县| 会宁县| 高雄市| 交口县| 佛教| 鄂托克前旗| 名山县| 信宜市| 开原市| 缙云县| 绥芬河市| 万载县| 榆林市| 梅河口市| 黑山县| 颍上县| 玉龙| 寿阳县| 永德县| 襄垣县| 托里县| 沁源县| 固阳县| 余姚市| 江陵县| 恭城| 清丰县| 观塘区| 龙山县| 鄂尔多斯市| 德江县| 长治县| 九台市| 应城市|