• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)分析挖掘技術(shù)在審計(jì)中的運(yùn)用

      2020-11-06 06:01廖智瑋袁靜
      市場(chǎng)觀察 2020年9期

      廖智瑋 袁靜

      摘? 要:隨著信息化水平的不斷提高,被審計(jì)單位的數(shù)據(jù)呈現(xiàn)出海量化趨勢(shì)的特征,數(shù)據(jù)分析方法和分析工具也層出不窮,能夠直接運(yùn)用到審計(jì)實(shí)踐的方法和工具同樣比較多。熟悉各種工具的優(yōu)缺點(diǎn)和適用范圍,有利于審計(jì)人員在不同審計(jì)環(huán)境下選擇合適的方法和工具進(jìn)行審計(jì)工作,同時(shí)可以輔助審計(jì)人員在海量數(shù)據(jù)中發(fā)現(xiàn)疑點(diǎn),為數(shù)據(jù)式審計(jì)提供重要途徑。

      關(guān)鍵詞:數(shù)據(jù)審計(jì);數(shù)據(jù)分析挖掘;方法工具

      隨著信息化水平的不斷提高,被審計(jì)單位數(shù)據(jù)海量化的趨勢(shì)越來(lái)越凸顯。運(yùn)用大數(shù)據(jù)分析技術(shù),探索被審計(jì)單位數(shù)據(jù)海量化形勢(shì)下適當(dāng)?shù)膶徲?jì)方法和應(yīng)用技巧,是當(dāng)前審計(jì)工作領(lǐng)域面臨的重要挑戰(zhàn)。數(shù)據(jù)分析作為一種新的計(jì)算機(jī)審計(jì)方法,熟悉并掌握數(shù)據(jù)分析技術(shù),能夠輔助審計(jì)人員在海量數(shù)據(jù)中發(fā)現(xiàn)疑點(diǎn),可為數(shù)據(jù)式審計(jì)提供重要途徑。

      常用的數(shù)據(jù)分析挖掘方法

      數(shù)據(jù)分析挖掘方法有很多種,如聚類分析、關(guān)聯(lián)分析、序列模式等,下面將逐一介紹。

      1.聚類分析,或稱分類分析、數(shù)值分類,指將集合按照類似原則把具體對(duì)象分組為多個(gè)類的過(guò)程。如在對(duì)物資采購(gòu)業(yè)務(wù)進(jìn)行審計(jì)時(shí),為檢查采購(gòu)業(yè)務(wù)各環(huán)節(jié)的內(nèi)部控制執(zhí)行情況,可以用聚類分析方法將被審計(jì)單位的所有采購(gòu)業(yè)務(wù),并按相似特征進(jìn)行分析,而不需要逐一鑒別采購(gòu)業(yè)務(wù),以此達(dá)到減少重復(fù)工作的同時(shí)提高審計(jì)工作效率的目的。

      2.關(guān)聯(lián)分析,或稱關(guān)聯(lián)挖掘,指在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項(xiàng)目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)。如在對(duì)某產(chǎn)品成本核算進(jìn)行審計(jì)時(shí),面對(duì)海量的人、材、工、費(fèi)等眾多數(shù)據(jù),可采用該方法分析發(fā)現(xiàn)產(chǎn)品生產(chǎn)數(shù)據(jù)之間的關(guān)聯(lián)性,并結(jié)合存貨盤庫(kù)、出入庫(kù)記錄等數(shù)據(jù)信息,推斷出產(chǎn)品成本是否合理。

      3.序列模式,指挖掘相對(duì)時(shí)間或出現(xiàn)頻率高的方法。如在對(duì)某單位經(jīng)費(fèi)管理進(jìn)行審計(jì)時(shí),可利用序列模式挖掘出被審計(jì)單位經(jīng)費(fèi)賬目數(shù)據(jù)中,一些經(jīng)常以某種規(guī)律出現(xiàn)的事件序列模式,通過(guò)分析這些頻繁發(fā)生的時(shí)間序列模式,可幫助審計(jì)人員發(fā)現(xiàn)其中的異常現(xiàn)象。

      常用的數(shù)據(jù)分析挖掘工具

      當(dāng)前可用的數(shù)據(jù)分析挖掘工具比較多,常見的有K- Miner、Excel、SQL Server、IBM SPSS 等。

      1.Excel軟件工具。Excel是審計(jì)人員最為熟悉和接受程度較高的軟件,以其簡(jiǎn)單性、易操作性在計(jì)算機(jī)審計(jì)工作中已經(jīng)得到了廣泛應(yīng)用。除了基本的統(tǒng)計(jì)分析,借助Microsoft公司為 Excel2007以后版本提供的外接程序Dmaddin.msi,還可以進(jìn)行數(shù)據(jù)分析挖掘。

      2.SQL Server分析服務(wù)。Microsoft SQL Server分析服務(wù)是與數(shù)據(jù)庫(kù)SQL Server 服務(wù)并列的服務(wù),其整合了后臺(tái)數(shù)據(jù)庫(kù)服務(wù)和前臺(tái)商業(yè)應(yīng)用程序,充分發(fā)揮了數(shù)據(jù)庫(kù)服務(wù)器對(duì)關(guān)系數(shù)據(jù)的管理能力和分析服務(wù)對(duì)數(shù)據(jù)分析挖掘結(jié)構(gòu)的管理能力。審計(jì)人員可以通過(guò)導(dǎo)入、導(dǎo)出數(shù)據(jù)工具以及查詢分析器,進(jìn)行對(duì)數(shù)據(jù)的清洗、轉(zhuǎn)換和抽取等步驟。

      3.IBM SPSS軟件工具及SPSSAU。SPSS是IBM公司推出的“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件,也是目前運(yùn)用比較廣泛的一款工具。另外,北京青絲科技有限公司開發(fā)了網(wǎng)頁(yè)版數(shù)據(jù)科學(xué)算法平臺(tái)工具——SPSSAU[[[]北京青絲科技有限公司.幫助手冊(cè)[DB/OL].https://spssau.com/front/spssau/index.html.]],該平臺(tái)工具包含了IBM SPSS軟件的大部分功能,但其操作更加簡(jiǎn)單、分析更加智能,只需導(dǎo)入數(shù)據(jù),即可實(shí)現(xiàn)“傻瓜式”操作,對(duì)于沒有SPSS軟件運(yùn)用基礎(chǔ)的審計(jì)人員而言是一種更好的替代工具。

      4.神通K- Miner。該軟件是神舟通用數(shù)據(jù)技術(shù)有限公司的商務(wù)智能數(shù)據(jù)分析挖掘工具,以數(shù)據(jù)挖掘標(biāo)準(zhǔn)CRISP-DM為基礎(chǔ),可對(duì)數(shù)據(jù)分析挖掘過(guò)程進(jìn)行擴(kuò)展和增強(qiáng),使得審計(jì)人員能夠建立和實(shí)施以模型生命周期管理為核心的審計(jì)數(shù)據(jù)分析挖掘項(xiàng)目。

      5.Python程序設(shè)計(jì)語(yǔ)言。Python是一種面向?qū)ο蟮膭?dòng)態(tài)類型計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,因其數(shù)據(jù)處理速度快、功能強(qiáng)大且簡(jiǎn)單易學(xué),在數(shù)據(jù)分析與處理中被廣泛應(yīng)用。Python擁有IPython、NumPy、SciPy、pandas、Matplot-lib、scikit-learn和Spyder 等功能齊全、接口統(tǒng)一的數(shù)據(jù)庫(kù),能為數(shù)據(jù)分析工作提供極大地便利。

      數(shù)據(jù)分析挖掘的基本步驟

      數(shù)據(jù)分析挖掘的基本步驟包括:數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、選擇方法工具、建立模型、評(píng)估模型及運(yùn)用。

      1.收集原始審計(jì)數(shù)據(jù)。收集原始審計(jì)數(shù)據(jù)的前提是要明確審計(jì)目標(biāo)以及審計(jì)的重點(diǎn)內(nèi)容,在此基礎(chǔ)上采集內(nèi)部數(shù)據(jù)和外部數(shù)據(jù),常用方法包括數(shù)據(jù)接口采集、直接復(fù)制以及通過(guò)備份文件恢復(fù)等。內(nèi)部數(shù)據(jù)指被審計(jì)單位信息系統(tǒng)中的電子數(shù)據(jù),如財(cái)務(wù)系統(tǒng)數(shù)據(jù)、業(yè)務(wù)流程數(shù)據(jù)等。外部數(shù)據(jù)指與被審計(jì)單位業(yè)務(wù)相關(guān)的其他數(shù)據(jù),如銀行流水、企業(yè)信息、政府指導(dǎo)價(jià)等。

      2.數(shù)據(jù)預(yù)處理。由于收集到的原始數(shù)據(jù)中既可能包含有價(jià)值的審計(jì)數(shù)據(jù)信息,還可能包含噪聲信息,因此要對(duì)原始審計(jì)數(shù)據(jù)進(jìn)行預(yù)處理。通過(guò)對(duì)審計(jì)數(shù)據(jù)進(jìn)行清理、集成、變換和歸約等處理,可以大大提高數(shù)據(jù)質(zhì)量,提高審計(jì)分析的挖掘效率。

      3.選擇分析方法工具。在對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后,審計(jì)人員應(yīng)該根據(jù)獲取的數(shù)據(jù),結(jié)合需要審計(jì)的業(yè)務(wù)類型,選擇適當(dāng)?shù)姆治龇椒ê凸ぞ?。比如,需要?duì)某個(gè)單位的車輛維修費(fèi)用進(jìn)行審計(jì),在收集到車輛數(shù)量、維修開支明細(xì)、車輛保險(xiǎn)等數(shù)據(jù)后,初步判斷可以采取數(shù)據(jù)分挖掘中的關(guān)聯(lián)分析法,然后再選擇較為簡(jiǎn)單的Excel進(jìn)行分析,或者利用SQL Server直接實(shí)現(xiàn)導(dǎo)入數(shù)據(jù)、分析數(shù)據(jù)、輸出結(jié)果的“一條龍”操作。

      4.建立分析挖掘模型。該步驟是數(shù)據(jù)挖掘的核心,由于建立模型并不是一蹴而就能完成的,需要模型設(shè)計(jì)人員和審計(jì)人員不斷嘗試各種分析挖掘技術(shù)方法,總結(jié)出其中的規(guī)律,從而選擇合適且安全的模型。

      5.模型評(píng)估及運(yùn)用??梢圆捎门c現(xiàn)在使用的數(shù)據(jù)非常相似的歷史數(shù)據(jù),或?qū)?shù)據(jù)分成訓(xùn)練集和測(cè)試集兩組,第一組用來(lái)訓(xùn)練或評(píng)估模型,即用于建立模型,之后使用第二組數(shù)據(jù)來(lái)測(cè)試模型,即測(cè)試集用于驗(yàn)證模型。當(dāng)訓(xùn)練和測(cè)試周期完成之后,再利用一部分真實(shí)數(shù)據(jù)進(jìn)行檢驗(yàn),主要檢查模型得出的數(shù)據(jù)誤差率是否在可接受的范圍內(nèi)。如果數(shù)據(jù)誤差率超過(guò)可接受范圍,則需要重新評(píng)估分析方法、工具、已建立的模型和數(shù)據(jù)源等,直到數(shù)據(jù)誤差率達(dá)到可接受范圍之內(nèi)。

      红原县| 新乡县| 贞丰县| 嘉峪关市| 隆子县| 聂荣县| 页游| 沂源县| 林州市| 东山县| 若羌县| 东港市| 牟定县| 浦城县| 浠水县| 祁门县| 漳州市| 漯河市| 屯门区| 广昌县| 荥阳市| 凭祥市| 镶黄旗| 柯坪县| 昌邑市| 德阳市| 垫江县| 安福县| 沁源县| 平利县| 鹿邑县| 海宁市| 芜湖市| 龙游县| 曲松县| 漯河市| 十堰市| 姚安县| 万荣县| 浦县| 平山县|