陳星 張宇飛 馬月 張文宇
[摘要]在現(xiàn)代審計(jì)過程中,一方面是企業(yè)財(cái)務(wù)信息量的極速增長,一方面是對(duì)審計(jì)工作的要求越來越高。為了在有限的時(shí)間內(nèi)高質(zhì)量地完成審計(jì)任務(wù),審計(jì)抽樣就成為了主要方式。數(shù)據(jù)挖掘是針對(duì)當(dāng)數(shù)據(jù)信息量過大時(shí),從中有效地發(fā)現(xiàn)有用數(shù)據(jù),進(jìn)而進(jìn)行分析的過程。本文針對(duì)審計(jì)抽樣的特點(diǎn),運(yùn)用數(shù)據(jù)挖掘技術(shù)的思想及相關(guān)算法,為審計(jì)抽樣提供了又一種解決方案,將審計(jì)抽樣分析技術(shù)提升到一個(gè)新的高度。
[關(guān)鍵詞]數(shù)據(jù)挖掘;審計(jì)抽樣;運(yùn)用流程
隨著信息技術(shù)和數(shù)據(jù)庫系統(tǒng)的普及,人們面對(duì)的各種數(shù)據(jù)量急劇增加,而數(shù)據(jù)的激增使從中發(fā)現(xiàn)重要信息的難度增大,人們希望能夠運(yùn)用有效的數(shù)據(jù)分析方法對(duì)這些繁亂無章的數(shù)據(jù)進(jìn)行更深一層次的分析,以便更好地掌握和利用這些數(shù)據(jù),挖掘出對(duì)人們有用的信息。在這一情況下,數(shù)據(jù)挖掘(Data Min-ing,DM)技術(shù)應(yīng)運(yùn)而生并逐漸發(fā)展成熟。
從審計(jì)角度來看,在企業(yè)規(guī)模不斷擴(kuò)大和經(jīng)營復(fù)雜程度不斷提升的今天,審計(jì)人員在進(jìn)行審計(jì)時(shí)需要面對(duì)海量的財(cái)務(wù)數(shù)據(jù)。時(shí)間與成本的限制,使得審計(jì)人員對(duì)每一筆交易進(jìn)行檢查日益變得既不現(xiàn)實(shí),也沒有必要。為了在合理的時(shí)間內(nèi)以合理的成本完成審計(jì)工作,審計(jì)抽樣的運(yùn)用就變得不可或缺。因此,在審計(jì)抽樣領(lǐng)域應(yīng)用數(shù)據(jù)挖掘是審計(jì)人員的現(xiàn)實(shí)需要。這將有利于解決審計(jì)抽樣數(shù)據(jù)的噪音問題,有效地控制審計(jì)風(fēng)險(xiǎn)、降低審計(jì)成本。
審計(jì)工作如今越來越制度化、規(guī)范化,進(jìn)行審計(jì)抽樣方法的研究更加有現(xiàn)實(shí)意義。數(shù)據(jù)挖掘技術(shù)在一些行業(yè)已有成功的應(yīng)用,但由于審計(jì)工作的專業(yè)性較強(qiáng),涉及審計(jì)業(yè)務(wù)的技術(shù)研究相對(duì)緩慢,在審計(jì)抽樣中的應(yīng)用也不多見。
一、數(shù)據(jù)挖掘技術(shù)的概念和步驟
概括來說,數(shù)據(jù)挖掘是一種特定應(yīng)用的數(shù)據(jù)分析過程,它可以從包含大量冗余信息的數(shù)據(jù)中提取盡可能多的隱藏知識(shí),從而為做出正確的判斷提供基礎(chǔ)。
通過各國學(xué)者多年來的不斷研究,現(xiàn)在已經(jīng)有多種數(shù)據(jù)挖掘技術(shù)存在,用于集中對(duì)大量數(shù)據(jù)的抽取和分析??偟膩碚f,數(shù)據(jù)挖掘的任務(wù)及模式有聚類、分類、關(guān)聯(lián)規(guī)則、偏差檢測等。聚類分析可以在事先不規(guī)定分組規(guī)則的情況下,將數(shù)據(jù)按照其自身特征劃分成不同的群組,在不同群組的數(shù)據(jù)間有明顯差別,而每個(gè)群組內(nèi)部的數(shù)據(jù)比較相似;分類可以解決的問題是為一個(gè)事件或?qū)ο髿w類,在使用上既可以用此模型分析已有的數(shù)據(jù),也可以用它來預(yù)測未來的數(shù)據(jù);關(guān)聯(lián)分析的目的是找出數(shù)據(jù)中隱藏的關(guān)聯(lián)關(guān)系網(wǎng),其生成的規(guī)則一般帶有可信度;偏差檢測對(duì)發(fā)現(xiàn)數(shù)據(jù)庫中的異常記錄很有意義。數(shù)據(jù)挖掘技術(shù)中常用的方法有分類、聚類、回歸分析、關(guān)聯(lián)規(guī)則、決策樹、粗糙集等。
數(shù)據(jù)挖掘的基本過程可由以下四個(gè)步驟的組成:
(1)問題識(shí)別。清晰地識(shí)別出領(lǐng)域內(nèi)的特定問題,確定數(shù)據(jù)挖掘的目的。
(2)數(shù)據(jù)準(zhǔn)備。包括數(shù)據(jù)收集及數(shù)據(jù)預(yù)處理,實(shí)現(xiàn)對(duì)目標(biāo)數(shù)據(jù)集的提取及對(duì)數(shù)據(jù)進(jìn)行再加工。
(3)數(shù)據(jù)挖掘。這是數(shù)據(jù)挖掘過程中最重要的步驟,其工作是使用智能算法,在經(jīng)過加工的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘,提取出數(shù)據(jù)模式或規(guī)律知識(shí)。
(4)結(jié)果分析。對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋和評(píng)價(jià),轉(zhuǎn)換成為用戶所需要的知識(shí)。
二、審計(jì)抽樣和審計(jì)統(tǒng)計(jì)抽樣
審計(jì)抽樣是指注冊(cè)會(huì)計(jì)師對(duì)具有審計(jì)相關(guān)性的總體中低于百分之百的項(xiàng)目實(shí)施審計(jì)程序,使所有抽樣單元都有被選取的機(jī)會(huì),為注冊(cè)會(huì)計(jì)師針對(duì)整個(gè)總體得出結(jié)論提供合理基礎(chǔ)。
審計(jì)抽樣應(yīng)當(dāng)具備三個(gè)基本特征:(1)對(duì)某類交易或賬戶余額中低于百分之百的項(xiàng)目實(shí)施審計(jì)程序;(2)所有抽樣單元都有相同概率被選取的機(jī)會(huì);(3)審計(jì)測試的目的是為了評(píng)價(jià)該賬戶余額或交易類型的某一特征。
審計(jì)人員在使用審計(jì)抽樣方法時(shí),主要分為三個(gè)階段進(jìn)行。第一階段是樣本設(shè)計(jì)階段,旨在根據(jù)測試的目標(biāo)和抽樣總體,制定選取樣本的計(jì)劃。第二階段是選取樣本階段,旨在按照適當(dāng)?shù)姆椒◤南鄳?yīng)的抽樣總體中選取所需的樣本,并對(duì)其實(shí)施檢查,以確定是否存在誤差。第三階段是評(píng)價(jià)樣本結(jié)果階段,旨在根據(jù)對(duì)誤差的性質(zhì)和原因的分析,將樣本結(jié)果推斷至總體,形成對(duì)總體的結(jié)論。
審計(jì)抽樣包括統(tǒng)計(jì)抽樣和非統(tǒng)計(jì)抽樣兩種方法。統(tǒng)計(jì)抽樣是指同時(shí)具備下列特征的抽樣方法:(1)隨機(jī)選取樣本項(xiàng)目;(2)運(yùn)用概率論評(píng)價(jià)樣本結(jié)果。不同時(shí)具備前款提及的兩個(gè)特征的抽樣方法為非統(tǒng)計(jì)抽樣。
審計(jì)人員會(huì)根據(jù)具體情況,運(yùn)用職業(yè)判斷,來選取能夠最有效率的獲取審計(jì)證據(jù)的抽樣方法。統(tǒng)計(jì)抽樣的優(yōu)點(diǎn)在于能夠客觀地計(jì)量抽樣風(fēng)險(xiǎn),并通過調(diào)整樣本規(guī)模來精確地控制風(fēng)險(xiǎn),這也是與非統(tǒng)計(jì)抽樣的最主要的區(qū)別。另外,統(tǒng)計(jì)抽樣還有助于審計(jì)人員高效地設(shè)計(jì)樣本,計(jì)量所獲取證據(jù)的充分性,以及定量評(píng)價(jià)樣本結(jié)果,也正是如此,才使數(shù)據(jù)挖掘的運(yùn)用得以進(jìn)行。
審計(jì)抽樣中數(shù)據(jù)挖掘的運(yùn)用流程
任何一項(xiàng)審計(jì)工作,都不可能也不應(yīng)該去審查總體中的所有樣本,這種做法所花費(fèi)的時(shí)間和費(fèi)用成本不存在合理性。更重要的是審計(jì)人員在限定的時(shí)間內(nèi)完成對(duì)每個(gè)程序收集所有證據(jù),并進(jìn)行檢查的任務(wù)是不現(xiàn)實(shí)的。所以我們需要在大量的可能數(shù)據(jù)中選取其中的一部分作為審計(jì)樣本。針對(duì)審計(jì)抽樣的性質(zhì),綜合考慮數(shù)據(jù)挖掘各種算法的特點(diǎn),我們可以使用數(shù)據(jù)挖掘中的分類或聚類算法將難以計(jì)數(shù)的隨機(jī)審計(jì)數(shù)據(jù)進(jìn)行分層,將審計(jì)數(shù)據(jù)分成若干層,并且為每一層規(guī)定唯一的編號(hào),再從中選擇若干樣本進(jìn)行重點(diǎn)分析。這樣,審計(jì)人員就有可能使用少量具有代表性的審計(jì)樣本,來代替大量相似的審計(jì)數(shù)據(jù),從而大大減輕了審計(jì)人員的負(fù)擔(dān)。另外,在許多情況下,由于某些未被完全知道的原因,一些單個(gè)重大項(xiàng)目需要重點(diǎn)分析,這時(shí)使用偏差測試檢驗(yàn)可以更加容易地發(fā)現(xiàn)關(guān)鍵因素。同時(shí)針對(duì)不同審計(jì)抽樣的特殊性,綜合運(yùn)用其它方法進(jìn)行補(bǔ)充。
根據(jù)審計(jì)抽樣過程中各種數(shù)據(jù)挖掘算法的運(yùn)用思想,將審計(jì)抽樣的三個(gè)階段與數(shù)據(jù)挖掘的四個(gè)步驟進(jìn)行結(jié)合,可以總結(jié)出審計(jì)抽樣的數(shù)據(jù)挖掘具體流程,如圖2所示。
(1)問題識(shí)別。在這一階段主要內(nèi)容包括確定審計(jì)的問題和目標(biāo),掌握解決此類問題的主要方法,確定審計(jì)數(shù)據(jù)挖掘目標(biāo)和結(jié)論的評(píng)估標(biāo)準(zhǔn)。
(2)數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)收集和預(yù)處理直接決定著審計(jì)數(shù)據(jù)挖掘結(jié)論是否正確。由于被審計(jì)單位數(shù)據(jù)量過大,審計(jì)人員需要在滿足重要性和相關(guān)性的基礎(chǔ)上采樣進(jìn)行數(shù)據(jù)消減;再針對(duì)各種不同類型的數(shù)據(jù)采取相適應(yīng)的數(shù)據(jù)預(yù)處理方法。通過數(shù)據(jù)準(zhǔn)備這一步驟,審計(jì)人員將原始數(shù)據(jù)轉(zhuǎn)換為了數(shù)據(jù)挖掘方法所需要的特定的數(shù)據(jù)格式及類型。
(3)數(shù)據(jù)挖掘。這一過程是審計(jì)人員在審計(jì)問題的發(fā)現(xiàn)過程中的一個(gè)關(guān)鍵性步驟。這一步驟包括選擇數(shù)據(jù)挖掘方法、確定訓(xùn)練與檢驗(yàn)程序、建立模型、驗(yàn)證發(fā)現(xiàn)的知識(shí)等。
(4)結(jié)果分析。根據(jù)審計(jì)的問題和目標(biāo)對(duì)提取的信息進(jìn)行分析,把結(jié)果轉(zhuǎn)換為易懂的知識(shí)從而提交給審計(jì)人員。如果對(duì)結(jié)果不滿意,則重復(fù)進(jìn)行上述過程。
結(jié)束語
在計(jì)算機(jī)技術(shù)快速發(fā)展的時(shí)代,企業(yè)財(cái)務(wù)數(shù)據(jù)信息量過于龐大,在進(jìn)行審計(jì)抽樣時(shí),傳統(tǒng)的人工抽樣方式已不再適用,簡單的電算化技術(shù)操作也不能很好地滿足要求。本文從改進(jìn)審計(jì)抽樣的技術(shù)方法出發(fā),運(yùn)用數(shù)據(jù)挖掘技術(shù)可以快速有效地為審計(jì)人員搜集其所需的證據(jù),來實(shí)現(xiàn)在審計(jì)抽樣的過程中,盡可能地提高效率、降低成本的目標(biāo)。有效地有利于將審計(jì)人員從繁雜的審計(jì)證據(jù)收集工作中解脫出來,將更多的精力致力投入到職業(yè)判斷中,進(jìn)行審計(jì)決策的制定,有效地保證了審計(jì)工作的完成質(zhì)量。
參考文獻(xiàn)
[1]趙磊.數(shù)據(jù)挖掘技術(shù)在財(cái)務(wù)分析中的應(yīng)用[J].中國管理信息化,2009,12(2):34-38.
[2]鄒友華.數(shù)據(jù)挖掘在財(cái)務(wù)決策中的應(yīng)用[J].現(xiàn)代商貿(mào)工業(yè),2008,4(4):157-158.
[3]孫山澤.抽樣調(diào)查.北京:北京大學(xué)出版社,2004.
[4]中國注冊(cè)會(huì)計(jì)師協(xié)會(huì)編.審計(jì)[M].北京:中國財(cái)政經(jīng)濟(jì)出版社,2012.
[5]毛國君、段立娟、王實(shí)、石云編著.數(shù)據(jù)挖掘原理與算法(第二版)[M].北京:清華大學(xué)出版社,2007.
[6]張莉.數(shù)據(jù)挖掘技術(shù)及應(yīng)用現(xiàn)狀[J].中國石油人學(xué)勝利學(xué)院學(xué)報(bào),2008,6:34-35.
[7]Patricia L. Smith,Audit and Assessment of SamplingSystems[J].Chemometrics and Intelligent Laboratory Systems.2004,1(74):225-230.