胡珊珊
數(shù)據(jù)挖掘技術(shù)在現(xiàn)代審計(jì)中的應(yīng)用研究
胡珊珊
[提要]隨著信息技術(shù)的發(fā)展和網(wǎng)絡(luò)的廣泛普及,審計(jì)數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)以驚人的速度增長(zhǎng)。審計(jì)過(guò)程中利用計(jì)算機(jī)技術(shù)的程度越來(lái)越高,審計(jì)人員面對(duì)大量的財(cái)務(wù)數(shù)據(jù)或非財(cái)務(wù)數(shù)據(jù)。在審計(jì)系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù),顯示出了巨大的優(yōu)勢(shì),本文介紹了審計(jì)中引用數(shù)據(jù)挖掘技術(shù)的程序和方法,并指出了這一技術(shù)應(yīng)用于現(xiàn)代審計(jì)中的一些局限。
數(shù)據(jù)挖掘;審計(jì);技術(shù)
隨著經(jīng)濟(jì)的發(fā)展,企業(yè)活動(dòng)的日益錯(cuò)綜復(fù)雜,交易數(shù)量的龐大對(duì)各項(xiàng)交易進(jìn)行記錄、分析的過(guò)程如果仍然依靠手工操作,會(huì)導(dǎo)致工作效率嚴(yán)重低下,并且工作成本大大增加。與此同時(shí),隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)的普及,人工智能系統(tǒng)已經(jīng)被引入企業(yè)管理,如供應(yīng)鏈管理系統(tǒng)(SCM)和企業(yè)資源計(jì)劃系統(tǒng)(ERP),這些系統(tǒng)使企業(yè)的眾多交易活動(dòng)都可以通過(guò)計(jì)算機(jī)實(shí)時(shí)在線錄入,形成大量的數(shù)據(jù),現(xiàn)代審計(jì)面臨著數(shù)據(jù)庫(kù)中的海量數(shù)據(jù),如何從中尋找出一定的數(shù)據(jù)特征,發(fā)現(xiàn)可疑數(shù)據(jù),以提高審計(jì)效率和降低審計(jì)風(fēng)險(xiǎn),是審計(jì)人員面臨的嶄新課題。
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在的信息和知識(shí)過(guò)程。這一概念要求數(shù)據(jù)源必須是真實(shí)的、海量的、有噪聲的。數(shù)據(jù)挖掘是一個(gè)完整的過(guò)程,該過(guò)程從大型數(shù)據(jù)庫(kù)中挖掘先前未知的、有效的且可用的信息,并利用這些信息做出決策或者豐富知識(shí)。
數(shù)據(jù)挖掘改變了審計(jì)實(shí)踐的方式。由于信息技術(shù)的普及,很多企業(yè)引入人工智能系統(tǒng),這些系統(tǒng)使企業(yè)的眾多交易活動(dòng)都可以實(shí)時(shí)在線錄入,各種事件包含大量會(huì)計(jì)數(shù)據(jù)和經(jīng)營(yíng)管理數(shù)據(jù)。審計(jì)人員通過(guò)對(duì)數(shù)據(jù)的分析獲得審計(jì)線索,獲取有用的審計(jì)證據(jù),并發(fā)表適當(dāng)?shù)膶徲?jì)意見(jiàn)。數(shù)據(jù)挖掘可以從大量的數(shù)據(jù)中發(fā)現(xiàn)隱藏于數(shù)據(jù)中的新的或者不可預(yù)見(jiàn)的模式,可以回答審計(jì)人員可能根本沒(méi)有想過(guò)的問(wèn)題。
在審計(jì)過(guò)程中運(yùn)用數(shù)據(jù)挖掘技術(shù)的基本思路是這樣的:首先接受日志收集信息系統(tǒng)各部件提交的統(tǒng)一格式的審計(jì)數(shù)據(jù),然后對(duì)這些數(shù)據(jù)進(jìn)行預(yù)處理,比如轉(zhuǎn)換格式、數(shù)字提煉等。接下來(lái)運(yùn)用合適的數(shù)據(jù)挖掘算法對(duì)審計(jì)數(shù)據(jù)進(jìn)行處理,提取數(shù)據(jù)中隱藏的知識(shí),并對(duì)實(shí)踐進(jìn)行統(tǒng)計(jì)。最后系統(tǒng)地進(jìn)行審計(jì)數(shù)據(jù)的分析處理及趨勢(shì)預(yù)測(cè)。
目前應(yīng)用于現(xiàn)代審計(jì)業(yè)務(wù)的數(shù)據(jù)挖掘技術(shù)主要有以下幾種方法:
(一)離群點(diǎn)挖掘
離群點(diǎn)挖掘是從大量復(fù)雜的數(shù)據(jù)中挖掘出存在于小部分異常數(shù)據(jù)中新穎的、與常規(guī)數(shù)據(jù)模式顯著不同的數(shù)據(jù)模式。利用離群點(diǎn)挖掘,一方面可以對(duì)審計(jì)數(shù)據(jù)進(jìn)行有效的預(yù)處理,減少審計(jì)數(shù)據(jù)量,快速定位數(shù)據(jù),從而提高審計(jì)效率;另一方面可以自動(dòng)的從數(shù)據(jù)中提取難以發(fā)現(xiàn)的業(yè)務(wù)模式和管理模式行為,減少人工參與,減輕審計(jì)人員工作負(fù)擔(dān)。
(二)孤立點(diǎn)檢測(cè)
孤立點(diǎn)是在數(shù)據(jù)源中與眾不同的數(shù)據(jù),使人懷疑這些數(shù)據(jù)并非隨機(jī)偏差,而是產(chǎn)生于完全不同的機(jī)制。由于審計(jì)中可疑數(shù)據(jù)往往表現(xiàn)為孤立點(diǎn),所以通過(guò)檢測(cè)并去除數(shù)據(jù)源中的孤立點(diǎn)可以達(dá)到數(shù)據(jù)清理的目的,從而提高數(shù)據(jù)質(zhì)量,以達(dá)到審計(jì)目的。
(三)異常點(diǎn)檢測(cè)
異常點(diǎn)檢測(cè)是數(shù)據(jù)挖掘技術(shù)中重要的研究?jī)?nèi)容。它是從大量審計(jì)數(shù)據(jù)對(duì)象中挖掘少量具有異常行為模式的數(shù)據(jù)對(duì)象,很多情況下,這些審計(jì)數(shù)據(jù)對(duì)象包含了跟多審計(jì)人員感興趣的信息。
本文將匹配度計(jì)算定義為正向匹配度和反向匹配度。反向匹配度是本文提出的一種新的計(jì)算匹配度的度量方法。正匹配度和反匹配度主要計(jì)算檢索時(shí)檢索的關(guān)鍵詞與知識(shí)庫(kù)記錄標(biāo)題的匹配程度。知識(shí)檢索時(shí),檢索關(guān)鍵詞與知識(shí)庫(kù)記錄的標(biāo)題在很大程度上能反映整個(gè)記錄的主題,所以匹配度的計(jì)算是非常必要的。
(四)聚類(lèi)分析
數(shù)據(jù)聚類(lèi)是將審計(jì)資料數(shù)據(jù)中較為接近的數(shù)據(jù)劃為一類(lèi),根據(jù)不同數(shù)據(jù)的特征,將對(duì)象分成幾個(gè)群體。聚類(lèi)分析可應(yīng)用于控制測(cè)試階段,為測(cè)試各控制環(huán)節(jié)的執(zhí)行情況將具有相似特征的交易分組。繼而更有利于審計(jì)人員對(duì)相似數(shù)據(jù)進(jìn)行分析、挖掘。
(五)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則發(fā)現(xiàn)是通過(guò)分析資料,找出某一事件或資料中會(huì)同時(shí)出現(xiàn)的東西。關(guān)聯(lián)規(guī)則挖掘用于發(fā)現(xiàn)大量數(shù)據(jù)集合間有意義的關(guān)聯(lián),它側(cè)重于數(shù)據(jù)中不同領(lǐng)域之間的聯(lián)系。審計(jì)信息系統(tǒng)運(yùn)用關(guān)聯(lián)規(guī)則提取數(shù)據(jù)之間的聯(lián)系,能有效的分析經(jīng)濟(jì)業(yè)務(wù)中數(shù)據(jù)的相關(guān)性,從而使審計(jì)人員更準(zhǔn)確的發(fā)現(xiàn)數(shù)據(jù)之間的聯(lián)系。
隨著信息技術(shù)的迅猛發(fā)展和審計(jì)實(shí)踐的變化,這些技術(shù)還在實(shí)踐中不斷的完善和發(fā)展,將來(lái)必定有更多更有用的數(shù)據(jù)挖掘方法應(yīng)用于審計(jì)實(shí)踐。
隨著信息技術(shù)的發(fā)展和網(wǎng)絡(luò)的廣泛普及,審計(jì)數(shù)據(jù)和網(wǎng)絡(luò)數(shù)據(jù)以驚人的速度增長(zhǎng)。審計(jì)過(guò)程中利用計(jì)算機(jī)技術(shù)的程度越來(lái)越高,很多大型組織已經(jīng)建立并運(yùn)行著特大數(shù)量級(jí)的應(yīng)用數(shù)據(jù)庫(kù),并積累了大量的歷史數(shù)據(jù)。審計(jì)人員面對(duì)的也不再是紙質(zhì)的會(huì)計(jì)資料,每一個(gè)被審計(jì)單位的計(jì)算機(jī)系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)中都存在著大量的財(cái)務(wù)數(shù)據(jù)或非財(cái)務(wù)數(shù)據(jù)。在審計(jì)系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù),顯示出了巨大的優(yōu)勢(shì),尤其是在大規(guī)模網(wǎng)絡(luò)環(huán)境下進(jìn)行的數(shù)據(jù)挖掘,不但可以提高系統(tǒng)的運(yùn)行效率,還能增強(qiáng)系統(tǒng)的智能性。
數(shù)據(jù)挖掘作為一種新興的技術(shù),與以往的單純的統(tǒng)計(jì)方法相比,其優(yōu)勢(shì)在于它能從數(shù)據(jù)中發(fā)現(xiàn)人們未知的知識(shí)和規(guī)律。我們引入數(shù)據(jù)挖掘技術(shù)的目的是建立一種系統(tǒng)化和自動(dòng)化的創(chuàng)建入侵檢測(cè)系統(tǒng)的方法,這種方法采用以數(shù)據(jù)為中心的視點(diǎn),將入侵檢測(cè)視為一個(gè)數(shù)據(jù)分析過(guò)程。這種方法符合現(xiàn)代審計(jì)的需要,其核心是將數(shù)據(jù)挖掘技術(shù)應(yīng)用于審計(jì)數(shù)據(jù),從中分別提煉出正常和入侵情況下的用戶行為模式,再由生成的模式庫(kù)匹配入侵檢測(cè)系統(tǒng)所采集到的數(shù)據(jù)以捕獲網(wǎng)絡(luò)入侵。它不僅可以處理大規(guī)模的數(shù)據(jù),而且不需要審計(jì)人員提供主觀評(píng)價(jià)信息,這種技術(shù)能發(fā)現(xiàn)容易被審計(jì)人員主觀忽視和隱藏的信息,有利于避免有價(jià)值的線索被人為的主觀因素所忽略的情況。
數(shù)據(jù)挖掘技術(shù)在西方審計(jì)中還處于初級(jí)階段,它的應(yīng)用還有一定的局限性。
1.數(shù)據(jù)質(zhì)量難以保證
數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)在于數(shù)據(jù)本身的質(zhì)量,如果數(shù)據(jù)本身是虛假的、錯(cuò)誤的,特別是作為審計(jì)對(duì)象的那些數(shù)據(jù)如果被審計(jì)單位篡改了,那么再先進(jìn)、再成熟的數(shù)據(jù)挖掘技術(shù)也無(wú)法得出有意義的結(jié)論。
2.使用成本高
數(shù)據(jù)挖掘技術(shù)要應(yīng)用于實(shí)際工作中,必須要產(chǎn)生相應(yīng)的數(shù)據(jù)編制成本、維護(hù)成本、分析成本和人員培訓(xùn)成本,一些數(shù)據(jù)軟件的成本費(fèi)用更是高的驚人。成本因素也是數(shù)據(jù)挖掘技術(shù)應(yīng)用于審計(jì)工作中的一個(gè)局限。
3.對(duì)審計(jì)人員的素質(zhì)要求高
由于審計(jì)數(shù)據(jù)特征和測(cè)度是根據(jù)建模者的經(jīng)驗(yàn)和知識(shí)選擇的,因此數(shù)據(jù)挖掘技術(shù)要真正應(yīng)用到現(xiàn)代審計(jì)工作中來(lái),不僅需要審計(jì)人員具有豐富的審計(jì)理論知識(shí)和實(shí)踐經(jīng)驗(yàn),而且還要求他們掌握計(jì)算機(jī)的專(zhuān)業(yè)知識(shí),熟悉數(shù)據(jù)庫(kù)和數(shù)據(jù)挖掘的技能。他們不僅要能識(shí)別、運(yùn)用挖掘技術(shù),而且還要對(duì)結(jié)果做出有效的分析和評(píng)價(jià)。
盡管數(shù)據(jù)挖掘技術(shù)應(yīng)用于現(xiàn)代審計(jì)技術(shù)還處于初級(jí)階段,但它的巨大優(yōu)勢(shì)是傳統(tǒng)審計(jì)方法無(wú)可比擬的,相信在不久的將來(lái)隨著審計(jì)人員技術(shù)水平的提高和對(duì)數(shù)據(jù)挖掘技術(shù)研究的深入,數(shù)據(jù)挖掘技術(shù)必定將在現(xiàn)代審計(jì)中有更廣闊的應(yīng)用前景。
[1]李博羅,良辰.中觀信息系統(tǒng)審計(jì)風(fēng)險(xiǎn)控制體系研究[J].審計(jì)研究,2013,(11).
[2]曾德勝澎燦明.基于數(shù)據(jù)挖掘的審計(jì)系統(tǒng)研究[J].長(zhǎng)春工程學(xué)院學(xué)報(bào):自然科學(xué)版2011,(1).
[責(zé)任編輯:程文燕]
胡珊珊(1982-),女,江西經(jīng)濟(jì)管理干部學(xué)院講師、審計(jì)師、碩士,研究方向?yàn)閷徲?jì)。(江西南昌330000)