陽(yáng)秋林 唐倩倩
[摘? ? 要] 大數(shù)據(jù)審計(jì)的研究與應(yīng)用是近年來審計(jì)領(lǐng)域的熱點(diǎn),數(shù)據(jù)的井噴式增長(zhǎng)以及技術(shù)的更迭對(duì)傳統(tǒng)的審計(jì)監(jiān)督而言無(wú)異于當(dāng)頭棒喝。因此如何在海量數(shù)據(jù)中獲取與審計(jì)相關(guān)的數(shù)據(jù)以及選擇適應(yīng)時(shí)代的審計(jì)方法是目前開展大數(shù)據(jù)審計(jì)的關(guān)鍵環(huán)節(jié)。本文首先闡述了開展大數(shù)據(jù)審計(jì)的必要性,分析了目前大數(shù)據(jù)審計(jì)在數(shù)據(jù)采集過程中存在的問題,提出了基于python的大數(shù)據(jù)審計(jì)原理,其次通過梳理大數(shù)據(jù)審計(jì)的研究現(xiàn)狀,剖析傳統(tǒng)審計(jì)在數(shù)據(jù)存儲(chǔ),審計(jì)程序的轉(zhuǎn)型,最后研討大數(shù)據(jù)技術(shù)和方法對(duì)審計(jì)的支撐作用。
[關(guān)鍵詞] 大數(shù)據(jù)審計(jì);Python;審計(jì)方法
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 01. 032
[中圖分類號(hào)] F239? ? [文獻(xiàn)標(biāo)識(shí)碼]? A? ? ? [文章編號(hào)]? 1673 - 0194(2020)01- 0070- 04
1? ? ? 引? ? 言
隨著信息技術(shù)的發(fā)展,被審計(jì)單位的運(yùn)行越來越依賴于信息化,審計(jì)工作環(huán)境發(fā)生了翻天覆地的變化,以傳統(tǒng)的審查賬簿為主要手段的審計(jì)面臨著巨大的困境。2015年,國(guó)務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》。2016年金磚國(guó)家最高審計(jì)機(jī)關(guān)領(lǐng)導(dǎo)人在會(huì)議上指出:要加強(qiáng)頂層設(shè)計(jì)和戰(zhàn)略規(guī)劃,加大大數(shù)據(jù)技術(shù)的應(yīng)用,創(chuàng)新審計(jì)方式方法,提升審計(jì)效能,更好發(fā)揮審計(jì)作用[1]。2018年,習(xí)近平總書記在中央審計(jì)委員會(huì)第一次會(huì)議上指出,要堅(jiān)持科技強(qiáng)審,加強(qiáng)審計(jì)信息化建設(shè)。與此同時(shí),國(guó)內(nèi)外學(xué)術(shù)界也對(duì)大數(shù)據(jù)技術(shù)在審計(jì)上的研究給予高度重視,Earley(2015)分析了大數(shù)據(jù)技術(shù)給審計(jì)工作帶來的機(jī)遇和挑戰(zhàn),研究了大數(shù)據(jù)技術(shù)在CPA審計(jì)中的應(yīng)用[2];陳偉(2017)分析了大數(shù)據(jù)審計(jì)的現(xiàn)狀與發(fā)展,以及大數(shù)據(jù)環(huán)境下電子數(shù)據(jù)審計(jì)的機(jī)遇、挑戰(zhàn)與方法??v觀學(xué)術(shù)界與實(shí)務(wù)界,研究大數(shù)據(jù)審計(jì)具有重要的現(xiàn)實(shí)意義與應(yīng)用價(jià)值。
2? ? ? 研究現(xiàn)狀
2.1? ?大數(shù)據(jù)的內(nèi)涵及特點(diǎn)
早在2008年,《Nature》就推出了“Big Data”???,首次提出了大數(shù)據(jù)的概念。2011年,麥肯錫(2011)發(fā)布了《Big data: The next frontier for innovation, competition, and productivity》,將大數(shù)據(jù)定義為大小超出常規(guī)數(shù)據(jù)庫(kù)工具獲取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集。
概括來說,大數(shù)據(jù)主要具有以下四個(gè)特點(diǎn)。
(1)大量: 數(shù)據(jù)量大,非結(jié)構(gòu)化數(shù)據(jù)的超大規(guī)模和增長(zhǎng)比結(jié)構(gòu)化數(shù)據(jù)增長(zhǎng)快10~50倍;另一方面,計(jì)算量較大。
(2)多樣性:大數(shù)據(jù)的形式多樣,如文字、圖片、視頻等。
(3)迅捷:一方面,數(shù)據(jù)量增長(zhǎng)速度快;另一方面,大數(shù)據(jù)要求實(shí)時(shí)分析,處理速度要快。
(4)真實(shí)性:數(shù)據(jù)必須是準(zhǔn)確的、可靠的、一致的,具有可追溯性。
2.2? ?大數(shù)據(jù)審計(jì)的內(nèi)涵
目前,國(guó)外有關(guān)大數(shù)據(jù)審計(jì)的學(xué)術(shù)研究還比較零散。Lohr(2011)認(rèn)為,應(yīng)用大數(shù)據(jù)技術(shù)以后,審計(jì)判斷更多的是依據(jù)數(shù)而非經(jīng)驗(yàn),這將提高審計(jì)的質(zhì)量 。Moffitt etal(2013)也認(rèn)為, 大數(shù)據(jù)將改變審計(jì)判斷的方式[3]。國(guó)內(nèi)學(xué)者大都認(rèn)為大數(shù)據(jù)審計(jì)是基于大數(shù)據(jù)技術(shù)發(fā)展而產(chǎn)生的一種新的審計(jì)方式,其主要內(nèi)容包括電子數(shù)據(jù)審計(jì)和計(jì)算機(jī)信息系統(tǒng)審計(jì)兩方面。
2.3? ?大數(shù)據(jù)對(duì)審計(jì)的影響研究
(1)加大對(duì)外部數(shù)據(jù)的依賴:經(jīng)濟(jì)活動(dòng)的日益復(fù)雜,加大了審計(jì)的難度,傳統(tǒng)的“一對(duì)一”的審計(jì)獲取數(shù)據(jù)不夠全面,大數(shù)據(jù)環(huán)境下,審計(jì)更加依賴于電子數(shù)據(jù),對(duì)紙質(zhì)數(shù)據(jù)的需求減少,更多的是需要外部數(shù)據(jù)。
(2)加強(qiáng)相關(guān)關(guān)系證據(jù)的應(yīng)用:大數(shù)據(jù)技術(shù)下的審計(jì)不再依賴于審計(jì)證據(jù)之間的因果關(guān)系而是基于數(shù)據(jù)間的相關(guān)性進(jìn)行分析和驗(yàn)證, 利用計(jì)算機(jī)可以提取并分析相關(guān)性較弱的審計(jì)證據(jù)。
(3)力推審計(jì)質(zhì)量和審計(jì)效率的提升:在大數(shù)據(jù)環(huán)境下,注冊(cè)會(huì)計(jì)師不必采用抽樣審計(jì)調(diào)查,而是全面調(diào)查,這樣可以避免抽樣誤差,從而提高審計(jì)質(zhì)量。利用大數(shù)據(jù)審計(jì),審計(jì)證據(jù)將會(huì)更多、更全面。
3? ? ? 大數(shù)據(jù)環(huán)境下審計(jì)的技術(shù)支持
3.1? ?大數(shù)據(jù)審計(jì)的數(shù)據(jù)采集
3.1.1? ?大數(shù)據(jù)審計(jì)的數(shù)據(jù)來源分析
大數(shù)據(jù)審計(jì)數(shù)據(jù)采集過程中的挑戰(zhàn)主要集中在兩方面,一方面,在數(shù)據(jù)生成過程中,有許多可以人為控制的環(huán)節(jié),增強(qiáng)了舞弊的可能性,再者單位之間用的軟件不同也可能影響審計(jì)的有效性,例如A公司使用金蝶,審計(jì)單位使用用友,那么這兩者之間所產(chǎn)生的數(shù)據(jù)格式將會(huì)有所不同,審計(jì)人員在沒有有效的手段驗(yàn)證數(shù)據(jù)真實(shí)性的情況下轉(zhuǎn)換不同格式之間的數(shù)據(jù),可能產(chǎn)生不可預(yù)見的錯(cuò)誤,增大審計(jì)風(fēng)險(xiǎn)。另一方面,隨著經(jīng)濟(jì)活動(dòng)復(fù)雜程度的提高,企業(yè)數(shù)據(jù)呈幾何級(jí)增長(zhǎng),數(shù)據(jù)所呈現(xiàn)形式也豐富多樣,不僅僅局限于數(shù)值,還包括文字、圖片等多種形式,數(shù)據(jù)類型也不僅僅局限于結(jié)構(gòu)化數(shù)據(jù)還包括非結(jié)構(gòu)化數(shù)據(jù)。因此審計(jì)人員在采集數(shù)據(jù)時(shí),可能導(dǎo)致數(shù)據(jù)采集查全率低,不能真正反映有效的審計(jì)信息。
3.1.2? ?現(xiàn)有的數(shù)據(jù)采集方法
(1)Direct replication。當(dāng)審計(jì)單位與被審計(jì)單位使用相同的數(shù)據(jù)庫(kù)時(shí),直接復(fù)制到審計(jì)人員的計(jì)算機(jī)中。
(2)ODBC接口采集。即審計(jì)人員通過ODBC數(shù)據(jù)訪問接口直接訪問被審計(jì)單位信息系統(tǒng),轉(zhuǎn)化成審計(jì)所需的格式。
(3)辦公軟件數(shù)據(jù)采集。使用如Excel,MS Access,MS SQL Server 等辦公軟件完成數(shù)據(jù)采集。
(4)專屬模板采集。一些審計(jì)軟件在被設(shè)計(jì)時(shí),根據(jù)審計(jì)單位不同的特點(diǎn)設(shè)置了相應(yīng)的模板,審計(jì)人員在進(jìn)行數(shù)據(jù)采集時(shí),通過選擇相應(yīng)的模板,即可自動(dòng)實(shí)現(xiàn)數(shù)據(jù)的采集。
四種采集方式各有利弊,如表1所示。
3.1.3? ?大數(shù)據(jù)環(huán)境下的審計(jì)數(shù)據(jù)采集方法——以Python為例
目前,審計(jì)數(shù)據(jù)的采集主要依托于被審計(jì)單位的數(shù)據(jù)庫(kù),但在大數(shù)據(jù)環(huán)境下,審計(jì)人員也應(yīng)積極搜集第三方數(shù)據(jù),增強(qiáng)審計(jì)數(shù)據(jù)的全面性。然而這些信息大多以網(wǎng)頁(yè)的格式存在,難以被審計(jì)人員直接分析,這就影響查全率,造成了一定的審計(jì)風(fēng)險(xiǎn)。因此,審計(jì)人員可以采用計(jì)算機(jī)輔助工具抓取網(wǎng)上數(shù)據(jù)。
Python(網(wǎng)絡(luò)爬蟲),是一種按照特定規(guī)則抓取網(wǎng)絡(luò)信息的程序或腳本。因此,網(wǎng)絡(luò)爬蟲技術(shù)可以幫助審計(jì)人員獲得各類與審計(jì)相關(guān)的數(shù)據(jù),利用爬蟲技術(shù)采集數(shù)據(jù)的過程主要有以下幾步:第一步,確定目標(biāo)。審計(jì)人員確定所需要獲取的數(shù)據(jù)。第二步,網(wǎng)頁(yè)分析,為獲取第一步所需的數(shù)據(jù)對(duì)相關(guān)網(wǎng)頁(yè)進(jìn)行分析。第三步,數(shù)據(jù)獲取,根據(jù)上一步對(duì)網(wǎng)頁(yè)的分析,抓取數(shù)據(jù)。第四步,數(shù)據(jù)過濾和清洗。對(duì)取得的數(shù)據(jù)利用可視化工具進(jìn)行分析,再借助SQL查詢、Excel分析等進(jìn)行建模和分析,進(jìn)一步獲得審計(jì)數(shù)據(jù)。
3.1.4? ?基于Python的審計(jì)大數(shù)據(jù)采集
常用的網(wǎng)絡(luò)爬蟲軟件主要有以下五種,其優(yōu)缺點(diǎn)如表2所示。
3.2? ?大數(shù)據(jù)環(huán)境下的審計(jì)數(shù)據(jù)存儲(chǔ)
傳統(tǒng)的審計(jì)數(shù)據(jù)有兩種存儲(chǔ)方式,一是以紙質(zhì)文檔的形式儲(chǔ)存,采用這種方式存儲(chǔ),一旦文件數(shù)據(jù)過多,就需要占用大量的空間。造成空間上的而浪費(fèi)。且時(shí)間一長(zhǎng),文檔可能發(fā)霉變質(zhì)。二是以電子數(shù)據(jù)的形式存儲(chǔ),以U盤或者移動(dòng)硬盤為載體, 這種存儲(chǔ)方式雖然相對(duì)便捷,但存儲(chǔ)介質(zhì)易受病毒感染且數(shù)據(jù)不能共享。郭紅建(2017)大數(shù)據(jù)環(huán)境下的云端存儲(chǔ)相較于上述兩種存儲(chǔ)方式有著絕對(duì)的優(yōu)勢(shì), 云端存儲(chǔ)通過集群應(yīng)用、網(wǎng)絡(luò)技術(shù)或分布式文件系統(tǒng)等功能,將云端數(shù)據(jù)的存儲(chǔ)設(shè)備協(xié)同工作,共同對(duì)外提供升級(jí)數(shù)據(jù)存儲(chǔ)和審計(jì)作業(yè)訪問[4]。
3.3? ?大數(shù)據(jù)環(huán)境下的審計(jì)程序分析
3.3.1? ?審計(jì)程序分析方法
審計(jì)程序方法主要有趨勢(shì)分析、比率分析、回歸分析以及時(shí)間序列分析這四種方法。
(1)趨勢(shì)分析法。簡(jiǎn)單來說,趨勢(shì)分析是通過各期指標(biāo)對(duì)基期指標(biāo)的變化趨勢(shì)分析,看看這種趨勢(shì)的變化是否合理,進(jìn)一步可以發(fā)現(xiàn)異?;?yàn)轭A(yù)測(cè)未來發(fā)展提供幫助。
(2)比率分析法。此種方法是財(cái)務(wù)分析最常用的工具,通過財(cái)務(wù)報(bào)表上若干重要項(xiàng)目的相關(guān)數(shù)據(jù)相互比較分析企業(yè)獲利能力、償債能力、成長(zhǎng)能力以及周轉(zhuǎn)能力,從而評(píng)價(jià)公司的經(jīng)營(yíng)活動(dòng)。
(3)回歸分析法。回歸分析法是一種統(tǒng)計(jì)方法,通過構(gòu)建因變量與自變量之間的回歸方程式來預(yù)測(cè)與其有相關(guān)關(guān)系的隨機(jī)變量值?;貧w分析法的難點(diǎn)在于需要收集企業(yè)大量的基礎(chǔ)數(shù)據(jù)并且要確定變量之間是否存在相關(guān)關(guān)系,如若不然,預(yù)測(cè)結(jié)果將出現(xiàn)嚴(yán)重偏差。
(4)時(shí)間序列分析法。將經(jīng)濟(jì)發(fā)展、購(gòu)買力大小、銷售變化等同一變數(shù)的一組觀察值,按時(shí)間順序排列并結(jié)合數(shù)學(xué)方法來預(yù)測(cè)市場(chǎng)未來的發(fā)展變化趨勢(shì)。
3.3.2? ?大數(shù)據(jù)引進(jìn)審計(jì)分析程序的方式
引入大數(shù)據(jù)后,審計(jì)分析程序具體的分析方法也發(fā)生了一點(diǎn)改變,但基本流程是一致的??梢苑譃榇_定分析程序?qū)ο?、明確期望值、可認(rèn)同差異運(yùn)算和分析差異合理性四個(gè)步驟。
(1)確定分析程序?qū)ο?。大?shù)據(jù)環(huán)境下的審計(jì)分析程序不再選取預(yù)期關(guān)系作為關(guān)鍵點(diǎn),而是采用多角度的方式將數(shù)據(jù)概念抽象化,降低低概念層次的數(shù)據(jù),擴(kuò)大高概念層次的數(shù)據(jù)并運(yùn)用一定的分析技術(shù)處理數(shù)據(jù),提升數(shù)據(jù)的價(jià)值并且詳盡地描述財(cái)務(wù)數(shù)據(jù),使財(cái)務(wù)報(bào)告更全面、客觀,為下一步打好基礎(chǔ)。
(2)明確期望值。大數(shù)據(jù)環(huán)境下的審計(jì),行業(yè)內(nèi)的審計(jì)數(shù)據(jù)共享在大數(shù)據(jù)平臺(tái),審計(jì)程序分析數(shù)據(jù)也不例外。依托于大數(shù)據(jù)平臺(tái)不僅可以量化相似企業(yè)數(shù)據(jù),還能從大數(shù)據(jù)平臺(tái)獲取各種行業(yè)數(shù)據(jù),并且能夠利用大數(shù)據(jù)處理技術(shù),使得數(shù)據(jù)更加的客觀準(zhǔn)確,擺脫了傳統(tǒng)審計(jì)獲取程序分析數(shù)據(jù)難、數(shù)據(jù)不準(zhǔn)確的困境。
(3)可認(rèn)同差異運(yùn)算。大數(shù)據(jù)下的審計(jì)分析程序,將同行業(yè)的審計(jì)數(shù)據(jù)以不同的屬性進(jìn)行差異性和相似性的劃分,選取與被審計(jì)單位相似的企業(yè)為標(biāo)準(zhǔn),計(jì)算差異值范圍,但要保證審計(jì)分析的準(zhǔn)確性就必須確保被選取企業(yè)的審計(jì)數(shù)據(jù)真實(shí),這在一定程度上提高了審計(jì)人員對(duì)數(shù)據(jù)收集和篩選的要求。
(4)分析差異合理性。傳統(tǒng)審計(jì)下,執(zhí)行被審計(jì)單位分析程序時(shí),依賴于注冊(cè)會(huì)計(jì)師的經(jīng)驗(yàn)去分析和判斷重大差異,主觀性較強(qiáng),削弱了分析程序的功能,而引入大數(shù)據(jù)技術(shù)后,深度挖掘差異存在的根本原因,重新執(zhí)行分析程序同時(shí)有效識(shí)別差異,排除干擾數(shù)據(jù),為進(jìn)一步執(zhí)行審計(jì)程序打好基礎(chǔ)。
3.4? ?大數(shù)據(jù)下的數(shù)據(jù)挖掘
數(shù)據(jù)挖掘即是運(yùn)用一定的方法對(duì)數(shù)據(jù)進(jìn)一步的分析處理,挖掘隱含的數(shù)據(jù)及其價(jià)值。主要包括以下幾個(gè)步驟。
(1)數(shù)據(jù)清理:篩選并剔除重復(fù)多余的數(shù)據(jù)。
(2)數(shù)據(jù)轉(zhuǎn)換:即是指將數(shù)據(jù)從一種形式變?yōu)榱硪环N形式,在實(shí)務(wù)中,由于每一個(gè)軟件對(duì)數(shù)據(jù)庫(kù)的架構(gòu)和存儲(chǔ)形式是不同的,我們?yōu)榱塑浖軌蚋玫刈R(shí)別數(shù)據(jù)而進(jìn)行數(shù)據(jù)轉(zhuǎn)換。
(3)數(shù)據(jù)分析:運(yùn)用統(tǒng)計(jì)的方法對(duì)數(shù)據(jù)進(jìn)行處理,提取出有用的數(shù)據(jù)用于輔助決策。
(4)知識(shí)表示:將數(shù)據(jù)挖掘的結(jié)果以通俗易懂的方式描述出來。
4? ? ? 大數(shù)據(jù)環(huán)境下審計(jì)的方法支撐
伴隨著經(jīng)濟(jì)活動(dòng)的日益復(fù)雜,傳統(tǒng)審計(jì)的弊端逐漸凸顯,人們迫切需要傳統(tǒng)審計(jì)升級(jí)轉(zhuǎn)變,大數(shù)據(jù)審計(jì)應(yīng)運(yùn)而生。大數(shù)據(jù)審計(jì)為傳統(tǒng)審計(jì)向全量分析、宏觀評(píng)價(jià)、分工協(xié)作等方面轉(zhuǎn)變提供方法支撐。
4.1? ?數(shù)據(jù)分析方法
從樣本數(shù)據(jù)分析到全面數(shù)據(jù)分析。傳統(tǒng)審計(jì)下,由于人員、技術(shù)、地點(diǎn)等多方的限制,若要對(duì)被審單位所有的數(shù)據(jù)進(jìn)行分析,難度太大且耗時(shí)太久,因此在傳統(tǒng)審計(jì)方法下往往選擇對(duì)樣本數(shù)據(jù)進(jìn)行分析,不可否認(rèn)的是,對(duì)樣本數(shù)據(jù)分析結(jié)果的確有一定的代表性, 但偶然性因素較大,影響審計(jì)結(jié)果的準(zhǔn)確性。大數(shù)據(jù)環(huán)境下的審計(jì),范圍廣、內(nèi)容全,可以從全量的角度進(jìn)行審計(jì),審計(jì)對(duì)象更全面、更整體,審計(jì)結(jié)果也更具有代表性。
4.2? ?審計(jì)評(píng)價(jià)方法
傳統(tǒng)審計(jì)評(píng)價(jià)是從微觀和細(xì)節(jié)入手,得到也只是個(gè)體性的結(jié)論。而在大數(shù)據(jù)環(huán)境下可以對(duì)獲取和分析審計(jì)對(duì)象內(nèi)外部的數(shù)據(jù),從而對(duì)公司進(jìn)行全局性的分析。
4.3? ?審計(jì)工作方法
傳統(tǒng)的審計(jì)工作方法就是從審計(jì)的準(zhǔn)備階段開始,一個(gè)審計(jì)主體對(duì)一個(gè)被審計(jì)單位,各自完成各自的審計(jì)任務(wù),而實(shí)際上,被審計(jì)單位并不是一個(gè)孤立的主體,往往有多個(gè)相關(guān)的單位與之發(fā)生經(jīng)濟(jì)業(yè)務(wù)?;诖?,一旦經(jīng)濟(jì)業(yè)務(wù)比較復(fù)雜,傳統(tǒng)的審計(jì)方式就難以深入分析。而大數(shù)據(jù)審計(jì)可以讓多個(gè)審計(jì)單位可以共同完成一項(xiàng)審計(jì)任務(wù),資源互補(bǔ),優(yōu)化利用各個(gè)方面的專業(yè)人才,提高審計(jì)效率和質(zhì)量。
4.4? ?審計(jì)模式
傳統(tǒng)的審計(jì)模式為事后審計(jì),僅審計(jì)被審計(jì)單位已經(jīng)完成的賬務(wù)處理和報(bào)表,判斷是否正確、合法合規(guī),只能達(dá)到事后監(jiān)督和糾正錯(cuò)誤的目的,而沒有預(yù)防的作用。大數(shù)據(jù)環(huán)境下的審計(jì)貫穿審計(jì)的整個(gè)過程,是一種事前監(jiān)控、事中分析、事后檢查“三位一體”的持續(xù)審計(jì)模式。
5? ? ? 結(jié)? ? 語(yǔ)
大數(shù)據(jù)時(shí)代的到來,給傳統(tǒng)審計(jì)帶來了巨大的挑戰(zhàn),大數(shù)據(jù)環(huán)境下如何獲得與審計(jì)相關(guān)的數(shù)據(jù),探索大數(shù)據(jù)審計(jì)技術(shù)與方法的革新是推動(dòng)傳統(tǒng)審計(jì)轉(zhuǎn)型的現(xiàn)實(shí)需求。本文通過以上幾個(gè)方面對(duì)大數(shù)據(jù)審計(jì)進(jìn)行探析,為進(jìn)一步的審計(jì)流程再造、審計(jì)平臺(tái)搭建奠定了基礎(chǔ)。
主要參考文獻(xiàn)
[1]劉家義.充分發(fā)揮國(guó)家審計(jì)在促進(jìn)經(jīng)濟(jì)和社會(huì)發(fā)展中的作用[Z].2016.
[2]Earley CE.Data Analytics in Auditing: Opportunities and Challenges[J].Business Horizons,2015(5).
[3]MOFFITT K C,VASARHELYI M A.AIS in an Age of Big Data[J].Journal of Information,2013,27(2).
[4]郭紅建.基于審計(jì)云的大數(shù)據(jù)審計(jì)技術(shù)與方法[J].管理觀察,2017(36).