陳雄智,徐世鑫
(陸軍勤務(wù)學(xué)院,重慶 400041)
數(shù)據(jù)挖掘(Data Mining,DM)的概念最早是在1995年的美國(guó)計(jì)算機(jī)年會(huì)(ACM)上提出的,其是從海量的、不完全的、有噪音的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱藏的、不為人知的卻潛在有用的信息和知識(shí)的過(guò)程。利用數(shù)據(jù)挖掘技術(shù)的可伸縮性、隱含性、價(jià)值性、預(yù)測(cè)性等特點(diǎn),將其應(yīng)用于經(jīng)濟(jì)責(zé)任審計(jì)中,是傳統(tǒng)審計(jì)方法無(wú)法取代的。經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘平臺(tái)建設(shè)將大數(shù)據(jù)技術(shù)與審計(jì)業(yè)務(wù)深度融合,是貫徹新時(shí)代國(guó)家審計(jì)工作、堅(jiān)定科技強(qiáng)審戰(zhàn)略、運(yùn)用現(xiàn)代化信息技術(shù)和方法手段的實(shí)際舉措,可實(shí)現(xiàn)經(jīng)濟(jì)責(zé)任審計(jì)由賬本式向大數(shù)據(jù)轉(zhuǎn)變,大幅提高審計(jì)的效率和質(zhì)量,增強(qiáng)經(jīng)濟(jì)責(zé)任審計(jì)的精準(zhǔn)度和穿透力。
經(jīng)濟(jì)責(zé)任審計(jì)文件資料龐雜,如財(cái)務(wù)數(shù)據(jù)、會(huì)議記錄數(shù)據(jù)、多媒體數(shù)據(jù)等各種結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),如何從這些泛在的數(shù)據(jù)中找出疑點(diǎn)線(xiàn)索或?qū)徲?jì)證據(jù),是經(jīng)濟(jì)責(zé)任審計(jì)的難點(diǎn)。隨著國(guó)家審計(jì)全覆蓋要求的實(shí)施,人少事多的矛盾更加突出,依靠傳統(tǒng)審計(jì)手段難以完成審計(jì)任務(wù)。數(shù)據(jù)挖掘技術(shù)能夠運(yùn)用不同的算法,快速地從海量數(shù)據(jù)中獲取有價(jià)值的數(shù)據(jù),加快數(shù)據(jù)挖掘技術(shù)應(yīng)用于經(jīng)濟(jì)責(zé)任審計(jì)中的應(yīng)用研究,將兩者有機(jī)融合,是克服經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)內(nèi)容泛在性的影響、提高經(jīng)濟(jì)責(zé)任審計(jì)效率的重要途徑。
經(jīng)濟(jì)責(zé)任審計(jì)對(duì)象特殊,很多數(shù)據(jù)資料難以定量分析,面臨的人為影響因素較多,審計(jì)證據(jù)隱蔽性強(qiáng),審計(jì)線(xiàn)索發(fā)現(xiàn)困難。運(yùn)用數(shù)據(jù)挖掘技術(shù),可對(duì)被審計(jì)單位的會(huì)議記錄、財(cái)務(wù)數(shù)據(jù)及其他各種性質(zhì)的數(shù)據(jù)資料進(jìn)行深層次的分析和研究,將有缺陷的數(shù)據(jù)補(bǔ)全并剔除無(wú)用的數(shù)據(jù),提高數(shù)據(jù)的完整性、可靠性,通過(guò)分析各數(shù)據(jù)間的隱藏鉤稽關(guān)系和關(guān)聯(lián)情況,揭示數(shù)據(jù)原來(lái)的特征和內(nèi)在聯(lián)系,找出通過(guò)傳統(tǒng)手段很難發(fā)現(xiàn)的問(wèn)題,提高審計(jì)質(zhì)量效益。
隨著國(guó)家信息化、智能化發(fā)展的不斷推進(jìn),大量先進(jìn)信息技術(shù)被應(yīng)用于日常經(jīng)濟(jì)活動(dòng),信息化程度越來(lái)越高,僅僅依靠傳統(tǒng)手段顯然已無(wú)法滿(mǎn)足新時(shí)代審計(jì)的要求,亦無(wú)法完成相應(yīng)審計(jì)任務(wù)。針對(duì)經(jīng)濟(jì)責(zé)任審計(jì)的特殊性,要適應(yīng)審計(jì)對(duì)象的需求,積極運(yùn)用新的信息技術(shù)有著更為迫切的需要,只有這樣才能有效應(yīng)對(duì)各種基于新的信息技術(shù)的新型舞弊手段,推動(dòng)經(jīng)濟(jì)責(zé)任審計(jì)技術(shù)升級(jí),降低審計(jì)風(fēng)險(xiǎn)。
數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)責(zé)任審計(jì)中的應(yīng)用,可部分實(shí)現(xiàn)大數(shù)據(jù)審計(jì)中總體分析和發(fā)現(xiàn)疑點(diǎn)的步驟,促進(jìn)經(jīng)濟(jì)責(zé)任審計(jì)由賬本式向大數(shù)據(jù)轉(zhuǎn)變。同時(shí),經(jīng)濟(jì)責(zé)任審計(jì)要求對(duì)財(cái)政收支、國(guó)有資產(chǎn)管理、政府投資、預(yù)算執(zhí)行等經(jīng)濟(jì)活動(dòng)的管理和監(jiān)督情況做出評(píng)價(jià),都帶有一定的主觀性,通過(guò)運(yùn)用數(shù)據(jù)挖掘技術(shù)的算法,可以將部分審計(jì)結(jié)果定量化,推動(dòng)經(jīng)濟(jì)責(zé)任審計(jì)由合規(guī)向績(jī)效轉(zhuǎn)變。
在目前聯(lián)網(wǎng)審計(jì)基礎(chǔ)上,融入經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘平臺(tái),以大數(shù)據(jù)技術(shù)為手段構(gòu)建一個(gè)數(shù)字化審計(jì)專(zhuān)業(yè)平臺(tái)。該平臺(tái)具有審計(jì)數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘的實(shí)現(xiàn)、疑點(diǎn)線(xiàn)索管理、權(quán)限管理、業(yè)務(wù)協(xié)同等功能。總體上構(gòu)建一個(gè)結(jié)構(gòu)合理、快速高效、安全穩(wěn)定的經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘平臺(tái),增強(qiáng)經(jīng)濟(jì)責(zé)任審計(jì)的質(zhì)量和效率。
(1)系統(tǒng)性。在構(gòu)建經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘平臺(tái)過(guò)程中,應(yīng)加強(qiáng)頂層設(shè)計(jì),充分考慮各層級(jí)審計(jì)機(jī)構(gòu)、被審計(jì)單位及其他相關(guān)社會(huì)機(jī)構(gòu)組織的關(guān)系,按照各層級(jí)審計(jì)機(jī)構(gòu)與被審計(jì)單位相對(duì)應(yīng)為主線(xiàn),加強(qiáng)與屬地相關(guān)社會(huì)機(jī)構(gòu)組織聯(lián)系為輔助,合理布局平臺(tái)各模塊功能,統(tǒng)籌設(shè)計(jì),預(yù)留社會(huì)審計(jì)數(shù)據(jù)接口,充分利用社會(huì)資源,形成整體審計(jì)力量合力。
(2)可擴(kuò)展性和兼容性。隨著社會(huì)的高速發(fā)展,會(huì)不斷涌現(xiàn)出新技術(shù)新方法,只有與時(shí)俱進(jìn),在平臺(tái)設(shè)計(jì)構(gòu)建時(shí)充分考慮可擴(kuò)展性,不斷融入新技術(shù),才能以盡量少的代價(jià)適應(yīng)這種變化。注重平臺(tái)功能模塊設(shè)計(jì),確??稍丛床粩嗟靥砑痈鞣N審計(jì)模型,同時(shí)設(shè)置好標(biāo)準(zhǔn)接口,注重平臺(tái)的兼容性建設(shè),盡量多地兼容不同條件下的作業(yè)。
(3)可靠性和安全性??煽啃孕枨缶褪且_保平臺(tái)運(yùn)行穩(wěn)定,對(duì)輸入有提示,數(shù)據(jù)有檢查,防止數(shù)據(jù)異常,能夠處理系統(tǒng)運(yùn)行過(guò)程中出現(xiàn)的各種異常情況,防止誤操作和非法使用,針對(duì)出現(xiàn)的問(wèn)題能正確的處理,恰當(dāng)?shù)幕乇?。安全性需要確保程序安全、系統(tǒng)安全、數(shù)據(jù)安全,主要是確保程序上沒(méi)有安全漏洞,權(quán)限訪(fǎng)問(wèn)控制嚴(yán)格,數(shù)據(jù)不被非法訪(fǎng)問(wèn)和篡改。
(1)數(shù)據(jù)資源層。數(shù)據(jù)源主要包括被審計(jì)單位原始數(shù)據(jù)、財(cái)務(wù)管理數(shù)據(jù)、資源配置數(shù)據(jù)、審計(jì)業(yè)務(wù)數(shù)據(jù)和地方商業(yè)數(shù)據(jù)等,這些數(shù)據(jù)主要通過(guò)網(wǎng)絡(luò)和接口兩種方式采集,并分別將數(shù)據(jù)存儲(chǔ)于基礎(chǔ)信息庫(kù)和分布式文件系統(tǒng),形成平臺(tái)的數(shù)據(jù)資源層。
(2)作業(yè)支撐層。主要包括共用核心服務(wù)、共用支撐服務(wù)和審計(jì)支撐服務(wù),以服務(wù)和構(gòu)件形式為經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘平臺(tái)數(shù)據(jù)采集、預(yù)處理、挖掘的實(shí)現(xiàn)及疑點(diǎn)線(xiàn)索管理等提供支撐。
(3)功能構(gòu)件層。主要包括審計(jì)通用構(gòu)件、數(shù)據(jù)采集構(gòu)件、數(shù)據(jù)預(yù)處理構(gòu)件、數(shù)據(jù)挖掘的實(shí)現(xiàn)構(gòu)件、疑點(diǎn)線(xiàn)索管理構(gòu)件、權(quán)限管理構(gòu)件和業(yè)務(wù)協(xié)同構(gòu)件,這些構(gòu)件可根據(jù)需要添加不同類(lèi)型的挖掘模型,在每個(gè)審計(jì)流程中均可重復(fù)使用。
(4)審計(jì)應(yīng)用層。審計(jì)應(yīng)用層是審計(jì)人員可以直接接觸的層面,按照經(jīng)濟(jì)責(zé)任審計(jì)人員需求,將該平臺(tái)整合到審計(jì)管理系統(tǒng)、現(xiàn)場(chǎng)審計(jì)系統(tǒng)或聯(lián)網(wǎng)審計(jì)系統(tǒng)之中,便于審計(jì)人員操作使用。
經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘平臺(tái)具備多種數(shù)據(jù)挖掘功能,主要可實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘的實(shí)現(xiàn)、疑點(diǎn)線(xiàn)索管理、權(quán)限管理和業(yè)務(wù)協(xié)同六大功能,其功能設(shè)計(jì)如圖1所示。
圖1 經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘平臺(tái)功能設(shè)計(jì)示意
(1)數(shù)據(jù)采集功能。數(shù)據(jù)采集功能包括服務(wù)器自動(dòng)采集、被審計(jì)單位通過(guò)網(wǎng)絡(luò)上傳和審計(jì)人員手工采集三部分,在進(jìn)行數(shù)據(jù)采集前,審計(jì)人員可結(jié)合審計(jì)工作方案中明確的審計(jì)目的、范圍、內(nèi)容及重點(diǎn),結(jié)合審計(jì)前調(diào)查了解的被審計(jì)單位數(shù)據(jù)的來(lái)源和形式,設(shè)定本次數(shù)據(jù)采集的范圍、內(nèi)容及重點(diǎn),實(shí)現(xiàn)數(shù)據(jù)采集功能。
(2)數(shù)據(jù)預(yù)處理功能。數(shù)據(jù)預(yù)處理功能按照數(shù)據(jù)挖掘的流程,設(shè)計(jì)了數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約四個(gè)部分。主要是按照此流程將原始數(shù)據(jù)進(jìn)行初步清理、轉(zhuǎn)換,排除遺漏、冗余和明顯錯(cuò)誤的數(shù)據(jù),并將清理之后的原始數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘平臺(tái)可用的數(shù)據(jù),進(jìn)一步剔除數(shù)據(jù)結(jié)構(gòu)中的干擾項(xiàng)目,以便控制數(shù)據(jù)挖掘的準(zhǔn)確性。
(3)數(shù)據(jù)挖掘的實(shí)現(xiàn)功能。數(shù)據(jù)挖掘的實(shí)現(xiàn)功能主要是運(yùn)用適用于經(jīng)濟(jì)責(zé)任審計(jì)的數(shù)據(jù)挖掘算法,也可固化為相應(yīng)的數(shù)據(jù)挖掘模型,針對(duì)準(zhǔn)備好的數(shù)據(jù),利用關(guān)聯(lián)規(guī)則、聚類(lèi)分析、異常點(diǎn)檢測(cè)等數(shù)據(jù)挖掘技術(shù)方法,發(fā)現(xiàn)數(shù)據(jù)中隱藏的事項(xiàng),確定挖掘操作模型并加以實(shí)現(xiàn)。
(4)疑點(diǎn)線(xiàn)索管理功能。挖掘發(fā)現(xiàn)的疑點(diǎn)線(xiàn)索將轉(zhuǎn)入疑點(diǎn)線(xiàn)索管理構(gòu)件,審計(jì)人員可根據(jù)疑點(diǎn)線(xiàn)索進(jìn)行核查,確定進(jìn)一步審計(jì)內(nèi)容。疑點(diǎn)線(xiàn)索分類(lèi)管理主要是通過(guò)數(shù)據(jù)挖掘的實(shí)現(xiàn)生成的疑點(diǎn)線(xiàn)索,平臺(tái)根據(jù)經(jīng)濟(jì)責(zé)任審計(jì)五大內(nèi)容進(jìn)行分類(lèi)管理。疑點(diǎn)線(xiàn)索數(shù)據(jù)確認(rèn)是審計(jì)人員根據(jù)經(jīng)驗(yàn)判斷或現(xiàn)場(chǎng)審計(jì)調(diào)查結(jié)果,對(duì)疑點(diǎn)線(xiàn)索庫(kù)中的數(shù)據(jù)進(jìn)行確認(rèn)或延伸處理。
(5)權(quán)限管理功能。權(quán)限管理功能包括部門(mén)、職務(wù)和功能管理。根據(jù)經(jīng)濟(jì)責(zé)任審計(jì)規(guī)定的權(quán)限設(shè)置相應(yīng)權(quán)限管理,確保平臺(tái)數(shù)據(jù)安全。
(6)業(yè)務(wù)協(xié)同功能。業(yè)務(wù)協(xié)同功能包括平臺(tái)與現(xiàn)場(chǎng)審計(jì)實(shí)施系統(tǒng)(AO)業(yè)務(wù)協(xié)同、平臺(tái)與審計(jì)管理信息系統(tǒng)(OA)業(yè)務(wù)協(xié)同,審計(jì)人員可利用金審工程資源,與經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘平臺(tái)實(shí)現(xiàn)資源共享。
擁有大量、真實(shí)的數(shù)據(jù)積累是數(shù)據(jù)挖掘技術(shù)應(yīng)用的一個(gè)必要條件。一是要加強(qiáng)數(shù)據(jù)歸集的全面性,針對(duì)經(jīng)濟(jì)責(zé)任審計(jì)內(nèi)容和范圍,研究制定數(shù)據(jù)資源目錄體系和電子數(shù)據(jù)歸集運(yùn)用辦法,全面整合各類(lèi)數(shù)據(jù),形成覆蓋面廣、內(nèi)容豐富、分類(lèi)合理的審計(jì)資源庫(kù);二是要暢通數(shù)據(jù)來(lái)源渠道,積極拓展審計(jì)聯(lián)網(wǎng)系統(tǒng),探索采取設(shè)立審計(jì)前置服務(wù)器和單向網(wǎng)關(guān)等方式,實(shí)現(xiàn)各級(jí)聯(lián)網(wǎng)數(shù)據(jù)自動(dòng)進(jìn)入數(shù)據(jù)中心,實(shí)時(shí)提供數(shù)據(jù)資源;三是擴(kuò)展完善數(shù)據(jù)接口,適應(yīng)各業(yè)務(wù)部門(mén)數(shù)據(jù)管理模式,以便于將分散的、不明來(lái)源的經(jīng)濟(jì)責(zé)任審計(jì)業(yè)務(wù)數(shù)據(jù)進(jìn)行整合。
法律法規(guī)和審計(jì)準(zhǔn)則的建設(shè)往往滯后于信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)的應(yīng)用范圍、程序和標(biāo)準(zhǔn)缺乏足夠的法規(guī)依據(jù)。一是加強(qiáng)總體規(guī)劃設(shè)計(jì)。2013年,國(guó)家審計(jì)署辦公廳印發(fā)了《開(kāi)展審計(jì)數(shù)據(jù)綜合利用的試行意見(jiàn)的通知》,并將數(shù)據(jù)挖掘技術(shù)融入當(dāng)前審計(jì)模式中,需要盡快制定相應(yīng)規(guī)章制度,為應(yīng)用數(shù)據(jù)挖掘技術(shù)提供法規(guī)遵循。二是制定具體操作指引。明確數(shù)據(jù)采集、預(yù)處理、挖掘?qū)崿F(xiàn)、結(jié)果評(píng)價(jià)等方面的通用標(biāo)準(zhǔn)和要求,為數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)責(zé)任審計(jì)中應(yīng)用提供指導(dǎo)。三是完善運(yùn)行機(jī)制。建立各行業(yè)類(lèi)別電子數(shù)據(jù)報(bào)送、管理、利用等規(guī)范化流程,促進(jìn)各環(huán)節(jié)運(yùn)行通暢有序,確保數(shù)據(jù)挖掘的實(shí)現(xiàn)。
一是嚴(yán)格訪(fǎng)問(wèn)權(quán)限,經(jīng)濟(jì)責(zé)任審計(jì)涉及的數(shù)據(jù)面廣、內(nèi)容敏感性強(qiáng),要建立用戶(hù)身份、使用權(quán)限的驗(yàn)證體系,控制用戶(hù)的安全操作,確保數(shù)據(jù)不被非法訪(fǎng)問(wèn)和篡改;二是建立數(shù)據(jù)安全威脅掃描機(jī)制,創(chuàng)設(shè)保護(hù)服務(wù)器,定期對(duì)數(shù)據(jù)安全情況進(jìn)行檢查,查找漏洞隱患,并及時(shí)預(yù)警修補(bǔ);三是加強(qiáng)數(shù)據(jù)安全管理,實(shí)時(shí)更新和升級(jí)數(shù)據(jù)庫(kù),加強(qiáng)數(shù)據(jù)調(diào)取或更新的審核,及時(shí)進(jìn)行數(shù)據(jù)安全保護(hù)調(diào)整,保障數(shù)據(jù)安全。
完成經(jīng)濟(jì)責(zé)任審計(jì)數(shù)據(jù)挖掘工作,需要培養(yǎng)一批既具備審計(jì)知識(shí)和業(yè)務(wù)能力,又具備數(shù)據(jù)挖掘思維的復(fù)合型人才。一要樹(shù)立新觀念。面對(duì)信息技術(shù)的飛速發(fā)展,必須變被動(dòng)為主動(dòng),從傳統(tǒng)的僅依靠經(jīng)驗(yàn)和查詢(xún)式數(shù)據(jù)分析技術(shù)的審計(jì)觀念中走出來(lái),努力培養(yǎng)利用數(shù)據(jù)挖掘等新技術(shù)發(fā)掘隱藏疑點(diǎn)線(xiàn)索的習(xí)慣,突破慣性思維,提高解決新問(wèn)題的思維能力。二要重視人才培養(yǎng)。加強(qiáng)審計(jì)人員繼續(xù)教育,對(duì)審計(jì)人員進(jìn)行專(zhuān)業(yè)培訓(xùn),優(yōu)化知識(shí)結(jié)構(gòu),使其掌握數(shù)據(jù)挖掘的基本原理和方法,靈活運(yùn)用數(shù)據(jù)處理與統(tǒng)計(jì)分析工具,搭建數(shù)據(jù)分析模型,實(shí)現(xiàn)數(shù)據(jù)挖掘方法的有效運(yùn)用。三要合理使用人才。在實(shí)施經(jīng)濟(jì)責(zé)任審計(jì)項(xiàng)目時(shí),將熟悉數(shù)據(jù)挖掘技術(shù)人員與其他人員搭配,科學(xué)合理配置審計(jì)組人員,實(shí)現(xiàn)取長(zhǎng)補(bǔ)短,克服相關(guān)人才不足的問(wèn)題。