楊兆群 蔡潤柱 郭嘉玲
[摘要]商業(yè)銀行非結(jié)構(gòu)化數(shù)據(jù)的增多,給審計(jì)工作帶來諸多挑戰(zhàn),面對(duì)審計(jì)風(fēng)險(xiǎn)的提高,內(nèi)部審計(jì)需要重新審視傳統(tǒng)的審計(jì)工作模式與方法技術(shù),了解審計(jì)發(fā)展的困局與出路,掌握非結(jié)構(gòu)化數(shù)據(jù)分析的發(fā)展現(xiàn)狀,探索一條可行的非結(jié)構(gòu)化數(shù)據(jù)審計(jì)工作模式,從而提高審計(jì)質(zhì)量與效率,降低審計(jì)風(fēng)險(xiǎn),逐步實(shí)現(xiàn)審計(jì)信息化。
[關(guān)鍵詞]商業(yè)銀行?? 內(nèi)部審計(jì)?? 非結(jié)構(gòu)化?? 文本數(shù)據(jù)
互聯(lián)網(wǎng)金融、移動(dòng)支付快速發(fā)展的帶動(dòng)下,
國內(nèi)銀行業(yè)不斷創(chuàng)新業(yè)務(wù)種類與業(yè)務(wù)流程,擴(kuò)展業(yè)務(wù)空間并逐漸向數(shù)字化銀行轉(zhuǎn)變。同時(shí),在強(qiáng)監(jiān)管及內(nèi)部控制的態(tài)勢(shì)下,各項(xiàng)業(yè)務(wù)檔案、指標(biāo)與報(bào)告文檔種類繁多,超過80%為非結(jié)構(gòu)化數(shù)據(jù),包含大量有價(jià)值的信息,而挖掘這些信息又不同于結(jié)構(gòu)化數(shù)據(jù)的處理,由此給內(nèi)部審計(jì)帶來前所未有的挑戰(zhàn),急需一種新的方法予以應(yīng)對(duì)。
一、非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用現(xiàn)狀
(一)非結(jié)構(gòu)化數(shù)據(jù)類型
開展銀行內(nèi)部審計(jì)工作時(shí),需要調(diào)閱審計(jì)對(duì)象各類型的非結(jié)構(gòu)化管理文檔,文檔類型有文本、表格、PDF文件、音頻文件等,這些文檔數(shù)據(jù)主要包括全面風(fēng)險(xiǎn)報(bào)告、人員變動(dòng)、內(nèi)部檢查報(bào)告、考核管理、公文管理等16類,如表1所示。處理如此多的數(shù)據(jù),現(xiàn)有審計(jì)模式很難不失質(zhì)效。
(二)非結(jié)構(gòu)化數(shù)據(jù)特點(diǎn)
隨著業(yè)務(wù)類型及交易控制手段的更新,銀行內(nèi)部產(chǎn)生大量、多類型、價(jià)值密度低的非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)包括行內(nèi)系統(tǒng)數(shù)據(jù)、行內(nèi)文檔數(shù)據(jù),同時(shí)也包括購買行外的征信、處罰、拍賣等數(shù)據(jù)。因此,除數(shù)據(jù)量大、種類繁多、存儲(chǔ)空間大等特點(diǎn)外,非結(jié)構(gòu)化數(shù)據(jù)還具有數(shù)據(jù)結(jié)構(gòu)隨機(jī),無法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享、分析和處理,數(shù)據(jù)結(jié)構(gòu)復(fù)雜,分析使用難度高,大量數(shù)據(jù)處理及不同數(shù)據(jù)之間耦合關(guān)聯(lián),在海量數(shù)據(jù)中不易找尋風(fēng)險(xiǎn)線索,數(shù)據(jù)價(jià)值密度低等特點(diǎn)。
(三)非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用方法
一是銀行系統(tǒng)產(chǎn)生的應(yīng)用日志或系統(tǒng)日志以XML格式保存在數(shù)據(jù)庫表中,日常應(yīng)用中多以數(shù)據(jù)庫語言LIKE或正則表達(dá)式函數(shù)模糊查詢。二是對(duì)于WORD、PDF、EXCEL、TXT、圖片等非結(jié)構(gòu)化電子數(shù)據(jù),主要由審計(jì)對(duì)象提供,數(shù)據(jù)檢查以手工翻閱、人腦分析判斷各線索之間的關(guān)聯(lián)為主。三是對(duì)于培訓(xùn)簽到表、機(jī)房巡檢表、機(jī)房進(jìn)出登記簿、信貸檔案等非結(jié)構(gòu)化紙質(zhì)數(shù)據(jù),現(xiàn)場(chǎng)審計(jì)只能通過人力排查。四是對(duì)于報(bào)告、發(fā)文、審批授權(quán)等存放于系統(tǒng)中的非結(jié)構(gòu)化文件數(shù)據(jù),主要采用抽樣及觀察方式開展檢查。上述方法低效、低質(zhì),無法快速獲得有價(jià)值的信息,反而增加了審計(jì)工作的風(fēng)險(xiǎn)。
二、非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用面臨的問題
現(xiàn)行審計(jì)的基本模式為“非現(xiàn)場(chǎng)+現(xiàn)場(chǎng)”,首先通過非現(xiàn)場(chǎng)結(jié)構(gòu)化的數(shù)據(jù)分析確定工作方向和范圍,然后通過現(xiàn)場(chǎng)檢查確認(rèn)問題屬性,在文檔與音頻等資料數(shù)量少的情形下這樣做是可行的,但在銀行業(yè)信息技術(shù)加快應(yīng)用、風(fēng)控體系管理日益完善、非結(jié)構(gòu)化數(shù)據(jù)已成主流數(shù)據(jù)的形勢(shì)下,已有的非現(xiàn)場(chǎng)技術(shù)僅能對(duì)部分結(jié)構(gòu)化數(shù)據(jù)建模分析,而對(duì)大量有價(jià)值的數(shù)據(jù)則無法有效利用,致使審計(jì)風(fēng)險(xiǎn)不斷加大。
第一,審計(jì)方法與工具不足。由于非結(jié)構(gòu)化數(shù)據(jù)具有量大、類型多、結(jié)構(gòu)不固定等特點(diǎn),傳統(tǒng)的數(shù)據(jù)建模、抽樣統(tǒng)計(jì)、數(shù)據(jù)透視等方法已不再適用,現(xiàn)行廣泛使用的數(shù)據(jù)處理工具SYSBASE、ORACLE、SQL等很難兼容非結(jié)構(gòu)化數(shù)據(jù)。而隨著傳統(tǒng)銀行向數(shù)字化銀行轉(zhuǎn)型,非結(jié)構(gòu)化數(shù)據(jù)的日益增多也使內(nèi)部審計(jì)現(xiàn)有的方法、工具無法應(yīng)對(duì)。
第二,無法實(shí)現(xiàn)連續(xù)審計(jì)。結(jié)構(gòu)化數(shù)據(jù)可以通過數(shù)據(jù)建模、腳本監(jiān)控的方式實(shí)現(xiàn)日常風(fēng)險(xiǎn)的監(jiān)督,較好地保證數(shù)據(jù)的有效性與風(fēng)險(xiǎn)發(fā)現(xiàn)的及時(shí)性,實(shí)現(xiàn)持續(xù)審計(jì)監(jiān)督的職能。但非結(jié)構(gòu)化數(shù)據(jù),審計(jì)人員只能定期或在特定項(xiàng)目中通過人工翻閱,且數(shù)據(jù)大多是歷史性的,時(shí)效性差,即便發(fā)現(xiàn)風(fēng)險(xiǎn)也存在滯后性,無法實(shí)現(xiàn)連續(xù)審計(jì)。
第三,審計(jì)資料利用率低。審計(jì)工作從結(jié)構(gòu)化數(shù)據(jù)中發(fā)現(xiàn)問題的幾率在逐漸減少,大部分有價(jià)值的數(shù)據(jù)潛藏在各種非結(jié)構(gòu)化數(shù)據(jù)中,而審計(jì)項(xiàng)目周期基本在30-90日,因通過人工翻閱大量的非結(jié)構(gòu)化數(shù)據(jù)無法保證完全覆蓋,故一般只按比例抽取一定的數(shù)據(jù)進(jìn)行檢查,資料利用率低,發(fā)現(xiàn)問題缺乏代表性,更難揭露整體風(fēng)險(xiǎn)。
三、非結(jié)構(gòu)化數(shù)據(jù)分析對(duì)于審計(jì)工作的意義
銀行內(nèi)部非結(jié)構(gòu)化數(shù)據(jù)的增多,使審計(jì)面臨的風(fēng)險(xiǎn)隨之增加,充分開展非結(jié)構(gòu)化數(shù)據(jù)分析對(duì)于審計(jì)工作發(fā)揮職能、提質(zhì)增效意義重大。
(一)化繁為簡(jiǎn)
審計(jì)工作需要檢查各種類型的非結(jié)構(gòu)化文本數(shù)據(jù),不同類型文檔采用的檢查手段大相徑庭,檢查流程千差萬別,對(duì)審計(jì)人員的能力及經(jīng)驗(yàn)有較高要求,比如,檢查信貸客戶,既要翻閱堆積如山的紙質(zhì)信貸檔案,又要登錄系統(tǒng)查詢授信審批流程日志,審計(jì)過程繁瑣而又機(jī)械,關(guān)注的風(fēng)險(xiǎn)點(diǎn)又大不相同。通過引入非結(jié)構(gòu)化數(shù)據(jù)分析技術(shù),將多種形式的文本數(shù)據(jù)規(guī)范為一種,利用關(guān)鍵詞算法技術(shù)快速提取可疑風(fēng)險(xiǎn)點(diǎn),達(dá)到化繁為簡(jiǎn)的目的。
(二)提升價(jià)值
傳統(tǒng)審計(jì)工作中僅利用結(jié)構(gòu)化數(shù)據(jù)及少部分非結(jié)構(gòu)化數(shù)據(jù),描述的風(fēng)險(xiǎn)不夠全面系統(tǒng),數(shù)據(jù)價(jià)值未能有效展示。運(yùn)用非結(jié)構(gòu)化技術(shù)后,一是可以充分挖掘數(shù)據(jù),提取有價(jià)值的數(shù)據(jù),彌補(bǔ)單純結(jié)構(gòu)化數(shù)據(jù)分析的不足;二是充分整合數(shù)據(jù),尤其是數(shù)據(jù)之間的關(guān)聯(lián)性,形成對(duì)審計(jì)對(duì)象的整體畫像,降低因數(shù)據(jù)量不足而引起的理解偏差,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的提升。
(三)提速增效
在非結(jié)構(gòu)化數(shù)據(jù)量加速增加的時(shí)代,審計(jì)人員僅靠手工翻閱及肉眼排查,必然會(huì)導(dǎo)致審計(jì)周期被拖長,審計(jì)范圍被限制,最終影響審計(jì)效率與效益。非結(jié)構(gòu)化數(shù)據(jù)分析技術(shù)的運(yùn)用,可快速識(shí)別和分析資料文檔,形成審計(jì)場(chǎng)景的風(fēng)險(xiǎn)因子,從而加快審計(jì)工作開展,提升審計(jì)工作質(zhì)量。
(四)降低風(fēng)險(xiǎn)
審計(jì)風(fēng)險(xiǎn)作為審計(jì)工作的系統(tǒng)性風(fēng)險(xiǎn),不能通過風(fēng)險(xiǎn)組合或者替代等手段將其杜絕。隨著非結(jié)構(gòu)化數(shù)據(jù)的增多,審計(jì)工作難以有效地把握審計(jì)對(duì)象的整體風(fēng)險(xiǎn)情況,深度與廣度受到數(shù)據(jù)復(fù)雜度及數(shù)據(jù)量的影響,導(dǎo)致風(fēng)險(xiǎn)累積效應(yīng)增大。而借助非結(jié)構(gòu)化數(shù)據(jù)分析手段,全面分析和利用數(shù)據(jù),形成整體的風(fēng)險(xiǎn)圖譜,可有效減少審計(jì)過程的風(fēng)險(xiǎn)累積。通過最大程度地分析數(shù)據(jù),可發(fā)現(xiàn)具有普遍性、全局性的風(fēng)險(xiǎn)因素,實(shí)現(xiàn)審計(jì)風(fēng)險(xiǎn)有效可控。
四、非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用原理與場(chǎng)景
(一)非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用原理
非結(jié)構(gòu)化數(shù)據(jù)分析的原理是通過將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù),然后對(duì)文本數(shù)據(jù)進(jìn)行加工處理,逐步轉(zhuǎn)為半結(jié)構(gòu)化或結(jié)構(gòu)化數(shù)據(jù),如圖1所示。
1. 非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換。為便于統(tǒng)一分析,簡(jiǎn)化分析方法,首先將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù),其中OFFICE文檔與TXT文件轉(zhuǎn)換為文本數(shù)據(jù)較為容易,自身就是可編輯的文本;PDF文件可借助文本編輯工具如OFFICE、WPS等轉(zhuǎn)換為WORD或TXT文件;圖片文件轉(zhuǎn)換主要使用OCR技術(shù)識(shí)別圖片數(shù)據(jù),但轉(zhuǎn)換的準(zhǔn)確率會(huì)受圖片質(zhì)量的影響,目前OCR技術(shù)識(shí)別圖片數(shù)據(jù)仍需要人工校驗(yàn),并逐步優(yōu)化識(shí)別腳本;音頻文件轉(zhuǎn)換為文本數(shù)據(jù),需要借助外部工具,如訊飛、百度語音等應(yīng)用工具,轉(zhuǎn)換準(zhǔn)確率較高。
2. 文本數(shù)據(jù)處理。非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為文本數(shù)據(jù)時(shí)處于半結(jié)構(gòu)化狀態(tài),需用已有的NLP、SNA算法進(jìn)行處理。常用的文本處理算法包括TF-IDF、TextRank、Word2vec及Doc2vec等,每種算法都有相應(yīng)的應(yīng)用場(chǎng)景與特點(diǎn),如表2所示。
3. 數(shù)據(jù)分析。從文本數(shù)據(jù)中提取的關(guān)鍵詞、關(guān)鍵句、詞向量等數(shù)據(jù),可根據(jù)應(yīng)用場(chǎng)景的不同采取不同的數(shù)據(jù)分析方法,常用的分析方法有SNA分析、聚焦分析、經(jīng)營分析、員工違規(guī)分析等。數(shù)據(jù)分析不能一蹴而就、一勞永逸,還需對(duì)其結(jié)果的準(zhǔn)確率及適應(yīng)性進(jìn)行檢查,逐步完善算法學(xué)習(xí)。銀行內(nèi)部常用的非結(jié)構(gòu)化數(shù)據(jù)提取關(guān)鍵詞詞庫如表3所示。
4. 審計(jì)作業(yè)。數(shù)據(jù)分析的結(jié)果要與審計(jì)作業(yè)相結(jié)合,服務(wù)于審計(jì)工作。同時(shí),審計(jì)工作要提供數(shù)據(jù)分析場(chǎng)景及反饋數(shù)據(jù)分析的驗(yàn)證結(jié)果,促進(jìn)數(shù)據(jù)分析模型的迭代優(yōu)化。審計(jì)作業(yè)在整個(gè)非結(jié)構(gòu)化分析過程中同樣重要,驗(yàn)證的全面性與適應(yīng)性決定了數(shù)據(jù)分析模型的質(zhì)量。
(二)非結(jié)構(gòu)化數(shù)據(jù)分析在銀行審計(jì)中的應(yīng)用場(chǎng)景
1. 授信報(bào)告情感分析。信貸業(yè)務(wù)的全流程包括貸前、貸中、貸后三個(gè)階段,審計(jì)工作需要對(duì)每個(gè)階段的客戶調(diào)查報(bào)告進(jìn)行人工翻閱和判斷,這個(gè)過程要耗費(fèi)大量的人力成本與時(shí)間成本并存在一定的操作風(fēng)險(xiǎn)。運(yùn)用情感分析文本挖掘技術(shù),可以將文本數(shù)據(jù)向量化,利用模型學(xué)習(xí)來分析文本內(nèi)容,從而減少審計(jì)項(xiàng)目成本投入,實(shí)現(xiàn)對(duì)授信客戶風(fēng)險(xiǎn)的準(zhǔn)確判斷。
2. 報(bào)告相似度分析。在銀行工作中,有很多報(bào)告或報(bào)表需要定期編寫,如信貸客戶調(diào)查報(bào)告、系統(tǒng)上線后評(píng)價(jià)報(bào)告等,通過報(bào)告相似度分析,可以判斷員工的履職情況,有效降低內(nèi)控合規(guī)風(fēng)險(xiǎn)。另外,報(bào)告相似度分析也可以應(yīng)用到客戶提交材料的分析,如財(cái)務(wù)報(bào)告、資產(chǎn)負(fù)債表等,分析客戶提交材料的真實(shí)性,及時(shí)發(fā)現(xiàn)業(yè)務(wù)風(fēng)險(xiǎn)。
3. 客戶畫像。全面了解客戶是一項(xiàng)困難的工作,特別是在單純依賴結(jié)構(gòu)化數(shù)據(jù)的情況下,客戶信息的不完整影響對(duì)客戶整體風(fēng)險(xiǎn)的判斷,易造成風(fēng)險(xiǎn)事件。利用非結(jié)構(gòu)化數(shù)據(jù),大多時(shí)候會(huì)包含一些外部數(shù)據(jù),如判決信息、商業(yè)信息、習(xí)慣信息等,提取這些客戶關(guān)鍵信息,通過對(duì)客戶貼信息標(biāo)簽,將客戶的特征信息提取再匯總,形成對(duì)客戶的整體畫像,更加全面了解客戶,從而為客戶打造更好的服務(wù)。
五、非結(jié)構(gòu)化數(shù)據(jù)分析應(yīng)用案例
根據(jù)非結(jié)構(gòu)化數(shù)據(jù)分析原理及場(chǎng)景,利用Python(V3.7)分析工具,針對(duì)情感分析及相似度分析應(yīng)用案例展開說明。
(一)授信報(bào)告情感分析應(yīng)用
在銀行信貸業(yè)務(wù)申請(qǐng)過程中,銀行需要對(duì)申請(qǐng)人開展一系列審核,主要是評(píng)價(jià)申請(qǐng)人的各種經(jīng)營情況、還款意愿的真實(shí)性。通常情況下,銀行對(duì)貸款申請(qǐng)人的工作背景、經(jīng)濟(jì)實(shí)力等因素展開分析,但是僅憑這些要素不足以判斷借款人的真實(shí)風(fēng)險(xiǎn)。在很多情況下,壞賬的發(fā)生是因?yàn)榻杩钊说闹饔^因素所引起,這些因素包括申請(qǐng)貸款的動(dòng)機(jī)、還款的能力、財(cái)務(wù)狀況等,因此需要將情感因素納入到貸款的風(fēng)險(xiǎn)評(píng)估當(dāng)中。通過在貸款審批意見過程中加入情感分析模塊,分析銀行授信整個(gè)流程中貸款的審批意見情感因子,能夠有效解決上述問題。審批意見的情感分析應(yīng)用是對(duì)授信流程中所有文檔的情感分析,通過授信流程中所有的文檔表現(xiàn)出來的語義和情感傾向,判斷是否存在風(fēng)險(xiǎn)隱患。授信審批意見表現(xiàn)出來的情感傾向隨著風(fēng)險(xiǎn)的變化有微妙的變化,不同授信環(huán)節(jié)的人由于與項(xiàng)目利益相關(guān)性不同,情感上存在差異,如客戶經(jīng)理與審查員的風(fēng)險(xiǎn)關(guān)注點(diǎn)不同,貸款審查委員之間對(duì)于項(xiàng)目的認(rèn)知也具有明顯傾向性,風(fēng)險(xiǎn)經(jīng)理與業(yè)務(wù)客戶經(jīng)理的風(fēng)險(xiǎn)把握不盡相同。因此,必須將授信流程中的重要文檔(授信分析報(bào)告、審查意見、貸審會(huì)記錄、風(fēng)險(xiǎn)核查報(bào)告、監(jiān)控報(bào)告、貸后檢查報(bào)告等)都作為處理對(duì)象,一方面可以得出不同環(huán)節(jié)的文本情感得分差異,另一方面可以綜合評(píng)分判斷風(fēng)險(xiǎn)。如圖2所示。
基于貸款審批意見的文本情感分析,主要目標(biāo)是通過對(duì)貸款流程報(bào)告中的所有審批意見進(jìn)行情感分析,查找負(fù)面傾向明顯的客戶,如表4所示。
通過風(fēng)險(xiǎn)模型的方式可以鎖定部分風(fēng)險(xiǎn)客戶。另外,外部黑名單數(shù)據(jù)通過和行內(nèi)客戶關(guān)聯(lián)也可以鎖定部分黑名單客戶,通過情感分析也可以得出疑似可能發(fā)生風(fēng)險(xiǎn)的客戶。從這三個(gè)維度,就可以對(duì)行內(nèi)的客戶進(jìn)行抽樣,從而更精準(zhǔn)地找出疑似風(fēng)險(xiǎn)客戶。
(二)調(diào)查報(bào)告相似度分析
場(chǎng)景一:分支機(jī)構(gòu)會(huì)定期提交月報(bào)或者季報(bào),通過文本相似度分析對(duì)提交的報(bào)告進(jìn)行檢查,目的是核查相關(guān)人員是否認(rèn)真編寫報(bào)告。相似度的計(jì)算結(jié)果在0-1之間,如果相似度達(dá)到一定閾值,則可判斷兩份報(bào)告的相似度較高。
場(chǎng)景二:部分銀行客戶與資金中介進(jìn)行合作,貸款前的調(diào)查報(bào)告由資金中介完成,因而導(dǎo)致同一個(gè)中介下很多客戶的貸前調(diào)查報(bào)告非常相似。
場(chǎng)景三:銀行在發(fā)放貸款后,會(huì)定期進(jìn)行貸后調(diào)查并出具貸后調(diào)查報(bào)告。分析各個(gè)季度或者月度貸后調(diào)查報(bào)告相似的情況。在中文信息處理中,文本相似度的計(jì)算廣泛應(yīng)用于信息檢索、機(jī)器翻譯、自動(dòng)問答系統(tǒng)、文本挖掘等領(lǐng)域。文本相似度計(jì)算目前的主流方法是采用語義結(jié)合詞頻的方式。在進(jìn)行文本分析的過程中,詞語首先要轉(zhuǎn)換為詞向量,向量空間模型將字詞轉(zhuǎn)為連續(xù)值的向量表達(dá),并且意思相近的詞將被映射到向量空間中相近的位置。轉(zhuǎn)換后的詞匯都是空間中的點(diǎn),如圖3 所示。
通過計(jì)算向量空間詞語的相似度,可以最終計(jì)算兩個(gè)句子的相似度, 如表5所示。
總之,隨著信息技術(shù)的發(fā)展,大數(shù)據(jù)應(yīng)用已成為數(shù)據(jù)分析常態(tài),非結(jié)構(gòu)化數(shù)據(jù)分析作為大數(shù)據(jù)應(yīng)用的一部分,在商業(yè)銀行內(nèi)部審計(jì)工作中的重要性顯著提高。內(nèi)部審計(jì)在處理非結(jié)構(gòu)化數(shù)據(jù)時(shí)還不能像處理結(jié)構(gòu)化數(shù)據(jù)那樣游刃有余,面對(duì)審計(jì)項(xiàng)目的增多,審計(jì)資料的多樣化與復(fù)雜化,單靠人力無法實(shí)現(xiàn)審計(jì)工作質(zhì)的飛躍與量的提升,勢(shì)必要開展非結(jié)構(gòu)化數(shù)據(jù)的分析與應(yīng)用,提升數(shù)據(jù)分析模型的質(zhì)量,做好技術(shù)分析與審計(jì)實(shí)施的結(jié)合,逐步提升審計(jì)工作持續(xù)性與全面性,加快內(nèi)部審計(jì)工作信息化建設(shè)。
(作者單位:東莞銀行股份有限公司,郵政編碼:523000,電子郵箱:yazhaqu@163.com)
主要參考文獻(xiàn)
陳偉,勾東升,徐發(fā)亮.基于文本數(shù)據(jù)分析的大數(shù)據(jù)審計(jì)方法研究[J].中國注冊(cè)會(huì)計(jì)師, 2018(11):80-84
呂勁松,王志成,王秦輝,徐權(quán).大數(shù)據(jù)環(huán)境下商業(yè)銀行審計(jì)非結(jié)構(gòu)化數(shù)據(jù)研究[J].管理理論與方法, 2017(205):141-144
徐宗本,張講社.基于認(rèn)知的非結(jié)構(gòu)化信息處理:現(xiàn)狀與趨勢(shì)[J].中國基礎(chǔ)科學(xué), 2007(6):4-8
趙輝,范志城,許永池,陳波,徐秀星.基于關(guān)鍵字檢索的方法在非結(jié)構(gòu)化審計(jì)數(shù)據(jù)分析中的運(yùn)用[J].中國內(nèi)部審計(jì), 2010(10):58-61