汪莉 葉健彪
[摘要]本文結(jié)合內(nèi)審工作具體實(shí)踐,探討OCR技術(shù)在財(cái)產(chǎn)保險(xiǎn)公司內(nèi)部審計(jì)工作中的應(yīng)用基礎(chǔ)、預(yù)期目標(biāo)及應(yīng)用場(chǎng)景,以期促進(jìn)審計(jì)技術(shù)創(chuàng)新、提高審計(jì)工作效率及效果。
[關(guān)鍵詞]OCR技術(shù)? ? 內(nèi)部審計(jì)? ? 技術(shù)創(chuàng)新
人工智能、大數(shù)據(jù)的發(fā)展已經(jīng)上升為國(guó)家戰(zhàn)
在略的當(dāng)下,運(yùn)用科技手段推進(jìn)審計(jì)技術(shù)的深度轉(zhuǎn)型勢(shì)在必行。加強(qiáng)審計(jì)技術(shù)創(chuàng)新研究,是內(nèi)部審計(jì)部門(mén)和人員順應(yīng)審計(jì)工作發(fā)展新形勢(shì)、新要求,行使好審計(jì)監(jiān)督職責(zé),保障國(guó)有保險(xiǎn)企業(yè)高質(zhì)量發(fā)展轉(zhuǎn)型的必然要求。積極探索OCR技術(shù)在內(nèi)部審計(jì)工作中的應(yīng)用,是審計(jì)人員推進(jìn)審計(jì)技術(shù)創(chuàng)新的有益實(shí)踐。
一、內(nèi)部審計(jì)應(yīng)用OCR技術(shù)的現(xiàn)實(shí)基礎(chǔ)及實(shí)現(xiàn)目標(biāo)
光學(xué)字符識(shí)別(Optical Character Recognition,
簡(jiǎn)稱(chēng)OCR)是指對(duì)圖像文件進(jìn)行分析識(shí)別處理,獲取文字及版面信息并翻譯成計(jì)算機(jī)文字的過(guò)程。簡(jiǎn)言之,就是將掃描文檔中的文字進(jìn)行識(shí)別,再以文本的形式輸出。
在移動(dòng)互聯(lián)時(shí)代,OCR可以說(shuō)是一門(mén)非?!肮爬稀钡募夹g(shù)。從20世紀(jì)50年代發(fā)展至今,OCR技術(shù)在圖像文件識(shí)別的理論和應(yīng)用方面,已非常成熟。近年來(lái),OCR技術(shù)在保險(xiǎn)行業(yè)的應(yīng)用如火如荼。就財(cái)產(chǎn)保險(xiǎn)公司的經(jīng)營(yíng)而言,現(xiàn)階段主要應(yīng)用識(shí)別特定場(chǎng)景的專(zhuān)用OCR,實(shí)現(xiàn)如承保環(huán)節(jié)自然人身份證、駕駛證和企業(yè)工商登記證照識(shí)別;承保車(chē)輛行駛證識(shí)別;智能財(cái)務(wù)審核中對(duì)發(fā)票、火車(chē)票、出租車(chē)票等票據(jù)的識(shí)別以及合同審核。相對(duì)于OCR技術(shù)在保險(xiǎn)公司承保、理賠和財(cái)務(wù)環(huán)節(jié)的研究和應(yīng)用,OCR技術(shù)在內(nèi)部審計(jì)工作中的應(yīng)用尚處于摸索階段。在內(nèi)部審計(jì)過(guò)程中,面對(duì)影像系統(tǒng)種類(lèi)繁多、類(lèi)別各異的圖像資料,OCR技術(shù)的應(yīng)用缺乏標(biāo)準(zhǔn)化、結(jié)構(gòu)化的識(shí)別基礎(chǔ),實(shí)現(xiàn)難度較大。以費(fèi)用報(bào)銷(xiāo)系統(tǒng)中的重要票據(jù)——發(fā)票圖像為例,在營(yíng)業(yè)稅改增值稅實(shí)施以前,影像系統(tǒng)中發(fā)票種類(lèi)較多,既有營(yíng)業(yè)稅發(fā)票又有增值稅發(fā)票,既有機(jī)打發(fā)票又有手工發(fā)票和定額發(fā)票,且各地發(fā)票式樣不統(tǒng)一,使用OCR技術(shù)對(duì)發(fā)票信息進(jìn)行識(shí)別存在較大技術(shù)瓶頸,不具備應(yīng)用基礎(chǔ)。2016年5月1日營(yíng)改增實(shí)施后,增值稅發(fā)票的式樣實(shí)現(xiàn)了票種和地域的統(tǒng)一,為OCR技術(shù)在審計(jì)領(lǐng)域的應(yīng)用創(chuàng)造了客觀條件。現(xiàn)階段,應(yīng)用OCR技術(shù)推動(dòng)內(nèi)部審計(jì)的創(chuàng)新具備了現(xiàn)實(shí)基礎(chǔ),將有力提升審計(jì)技術(shù)水平。
(一)激活沉睡數(shù)據(jù)價(jià)值,進(jìn)一步擴(kuò)展審計(jì)分析內(nèi)容
傳統(tǒng)的審計(jì)模式下,保險(xiǎn)公司內(nèi)審人員僅能對(duì)核心業(yè)務(wù)系統(tǒng)及關(guān)聯(lián)信息系統(tǒng)中的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,而在保險(xiǎn)公司龐大的數(shù)據(jù)儲(chǔ)存庫(kù)中,僅有少數(shù)為結(jié)構(gòu)化數(shù)據(jù),絕大部分為非結(jié)構(gòu)化數(shù)據(jù)信息,諸如圖像、語(yǔ)音、視頻等。隨著業(yè)務(wù)規(guī)模的快速發(fā)展以及電子化運(yùn)營(yíng)程度的不斷深入,保險(xiǎn)公司在承保、理賠和財(cái)務(wù)等業(yè)務(wù)環(huán)節(jié)所產(chǎn)生的大量紙質(zhì)材料,通過(guò)掃描設(shè)備轉(zhuǎn)化成電子文檔保存至影像系統(tǒng),影像系統(tǒng)積累了海量的非結(jié)構(gòu)化信息,這些信息尚未轉(zhuǎn)化成供內(nèi)部審計(jì)工作利用的有效數(shù)據(jù)。通過(guò)OCR技術(shù),能夠?qū)⒂跋裣到y(tǒng)中的非結(jié)構(gòu)化數(shù)據(jù)識(shí)別成文本數(shù)據(jù)輸出,并形成審計(jì)分析對(duì)象。以費(fèi)用報(bào)銷(xiāo)系統(tǒng)的影像為例,通過(guò)對(duì)增值稅發(fā)票票面的信息內(nèi)涵和數(shù)據(jù)價(jià)值進(jìn)行充分挖掘,將進(jìn)一步擴(kuò)展和延伸審計(jì)分析的內(nèi)容和范圍,有效提升審計(jì)價(jià)值。
(二)拓寬風(fēng)險(xiǎn)數(shù)據(jù)維度,進(jìn)一步豐富預(yù)警規(guī)則
現(xiàn)階段的內(nèi)部審計(jì)對(duì)于風(fēng)險(xiǎn)的感知和識(shí)別,主要依靠審計(jì)輔助系統(tǒng)提取風(fēng)險(xiǎn)數(shù)據(jù),由于風(fēng)險(xiǎn)數(shù)據(jù)的提取規(guī)則主要基于結(jié)構(gòu)化數(shù)據(jù),缺少非結(jié)構(gòu)化數(shù)據(jù)所蘊(yùn)含的信息,往往難以反映風(fēng)險(xiǎn)全貌。以費(fèi)用列支的真實(shí)性和合規(guī)性審計(jì)為例,目前主要采用“科目+憑證”的方法進(jìn)行抽樣篩查,審計(jì)發(fā)現(xiàn)的風(fēng)險(xiǎn)往往僅能反映單一業(yè)務(wù)或單一機(jī)構(gòu)的“點(diǎn)”上異動(dòng),風(fēng)險(xiǎn)數(shù)據(jù)的維度相對(duì)單一。引入OCR技術(shù),將全域和全量的發(fā)票影像識(shí)別轉(zhuǎn)化為Excel電子數(shù)據(jù),再將轉(zhuǎn)化后的數(shù)據(jù)與報(bào)銷(xiāo)系統(tǒng)已有的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行關(guān)聯(lián)匹配,在技術(shù)層面打通業(yè)務(wù)和經(jīng)營(yíng)機(jī)構(gòu)的邊界,豐富預(yù)警規(guī)則,有利于內(nèi)審人員發(fā)現(xiàn)“面”上的問(wèn)題,進(jìn)一步查找審計(jì)線(xiàn)索。
(三)提高非現(xiàn)場(chǎng)審計(jì)效率和精準(zhǔn)度,進(jìn)一步降低審計(jì)風(fēng)險(xiǎn)
審計(jì)抽樣是審計(jì)人員在非現(xiàn)場(chǎng)階段的主要工作。傳統(tǒng)審計(jì)模式下,開(kāi)展非現(xiàn)場(chǎng)分析提取審計(jì)樣本主要有兩種方法:一是結(jié)合以往審計(jì)檢查發(fā)現(xiàn)的風(fēng)險(xiǎn)點(diǎn)提取風(fēng)險(xiǎn)數(shù)據(jù);二是通過(guò)提取審計(jì)區(qū)間的全量業(yè)務(wù)清單,依據(jù)經(jīng)驗(yàn)進(jìn)行人工判斷、篩選和提取抽樣。選取審計(jì)樣本后,審計(jì)人員需要登錄相關(guān)系統(tǒng)逐筆查看,了解基本事實(shí)后,再結(jié)合現(xiàn)場(chǎng)審計(jì)進(jìn)行核實(shí)確認(rèn)。在業(yè)務(wù)量不大的情況下,傳統(tǒng)審計(jì)抽樣方法是行之有效的,但隨著業(yè)務(wù)規(guī)模的急劇增加,依賴(lài)少量數(shù)據(jù)樣本的抽樣技術(shù)暴露出局限性,對(duì)于審計(jì)人員來(lái)說(shuō)具有一定的風(fēng)險(xiǎn),如果審計(jì)人員想降低抽樣風(fēng)險(xiǎn),只能增加抽樣的樣本。而出于時(shí)間和人力成本考慮,一味通過(guò)增加樣本量降低審計(jì)風(fēng)險(xiǎn)顯然不現(xiàn)實(shí)。應(yīng)用包括OCR在內(nèi)的人工智能技術(shù)解決海量數(shù)據(jù)下審計(jì)抽樣困局,將是推進(jìn)非現(xiàn)場(chǎng)審計(jì)深度轉(zhuǎn)型的有效途徑。人工智能使得審計(jì)人員能夠?qū)彶樗袛?shù)據(jù),審計(jì)人員可以不再局限于依賴(lài)少量數(shù)據(jù)樣本,而是立足總體樣本的審計(jì)檢查,可從所有數(shù)據(jù)中獲得相關(guān)信息。
(四)儲(chǔ)備數(shù)據(jù)資源,進(jìn)一步提升審計(jì)信息化水平
在人工智能時(shí)代,內(nèi)部審計(jì)不再只是查錯(cuò)糾弊,將更加緊密?chē)@企業(yè)發(fā)展大局,立足于價(jià)值創(chuàng)造,推動(dòng)高質(zhì)量發(fā)展轉(zhuǎn)型。人工智能可以利用自身優(yōu)勢(shì)對(duì)海量數(shù)據(jù)進(jìn)行搜集、挖掘、歸納以及深度分析,從更高層面、更廣范圍、更加綜合的視角提供具有前瞻性的審計(jì)建議,這是一個(gè)變數(shù)據(jù)為資源、變資源為智慧的過(guò)程。構(gòu)建基于人工智能技術(shù)的智能審計(jì)系統(tǒng)將成為未來(lái)內(nèi)部審計(jì)信息化建設(shè)的趨勢(shì)。以O(shè)CR技術(shù)形成的數(shù)據(jù)及系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)為資源,一方面,結(jié)合機(jī)器學(xué)習(xí)的應(yīng)用,推動(dòng)構(gòu)建多維度風(fēng)險(xiǎn)數(shù)據(jù)的智能分析模型;另一方面,結(jié)合大數(shù)據(jù)技術(shù),將內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,可以收集更多的審計(jì)證據(jù),進(jìn)一步提升審計(jì)價(jià)值。
二、OCR技術(shù)可應(yīng)用的審計(jì)業(yè)務(wù)場(chǎng)景
由于影像系統(tǒng)存儲(chǔ)的影像資料種類(lèi)繁多,且涉及承保、理賠和財(cái)務(wù)等多個(gè)業(yè)務(wù)環(huán)節(jié),在技術(shù)探索階段,以財(cái)務(wù)費(fèi)用報(bào)銷(xiāo)系統(tǒng)為切入點(diǎn),選取標(biāo)準(zhǔn)化、規(guī)范化程度較高的增值稅發(fā)票、火車(chē)票等票據(jù)圖像,進(jìn)行格式化識(shí)別,并嘗試應(yīng)用于以下審計(jì)業(yè)務(wù)場(chǎng)景。
(一)對(duì)公務(wù)接待和商務(wù)活動(dòng)是否落實(shí)中央“八項(xiàng)規(guī)定”精神的核查
在全面從嚴(yán)治黨的新形勢(shì)和新要求下,國(guó)有企業(yè)領(lǐng)導(dǎo)干部在日常經(jīng)營(yíng)過(guò)程中是否嚴(yán)格落實(shí)中央“八項(xiàng)規(guī)定”精神,是經(jīng)理經(jīng)濟(jì)責(zé)任審計(jì)和高級(jí)管理人員審計(jì)必須關(guān)注的重要事項(xiàng)。通過(guò)OCR技術(shù),對(duì)涉及公務(wù)接待和商務(wù)活動(dòng)的報(bào)銷(xiāo)事項(xiàng)進(jìn)行篩查,能夠迅速錨定是否存在違紀(jì)違規(guī)問(wèn)題線(xiàn)索,主動(dòng)開(kāi)展核查。
1.對(duì)違規(guī)購(gòu)買(mǎi)土特產(chǎn)、高檔煙酒等事項(xiàng)的核查。提取招待費(fèi)、宣傳費(fèi)、公雜費(fèi)科目項(xiàng)下所有增值稅發(fā)票的影像,運(yùn)用OCR技術(shù)對(duì)發(fā)票開(kāi)具方、商品名稱(chēng)等內(nèi)容進(jìn)行識(shí)別,重點(diǎn)關(guān)注發(fā)票開(kāi)具方含有“商貿(mào)”“特產(chǎn)”“煙酒”“商行”的費(fèi)用報(bào)銷(xiāo),以及采購(gòu)的商品名稱(chēng)中含有“煙”“酒”“禮盒”。需要關(guān)注的是,審計(jì)實(shí)踐中發(fā)現(xiàn)基層公司存在隱形變異現(xiàn)象,通過(guò)開(kāi)具“購(gòu)水”或者“購(gòu)茶葉”等發(fā)票進(jìn)行變通,掩蓋實(shí)際采購(gòu)的商品信息。對(duì)于此類(lèi)情況,在對(duì)票面信息要素進(jìn)行識(shí)別后,審計(jì)人員可通過(guò)現(xiàn)場(chǎng)訪談、盤(pán)點(diǎn)實(shí)物等方法對(duì)采購(gòu)的真實(shí)性進(jìn)行核查。
2.對(duì)超標(biāo)購(gòu)置宣傳品的核查。保險(xiǎn)公司在品牌營(yíng)銷(xiāo)、業(yè)務(wù)公關(guān)、拜訪重要客戶(hù)、接待來(lái)訪嘉賓等對(duì)外公務(wù)活動(dòng)中,贈(zèng)送宣傳品屬于正常的商務(wù)往來(lái),但相關(guān)宣傳品購(gòu)置應(yīng)符合中央“八項(xiàng)規(guī)定”精神要求,避免奢侈。提取宣傳費(fèi)、廣告費(fèi)科目項(xiàng)下增值稅發(fā)票的影像,運(yùn)用OCR技術(shù)對(duì)發(fā)票開(kāi)具方、商品名稱(chēng)和單價(jià)等內(nèi)容進(jìn)行識(shí)別,轉(zhuǎn)換成Excel文本后再進(jìn)行比對(duì)篩查。
3.對(duì)超標(biāo)出行事項(xiàng)的核查。中央針對(duì)超標(biāo)乘坐交通工具出臺(tái)了明確規(guī)定,同時(shí)國(guó)內(nèi)機(jī)票、火車(chē)票的票面都清晰標(biāo)注了艙位和座位等級(jí)。運(yùn)用OCR技術(shù)對(duì)差旅費(fèi)報(bào)銷(xiāo)中機(jī)票艙位、火車(chē)票座位等級(jí)等信息進(jìn)行識(shí)別,重點(diǎn)關(guān)注機(jī)票艙位為F、A、C、D,火車(chē)票座位等級(jí)為一等座、軟臥的差旅費(fèi)報(bào)銷(xiāo),并與出差人員的職務(wù)級(jí)別進(jìn)行比對(duì),從中篩選超標(biāo)乘坐交通工具的行為。
4.對(duì)高檔酒店住宿和消費(fèi)的核查。提取差旅費(fèi)、招待費(fèi)、會(huì)議費(fèi)科目項(xiàng)下所有增值稅發(fā)票的影像,并對(duì)發(fā)票開(kāi)具方進(jìn)行識(shí)別,根據(jù)酒店名稱(chēng)信息篩選屬于高檔酒店的費(fèi)用。如某支公司2018年5月2日?qǐng)?bào)銷(xiāo)差旅費(fèi)2,178元,發(fā)票開(kāi)具方為某酒店,該酒店在旅游訂房網(wǎng)站顯示為五星級(jí)酒店。在鎖定相關(guān)信息后,審計(jì)人員可結(jié)合現(xiàn)場(chǎng)訪談,了解實(shí)際情況,確定是否存在高檔酒店消費(fèi)情況。
(二)對(duì)高頻交易及異常采購(gòu)的核查
1.對(duì)同一經(jīng)營(yíng)單位在同一供應(yīng)商連續(xù)多次采購(gòu)的核查。在保險(xiǎn)行業(yè)亂象中,基層公司變通列支銷(xiāo)售費(fèi)用及虛開(kāi)發(fā)票套取費(fèi)用用于爭(zhēng)搶業(yè)務(wù)是監(jiān)管治理的重點(diǎn)。從以往審計(jì)經(jīng)驗(yàn)看,此類(lèi)情況多為在同一商品銷(xiāo)售單位連續(xù)、多次采購(gòu)。應(yīng)用OCR技術(shù),提取增值稅發(fā)票的開(kāi)具方、商品名稱(chēng)、開(kāi)具日期等信息,重點(diǎn)關(guān)注連續(xù)、多次出現(xiàn)的發(fā)票開(kāi)具單位,并對(duì)采購(gòu)的商品、開(kāi)具日期、報(bào)銷(xiāo)經(jīng)辦人進(jìn)行關(guān)聯(lián),分析商品采購(gòu)情況的合理性,篩選存在邏輯錯(cuò)誤或商品數(shù)量遠(yuǎn)超經(jīng)營(yíng)單位日常運(yùn)營(yíng)實(shí)際需求的情況。如某支公司2018年9-12月連續(xù)8次在某科技公司購(gòu)入大量復(fù)印紙、硒鼓等辦公用品,與該支公司機(jī)構(gòu)和人員規(guī)模不匹配,采購(gòu)商品數(shù)量遠(yuǎn)超出實(shí)際需求。在鎖定相關(guān)信息后,審計(jì)人員可結(jié)合現(xiàn)場(chǎng)訪談進(jìn)一步核實(shí)資金實(shí)際用途。
2.對(duì)同類(lèi)物品采購(gòu)價(jià)格的核查。運(yùn)用OCR工具,對(duì)發(fā)票票面信息“貨物名稱(chēng)”和“單價(jià)”進(jìn)行識(shí)別,輸出文本后對(duì)同類(lèi)物品采購(gòu)價(jià)格進(jìn)行核實(shí),篩選相同貨物名稱(chēng)但價(jià)格相差較大的費(fèi)用報(bào)銷(xiāo)。如某支公司2018年10月26日?qǐng)?bào)銷(xiāo)一批辦公耗材,其中三星3710硒鼓單價(jià)為241元;2018年12月10日再次報(bào)銷(xiāo)一批辦公耗材,其中三星3710硒鼓單價(jià)為413元。兩次采購(gòu)供應(yīng)商為同一供應(yīng)商,但采購(gòu)價(jià)格存在較大差異,可結(jié)合現(xiàn)場(chǎng)審計(jì)作進(jìn)一步核實(shí)。
3.對(duì)舍近求遠(yuǎn)采購(gòu)的核查。通過(guò)OCR技術(shù)提取增值稅發(fā)票的開(kāi)具方、商品名稱(chēng)、開(kāi)具日期等信息,重點(diǎn)關(guān)注跨區(qū)域采購(gòu)非特定商品的報(bào)銷(xiāo)事項(xiàng),篩選出舍近求遠(yuǎn)的采購(gòu),進(jìn)一步排除采購(gòu)事項(xiàng)和費(fèi)用列支是否存在不真實(shí)的問(wèn)題。如中部省份某支公司2018年11月報(bào)銷(xiāo)宣傳品費(fèi)用45,600元,發(fā)票開(kāi)具方為深圳市某設(shè)計(jì)開(kāi)發(fā)有限公司,商品名稱(chēng)為金屬制品、杯壺套裝;同一經(jīng)辦人在2018年12月再次報(bào)銷(xiāo)購(gòu)宣傳品費(fèi)用51,355元,發(fā)票開(kāi)具方為深圳某禮品有限公司,商品名稱(chēng)為汽車(chē)香膏座等。后續(xù)結(jié)合現(xiàn)場(chǎng)審計(jì),了解基層經(jīng)營(yíng)單位舍近求遠(yuǎn)采購(gòu)的原因,進(jìn)一步核實(shí)費(fèi)用列支的真實(shí)性。
(三)對(duì)連號(hào)票據(jù)的核查
在實(shí)務(wù)操作中,部分基層公司為規(guī)避審核和管控,往往存在開(kāi)具連號(hào)發(fā)票、在不同時(shí)點(diǎn)分開(kāi)報(bào)銷(xiāo)的情況。審計(jì)人員通過(guò)OCR技術(shù),提取重點(diǎn)監(jiān)控科目項(xiàng)下的增值稅發(fā)票影像,能夠?qū)崿F(xiàn)對(duì)發(fā)票號(hào)的識(shí)別,快速定位使用連號(hào)發(fā)票在不同時(shí)間進(jìn)行報(bào)銷(xiāo)的違規(guī)行為。如某支公司于2018年4月10日、2018年5月7日分別報(bào)銷(xiāo)招待費(fèi)996元、997元,發(fā)票號(hào)分別為64025316、64025318,開(kāi)票日期均為2018年3月28日,發(fā)票開(kāi)具方均為“某餐飲股份有限公司”。
(四)對(duì)稅局代開(kāi)發(fā)票的核查
在日常經(jīng)營(yíng)中,部分費(fèi)用發(fā)票存在稅局代開(kāi)的情況,但所涉及的費(fèi)用一般金額較小、事項(xiàng)較瑣碎,如勞務(wù)費(fèi)、清潔費(fèi)等,而且需要稅局代開(kāi)的銷(xiāo)售單位一般為規(guī)模較小、管理不規(guī)范的個(gè)體工商企業(yè)。此類(lèi)費(fèi)用發(fā)票的存在是合理的,但如果某經(jīng)營(yíng)單位存在大量此類(lèi)發(fā)票,則屬于異常情況。運(yùn)用OCR技術(shù),把發(fā)票開(kāi)具方包含“稅務(wù)”的費(fèi)用進(jìn)行匯總統(tǒng)計(jì),篩選代開(kāi)發(fā)票占比較高的經(jīng)營(yíng)單位,以及報(bào)銷(xiāo)金額較大的費(fèi)用進(jìn)行核查。如某支公司2016年存在一定數(shù)量當(dāng)?shù)囟惥执_(kāi)發(fā)票的費(fèi)用報(bào)銷(xiāo),通過(guò)OCR技術(shù)識(shí)別發(fā)票票面信息后抽查發(fā)現(xiàn)存在不合理的情況。如2016年12月報(bào)銷(xiāo)其他費(fèi)用4200元,發(fā)票為某稅局代開(kāi),銷(xiāo)售商品為洗漱包,經(jīng)進(jìn)一步核實(shí),發(fā)現(xiàn)實(shí)際商品銷(xiāo)售單位為某科技有限公司。
三、現(xiàn)階段應(yīng)用OCR技術(shù)存在的困難
(一)影像資料篩選分類(lèi)準(zhǔn)確率問(wèn)題
由于保險(xiǎn)公司影像系統(tǒng)中包含的資料類(lèi)目繁多,以費(fèi)用報(bào)銷(xiāo)系統(tǒng)為例,包含增值稅發(fā)票、貨物明細(xì)清單、實(shí)物圖例、入庫(kù)簽收單、銷(xiāo)售方工商登記信息、自然人身份證件等多種影像資料。在實(shí)踐過(guò)程中,首先需要使用深度神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)技術(shù)對(duì)影像照片進(jìn)行清分,篩選并定位其中的發(fā)票照片。從現(xiàn)階段機(jī)器學(xué)習(xí)的效果看,由于訓(xùn)練照片樣本數(shù)量、多樣性和訓(xùn)練次數(shù)不足,目前深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練實(shí)際識(shí)別準(zhǔn)確率約90%,距離99%的理論值尚有差距,存在照片篩選錯(cuò)誤或遺漏的問(wèn)題。
(二)票據(jù)信息識(shí)別精準(zhǔn)度問(wèn)題
目前,影像資料主要依靠經(jīng)辦人通過(guò)使用公司配備的高拍儀進(jìn)行采集,在實(shí)際操作中存在高拍儀對(duì)焦不準(zhǔn)確、拍攝環(huán)境光線(xiàn)不足、拍攝角度不正確等造成影像模糊、傾斜、暗光等情況;拍照上傳的圖片存在噪聲、模糊、扭曲、形變、復(fù)雜背景干擾等問(wèn)題;在原始票據(jù)開(kāi)具打印環(huán)節(jié),存在如文字溢出票據(jù)表格單元、錯(cuò)行、錯(cuò)位、印章覆蓋文字信息等問(wèn)題,造成文字識(shí)別干擾,極大影響了識(shí)別準(zhǔn)確率。
(三)影像資料獲取和存儲(chǔ)安全問(wèn)題
現(xiàn)階段獲取分支機(jī)構(gòu)的影像資料,需要通過(guò)安全文件傳送協(xié)議從影像系統(tǒng)下載。在照片下載的過(guò)程中,不可避免地對(duì)影像系統(tǒng)生產(chǎn)環(huán)境的帶寬造成一定的占用,需要在非繁忙時(shí)間進(jìn)行下載。此外,由于網(wǎng)絡(luò)帶寬限制,影像照片的下載速度慢,耗時(shí)較長(zhǎng)。影像資料下載后,若缺少專(zhuān)用的存儲(chǔ)設(shè)備,將存在數(shù)據(jù)安全風(fēng)險(xiǎn)。
(四)資源投入和人才隊(duì)伍建設(shè)問(wèn)題
應(yīng)用OCR技術(shù)對(duì)圖片進(jìn)行處理操作,將大量非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為便于進(jìn)行審計(jì)分析的高質(zhì)量結(jié)構(gòu)化數(shù)據(jù),需要匹配具有較高計(jì)算能力的硬件,如多核CPU、高端顯卡、大容量存儲(chǔ)硬盤(pán)等設(shè)備。一旦缺少相應(yīng)的資源投入,存儲(chǔ)影像照片的數(shù)量有限,不能做到長(zhǎng)期數(shù)據(jù)積累,客觀上造成數(shù)據(jù)利用不充分,資源投入不足,將成為OCR技術(shù)在審計(jì)應(yīng)用場(chǎng)景大規(guī)模落地的掣肘。同時(shí),由于現(xiàn)有內(nèi)審隊(duì)伍的IT人員接觸新技術(shù)、新工具的時(shí)間不長(zhǎng),關(guān)鍵技術(shù)的應(yīng)用能力尚顯不足,在改進(jìn)算法提升影像資料篩選的準(zhǔn)確率以及改善識(shí)別準(zhǔn)確率方面,仍需要加大科研投入。因此,進(jìn)一步加強(qiáng)審計(jì)信息化人才隊(duì)伍建設(shè),加快審計(jì)條線(xiàn)IT人員的技術(shù)轉(zhuǎn)型,將是推進(jìn)審計(jì)技術(shù)創(chuàng)新發(fā)展的關(guān)鍵所在。
隨著OCR技術(shù)在內(nèi)部審計(jì)工作中的探索實(shí)踐,筆者相信,新技術(shù)的應(yīng)用將為內(nèi)審人員進(jìn)一步樹(shù)立數(shù)據(jù)思維、拓寬審計(jì)思路、提升審計(jì)水平帶來(lái)更廣闊的視角。
主要參考文獻(xiàn)
張鳳元,皮雨鑫,劉美佳.將人工智能應(yīng)用于審計(jì)的研究[J].對(duì)外經(jīng)貿(mào), 2016(12)