趙納暉 張?zhí)煅?/p>
【摘 要】 財務(wù)報告舞弊是企業(yè)舞弊的手段之一,不僅會導致會計信息失真,而且會危害經(jīng)濟的健康發(fā)展,因此,如何克服傳統(tǒng)的人工檢測和基于數(shù)值指標的淺層模型識別等方法的弊端,找到一種更為高效的智能化識別方法具有重要的現(xiàn)實意義。選取2015—2019年間存在舞弊行為的A股上市公司定期報告,以其中的管理層討論與分析章節(jié)(Management Discussion and Analysis,MD&A)為樣本,同時確定了規(guī)模相同的控制樣本,通過實證研究對比了深度學習模型和以往常用的淺層模型在檢測財務(wù)報告舞弊時的性能。結(jié)果表明,在規(guī)模對等的舞弊和非舞弊類財務(wù)報告組成的文本數(shù)據(jù)集上,深度學習模型表現(xiàn)出明顯優(yōu)于基準模型的分類性能。研究結(jié)果為利用MD&A文本數(shù)據(jù)和深度學習方法識別企業(yè)財務(wù)報告舞弊的有效性提供了直接的證據(jù)。
【關(guān)鍵詞】 財務(wù)報告舞弊識別; 管理層討論與分析; 文本數(shù)據(jù); 深度學習; 卷積神經(jīng)網(wǎng)絡(luò)
【中圖分類號】 F239.1? 【文獻標識碼】 A? 【文章編號】 1004-5937(2022)08-0140-10
一、引言
由于財務(wù)舞弊可能引發(fā)嚴重的經(jīng)濟和社會問題,有效識別舞弊成為會計和財務(wù)領(lǐng)域的研究熱點。財務(wù)報告舞弊因其發(fā)生頻率相對較低,且通常由行業(yè)內(nèi)具有豐富知識和從業(yè)經(jīng)驗的人實施,企業(yè)很容易掩蓋這類舞弊行為。
2021年《關(guān)于依法從嚴打擊證券違法活動的意見》提出,要依法嚴厲查處證券違法犯罪案件,加強誠信約束懲戒,強化震懾效應(yīng)。上市公司財務(wù)報告舞弊現(xiàn)象,嚴重削弱了財務(wù)報告本身的風險預警作用。相較于耗時且昂貴的人工檢測方式,開展效率更高的自動化和智能化檢測已成為財務(wù)報告舞弊識別研究的關(guān)鍵問題。早期關(guān)于財務(wù)報告舞弊智能化識別的研究大多利用各類會計和財務(wù)指標預測企業(yè)的舞弊行為,而現(xiàn)實的金融市場中充斥著各種復雜的模式,僅靠一些數(shù)值指標構(gòu)建的識別模型,其預測性能是相對局限的。因此,之后的研究開始逐步重視文本信息對于識別財務(wù)舞弊的作用,相當數(shù)量的研究也已證實利用定期報告中的管理層討論與分析章節(jié)(Management Discussion and Analysis,MD&A)能夠發(fā)掘部分財務(wù)報告舞弊現(xiàn)象[1]。
在已有研究中,利用機器學習模型對文本數(shù)據(jù)進行分類預測的方法較為流行。但傳統(tǒng)的機器學習模型,也稱“淺層模型”,在處理文本信息時需要借助先驗知識人工提取樣本特征,這種方式對數(shù)據(jù)含義的表達能力較弱。為了充分利用文本數(shù)據(jù)的價值,對能夠更高效地提取和利用文本信息算法的需求愈加強烈。深度學習模型作為機器學習的另一種范式,能夠自動實現(xiàn)特征的多次提取和變換,以實現(xiàn)數(shù)據(jù)更高層次的抽象表示,從而彌補了淺層模型的不足[2]。
基于此,本文采用了一種字符級卷積神經(jīng)網(wǎng)絡(luò)[3]的深度學習算法,并結(jié)合上市公司定期報告中的MD&A文本,構(gòu)建了識別財務(wù)報告舞弊的智能化模型。研究收集了2015—2019年的上市公司舞弊樣本以及同樣規(guī)模的控制樣本,利用詞嵌入層將MD&A中的文本轉(zhuǎn)換為特征矩陣,以識別具有舞弊性質(zhì)的財務(wù)報告。同時,為了比較不同模型的預測性能,研究還選取了部分統(tǒng)計學模型和淺層模型作為基準模型。結(jié)果表明,深度學習模型利用MD&A文本識別上市公司財務(wù)報告舞弊的性能明顯優(yōu)于基準模型。本文的貢獻在于,不同于以往基于淺層模型的研究,本文引入了人工智能領(lǐng)域興起的深度學習技術(shù),以構(gòu)建檢測舞弊的智能化模型;此外,研究還證明了財務(wù)報告這種可得性和可靠性更強的文本數(shù)據(jù)同樣具備識別企業(yè)舞弊行為的價值,可以為舞弊識別及相關(guān)研究提供新的數(shù)據(jù)支持。
二、文獻綜述
早期針對財務(wù)報告舞弊識別的研究集中在對舞弊影響因素和信號的識別上,并利用統(tǒng)計學模型發(fā)現(xiàn)違規(guī)披露行為[4],但這種方法取得的成果相當有限,可能和在選取與舞弊相關(guān)的財務(wù)指標時存在一定的主觀性有關(guān)。之后,數(shù)據(jù)挖掘和機器學習等智能化模型的應(yīng)用成為舞弊識別研究的一個新趨勢。與統(tǒng)計學方法相比,智能化識別模型對數(shù)據(jù)的假設(shè)更少,且支持非線性決策,這些特征提高了模型的可塑性和分類性能,也使得此類模型很快得到了廣泛的應(yīng)用[5]。
起初的智能化模型普遍采用數(shù)值指標,其樣本屬性有限,且選取過程存在較強的主觀性,嚴重限制了模型的預測性能。因此,研究人員開始更多地關(guān)注文本這類具有復雜性和隱藏性的非結(jié)構(gòu)化數(shù)據(jù),通過提取文本的特征以判斷它們是否能夠作為識別財務(wù)報告舞弊的信息來源[6]。由于財務(wù)報告的MD&A部分由企業(yè)的管理團隊使用通用且正式的商業(yè)語言編輯而成,涵蓋了對企業(yè)的財務(wù)狀況、經(jīng)營成果和前瞻性聲明等內(nèi)容的討論,也被大多數(shù)研究用作識別財務(wù)報告舞弊的文本來源[7]。本章節(jié)之后的內(nèi)容主要討論基于數(shù)值和文本數(shù)據(jù)以及各類智能化模型識別財務(wù)報告舞弊的研究。
(一)基于數(shù)值數(shù)據(jù)的智能化財務(wù)報告舞弊識別
目前基于數(shù)值數(shù)據(jù)的智能化財務(wù)報告舞弊識別模型主要基于淺層模型和數(shù)據(jù)挖掘模型構(gòu)建,包括神經(jīng)網(wǎng)絡(luò)、決策樹、隨機森林、進化算法、支持向量機和混合方法等。
神經(jīng)網(wǎng)絡(luò)主要涉及BP神經(jīng)網(wǎng)絡(luò)、概率神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)處理組合算法、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和生長分層自組織映射網(wǎng)絡(luò)。決策樹包括單個決策樹和決策樹的集合,如隨機森林。盡管決策樹和隨機森林模型可以處理舞弊檢測問題中的非線性特征,但訓練過程中容易出現(xiàn)過擬合的問題,即識別模型的泛化性能普遍較差。進化算法(如遺傳規(guī)劃和螢火蟲算法)也被用于輔助決策樹模型的設(shè)計和訓練。支持向量機能夠通過線性分類的方式解決財務(wù)報告舞弊識別這一復雜的非線性問題,而不需要增加計算的復雜度。然而,在處理噪聲較多的數(shù)據(jù)集時,支持向量機可能表現(xiàn)出性能不佳的問題?;旌戏椒ㄊ抢枚喾N模型的優(yōu)勢組合而成的新模型,在針對特定的問題域時能夠表現(xiàn)出優(yōu)于單個模型的分類性能。表1按照時間順序總結(jié)了基于數(shù)值數(shù)據(jù)實現(xiàn)智能化財務(wù)報告舞弊識別的研究。
(二)基于文本數(shù)據(jù)的財務(wù)報告舞弊智能化識別
目前研究所采用的文本主要包括企業(yè)披露的定期報告、新聞、金融社交媒體平臺的用戶生成內(nèi)容(User-Generated Content,UGC)以及各類利益相關(guān)者提出的關(guān)于企業(yè)經(jīng)營情況以及公開披露信息的分析和討論等。其中,新聞、社交媒體和各類利益相關(guān)者產(chǎn)生的數(shù)據(jù)包含較多噪音,而企業(yè)披露的定期報告則具有更易于處理的結(jié)構(gòu)和更可靠的來源,且其中包含很多具有誤導性陳述的語言變量可以作為識別企業(yè)舞弊的依據(jù),因而被很多研究用作識別財務(wù)報告舞弊的直接證據(jù)[16]。
在利用文本識別舞弊性的財務(wù)報告時,需要對文本數(shù)據(jù)進行預處理。由于淺層模型不進行或只進行一次特征選擇的局限,必須借助有效的文本表示方法單獨提取文本特征,以保證下游模型的識別性能。目前研究中應(yīng)用的文本表示方法大致可以分為兩類:第一類是對某些關(guān)鍵詞、關(guān)鍵詞元組或詞匯和句子特征等的統(tǒng)計描述。例如文本的情感分析,利用語言模型構(gòu)建的文本分析框架和基于詞匯多樣性和句法復雜度等語言特征實現(xiàn)對文本數(shù)據(jù)的量化處理等。第二類是基于某類算法實現(xiàn)特定的文本格式。主要的算法類別有:(1)詞袋模型,即一種預先定義的單詞列表,能夠表示財務(wù)報告的負面性、不確定性和訴訟性的單詞列表通常與企業(yè)的舞弊行為之間存在關(guān)聯(lián);(2)主題模型,例如LDA(Latent Dirichlet Allocation)模型,在企業(yè)舞弊的研究中常被用來提取財務(wù)報告的語義主題;(3)TF-IDF(Term Frequency-Inverse Document Frequency)算法,該算法能夠?qū)崿F(xiàn)詞語級的文本特征提取,并基于詞語權(quán)重形成的詞向量集合表示文本集合。表2按照時間順序總結(jié)了基于文本數(shù)據(jù)實現(xiàn)智能化財務(wù)報告舞弊識別的研究。
(三)文獻評述
在對已有文獻的綜述中,有三點內(nèi)容值得關(guān)注。首先,大多數(shù)研究運用的智能化識別方法對數(shù)據(jù)的假設(shè)更小,且允許非線性決策邊界,這些特性提高了模型的靈活性和分類性能;其次,單純使用數(shù)值指標構(gòu)建智能化預測模型的局限性愈發(fā)突出,更多的學者開始關(guān)注文本這類來源廣泛且數(shù)據(jù)量龐大,同時包含更多樣本屬性的非結(jié)構(gòu)化數(shù)據(jù);最后,對于財務(wù)報告舞弊的檢測,淺層模型和數(shù)據(jù)挖掘算法只能利用數(shù)據(jù)集中存在的顯式屬性,卻很難發(fā)掘同樣存在的其他形式的隱藏屬性。而文本數(shù)據(jù)恰恰包含較多隱藏的屬性和模式,需要進一步探求更為有效的智能化識別方法。
對比淺層模型,深度學習模型的結(jié)構(gòu)更為復雜,能更好地發(fā)掘數(shù)據(jù)集中存在的特征。而目前,基于文本數(shù)據(jù)識別財務(wù)報告舞弊的研究則是由淺層模型和數(shù)據(jù)挖掘模型占據(jù)主導地位,鮮有基于深度學習模型的探索。因此,本文的研究基于文本數(shù)據(jù)和深度學習算法構(gòu)建識別財務(wù)報告舞弊的智能化模型,試圖探究人工智能技術(shù)是否能更有效地挖掘和利用MD&A文本中預示企業(yè)舞弊行為的潛在信號,以識別財務(wù)報告舞弊,進而檢驗深度學習方法在財務(wù)報告舞弊識別研究中的應(yīng)用價值。
三、數(shù)據(jù)選取和樣本來源
我國上市公司各級監(jiān)管機構(gòu)的公開披露是判定上市公司是否存在舞弊行為最客觀和有效的依據(jù)之一。一方面,研究依據(jù)中國證監(jiān)會、上海證券交易所、深圳證券交易所和地方證監(jiān)局對上市公司的處罰報告和收錄這些披露文件的CSMAR數(shù)據(jù)庫,并按照CSMAR數(shù)據(jù)庫對處罰公告的分類,選取其中涉及虛構(gòu)利潤、虛列資產(chǎn)、虛假記載、重大遺漏、披露不實和一般會計處理不當六類定期報告舞弊行為的公告確定為舞弊樣本。另一方面,由于2015年之前的部分定期報告將MD&A合并在董事會報告一節(jié)中未單獨披露,研究將2015年作為選取舞弊樣本的時間起點。據(jù)此,本文選取了2015—2019年存在上述舞弊行為的上市公司定期報告(包含具有MD&A章節(jié)的年度報告和半年度報告)共計454份。同時,為了保證控制樣本與舞弊樣本具有相同的規(guī)模,研究還依據(jù)中國社會科學院金融研究所等在2015—2018年發(fā)布的《中國上市公司質(zhì)量評價報告》和報告中的上市公司價值管理能力排名,以及恒大研究院發(fā)布的《中國上市公司質(zhì)量報告:2019》中的合規(guī)質(zhì)量,選取每年排名前45的上市公司作為控制樣本,得到半年度報告和年度報告共計450份。
圖1總結(jié)了研究的分析過程,包括文本數(shù)據(jù)的選取、文本預處理、樣本特征提取、模型構(gòu)建和結(jié)果評估5個部分。
四、模型構(gòu)建
文本分類是自然語言處理(Natural Language Processing,NLP)領(lǐng)域的一個經(jīng)典問題,具體指按照事先定義好的主題類別來劃分數(shù)據(jù)集中每個文本的類別。研究參考Zhang et al.[3]提出的字符級卷積神經(jīng)網(wǎng)絡(luò),利用上市公司財務(wù)報告中的MD&A文本,構(gòu)建了一種通過文本分類方式識別舞弊性財務(wù)報告的智能化模型,并選取了部分統(tǒng)計學模型和淺層模型作為基準模型,以對比不同模型的分類性能。
對于輸入深度學習模型和基準模型的MD&A文本,研究采用了不同的文本預處理流程,尤其是根據(jù)淺層模型和深度學習模型各自的特點選取了不同的文本表示方法,以盡可能提升下游模型的分類性能。后面將詳細闡述深度學習模型和基準模型各自的文本預處理方法,以及深度學習模型的具體架構(gòu)和實現(xiàn)。對于基準模型,本文只進行簡要的介紹。
(一)深度學習模型
深度學習模型的設(shè)計過程主要分為兩個階段:一是文本的預處理;二是模型的構(gòu)建。
1.文本預處理
深度學習模型的文本預處理主要包括兩個步驟:一是數(shù)據(jù)集類別的劃分;二是文本字符的初步量化。
大多數(shù)基于智能化模型的財務(wù)預測研究采用了二分法的方式,即將數(shù)據(jù)集劃分為訓練集和測試集,其中訓練集通常占80%,測試集占20%。為了盡可能避免訓練階段產(chǎn)生的模型出現(xiàn)過擬合的問題,研究增加了驗證集的劃分。同時,為了保持數(shù)據(jù)劃分的一致性,避免因數(shù)據(jù)劃分過程中存在額外偏差而影響最終的結(jié)果,參照機器學習研究對小樣本集(樣本總數(shù)通常小于10 000)的劃分慣例,本文按照 的比例將MD&A文本集劃分訓練集、驗證集和測試集,且每類數(shù)據(jù)集都保持舞弊類和非舞弊類的樣本數(shù)量對等。
樣本在劃分為不同類別的數(shù)據(jù)集后還需要經(jīng)過進一步的預處理:首先,去除了MD&A文本中的數(shù)字、字母、標點符號和一些特殊符號。這種對文本信息的過濾也是NLP中常用的方法,有助于降低下游分類模型的維數(shù)。其次,字符的編碼過程需要為輸入模型的文本構(gòu)建一個固定規(guī)模為m的詞匯表,并采用整數(shù)對表中的每個字符進行量化,每個整數(shù)表示一個字符的ID。詞匯表通常需要覆蓋文本所包含的95%的詞匯,考慮到研究所采用的文本的字符數(shù)量,本文將m的大小設(shè)置為3 000,詞匯表會優(yōu)先量化高頻字符,在達到固定規(guī)模3 000后其余的字符將被作為低頻字符過濾掉。最后,利用詞匯表將文本表示為字符的ID列表。此時,每篇MD&A文本序列的長度需要固定為l。這是因為用于訓練卷積神經(jīng)網(wǎng)絡(luò)的張量(即表示為多維數(shù)組的數(shù)據(jù),由詞匯表量化的文本序列再經(jīng)過詞嵌入層的處理得到)必須由相同維數(shù)的矩陣組成,而每篇文本的長度不同,因此需要截斷較長的文本,同時向較短的文本添加零,這種操作也被稱為填充。研究將文本的固定長度l設(shè)置為5 000。此外,不在詞匯表中的字符也將被量化為零。
2.基于詞嵌入的文本表示
文本表示是NLP中的一個核心任務(wù),現(xiàn)有的表示方法主要有離散形式的符號表示和分布式表示兩種形式。詞嵌入屬于詞語的一種分布式表示形式,能夠?qū)⒃~語映射到一個數(shù)十或數(shù)百維度的實值向量中,并盡可能保留原始數(shù)據(jù)的屬性。這種方法能更好地衡量詞語之間的距離(即語義的相似性,距離上更接近的詞語便被賦予類似的表示),以便在顯著降低文本和下游模型維度的同時更好地理解文本的底層語義。
研究以截取自MD&A部分的語句為例,詳細說明基于詞嵌入的文本表示方法,具體過程可以分為4個步驟,結(jié)果如圖2所示。第一,根據(jù)研究構(gòu)建的詞匯表,“強化公司內(nèi)部管理”被轉(zhuǎn)換為8個整數(shù)ID構(gòu)成的句向量,n1至n8分別表示字符在詞匯表中對應(yīng)的整數(shù)。第二,整數(shù)ID構(gòu)成的句向量被進一步轉(zhuǎn)換為獨熱編碼表示的8×m的矩陣。獨熱編碼使用稀疏的高維向量表示每個字符(維度等于詞匯表的規(guī)模m),該向量除第ni列(i=1,2,…,8)為1外,其余列均為0。第三,詞嵌入層需要訓練一個m×d的系數(shù)矩陣,d為語句最終嵌入的向量空間的維度。系數(shù)矩陣的參數(shù)aij(i=1,2,…,m;j=1,2,…,d)由隨機初始化生成,通過神經(jīng)網(wǎng)絡(luò)模型和反向傳播算法進行訓練與更新。第四,獨熱編碼表示的語句矩陣輸入詞嵌入層后,經(jīng)過系數(shù)矩陣的變換(矩陣相乘),最終被映射到一個8×d的向量空間中,表示為一個8×d的文本特征矩陣。通過詞嵌入的處理,8個字符都被表示成維度為d的向量,每個維度θij(i=1,2,…,8;j=1,2,…,d)則表示由-1到1之間的具體數(shù)值構(gòu)成的特征值。
研究在卷積神經(jīng)網(wǎng)絡(luò)的前端構(gòu)建了詞嵌入層,每個由整數(shù)ID表示的字符構(gòu)成且長度為l的文本向量在輸入詞嵌入層后被映射到一個l×d的向量空間中。向量空間的維度d屬于模型的參數(shù),經(jīng)過多次訓練和優(yōu)化,本文將這一參數(shù)設(shè)置為64。詞嵌入層通過自訓練的方式實現(xiàn),更利于針對特定數(shù)據(jù)和分類任務(wù)。
3.字符級的卷積神經(jīng)網(wǎng)絡(luò)
本文采用了一種基于字符層面建模的卷積神經(jīng)網(wǎng)絡(luò)來提取文本的高層抽象概念,具體架構(gòu)如圖3所示,包括詞嵌入層、卷積層、池化層、全連接層以及輸出層。卷積神經(jīng)網(wǎng)絡(luò)的核心思想是訓練多個卷積核通過卷積操作來檢測樣本的局部特征。在本文的研究中,這些局部特征可能是識別財務(wù)報告舞弊的關(guān)鍵。
經(jīng)過詞嵌入層處理得到的文本特征矩陣T∈Rt×d首先被輸入卷積層(l為文本的固定長度,d為向量空間的維度)。卷積核C∈Rh×d的行數(shù)h(即長度)為5,列數(shù)d與文本特征矩陣的維度同為64。每個卷積核都會從上到下依次與5行64列的文本矩陣塊做卷積操作,卷積核每次下移的幅度為步長1。每次卷積操作得到的特征可以表示為:
其中,Ti:i+h-1表示由第i個到第i+h-1個字符向量組成的文本矩陣塊,b為偏置項,f(x)為ReLU激活函數(shù)。每個卷積核通過卷積計算共能得到l-h+1個特征,由此組成的特征圖可以表示為:
研究共構(gòu)建了256個卷積核,因此能夠得到256張?zhí)卣鲌D。
卷積層提取的特征圖依然具有較高的維度,需要經(jīng)過池化層的處理,以進一步提取特征和過濾文本信息。研究采用全局最大池化的方法,以每張?zhí)卣鲌D為單位,通過選取其中最大的特征值并舍棄其他特征值的方式再一次實現(xiàn)局部特征的提取。
池化層從每張?zhí)卣鲌D中提取的局部特征會輸入全連接層進行非線性組合。研究對全連接層的神經(jīng)元進行了隨機失活(Dropout)處理,即在每輪迭代的過程中隨機使一部分神經(jīng)元失活(比例設(shè)置為0.5),從而減少特征的冗余,防止模型出現(xiàn)過擬合問題。此外,研究還采用ReLU(Rectified Linear Unit)激活函數(shù)對全連接層神經(jīng)元輸出的結(jié)果進行非線性變換。
最終,由softmax分類器構(gòu)成的輸出層會根據(jù)全連接層輸入的結(jié)果生成每個樣本的分類標簽(舞弊和非舞弊),從而完成文本分類的過程。
4.模型的具體實現(xiàn)
研究基于TensorFlow的架構(gòu)構(gòu)建深度學習模型,模型的權(quán)重使用高斯分布進行初始化。由于CNN是一種典型的前饋神經(jīng)網(wǎng)絡(luò),需要利用反向傳播算法完成模型的訓練,損失函數(shù)則選擇了交叉熵損失函數(shù)。由于完整的訓練集規(guī)模較大,耗用的計算資源較多,不利于模型的訓練。因此,研究采用批尺寸為64,且經(jīng)過Adam算法優(yōu)化的隨機梯度下降方法(Stochastic Gradient Descent,SGD)進行參數(shù)調(diào)優(yōu),學習率設(shè)置為0.0001(過低會導致參數(shù)更新速度緩慢,過高則可能跳過局部最小值點)。SGD也是對標準BP算法的一種優(yōu)化。由于目標函數(shù)可以分解在不同的子集上進行計算求和,通過將訓練集劃分為多個較小的子樣本集,可以使SGD算法一次只在一個批次上更新參數(shù)(包括詞嵌入層和卷積層的權(quán)重矩陣)。樣本的訓練采用10輪迭代的方式,并在模型性能無法改善的情況下使用提前停止方法終止訓練過程。
(二)其他基準模型
研究選取了一些統(tǒng)計學模型和淺層機器學習模型,并以此為基礎(chǔ)對深度學習模型進行了基準測試。統(tǒng)計學模型包括邏輯回歸和樸素貝葉斯模型,淺層模型則包含支持向量機、隨機森林和兩類梯度提升決策樹的變體模型(XGBoost和LightGBM)。基準模型基于scikit-learn機器學習庫提供的方法構(gòu)建。
1.文本預處理
研究基于同樣的MD&A文本集訓練基準模型,并利用五折交叉驗證方法實現(xiàn)模型的訓練和測試。數(shù)據(jù)集在進行文本表征和特征提取前依然需要先移除文本中的數(shù)字、字母、標點符號和一些特殊符號,保留純文本內(nèi)容,再完成去除停用詞和分詞處理。研究參照哈爾濱工業(yè)大學開發(fā)的中文停用詞表去除文本的停用詞,并選用jieba中文分詞工具實現(xiàn)分詞處理。
文本的表示形式和特征提取過程基于卡方檢驗和TF-IDF算法??ǚ綑z驗的核心思想是通過觀測實際值與理論值的偏差衡量假設(shè)是否正確?;谶@一原理,在對MD&A文本進行特征選擇時,本文將“特征詞與財務(wù)報告舞弊不相關(guān)”作為原假設(shè),以提取文本的特征詞匯。具體的計算方法如下:
其中,N表示文本總數(shù),A和B分別表示特征詞在舞弊類和非舞弊類文本中出現(xiàn)的頻率,C和D則分別表示特征詞在舞弊類和非舞弊類文本中不出現(xiàn)的頻率。根據(jù)上述的計算方法,研究提取了文本集中的前1 000個詞作為特征詞。
考慮到這些特征詞在文本分類中的重要性,利用詞頻-逆文本頻率(Term Frequency-Inverse Document Frequency,TF-IDF)算法來賦予特征詞不同的權(quán)重。基于TF-IDF算法,特征詞的權(quán)重可以表示為:
其中,j表示文本,k和l表示文本類別,tfijk表示特征詞i在k類j文本的詞頻,N表示文本總數(shù),n表示包含特征詞i的k類文本總數(shù)。由此,由卡方檢驗提取的特征詞表示的MD&A文本被進一步轉(zhuǎn)換為TF-IDF權(quán)重表示的文本向量。
2.統(tǒng)計學模型和淺層模型
邏輯回歸是智能化舞弊識別研究中最常用的模型,它利用一系列輸入向量、一個相關(guān)的響應(yīng)變量以及自然對數(shù)來計算回歸結(jié)果在特定類別內(nèi)的概率。對于舞弊識別這種二元分類問題,響應(yīng)變量可以表示為:
計算MD&A文本所屬類別的公式為:
除了邏輯回歸,本文還采用了另一種統(tǒng)計學中常用的數(shù)據(jù)分類模型,即樸素貝葉斯(Naive Bayesian,NB)模型。NB算法基于貝葉斯原理,假定MD&A文本的特征向量為,文本屬于某一類別ci的概率為條件概率P(ci),模型的訓練過程就是利用訓練集統(tǒng)計先驗概率P(ci)和特征dj(N為樣本包含的特征數(shù))在類別ci(i={0,1})中出現(xiàn)的概率。具體的計算方法可以表示為:
研究選取的淺層模型包括支持向量機、隨機森林和決策樹,這些模型都是財務(wù)預測的研究中最常用的智能化模型。支持向量機通過將樣本空間映射到一個高維的特征空間中,使得很多復雜的非線性問題能夠通過線性分類的方式解決。本文選擇了RBF函數(shù)作為支持向量機模型的核函數(shù);隨機森林是一種包含多個決策樹的分類模型,會隨機選擇特征集中的n個特征,每棵樹都對樣本集采用Bootstrap抽樣的方法確定自身的訓練集;此外,研究還構(gòu)建了兩種梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)的變體模型:XGBoost和LightGBM。GBDT是一種集成學習模型,能基于決策樹實現(xiàn)分類和回歸。模型的訓練過程由多輪迭代完成,每輪迭代產(chǎn)生一個弱學習器,并基于上一輪迭代的殘差進行訓練,通過不斷減小殘差來提高分類精度,直至達到最優(yōu)。
五、實證結(jié)果
(一)模型評估
構(gòu)建一個具有較好的樣本外預測能力的財務(wù)報告舞弊識別模型對本文的研究至關(guān)重要。對于深度學習模型和基準模型,研究都采用精確率(Precision)、召回率(Recall)和F1分數(shù)(F1-score)三類評價指標衡量模型在測試集上的分類性能。
精確率表示模型預測出的舞弊類樣本中被正確預測的比例,召回率則表示所有的舞弊類樣本中被正確預測的比例。精確率和召回率可以分別表示為:
其中,TP(即真陽性(True Positive,TP))表示被模型預測為舞弊樣本且本身也為舞弊樣本的MD&A文本;FP(即假陽性(False Positive,F(xiàn)P))表示被模型預測為舞弊樣本而本身為非舞弊樣本的MD&A文本;FN(即假陰性(False Negative)),表示被模型預測為非舞弊樣本而本身為舞弊樣本的MD&A文本。F1分數(shù)是統(tǒng)計學中常用來衡量模型二分類性能的一種指標,可以表示模型的精確率和召回率的一種調(diào)和平均值,具體表示為:
這三類指標的值均介于0和1之間,越接近1表示模型的分類性能越好。然而,以上三類指標的計算過程均假定舞弊類文本為正樣本,而非舞弊類文本為負樣本。為了綜合考察模型在不同類別上的分類性能,研究還引入了宏平均(Macro-Average)的方法,即對舞弊類和非舞弊類樣本分別作為正樣本時得到的評價指標值求算術(shù)平均值。
(二)實證結(jié)果及分析
表3和表4分別總結(jié)了利用上市公司定期報告中的MD&A文本訓練的深度學習模型和基準模型在樣本外數(shù)據(jù)集上的預測結(jié)果(評價指標采用宏平均后的數(shù)值),以及深度學習模型在不同類別上的預測性能。深度學習模型的架構(gòu)基于詞嵌入模型和一種字符級的卷積神經(jīng)網(wǎng)絡(luò),基準模型則選取了兩類統(tǒng)計學模型(邏輯回歸和樸素貝葉斯模型)和三類淺層模型(支持向量機、隨機森林和梯度提升決策樹)。根據(jù)表3和表4列示的各項評價指標,研究的實證結(jié)果可以總結(jié)為以下四點:第一,研究所實現(xiàn)的模型,無論是深度學習模型還是其他基準模型,評價分類性能的指標值均大于0.7,表明模型能夠有效利用MD&A中的文本信息進行財務(wù)報告舞弊識別;第二,深度學習的各項分類性能均顯著高于其他基準模型,表明相較于傳統(tǒng)智能化財務(wù)報告舞弊檢測研究所采用的模型,本文構(gòu)建的深度學習架構(gòu)能更好地識別具有舞弊性質(zhì)的財務(wù)報告;第三,邏輯回歸、樸素貝葉斯和支持向量機模型的各項指標均在0.8左右,顯著高于其他決策樹類的模型,表明基于小樣本(樣本數(shù)小于1 000)的文本數(shù)據(jù)集進行財務(wù)報告舞弊識別時,邏輯回歸、樸素貝葉斯和支持向量機模型具有更好的預測性能;第四,深度學習模型在兩類MD&A文本集上的評價指標值均大于0.82,表明模型在不同類別的數(shù)據(jù)集上均表現(xiàn)出較好的舞弊識別能力。
六、結(jié)論與啟示
財務(wù)報告作為公開披露的信息,直接反映了企業(yè)的運營狀況,因此也成為了企業(yè)實施舞弊行為的重要媒介。有效識別財務(wù)報告舞弊成為規(guī)范金融市場運行秩序的重要手段之一。利用深度學習技術(shù)在NLP領(lǐng)域取得的各項突破,本文構(gòu)建了用于識別上市公司財務(wù)報告舞弊的字符級卷積神經(jīng)網(wǎng)絡(luò)模型,該模型采用財務(wù)報告中的MD&A文本作為分析樣本。結(jié)果表明,在淺層模型具有明顯優(yōu)勢的小樣本數(shù)據(jù)集上,不需要經(jīng)過復雜的文本特征定向提取,字符級卷積神經(jīng)網(wǎng)絡(luò)模型依然能夠表現(xiàn)出更優(yōu)越的分類性能,這一結(jié)果也為利用深度學習技術(shù)改進現(xiàn)有的財務(wù)報告舞弊識別方法提供了直接的證據(jù)。此外,研究不僅證明了深度學習模型在識別財務(wù)報告舞弊上的優(yōu)勢,而且所構(gòu)建的各類模型在MD&A文本上均表現(xiàn)出較好的預測性能,這體現(xiàn)了企業(yè)披露的公開文本所具有的效用和信息價值。同時,財務(wù)報告的文本披露作為一種可靠性強且易于獲得的數(shù)據(jù)來源,可以為相關(guān)研究提供很好的數(shù)據(jù)支持。
本文涉及到的很多內(nèi)容值得進一步探究。首先,深度學習模型和其他使用非結(jié)構(gòu)化數(shù)據(jù)的人工智能系統(tǒng)類似,訓練擬合出的卷積神經(jīng)網(wǎng)絡(luò)模型是一個黑箱。深入挖掘和分析模型訓練過程中提取的文本局部特征,有利于揭示表明企業(yè)存在舞弊行為的財務(wù)報告文本的本質(zhì);其次,研究只采用了MD&A文本作為訓練數(shù)據(jù)的唯一來源,而目前依然存在大量的非結(jié)構(gòu)化數(shù)據(jù)源源不斷地注入金融市場,利用更多不同來源的文本數(shù)據(jù)可能有助于提升深度學習模型在企業(yè)舞弊識別中的性能;最后,研究所涉及的詞嵌入方法和字符級的CNN模型只是深度學習技術(shù)的冰山一角。僅就NLP而言,深度學習還存在大量的新興技術(shù)值得深入研究,例如知識圖譜、注意力機制、Transformer等文本表示方法,循環(huán)神經(jīng)網(wǎng)絡(luò)、自編碼器、受限玻爾茲曼機、對抗生成網(wǎng)絡(luò)和強化學習等深度學習的基礎(chǔ)架構(gòu),以及基于這些架構(gòu)及其變體模型組合而成的混合模型等??傊?,本文發(fā)掘了基于文本數(shù)據(jù)的深度學習模型在財務(wù)和會計預測研究中的部分價值,更多的應(yīng)用價值值得后續(xù)的研究進一步探索。
【參考文獻】
[1] DONG W,LIAO S,LIANG L.Financial statement fraud detection using text mining:a systemic functional linguistics theory perspective[C].Proceedings of the Pacific Asia Conference on Information Systems (PACIS),2016.
[2] 胡越,羅東陽,花奎,等.關(guān)于深度學習的綜述與討論 [J].智能系統(tǒng)學報,2019,14(1):1-19.
[3] ZHANG X,ZHAO J,LECUN Y.Character-level convolutional networks for text classification[C].Proceedings of the Advances in Neural Information Processing Systems,2015.
[4] 張莉.基于國家治理的上市公司舞弊審計實證檢驗 [J].財會月刊,2018(6):20.
[5] MAI F,TIAN S,LEE C,et al.Deep learning models for bankruptcy prediction using textual disclosures[J].European Journal of Operational Research,2019,274(2):743-758.
[6] DONG W,LIAO S,ZHANG Z.Leveraging financial social media data for corporate fraud detection [J].Journal of Management Information Systems,2018,35(2):461-487.
[7] GLANCY F H,YADAV S B.A computational model for financial reporting fraud detection[J].Decision Support Systems,2011,50(3):595-601.
[8] 皇甫冬雪.基于Lib-SVM的損益調(diào)整類財務(wù)報告舞弊識別模型研究——來自中國證券市場的證據(jù)[J].會計之友,2011(25):75-79.
[9] RAVISANKAR P,RAVI V,RAO G R,et al.Detection of financial statement fraud and feature selection using data mining techniques[J].Decision Support Systems,2011,50(2):491-500.
[10] PAI P-F,HSU M-F,WANG M-C.A support vector machine-based model for detecting top management fraud[J].Knowledge-Based Systems,2011,24(2):314-321.
[11] HUANG S-Y,TSAIH R-H,YU F.Topological pattern discovery and feature extraction for fraudulent financial reporting[J].Expert Systems with Applications,2014,41(9):4360-4372.
[12] CHEN S,GOO YJ J,SHEN ZD.A hybrid approach of stepwise regression,logistic regression,support vector machine,and decision tree for forecasting fraudulent financial statements[J/OL].The Scientific World Journal,2014.
[13] PRADEEP G,RAVI V,NANDAN K,et al.Fraud detection in financial statements using evolutionary computation based rule miners[C].Proceedings of the International Conference on Swarm,Evolutionary,and Memetic Computing,2014.
[14] KIM Y J,BAIK B,CHO S.Detecting financial misstatements with fraud intention using multi-class cost-sensitive learning [J].Expert Systems with Applications,2016,62:32-43.
[15] 馮炳純.基于數(shù)據(jù)挖掘技術(shù)的財務(wù)舞弊識別模型構(gòu)建[J].財會通訊,2019,805(5):93-97.
[16] XING F Z,CAMBRIA E,WELSCH R E.Natural language based financial forecasting:a survey [J].Artificial Intelligence Review,2018,50(1):49-73.
[17] DYCK A,et al.The corporate governance role of the media[J].The Journal of Finance,2008,63(3):1093-1135.
[18] CECCHINI M,AYTUG H,KOEHLER G J,et al.Making words work:using financial text as a predictor of financial events[J].Decision Support Systems,2010,50(1):164-175.
[19] HUMPHERYS S L,MOFFITT K C,BURNS M B,et al.Identification of fraudulent financial statements using linguistic credibility analysis [J].Decision Support Systems,2011,50(3):585-594.
[20] GOEL S,UZUNER O.Do sentiments matter in fraud detection? Estimating semantic orientation of annual reports [J].Intelligent Systems in Accounting,F(xiàn)inance and Management,2016,23(3):215-239.
[21] MINHAS S,HUSSAIN A.From spin to swindle:identifying falsification in financial text [J].Cognitive computation,2016,8(4):729-745.
[22] HAJEK P,HENRIQUES R.Mining corporate annual reports for intelligent detection of financial statement fraud a comparative study of machine learning methods[J].Knowledge Based Systems,2017,128(6):139-152.