陳朝焰 韓冬梅 吳馨一
【摘要】本文針對(duì)資本市場(chǎng)中普遍存在的上市公司財(cái)務(wù)欺詐問(wèn)題, 在財(cái)報(bào)數(shù)據(jù)中融入財(cái)經(jīng)新聞文本特征, 并提取時(shí)序信息, 為上市公司財(cái)務(wù)欺詐預(yù)警提供新途徑。以結(jié)構(gòu)化的財(cái)報(bào)數(shù)據(jù)和非結(jié)構(gòu)化的新聞文本數(shù)據(jù)為對(duì)象, 在結(jié)構(gòu)化數(shù)據(jù)特征中融入新聞文本的主題特征、 觀點(diǎn)特征、 情緒特征和欺詐特征, 然后提取時(shí)序信息, 并基于樹(shù)集成的方法實(shí)現(xiàn)上市公司財(cái)務(wù)欺詐預(yù)警。本文融合預(yù)警欺詐行為的方法在CSMAR財(cái)報(bào)數(shù)據(jù)集和爬取的新浪財(cái)經(jīng)數(shù)據(jù)集上達(dá)到了86.1%的準(zhǔn)確率和86.5%的召回率, 融入新聞特征和時(shí)序信息后比單純地采用財(cái)報(bào)數(shù)據(jù)特征的準(zhǔn)確率提高了8%。新聞文本特征可以作為財(cái)報(bào)數(shù)據(jù)的有效補(bǔ)充, 且在財(cái)報(bào)數(shù)據(jù)和新聞文本數(shù)據(jù)中引入時(shí)序信息有利于提高上市公司財(cái)務(wù)欺詐的預(yù)警性能。
【關(guān)鍵詞】上市公司;財(cái)務(wù)欺詐;新聞文本;時(shí)序信息;欺詐預(yù)警
【中圖分類號(hào)】F275? ? ? 【文獻(xiàn)標(biāo)識(shí)碼】A? ? ? 【文章編號(hào)】1004-0994(2023)12-0030-10
一、 引言
上市公司財(cái)務(wù)欺詐事件時(shí)有發(fā)生。不僅在我國(guó), 在世界范圍內(nèi)上市公司財(cái)務(wù)欺詐都是一個(gè)焦點(diǎn)問(wèn)題。2020年, 瑞幸咖啡發(fā)布公告承認(rèn)其2019年第二至第四季度存在偽造交易行為的財(cái)務(wù)造假行為, 涉及總金額約為22億元。安然公司曾被曝財(cái)務(wù)造假, 虛增利潤(rùn)5.52億美元, 使得股東和股民損失740億美元。安然公司的造假丑聞還殃及了花旗銀行、 安達(dá)信等, 同時(shí)引出了世通的財(cái)務(wù)欺詐案件, 這又導(dǎo)致三萬(wàn)人失業(yè), 使投資者損失1800億美元。除了巨大的財(cái)務(wù)損失, 股民信心也受到重大打擊, 一時(shí)間股票市場(chǎng)持續(xù)低迷。因此, 公司財(cái)務(wù)欺詐行為對(duì)資本市場(chǎng)的整體發(fā)展和投資者的信心都會(huì)造成損害。
鑒于財(cái)務(wù)欺詐事件的頻發(fā)及其給社會(huì)帶來(lái)的危害, 如何準(zhǔn)確及時(shí)地識(shí)別出具有財(cái)務(wù)造假行為的上市公司, 在第一時(shí)間減輕財(cái)務(wù)造假帶來(lái)的損失, 是對(duì)資本市場(chǎng)各個(gè)方面都非常有意義的研究問(wèn)題。為此, 國(guó)內(nèi)外學(xué)者對(duì)財(cái)務(wù)欺詐預(yù)警方法進(jìn)行了廣泛研究(王昱和楊珊珊,2021;宋宇和李鴻禧,2020;Bao等,2020;吳慶賀等,2020;Craja等,2020;Hajek和Henriques,2017)?,F(xiàn)有研究中, 從結(jié)構(gòu)化的“企業(yè)—年度”數(shù)據(jù)中提取財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)是主流做法(王昱和楊珊珊,2021;宋宇和李鴻禧,2020;Bao等,2020;吳慶賀等,2020)。楊子暉等(2022)指出, 采用傳統(tǒng)的機(jī)器學(xué)習(xí)模型(如隨機(jī)森林模型和Logit回歸模型等), 能夠?qū)ξ覈?guó)大多數(shù)財(cái)務(wù)危機(jī)事件進(jìn)行有效預(yù)警。隨著自然語(yǔ)言處理技術(shù)的進(jìn)步, 非結(jié)構(gòu)化的文本數(shù)據(jù)可作為對(duì)結(jié)構(gòu)化數(shù)據(jù)的有益補(bǔ)充(Craja等,2020;Hajek和Henriques,2017)。然而, 結(jié)構(gòu)化數(shù)據(jù)和文本數(shù)據(jù)中的時(shí)序信息沒(méi)有得到充分挖掘。鑒于此, 本文將時(shí)序信息的提取引入結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化的文本數(shù)據(jù)中, 以期能夠更好地捕捉公司財(cái)務(wù)欺詐的連續(xù)變化信息, 從而獲得更好的上市公司財(cái)務(wù)欺詐預(yù)警性能。
從數(shù)據(jù)的獲取途徑來(lái)看, 結(jié)構(gòu)化年報(bào)數(shù)據(jù)通常來(lái)源于國(guó)泰安(CSMAR)或銳思(RESSET)等公開(kāi)的金融數(shù)據(jù)庫(kù), 其發(fā)布時(shí)間均有一定的滯后性; 此外, 上市公司財(cái)務(wù)欺詐的界定依賴于監(jiān)管機(jī)構(gòu)發(fā)布公告的時(shí)效性, 且通常也存在一定的滯后性。鑒于此, 本文通過(guò)對(duì)爬取的財(cái)經(jīng)新聞文本進(jìn)行信息挖掘, 以期彌補(bǔ)結(jié)構(gòu)化數(shù)據(jù)時(shí)效性不足的問(wèn)題。
本文的主要貢獻(xiàn)如下: 首先, 在結(jié)構(gòu)化的財(cái)報(bào)指標(biāo)數(shù)據(jù)基礎(chǔ)上, 增加了新聞文本作為新的數(shù)據(jù)源, 并提取時(shí)序信息, 建立了一個(gè)更加完善的上市公司財(cái)務(wù)欺詐預(yù)警框架; 其次, 在提取結(jié)構(gòu)化財(cái)報(bào)數(shù)據(jù)特征和新聞文本特征的時(shí)序信息時(shí), 考慮了上市公司經(jīng)營(yíng)活動(dòng)的連續(xù)性。與已有研究相比, 本文構(gòu)建的時(shí)序性衍生指標(biāo)考慮了隱藏在財(cái)報(bào)數(shù)據(jù)和新聞文本數(shù)據(jù)中的時(shí)序信息, 各指標(biāo)的時(shí)序性變動(dòng)可能預(yù)示著企業(yè)的財(cái)務(wù)危機(jī)或企業(yè)財(cái)務(wù)規(guī)律上的異常, 更有利于進(jìn)行財(cái)務(wù)欺詐預(yù)警。此外, 由于新聞報(bào)道的客觀性和即時(shí)性, 新聞文本特征的引入, 更能及時(shí)對(duì)有欺詐可能的上市公司發(fā)出預(yù)警。
二、 相關(guān)研究綜述
國(guó)內(nèi)外關(guān)于上市公司財(cái)務(wù)欺詐預(yù)警方面的研究, 依據(jù)所處理數(shù)據(jù)形式的不同, 可分為結(jié)構(gòu)化方法和非結(jié)構(gòu)化方法。在結(jié)構(gòu)化方法的研究方面, 孟銀鳳和王珮瑤(2023)通過(guò)構(gòu)造Zipf因子, 生成新的特征向量補(bǔ)充到數(shù)據(jù)集中以挖掘更多有效信息, 并基于隨機(jī)森林構(gòu)造財(cái)務(wù)預(yù)警模型。高燕等(2023)以A股制造企業(yè)為樣本, 構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型預(yù)警財(cái)務(wù)風(fēng)險(xiǎn), 并以一汽夏利(現(xiàn)中國(guó)鐵物)為例進(jìn)行分析, 提出防范風(fēng)險(xiǎn)的建議。楊貴軍等(2021)通過(guò)引入包含代表財(cái)務(wù)數(shù)據(jù)質(zhì)量的修正Benford因子, 改善財(cái)務(wù)危機(jī)預(yù)警Logistic模型的預(yù)測(cè)效果。Kotsiantis等(2006)以164家欺詐和非欺詐公司的財(cái)務(wù)數(shù)據(jù)作為樣本, 分別建立了貝葉斯網(wǎng)絡(luò)、 k-均值、 決策樹(shù)、 人工神經(jīng)網(wǎng)絡(luò)、 支持向量機(jī)及邏輯回歸模型, 使用堆疊變量方法發(fā)現(xiàn)混合分類器的效果好于單一模型的分類效果。Cecchini等(2010a)利用40個(gè)財(cái)務(wù)指標(biāo), 開(kāi)發(fā)了面向金融領(lǐng)域的支持向量機(jī)核函數(shù)進(jìn)行公司的管理層舞弊預(yù)警。Dechow等(2011)分析了欺詐公司的財(cái)務(wù)特性, 并通過(guò)對(duì)財(cái)務(wù)變量的邏輯回歸處理預(yù)測(cè)會(huì)計(jì)報(bào)表中的欺詐行為。Bao等(2020)運(yùn)用集成學(xué)習(xí)模型并引入一種新的性能評(píng)估指標(biāo), 得出的欺詐預(yù)測(cè)結(jié)果優(yōu)于Dechow等(2011)的邏輯回歸模型和Cecchini等(2010a)的支持向量機(jī)模型。酈金梁等(2020)構(gòu)建了遞延所得稅異動(dòng)指標(biāo), 并利用XGBoost算法進(jìn)行上市公司財(cái)務(wù)欺詐預(yù)警。
在非結(jié)構(gòu)化方法的研究方面, 隨著自然語(yǔ)言處理技術(shù)的進(jìn)步, 非結(jié)構(gòu)化的文本挖掘技術(shù)成為主流。Cecchini等(2010b)從10-Ks的管理層討論和分析(MD&A)部分創(chuàng)建字典來(lái)區(qū)分欺詐和非欺詐公司, 將文本數(shù)據(jù)作為財(cái)務(wù)數(shù)據(jù)的有效補(bǔ)充, 其分析結(jié)果表明MD&A文本補(bǔ)充了定量財(cái)務(wù)信息。Purda和Skillicorn(2015)對(duì)MD&A部分的所有單詞進(jìn)行有效性排序, 挑選前200個(gè)最具預(yù)測(cè)性的單詞, 采用詞袋模型對(duì)樣本分類, 取得了較好效果。Hajek和Henriques(2017)從MD&A文本中提取語(yǔ)言學(xué)指標(biāo), 作為對(duì)結(jié)構(gòu)化指標(biāo)的有效補(bǔ)充, 共同實(shí)現(xiàn)財(cái)務(wù)報(bào)表舞弊的智能預(yù)警, 并比較了多種機(jī)器學(xué)習(xí)方法的性能。Dong等(2018)提出了一個(gè)基于SFL理論的文本分析框架, 結(jié)合社交媒體文本的概念功能和人際功能對(duì)上市公司欺詐的早期跡象進(jìn)行預(yù)警。徐凱等(2022)以MD&A文本信息為基礎(chǔ), 構(gòu)建Logistic財(cái)務(wù)危機(jī)預(yù)警模型, 研究了MD&A文本積極信息與文本信息可讀性對(duì)企業(yè)財(cái)務(wù)危機(jī)的預(yù)警作用。肖毅等(2020)基于TEI@I方法論的理論框架, 集成文本挖掘和深度學(xué)習(xí)構(gòu)建企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型。Brown等(2020)運(yùn)用隱性狄利克雷分布(LDA)主題模型, 將MD&A部分的主題特征與財(cái)務(wù)數(shù)據(jù)和文本特征相結(jié)合, 證明了提取披露的主題有助于捕捉財(cái)務(wù)不端行為。胡楠等(2021)基于高層梯隊(duì)理論和社會(huì)心理學(xué)中的時(shí)間導(dǎo)向理論, 得出管理者內(nèi)在的短視主義特質(zhì)與企業(yè)資本支出和研發(fā)支出的關(guān)系, 采用文本分析和機(jī)器學(xué)習(xí)技術(shù)構(gòu)建出管理者短視主義指標(biāo)并據(jù)此完成實(shí)證檢驗(yàn)。
從上述研究中可以發(fā)現(xiàn), 不少研究會(huì)將非結(jié)構(gòu)化文本數(shù)據(jù)作為對(duì)結(jié)構(gòu)化數(shù)據(jù)的有效補(bǔ)充, 這有利于提升上市公司財(cái)務(wù)欺詐預(yù)警性能。然而, 文本數(shù)據(jù)的觀點(diǎn)、 主題和情緒等特征在欺詐年度附近的變化信息并未得到充分考慮。鑒于此, 本文在結(jié)構(gòu)化的財(cái)報(bào)數(shù)據(jù)中融入財(cái)經(jīng)新聞文本特征的同時(shí), 還在模型中加入提取的時(shí)序信息, 為上市公司財(cái)務(wù)欺詐預(yù)警研究提供新思路。
三、 特征工程與時(shí)序信息提取
為更好地將結(jié)構(gòu)化的財(cái)報(bào)數(shù)據(jù)和非結(jié)構(gòu)化的新聞文本數(shù)據(jù)有效融合, 需進(jìn)行特征工程處理, 將其變換至相同的特征維度。且在進(jìn)行特征變換前, 對(duì)財(cái)報(bào)數(shù)據(jù)和新聞文本數(shù)據(jù)的特征均需進(jìn)行時(shí)序信息提取。
(一)結(jié)構(gòu)化財(cái)報(bào)數(shù)據(jù)的特征提取
本文所采取的結(jié)構(gòu)化財(cái)報(bào)數(shù)據(jù)特征工程與時(shí)序信息提取過(guò)程如圖1所示。從圖1可以看出, 結(jié)構(gòu)化財(cái)報(bào)數(shù)據(jù)可由財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)表征, 但在將其輸入財(cái)務(wù)欺詐智能預(yù)警模型前, 需對(duì)其進(jìn)行數(shù)據(jù)預(yù)處理和特征變換。另外, 為了降低數(shù)據(jù)的維度, 還需進(jìn)行指標(biāo)篩選。
1. 財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)挑選。依據(jù)國(guó)內(nèi)外相關(guān)研究文獻(xiàn)(Chen和Han,2023;葉欽華等,2022), 并結(jié)合上市公司財(cái)報(bào)指標(biāo)數(shù)據(jù)的獲取情況, 本文共篩選了與結(jié)構(gòu)化財(cái)報(bào)數(shù)據(jù)相關(guān)的42個(gè)指標(biāo), 其中償債能力(x1 ~ x3)、 比率結(jié)構(gòu)(x4 ~ x6)、 經(jīng)營(yíng)能力(x7 ~ x10)、 盈利能力(x11 ~ x13)、 現(xiàn)金流分析(x14 ~ x16)、 風(fēng)險(xiǎn)水平(x17,x18)、 發(fā)展能力(x19 ~ x24)、 每股指標(biāo)(x25 ~ x27)和流動(dòng)資產(chǎn)結(jié)構(gòu)(x28 ~ x32)等共計(jì)9類32個(gè)為財(cái)務(wù)指標(biāo), 股本結(jié)構(gòu)(x33 ~ x35)、 治理綜合信息(x36 ~ x39)、 三會(huì)基本信息(x40 ~ x42)等共計(jì)3類10個(gè)為非財(cái)務(wù)指標(biāo)。本文選取的與結(jié)構(gòu)化財(cái)報(bào)數(shù)據(jù)相關(guān)的指標(biāo)及其定義如表1所示。
對(duì)于上述挑選好的指標(biāo), 結(jié)合上市公司的欺詐年度情況, 可建立結(jié)構(gòu)化的“企業(yè)—年度”數(shù)據(jù)集。
2. 結(jié)構(gòu)化數(shù)據(jù)時(shí)序信息提取。為了更好地捕捉上市公司的財(cái)務(wù)欺詐行為, 需考慮能夠反映各指標(biāo)數(shù)據(jù)連續(xù)變化和累積效果的時(shí)序信息。對(duì)于表1中的財(cái)務(wù)指標(biāo)數(shù)據(jù)x1 ~ x32, 其為連續(xù)型數(shù)值, 因此采用比值形式構(gòu)造財(cái)務(wù)指標(biāo)的衍生變量:
(三)基準(zhǔn)算法與樹(shù)集成方法
可供選擇的機(jī)器學(xué)習(xí)模型fML(?)種類較多, 決策樹(shù)由于具有很強(qiáng)的可解釋性和簡(jiǎn)易性而受到廣泛關(guān)注。常見(jiàn)的決策樹(shù)模型類型有ID3、 C4.5、 C5.0和CART, 其中CART的應(yīng)用最廣泛。由于容易出現(xiàn)過(guò)擬合, 常規(guī)的決策樹(shù)模型很少被采用, 通常僅作為基準(zhǔn)模型用于性能對(duì)比, 因此本文選擇CART(Loh,2011)作為基準(zhǔn)模型。實(shí)際被廣泛應(yīng)用的是樹(shù)集成方法, 主要有兩大類: RF和提升樹(shù)。RF(Breiman,2001)可看做Bagging集成的變體, 由成百上千棵決策樹(shù)構(gòu)成基分類器, 這些基決策樹(shù)的屬性來(lái)自于對(duì)全體屬性集合的隨機(jī)抽樣; 提升樹(shù)同樣集成了成百上千棵決策樹(shù), 但其通過(guò)不斷添加越來(lái)越多的樹(shù), 來(lái)迭代地減小分類誤差, 直到滿足停止條件為止。為構(gòu)造提升樹(shù), 可在AdaBoost(Freund和Schapire,1997)中使用決策樹(shù)作為基本分類器, 這樣可將多個(gè)弱分類器提升為強(qiáng)分類器。當(dāng)使用梯度提升算法來(lái)解決優(yōu)化問(wèn)題時(shí), 提升算法成為梯度提升算法, 最典型的是XGBoost(Chen和Guestrin,2016)。XGBoost是對(duì)經(jīng)典梯度提升算法的改進(jìn), 在求解損失函數(shù)的最優(yōu)解時(shí)使用了牛頓法, 并將損失函數(shù)泰勒展開(kāi)到二階, 另外損失函數(shù)中加入了正則化項(xiàng)。
綜上所述, 本文共挑選三種典型的樹(shù)集成方法: RF、 AdaBoost和XGBoost, 并使用經(jīng)典的CART決策樹(shù)作為基準(zhǔn)分類器, 對(duì)樹(shù)集成方法的性能進(jìn)行對(duì)比。
五、 實(shí)驗(yàn)驗(yàn)證與分析
(一)數(shù)據(jù)集描述
本實(shí)驗(yàn)所使用的結(jié)構(gòu)化數(shù)據(jù)來(lái)源于中國(guó)經(jīng)濟(jì)金融研究數(shù)據(jù)庫(kù)(CSMAR), 新聞文本數(shù)據(jù)則爬取自新浪財(cái)經(jīng)網(wǎng)站。本研究共收集2016 ~ 2018年620家上市公司(310家欺詐樣本和310家非欺詐樣本)的結(jié)構(gòu)化數(shù)據(jù)和76675篇新聞文本數(shù)據(jù)。首先根據(jù)標(biāo)題中的關(guān)鍵詞篩選掉與多家公司相關(guān)聯(lián)的新聞文本, 然后對(duì)余下的新聞進(jìn)行人工篩選, 共得到15043篇。其中: 欺詐公司在欺詐前一年共有3431條, 在欺詐當(dāng)年有4985條; 非欺詐公司在欺詐前一年有3000條, 在欺詐當(dāng)年共有3627條。各家上市公司的分類標(biāo)簽則依據(jù)CSMAR數(shù)據(jù)庫(kù)中的上市公司財(cái)務(wù)違規(guī)信息表進(jìn)行標(biāo)注。本研究采用企業(yè)—年度數(shù)據(jù)標(biāo)注形式, 即將欺詐當(dāng)年的每一家公司作為一個(gè)樣本, 而對(duì)于連續(xù)多年均存在財(cái)務(wù)欺詐的公司, 則選取該公司首次被披露的年份。
(二)實(shí)驗(yàn)設(shè)置與過(guò)程
本實(shí)驗(yàn)所采用的上市公司財(cái)務(wù)欺詐預(yù)警過(guò)程如圖6所示。在結(jié)構(gòu)化數(shù)據(jù)中融合新聞文本特征, 并提取相應(yīng)的時(shí)序信息。進(jìn)行特征集成時(shí), 分別對(duì)財(cái)報(bào)數(shù)據(jù)和財(cái)經(jīng)新聞文本數(shù)據(jù)及其時(shí)序性衍生特征進(jìn)行組合。然后分別利用CART、 RF、 AdaBoost和XGBoost等構(gòu)建上市公司財(cái)務(wù)欺詐預(yù)警模型, 實(shí)現(xiàn)對(duì)上市公司財(cái)務(wù)欺詐的智能預(yù)警。
實(shí)驗(yàn)中, 采用五折交叉驗(yàn)證的方式對(duì)所選模型進(jìn)行性能評(píng)價(jià)。首先, 將來(lái)自620家上市公司的樣本劃分成5等份; 其次, 采用五折交叉驗(yàn)證, 將其中4份作為訓(xùn)練集, 余下1份作為測(cè)試集; 最后, 將五折交叉驗(yàn)證結(jié)果的均值作為模型評(píng)價(jià)指標(biāo)的結(jié)果。本文選取準(zhǔn)確率Acc=(TN+TP)/(TN+FP+FN+TP)和召回率Recall=TP/(FN+TP)作為模型性能的評(píng)價(jià)指標(biāo), 其中, TN、 FP、 FN和TP分別為真負(fù)率、 假正率、 假負(fù)率和真正率, 其可通過(guò)混淆矩陣獲得。
六、 結(jié)論
本文將傳統(tǒng)的結(jié)構(gòu)化財(cái)報(bào)數(shù)據(jù)、 非結(jié)構(gòu)化財(cái)經(jīng)新聞文本數(shù)據(jù)及其時(shí)序信息進(jìn)行融合, 并基于樹(shù)集成方法對(duì)上市公司財(cái)務(wù)欺詐進(jìn)行了預(yù)測(cè)分析。主要結(jié)論為: 第一, 新聞文本特征可作為上市公司財(cái)報(bào)數(shù)據(jù)的有效補(bǔ)充。新聞的時(shí)效性強(qiáng)于財(cái)報(bào), 從新聞文本中提取的主題、 觀點(diǎn)、 情緒和欺詐等特征是對(duì)財(cái)務(wù)指標(biāo)與非財(cái)務(wù)指標(biāo)的有益補(bǔ)充。第二, 在財(cái)報(bào)數(shù)據(jù)和新聞文本數(shù)據(jù)中引入時(shí)序信息均有助于提高上市公司財(cái)務(wù)欺詐預(yù)警性能。時(shí)序信息的利用, 有助于后續(xù)的機(jī)器學(xué)習(xí)模型捕捉指標(biāo)或特征的連續(xù)變化, 更有利于識(shí)別上市公司的財(cái)務(wù)欺詐。第三, AdaBoost算法的欺詐預(yù)警性能優(yōu)于RF算法和XGBoost算法。在利用樹(shù)集成方法實(shí)現(xiàn)上市公司財(cái)務(wù)欺詐預(yù)警時(shí), 將RF、 AdaBoost和XGBoost算法的性能與基準(zhǔn)的CART算法的性能進(jìn)行了對(duì)比, 發(fā)現(xiàn)AdaBoost算法的性能最佳, 達(dá)到了86.1%的準(zhǔn)確率和86.5%的召回率。
上市公司財(cái)務(wù)欺詐預(yù)警模型的輸出信息, 可為監(jiān)管部門、 上市公司管理者和投資者等使用方提供智能決策依據(jù)。研究的實(shí)踐意義為: 首先, 對(duì)于證監(jiān)會(huì)、 深圳證券交易所、 上海證券交易所等監(jiān)管部門而言, 如果某公司存在欺詐預(yù)警, 則監(jiān)管部門需對(duì)該公司加以重點(diǎn)關(guān)注和考察, 并加大監(jiān)管力度, 以減小財(cái)務(wù)欺詐給資本市場(chǎng)帶來(lái)的沖擊, 進(jìn)而促進(jìn)證券市場(chǎng)健康運(yùn)行。其次, 對(duì)于被考察企業(yè)而言, 如果其收到財(cái)務(wù)欺詐預(yù)警信號(hào), 則表明其財(cái)務(wù)指標(biāo)已經(jīng)開(kāi)始惡化。為避免因財(cái)務(wù)指標(biāo)惡化而導(dǎo)致企業(yè)財(cái)務(wù)危機(jī), 進(jìn)而帶來(lái)不必要的損失, 其管理者應(yīng)及早排查企業(yè)的財(cái)務(wù)風(fēng)險(xiǎn)狀況, 以及時(shí)發(fā)現(xiàn)偏離正常范圍的各項(xiàng)指標(biāo), 并采取措施進(jìn)行補(bǔ)救, 及時(shí)規(guī)避財(cái)務(wù)風(fēng)險(xiǎn)。最后, 投資者在識(shí)別上市公司的投資風(fēng)險(xiǎn)時(shí), 如果發(fā)現(xiàn)某公司存在欺詐預(yù)警, 則投資者需詳細(xì)評(píng)估該公司的財(cái)務(wù)風(fēng)險(xiǎn)狀況, 并對(duì)其投資決策做相應(yīng)的調(diào)整, 以規(guī)避盲目投資帶來(lái)的經(jīng)濟(jì)損失。
【 主 要 參 考 文 獻(xiàn) 】
胡楠,薛付婧,王昊楠.管理者短視主義影響企業(yè)長(zhǎng)期投資嗎? —— 基于文本分析和機(jī)器學(xué)習(xí)[ J].管理世界,2021(5):139 ~ 156+11+19 ~ 21.
酈金梁,吳謠,雷曜,黃燕婷.有效預(yù)警上市公司違規(guī)的遞延所得稅異動(dòng)指標(biāo)和人工智能模型[ J].金融研究,2020(8):149 ~ 168.
孟銀鳳,王珮瑤.基于Zipf定律的隨機(jī)森林財(cái)務(wù)預(yù)警模型[ J/OL].山西大學(xué)學(xué)報(bào)(自然科學(xué)版):1 ~ 9[2023-05-09].https://doi.org/10.13451/j.sxu.ns.
2022088.
宋宇,李鴻禧.基于決策樹(shù)集成的債券發(fā)行企業(yè)財(cái)務(wù)預(yù)警研究[ J].財(cái)會(huì)月刊,2020(6):45 ~ 50.
王昱,楊珊珊.考慮多維效率的上市公司財(cái)務(wù)困境預(yù)警研究[ J].中國(guó)管理科學(xué),2021(2):32 ~ 41.
吳慶賀,唐曉華,林宇.創(chuàng)業(yè)板上市公司財(cái)務(wù)危機(jī)的識(shí)別與預(yù)警[ J].財(cái)會(huì)月刊,2020(2):56 ~ 64.
肖毅,熊凱倫,張希.基于TEI@I方法論的企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型研究[ J].管理評(píng)論,2020(7):226 ~ 235.
徐琳宏,林鴻飛,潘宇等.情感詞匯本體的構(gòu)造[ J].情報(bào)學(xué)報(bào),2008(2):180 ~ 185.
楊貴軍,孫玲莉,周亞夢(mèng)等.基于修正Benford律的財(cái)務(wù)危機(jī)預(yù)警Logistic模型及其應(yīng)用[ J].?dāng)?shù)理統(tǒng)計(jì)與管理,2021(4):585 ~ 595.
楊子暉,張平淼,林師涵.系統(tǒng)性風(fēng)險(xiǎn)與企業(yè)財(cái)務(wù)危機(jī)預(yù)警 —— 基于前沿機(jī)器學(xué)習(xí)的新視角[ J].金融研究,2022(8):152 ~ 170.
葉欽華,黃世忠,葉凡等.嚴(yán)監(jiān)管下的財(cái)務(wù)舞弊分析 —— 基于2020~2021年的舞弊樣本[ J].財(cái)會(huì)月刊,2022(13):10 ~ 15.
Bao Y., Ke B., Li B., et al.. Detecting accounting fraud in publicly traded US firms using a machine learning approach[ J].Journal of Accounting Research, 2020(1):199 ~ 235.
Blei D. M., Ng A. Y., Jordan M. I.. Latent dirichlet allocation[ J].Journal of Machine Learning Research,2003(1):993 ~ 1022.
Breiman L.. Random forests[ J].Machine Learning,2001(1):5 ~ 32.
Brown N. C., Crowley R. M., Elliott W. B.. What are you saying? Using topic to detect financial misreporting[ J].Journal of Accounting Research,2020(1):237 ~ 291.
Cecchini M., Aytug H., Koehler G. J., et al.. Detecting management fraud in public companies[ J].Management Science,2010a(7):1146 ~ 1160.
Cecchini M., Aytug H., Koehler G. J., et al.. Making words work: Using financial text as a predictor of financial events[ J].Decision Support Systems, 2010b(1):164 ~ 175.
Chen Z. Y., Han D.. Detecting corporate financial fraud via two-stage mapping in joint temporal and financial feature domain[ J].Expert Systems with Applications,2023(217):119559.
Craja P., Kim A., Lessmann S.. Deep learning for detecting financial statement fraud[ J].Decision Support Systems,2020(139):113421.
Dechow P. M., Ge W., Larson C. R., et al.. Predicting material accounting misstatements[ J].Contemporary Accounting Research,2011(1):17 ~ 82.
Dong W., Liao S., Zhang Z.. Leveraging financial social media data for corporate fraud detection[ J].Journal of Management Information Systems,2018(2):461 ~ 487.
Freund Y., Schapire R. E.. A decision-theoretic generalization of on-line learning and an application to boosting[ J].Journal of Computer and System Sciences,1997(1):119 ~ 139.
Hajek P., Henriques R.. Mining corporate annual reports for intelligent detection of financial statement fraud-A comparative study of machine learning methods[ J].Knowledge-Based Systems,2017(128):139 ~ 152.
Jiang F., Lee J., Martin X., et al.. Manager sentiment and stock returns[ J].Journal of Financial Economics,2019(1):126 ~ 149.
Kotsiantis S., Koumanakos E., Tzelepis D., et al.. Forecasting fraudulent financial statements using data mining[ J].International Journal of Computational Intelligence,2006(2):104 ~ 110.
Loh W. Y.. Classification and regression trees[ J].Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery,2011(1):14 ~ 23.
Purda L., Skillicorn D.. Accounting variables, deception, and a bag of words: Assessing the tools of fraud detection[ J].Contemporary Accounting Research,2015(3):1193 ~ 1223.