李 清,閆世剛
(吉林大學(xué) 商學(xué)院,吉林 長(zhǎng)春 130012)
其實(shí)識(shí)別會(huì)計(jì)舞弊最簡(jiǎn)單最有效的方法就是仔細(xì)地查賬,但對(duì)于普通投資者或利益相關(guān)者而言,既無查賬的權(quán)力也無查賬的能力,聘請(qǐng)會(huì)計(jì)師審計(jì)也存在合謀作弊的風(fēng)險(xiǎn)或者不符合成本效益原則,因此構(gòu)建Logistic回歸會(huì)計(jì)舞弊識(shí)別模型或者構(gòu)建會(huì)計(jì)舞弊指數(shù)進(jìn)行發(fā)布預(yù)警,對(duì)于防止掉入舞弊公司陷阱、選擇正確的投資策略就有著巨大的作用。同樣是進(jìn)行舞弊識(shí)別,但是兩種方法的原理、構(gòu)建基礎(chǔ)迥異,具有各自的優(yōu)缺點(diǎn),本文就上述問題進(jìn)行了探討。
本文貢獻(xiàn)如下:第一,通過對(duì)Logistic回歸原理的分析,歸納出了Logistic舞弊識(shí)別模型的構(gòu)建基礎(chǔ)、識(shí)別準(zhǔn)確率低的原因以及其他優(yōu)缺點(diǎn)。第二,歸納出了會(huì)計(jì)舞弊指數(shù)的構(gòu)建基礎(chǔ)和優(yōu)缺點(diǎn)。第三,為監(jiān)管機(jī)構(gòu)或咨詢公司開發(fā)舞弊識(shí)別模型或舞弊指數(shù)模型提供了極具價(jià)值的經(jīng)驗(yàn)和方法借鑒,彌補(bǔ)了兩種模型比較研究方法論的缺口,將舞弊識(shí)別這一復(fù)雜問題的研究向前推進(jìn)了一大步。第四,豐富了舞弊識(shí)別研究的文獻(xiàn)。
會(huì)計(jì)舞弊識(shí)別研究主要集中在以下幾方面:(1)舞弊動(dòng)因的三角形理論。該理論認(rèn)為舞弊的動(dòng)因來自于壓力、機(jī)會(huì)和借口[1]15-51。具體到我國資本市場(chǎng),舞弊動(dòng)因主要包括:欺詐上市、財(cái)務(wù)困境、退市壓力、配股、偷稅、虛構(gòu)利潤牟取最大化個(gè)人報(bào)酬等。(2)舞弊識(shí)別指標(biāo)體系的構(gòu)建。途徑主要有問卷調(diào)查[2]323-333[3]54-53、財(cái)務(wù)報(bào)告分析[4]4-9、通過舞弊動(dòng)因理論選擇舞弊動(dòng)因的替代變量作為指標(biāo)體系[5]53-81[6]91-96、抑或是努力窮盡各種特征變量通過數(shù)據(jù)挖掘模型篩選出顯著的財(cái)務(wù)或公司治理指標(biāo)[7]38-46[8]351-356[9]440-451。但尚無公認(rèn)統(tǒng)一有效的指標(biāo)體系。(3)舞弊識(shí)別模型構(gòu)建。主要有Logistic回歸[10]179-191[11]75-80[12]84-90、人工神經(jīng)網(wǎng)絡(luò)[13]169-184、決策樹和貝葉斯信念網(wǎng)絡(luò)[14]995-1003、案例推理[15]84-89等。普遍存在的問題是:建模樣本少,沒有使用大樣本來驗(yàn)證準(zhǔn)確率。(4)舞弊指數(shù)構(gòu)建。李清等[16]36-44使用制造業(yè)樣本數(shù)據(jù)和30個(gè)財(cái)務(wù)指標(biāo)探討了會(huì)計(jì)舞弊指數(shù)的構(gòu)建方法。(5)舞弊防范治理。Treadway Committee[17]34認(rèn)為應(yīng)通過高層管理理念、控制活動(dòng)、監(jiān)督審計(jì)來進(jìn)行舞弊的防范治理。
綜上可見,Logistic舞弊識(shí)別模型與會(huì)計(jì)舞弊指數(shù)比較研究尚屬空白,各自的構(gòu)建基礎(chǔ)、優(yōu)缺點(diǎn)尚有待探討。
Logistic回歸使用Sigmoid函數(shù)f(x)=1/(1+e-x),采用最大似然估計(jì)法進(jìn)行模型參數(shù)估計(jì)[18]6-17。函數(shù)值在0-1之間變化如同舞弊發(fā)生的概率值。
圖1 Sigmoid函數(shù)
設(shè)舞弊公司用1表示、非舞弊公司用0表示,從總體中隨機(jī)抽取n個(gè)樣本公司,觀測(cè)值標(biāo)注為y1,…,yn,即取值為1或0。設(shè)pi=P(yi=1|xi1,xi2,…,xik)是給定k個(gè)自變量xi1,xi2,…,xik的條件下第i個(gè)公司發(fā)生舞弊(yi=1)的條件概率,于是,Logistic模型將有下列形式:
pi=P(yi=1|xi1,xi2,…,xik)
i=1,2,…,n
(1)
等價(jià)于
i=1,2,…,n
(2)
式中α,β1,β2,…,βk是k+1個(gè)待估計(jì)的回歸系數(shù),n為樣本公司數(shù)。
而在同樣條件下即給定k個(gè)自變量xi1,xi2,…,xik的條件下第i個(gè)公司為非舞弊公司(yi=0)的條件概率為P(yi=0|xi1,xi2,…,xik)=1-pi。因此,得到一個(gè)觀測(cè)值的概率為:
(3)
(3)式稱為0—1分布。因?yàn)閚次觀測(cè)相互獨(dú)立,所以聯(lián)合概率即似然函數(shù)為n個(gè)概率的乘積:
(4)
最大似然估計(jì)就是只求出一組系數(shù)α和βj(j=1,2,…,k),而使得n個(gè)樣本其各自的自變量xi1,xi2,…,xik與系數(shù)的乘積和恰好與其觀測(cè)值yi=1或0對(duì)應(yīng)上(如表1所示)同時(shí)成立的概率最大,這個(gè)過程是通過對(duì)似然函數(shù)求偏導(dǎo)數(shù)實(shí)現(xiàn)的,為了簡(jiǎn)化計(jì)算通常是對(duì)似然函數(shù)的對(duì)數(shù)求偏導(dǎo)數(shù),因?yàn)槎呤堑葍r(jià)的,ln[L(α,βj)]是L(α,βj)的單調(diào)函數(shù),使ln[L(α,βj)]取得最大值的α和βj同樣使L(α,βj)取得最大值。ln[L(α,βj)]分別對(duì)α和βj求偏導(dǎo)數(shù)并令它們等于0,得到似然方程為:
(5)
(6)
解這k+1個(gè)聯(lián)立方程,就能求得系數(shù)α和β1,β2,…,βk的值,解方程是通過計(jì)算數(shù)學(xué)專業(yè)研究的數(shù)值計(jì)算方法例如牛頓-拉夫森迭代方法并通過計(jì)算機(jī)迭代實(shí)現(xiàn)的。
最后,通過公式(1)計(jì)算出公司舞弊的概率,確定最佳的概率分割值如0.5,當(dāng)pi>0.5時(shí)判為舞弊公司,pi≤0.5時(shí)判為非舞弊公司。當(dāng)舞弊和非舞弊公司樣本數(shù)為1:1時(shí),通常概率分割值取0.5;如果樣本數(shù)不是1∶1,則分割值可以通過圍繞0.5上下變動(dòng)試算確定,以便使得舞弊和非舞弊識(shí)別總準(zhǔn)確率更高、同時(shí)舞弊識(shí)別準(zhǔn)確率和非舞弊識(shí)別準(zhǔn)確率又不至于差得太多。調(diào)整概率分割值不影響系數(shù)。
表1 自變量與觀測(cè)值對(duì)應(yīng)表
從Logistic模型系數(shù)求解過程可以看出,0和1必須是確定的,即模型構(gòu)建的基礎(chǔ)是:舞弊和非舞弊公司都是確定的,是典型的0和1二分類問題。舞弊公司受到證監(jiān)會(huì)處罰是確定的,但非舞弊公司由于舞弊的隱匿性或者幾年后才被發(fā)現(xiàn)甚至永遠(yuǎn)未被發(fā)現(xiàn)而難以確定,一旦無法嚴(yán)格區(qū)分舞弊與否,則模型構(gòu)建的基礎(chǔ)將不存在。這就是目前已有的Logistic模型存在的最大問題。
(1)對(duì)樣本分布無要求。盡管樣本服從多元正態(tài)分布能夠提高模型穩(wěn)定性和功效。
(2)對(duì)自變量類型無要求。自變量可以是虛擬變量、連續(xù)變量或者是二者乘積的交互變量。
(3)易用性。模型結(jié)構(gòu)簡(jiǎn)單,易使用。
(4)易交叉驗(yàn)證。容易使用留一法、保持方法、K折交叉驗(yàn)證等方法進(jìn)行模型的交叉驗(yàn)證以評(píng)估模型的準(zhǔn)確率。
(5)用途廣。除了舞弊與非舞弊的分類識(shí)別外,還可以進(jìn)行舞弊與自變量的相關(guān)性研究。
(6)成本低。由于統(tǒng)計(jì)軟件的普及應(yīng)用使得建模成本低。
(7)普及性。Logistic回歸模型是構(gòu)建會(huì)計(jì)舞弊識(shí)別使用最多最普及的模型。
(1)非舞弊公司不確定。舞弊和非舞弊公司必須是確定的,而實(shí)際上若非仔細(xì)地查賬則建模時(shí)所選的非舞弊公司未必就沒有舞弊行為。
(2)舞弊識(shí)別指標(biāo)選擇困難。從已有的文獻(xiàn)看,大多是努力窮盡各種可能的舞弊特征指標(biāo),然后通過數(shù)據(jù)挖掘方法篩選出顯著的財(cái)務(wù)或公司治理指標(biāo),用以探測(cè)高估資產(chǎn)和虛增收入、低估負(fù)債和費(fèi)用等形式的舞弊。例如,普遍選取股權(quán)結(jié)構(gòu)、董事會(huì)結(jié)構(gòu)、財(cái)務(wù)困境、負(fù)債率、周轉(zhuǎn)率、增長(zhǎng)率、公司規(guī)模,以及與現(xiàn)金、應(yīng)收賬款、存貨等相關(guān)的其他指標(biāo),首先對(duì)指標(biāo)進(jìn)行均值差異檢驗(yàn),篩選出差異顯著的指標(biāo),然后再使用向前逐步選擇或向后逐步剔除方法,篩選出顯著的指標(biāo)組合。由于不同的研究者建模時(shí)使用的樣本公司不同,不同的樣本公司隱含的舞弊手段可能不同,經(jīng)常會(huì)出現(xiàn)同一個(gè)指標(biāo)在A模型中與舞弊顯著相關(guān),但在B模型中卻不顯著的情況,指標(biāo)的顯著只對(duì)有限樣本有效,因此目前尚無公認(rèn)統(tǒng)一有效包治百病的指標(biāo)體系。
(3)舞弊點(diǎn)難以判斷。由于是根據(jù)多個(gè)指標(biāo)的加權(quán)和導(dǎo)致的概率超過分割值來判為舞弊,是指標(biāo)的組合與舞弊發(fā)生概率的對(duì)應(yīng)關(guān)系,因此不能直觀地看出是與哪個(gè)指標(biāo)或與哪幾個(gè)指標(biāo)相關(guān)的舞弊發(fā)生。另外,如果選用的是資產(chǎn)負(fù)債率(總負(fù)債/總資產(chǎn))、資產(chǎn)收益率(凈利潤/總資產(chǎn))這樣與舞弊手段無直接關(guān)聯(lián)的指標(biāo),情況就更糟了,因?yàn)樽疃嘀荒苷f明負(fù)債越多或者利潤越少公司舞弊的概率越大,具體進(jìn)行了怎樣的舞弊不得而知。
(4)識(shí)別準(zhǔn)確率偏低。一是因?yàn)榻r(shí)不能窮盡樣本和指標(biāo),建立的模型只能識(shí)別與自變量xi1,xi2,…,xik相關(guān)的舞弊,由于模型中不含有其他指標(biāo),因此與其他指標(biāo)相關(guān)的舞弊難以識(shí)別,也就是說企業(yè)有幾百個(gè)明細(xì)會(huì)計(jì)科目都存在舞弊風(fēng)險(xiǎn),但模型只能識(shí)別出部分科目的舞弊。二是因?yàn)閱蝹€(gè)指標(biāo)的值較小可能意味著沒有這種舞弊發(fā)生,但是多個(gè)小的指標(biāo)值與系數(shù)的乘積和就可能導(dǎo)致舞弊概率超過分割值,從而導(dǎo)致誤判為舞弊。三是因?yàn)?0萬元的舞弊可能被識(shí)別出來,而幾個(gè)1萬元的舞弊累加后由于舞弊概率沒有超過分割值就識(shí)別不出來。四是過度擬合樣本泛化能力差,如果迭代次數(shù)控制不好可能導(dǎo)致模型過度擬合樣本,對(duì)新的公司進(jìn)行舞弊識(shí)別時(shí)反而不準(zhǔn)。
(5)高估識(shí)別準(zhǔn)確率。大多數(shù)模型使用舞弊和非舞弊1:1配對(duì)樣本建模,而不是真實(shí)情況的比例配對(duì),高估了識(shí)別準(zhǔn)確率。目前已有的Logistic模型給出的較高識(shí)別準(zhǔn)確率因沒有大樣本驗(yàn)證,可信性大打折扣,如果Logistic模型真的達(dá)到了90%—95%這樣很高的準(zhǔn)確率,那么舞弊識(shí)別的老大難問題不就解決了嗎?
(6)分割點(diǎn)選擇困難。概率分割點(diǎn)選取不同時(shí)造成舞弊識(shí)別率和非舞弊識(shí)別率上下?lián)u擺,高低難以均衡,難以抉擇。
(7)多重共線性難以解決。如果一個(gè)自變量能夠用其他自變量進(jìn)行線性解釋,即用一個(gè)自變量做因變量、用其余的自變量做自變量進(jìn)行線性回歸,如果擬合優(yōu)度R2較大,就說明存在多重共線性。Logistic回歸對(duì)多重共線性敏感,自變量之間的多重共線性將導(dǎo)致回歸系數(shù)的標(biāo)準(zhǔn)誤的膨脹,從而導(dǎo)致自變量顯著性檢驗(yàn)的Wald統(tǒng)計(jì)量變小、顯著性水平Sig值變大,變量的顯著性下降甚至不顯著,或是變量系數(shù)的正負(fù)號(hào)的改變,以至于難以解釋自變量與因變量的相關(guān)性。由于每個(gè)會(huì)計(jì)科目都可能舞弊,因此理論上模型應(yīng)該包含更多的自變量,但矛盾的是自變量越多,多重共線性就會(huì)越嚴(yán)重,解決多重共線性的辦法通常包括:刪除變量,用主成分合成新的變量,對(duì)于交叉變量進(jìn)行中心化處理,增加樣本等,而這些方法往往由于恰恰是理論上需要的變量不能刪除、合成的新變量難以解釋其會(huì)計(jì)涵義、舞弊樣本有限等原因難以實(shí)現(xiàn)。
(8)需要關(guān)注樣本量。Logistic模型應(yīng)關(guān)注樣本量,當(dāng)樣本量小于100時(shí)回歸結(jié)果風(fēng)險(xiǎn)較大,大于500時(shí)回歸結(jié)果比較可靠。目前普遍存在的問題恰恰是:建模樣本少,通常只有幾十個(gè)舞弊樣本,以及幾十個(gè)配對(duì)樣本。
(9)需要判定模型結(jié)構(gòu)。需要關(guān)注也許logit并不一定就是自變量的線性組合還可能是非線性組合函數(shù)。
會(huì)計(jì)舞弊指數(shù),是指根據(jù)會(huì)計(jì)舞弊手段選擇舞弊指標(biāo),根據(jù)每個(gè)指標(biāo)值偏離閾值的程度打分,累加后作為舞弊指數(shù)。
1.舞弊指標(biāo)體系構(gòu)建
參照文獻(xiàn)以及根據(jù)舞弊手段自行設(shè)計(jì),共得到30個(gè)舞弊識(shí)別指標(biāo)[16]36-44,包括應(yīng)收賬款周轉(zhuǎn)指數(shù)、存貨周轉(zhuǎn)指數(shù)等。由于舞弊手段多是直接粉飾會(huì)計(jì)科目和賬表數(shù)字,從而帶來財(cái)務(wù)指標(biāo)的異常變動(dòng),故只選擇了財(cái)務(wù)指標(biāo)作為舞弊指標(biāo)以便能更為靈敏地識(shí)別出舞弊。
2.舞弊指標(biāo)閾值的確定
閾值是判別會(huì)計(jì)舞弊與否的門檻,由于30個(gè)指標(biāo)均為正向指標(biāo)、數(shù)值越大舞弊程度越高,因此有一個(gè)指標(biāo)值超過閾值就判為舞弊。采用多數(shù)原則法確定閾值[19]43-45,該方法假設(shè)多數(shù)公司(如75%)在該指標(biāo)上沒有舞弊,即把各個(gè)公司按該指標(biāo)值降序排列,將前25%的公司視為有舞弊發(fā)生,其余視為沒有舞弊發(fā)生,第25%那個(gè)公司的值定為閾值。閾值還有其他計(jì)算方法:最小值+(最大值-最小值)×0.75,以上均稱為0.75法則,也可以使用0.618黃金分割法則。
為了研究不同的閾值確定比例對(duì)公司指數(shù)排序的影響,分別計(jì)算了四種方案進(jìn)行對(duì)比探討,即分別將前10%、25%、38.2%、50%的公司視為有舞弊發(fā)生,如表2所示。例如將前25%的公司視為舞弊時(shí),即將28(公司總數(shù))×25%=7家公司視為舞弊公司,7家公司再分成三等份分別賦給3分、2分、1分,其余公司賦0分,第7家公司的值1.203 240即為應(yīng)收賬款周轉(zhuǎn)指數(shù)的閾值。
表2 四種計(jì)算方案閾值的確定和賦值方法
3.會(huì)計(jì)舞弊指數(shù)構(gòu)建
(1)樣本選取。隨機(jī)選取了C40儀器儀表制造業(yè)公司作為研究對(duì)象,共計(jì)28家企業(yè),進(jìn)行2016年的閾值和舞弊指數(shù)計(jì)算。
(2)舞弊指數(shù)構(gòu)建和預(yù)警。將每個(gè)公司的30個(gè)指標(biāo)得分累加,即得到了該公司的會(huì)計(jì)舞弊指數(shù),最高為94分,0分表示沒有舞弊發(fā)生,也就是說盡管舞弊指數(shù)的構(gòu)建基礎(chǔ)是假設(shè)每個(gè)公司都有舞弊的可能性,但計(jì)算的結(jié)果是許多公司舞弊指數(shù)為0并沒有舞弊發(fā)生,說明了指數(shù)計(jì)算方法的科學(xué)性,不存在“有罪推定”的邏輯起點(diǎn)上的缺陷。將各個(gè)公司指數(shù)排序發(fā)布即可進(jìn)行預(yù)警。如表3所示共計(jì)算了四種方案進(jìn)行排序?qū)Ρ龋磳⑶?0%、25%、38.2%、50%的公司設(shè)為舞弊公司所分別得到的指數(shù),其中“吉艾科技”舞弊指數(shù)最高。
(3)指數(shù)的Spearman秩相關(guān)檢驗(yàn)。將四種計(jì)算方案所得指數(shù)進(jìn)行等級(jí)相關(guān)分析,秩相關(guān)系數(shù)計(jì)算公式為[20]121-123:
(7)
表3 四種計(jì)算方案得到的會(huì)計(jì)舞弊指數(shù)排序?qū)Ρ?/p>
表4 指數(shù)Spearman秩相關(guān)系數(shù)
注:**在1%的水平上顯著相關(guān)。
會(huì)計(jì)舞弊指數(shù)的構(gòu)建基礎(chǔ)是:假設(shè)每個(gè)公司都有舞弊的可能性,無須事先知道公司舞弊與否的更多信息。當(dāng)非舞弊公司難以判定時(shí),Logistic模型的構(gòu)建基礎(chǔ)將不存在,此時(shí)更適合于構(gòu)建會(huì)計(jì)舞弊指數(shù)。
(1)事先無須知道更多信息。構(gòu)建舞弊指數(shù)時(shí),事先無須知道公司舞弊與否的信息,因?yàn)槊總€(gè)公司在壓力、機(jī)會(huì)和借口面前均存在舞弊風(fēng)險(xiǎn),避免了非舞弊公司難以判斷的窘境。
(2)“或”的思想。摒棄了Logistic模型在計(jì)算舞弊概率時(shí)對(duì)指標(biāo)進(jìn)行加總的“與”的老思路,而是采用單指標(biāo)打分“或”的新方法,30個(gè)指標(biāo)中只要有某個(gè)指標(biāo)超過閾值就是舞弊,指數(shù)模型更符合客觀實(shí)際。
(3)舞弊點(diǎn)直觀。由于組成舞弊指數(shù)的各個(gè)指標(biāo)有明確的含義是探測(cè)哪個(gè)會(huì)計(jì)科目舞弊的,又采用的是單指標(biāo)打分方法,每個(gè)指標(biāo)的得分一目了然,舞弊點(diǎn)和舞弊程度得分便直觀地顯現(xiàn)出來。進(jìn)行會(huì)計(jì)科目舞弊預(yù)警、把閾值做成標(biāo)準(zhǔn)值發(fā)布都是未來重要的研究?jī)?nèi)容。
(4)無須關(guān)注多重共線性??赡馨l(fā)生舞弊,因此可以選擇大量的舞弊識(shí)別指標(biāo)構(gòu)建指數(shù),用以識(shí)別各種手段各個(gè)科目的舞弊,而不存在多重共線性問題。
(5)靈敏度高。會(huì)計(jì)舞弊指數(shù)是連續(xù)的,克服了只把公司進(jìn)行舞弊與否的二分類而造成的分類粗、誤判多、研究缺乏精細(xì)化的缺點(diǎn),指數(shù)具有連續(xù)、靈敏、精細(xì)化刻畫舞弊程度的優(yōu)點(diǎn)。
(6)直觀易用。會(huì)計(jì)舞弊指數(shù)既是舞弊程度、內(nèi)部控制有效與否的直觀反映,也是會(huì)計(jì)師、投資者、銀行規(guī)避審計(jì)風(fēng)險(xiǎn)、投資風(fēng)險(xiǎn)、信貸風(fēng)險(xiǎn)的簡(jiǎn)單易用的決策工具。
(7)構(gòu)建可操作性強(qiáng)。舞弊指標(biāo)主要包括根據(jù)舞弊手段選擇的財(cái)務(wù)指標(biāo),這使得舞弊指數(shù)構(gòu)建具有可操作性、模型識(shí)別舞弊更靈敏。
(8)挖掘舞弊動(dòng)因理論層面高。將公司治理或內(nèi)部控制等指標(biāo)不作為指數(shù)的組成部分,而是作為舞弊三角形理論的具體動(dòng)因,是舞弊指數(shù)大小的影響因素,通過線性回歸模型實(shí)證檢驗(yàn)后可以根據(jù)顯著的影響因素提出舞弊治理建議,以便站在更高的理論層面上挖掘舞弊產(chǎn)生的動(dòng)因。
(1)舞弊指標(biāo)體系選取困難。當(dāng)然,Logistic模型同樣存在指標(biāo)選擇難的問題。
(2)舞弊指標(biāo)閾值確定困難。
Logistic模型的構(gòu)建基礎(chǔ)是舞弊和非舞弊公司都是確定的,當(dāng)非舞弊公司難以判斷時(shí),就會(huì)造成分類模型的構(gòu)建基礎(chǔ)不復(fù)存在。同時(shí),由于舞弊手段多種多樣,表現(xiàn)為規(guī)律性不強(qiáng),規(guī)律性不強(qiáng)就難以建模,建立的模型也不準(zhǔn)確,所以構(gòu)建會(huì)計(jì)舞弊指數(shù)便是很好的替代。舞弊指數(shù)的構(gòu)建基礎(chǔ)是假設(shè)每個(gè)公司都有舞弊的可能性,而無須事先知道舞弊與否的更多信息。指數(shù)具有精細(xì)化刻畫舞弊程度的優(yōu)點(diǎn)。
發(fā)布舞弊指數(shù)排名是對(duì)舞弊公司的警示和震懾,有助于提高資本市場(chǎng)的信息披露質(zhì)量。