• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于神經(jīng)網(wǎng)絡(luò)集成的財(cái)務(wù)舞弊識(shí)別方法

      2014-06-20 04:18高媛媛
      關(guān)鍵詞:財(cái)務(wù)舞弊

      高媛媛

      摘 要:為提高財(cái)務(wù)舞弊識(shí)別的精確度及泛化能力,本文以Spss Modeler14.2為平臺(tái),利用bagging和Boosting算法構(gòu)建神經(jīng)網(wǎng)絡(luò)集成分類器,建立財(cái)務(wù)舞弊識(shí)別數(shù)據(jù)流,并對(duì)結(jié)果進(jìn)行了分析。結(jié)果表明,Boosting算法構(gòu)建的神經(jīng)網(wǎng)絡(luò)集成分類器精確度高,泛化能力強(qiáng),能更有效的識(shí)別財(cái)務(wù)舞弊。

      關(guān)鍵詞:財(cái)務(wù)舞弊;神經(jīng)網(wǎng)絡(luò)集成;Bagging;Boosting

      0 引言

      近年來(lái)上市公司的財(cái)務(wù)舞弊案頻繁發(fā)生,打擊了公眾對(duì)上市公司和資本市場(chǎng)的信心,成為資本市場(chǎng)健康發(fā)展的一塊頑石,因此尋求有效并能迅速識(shí)別舞弊的方法成為資本市場(chǎng)和會(huì)計(jì)執(zhí)業(yè)界面臨的問題之一。隨著人工智能和計(jì)算機(jī)技術(shù)的發(fā)展,許多數(shù)據(jù)挖掘算法應(yīng)用到財(cái)務(wù)舞弊識(shí)別領(lǐng)域,神經(jīng)網(wǎng)絡(luò)由于對(duì)數(shù)據(jù)分布假設(shè)沒有要求,且非線性擬合能力較強(qiáng),這使得其在舞弊識(shí)別方面具有較強(qiáng)的適用性。國(guó)外應(yīng)用神經(jīng)網(wǎng)路識(shí)別財(cái)務(wù)舞弊的研究開展的較早,Ethridge和Brooks早在1994年就提出人工神經(jīng)網(wǎng)絡(luò)是甄別管理舞弊的理想方法[1]。Green和Choi (1997)利用原始財(cái)務(wù)數(shù)據(jù)建立神經(jīng)網(wǎng)絡(luò)(ANN)舞弊判別模型[2]。Lin、Hwang和Becker (2003) 融合模糊回歸、神經(jīng)網(wǎng)絡(luò)等方法構(gòu)建了集成的模糊神經(jīng)網(wǎng)絡(luò)[3]。國(guó)內(nèi)學(xué)者的代表性研究主要有:梁杰等(2006)提出了模糊神經(jīng)網(wǎng)絡(luò)混合模型[4]。劉君、王里平(2006)建立徑向基概率神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)舞弊識(shí)別模型[5]。蔡志岳和吳世農(nóng)(2006)證明遺傳神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確度高于邏輯回歸模型和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型[6]。

      從上述研究可以看出前人的研究主要采用單一分類器構(gòu)建模型,在實(shí)際應(yīng)用中單一分類器存在一些缺陷,如分類精確度較低、預(yù)測(cè)性能不穩(wěn)定等問題。針對(duì)財(cái)務(wù)舞弊識(shí)別建模數(shù)據(jù)樣本量較少、數(shù)據(jù)維度高、信噪比低等諸多難題,本文提出采用神經(jīng)網(wǎng)絡(luò)集成的思想來(lái)提高舞弊識(shí)別模型的泛化能力和預(yù)測(cè)效果。

      1 神經(jīng)網(wǎng)絡(luò)集成

      根據(jù)1996年Sollich和Krough的定義:“神經(jīng)網(wǎng)絡(luò)集成是用有限個(gè)神經(jīng)網(wǎng)絡(luò)對(duì)同一個(gè)問題進(jìn)行學(xué)習(xí),集成在某輸入示例下的輸出由構(gòu)成集成的各神經(jīng)網(wǎng)絡(luò)在該示例下的輸出共同決定”[7]。簡(jiǎn)單來(lái)說(shuō),通過(guò)建立多個(gè)神經(jīng)網(wǎng)絡(luò)并將其結(jié)論結(jié)合,以提高學(xué)習(xí)系統(tǒng)的泛化能力。在生成集成的個(gè)體網(wǎng)絡(luò)方面,Bagging和Boosting是集成學(xué)習(xí)中兩種常用的算法。

      1.1 Bagging 算法

      Bagging 是1996年Breiman在Bootstrapping和aggregating概念的基礎(chǔ)上提出的。Bagging算法的核心思想是可重復(fù)取樣。該方法通過(guò)對(duì)原始數(shù)據(jù)集進(jìn)行放回抽樣,產(chǎn)生訓(xùn)練數(shù)據(jù)集的副本,創(chuàng)建大小與原始數(shù)據(jù)集相同的 bootstrap 樣本。然后,在每個(gè)副本上構(gòu)建“成分模型”,得出預(yù)測(cè)函數(shù)序列,最終的預(yù)測(cè)結(jié)果將按照一定的集成方法來(lái)得到。

      2 實(shí)證檢驗(yàn)

      2.1 研究設(shè)計(jì)

      本文以Spss Modeler 14.2為建模平臺(tái),首先利用Pearson相關(guān)算法對(duì)舞弊識(shí)別指標(biāo)進(jìn)行特征選擇,形成次優(yōu)特征集,在此基礎(chǔ)上利用Bagging算法和Boosting算法構(gòu)建神經(jīng)網(wǎng)絡(luò)集成分類器作為挖掘模型,建立舞弊識(shí)別數(shù)據(jù)流。Spss Modeler 14.2的神經(jīng)網(wǎng)絡(luò)建模工具是一種完全的黑盒模型,不需要自己構(gòu)建數(shù)學(xué)函數(shù),完全通過(guò)機(jī)器的學(xué)習(xí)完成建模。

      2.2 樣本選取

      本文所用數(shù)據(jù)來(lái)源于國(guó)泰安上市公司數(shù)據(jù)庫(kù),選取2008~2012年因虛構(gòu)利潤(rùn)、虛列資產(chǎn)、誤導(dǎo)性陳述、重大遺漏、推遲披露等原因被證監(jiān)會(huì)、上交所、深交所公開處罰的違規(guī)樣本作為舞弊樣本,以與舞弊樣本相同行業(yè)、相同年度、相近規(guī)模為標(biāo)準(zhǔn)選取非違規(guī)公司為配對(duì)樣本。共獲得樣本1100個(gè)。

      2.3 指標(biāo)選擇與數(shù)據(jù)預(yù)處理

      (一)舞弊識(shí)別指標(biāo)

      舞弊識(shí)別指標(biāo)通常作為舞弊識(shí)別的分類特征,因此甄選適當(dāng)?shù)淖R(shí)別指標(biāo)是構(gòu)建模型的前提。根據(jù)以往的研究經(jīng)驗(yàn),財(cái)務(wù)指標(biāo)被普遍應(yīng)用,并證明在舞弊識(shí)別方面是有效的。此外,會(huì)計(jì)信息的真實(shí)性有賴于公司外部監(jiān)督和內(nèi)部治理機(jī)制的保障,因此研究選擇了涵蓋企業(yè)償債能力、營(yíng)運(yùn)能力、盈利能力、發(fā)展能力、風(fēng)險(xiǎn)水平、現(xiàn)金流量能力等方面的財(cái)務(wù)指標(biāo);同時(shí)也將選擇公司治理、股權(quán)結(jié)構(gòu)、審計(jì)意見等非財(cái)務(wù)信息指標(biāo)作為舞弊識(shí)別的備選指標(biāo)。具體如下:

      (1)償債能力:資產(chǎn)負(fù)債率、利息保障倍數(shù)、營(yíng)運(yùn)資金與借款比、產(chǎn)權(quán)比率、流動(dòng)比率、速動(dòng)比率、現(xiàn)金比率、營(yíng)運(yùn)資金比率

      (2)營(yíng)運(yùn)能力:存貨周轉(zhuǎn)率、存貨與收入比、應(yīng)收賬款周轉(zhuǎn)率、應(yīng)收賬款與收入比、總資產(chǎn)周轉(zhuǎn)率

      (3)盈利能力:營(yíng)業(yè)毛利率、息稅前利潤(rùn)與營(yíng)業(yè)收入比、資產(chǎn)報(bào)酬率、總資產(chǎn)凈利率、凈資產(chǎn)收益率、管理費(fèi)用率、財(cái)務(wù)費(fèi)用率、銷售費(fèi)用率

      (4)發(fā)展能力:應(yīng)計(jì)項(xiàng)目總資產(chǎn)比、總資產(chǎn)增長(zhǎng)率、利潤(rùn)總額增長(zhǎng)率、營(yíng)業(yè)收入增長(zhǎng)率、每股收益增長(zhǎng)率

      (5)風(fēng)險(xiǎn)水平:財(cái)務(wù)杠桿系數(shù)、經(jīng)營(yíng)杠桿系數(shù)

      (6)現(xiàn)金流量能力:營(yíng)業(yè)收入現(xiàn)金比率、自由現(xiàn)金比率、營(yíng)運(yùn)指數(shù)

      (7)公司治理指標(biāo):董事長(zhǎng)與總經(jīng)理兼任情況、董事會(huì)會(huì)議次數(shù)、監(jiān)事會(huì)會(huì)議次數(shù)、股東大會(huì)會(huì)議次數(shù)、

      (8)股權(quán)結(jié)構(gòu):股權(quán)集中度、控制權(quán)競(jìng)爭(zhēng)程度、高管持股比

      (9)外部監(jiān)督指標(biāo):審計(jì)意見類型、會(huì)計(jì)師事務(wù)所變更

      (二)數(shù)據(jù)預(yù)處理

      由于原始數(shù)據(jù)存在缺失的情況,會(huì)對(duì)深層次數(shù)據(jù)分析和構(gòu)建模型帶來(lái)不利影響,因此在進(jìn)行指標(biāo)篩選前要對(duì)數(shù)據(jù)進(jìn)行清理。刪除缺失值比例大于30%的特征變量,對(duì)于缺失比例較小的變量,連續(xù)類型的變量利用均值對(duì)空值進(jìn)行插補(bǔ),標(biāo)志類型的變量則將整條個(gè)案刪除,形成建模的樣本數(shù)據(jù)。每股收益增長(zhǎng)率因?yàn)槿笔П嚷食^(guò)30%被過(guò)濾出去,最終共39個(gè)特征變量,1056條記錄(其中舞弊樣本597個(gè),非舞弊樣本459個(gè))形成建模數(shù)據(jù)。

      (三)特征提取

      在建模之前首先對(duì)舞弊識(shí)別備選指標(biāo)進(jìn)行篩選。常用的對(duì)指標(biāo)進(jìn)行降維的方法包括兩類,一是選擇指標(biāo)的子集來(lái)代替原有的指標(biāo)體系;二是對(duì)原有指標(biāo)進(jìn)行變換轉(zhuǎn)化成新的綜合性指標(biāo),如主成分分析[8]。研究首先選擇了主成分分析法,利用SPSS對(duì)建模數(shù)據(jù)進(jìn)行主成分分析,KMO和Bartlett檢驗(yàn)值為0.569(<0.7),提取公因子14個(gè),累計(jì)貢獻(xiàn)率66.86%,由此看來(lái)利用主成分分析會(huì)損失部分信息,所以本文采用子集選擇法篩選指標(biāo)。利用Spss Modeler14.2的征選擇節(jié)點(diǎn),選擇Pearson相關(guān)性分析對(duì)備選指標(biāo)篩選,將重要性大于0.9的指標(biāo)作為次優(yōu)特征集,如表1所示。

      2.4 建模及結(jié)果分析

      利用Spss Modeler的“分區(qū)”,按照5:5的比例將樣本隨機(jī)劃分為訓(xùn)練分區(qū)和測(cè)試分區(qū)。在本文中,將單一神經(jīng)網(wǎng)絡(luò)、boosting神經(jīng)網(wǎng)絡(luò)分類集成與bagging神經(jīng)網(wǎng)絡(luò)分類集成進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)中,采用3層MLP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。首選確定神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)的數(shù)目。隱含層的節(jié)點(diǎn)數(shù)太少,則神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)誤差大,泛化能力差;隱含層節(jié)點(diǎn)數(shù)目太多,則會(huì)延長(zhǎng)網(wǎng)絡(luò)的學(xué)習(xí)時(shí)間,且學(xué)習(xí)過(guò)程“記住”噪音等非規(guī)律內(nèi)容,網(wǎng)絡(luò)易出現(xiàn)過(guò)度擬合現(xiàn)象,即系統(tǒng)可以很好地?cái)M合訓(xùn)練數(shù)據(jù)集,但泛化能力很差。對(duì)隱含層節(jié)點(diǎn)數(shù)目的確定理論上沒有很好的方法,通常由實(shí)驗(yàn)測(cè)試得出,通過(guò)反復(fù)實(shí)驗(yàn)發(fā)現(xiàn)隱含層節(jié)點(diǎn)為6個(gè)時(shí)性能較好,由此神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為輸入層19個(gè)節(jié)點(diǎn),隱含層6個(gè)節(jié)點(diǎn),輸出層1個(gè)節(jié)點(diǎn)。選擇Spss Modeler建模中的“神經(jīng)網(wǎng)絡(luò)”進(jìn)行設(shè)置,具體參數(shù)如下:

      (一)字段選項(xiàng):“目標(biāo)”選擇“舞弊否”字段,“預(yù)測(cè)變量”對(duì)應(yīng)特征選擇后的19個(gè)財(cái)務(wù)及非財(cái)務(wù)指標(biāo)值。

      (二)構(gòu)建選項(xiàng):

      (1)“目標(biāo)”選擇“創(chuàng)建新模型”建立單一分類器;選擇“增強(qiáng)模型的準(zhǔn)確性”創(chuàng)建boosting分類器集;選擇“增強(qiáng)模型穩(wěn)定性”創(chuàng)建bagging分類器集;

      (2)“基本”中設(shè)置神經(jīng)網(wǎng)絡(luò)模型為MLP,隱藏層設(shè)置為1層,自定義單元數(shù)目為6;

      (3)“停止規(guī)則”中設(shè)置停止時(shí)間為5.0分鐘;

      (4)“整體”中設(shè)置分類目標(biāo)的合并規(guī)則為“投票”方式,用于Bagging和Boosting的組件模型數(shù)量為15個(gè);

      (5)過(guò)度擬合防止集合百分比為30%。

      (三)其他參數(shù)采用系統(tǒng)默認(rèn)值

      在Spss Modeler中構(gòu)建舞弊識(shí)別與檢驗(yàn)?zāi)P蛿?shù)據(jù)流,檢驗(yàn)結(jié)果如表2,單一神經(jīng)網(wǎng)絡(luò)能夠識(shí)別財(cái)務(wù)舞弊,在訓(xùn)練集和測(cè)試集上表現(xiàn)穩(wěn)定,但是精確度較低;Bagging算法和Boosting算法的精確度都高于單一神經(jīng)網(wǎng)絡(luò)的精確度,Boosting算法構(gòu)造的神經(jīng)網(wǎng)絡(luò)集成分類器精確度高于bagging算法構(gòu)造的集成分類器,但其穩(wěn)定性略遜于bagging算法構(gòu)造的集成分類器。

      3 結(jié)論

      由于公司舞弊受到多種因素影響,且作用機(jī)制復(fù)雜,運(yùn)用單一神經(jīng)網(wǎng)絡(luò)較難提高舞弊識(shí)別的精確性和穩(wěn)定性。因此本文提出應(yīng)用神經(jīng)網(wǎng)絡(luò)集成技術(shù)對(duì)識(shí)別財(cái)務(wù)舞弊進(jìn)行識(shí)別,以克服當(dāng)前識(shí)別財(cái)務(wù)舞弊建模過(guò)程中存在的樣本量少,維度高、非線性、噪音干擾以及數(shù)據(jù)缺失等諸多難題。本文以Spss Modeler 14.2 為平臺(tái),采用Bagging和Boosting算法建立模型,結(jié)果表明Boosting算法構(gòu)建的神經(jīng)網(wǎng)絡(luò)集成精確度最高,穩(wěn)定性較強(qiáng),優(yōu)于Bagging算法構(gòu)建的神經(jīng)網(wǎng)絡(luò)集成和單一神經(jīng)網(wǎng)絡(luò)模型。

      參考文獻(xiàn):

      [1] Etheridge,Harlan L.,Richard C. Brooks. Neural Networks: A New Technology[J]. The CPA Journal, 1994, 64(3):36 - 39,52 - 55.

      [2] Green B.P.,Choi J.H.. Assessing the risk of management fraud through neural network technology[J]. Auditing: A Journal of Practice &Theory;,1997,16:14-28.

      [3] Jerry W. Lin,Mark I. Hwang,Jack D. Becker,A Fuzzy Neural Network for Assessing the Risk of Fraudulent Financial Reporting[J]. Managerial Auditing Journal,2003,18(8): 657-665.

      [4] 梁杰,位金亮等. 基于神經(jīng)網(wǎng)絡(luò)的會(huì)計(jì)舞弊混合識(shí)別模型研究[J]. 統(tǒng)計(jì)與決策,2006(2):152-153.

      [5] 劉君,王里平. 基于概率神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)舞弊識(shí)別模型[J]. 哈爾濱商業(yè)大學(xué)學(xué)報(bào),2006(3):102-205.

      [6] 蔡志岳,吳世農(nóng). 基于公司治理的信息披露舞弊預(yù)警研究[J]. 管理科學(xué),2006,19(4):79-90.

      [7] Sollich P, Krogh A.Learning with ensembles: How over-fitting can be useful[M]. Advances in Neural Information Processing Systems 8.MA: MIT Press,1996: 190-196.

      [8] 習(xí)勤,米帥軍. 指標(biāo)篩選技術(shù)在神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)挖掘中的應(yīng)用[J]. 統(tǒng)計(jì)與決策,2011(10):163-165.

      猜你喜歡
      財(cái)務(wù)舞弊
      上市公司的財(cái)務(wù)舞弊分析及啟示
      海口市| 新余市| 广水市| 蒙城县| 上思县| 岳普湖县| 巧家县| 广饶县| 达日县| 壶关县| 乡宁县| 古蔺县| 大方县| 昌吉市| 浦东新区| 和硕县| 罗江县| 新邵县| 普安县| 永吉县| 黔东| 扎鲁特旗| 汝南县| 河源市| 福州市| 安多县| 迁西县| 昆明市| 绩溪县| 襄樊市| 鹿泉市| 迁西县| 札达县| 石泉县| 宝兴县| 乐昌市| 台江县| 攀枝花市| 中西区| 宿松县| 左权县|