摘 要:傳統(tǒng)的人工稅務(wù)稽查選案,具有人為因素大、缺乏科學(xué)性和準(zhǔn)確度等弊端。建立稽查選案模型、采用計(jì)算機(jī)自動(dòng)選案,可以避免上述弊端并提高工作效率。最初選取了9個(gè)財(cái)務(wù)指標(biāo),經(jīng)過篩選,最終使用8個(gè)指標(biāo)建立了稅務(wù)稽查選案的Logistic判別模型,樣本回帶總準(zhǔn)確率達(dá)79.6%。
關(guān)鍵詞:偷稅;稽查選案;Logistic回歸模型
中圖分類號(hào):F231.6 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-291X(2012)35-0096-02
引言
稅務(wù)稽查的工作流程主要包括選案、實(shí)施檢查、審理和執(zhí)行等階段[1]。選案是找出偷漏稅疑點(diǎn)最大的被稽查對(duì)象的過程,是稽查人員根據(jù)納稅企業(yè)的各種非財(cái)務(wù)和財(cái)務(wù)信息,進(jìn)行定性和定量分析的結(jié)果。傳統(tǒng)的人工稽查選案,主要依靠舉報(bào)材料、稽查人員經(jīng)驗(yàn)或是上級(jí)下派的任務(wù)確定稽查對(duì)象,具有人為因素多、工作強(qiáng)度大、準(zhǔn)確度低等缺點(diǎn)。同時(shí),如今偷逃稅方法日益高明,稽查人員日益感到力不從心[2]。建立稽查選案模型、采用計(jì)算機(jī)自動(dòng)選案,可以避免傳統(tǒng)人工選案的弊端,提高稽查選案工作的客觀性、科學(xué)性、準(zhǔn)確度和工作效率,對(duì)于堵塞企業(yè)偷漏稅行為具有重要作用。
一、樣本選取、指標(biāo)選取和均值差異檢驗(yàn)
本文共選擇了27家企業(yè)2009年上半年和2010年上半年的54組數(shù)據(jù)作為研究樣本,每家企業(yè)2組數(shù)據(jù),企業(yè)類型包括制造業(yè)、煤業(yè)、發(fā)電等行業(yè)。54組數(shù)據(jù)中誠(chéng)實(shí)納稅的數(shù)據(jù)為47組,被定性為有偷稅行為的數(shù)據(jù)有7組。樣本數(shù)據(jù)來(lái)源于某稅務(wù)局的納稅申報(bào)表和企業(yè)的財(cái)務(wù)報(bào)表。
選取稅務(wù)稽查選案指標(biāo)尚無(wú)統(tǒng)一標(biāo)準(zhǔn),但通常應(yīng)遵循綜合性、規(guī)范性、易得性、重要性、穩(wěn)定性、簡(jiǎn)潔性等原則[3],根據(jù)上述原則并借鑒參考文獻(xiàn),本文共選擇了4類9個(gè)財(cái)務(wù)指標(biāo),如表1所示,包括2個(gè)稅收負(fù)擔(dān)狀況指標(biāo),2個(gè)盈利能力指標(biāo),2個(gè)營(yíng)運(yùn)能力指標(biāo),3個(gè)償債能力指標(biāo)[1-4]。對(duì)偷稅組和誠(chéng)實(shí)組的9個(gè)財(cái)務(wù)指標(biāo)進(jìn)行Mann-Whitney U均值差異檢驗(yàn)(零假設(shè)H0:均值相等),用以探查各指標(biāo)均值差異情況,顯著性概率p值分別為:0.027、0.010、0.928、0.078、0.847、0.328、0.847、0.949、0.709,說明稅負(fù)率、進(jìn)銷項(xiàng)比2個(gè)指標(biāo)在5%的水平上偷稅組和誠(chéng)實(shí)組均值差異顯著,主營(yíng)業(yè)務(wù)費(fèi)用率指標(biāo)在10%的水平上均值差異顯著。
二、Logistic回歸偷稅企業(yè)識(shí)別模型
構(gòu)建模型使用了SPSS統(tǒng)計(jì)軟件?;檫x案屬于二分類問題,因此,誠(chéng)實(shí)企業(yè)用0代表、偷稅企業(yè)用1代表;自變量即為表1中的9個(gè)財(cái)務(wù)指標(biāo)。盡管不需要對(duì)模型進(jìn)行序列相關(guān)檢驗(yàn)和異方差檢驗(yàn),但需要進(jìn)行多重共線性檢驗(yàn),以決定最終是否刪除某些能用其它自變量線性組合表示的自變量。使用容忍度(Tolerance)指標(biāo)進(jìn)行該項(xiàng)檢驗(yàn),容忍度小于0.2的自變量應(yīng)該刪除,在SPSS軟件的線性回歸模塊中可以自動(dòng)計(jì)算自變量的容忍度。最終刪除了“流動(dòng)比率”指標(biāo),因?yàn)槠淙萑潭忍?。如?所示,最終模型保留了其余8個(gè)指標(biāo),因?yàn)樗鼈兊娜萑潭染笥诘扔?.485,不存在多重共線性。Logistic模型為:
模型參數(shù)如表2所示,Wald統(tǒng)計(jì)量用以檢驗(yàn)?zāi)P拖禂?shù)的顯著性,類似于線性模型的t檢驗(yàn)。使用最大似然估計(jì)法估計(jì)Logistic模型參數(shù),似然值越大,模型擬合效果越好。但習(xí)慣上常用似然函數(shù)值的對(duì)數(shù)的-2倍,即用-2 Log likelihood(-2LL)表示擬合效果,因此就變成-2LL越小模型擬合的越好。Logistic模型的擬合度也可以用和2個(gè)指標(biāo)值來(lái)衡量,這兩個(gè)值的涵義就如同線性模型的擬合優(yōu)度一樣。三個(gè)擬合度指標(biāo)值分別為23.581、0.613、0.817,擬合效果很好。
分類閾值概率選擇的不同直接影響到模型識(shí)別的準(zhǔn)確率,經(jīng)試算閾值取為ρ≤0.08,即如果偷稅概率則判為誠(chéng)實(shí)企業(yè),如果ρ>0.08則判為偷稅企業(yè),樣本回代到模型中的判別準(zhǔn)確率如表3所示,總準(zhǔn)確率79.6%、偷稅企業(yè)100%、誠(chéng)實(shí)企業(yè)76.6%。以某水泥企業(yè)為例,其2009年被稅務(wù)局定性為偷稅企業(yè)。2009年的8個(gè)指標(biāo)值分別為:0.00、5.38、0.081、1.61、0.547、0.02、0.70、0.76,代入模型中得p=0.898,大于0.08,因此,模型判別其2009年為偷稅企業(yè),定量判別結(jié)果正確。