謝波峰(中國人民大學(xué)中國財(cái)政金融政策研究中心 北京 100872)
面向大數(shù)據(jù)的稅務(wù)管理應(yīng)用模式及政策建議*
謝波峰(中國人民大學(xué)中國財(cái)政金融政策研究中心 北京 100872)
本文在總結(jié)各國稅務(wù)機(jī)關(guān)大數(shù)據(jù)應(yīng)用經(jīng)驗(yàn)的基礎(chǔ)上,提煉了大數(shù)據(jù)應(yīng)用的三大特征,歸納了新的應(yīng)用模式,并從理念、實(shí)施路徑和成果應(yīng)用三個(gè)方面提出了相應(yīng)的政策建議,以期為我國稅務(wù)機(jī)關(guān)應(yīng)用大數(shù)據(jù)提供有益參考。
稅收大數(shù)據(jù) 稅務(wù)管理 數(shù)據(jù)分析與應(yīng)用
從頂級科研期刊Science、Nature提出大數(shù)據(jù)這一研究領(lǐng)域以來,包括我國在內(nèi)的各國稅務(wù)機(jī)關(guān)便紛紛開始嘗試大數(shù)據(jù)在稅務(wù)管理中的應(yīng)用,試圖發(fā)現(xiàn)更多規(guī)律,進(jìn)一步提升管理效率。本文梳理了各國稅務(wù)機(jī)關(guān)大數(shù)據(jù)應(yīng)用經(jīng)驗(yàn),分析了大數(shù)據(jù)應(yīng)用的特征,歸納了面向大數(shù)據(jù)稅務(wù)管理應(yīng)用的主要模式,并對我國稅務(wù)機(jī)關(guān)進(jìn)一步發(fā)展大數(shù)據(jù)應(yīng)用提出了相應(yīng)的政策建議。
事實(shí)上,在大數(shù)據(jù)這一概念風(fēng)靡之前,不少國家就開始探索如何發(fā)揮稅收征管中積累的海量數(shù)據(jù)的應(yīng)用價(jià)值。例如,美國國稅局(IRS)早在2004年左右就嘗試通過關(guān)系型挖掘技術(shù)來發(fā)現(xiàn)海量納稅人數(shù)據(jù)中的遵從信息,IRS針對高收入人群非法利用避稅方法的現(xiàn)象,應(yīng)用支持向量機(jī)的數(shù)據(jù)挖掘方法,使用2000-2003年納稅年度數(shù)據(jù)建立的模型識別了不少高收入納稅人不遵從的稅收案例,每個(gè)案例都涉及上百萬美元的偷逃稅額。近年來,隨著具有“4V”特征①4V是指Volume、Velocity、Variety、Value.的大數(shù)據(jù)技術(shù)的進(jìn)一步應(yīng)用和推廣,各國在應(yīng)用大數(shù)據(jù)的場景方面更加豐富(OECD,2016),出現(xiàn)不少值得借鑒的經(jīng)驗(yàn)。
(一)嘗試引入更多方法
在豐富的大數(shù)據(jù)面前,以前受制于數(shù)據(jù)的方法選擇空間更大。以逃稅分析為例,各國稅務(wù)機(jī)關(guān)除了應(yīng)用傳統(tǒng)的計(jì)量統(tǒng)計(jì)模型外,還嘗試了不少新方法。愛爾蘭、荷蘭、新西蘭、新加坡等國通過社會(huì)網(wǎng)絡(luò)分析(SNA)幫助發(fā)現(xiàn)增值稅輪盤詐騙(Carousel fraud),SNA方法將大量交易數(shù)據(jù)進(jìn)行關(guān)系分析,推測出可疑群體的聯(lián)系,并進(jìn)行形象化展示。澳大利亞和愛爾蘭在識別不正確扣除申報(bào)和未申報(bào)收入的應(yīng)用中,探索了無監(jiān)督學(xué)習(xí)模型(unsupervised learning methods)的使用。無監(jiān)督學(xué)習(xí)模型針對事先不確定的不遵從納稅人和遵從納稅人的混合樣本群,自行發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的性質(zhì)和規(guī)律,從而實(shí)現(xiàn)混合數(shù)據(jù)的自動(dòng)分類,該方法充分體現(xiàn)了“讓數(shù)據(jù)說話”的應(yīng)用原則。與偏重于理論及經(jīng)驗(yàn)指導(dǎo)的傳統(tǒng)監(jiān)督學(xué)習(xí)型模型相比,其更容易發(fā)現(xiàn)以往不知道的數(shù)據(jù)模式,通過此方法,澳大利亞稅務(wù)局和愛爾蘭稅務(wù)局發(fā)現(xiàn)了不少以前未知的稅收風(fēng)險(xiǎn)特征。
(二)進(jìn)一步拓展分析對象
大數(shù)據(jù)可以將稅務(wù)管理中的分析對象從單個(gè)納稅人拓展到相關(guān)的各種主體。SNA就是將分析對象從單個(gè)納稅人拓寬到一組納稅人,幫助稅務(wù)管理部門分析團(tuán)伙稅收犯罪情況,此類案件僅分析單個(gè)企業(yè)往往無法發(fā)現(xiàn)可疑之處。通過SNA方法理清各企業(yè)之間的關(guān)系,包括各公司高層之間的關(guān)系、銀行賬戶往來、共享的辦公電話等,便于稅務(wù)風(fēng)險(xiǎn)管理人員在集團(tuán)范圍內(nèi)發(fā)現(xiàn)風(fēng)險(xiǎn)。分析對象的拓展還可以通過業(yè)務(wù)流、現(xiàn)金收入流等關(guān)系進(jìn)行。例如,IRS通過模型將交易分析拓展到現(xiàn)金流中的相關(guān)納稅人,從而發(fā)現(xiàn)低申報(bào)的不遵從現(xiàn)象。除此之外,澳大利亞稅務(wù)局將同一稅務(wù)中介的納稅人歸類在同一個(gè)模型中進(jìn)行分析,形成了針對統(tǒng)一稅務(wù)中介層面的不同納稅人風(fēng)險(xiǎn)檢測。
(三)應(yīng)用場景更加豐富
近年來,稅務(wù)機(jī)關(guān)收集的大數(shù)據(jù)除了征收管理方面的信息之外,還包括納稅人溝通情況、調(diào)查問卷、政府其他部門的公民管理數(shù)據(jù)、銀行部門信用記錄等數(shù)據(jù),使得潛在的應(yīng)用場景更加豐富,可以進(jìn)一步在納稅服務(wù)、欠稅管理等領(lǐng)域應(yīng)用。例如,新加坡稅務(wù)局(IRAS)從2014年開始,通過分析各種數(shù)據(jù)在改進(jìn)涉稅事項(xiàng)通知設(shè)計(jì)、自助納稅工具等方向進(jìn)行了拓展。值得一提的是,IRAS將來自于納稅人的文體信息抽取、清洗、結(jié)構(gòu)化,通過交互式流程使分析團(tuán)隊(duì)和業(yè)務(wù)人員之間形成緊密合作,讓文體分析流程和結(jié)果更加符合為納稅人服務(wù)的語境。例如,在一項(xiàng)稅收政策發(fā)生變化之后,分析發(fā)現(xiàn)納稅人經(jīng)常關(guān)心的問題也發(fā)生了變化,IRAS在網(wǎng)站及時(shí)更新納稅指南,并且主動(dòng)推送給相應(yīng)的納稅人,從而減少納稅人的咨詢次數(shù)。新西蘭稅務(wù)局則以客戶為中心,整合顧客調(diào)查結(jié)果和風(fēng)險(xiǎn)管理數(shù)據(jù),得到更全面的納稅人數(shù)據(jù),然后進(jìn)行情感分析和問題抽取,推出針對遵從納稅人和不遵從納稅人抱怨的個(gè)性化應(yīng)對措施。
(四)與管理行為改進(jìn)聯(lián)系更緊密
通過大數(shù)據(jù)分析與實(shí)驗(yàn)經(jīng)濟(jì)學(xué)等其他相關(guān)領(lǐng)域的綜合應(yīng)用,各國稅務(wù)機(jī)關(guān)在管理行為改進(jìn)方面更加積極主動(dòng)。例如,挪威稅務(wù)局通過實(shí)驗(yàn)經(jīng)濟(jì)學(xué)方法,進(jìn)行處理組和控制組的效應(yīng)分析,獲取不同的告知方式對納稅人申報(bào)境外收入的不同反應(yīng),然后針對不同類型的納稅人采取更有效的告知方式,提高境外收入的申報(bào)效率。英國稅務(wù)局借助“助推理論”②助推理論(nudge theory):一種行為經(jīng)濟(jì)學(xué)和社會(huì)心理學(xué)的混合理論,解釋該理論最通俗易懂的例子就是設(shè)置一串可愛的腳印來指引方向,而不是常規(guī)的指路牌,形成垃圾入桶等更好的生活習(xí)慣。,通過模型預(yù)測不同類型納稅人的申報(bào)風(fēng)險(xiǎn),然后通過控制實(shí)驗(yàn)分析不同類型風(fēng)險(xiǎn)納稅人的行為反應(yīng)模式,采取最有效的信息提示和引導(dǎo)方式,幫助和推動(dòng)納稅人自我遵從稅收法律。
(一)應(yīng)用特征
大數(shù)據(jù)在稅務(wù)機(jī)關(guān)的應(yīng)用,除了各領(lǐng)域普遍具有的“4V”特征之外,還有以下三大特征。
1.“大”體現(xiàn)在范圍上,是通過稅務(wù)部門以外的大范圍數(shù)據(jù)來源,將不同部門、不同業(yè)務(wù),甚至不同表現(xiàn)形式的數(shù)據(jù)匯集成一個(gè)新的集合。
2.這種來源于不同部門的新數(shù)據(jù)集合,所形成的規(guī)模是我們以前沒有處理過的,大到接近能夠擁有的總體數(shù)據(jù),以至于不能稱之為樣本數(shù)據(jù)。
3.這種近乎總體的數(shù)據(jù)集,在各項(xiàng)工作方法和手段中取得了首要地位,現(xiàn)狀分析、形勢判斷、工作規(guī)劃等各項(xiàng)事務(wù)都要將大數(shù)據(jù)的應(yīng)用和地位排在第一位。
通過以上三個(gè)遞進(jìn)的特征, “大范圍數(shù)據(jù)、數(shù)據(jù)大規(guī)模、數(shù)據(jù)地位高”等與“大”直接掛接的特點(diǎn),進(jìn)一步定位了大數(shù)據(jù)的來源、規(guī)模和地位等重要問題。在把握大數(shù)據(jù)特征的基礎(chǔ)上,我們可以探索其在稅務(wù)管理中的應(yīng)用模式。
(二)應(yīng)用模式探索
一定的應(yīng)用模式有利于迅速定位大數(shù)據(jù)利用的方向,不斷的形成數(shù)據(jù)應(yīng)用積累,從國內(nèi)外實(shí)踐情況和理論研究來看,主要有以下幾種模式可供選擇。
1.在分析中使用更長、更寬、更活的變量序列
(1)變量變“長”。通過收集更長時(shí)間的變量序列,可以追溯到更遠(yuǎn)的過去,在一個(gè)更長的時(shí)間序列中,觀察變量的長期變化規(guī)律。由于時(shí)間拉長,剔除短期內(nèi)波動(dòng)的干擾,往往比較短時(shí)空中呈現(xiàn)的微弱變化更加明顯,增強(qiáng)了我們的識別能力。
(2)變量變“寬”。所謂變量變“寬”,實(shí)際上是指納入若干以往傳統(tǒng)分析中沒有考慮的新變量,新變量一方面來源于大數(shù)據(jù)環(huán)境下對以往擁有變量價(jià)值的重新認(rèn)識;另一方面來源于數(shù)據(jù)變“大”之后擁有的新變量。在數(shù)據(jù)變“寬”方面,特別值得注意的是,來自于互聯(lián)網(wǎng)收集的納稅人數(shù)據(jù)經(jīng)過整理對接之后,分類、標(biāo)準(zhǔn)化、指數(shù)化之后所形成的可用數(shù)據(jù)變化。許多基于大數(shù)據(jù)的研究將變量選擇視野拓寬到傳統(tǒng)領(lǐng)域之外,提出不少新穎的變量,取得了不錯(cuò)的應(yīng)用效果。
(3)粒度變“活”。這方面的應(yīng)用主要指宏觀數(shù)據(jù)與微觀數(shù)據(jù)之間的銜接對應(yīng),過去由于樣本數(shù)據(jù)的原因,宏觀數(shù)據(jù)分析與微觀數(shù)據(jù)之間的分析結(jié)論往往存在著一些不匹配的狀態(tài),從全局的總量分析到進(jìn)一步的結(jié)構(gòu)分析往往打不通,得不到進(jìn)一步的結(jié)論。這一狀況在大數(shù)據(jù)時(shí)代或許有所改觀,我們可以探索宏觀數(shù)據(jù)和微觀數(shù)據(jù)的混搭應(yīng)用,建立多個(gè)不同數(shù)據(jù)顆粒度下的分析,以便在不同粒度下獲得更多的了解和發(fā)現(xiàn)。
2.采用新的分析方法和模型
正如國內(nèi)外稅務(wù)管理大數(shù)據(jù)應(yīng)用的實(shí)踐所指出的方向一樣,無論是在原有數(shù)據(jù)的基礎(chǔ)上,還是新形成的大數(shù)據(jù)環(huán)境中,采用新的分析方法和模型也是一種值得嘗試的模式。新的分析方法和模型的應(yīng)用大概分為兩類。
(1)加強(qiáng)不同模型的組合應(yīng)用。根據(jù)數(shù)據(jù)對象和分析任務(wù)的不同,用分類模型將數(shù)據(jù)分組,通過不同的分析模型得到分析結(jié)果。以風(fēng)險(xiǎn)分析為例,這種不同的分析結(jié)果既包括推測風(fēng)險(xiǎn)概率,又涉及具體風(fēng)險(xiǎn)指向的分析。這種組合應(yīng)用還包括針對不同分析對象模型的相互鏈接。
(2)引入新的分析方法和模型。近年來,在不斷涌現(xiàn)的新分析方法和模型中,最引入注目的莫過于機(jī)器學(xué)習(xí)方法,各國稅務(wù)機(jī)關(guān)和研究機(jī)構(gòu)都在探索機(jī)器學(xué)習(xí)在稅務(wù)管理中的應(yīng)用。與通過理論和經(jīng)驗(yàn)選擇模型的計(jì)量經(jīng)濟(jì)學(xué)方法相比,許多機(jī)器學(xué)習(xí)方法是通過算法程序的交叉檢驗(yàn),根據(jù)一定的約束條件選擇模型,即機(jī)器學(xué)習(xí)是反復(fù)在部分?jǐn)?shù)據(jù)上估計(jì)模型,再在另一部分?jǐn)?shù)據(jù)上檢驗(yàn)?zāi)P停詈笸ㄟ^復(fù)雜性懲罰項(xiàng)(penalty term)來找到最合適的模型。該特點(diǎn)被概括為施加約束性(regularization)和系統(tǒng)性的模型選擇(systematic model selection),在更長序列、更寬變量、更多粒度選擇的大數(shù)據(jù)分析環(huán)境下,或許將會(huì)成為稅務(wù)管理數(shù)據(jù)分析的標(biāo)配。
3.在新理論指導(dǎo)下的應(yīng)用
在新數(shù)據(jù)、新方法的支持下,在指導(dǎo)數(shù)據(jù)分析的經(jīng)濟(jì)和管理理論方面,或許會(huì)有一些新的發(fā)現(xiàn),類似應(yīng)用“助推理論”,結(jié)合實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的方法,設(shè)計(jì)管理行為納入分析框架中??深A(yù)期的理論除了上述提及的行為經(jīng)濟(jì)學(xué)和社會(huì)心理學(xué)方面的理論,還會(huì)來自于不斷完善的稅收遵從理論。例如,近年來基于經(jīng)典的A-S模型拓展形成的遵從坡面模型(S-S模型),進(jìn)一步全面分析促進(jìn)遵從的強(qiáng)制力、信任度等因素。這些新理論的引入,使以往數(shù)據(jù)分析側(cè)重于現(xiàn)有模式的挖掘之外,還開始在稅務(wù)管理方法的效果分析、行為設(shè)計(jì)等主動(dòng)分析方面開啟新的窗口。
更值得一提的是,以上基于大數(shù)據(jù)的稅務(wù)管理數(shù)據(jù)分析的三種模式:新的變量、新的方法和新的理論之間存在著互相推進(jìn)的齒輪聯(lián)動(dòng)有機(jī)關(guān)系,在某一方面的推進(jìn),必將推動(dòng)其他兩方面的進(jìn)展。
在分析和借鑒國外應(yīng)用經(jīng)驗(yàn)的基礎(chǔ)上,結(jié)合我國稅務(wù)機(jī)關(guān)大數(shù)據(jù)應(yīng)用現(xiàn)狀,建議推進(jìn)我國稅務(wù)管理大數(shù)據(jù)應(yīng)用從以下方面著力:
第一,在應(yīng)用理念上,擺正大數(shù)據(jù)應(yīng)用的地位,既不神秘化,也不標(biāo)簽化。目前有些應(yīng)用存在一個(gè)誤區(qū):一方面認(rèn)為大數(shù)據(jù)無所不能;另一方面將所有的數(shù)據(jù)應(yīng)用工作都貼上大數(shù)據(jù)標(biāo)簽。認(rèn)為大數(shù)據(jù)無所不能,會(huì)由于現(xiàn)實(shí)的數(shù)據(jù)質(zhì)量、應(yīng)用能力等方面的差距,容易造成理想的應(yīng)用設(shè)想和現(xiàn)實(shí)的應(yīng)用結(jié)果落差太大,從而失去對大數(shù)據(jù)應(yīng)用的信心。將所有的數(shù)據(jù)應(yīng)用工作都認(rèn)為是大數(shù)據(jù)應(yīng)用,則會(huì)容易停留在現(xiàn)有的數(shù)據(jù)應(yīng)用水平,而無法邁向真正的大數(shù)據(jù)應(yīng)用。一定要恰如其分地認(rèn)識到大數(shù)據(jù)應(yīng)用的效果,客觀地分析所處的階段,在具有大數(shù)據(jù)、可以推行大應(yīng)用、能夠期望大價(jià)值的場景勇于創(chuàng)新,不具備條件和能力的時(shí)候?qū)嵤虑笫?,積極準(zhǔn)備和落實(shí)大數(shù)據(jù)應(yīng)用條件,爭取早日達(dá)到應(yīng)用大數(shù)據(jù)的成熟階段。
第二,把握好“從小到大,從局部到全面”的大數(shù)據(jù)應(yīng)用實(shí)施路徑。從講求實(shí)效的大數(shù)據(jù)應(yīng)用做法來看,一條較為實(shí)用的路徑應(yīng)該是從小到大,重視小數(shù)據(jù)的應(yīng)用、局部領(lǐng)域的應(yīng)用,在小應(yīng)用中發(fā)現(xiàn)問題,積累經(jīng)驗(yàn),將成熟的小應(yīng)用轉(zhuǎn)化成大數(shù)據(jù)環(huán)境下的大應(yīng)用,在大數(shù)據(jù)中進(jìn)一步驗(yàn)證和擴(kuò)大效果。要辯證把握大數(shù)據(jù)應(yīng)用和小數(shù)據(jù)應(yīng)用的關(guān)系,大部分情況下大數(shù)據(jù)應(yīng)用需要小數(shù)據(jù)的探索,甚至在數(shù)據(jù)分析理論中,小數(shù)據(jù)的探索性分析往往是大數(shù)據(jù)應(yīng)用的第一步,然而在需要大數(shù)據(jù)才能縱覽全局的情況下,也要果斷上馬大數(shù)據(jù)應(yīng)用項(xiàng)目。在這一路徑中,要充分鼓勵(lì)基層的創(chuàng)新應(yīng)用,研究稅務(wù)總局和省級稅務(wù)局集中式的高級分析團(tuán)隊(duì)與基層分析小組的混合分布式布局,做到既有統(tǒng)籌管理,又有各地的發(fā)揮空間。
第三,尊重?cái)?shù)據(jù)應(yīng)用規(guī)律,注重反饋,重視成效。重視大數(shù)據(jù)分析結(jié)果與實(shí)踐應(yīng)用的對比反饋,敢于分析和面對大數(shù)據(jù)應(yīng)用的功過,不擴(kuò)大數(shù)據(jù)分析的效果,也不回避實(shí)踐工作暴露出的分析過程中存在的問題,一定要避免大數(shù)據(jù)分析和實(shí)踐工作的“兩張皮”現(xiàn)象。提升大數(shù)據(jù)分析的針對性和準(zhǔn)確性,提高大數(shù)據(jù)分析對實(shí)踐工作的指導(dǎo)作用,真正做到“用數(shù)據(jù)說話”。同時(shí),在應(yīng)用導(dǎo)向的基礎(chǔ)上,借鑒快捷開發(fā)理念,固定和推廣成熟的分析模塊,并且逐步總結(jié)通用功能和模塊,形成和完善大數(shù)據(jù)分析平臺。
[1] DeBarr,MITRE& Maury Harwood.Relational Mining for Compliance Risk[R]. Washington: Internal Revenue Service,June, 2004.
[2] OECD. Advanced Analytics for Better Tax Administration: Putting Data to Work[R]. Paris:OECD Publishing,2016.
[3] Varian H R. Big Data: New Tricks for Econometrics[J]. Journal of Economic Perspectives, 2014, 28(2): 3-28.
[4] 謝波峰.“互聯(lián)網(wǎng)+”時(shí)代的稅收風(fēng)險(xiǎn)管理[J].中國稅務(wù), 2015,(08):34-35.
[5] 謝波峰.大數(shù)據(jù)時(shí)代稅收微觀數(shù)據(jù)體系的構(gòu)建[J].稅務(wù)研究, 2015,(01):92-95.
責(zé)任編輯:高仲芳
Big Data Application Models and Policy Suggestions In Tax Administration
Bofeng Xie
On the basis of summarizing the experiences of big data application by tax authorities in many countries, the paper refines into three distinctive characteristics in big data application, and generates a new application model, and then presents several policy suggestions from theory, implementation path and result application so as to provide some helpful reference for China’s tax authorities in the application of big data.
Big data Tax administration Data analysis and application
F810.42
A
2095-6126(2017)04-0011-04
* 本文是國家自然科學(xué)基金項(xiàng)目“面向大數(shù)據(jù)的稅收微觀數(shù)據(jù)體系構(gòu)建與政策效應(yīng)分析應(yīng)用”(項(xiàng)目編號:71373267)資助研究成果。