梁平漢 郭宇辰
關(guān)鍵詞:中國(guó)政府采購(gòu);數(shù)據(jù)使用;采購(gòu)公告
DOI:10.19313/j.cnki.cn10-1223/f.20221213.001
一、引言
近些年來(lái),隨著營(yíng)商環(huán)境優(yōu)化改革的深化與“數(shù)字政府”建設(shè)的深入進(jìn)行,“政府采購(gòu)”一詞頻繁地出現(xiàn)在公眾視野。財(cái)政部發(fā)布的數(shù)據(jù)顯示,在2002 年至2020 年期間,中國(guó)政府采購(gòu)規(guī)模從1 009.6 億元增長(zhǎng)到36 970.6 億元,其中2020 年政府采購(gòu)規(guī)模占全國(guó)財(cái)政支出和GDP 的比重分別為10.2%和3.6%①。政府采購(gòu)成為了一種重要的政府經(jīng)濟(jì)政策工具,發(fā)揮了調(diào)控經(jīng)濟(jì)的作用。2020年10 月,財(cái)政部與工信部聯(lián)合發(fā)布了《政府采購(gòu)促進(jìn)中小企業(yè)發(fā)展管理辦法》,強(qiáng)調(diào)政府采購(gòu)在支持中小企業(yè)發(fā)展中的重要作用,各地也開始逐步為中小企業(yè)加大預(yù)留采購(gòu)份額。2020 年末,財(cái)政部與住房和城鄉(xiāng)建設(shè)部聯(lián)合發(fā)布了《關(guān)于政府采購(gòu)支持綠色建材促進(jìn)建筑品質(zhì)提升試點(diǎn)工作的通知》,促進(jìn)了綠色建材行業(yè)的發(fā)展。2021 年5 月,財(cái)政部與多部門共同發(fā)布了《關(guān)于運(yùn)用政府采購(gòu)政策支持鄉(xiāng)村產(chǎn)業(yè)振興的通知》以支持鄉(xiāng)村振興事業(yè)。此外政府采購(gòu)也是世界銀行營(yíng)商環(huán)境(Doing Business)和宜商環(huán)境(Business Enabling Environment)評(píng)比的重要組成部分。
已有研究發(fā)現(xiàn),政府采購(gòu)對(duì)企業(yè)提高信息獲取能力(Chen等,2021)、提升盈利能力(Cohen和Li,2020)、有效抵御外部沖擊(Goldman,2020)以及助力小企業(yè)發(fā)展等方面有積極作用(Nakabayashi,2013),但是也存在投標(biāo)過(guò)程被操縱(Porter 和Zona,1993;Conley 和Decarolis,2016)、采購(gòu)成本支出超額(Flyvbjerg,2003)、偏袒有政治聯(lián)系的地區(qū)(Mironov和Zhuravskaya,2016;Baranek 和Titl,2020)及政客和投標(biāo)人之間的勾結(jié)(Coviello 和Gagliarducci,2017)等負(fù)面現(xiàn)象。
中國(guó)政府采購(gòu)制度起步較晚。自中國(guó)政府采購(gòu)網(wǎng)建立以來(lái),其逐漸成為政府采購(gòu)信息公開的主要平臺(tái),一些國(guó)內(nèi)外學(xué)者也開始使用中國(guó)政府采購(gòu)網(wǎng)(www.ccgp.gov.cn)的采購(gòu)公告信息數(shù)據(jù)(以下統(tǒng)稱:中國(guó)政府采購(gòu)數(shù)據(jù))研究政府采購(gòu)行為對(duì)于不同領(lǐng)域的影響,取得了許多重要的成果,如企業(yè)創(chuàng)新(姜愛華和費(fèi)堃桀,2021)、精準(zhǔn)扶貧(武威等,2022)、人工智能技術(shù)發(fā)展(Beraja 等,2020)、政企關(guān)系(Fang 等,2022)等。
政府采購(gòu)信息的公開極大便利了經(jīng)濟(jì)學(xué)研究者。但值得注意的是,已有研究的數(shù)據(jù)來(lái)源基本都是采用網(wǎng)絡(luò)爬蟲技術(shù)手段在中國(guó)政府采購(gòu)網(wǎng)獲取公告文本信息,由于文本收集和整理方法不同,所形成和使用的數(shù)據(jù)集質(zhì)量相差較大。若研究者無(wú)法察覺到這些數(shù)據(jù)在使用過(guò)程中可能存在的問(wèn)題,將會(huì)對(duì)實(shí)證研究的結(jié)果產(chǎn)生不確定影響,甚至導(dǎo)致錯(cuò)誤結(jié)論。已有研究存在以下主要問(wèn)題:第一,在目前的相關(guān)研究中,由于不同省份政府采購(gòu)信息披露程度不同,中國(guó)政府采購(gòu)數(shù)據(jù)在時(shí)間上的合理使用范圍并沒有達(dá)成一致。部分研究采用2015 年財(cái)政部《關(guān)于做好政府采購(gòu)信息公開工作的通知》文件發(fā)布之后的采購(gòu)公告進(jìn)行研究,另一部分則仍然使用2015 年之前的數(shù)據(jù)信息,而2015 年前后之間由于采購(gòu)信息公開政策的變化,可能導(dǎo)致樣本的代表性不同。第二,同類型研究之間使用的政府采購(gòu)公告樣本量差異較大,并且缺乏明確的說(shuō)明。第三,對(duì)于政府采購(gòu)數(shù)據(jù)與其他數(shù)據(jù)庫(kù)之間的匹配問(wèn)題、特殊訂單數(shù)據(jù)的處理及數(shù)據(jù)剔除等問(wèn)題并沒有界定清楚。鑒于此,本文首先回顧了相關(guān)研究對(duì)于中國(guó)政府采購(gòu)公告數(shù)據(jù)的使用現(xiàn)狀,并據(jù)此詳細(xì)說(shuō)明目前研究中存在的數(shù)據(jù)問(wèn)題;然后針對(duì)這些問(wèn)題,對(duì)中國(guó)政府采購(gòu)數(shù)據(jù)的公開政策過(guò)程、基本信息、地方政府上傳情況進(jìn)行梳理;整理了截至2021 年底中國(guó)政府采購(gòu)網(wǎng)上可獲得的全部1 300 余萬(wàn)份采購(gòu)公告,展示了各省份歷年采購(gòu)中標(biāo)公告數(shù)量的分布,發(fā)現(xiàn)其呈現(xiàn)明顯的空間集聚特征。本文還整理了各省級(jí)政府采購(gòu)分網(wǎng)中采購(gòu)中標(biāo)(成交)公告的樣本信息,通過(guò)與中國(guó)政府采購(gòu)網(wǎng)信息進(jìn)行比對(duì),發(fā)現(xiàn)采購(gòu)公告上傳率在2015 年財(cái)政部相關(guān)采購(gòu)信息發(fā)布文件出臺(tái)之后大幅上升至80%以上,因此采用2015 年以后的中國(guó)政府采購(gòu)數(shù)據(jù)進(jìn)行研究更為合適。本文還針對(duì)特殊類型公告的識(shí)別與清理、缺失字段的補(bǔ)充、采購(gòu)金額變量的提取以及同區(qū)域和企業(yè)層面數(shù)據(jù)庫(kù)之間的匹配進(jìn)行了總結(jié)與討論。
二、政府采購(gòu)數(shù)據(jù)使用現(xiàn)狀
隨著政府采購(gòu)規(guī)模的逐步增加,中國(guó)政府采購(gòu)網(wǎng)披露的信息越來(lái)越豐富。近年來(lái)一些學(xué)者也關(guān)注到中國(guó)政府采購(gòu)數(shù)據(jù),但由于文本數(shù)據(jù)半結(jié)構(gòu)化、高維、數(shù)據(jù)量大的特性,該數(shù)據(jù)在文本的整理、關(guān)鍵變量識(shí)別與關(guān)鍵變量提取方面存在著不小的難度,目前而言使用該數(shù)據(jù)的研究并沒有很多。
在目前的相關(guān)研究文獻(xiàn)中,創(chuàng)新是最受到研究者關(guān)注的主題之一。有市場(chǎng)需求就會(huì)帶來(lái)創(chuàng)新(Edler 和Georghiou,2007),而政府采購(gòu)正是創(chuàng)造這一需求的關(guān)鍵因素。姜愛華和費(fèi)堃桀(2021)手工整理了2015-2019年的政府采購(gòu)數(shù)據(jù),利用公告中供應(yīng)商的名稱與上市公司全稱進(jìn)行匹配,剔除重要財(cái)務(wù)指標(biāo)缺失的樣本并進(jìn)行縮尾處理,最終得到了13004個(gè)企業(yè)年度觀測(cè)值,發(fā)現(xiàn)企業(yè)獲得政府采購(gòu)訂單能夠顯著促進(jìn)企業(yè)創(chuàng)新。基于分行業(yè)視角,肖建華和謝璐華(2020)利用中國(guó)政府采購(gòu)網(wǎng)2013-2017年的174 718 份采購(gòu)合同,以其采購(gòu)合同的金額的對(duì)數(shù)衡量政府采購(gòu)政策,探究在不同競(jìng)爭(zhēng)強(qiáng)度的行業(yè)中,政府采購(gòu)政策對(duì)于創(chuàng)新影響的省際差異。武威和劉玉廷(2020)基于本地政府與異地政府的視角,將2015-2017 年中國(guó)政府采購(gòu)數(shù)據(jù)與企查查等企業(yè)數(shù)據(jù)匹配,剔除樣本中包含的非企業(yè)供應(yīng)商與供應(yīng)商信息不完整樣本,最終得到15948份采購(gòu)公告,發(fā)現(xiàn)本地政府采購(gòu)與異地政府采購(gòu)對(duì)企業(yè)創(chuàng)新產(chǎn)生不同的效應(yīng)。聚焦于中國(guó)人工智能的創(chuàng)新,Beraja等(2020)基于2013-2019 年290 余萬(wàn)份政府采購(gòu)合同,與中國(guó)人工智能企業(yè)進(jìn)行名單匹配,得到28023份政府人臉識(shí)別采購(gòu)合同樣本,發(fā)現(xiàn)政府采購(gòu)對(duì)人臉識(shí)別相關(guān)的人工智能專利的增長(zhǎng)起到了推動(dòng)作用。
在政企關(guān)系研究方面,F(xiàn)ang等(2022)利用中國(guó)政府采購(gòu)網(wǎng)2013-2020年的380余萬(wàn)份采購(gòu)公告與工商注冊(cè)企業(yè)數(shù)據(jù)進(jìn)行匹配,發(fā)現(xiàn)當(dāng)本地官員處于激烈的政治競(jìng)爭(zhēng)中時(shí),本地政府將更少地向競(jìng)爭(zhēng)地區(qū)的企業(yè)進(jìn)行采購(gòu),這造成了市場(chǎng)分割,影響了資源分配。Lu 和Wang(2022)則利用中國(guó)政府采購(gòu)網(wǎng)2016-2020年數(shù)據(jù)與上市公司匹配,獲取了93917份政府上市公司采購(gòu)合同,分析發(fā)現(xiàn)政治關(guān)聯(lián)對(duì)企業(yè)獲得政府采購(gòu)合同存在顯著積極的影響,經(jīng)濟(jì)意義上看,存在政治關(guān)聯(lián)的企業(yè)會(huì)多獲得約1537萬(wàn)元政府采購(gòu)合同。
還有研究關(guān)注于政府采購(gòu)作為政府影響企業(yè)的一種手段對(duì)于社會(huì)公共價(jià)值的作用,如政府采購(gòu)影響企業(yè)履行企業(yè)社會(huì)責(zé)任(韓旭和武威,2021)、中國(guó)特色精準(zhǔn)扶貧(武威等,2022)、經(jīng)濟(jì)發(fā)展(武威和劉國(guó)平,2021)等。此外,還有研究單獨(dú)使用政府采購(gòu)數(shù)據(jù)測(cè)量經(jīng)濟(jì)生產(chǎn)生活。江鴻澤和梁平漢(2022)基于政府采購(gòu)公告整理了各地的公共視頻監(jiān)控系統(tǒng)使用情況,Liu 等(2022)則抓取了2013-2021 年超過(guò)350 萬(wàn)份政府采購(gòu)公告,用以識(shí)別企業(yè)的政治聯(lián)系。
這些研究對(duì)于中國(guó)政府采購(gòu)數(shù)據(jù)的使用沒有達(dá)成一致。首先,對(duì)于中國(guó)政府采購(gòu)公告的使用時(shí)間范圍不一致,部分研究以《關(guān)于做好政府采購(gòu)信息公開工作的通知》(財(cái)庫(kù)[2015]135 號(hào))文件中新的信息公開要求為依據(jù),使用文件頒布后的樣本,認(rèn)為這部分樣本更齊全,但另外一部分研究仍然使用2015 年之前的樣本進(jìn)行分析。其次,各類研究所涉及到的樣本量相差較大,具體從千位至百萬(wàn)級(jí)樣本不等。某些研究者還使用數(shù)據(jù)服務(wù)公眾號(hào)所提供的政府采購(gòu)合同樣本作為數(shù)據(jù)來(lái)源,其數(shù)據(jù)整理形成過(guò)程和樣本量存疑,整體不可靠,樣本缺失嚴(yán)重,不足以支持嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)研究。最后,對(duì)于政府采購(gòu)數(shù)據(jù)與其他數(shù)據(jù)庫(kù)之間匹配的原則、樣本剔除的原因及特殊合同處理①等數(shù)據(jù)預(yù)處理問(wèn)題并沒有界定清楚。例如,很多文章使用合同數(shù)量作為研究對(duì)象,但是對(duì)于一個(gè)采購(gòu)公告中包含多個(gè)分包合同項(xiàng)目時(shí)是否進(jìn)行拆分合同處理并未界定。
三、政府采購(gòu)數(shù)據(jù)公開相關(guān)政策
從政府采購(gòu)制度的發(fā)展來(lái)看,我國(guó)的政府采購(gòu)制度始于1995年在上海、深圳等地區(qū)的試點(diǎn)。1999年財(cái)政部頒布的《政府采購(gòu)管理暫行辦法》與《政府采購(gòu)運(yùn)行規(guī)程暫行規(guī)定》等,使得政府采購(gòu)制度逐步完善。圖1 展示了政府采購(gòu)信息公開政策的發(fā)展過(guò)程。
為加強(qiáng)政府采購(gòu)信息公告管理,提高政府采購(gòu)工作的透明度,便于公眾和有關(guān)部門實(shí)施監(jiān)督,根據(jù)《政府采購(gòu)管理暫行辦法》和《政府采購(gòu)招標(biāo)投標(biāo)管理暫行辦法》的有關(guān)規(guī)定,中華人民共和國(guó)財(cái)政部于2000年9月11日制定了《政府采購(gòu)信息公告管理辦法》。該辦法共分為五個(gè)章節(jié),分別為第一章總則,主要闡述信息公開的原則與監(jiān)管工作的規(guī)定;第二章信息公告管理,對(duì)信息發(fā)布的渠道以及各類信息的發(fā)布格式進(jìn)行了詳細(xì)的界定;第三章信息公告程序,注明了對(duì)信息提交、發(fā)布與修改的流程;第四章違規(guī)處罰,羅列了在政府采購(gòu)工作過(guò)程中可能存在的違規(guī)行為以及懲治措施;第五章附則,規(guī)定了中央部門政府采購(gòu)信息公告管理工作按照該辦法執(zhí)行,并于發(fā)布之日2000年9月11日起生效。
同年,為加強(qiáng)政府采購(gòu)信息網(wǎng)絡(luò)建設(shè),在全國(guó)范圍內(nèi)建立起統(tǒng)一、規(guī)范的政府采購(gòu)信息發(fā)布渠道,提高政府采購(gòu)工作的公開性和透明度,財(cái)政部于2000年12月31日正式開通“中國(guó)政府采購(gòu)網(wǎng)”,并于2001 年上半年為各地方政府開通了中國(guó)政府采購(gòu)網(wǎng)的各地方分網(wǎng)。2001年開始,各地方政府陸續(xù)開始在“中國(guó)政府采購(gòu)網(wǎng)”上公布采購(gòu)信息,但2001年僅有6條采購(gòu)公告的公布,隨后2002年以及2003年雖然公布采購(gòu)公告數(shù)量分別達(dá)到了5735條與10263條,但這與全國(guó)總體政府采購(gòu)數(shù)量依舊相差甚遠(yuǎn)。2004年9月11日,財(cái)政部廢除了2000年9月11日頒布實(shí)施的《政府采購(gòu)信息公告管理辦法》,并同時(shí)頒布了新的《政府采購(gòu)信息公告管理辦法》。
2004年的管理辦法主要在進(jìn)一步規(guī)范政府采購(gòu)信息發(fā)布媒體上做了新的規(guī)定。第一,對(duì)于發(fā)布信息平臺(tái)進(jìn)行了更加嚴(yán)格的規(guī)定,尤其是對(duì)于地方政府,要求“地方的政府采購(gòu)信息可以同時(shí)在其省級(jí)財(cái)政部門指定的政府采購(gòu)信息發(fā)布媒體上公告”。而2000年的管理辦法則指出地方政府可以自行指定發(fā)布平臺(tái),規(guī)定“省級(jí)政府采購(gòu)管理機(jī)構(gòu)還可以指定其他報(bào)刊和網(wǎng)絡(luò)等媒介公告信息”。第二,要求更全面更透明地發(fā)布各類公告。例如在中標(biāo)信息中,2004年的文件要求對(duì)于評(píng)委會(huì)成員名單完全公布,并且新增了對(duì)于投訴處理決定公告的發(fā)布要求。第三,新管理辦法中新增單獨(dú)一章,內(nèi)容是關(guān)于政府采購(gòu)信息指定媒體的管理,對(duì)于發(fā)布媒體的管理流程以及管理過(guò)程中可能存在的違規(guī)行為進(jìn)行說(shuō)明。
為深入貫徹落實(shí)黨的十八屆三中、四中全會(huì)精神,按照深化財(cái)稅體制改革、實(shí)施公開透明預(yù)算制度的總體部署,財(cái)政部于2015年7月24日發(fā)布了《關(guān)于做好政府采購(gòu)信息公開工作的通知》(財(cái)庫(kù)[2015]135 號(hào)),文件對(duì)于政府采購(gòu)信息的公開渠道進(jìn)行了更加嚴(yán)格的規(guī)定:“為了便于政府采購(gòu)當(dāng)事人獲取信息,在其他政府采購(gòu)信息發(fā)布媒體公開的政府采購(gòu)信息應(yīng)當(dāng)同時(shí)在中國(guó)政府采購(gòu)網(wǎng)發(fā)布?!痹撘?guī)定確定了中國(guó)政府采購(gòu)網(wǎng)為政府采購(gòu)信息發(fā)布的總平臺(tái)的功能。2017年5月8日財(cái)政部發(fā)布《關(guān)于進(jìn)一步做好政府采購(gòu)信息公開工作有關(guān)事項(xiàng)的通知》,再次強(qiáng)調(diào)了對(duì)于財(cái)庫(kù)[2015]135號(hào)文件規(guī)定的執(zhí)行,并在此基礎(chǔ)上加強(qiáng)對(duì)政府采購(gòu)信息公開工作的考核與監(jiān)督,其中包括加強(qiáng)監(jiān)督檢查、實(shí)施動(dòng)態(tài)監(jiān)管和大數(shù)據(jù)分析以及委托第三方開展評(píng)估。2019年1月8日,財(cái)政部國(guó)庫(kù)司公開了第三方委托機(jī)構(gòu)對(duì)于政府采購(gòu)信息公開情況的評(píng)估結(jié)果,結(jié)果顯示政府采購(gòu)?fù)该鞫瘸掷m(xù)提升,但部分地方政府采購(gòu)信息公開仍然存在薄弱環(huán)節(jié),這主要體現(xiàn)在地區(qū)間差異較大、采購(gòu)項(xiàng)目信息細(xì)節(jié)公開還存在欠缺、部分地區(qū)網(wǎng)站服務(wù)功能仍然不完善。
2019年11月27日,財(cái)政部對(duì)2004年頒布的《政府采購(gòu)信息公告管理辦法》作了修訂,新辦法于2020年3月1日起實(shí)施。此次修訂的主要內(nèi)容包括了四大方面:一是,關(guān)注信息發(fā)布管理。刪除了上一版本中有關(guān)政府采購(gòu)信息公開范圍和內(nèi)容的具體規(guī)定,重點(diǎn)對(duì)政府采購(gòu)信息發(fā)布行為進(jìn)行規(guī)范。二是,剔除與政策法規(guī)文件不一致的內(nèi)容。比如依照政府采購(gòu)法有關(guān)集中采購(gòu)目錄及標(biāo)準(zhǔn)由國(guó)務(wù)院和省級(jí)人民政府公布的規(guī)定,而在上一版中注明的卻是關(guān)于集中采購(gòu)目錄及標(biāo)準(zhǔn)由財(cái)政部門公告的規(guī)定。三是,明確財(cái)政部門的信息發(fā)布責(zé)任。規(guī)定除政府采購(gòu)項(xiàng)目信息外,監(jiān)督檢查處理結(jié)果、集中采購(gòu)機(jī)構(gòu)考核結(jié)果等監(jiān)管信息也應(yīng)在指定媒體上公告。四是,突出網(wǎng)絡(luò)公開主渠道作用。將中國(guó)政府采購(gòu)網(wǎng)及其省級(jí)分網(wǎng)明確為政府采購(gòu)信息的匯總平臺(tái),要求政府采購(gòu)信息應(yīng)當(dāng)在中國(guó)政府采購(gòu)網(wǎng)或其省級(jí)分網(wǎng)發(fā)布,同時(shí)刪除了上一版本中明顯指向報(bào)紙、雜志等紙質(zhì)媒體的規(guī)定。
通過(guò)回顧相關(guān)政策不難看出,隨著中國(guó)政府采購(gòu)體系的逐漸完善,政府對(duì)于采購(gòu)信息的公開度、透明度、完善程度、監(jiān)督力度都提出了更高的要求。除去以上政策文件,還有一些政策文件也涉及關(guān)于信息公開的要求,例如《財(cái)政部關(guān)于中國(guó)政府采購(gòu)網(wǎng)有關(guān)管理問(wèn)題的通知》(財(cái)庫(kù)[2000]28 號(hào))、《中華人民共和國(guó)政府采購(gòu)法》總則第十一條指明政府采購(gòu)信息應(yīng)當(dāng)及時(shí)發(fā)布在指定媒體上以及《政府采購(gòu)公告和公示信息格式規(guī)范(2020 年版)》對(duì)公開信息進(jìn)行格式規(guī)范化等。本文僅就對(duì)采購(gòu)數(shù)據(jù)質(zhì)量影響最大的幾個(gè)政策文件進(jìn)行論述。
四、政府采購(gòu)數(shù)據(jù)庫(kù)基
本信息本節(jié)主要介紹中國(guó)政府采購(gòu)數(shù)據(jù)的基本情況。中國(guó)政府采購(gòu)網(wǎng)(www.ccgp.gov.cn)是由國(guó)家財(cái)政部建設(shè)的網(wǎng)站,它的數(shù)據(jù)來(lái)源于中央各部門的公開采購(gòu)公告以及各地方政府上傳的采購(gòu)公告,時(shí)間跨度為2001年至今。截至2021年12月31日,中國(guó)政府采購(gòu)網(wǎng)發(fā)布的采購(gòu)公告為1330余萬(wàn)條(其中PPP 項(xiàng)目約2萬(wàn))①。采購(gòu)公告共分為12種公告類型以及PPP項(xiàng)目公告,這12 種公告類型分別為:公開招標(biāo)公告、詢價(jià)公告、競(jìng)爭(zhēng)性談判公告、單一來(lái)源公告、資格預(yù)審公告、邀請(qǐng)公告、中標(biāo)公告、更正公告、其他公告、競(jìng)爭(zhēng)性磋商公告、成交公告、終止公告。占比較多的分別為中標(biāo)公告(30.8%)、公開招標(biāo)(26.11%)、更正公告(8.85%)以及競(jìng)爭(zhēng)性談判公告(7.46%)。根據(jù)《政府采購(gòu)非招標(biāo)采購(gòu)方式管理辦法》,中標(biāo)公告為一般招標(biāo)方式交易達(dá)成結(jié)果公告;而成交公告為非招標(biāo)采購(gòu)方式交易達(dá)成結(jié)果公告,如競(jìng)爭(zhēng)性談判、單一來(lái)源采購(gòu)和詢價(jià)采購(gòu)方式。
除對(duì)于采購(gòu)公告按照類型進(jìn)行細(xì)分,中國(guó)政府采購(gòu)網(wǎng)還將公告分為中央公告與地方公告兩種類別,其中中央公告與地方公告分別占比5.38%和94.62%。針對(duì)采購(gòu)項(xiàng)目具體類型,細(xì)分為貨物類、工程類和服務(wù)類三類品目,并為公告標(biāo)注采購(gòu)所屬地區(qū)(省、自治區(qū)、直轄市)。但是,中國(guó)政府采購(gòu)網(wǎng)未對(duì)每一條政府采購(gòu)公告都做出如此清晰的標(biāo)記,部分公告在采購(gòu)所屬地以及采購(gòu)項(xiàng)目的品類信息方面存在缺失。
根據(jù)政府采購(gòu)項(xiàng)目公開信息要求,我們對(duì)主要的幾種公告所需包含的信息進(jìn)行說(shuō)明,如表1 所示。通過(guò)對(duì)各類政府采購(gòu)公告發(fā)布內(nèi)容的梳理,我們歸納出其中一些關(guān)鍵信息,同時(shí)列舉一些特殊情況:
第一,采購(gòu)人信息與代理機(jī)構(gòu)信息。各類公告均要求對(duì)于采購(gòu)人與代理機(jī)構(gòu)的名稱、地址以及聯(lián)系方式進(jìn)行披露。利用采購(gòu)人與代理機(jī)構(gòu)的名稱、地址以及聯(lián)系方式等信息有助于我們匹配到具體的政府部門或地區(qū)層面的信息,如與城市統(tǒng)計(jì)年鑒信息進(jìn)行匹配等。
第二,采購(gòu)項(xiàng)目信息。雖然采購(gòu)項(xiàng)目信息在各類公告中呈現(xiàn)的形式不一,但公告均需注明所需采購(gòu)項(xiàng)目的詳情。例如,項(xiàng)目名稱、金額(預(yù)算金額/中標(biāo)金額)、數(shù)量、規(guī)格、供應(yīng)商的資格要求等。這些信息可以幫助我們掌握采購(gòu)的規(guī)模,了解采購(gòu)項(xiàng)目的類型(貨物類、工程類或服務(wù)類)。值得注意的是,采購(gòu)公告中也存在著一些特殊的案例,部分涉密公告并未公開采購(gòu)方與供應(yīng)商信息。
第三,供應(yīng)商信息。供應(yīng)商信息一般包括供應(yīng)商名稱、供應(yīng)商地址與聯(lián)系方式,利用供應(yīng)商名稱與供應(yīng)商地址可以與現(xiàn)有數(shù)據(jù)庫(kù)中企業(yè)經(jīng)營(yíng)狀況等信息進(jìn)行匹配。但供應(yīng)商信息僅在部分類型公告中才存在,如中標(biāo)、成交公告以及單一來(lái)源公告。
我們對(duì)于中國(guó)政府采購(gòu)網(wǎng)2001年至2021年期間各類型公告的樣本進(jìn)行了收集并整理匯總,詳見附錄。為了解各地方政府采購(gòu)情況,本文以2013-2021年采購(gòu)中標(biāo)公告為例,針對(duì)中標(biāo)公告中的采購(gòu)方地址進(jìn)行了計(jì)算機(jī)自然語(yǔ)言識(shí)別并歸納,部分公告中未涉及到采購(gòu)方詳細(xì)地址的,本文以高德地圖查詢采購(gòu)單位并對(duì)地址進(jìn)行補(bǔ)充,最終展示了歷年地方政府采購(gòu)中標(biāo)數(shù)量前五名與后五名地區(qū),如表2所示。
總體來(lái)看,隨著時(shí)間的推移,大部分地方政府的采購(gòu)數(shù)量不斷增加。各省份采購(gòu)量增速平穩(wěn),購(gòu)買行為的地區(qū)特征明顯,與經(jīng)濟(jì)增長(zhǎng)情況、行政區(qū)劃和人口數(shù)量等特征存在重合。東部沿海城市的采購(gòu)量高于中西部城市,并在東部地區(qū)呈現(xiàn)出一定程度的空間聚集,在環(huán)珠三角和環(huán)京津冀地區(qū)的采購(gòu)量也明顯高于其他東部地區(qū),而在西部地區(qū),沒有出現(xiàn)此類聚集現(xiàn)象。此外,在東部地區(qū),地級(jí)市數(shù)量較多的廣東省、山東省、河南省采購(gòu)量均大于全國(guó)其他省份。最后,人口密集的省份,采購(gòu)需求明顯高于全國(guó)其他城市,廣東省、山東省、河南省、河北省等人口大省采購(gòu)量長(zhǎng)期位于高位。這與財(cái)政支出的省級(jí)層面分布也是比較一致的。
五、各地政府采購(gòu)數(shù)據(jù)上傳情況
財(cái)政部于2015年發(fā)布的《關(guān)于做好政府采購(gòu)信息公開工作的通知》(財(cái)庫(kù)[2015]135號(hào))對(duì)地方政府采購(gòu)數(shù)據(jù)的上傳匯總進(jìn)行了一定程度的規(guī)范化,部分已有研究也以此為依據(jù)進(jìn)行研究樣本的選擇,但各地方省級(jí)政府的執(zhí)行情況例如執(zhí)行力度、上傳數(shù)據(jù)情況是否在2015年前后有較大變化仍值得細(xì)究。由于各地方采購(gòu)網(wǎng)站對(duì)于采購(gòu)公告的分類標(biāo)準(zhǔn)不一,但對(duì)于中標(biāo)(成交)公告的分類卻頗為一致,并且中標(biāo)(成交)公告體現(xiàn)了實(shí)際發(fā)生的政府與企業(yè)之間的交易行為,為此,在接下來(lái)的討論中,本文將集中以中標(biāo)(成交)公告為例進(jìn)行討論。
表3整理了各省級(jí)政府采購(gòu)分網(wǎng)政府采購(gòu)中標(biāo)(成交)公告的起始發(fā)布時(shí)間以及可以獲取的總樣本量。由于各地政府網(wǎng)站更新和運(yùn)營(yíng)商更換,不同地方采購(gòu)分網(wǎng)現(xiàn)可追溯時(shí)間不一。重慶市于2007年6月7日在重慶市政府采購(gòu)網(wǎng)發(fā)布的中標(biāo)(成交)公告是截至目前可在互聯(lián)網(wǎng)上追溯的最早的地方中標(biāo)公告;而北京市政府采購(gòu)網(wǎng)只能追溯到2022年初。從發(fā)布公告數(shù)量上看,政府采購(gòu)地方分網(wǎng)中山東省發(fā)布公告數(shù)量最多,從2015年1月29日至2020年5月30日發(fā)布了56萬(wàn)多條采購(gòu)中標(biāo)(成交)公告,而寧夏則發(fā)布公告數(shù)量相對(duì)較少,從2016年3月24日至2022年5月30日僅發(fā)布了6000多條采購(gòu)中標(biāo)(成交)公告。由此可見,就目前可查詢到的信息而言,各個(gè)地區(qū)之間的政府采購(gòu)信息公布的可查詢的時(shí)間范圍和公布的采購(gòu)信息量相差較大。
為比較2015年財(cái)庫(kù)[2015]135號(hào)文件發(fā)布前后中國(guó)政府采購(gòu)網(wǎng)上各地方政府招標(biāo)信息上傳情況的變化,本文基于公告的可獲得性(參考表3),同時(shí)考慮公告的可追溯時(shí)間,在各地區(qū)分別選擇一個(gè)省份(自治區(qū)/直轄市)①的地方政府采購(gòu)公告樣本與中國(guó)政府采購(gòu)網(wǎng)數(shù)據(jù)比對(duì),探究2015年前后地方政府采購(gòu)公告數(shù)據(jù)上傳是否存在顯著的增長(zhǎng)。具體操作如下:第一,收集并整理對(duì)應(yīng)省份的中標(biāo)(成交)公告完整信息。第二,在2013-2016年間逐年隨機(jī)抽取1000份樣本。第三,提取公告中項(xiàng)目編號(hào)與中國(guó)政府采購(gòu)總網(wǎng)中的項(xiàng)目編號(hào)進(jìn)行匹配,對(duì)于項(xiàng)目編號(hào)缺失的樣本,通過(guò)利用標(biāo)題文本相似度進(jìn)行匹配,最終計(jì)算年度的上傳率。如此重復(fù)步驟二和步驟三100次,最終結(jié)果如圖4 所示。圖中某一個(gè)點(diǎn)的縱坐標(biāo)代表某一年隨機(jī)抽取樣本計(jì)算得到的上傳率??傮w來(lái)看,2013年地方政府采購(gòu)公告上傳率僅為50%左右,而2014 年后地方政府公告信息上傳率顯著增加,超過(guò)70%,2016年更超過(guò)了80%。一方面,這驗(yàn)證了《關(guān)于做好政府采購(gòu)信息公開工作的通知》(財(cái)庫(kù)① 分[2015]135號(hào))文件起到的規(guī)范作用;另一方面,這說(shuō)明2015 年之前中國(guó)政府采購(gòu)網(wǎng)中地方政府采購(gòu)公告信息缺失較為嚴(yán)重,而2015年后的樣本相對(duì)更完整,驗(yàn)證了部分已有研究采用2015年之后樣本的可靠性。
為保證地方政府采購(gòu)信息上傳至中國(guó)政府采購(gòu)網(wǎng)的規(guī)范化與效率化,財(cái)政部于2014 年進(jìn)行了網(wǎng)站系統(tǒng)劃分的工程,這為2015 年中央規(guī)范地方政府采購(gòu)信息上傳的行為奠定了技術(shù)基礎(chǔ)。擁有更便捷的上傳系統(tǒng)便解釋了為何2014 年與2015 年地方政府采購(gòu)信息上傳率差異并不大:便捷的系統(tǒng)更有利于地方采購(gòu)信息上傳;地方政府通過(guò)采購(gòu)網(wǎng)站的變化提前感知到中央升級(jí)系統(tǒng)的目的,并提前采取行為以符合中央規(guī)定。因此,在研究中使用2014 年政府采購(gòu)公告數(shù)據(jù)在一定程度上也是可以接受的。
六、政府采購(gòu)數(shù)據(jù)使用過(guò)程中的挑戰(zhàn)
中國(guó)政府采購(gòu)數(shù)據(jù)以其樣本量大、采購(gòu)內(nèi)容多樣等特點(diǎn)給應(yīng)用計(jì)量的研究者提供了很多寶貴素材,但是該數(shù)據(jù)在應(yīng)用到研究過(guò)程中也存在諸多問(wèn)題。我們嘗試?yán)脭?shù)據(jù)處理經(jīng)驗(yàn),對(duì)處理過(guò)程中可能存在的樣本選擇、指標(biāo)缺失、變量提取和數(shù)據(jù)匹配問(wèn)題進(jìn)行說(shuō)明,并提出可供參考的處理手段與方法,目的是給數(shù)據(jù)使用者提供解決問(wèn)題的方法建議與思路指引。
(一)樣本問(wèn)題
第一個(gè)問(wèn)題是對(duì)于特殊公告樣本的識(shí)別與提取。對(duì)于實(shí)證研究而言,拿到一份數(shù)據(jù)最開始的工作通常是針對(duì)研究問(wèn)題,對(duì)數(shù)據(jù)進(jìn)行清理。中國(guó)政府采購(gòu)網(wǎng)雖然對(duì)于公告類型有著詳細(xì)的分類,但其中也存在著分類不準(zhǔn)確的情況。例如,在中標(biāo)公告這一分類中會(huì)摻雜著招標(biāo)失敗公告。在進(jìn)行地方政府本地與異地采購(gòu)行為等涉及到合同數(shù)量的研究時(shí),就有必要在中標(biāo)公告中識(shí)別和篩選這些招標(biāo)失敗公告,剔除流標(biāo)公告①。通過(guò)對(duì)中國(guó)政府采購(gòu)網(wǎng)2013年1月1日至2021年12月31日所有中標(biāo)公告核對(duì),我們發(fā)現(xiàn)中標(biāo)公告中流標(biāo)公告約占7%。
第二個(gè)問(wèn)題是樣本缺失。財(cái)政部財(cái)庫(kù)[2015]135號(hào)文件中,規(guī)定了對(duì)于地方采購(gòu)數(shù)據(jù)上傳的流程,其中規(guī)定“為了便于政府采購(gòu)當(dāng)事人獲取信息,在其他政府采購(gòu)信息發(fā)布媒體公開的政府采購(gòu)信息應(yīng)當(dāng)同時(shí)在中國(guó)政府采購(gòu)網(wǎng)發(fā)布”。這意味著2015 年之前財(cái)政部對(duì)于地方政府采購(gòu)公告并未做出強(qiáng)制集中上傳的規(guī)定,因此這一期間中國(guó)政府采購(gòu)網(wǎng)中的采購(gòu)公告存在樣本缺失問(wèn)題。根據(jù)本文第四部分的分析與比較,我們建議研究采用2015 年及之后的中標(biāo)(成交)公告樣本。
(二)定義指標(biāo)缺失
中國(guó)政府采購(gòu)網(wǎng)對(duì)于公告的已有定義字段包括公告類型、上傳時(shí)間(精確至分秒)、采購(gòu)人、代理機(jī)構(gòu)、進(jìn)行采購(gòu)的地區(qū)(省、直轄市、自治區(qū))、采購(gòu)的品目類型。但網(wǎng)站并不會(huì)對(duì)于每條公告都清晰描述了這些字段,可能會(huì)存在部分字段的缺失。對(duì)于某些研究而言,這些指標(biāo)可能是不可或缺的。
我們嘗試提供對(duì)于存在缺失的字段進(jìn)行補(bǔ)充的方法。首先,如果缺失的字段是進(jìn)行采購(gòu)的地區(qū),對(duì)于政府采購(gòu)公告而言,公告的標(biāo)題或是公告具體內(nèi)容中通常會(huì)注明采購(gòu)方地址,研究者就相應(yīng)的地理信息進(jìn)行識(shí)別提取即可,對(duì)于公告中無(wú)采購(gòu)方地址信息的,我們建議利用地圖定位采購(gòu)單位來(lái)識(shí)別地址信息。其次,如果缺失的字段是采購(gòu)的品目,中國(guó)政府采購(gòu)網(wǎng)對(duì)于采購(gòu)的品目大致分為貨物類、工程類以及服務(wù)類三種大的類型,但是部分公告分類存在兩種特殊情況:第一,部分公告會(huì)在這三類的基礎(chǔ)上再進(jìn)行更細(xì)致的類型劃分,例如,貨物類/通用設(shè)備/辦公設(shè)備/投影儀,當(dāng)然也不是對(duì)于品目的分類越細(xì)致越好,如何選擇分類層級(jí)取決于具體的研究問(wèn)題,根據(jù)研究需要提取對(duì)應(yīng)的分類層級(jí)。第二,存在缺失該品目分類字段的問(wèn)題。對(duì)于缺失的情況,可供參考的解決辦法為采用自然語(yǔ)言處理的方式,利用機(jī)器學(xué)習(xí)進(jìn)行文本分類,如Beraja 等(2020)對(duì)于人臉識(shí)別系統(tǒng)相應(yīng)采購(gòu)的分類;如若研究所需樣本不大,可以以人工整理替代。
(三)文本變量提取
除了中國(guó)政府采購(gòu)網(wǎng)上已經(jīng)定義的公告字段外,采購(gòu)公告中仍然有很多變量值得研究者自行提取,由于篇幅有限,本文不能對(duì)所有可能變量進(jìn)行一一論述,在此僅以研究者普遍關(guān)注的采購(gòu)金額變量為例進(jìn)行說(shuō)明。
政府采購(gòu)公告并不像各級(jí)法院的裁判文書有固定的寫作格式,各地方的公告撰寫手法、信息排列順序、命名格式等都存在不同程度的差異,這增加了變量定位、識(shí)別與提取的難度。政府采購(gòu)金額在公告文本中大致有以下幾個(gè)方面的不同:第一,金額在公告中分布的位置不同。部分公告在文本中某一處會(huì)注明預(yù)算金額或是中標(biāo)(成交)金額;部分公告則是存在多個(gè)分包的情況,公告中只寫明每個(gè)分包的金額,并無(wú)匯總金額。第二,金額的撰寫格式不一,公告中主要存在三種金額的書寫格式,分別為中文大寫數(shù)字、中文小寫數(shù)字以及阿拉伯?dāng)?shù)字。第三,金額數(shù)字的單位不統(tǒng)一。元、萬(wàn)元、百萬(wàn)元等皆有出現(xiàn),也會(huì)出現(xiàn)結(jié)算的金額貨幣的不統(tǒng)一現(xiàn)象,部分會(huì)出現(xiàn)以美元或歐元進(jìn)行結(jié)算(約占0.15%)的情況。第四,部分公告存在金額數(shù)值的明顯異常以及金額相關(guān)信息并未在公告正文予以公布的情況。這都給我們的變量提取工作帶來(lái)了很多亟待解決的難點(diǎn)。
(四)數(shù)據(jù)匹配問(wèn)題
在樣本清理與有關(guān)變量識(shí)別提取后,研究者通常會(huì)將采購(gòu)數(shù)據(jù)同與研究問(wèn)題相關(guān)的其他成熟數(shù)據(jù)庫(kù)進(jìn)行匹配。采購(gòu)數(shù)據(jù)既可以與宏觀區(qū)域?qū)用娴臄?shù)據(jù)進(jìn)行匹配,也可以與微觀企業(yè)層面的數(shù)據(jù)進(jìn)行匹配。數(shù)據(jù)與數(shù)據(jù)之間的匹配通常需要兩個(gè)數(shù)據(jù)之間存在一個(gè)或多個(gè)具有唯一識(shí)別特征的變量,然后根據(jù)該變量與年份兩個(gè)維度進(jìn)行數(shù)據(jù)匹配。例如中國(guó)工業(yè)企業(yè)數(shù)據(jù)在不同年份之間的匹配,主要依賴于企業(yè)代碼與企業(yè)名稱這兩個(gè)具有高度唯一識(shí)別特征的變量進(jìn)行匹配(Brandt 等,2012;聶輝華等,2012)。
政府采購(gòu)公告數(shù)據(jù)在與城市層面的數(shù)據(jù)進(jìn)行匹配時(shí),采購(gòu)方的地理信息即為唯一識(shí)別特征變量。但值得注意的是,部分公告由于其涉密性質(zhì),對(duì)于采購(gòu)單位與地址進(jìn)行保密,致使此類樣本無(wú)法進(jìn)行匹配。而當(dāng)政府采購(gòu)公告數(shù)據(jù)與微觀企業(yè)數(shù)據(jù)進(jìn)行信息匹配時(shí),例如天眼查數(shù)據(jù)(Beraja 等,2020),企業(yè)名稱企業(yè)地址以及企業(yè)聯(lián)系方式則為具有高度唯一識(shí)別特征的變量。但也存在一些特殊情況需要討論,例如,一個(gè)采購(gòu)公告同時(shí)涉及好幾家不同的企業(yè)的情況。此時(shí)需要根據(jù)研究問(wèn)題進(jìn)行處理,如研究問(wèn)題是地方政府本地與異地企業(yè)采購(gòu)數(shù)量差異時(shí),可采取的辦法是對(duì)該公告根據(jù)供應(yīng)商數(shù)量進(jìn)行人為的拆分。但對(duì)于大樣本的情況,人為的識(shí)別與拆分的方法便難以維持,需要借助計(jì)算機(jī)技術(shù),這同樣是數(shù)據(jù)匹配過(guò)程中的難點(diǎn)之一。
七、總結(jié)與研究展望
本文從多個(gè)方面梳理了中國(guó)政府采購(gòu)數(shù)據(jù)相關(guān)內(nèi)容以供研究討論。首先,為了幫助研究者了解中國(guó)政府采購(gòu)數(shù)據(jù),本文回顧了中國(guó)政府采購(gòu)數(shù)據(jù)的數(shù)據(jù)公開政策的發(fā)展過(guò)程,整理了截至2021年底中國(guó)政府采購(gòu)網(wǎng)全部1300余萬(wàn)份公告,采用多種文本識(shí)別方法提取了基本數(shù)據(jù)信息,并展示了各省份歷年采購(gòu)中標(biāo)公告數(shù)量的分布情況。其次,為界定中國(guó)政府采購(gòu)數(shù)據(jù)在時(shí)間上的合理使用范圍,本文通過(guò)與各省級(jí)政府采購(gòu)分網(wǎng)發(fā)布的公告進(jìn)行比對(duì),發(fā)現(xiàn)采購(gòu)公告上傳率在2015年財(cái)政部相關(guān)采購(gòu)信息發(fā)布文件出臺(tái)之后大幅上升至80%以上,因此,采用2015年以后的中國(guó)政府采購(gòu)數(shù)據(jù)進(jìn)行研究更為合適。最后,為厘清中國(guó)政府采購(gòu)公告數(shù)據(jù)的數(shù)據(jù)清理問(wèn)題,本文還針對(duì)特殊類型公告的識(shí)別與清理、缺失字段的補(bǔ)充、采購(gòu)金額變量的提取以及同區(qū)域和企業(yè)層面數(shù)據(jù)庫(kù)之間的匹配進(jìn)行了總結(jié)與討論。
中國(guó)政府采購(gòu)數(shù)據(jù)的出現(xiàn),提供了更多的研究可能,但是目前使用該數(shù)據(jù)的研究還不多。通過(guò)對(duì)文獻(xiàn)的梳理以及數(shù)據(jù)梳理過(guò)程中的經(jīng)驗(yàn)總結(jié),我們嘗試從以下幾個(gè)方面探討該數(shù)據(jù)未來(lái)可供研究的視角:第一,可從地區(qū)政府采購(gòu)層面探討地方政府行為,如Fang等(2022)探究地方政府保護(hù)主義所導(dǎo)致的市場(chǎng)分割,Liu等(2022)則度量了企業(yè)的政治聯(lián)系。第二,從采購(gòu)部門層面探討各部門行為模式,政府采購(gòu)數(shù)據(jù)為進(jìn)一步理解政府部門職能提供可能,如公共安全部門的采購(gòu)行為是否影響到地區(qū)犯罪情況(江鴻澤和梁平漢,2022)。第三,從合同層面討論特定類型采購(gòu)合同的經(jīng)濟(jì)影響,如Beraja等(2020)利用人臉識(shí)別采購(gòu)合同探究政府對(duì)于人工智能企業(yè)發(fā)展的支持。誠(chéng)然,中國(guó)政府采購(gòu)數(shù)據(jù)因其數(shù)據(jù)量大、所包含的信息量多,除上述研究視角外,其可進(jìn)行研究的主題仍有待進(jìn)一步的挖掘與豐富。