□吳 卉
經(jīng)濟普查作為一種全面統(tǒng)計調(diào)查,是一個由微觀個體數(shù)據(jù)匯總成為宏觀總量數(shù)據(jù)的調(diào)查過程。因此,經(jīng)濟普查的數(shù)據(jù)處理過程是值得重點研究的方向。本文以2018年第四次全國經(jīng)濟普查(下文簡稱“四經(jīng)普”)為基礎(chǔ),深入剖析 “四經(jīng)普” 在數(shù)據(jù)處理工作中存在的問題,認真研究新形勢下經(jīng)普數(shù)據(jù)處理工作面臨的挑戰(zhàn)和機遇,為即將到來的第五次全國經(jīng)濟普查(下文簡稱 “五經(jīng)普”)數(shù)據(jù)處理工作提出建議。
歷次經(jīng)普的數(shù)據(jù)處理方案和程序都是由國家局主導(dǎo)制定和開發(fā),并在實踐中不斷完善。經(jīng)過四次經(jīng)濟普查,數(shù)據(jù)處理工作在技術(shù)上呈現(xiàn)巨大飛躍,但也存在一些難題。
1.層級過多不利于下情上傳?!八慕?jīng)普” 《普查數(shù)據(jù)處理方案》要求經(jīng)普數(shù)據(jù)處理工作按照 “統(tǒng)一領(lǐng)導(dǎo)、分級負責(zé)” 的原則,在國務(wù)院經(jīng)普辦的統(tǒng)一領(lǐng)導(dǎo)下,由國家、省、市、縣、鄉(xiāng)五級普查機構(gòu)組織實施。這種組織結(jié)構(gòu)有利于上情下達,有利于國務(wù)院經(jīng)普辦領(lǐng)導(dǎo)各級普查機構(gòu)按照統(tǒng)一部署完成本級數(shù)據(jù)處理工作,但在基層逐級向上反映問題的過程中,層級過多導(dǎo)致信息傳遞緩慢或失真的缺點就凸顯出來。尤其在經(jīng)普初期,數(shù)據(jù)處理各種問題較多,如若下情上傳不暢,問題得不到及時解決,將不利于調(diào)動各級普查人員積極性,不利于普查工作的順利推進。
2.部門協(xié)作未充分體現(xiàn)。經(jīng)濟普查需要編制、民政、稅務(wù)、市場監(jiān)管等部門協(xié)助提供相關(guān)行政記錄,各級普查機構(gòu)要與部門建立行之有效的溝通機制,才能高質(zhì)量完成經(jīng)普數(shù)據(jù)處理工作。然而,由于職責(zé)不清晰、分工不具體等原因,經(jīng)濟普查實際上是以統(tǒng)計部門為主,其他政府部門缺乏實質(zhì)性的支持和參與。個別部門還存在協(xié)作意識淡薄的問題。例如,只提供了行政記錄數(shù)據(jù),卻不提供數(shù)據(jù)結(jié)構(gòu)的說明,統(tǒng)計人員接收數(shù)據(jù)后,要分析推測數(shù)據(jù)字段的含義,再與經(jīng)普的數(shù)據(jù)需求作對接,延誤普查進度。
國務(wù)院經(jīng)普辦統(tǒng)一組織 “四經(jīng)普” 數(shù)據(jù)處理軟件的開發(fā)工作,數(shù)據(jù)處理軟件共5 套,每套軟件又細分為多個應(yīng)用系統(tǒng),除了一套表單位數(shù)據(jù)采集處理系統(tǒng)在一直運行之外,其他系統(tǒng)幾乎都是在 “四經(jīng)普” 籌備前期開發(fā)的,未經(jīng)長時間的運行優(yōu)化,存在一定瑕疵。
1.PAD 端系統(tǒng)運行不穩(wěn)定。從普查地圖底冊推送、單位清查、正式普查登記,再到事后抽查,PAD貫穿了經(jīng)普周期的多個環(huán)節(jié)。如果前期調(diào)研不充分,PAD 上各類應(yīng)用上線初期會存在很多問題,每個應(yīng)用都要經(jīng)歷多次更新升級,隨時都會有程序更新包推送到PAD 上。此外,系統(tǒng)測試時訪問量不夠多,未能對服務(wù)器造成真正的訪問壓力。試點時能正常使用的系統(tǒng),遇到高峰節(jié)點就會出現(xiàn)響應(yīng)跟不上的情況。系統(tǒng)設(shè)計不合理,穩(wěn)定性不好,會給基層操作帶來很多困難,增加基層工作難度。
2.PAD 端與平臺系統(tǒng)數(shù)據(jù)銜接不夠好。在普查區(qū)劃分階段,普查小區(qū)的電子地圖需要先在電子地圖系統(tǒng)中繪制,再推送到PAD 中去。如果電子地圖系統(tǒng)中普查小區(qū)邊界劃分不準確,PAD 上會出現(xiàn)部分調(diào)查單位不在普查小區(qū)內(nèi)的情況,導(dǎo)致普查員無法順利采集數(shù)據(jù)。在正式登記階段,PAD 采集軟件中只加載了少量的審核公式,大量審核工作需要在數(shù)據(jù)處理系統(tǒng)中進行。采集的數(shù)據(jù)上傳系統(tǒng)后,系統(tǒng)可能出現(xiàn)大量的審核錯誤,需要再次聯(lián)系調(diào)查單位核實,引發(fā)調(diào)查單位的抵觸心理,影響普查數(shù)據(jù)的質(zhì)量。
3.資料開發(fā)軟件使用價值低。經(jīng)普資料開發(fā)時間較長,公報數(shù)據(jù)發(fā)布較晚,對政府和社會各界所關(guān)心的熱點問題響應(yīng)慢,利用經(jīng)普資料進行分析研究的時效性較差。資料開發(fā)及分析軟件匯集了歷次普查數(shù)據(jù),并向全國統(tǒng)計人員開放,數(shù)據(jù)量巨大,權(quán)限設(shè)置復(fù)雜,查詢、匯總等操作難且響應(yīng)慢,許多統(tǒng)計人員選擇其他查詢匯總工具,資料開發(fā)及分析軟件使用頻率偏低。
1.PAD 設(shè)備型號各異,性能不佳。從三經(jīng)普引入手持終端入戶采集數(shù)據(jù)開始,至今有近十年的時間。經(jīng)過反復(fù)使用、多次更新,普查員手中的設(shè)備型號各異,部分設(shè)備性能不佳。不同型號的設(shè)備在安裝程序時可能會出現(xiàn)不同的問題;設(shè)備用久之后會出現(xiàn)電池不耐用、GPS 定位不準、內(nèi)存不夠大等問題。這些問題都會導(dǎo)致經(jīng)普程序閃退或者死機。頻繁發(fā)生的故障會消磨普查員的工作熱情,降低工作效率。
2.基層電腦不達要求,設(shè)備更新缺少支持。普查區(qū)劃分與繪圖軟件需要對地圖進行渲染,對顯卡有高要求;處理部門的海量數(shù)據(jù),對CPU 和內(nèi)存有較高要求。而多數(shù)基層統(tǒng)計人員的電腦只能應(yīng)付日常辦公,達不到經(jīng)普軟件運行的最低要求,容易出現(xiàn)卡頓或者不響應(yīng)的問題?!八慕?jīng)普” 總體方案對基層數(shù)據(jù)處理環(huán)境沒有明確提出設(shè)備的配置要求,沒有文件方案的支持,各級統(tǒng)計機構(gòu)在更新設(shè)備時如得不到財政支持,將影響普查工作進展。
隨著 “放管服” 改革深入推進,新產(chǎn)業(yè)、新業(yè)態(tài)、新商業(yè)模式的不斷涌現(xiàn),市場主體數(shù)量爆發(fā)式增長,給經(jīng)濟普查帶來了新的挑戰(zhàn)。以無錫市為例,“四經(jīng)普”時無錫市共有從事二三產(chǎn)業(yè)活動的法人單位24.69 萬個,與第三次全國經(jīng)濟普查相比,增加12.02 萬個,增幅為94.8%;產(chǎn)業(yè)活動單位為26.76 萬個,增加12.78 萬個,增幅為91.5%。單位數(shù)量的激增導(dǎo)致數(shù)據(jù)采集量的增長,對數(shù)據(jù)處理能力、存儲能力提出新的要求,對統(tǒng)計基礎(chǔ)設(shè)施承載能力帶來巨大沖擊。
“五經(jīng)普” 首次整合了投入產(chǎn)出調(diào)查,在普查軟件設(shè)計、同步數(shù)據(jù)采集、跨表審核驗收等環(huán)節(jié)既要確保兩項調(diào)查一體化推進,又要兼顧兩項調(diào)查的需求,體現(xiàn)出針對性和差異性,這也給經(jīng)濟普查帶來新的挑戰(zhàn)。“四經(jīng)普” 共設(shè)計普查表式66 張,各普查表內(nèi)需填報的指標少則十余項,多則百余項,且普查表指標復(fù)雜、表間邏輯關(guān)系緊密。投入產(chǎn)出表調(diào)查內(nèi)容更細,數(shù)據(jù)指標更多,填報要求和審核要求更高??傮w上看,整合投入產(chǎn)出調(diào)查,能夠減少重復(fù)性工作,提高普查效率,實現(xiàn)總量數(shù)據(jù)與結(jié)構(gòu)數(shù)據(jù)更好銜接;但對軟件開發(fā)而言,報表數(shù)量、表內(nèi)審核成倍增長,表間審核呈幾何級增長。如何科學(xué)整合兩項調(diào)查的數(shù)據(jù)處理工作,達到事半功倍的效果,對于數(shù)據(jù)處理組來說是一項新的課題。
2020 年,受新冠肺炎疫情影響,許多重大活動取消,如何在突發(fā)性公共衛(wèi)生事件下安全開展國情國力調(diào)查,是 “五經(jīng)普” 需要充分考慮的風(fēng)險事項。普查員要逐戶入企業(yè)進行單位清查和數(shù)據(jù)采集,各級經(jīng)普辦要根據(jù)疫情防控要求,充分估計可能發(fā)生的各種情況,提前制定風(fēng)險預(yù)案,保障普查員在各種復(fù)雜的情況下安全履職盡責(zé)。數(shù)據(jù)處理組要充分調(diào)研,研究如何利用新一代信息技術(shù)優(yōu)化單位清查和數(shù)據(jù)采集方式,在確保數(shù)據(jù)質(zhì)量和信息安全前提下,為普查員提供更安全可靠、靈活便捷的數(shù)據(jù)采集渠道,確保順利完成經(jīng)普任務(wù)。
入戶難,一直是普查中最大的痛點。第七次全國人口普查(下文簡稱 “七人普”)首次嘗試引導(dǎo)調(diào)查對象通過網(wǎng)絡(luò)自主填報,有效緩解了這一問題。傳統(tǒng)的人口普查是通過普查員入戶采集住戶信息,算上摸底清查和正式登記,每個普查員至少需要入戶兩次才能完成數(shù)據(jù)采集工作。在正式登記環(huán)節(jié),利用微信小程序,引導(dǎo)調(diào)查對象進行自主填報可以減少普查員的入戶次數(shù)。無錫市部分街道 “七人普” 的自主填報率達80%,這既減輕了普查員的工作量,又減少了各類病毒交叉?zhèn)魅镜目赡苄?,保障了普查員的健康安全。
隨著數(shù)字經(jīng)濟的發(fā)展,各地在打造數(shù)字政府的過程中,積累了大量的社會經(jīng)濟數(shù)據(jù)資源。經(jīng)濟普查可以利用政府數(shù)字化轉(zhuǎn)型的成果,運用大數(shù)據(jù)、人工智能等手段,基于名錄數(shù)據(jù),以社會信用代碼為唯一識別碼,與編辦、民政和市場監(jiān)管等部門的行政記錄進行比對,確定經(jīng)普調(diào)查單位的基本信息;利用稅務(wù)和社保數(shù)據(jù),確定調(diào)查單位的行業(yè)、規(guī)模及用工等信息;利用銀行、平臺等社會數(shù)據(jù)進行智能分析,生成精確的分地區(qū)經(jīng)普清查底冊,提升單位清查效率,保障調(diào)查數(shù)據(jù)質(zhì)量,提高智能編碼精度,為順利實施經(jīng)濟普查夯實數(shù)據(jù)底座。
傳統(tǒng)的手工錄入數(shù)據(jù)費時費力,給普查員帶來很大的工作壓力??梢岳脠D像識別和語義分析技術(shù),自動識別財務(wù)系統(tǒng)中的會計科目和對應(yīng)數(shù)字,并智能填充到PAD 數(shù)據(jù)采集軟件中,普查員只需確認識別出的數(shù)字和填充位置是否正確即可,從數(shù)據(jù)采集的源頭保證信息的準確性。在數(shù)據(jù)流入數(shù)據(jù)庫的過程中,通過深度學(xué)習(xí)、智能分析等技術(shù),完成對數(shù)據(jù)的分析和行業(yè)編碼,并彌補缺失的信息。在數(shù)據(jù)庫中,大數(shù)據(jù)可以將調(diào)查單位的主營業(yè)務(wù)、財務(wù)數(shù)據(jù)和用工數(shù)據(jù)等進行關(guān)聯(lián),構(gòu)建廣泛的調(diào)查單位關(guān)聯(lián)網(wǎng)絡(luò),為后期深度挖掘經(jīng)普數(shù)據(jù)價值提供堅實的基礎(chǔ)。
1.統(tǒng)籌兩項調(diào)查,科學(xué)制定數(shù)據(jù)處理方案。按照 “統(tǒng)籌組織實施方式、統(tǒng)一設(shè)計調(diào)查表式和業(yè)務(wù)流程、科學(xué)安排各專業(yè)分工合作、實現(xiàn)經(jīng)濟普查與投入產(chǎn)出調(diào)查一體化” 的設(shè)計原則,科學(xué)制定經(jīng)濟普查方案。方案要涵蓋經(jīng)濟普查和投入產(chǎn)出調(diào)查的全部內(nèi)容,既要保障兩項調(diào)查指標的一致性,又要兼顧指標的科學(xué)性和可獲得性,結(jié)合重點反映供給側(cè)結(jié)構(gòu)性改革新進展等要求,適度增減指標,盡量縮小上級復(fù)雜設(shè)計與基層填報水平之間的差距,提高數(shù)據(jù)的準確性和使用價值。
2.兼顧工作實際,優(yōu)化數(shù)據(jù)處理組織方式。省級成立緊密型辦公室集中辦公,市級以下采用扁平化的數(shù)據(jù)處理組織模式,同時提高普查辦對相關(guān)專業(yè)科室的牽頭指揮力度。省級成立緊密型辦公室,統(tǒng)一組織實施,確保基層接到的通知、答復(fù)都出自一個 “上級機構(gòu)”?;鶎硬捎帽馄交慕M織模式,能夠詳細了解各種數(shù)據(jù)處理問題,并及時向上反映,有利于共享問題的解決,提高普查效率。
1.充分測試,完善數(shù)據(jù)處理軟件。完善的數(shù)據(jù)處理程序是保障經(jīng)普數(shù)據(jù)質(zhì)量的關(guān)鍵。要重視數(shù)據(jù)采集處理軟件的測試工作。對數(shù)據(jù)處理程序做到早設(shè)計、早測試、早完善,盡力減少程序漏洞,提升PAD端應(yīng)用的穩(wěn)定性和流暢度,提高PAD 和平臺間的數(shù)據(jù)銜接性能。不僅要解決能不能用的問題,還要解決好不好用的問題,提高經(jīng)普數(shù)據(jù)的填報效率和數(shù)據(jù)質(zhì)量。
2.提前準備,改善數(shù)據(jù)處理硬件。根據(jù)各類行政記錄,科學(xué)估計經(jīng)普的調(diào)查單位數(shù)及其行業(yè)結(jié)構(gòu)和地區(qū)分布,提前統(tǒng)計各級現(xiàn)有的PAD 數(shù)量和型號,綜合籌備PAD設(shè)備的采購和分發(fā)事宜。統(tǒng)籌各階段數(shù)據(jù)處理工作的需要,充分估計經(jīng)普的數(shù)據(jù)量,以集約、高效為原則,運用云計算技術(shù)構(gòu)建數(shù)據(jù)處理節(jié)點的基礎(chǔ)計算資源和存儲資源,積極布置改善數(shù)據(jù)處理的硬件環(huán)境。
1.利用區(qū)塊鏈技術(shù),優(yōu)化數(shù)據(jù)采集模式。通過程序向調(diào)查對象布置報表,再審核匯總是統(tǒng)計調(diào)查的主要手段,也是傳統(tǒng)的 “我布置,你填報” 的數(shù)據(jù)采集模式。“七人普” 引入網(wǎng)絡(luò)自主填報方式,豐富了采集方式,但沒有從根本上改變這種模式。這種采集模式需要調(diào)查對象的高度配合,正確理解統(tǒng)計指標,并如實填報數(shù)據(jù)。隨著區(qū)塊鏈、云計算等技術(shù)的發(fā)展,越來越多的中小企業(yè) “上云入鏈”,積極進行數(shù)字化轉(zhuǎn)型。政府統(tǒng)計可以從“云” 和 “鏈” 中采集原始數(shù)據(jù),形成 “你生成,我獲取,你確認”的采集模式。這種采集模式,不存在指標理解和如實填報的問題,不依賴調(diào)查對象的配合度,能大大提高了統(tǒng)計數(shù)據(jù)質(zhì)量。
2.利用大數(shù)據(jù)技術(shù),挖掘部門數(shù)據(jù)價值。利用大數(shù)據(jù)技術(shù),全面收集編制、民政、稅務(wù)、市場監(jiān)管等部門行政記錄,各部門的數(shù)據(jù)相互印證,建立完整準確的普查對象信息庫,為經(jīng)濟普查的清查摸底打下良好的基礎(chǔ)??茖W(xué)比對各部門行政資料,利用企查查、天眼查等便捷工具進一步補充完善相關(guān)指標,形成高質(zhì)量的清查底冊,提高清查效率。將重要財務(wù)數(shù)據(jù)嵌入到經(jīng)普采集程序中去,對誤差較大的指標作友情提示,提高普查數(shù)據(jù)質(zhì)量。
1.重視資料開發(fā),及時共享經(jīng)普成果。每次普查都會形成大量的數(shù)據(jù)資料,分組詳細、指標多樣、結(jié)構(gòu)完整,對未來經(jīng)濟社會發(fā)展的預(yù)判有重要價值。在經(jīng)普資料開發(fā)階段,要兼顧統(tǒng)計系統(tǒng)內(nèi)外,尤其是參與組織實施的其他政府部門的需求,建立經(jīng)普資料開發(fā)的應(yīng)用規(guī)范。深化和拓展經(jīng)普資料的應(yīng)用開發(fā),構(gòu)建跨部門的數(shù)據(jù)共享平臺,廣泛動員社會各方力量深度挖掘經(jīng)普資料,完善經(jīng)普數(shù)據(jù)的開放渠道和共享方式,讓相關(guān)部門和社會公眾更加及時、便捷地共享經(jīng)濟普查成果。
2.面向未來發(fā)展,貫通各統(tǒng)計應(yīng)用系統(tǒng)。數(shù)據(jù)處理工作不僅要立足當前任務(wù),更要放眼長遠發(fā)展,將各個統(tǒng)計應(yīng)用系統(tǒng)融會貫通,做好本次普查與下次普查的銜接、當前建設(shè)與長遠發(fā)展間的銜接。打通各個系統(tǒng)之間的數(shù)據(jù)關(guān)聯(lián),不僅可以為后續(xù)的普查以及常規(guī)調(diào)查提供強大的數(shù)據(jù)支撐,最終可以構(gòu)建全國統(tǒng)一的統(tǒng)計數(shù)據(jù)大平臺,更好發(fā)揮統(tǒng)計部門的 “智庫” 功能,為經(jīng)濟高質(zhì)量發(fā)展提供強大的統(tǒng)計數(shù)據(jù)服務(wù)支撐。