□ 王 婧
調(diào)查研究是我們黨的傳家寶,是一代代中國共產(chǎn)黨人從勝利走向勝利的謀事之基、成事之道。新時代新起點,調(diào)查研究更是被賦予了新的深刻內(nèi)涵和時代要求,要充分發(fā)揮數(shù)字技術(shù)推進精準調(diào)查、深度研究,不斷提升發(fā)現(xiàn)問題、分析問題、解決問題的準度、力度。2023 年3 月,中辦印發(fā)《關(guān)于在全黨大興調(diào)查研究的工作方案》(以下簡稱《方案》),《方案》強調(diào),要堅持因地制宜,綜合運用座談訪談、隨機走訪、問卷調(diào)查、專家調(diào)查、抽樣調(diào)查、統(tǒng)計分析等方式,充分運用互聯(lián)網(wǎng)、大數(shù)據(jù)等現(xiàn)代信息技術(shù)開展調(diào)查研究,提高科學(xué)性和實效性。當(dāng)前,為全面提升統(tǒng)計數(shù)據(jù)質(zhì)量,節(jié)約政府統(tǒng)計成本,行政數(shù)據(jù)在統(tǒng)計中的應(yīng)用也越來越頻繁。本文就行政大數(shù)據(jù)在統(tǒng)計調(diào)查領(lǐng)域中的應(yīng)用及在精準調(diào)查中的應(yīng)用效果進行探索分析。
在當(dāng)今信息化時代,數(shù)據(jù)已經(jīng)成為驅(qū)動社會發(fā)展的重要生產(chǎn)要素,全球范圍內(nèi)運用大數(shù)據(jù)推動經(jīng)濟發(fā)展、完善社會治理、提升政府服務(wù)和監(jiān)管能力已經(jīng)成為趨勢。政府作為最大的數(shù)據(jù)生產(chǎn)者和擁有者,在其管理過程中產(chǎn)生的行政數(shù)據(jù)在社會大數(shù)據(jù)中占有的比重最大且權(quán)威性最高。
行政大數(shù)據(jù)是政府部門在行使其行政管理職能過程中,通過審批、注冊登記等記錄的大量信息數(shù)據(jù)。一是個人信息記錄數(shù)據(jù),包括戶籍、衛(wèi)生醫(yī)療保障、教育、就業(yè)等信息。上述數(shù)據(jù)記錄主要由公安、衛(wèi)生、教育、人力資源和社會保障等部門在其行使管理職能過程中產(chǎn)生并管理。二是單位信息記錄數(shù)據(jù),包括對企業(yè)、事業(yè)和機關(guān)等單位的注冊登記記錄,主要由市場監(jiān)督、稅務(wù)、民政和編辦等部門產(chǎn)生并管理。三是自然和資源記錄數(shù)據(jù),包括氣象、地震、土地、礦產(chǎn)資源、環(huán)境資源等信息,主要由自然資源、生態(tài)環(huán)境、氣象、地震、海洋等部門產(chǎn)生并管理。四是其他管理記錄數(shù)據(jù),包括知識產(chǎn)權(quán)申報、進出口報關(guān)登記、出入境登記記錄、資質(zhì)評定、傳感器記錄等,由相關(guān)的知識產(chǎn)權(quán)、海關(guān)及資質(zhì)評定等部門產(chǎn)生并管理。
1.國外行政數(shù)據(jù)開放情況。全球開放數(shù)據(jù)運動始于美國。2009 年,奧巴馬簽署了《透明與開放政府指令》,之后美國政府“一站式數(shù)據(jù)下載”網(wǎng)站“data.gov”正式上線。這個新生網(wǎng)站從開始僅有47 組數(shù)據(jù),27 個數(shù)據(jù)分析工具到2014 年達到了88421 個數(shù)據(jù)集,囊括了交通、經(jīng)濟、醫(yī)療、教育和人口服務(wù)等方面的數(shù)據(jù),其中1279 個由政府提供,236 個由居民提供,103 個由移動設(shè)備提供。2013 年5 月奧巴馬簽署了《政府信息默認開放和機器可讀行政命令》,政府需建立一套政策框架,促進數(shù)據(jù)的可操作性和開放性,提升信息資源的利用效率和利用價值。
同樣,早在2009 年,英國在《智慧型政府的行動方案》中就把數(shù)據(jù)開放作為政府工作的重要內(nèi)容,2009 年建立的“data.gov.uk”網(wǎng)站涵蓋了七個政府部門的1000 多個對外開放有效數(shù)據(jù)集,目前已增至8633 個數(shù)據(jù)集。為了促進公共數(shù)據(jù)的開放和利用,推進公共數(shù)據(jù)開放的標準化工作,英國政府規(guī)定各領(lǐng)域政府部門需要公布政府績效和用戶滿意度的報告,如2012 年正式開放的包括學(xué)生、教師、健康等國家學(xué)生數(shù)據(jù)庫,幫助家長和學(xué)生更好監(jiān)督學(xué)校的工作。
2.國內(nèi)行政數(shù)據(jù)開放與應(yīng)用情況。我國的行政數(shù)據(jù)開放正處于探索起步階段,中國政府公開信息整合服務(wù)平臺(govinfo.nlc.cn)和新版國家統(tǒng)計數(shù)據(jù)庫(http://data.stats.gov.cn/)分別于2011 年10 月和2013 年9 月上線提供數(shù)據(jù)服務(wù)。目前,我國的行政記錄數(shù)據(jù)廣泛應(yīng)用于政府統(tǒng)計工作中,主要包括直接應(yīng)用、統(tǒng)計估算等。
行政大數(shù)據(jù)在直接應(yīng)用中具體包含三個方面。一是統(tǒng)計產(chǎn)品直接取自同一行政記錄數(shù)據(jù)源,不需要鏈接其他行政記錄數(shù)據(jù)。實踐中,直接使用行政記錄數(shù)據(jù)進行統(tǒng)計的指標包括人口性別、年齡結(jié)構(gòu)、建筑物與居住地等。二是利用行政記錄數(shù)據(jù)生產(chǎn)新的數(shù)據(jù)。例如,利用居住地編碼即可生產(chǎn)住戶單位的數(shù)據(jù),即在沒有家庭信息登記記錄的情況下,一個住戶單位可以定義為擁有相同住址編碼的人群,不論其是否有血緣關(guān)系。三是更新基本單位名錄庫。例如,利用省級統(tǒng)計機構(gòu)定期獲取的“五證合一”部門共享的企業(yè)(農(nóng)民專業(yè)合作社)新增、變更登記信息,企業(yè)年報信息,以及異常名錄和失信企業(yè)信息,維護更新國家統(tǒng)計系統(tǒng)中的基本單位名錄庫。
統(tǒng)計估算是指在無法通過一種行政記錄數(shù)據(jù)源獲得統(tǒng)計所需的指標數(shù)據(jù)時,就需要利用多個行政記錄數(shù)據(jù)源進行估算。例如,在統(tǒng)計個人的主要經(jīng)濟活動時,單個數(shù)據(jù)源往往不全面,需要同時訪問多個行政記錄數(shù)據(jù)源,做到互相補充。例如,目前,住戶統(tǒng)計中,嘗試利用稅務(wù)部門掌握的年收入額12 萬元以上人群數(shù)量、平均申報收入額等數(shù)據(jù),評估校驗住戶調(diào)查中高收入人群比例及其收入水平,為準確測算基尼系數(shù)提供校準依據(jù)。
運用行政記錄數(shù)據(jù),還可以對抽樣調(diào)查數(shù)據(jù)的質(zhì)量進行檢驗。首先,通過比較行政記錄數(shù)據(jù)庫與抽樣數(shù)據(jù),可以檢驗發(fā)現(xiàn)抽樣調(diào)查中數(shù)據(jù)錄入等錯誤;其次,利用行政記錄數(shù)據(jù)可以對在調(diào)查中沒有反饋以及缺失的調(diào)查數(shù)據(jù)進行較好補充。
此外,行政記錄數(shù)據(jù)還可以分別用于結(jié)構(gòu)性統(tǒng)計、變動性統(tǒng)計和密度統(tǒng)計等。
2022 年,中央全面深化改革委員會第二十五次會議審議通過了《關(guān)于加強數(shù)字政府建設(shè)的指導(dǎo)意見》,指出需把數(shù)字技術(shù)廣泛應(yīng)用于政府管理服務(wù)中,推動政府?dāng)?shù)字化與智能化運行,提升政府公共服務(wù)質(zhì)量,增強政府公信力,以人民為中心,建設(shè)人民滿意的服務(wù)型政府。為檢驗政府工作成效,本文以群眾獲得感作為切入點,利用政務(wù)數(shù)據(jù)“畫像分析”技術(shù)為群眾需求“畫像”,并從中提煉形成改革任務(wù),打通堵點、連接斷點、解決難點,最終提升民生福祉。
用戶畫像是真實用戶的虛擬代表,是建立在一系列真實數(shù)據(jù)之上的目標用戶模型。用戶畫像是指根據(jù)用戶的屬性、用戶偏好、生活習(xí)慣、用戶行為等信息而抽象出來的標簽化用戶模型,而標簽是通過對用戶信息分析而來的高度精煉的特征標識。通過打標簽,可以用一些高度概括、容易理解的特征來描述用戶,不僅可以更容易理解用戶,而且可以方便計算機處理。
數(shù)字畫像分析是基于政務(wù)大數(shù)據(jù)中心匯聚的多方數(shù)據(jù)資源為數(shù)據(jù)支撐,聚焦自然人、企業(yè)等政務(wù)核心主體對象,構(gòu)建低學(xué)習(xí)成本的集配即用數(shù)字畫像配置平臺,實現(xiàn)法人庫、自然人庫等基礎(chǔ)庫歸集數(shù)據(jù)的快速透視、基礎(chǔ)庫數(shù)據(jù)分析應(yīng)用的敏捷無代碼快速構(gòu)建,支持核心主體對象全維信息的深度洞察,可幫助完成各種業(yè)務(wù)場景驅(qū)動下的群體特征分析模型的構(gòu)建、維護及快速圖形化渲染,滿足新時期基礎(chǔ)庫分析應(yīng)用敏捷構(gòu)建及應(yīng)用頻繁變更需求。
1.自然人全息檔案。以人口基礎(chǔ)數(shù)據(jù)庫作為支撐,通過自然人全維數(shù)據(jù)聚合、提煉、展示,構(gòu)建自然人個體的全息特征畫像。自然人單體畫像主題分類應(yīng)包括人員基礎(chǔ)信息、財產(chǎn)信息、任職信息、投資經(jīng)營信息、稅費繳納信息、關(guān)聯(lián)關(guān)系、信用歷史及家庭信息等。
2.企業(yè)畫像全息檔案。以法人基礎(chǔ)數(shù)據(jù)庫作為支撐,通過企業(yè)全維數(shù)據(jù)聚合、提煉、展示,構(gòu)建針對企業(yè)個體的全息特征畫像。企業(yè)單體畫像主題分類應(yīng)包括企業(yè)基礎(chǔ)信息、經(jīng)營情況、經(jīng)營風(fēng)險、資產(chǎn)信息、納稅信息、人力結(jié)構(gòu)、能源消耗等。
1.提高調(diào)查效率。政府行政大數(shù)據(jù)具有較強的時效性和準確性,可以快速獲取所需信息,提高調(diào)查效率。通過畫像分析,可以針對不同的調(diào)查群體設(shè)計不同的調(diào)查方案,從而避免無效的調(diào)查工作,提高調(diào)查效率。
2.降低調(diào)查成本。利用政府行政大數(shù)據(jù)進行調(diào)查,可以減少實地調(diào)查、問卷調(diào)查等傳統(tǒng)調(diào)查方式的成本。通過對調(diào)查對象的深入分析,可以減少樣本量,從而降低調(diào)查成本,同時提高調(diào)查結(jié)果的可靠性。
3.提高調(diào)查精度。政府行政大數(shù)據(jù)涵蓋了多個領(lǐng)域,可以從多維度、多層次對目標進行深入分析,提高調(diào)查精度。通過對調(diào)查對象的特征進行詳細描述和分析,可以減少數(shù)據(jù)采集和處理的誤差,提高數(shù)據(jù)質(zhì)量。
4.增強調(diào)查的針對性。政府行政大數(shù)據(jù)可以為政策制定提供有力支持,使政策更加符合實際需求,提高政策的針對性和實效性。畫像分析通過對調(diào)查對象的特點、需求、行為模式等進行深入分析,能夠為調(diào)查設(shè)計提供更準確的依據(jù),提高調(diào)查的針對性和有效性。
5.輔助決策制定。畫像分析可以為決策者提供更準確、更全面的數(shù)據(jù)支持,幫助其更好地了解調(diào)查對象的需求和行為模式,從而制定更符合實際情況的決策。
浙江省統(tǒng)計局著眼精準細化,以一體化平臺為依托,聚焦“人”的特征和活動屬性,綜合利用行政記錄、社會大數(shù)據(jù)等資源,統(tǒng)籌學(xué)歷、就業(yè)、職業(yè)、收入和支出等信息,構(gòu)建基本信息明確、工作信息清晰、收支信息客觀的“全面覆蓋+精準畫像”基礎(chǔ)數(shù)據(jù)庫,探索利用算法模型實現(xiàn)對以“人”和“家庭”為單元的群體精準畫像,為社情民意精準調(diào)查提供數(shù)據(jù)支撐。
一是高度集成信息,打造共同富?!盎A(chǔ)數(shù)據(jù)庫”(簡稱“共富庫”)。依托浙江省一體化智能化公共數(shù)據(jù)平臺,充分運用大數(shù)據(jù)、人工智能、移動互聯(lián)等信息技術(shù),創(chuàng)新完善統(tǒng)計調(diào)查方式,打破部門數(shù)據(jù)壁壘,統(tǒng)籌基本信息、工作信息、收支信息、家庭資產(chǎn)信息等,截至2023 年12 月中旬,共梳理33 個部門228 類數(shù)據(jù)資源,歸集到位30 個部門213 類數(shù)據(jù)資源46.9 億條,完成數(shù)據(jù)清洗39.4 億條。按照“科學(xué)規(guī)范、高效動態(tài)、準確翔實、安全可靠”原則,建成全國首個動態(tài)更新,覆蓋常住人口、企業(yè)和個體工商戶等的基礎(chǔ)數(shù)據(jù)庫?;A(chǔ)數(shù)據(jù)庫的建成,為統(tǒng)計調(diào)查提供了廣泛的數(shù)據(jù)來源、強大的數(shù)據(jù)處理能力、直觀的數(shù)據(jù)可視化結(jié)果以及開放透明的數(shù)據(jù)管理方式,有助于提高民意調(diào)查的質(zhì)量和效率,推動民意調(diào)查事業(yè)的發(fā)展。
二是精準分類群體,繪制重點人群“基本特征圖”。圍繞共同富?!皵U中提低”對象開展研究,確定重點群體,進行概念界定,明確統(tǒng)計口徑,建立包含學(xué)歷、社保、職業(yè)、技能職稱等的3 個一級標簽類目、12 個二級標簽類目、170 多個具體標簽、超540 個標簽選項的特征標簽體系。目前,已基本摸清進城務(wù)工人員、科研人員等“擴中提低”9 類重點群體底數(shù),從群體規(guī)模、地區(qū)分布、年齡結(jié)構(gòu)、受教育程度等方面提煉群體基本特征,為“擴中提低”改革精準施策提供堅實基礎(chǔ)。
基于共富基礎(chǔ)庫打造的精準調(diào)查場景,“浙江民調(diào)在線”平臺支持通過地區(qū)(顆粒度可到社區(qū)、村一級)、年齡、職業(yè)、性別等標簽字段對調(diào)查樣本進行精細畫像,由系統(tǒng)通過可用不可見的技術(shù)根據(jù)樣本畫像需求抽取樣本并通過短信平臺進行精準推送,實現(xiàn)快速觸達目標人群,大幅提升調(diào)查效率。同時與共同富裕·民情在線、智慧民生、統(tǒng)計e 家、統(tǒng)計地理信息系統(tǒng)、基本單位名錄庫等平臺深度融合,為加速構(gòu)建整體智治、高效協(xié)同的社情民意調(diào)查數(shù)字化工作新模式,提升統(tǒng)計調(diào)查能力和統(tǒng)計調(diào)查方式現(xiàn)代化提供強勁動力。
1.豐富了民意調(diào)查手段,極大提升了調(diào)查效率?!罢憬裾{(diào)在線”開辟了智調(diào)功能,豐富了調(diào)查手段,增加了調(diào)查靈活度,調(diào)查效率呈幾何級增長。上線以來共采集成功樣本1381 萬余個,收集社會各階層意見建議超過150 萬條,為基層減負50 萬人次以上。例如,為深入貫徹落實浙江省委、省政府關(guān)于實施營商環(huán)境優(yōu)化提升“一號改革工程”的決策部署,反映企業(yè)對浙江營商環(huán)境的具體評價,了解企業(yè)面臨的主要困難和意見建議,開展營商環(huán)境企業(yè)滿意度調(diào)查,歷時5 天,涵蓋不同地區(qū)、不同行業(yè)、不同規(guī)模和不同經(jīng)濟類型,定向收集有效樣本企業(yè)5981 家,獲取企業(yè)關(guān)于營商環(huán)境各類訴求、意見和建議共2295 條,獲評實施三個“一號工程”典型案例。
2.實現(xiàn)了重點群體多維度分析,為精準施策提供有力支撐。利用“浙江民調(diào)在線”平臺針對浙江省低收入農(nóng)戶、個體工商戶、高校畢業(yè)生、新就業(yè)形態(tài)從業(yè)人員(包括網(wǎng)約車司機、外賣小哥、快遞員)等“擴中”“提低”重點群體開展專項調(diào)查,了解重點群體現(xiàn)狀及需求,分析當(dāng)前重點群體綜合幫扶政策存在的問題,實現(xiàn)幫扶策略的個性化和精準化,為政府部門決策提供有效實踐指導(dǎo),為實現(xiàn)共同富裕提供有力數(shù)據(jù)支撐。
3.重塑了民意調(diào)查體系,為國家層面工作推進提供浙江經(jīng)驗。浙江先行先試,改被動收集為主動匯集,變?nèi)罕娪^望為群眾感受,重塑了社情民意調(diào)查工作體系?;诰毊嬒瘛⒕珳释苿?、智能排重等打造的智調(diào)功能為國家統(tǒng)計局相關(guān)應(yīng)用開發(fā)提供了浙江思路。依托應(yīng)用開展的全國群眾安全感線上調(diào)查案例成為國家統(tǒng)計局開展相關(guān)工作的重要參照。
一是數(shù)據(jù)收集和整合困難。行政大數(shù)據(jù)的來源廣泛,包括政府各部門、企業(yè)、社會組織等,數(shù)據(jù)類型和格式多樣,給數(shù)據(jù)收集和整合帶來了一定的困難。同時,由于數(shù)據(jù)標準不統(tǒng)一、數(shù)據(jù)質(zhì)量參差不齊等問題,也增加了數(shù)據(jù)整合的難度。
二是數(shù)據(jù)更新不及時?;A(chǔ)數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量和價值會隨著時間的推移發(fā)生變化,如果不能及時更新,那么基于這些數(shù)據(jù)做出的決策就可能過時或錯誤,動態(tài)更新數(shù)據(jù)庫對于提高決策的準確性和效率具有重要意義。
三是數(shù)據(jù)分析和利用能力不足。行政大數(shù)據(jù)的數(shù)據(jù)量龐大,需要專業(yè)的數(shù)據(jù)分析工具和方法進行挖掘和分析。然而,目前政府統(tǒng)計部門在數(shù)據(jù)分析和利用方面還存在一定的不足,缺乏足夠的技術(shù)和人才支持,無法充分發(fā)揮大數(shù)據(jù)的價值。
四是法規(guī)和政策不完善。目前關(guān)于行政大數(shù)據(jù)的法規(guī)和政策還不夠完善,缺乏明確的規(guī)范和標準。這導(dǎo)致在數(shù)據(jù)收集、存儲、使用等方面存在一定的法律風(fēng)險和政策不確定性,給政府統(tǒng)計調(diào)查工作帶來了一定的困難。
一是加強數(shù)據(jù)共享和服務(wù)意識。要健全部門聯(lián)動的數(shù)據(jù)樣本庫,推進部門行政記錄信息互聯(lián)互通,提升數(shù)據(jù)整合能力,推動數(shù)據(jù)規(guī)范化共享。建立統(tǒng)一的數(shù)據(jù)標準和規(guī)范,保證數(shù)據(jù)按照特定的技術(shù)標準和要求進行一致化處理,確保數(shù)據(jù)的完整性和準確性,全面提升信息化水平。
二是建立大數(shù)據(jù)動態(tài)更新機制。實現(xiàn)數(shù)據(jù)動態(tài)更新有利于保持行政大數(shù)據(jù)的時效性和代表性,能更好地反映當(dāng)前的社會、經(jīng)濟、科技等方面的變化,對于提高決策的準確性和效率具有重要意義。動態(tài)更新基礎(chǔ)數(shù)據(jù)庫需要定期維護,不斷優(yōu)化數(shù)據(jù)庫的結(jié)構(gòu),包括數(shù)據(jù)分類、標簽設(shè)置、數(shù)據(jù)存儲方式等,保持數(shù)據(jù)庫多樣性,同時應(yīng)當(dāng)通過建立反饋機制和定期評估調(diào)整等措施,提高數(shù)據(jù)庫的管理效率和數(shù)據(jù)質(zhì)量。
三是加大人才培引力度。發(fā)揮行政大數(shù)據(jù)作用,需要具備較高的數(shù)據(jù)分析和挖掘能力,高層次科技和管理人才隊伍建設(shè)是重要一環(huán)。要引進和培養(yǎng)大數(shù)據(jù)統(tǒng)計應(yīng)用人才,組建涵蓋統(tǒng)計方法、數(shù)據(jù)科學(xué)、信息技術(shù)等專家的大數(shù)據(jù)統(tǒng)計應(yīng)用研究團隊,分工協(xié)作,聯(lián)合攻關(guān)。同時,整合現(xiàn)有統(tǒng)計人才資源,創(chuàng)新工作模式,加強統(tǒng)計人員信息化培訓(xùn)和能力提升,將大數(shù)據(jù)、人工智能等技術(shù)與日常統(tǒng)計工作相結(jié)合,全力打造學(xué)習(xí)型、服務(wù)型、創(chuàng)新型統(tǒng)計人才隊伍。
四是完善大數(shù)據(jù)安全保障機制。隨著大數(shù)據(jù)廣泛使用,個人隱私和數(shù)據(jù)安全面臨挑戰(zhàn)。因此,需要完善和規(guī)范相關(guān)法律法規(guī)來保障大數(shù)據(jù)的安全。政府有關(guān)部門應(yīng)借鑒現(xiàn)代科技手段,結(jié)合內(nèi)部數(shù)據(jù)防泄漏管理長效機制來防止數(shù)據(jù)泄露,利用人工智能身份識別認證數(shù)據(jù)管控技術(shù)與加密、隔離等技術(shù)相互結(jié)合,共同防止敏感數(shù)據(jù)的泄露與擴散,對個人敏感數(shù)據(jù)進行匿名化處理,有效防止個人及企業(yè)的內(nèi)部敏感數(shù)據(jù)泄露。