李亞洲 陳 堅
為提升政府治理能力及國家競爭力,我國于2015年首次將大數(shù)據(jù)發(fā)展列入國家戰(zhàn)略,并于2016年發(fā)布《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》和《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》等相關(guān)指導(dǎo)性文件。為積極推進(jìn)公安大數(shù)據(jù)的建設(shè),公安部也于2017年印發(fā)《關(guān)于深入開展“大數(shù)據(jù)+網(wǎng)上督查”工作的意見》,并在2018年年初成立全國公安大數(shù)據(jù)領(lǐng)導(dǎo)小組,以大力實施公安大數(shù)據(jù)戰(zhàn)略,確保信息化建設(shè)能夠取得重大進(jìn)展,確保維護(hù)國家安全和社會穩(wěn)定。
隨著公安信息化建設(shè)迅猛發(fā)展,公安機關(guān)現(xiàn)已有數(shù)百種PB 級的大規(guī)模數(shù)據(jù)資源,數(shù)據(jù)量呈指數(shù)級增長,數(shù)據(jù)結(jié)構(gòu)和存儲方式日益多樣。不斷增多的信息數(shù)據(jù)已經(jīng)成為公安機關(guān)僅次于警力資源、裝備資源之后的新一類核心資源。在公安大數(shù)據(jù)治理方面,由于各個警種部門的數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一,因而無法形成統(tǒng)一的格式,給數(shù)據(jù)治理帶來了一定的困難①朱維和、魏鋒、高曉嵐:《公安大數(shù)據(jù)治理技術(shù)研究》,《警察技術(shù)》2018年第6 期。。為此,警務(wù)大數(shù)據(jù)的有效治理將有利于促進(jìn)公安大數(shù)據(jù)資產(chǎn)的價值變現(xiàn)②潘敏男:《公安數(shù)據(jù)間關(guān)聯(lián)關(guān)系的可視化研究與應(yīng)用》,東華大學(xué)2018年碩士學(xué)位論文。。
當(dāng)前,公安機關(guān)警務(wù)大數(shù)據(jù)建設(shè)面臨的主要問題有以下幾個方面:一是數(shù)據(jù)壁壘導(dǎo)致“信息孤島”的出現(xiàn)。由于數(shù)據(jù)不能充分共享、業(yè)務(wù)流程不能流暢銜接,各警種部門無法實現(xiàn)自身數(shù)據(jù)資源和業(yè)務(wù)接口的對外開放和數(shù)據(jù)共享,從而形成“單向信息孤島”①張敏:《在治安防控場景下大數(shù)據(jù)應(yīng)用方法分析》,《中國安全防范技術(shù)與應(yīng)用》2018年第6 期。。二是信息資源的數(shù)據(jù)融合不充分、信息接入不明確。三是數(shù)據(jù)難以應(yīng)用。公安機關(guān)在警務(wù)實戰(zhàn)中積累了海量數(shù)據(jù),但如何管理、有效應(yīng)用這些數(shù)據(jù),卻還未建立相關(guān)的警務(wù)數(shù)據(jù)知識圖譜,數(shù)據(jù)與知識之間的轉(zhuǎn)換困難、數(shù)據(jù)挖掘工具和手段的缺失使得數(shù)據(jù)的深層價值難以體現(xiàn)②王戰(zhàn)紅:《鐵路公安大數(shù)據(jù)建設(shè)及分析應(yīng)用研究》,《鐵道警察學(xué)院學(xué)報》2016年第3 期。。
從使用零散的數(shù)據(jù)變?yōu)槭褂媒y(tǒng)一的主數(shù)據(jù)的過程即為數(shù)據(jù)治理。從無組織的流程治理到覆蓋全業(yè)務(wù)范圍的綜合數(shù)據(jù)治理、把數(shù)據(jù)從混亂狀態(tài)處理成井井有條的過程均可稱之為數(shù)據(jù)治理。
傳統(tǒng)的公安數(shù)據(jù)治理戰(zhàn)略包括業(yè)務(wù)發(fā)展目標(biāo)、IT 規(guī)劃等相關(guān)規(guī)劃?;诎l(fā)展戰(zhàn)略和規(guī)劃的指導(dǎo),傳統(tǒng)的數(shù)據(jù)治理通過一系列流程的建設(shè)和執(zhí)行得以落實。
在大數(shù)據(jù)時代,數(shù)據(jù)治理面臨巨大挑戰(zhàn):第一個方面是數(shù)據(jù)不可知,用戶對于數(shù)據(jù)和業(yè)務(wù)的關(guān)系未知,數(shù)據(jù)資產(chǎn)較為模糊;第二個方面是數(shù)據(jù)不可控,由于數(shù)據(jù)處理沒有形成一致的標(biāo)準(zhǔn)導(dǎo)致數(shù)據(jù)難以統(tǒng)一;第三個方面是數(shù)據(jù)不可取,當(dāng)應(yīng)用系統(tǒng)需要大數(shù)據(jù)的時候,如何快速地實現(xiàn)數(shù)據(jù)獲得仍有待解決;第四個方面是數(shù)據(jù)不可聯(lián),在討論人工智能和機器學(xué)習(xí)之余,如何把業(yè)務(wù)人員頭腦中的知識和現(xiàn)有的數(shù)據(jù)關(guān)聯(lián)在一起還未得到解決。
圖1 大數(shù)據(jù)時代數(shù)據(jù)治理面臨的挑戰(zhàn)
大數(shù)據(jù)是通過協(xié)調(diào)多個不同部門的模型融合來制定數(shù)據(jù)優(yōu)化的相關(guān)策略,大數(shù)據(jù)也是廣義信息治理的一部分。隨著大數(shù)據(jù)成為專家學(xué)者研究的熱點話題,大數(shù)據(jù)的特征描述也呈現(xiàn)出多樣化趨勢。其中,以IBM 的“5V”模型描述大數(shù)據(jù)的特征較為常見,其在面對大數(shù)據(jù)興起帶來挑戰(zhàn)的同時,努力促進(jìn)大數(shù)據(jù)治理的發(fā)展和變革③Ibrahim Alhassan, David Sammon, Mary Daly, “Data governance activities: a comparison between scientific and practice-oriented literature”, Journal of Enterprise Information Management, 2018, Vol.31, No.2, pp.22-25.。
科學(xué)數(shù)據(jù)治理體系即網(wǎng)安大數(shù)據(jù)科學(xué)數(shù)據(jù)治理體系,是通過離線計算技術(shù)、流式計算技術(shù)、機器學(xué)習(xí)技術(shù)的應(yīng)用,構(gòu)建起的包括數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)資源目錄、數(shù)據(jù)勘探、數(shù)據(jù)分級分類、數(shù)據(jù)血緣關(guān)系、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)運維管理、智能化治理在內(nèi)的數(shù)據(jù)治理體系。①DAMA International, The DAMA Guide to the Data Management Body of Knowledge, New York: Technics Publications, 2009, p.37.
圖2 科學(xué)的數(shù)據(jù)治理體系
科學(xué)數(shù)據(jù)治理體系具有明顯的實戰(zhàn)優(yōu)勢,它是提升公安數(shù)據(jù)整體質(zhì)量,規(guī)范公安數(shù)據(jù)管理,實現(xiàn)數(shù)據(jù)可持續(xù)應(yīng)用的基礎(chǔ),是公安實現(xiàn)大數(shù)據(jù)戰(zhàn)略轉(zhuǎn)型的關(guān)鍵步驟和核心工作。②徐雅倩、王剛:《數(shù)據(jù)治理研究:進(jìn)程與爭鳴》,《電子政務(wù)》2018年第8 期。
圖3 科學(xué)的數(shù)據(jù)治理實戰(zhàn)優(yōu)勢
在實際工作中,科學(xué)數(shù)據(jù)治理體系能夠幫助公安機關(guān)綜合分析關(guān)于人、物、事件、時間等海量高價值數(shù)據(jù)資源,挖掘數(shù)據(jù)中存在的深層次關(guān)聯(lián)線索,既大大提高了網(wǎng)絡(luò)案件的破案效率,解決了人、事、物、組織關(guān)聯(lián)中斷的問題,同時也為刑偵、經(jīng)偵等部門提供了重要的信息來源和破案手段。在警務(wù)應(yīng)用中對于維護(hù)社會大局穩(wěn)定、預(yù)防和打擊犯罪、輔助指揮決策等發(fā)揮了重要作用。
在治安工作方面,以大數(shù)據(jù)部門建設(shè)的“一人一檔”系統(tǒng)為例,該系統(tǒng)應(yīng)用數(shù)據(jù)治理技術(shù),充分挖掘數(shù)據(jù)價值,提供了一鍵式快速分析目標(biāo)對象的服務(wù),以智能化處理技術(shù)輔助提升了人工研判效率。
在刑偵工作方面,科學(xué)的數(shù)據(jù)治理體系將突破性地改變公安機關(guān)的偵查格局,將先進(jìn)的偵查手段、思路以模型化的方式進(jìn)行呈現(xiàn)??茖W(xué)的數(shù)據(jù)治理可在今后的應(yīng)用中發(fā)揮拓展數(shù)據(jù)思維、優(yōu)化偵查思路的重要作用。
在經(jīng)偵工作方面,由于經(jīng)偵案件存在數(shù)據(jù)量大、數(shù)據(jù)噪聲多等問題,難以依靠傳統(tǒng)手段進(jìn)行破案,因此迫切需要展開數(shù)據(jù)治理工作,由此分別從微觀、中觀、宏觀的數(shù)據(jù)層面研究經(jīng)濟(jì)犯罪,打破傳統(tǒng)的點對點個案偵破模式,挖掘各類經(jīng)偵案件中的DNA,實現(xiàn)經(jīng)偵工作的數(shù)據(jù)化實戰(zhàn)與信息化建設(shè)。
在交管工作方面,依賴科學(xué)完善的數(shù)據(jù)治理體系進(jìn)行交通數(shù)據(jù)治理和分析,可以有效緩解城市擁堵現(xiàn)象并減少事故發(fā)生量。例如,可通過搭建智能交通模式識別系統(tǒng),為在道路可承受的前提下確定是否增加“吞吐量”提供智能指導(dǎo)。①沈妍:《大數(shù)據(jù)網(wǎng)絡(luò)中數(shù)據(jù)分類優(yōu)化識別分析》,《技術(shù)與市場》2019年第6 期。
公安大數(shù)據(jù)治理和科信大數(shù)據(jù)治理相似但不完全相同。在技術(shù)層面上,公安大數(shù)據(jù)治理和科信大數(shù)據(jù)治理沒有明顯差別,公安大數(shù)據(jù)也需要接入更多、更廣泛的數(shù)據(jù)資源,采用相同的數(shù)據(jù)治理標(biāo)準(zhǔn)進(jìn)行統(tǒng)一的數(shù)據(jù)匯集和處理,并通過分權(quán)、分域策略實現(xiàn)各業(yè)務(wù)部門的數(shù)據(jù)統(tǒng)一和數(shù)據(jù)共享②P.PINKLER, “Indicators are the Essence of Scientometrics and Bibliometrics”, Scientometrics, 2010, Vol.85, No.3, pp.61-66.。但是,二者所承載的業(yè)務(wù)平臺存在著細(xì)微的差異:雖然科信業(yè)務(wù)與技偵、刑偵、經(jīng)偵等部門的業(yè)務(wù)目標(biāo)相同,但通過整合包括公安系統(tǒng)的業(yè)務(wù)數(shù)據(jù)、工作數(shù)據(jù)、人員數(shù)據(jù)等全資源數(shù)據(jù),提供的業(yè)務(wù)范圍還應(yīng)涉及到人員管理、資源管理、資源協(xié)調(diào)和工作調(diào)度等方面的問題,需要在業(yè)務(wù)功能的層面上針對不同部門的業(yè)務(wù)需求來制定不同的功能策略。
圖4 公安大數(shù)據(jù)治理體系
公安大數(shù)據(jù)治理平臺應(yīng)以公安機關(guān)現(xiàn)有內(nèi)部資源為主干,綜合社會資源以及科信、技偵等業(yè)務(wù)資源,通過體系性地對數(shù)據(jù)全生命周期的獲取、處理、使用進(jìn)行規(guī)整,形成全面、分層的信息資源存儲,對智慧公安平臺上的業(yè)務(wù)以及云外用戶形成全面的數(shù)據(jù)支撐。③朱琳、金耀輝:《全局?jǐn)?shù)據(jù):大數(shù)據(jù)時代的數(shù)據(jù)治理》,《復(fù)旦公共行政評論》2017年第1 期。
一要實現(xiàn)數(shù)據(jù)概況清晰化。經(jīng)過多年的信息系統(tǒng)建設(shè),治安、刑偵、經(jīng)偵、禁毒、網(wǎng)安等各條線上建設(shè)了上百套系統(tǒng),匯聚了公安類、社會類、網(wǎng)絡(luò)類等數(shù)十種數(shù)據(jù)資源。因此,需要治理的數(shù)據(jù)資源應(yīng)包含公安系統(tǒng)能獲取到的所有數(shù)據(jù)資源。
二要實現(xiàn)數(shù)據(jù)關(guān)聯(lián)全面化??茖W(xué)數(shù)據(jù)治理體系為數(shù)據(jù)的關(guān)聯(lián)、數(shù)據(jù)的沖突檢測、數(shù)據(jù)的緩存、數(shù)據(jù)的讀入優(yōu)化等提供了質(zhì)的提升,具體包括數(shù)據(jù)的完整性檢測、數(shù)據(jù)的規(guī)范性檢測、數(shù)據(jù)的一致性檢測、準(zhǔn)確性檢測、關(guān)聯(lián)性檢測等,從而可有效消除公安數(shù)據(jù)行業(yè)中數(shù)據(jù)孤立等問題。
三要實現(xiàn)數(shù)據(jù)存儲標(biāo)準(zhǔn)化。公安大數(shù)據(jù)治理建設(shè)的重點在于對匯集庫、綜查庫的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化治理,對數(shù)據(jù)的質(zhì)量、運營、安全等按照數(shù)據(jù)資產(chǎn)管理的理念進(jìn)行管理,使數(shù)據(jù)“可控制、可量化、可變現(xiàn)”。
四要實現(xiàn)業(yè)務(wù)分析智能化。在數(shù)據(jù)關(guān)聯(lián)全面化、數(shù)據(jù)存儲標(biāo)準(zhǔn)化的基礎(chǔ)上,科學(xué)的數(shù)據(jù)治理體系能夠幫助公安機關(guān)合理使用不斷積累的信息數(shù)據(jù)庫。從海量信息的背后挖掘出潛在的價值,以此來提升公安機關(guān)的實戰(zhàn)分析能力。
科學(xué)的數(shù)據(jù)治理體系需要各個行業(yè)的共同努力。至目前為止,現(xiàn)有的研究還沒有就大數(shù)據(jù)治理核心要素的理解達(dá)成共識;在管理流程設(shè)計、組織信息治理規(guī)劃等方面,不同的研究者結(jié)合自身理解及大數(shù)據(jù)的特征給出了不同的定義;就大數(shù)據(jù)治理研究的關(guān)聯(lián)性、完整性和一致性來說,尚有不足。公安機關(guān)的數(shù)據(jù)治理也面臨著諸多困難,建立良好的公安數(shù)據(jù)應(yīng)用環(huán)境仍需進(jìn)一步探索。由于“信息孤島”普遍的存在,公安機關(guān)迫切需要對各層級所擁有的數(shù)據(jù)進(jìn)行合理有效地清理、整合和優(yōu)化。同時,對于跨部門、跨領(lǐng)域的數(shù)據(jù)資源采集、交換和共享,公安機關(guān)應(yīng)建立合理的機制以提高實際應(yīng)用中的數(shù)據(jù)分析效率,從而不斷提升自身的數(shù)據(jù)治理能力。
面對數(shù)據(jù)資源的爆炸式增長,公安機關(guān)大數(shù)據(jù)治理的核心是“疏”??茖W(xué)的數(shù)據(jù)治理體系可以減少數(shù)據(jù)庫中的錯誤,使數(shù)據(jù)清晰、標(biāo)準(zhǔn)、準(zhǔn)確,并能夠?qū)?shù)據(jù)的可用性、完整性、安全性等綜合起來進(jìn)行全面管理。公安機關(guān)要通過科學(xué)的數(shù)據(jù)治理,將數(shù)據(jù)中包含著的人、事、物、組織和案件等豐富的信息利用起來,挖掘出海量數(shù)據(jù)背后的隱藏線索。未來,還要不斷改進(jìn)相應(yīng)的制度設(shè)計,完善技術(shù)設(shè)施,以促進(jìn)數(shù)據(jù)治理體系的優(yōu)化。