杜曉玲 公安部第一研究所
當(dāng)前,大數(shù)據(jù)、人工智能等新興技術(shù)發(fā)展迅猛,為推動經(jīng)濟(jì)社會發(fā)展、提升社會治理能力開拓了新的思路。公安機(jī)關(guān)通過運(yùn)用大數(shù)據(jù)相關(guān)技術(shù),對已經(jīng)匯聚共享的公安數(shù)據(jù)資源進(jìn)行整理、歸類、分析、預(yù)測,自動發(fā)現(xiàn)查糾、預(yù)警,提示公安機(jī)關(guān)及其人民警察在履行職責(zé)、行使職權(quán)、遵守紀(jì)律等過程中可能存在的問題風(fēng)險。構(gòu)建公安監(jiān)督管理標(biāo)簽體系,將為公安監(jiān)督管理信息化建設(shè)提供大數(shù)據(jù)智能分析方面的重要技術(shù)支撐。
隨著信息技術(shù)的不斷發(fā)展,每天產(chǎn)生海量的公安數(shù)據(jù)信息,傳統(tǒng)的人為整理和歸納已不能滿足公安實際業(yè)務(wù)工作,因此需要利用大數(shù)據(jù)技術(shù)將數(shù)據(jù)標(biāo)簽化,從基本屬性、社會屬性和行為屬性等來描述公安業(yè)務(wù)數(shù)據(jù),更好地服務(wù)公安監(jiān)督管理業(yè)務(wù)應(yīng)用。
建立數(shù)據(jù)標(biāo)簽體系的目的是為了更好地滿足數(shù)據(jù)資源用戶高效利用數(shù)據(jù)的需求,因此,經(jīng)過準(zhǔn)確分析公安監(jiān)督管理標(biāo)簽體系建設(shè)的需求,公安監(jiān)督管理標(biāo)簽體系的建立主要在準(zhǔn)確利用公安數(shù)據(jù)資源需求的基礎(chǔ)上,通過構(gòu)建公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng),利用公安業(yè)務(wù)對象實體的關(guān)系、活動、地域、經(jīng)歷等數(shù)據(jù)的挖掘形成相應(yīng)的挖掘模型。
公安監(jiān)督管理標(biāo)簽體系建設(shè)的主要用戶為從事公安監(jiān)督管理工作的民警,其主要數(shù)據(jù)資源的需求包括民警在履行職責(zé)、行使職權(quán)、遵守紀(jì)律過程中的業(yè)務(wù)數(shù)據(jù)。
公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng),是一套B/S架構(gòu)的業(yè)務(wù)系統(tǒng),主要用于分析監(jiān)督管理實體標(biāo)簽,構(gòu)建監(jiān)督管理業(yè)務(wù)標(biāo)簽?zāi)P?,生成和管理業(yè)務(wù)標(biāo)簽體系,實現(xiàn)具體業(yè)務(wù)場景下的標(biāo)簽圈選功能,為公安監(jiān)督管理業(yè)務(wù)提供有力的數(shù)據(jù)支持。
系統(tǒng)軟件架構(gòu)如圖1所示。
數(shù)據(jù)源層:根據(jù)公安監(jiān)督管理業(yè)務(wù)實際,公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng)數(shù)據(jù)資源來源于全國各級警務(wù)監(jiān)督管理部門業(yè)務(wù)數(shù)據(jù),以及公安各警種業(yè)務(wù)數(shù)據(jù),主要關(guān)注涉及執(zhí)法過程和行政審批數(shù)據(jù)。
服務(wù)層:系統(tǒng)通過數(shù)據(jù)接入接口導(dǎo)入數(shù)據(jù)源層業(yè)務(wù)數(shù)據(jù),通過任務(wù)執(zhí)行引擎、數(shù)據(jù)搜索引擎,完成數(shù)據(jù)的各類處理工作,通過標(biāo)簽配置接口為功能層提供支撐。
功能層:基于服務(wù)層為應(yīng)用層提供數(shù)據(jù)融合、標(biāo)簽管理、標(biāo)簽開發(fā)、標(biāo)簽應(yīng)用、標(biāo)簽質(zhì)量等功能,完成標(biāo)簽全生命周期管理。
應(yīng)用層:基于底層功能為實現(xiàn)警員畫像、監(jiān)督管理事項檔案、標(biāo)簽圈選等應(yīng)用,為用戶提供可視化展示界面,為公安監(jiān)督管理業(yè)務(wù)應(yīng)用平臺提供標(biāo)簽接口服務(wù)。
公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng)向下對接監(jiān)督管理業(yè)務(wù)應(yīng)用系統(tǒng)和各警種業(yè)務(wù)系統(tǒng),獲取相關(guān)數(shù)據(jù);向上為監(jiān)督管理業(yè)務(wù)應(yīng)用系統(tǒng)提供標(biāo)簽服務(wù),輸出標(biāo)簽?zāi)芰Α?/p>
系統(tǒng)軟件邊界關(guān)系如圖2所示。
標(biāo)簽是我們利用一種數(shù)學(xué)化或形式化的方式去描述知識,其中包含了概念(本體)以及概念和概念之間的相互關(guān)系,它們之間的關(guān)系可以通過模型來構(gòu)建。之所以叫做動態(tài)標(biāo)簽,一方面是因為所有的概念,都是隨著業(yè)務(wù)不斷變化的,有了新的數(shù)據(jù),有了新的業(yè)務(wù)形態(tài),這些概念就要重新梳理;另一方面是因為概念和概念之間的關(guān)系也是不斷變化的,我們構(gòu)建的表述關(guān)系的模型也要隨之調(diào)整。因此,基于以上形成的就是一個動態(tài)調(diào)整的標(biāo)簽體系。
標(biāo)簽體系構(gòu)建方法有很多種,公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng)主要運(yùn)用斯坦福本體構(gòu)建七步法來實現(xiàn)標(biāo)簽體系的構(gòu)建。
步驟1:確定本體的領(lǐng)域和范圍
通過以下問題來確定公安監(jiān)督管理本體的領(lǐng)域和范圍,詳見表1。
?
從這個問題列表來看,公安監(jiān)督管理本體將包括警種類型、執(zhí)法條例和各種行為信息等。
步驟2:考慮復(fù)用現(xiàn)有的本體體系
在構(gòu)建本體之前可以考慮目前已經(jīng)做了什么本體體系,并檢查是否可以在關(guān)注的領(lǐng)域和任務(wù)下,細(xì)化和擴(kuò)展現(xiàn)有的本體體系。因此,公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng)需要實現(xiàn)對已有本體的導(dǎo)入和導(dǎo)出。
步驟3:枚舉本體中的重要術(shù)語
根據(jù)公安監(jiān)督管理業(yè)務(wù),梳理出一個需要用來陳述或向用戶解釋的所有術(shù)語的列表。例如,與警察相關(guān)的重要術(shù)語將包括警種、警銜、隸屬機(jī)構(gòu)、案事件、職能、條例、警容警紀(jì)等,其中:警種涉及經(jīng)偵、刑偵、治安等;警銜涉及警監(jiān)、警督、警司等;案事件涉及治安案件、刑事案件、交通事故等。在這個步驟中,要力求必須得到一個涉及公安監(jiān)督管理的全面的術(shù)語列表,暫時忽視概念之間的重疊、術(shù)語之間的關(guān)系,或概念可能具有的任何屬性,或者這些概念是類還是屬性。
步驟4:定義類和類的層次結(jié)構(gòu)
從步驟3中創(chuàng)建的術(shù)語中選擇類,并創(chuàng)建類之間的層次關(guān)系。公安監(jiān)督管理的類層次結(jié)構(gòu)的定義是依據(jù)公安頂層設(shè)計,采用自上而下的方式,即從領(lǐng)域中最概括性的概念開始,到更詳細(xì)化的概念。
例如,可以從創(chuàng)建“警察”這個最概括最籠統(tǒng)的概念類目開始,然后創(chuàng)建一些子類目來具體化警察類目:人民警察、武裝警察??梢赃M(jìn)一步分類人民警察類目,例如,分為公安機(jī)關(guān)警察、國家安全機(jī)關(guān)警察、司法機(jī)關(guān)警察、司法行政機(jī)關(guān)警察、接受公安部及其他部門雙重領(lǐng)導(dǎo)的警察等。
步驟5:定義類的屬性
已經(jīng)從步驟3中創(chuàng)建的術(shù)語列表中選擇了類,其余的大部分術(shù)語很可能是這些類的屬性。這些術(shù)語包括,例如,警察的個人信息、條例、職能以及行為信息。
對于列表中的每個屬性,必須確定它描述了哪個類。這些屬性將成為描述類的特性或特征。例如,警察類目將有以下屬性:個人信息、職能、條例和行為信息,而部門組織類目下將會有一個部門等級屬性。其中:
警察的年齡及性別等屬于內(nèi)在屬性;
警察的姓名和他的籍貫屬于外在屬性;
民警執(zhí)法的規(guī)范流程是結(jié)構(gòu)化的,屬于結(jié)構(gòu)屬性;
警察類目下的隸屬機(jī)構(gòu)屬性,代表警察類目和部門機(jī)構(gòu)類目之間的關(guān)系,屬于關(guān)系屬性。
另外還從屬性的性質(zhì)角度,對公安監(jiān)督管理標(biāo)簽屬性進(jìn)行如下分類:
(1)按時效性。按時效性可以分為靜態(tài)標(biāo)簽和動態(tài)標(biāo)簽。如民警的姓名、性別、出身日期等與生俱來的屬性信息屬于靜態(tài)標(biāo)簽;如民警的執(zhí)勤地點(diǎn)、接處警案件等經(jīng)常發(fā)生變動的特征和行為就屬于動態(tài)標(biāo)簽。
(2) 按定性定量。如“民警執(zhí)法不規(guī)范”“推諉扯皮不作為”等不能直接量化的標(biāo)簽屬于定性標(biāo)簽;如“處警反饋超過24小時”“收繳涉案財物大于10萬元”等可以準(zhǔn)確數(shù)量定義并能設(shè)定量化指標(biāo)的標(biāo)簽屬于定量標(biāo)簽。
(3)按對數(shù)據(jù)處理的深度。如“接警人姓名”“接警時間”“處警時間”等可以直接從業(yè)務(wù)數(shù)據(jù)中提取的標(biāo)簽屬于事實標(biāo)簽;如“執(zhí)法過錯”“處警不規(guī)范”等對對象屬性及行為等屬性的抽象和聚類,通過剖析對象的基礎(chǔ)數(shù)據(jù)為對象貼上相應(yīng)的總結(jié)概括性標(biāo)簽及指數(shù)的,屬于規(guī)則標(biāo)簽;如“有警不出”“不如實受立案”等參考已有事實數(shù)據(jù),基于對象的屬性、行為、位置和特征,針對這些行為預(yù)測配合監(jiān)督管理業(yè)務(wù)規(guī)則或算法產(chǎn)生的標(biāo)簽,屬于挖掘標(biāo)簽。
步驟6:規(guī)定屬性取值的范圍和限制
屬性還需要一些字段規(guī)定取值的范圍和限制,如值類型、允許的取值、值的數(shù)量(基數(shù))以及屬性值的其他特性。例如,屬性“姓名”的值是一個字符串,則說“姓名”是一個具有值類型為字符串的屬性;屬性“管轄警種”有多個值且這些值是治安警察類目下的實例,也就是說“管轄警種”是一個具有實例類型的屬性,其具體的取值為治安警察類目下的實例。
步驟7:創(chuàng)建實例
最后一步是在層級結(jié)構(gòu)中創(chuàng)建類目的各個實例。定義一個類的單個實例需要:
(1)選擇一個類;
(2)創(chuàng)建一個該類的單個實例;
(3)填充屬性值。
例如,創(chuàng)建一個單獨(dú)的實例——治安警察來代表一種特定種類的人民警察。治安警察是公安機(jī)關(guān)領(lǐng)導(dǎo)的警察的一個實例,此實例中定義了以下屬性值:
·基礎(chǔ)信息;
·隸屬機(jī)構(gòu):某某公安局;
·職能:預(yù)防、發(fā)現(xiàn)和制止違法犯罪,維護(hù)公共場所的治安秩序,管理特種行業(yè),管理危險物品,處理一般違法案件等。
基于以上標(biāo)簽體系構(gòu)建方法并緊密結(jié)合監(jiān)督管理業(yè)務(wù),構(gòu)建具有監(jiān)督管理業(yè)務(wù)特色,符合實戰(zhàn)的實體標(biāo)簽體系。
首先基于傳統(tǒng)人員、地點(diǎn)、物品、事件、時間五大類實體標(biāo)簽,以每個實體作為一個分析維度,再通過人、地、事、物、時間多個體系的關(guān)聯(lián)和打通,用一個多維的標(biāo)簽體系來描述一個具體的實體,在監(jiān)督管理具體的業(yè)務(wù)場景中,以這個實體為中心設(shè)計監(jiān)督管理預(yù)警項,建立標(biāo)簽規(guī)則,最終形成監(jiān)督管理業(yè)務(wù)標(biāo)簽,如圖3所示。
其中,人員類標(biāo)簽包括:基本信息(如身份信息、地址信息)、社會背景(基本屬性、學(xué)歷學(xué)位、持有證件、職業(yè)、家庭狀況)、涉案涉嫌等;
地點(diǎn)類標(biāo)簽包括:涉黃場所、涉毒場所、盜竊高發(fā)區(qū)、搶劫高發(fā)區(qū)、保護(hù)區(qū)域、商業(yè)區(qū)、生活區(qū)、商場、廣場、公園、學(xué)校;
物品類標(biāo)簽包括:通訊工具、金融設(shè)備(銀行卡、POS機(jī)、ATM機(jī))、虛擬物品(手機(jī)號、銀行卡號)、交通工具、運(yùn)輸工具、盜竊工具、限制運(yùn)輸物品;
事件類標(biāo)簽包括:執(zhí)法過錯、執(zhí)法不規(guī)范、出警不及時、處警不規(guī)范、反饋不屬實、有警不出、推諉扯皮;
時間類標(biāo)簽包括:日期標(biāo)簽(節(jié)日、工作日、周末)、時間標(biāo)簽(凌晨、上午、下午、傍晚)、季節(jié)標(biāo)簽(春季、夏季、秋季、冬季)、頻次標(biāo)簽。
每一類有多個實體對象,這些實體對象均有一套自身的標(biāo)簽系統(tǒng),以時間類標(biāo)簽體系為例,如圖4所示。
公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng)利用基礎(chǔ)屬性標(biāo)注、統(tǒng)計、模型算法及大數(shù)據(jù)分析等技術(shù),將監(jiān)督管理業(yè)務(wù)對象實體形成屬性標(biāo)簽、統(tǒng)計分析標(biāo)簽和模型算法標(biāo)簽,其主要功能包括標(biāo)簽開發(fā)、標(biāo)簽管理、標(biāo)簽展示和標(biāo)簽應(yīng)用等,并提供服務(wù)接口為其他系統(tǒng)提供標(biāo)簽服務(wù)。
系統(tǒng)采用交互式數(shù)據(jù)處理方式,實現(xiàn)標(biāo)簽的可視化開發(fā),無需梳理復(fù)雜的SQL邏輯,代替手工寫腳本,實現(xiàn)所見即所得。采用基于內(nèi)存的實時計算方式,依托Pipeline技術(shù)進(jìn)行交互式數(shù)據(jù)探索,可有效提高計算性能,加快標(biāo)簽輸出速度。功能界面如圖5所示。
標(biāo)簽管理模塊允許用戶創(chuàng)建多種多樣的實體,以實體作為標(biāo)簽體系構(gòu)建的基礎(chǔ)。用戶可根據(jù)業(yè)務(wù)的實際需求制定適合的標(biāo)簽實體體系,包含標(biāo)簽業(yè)務(wù)屬性定義、標(biāo)簽規(guī)則定義、標(biāo)簽發(fā)布、標(biāo)簽導(dǎo)入導(dǎo)出等功能。
提供各標(biāo)簽實體的標(biāo)簽體系概況展示功能,為用戶展示標(biāo)簽體系的多層級分類概況、標(biāo)簽屬性內(nèi)容信息及實體覆蓋情況,用戶可查看各標(biāo)簽的分類、主題、業(yè)務(wù)領(lǐng)域、標(biāo)簽類型、更新周期等信息,整體掌握標(biāo)簽體系情況。功能界面如圖6所示。
系統(tǒng)實現(xiàn)為監(jiān)督對象畫像提供實體全方位信息描繪,分區(qū)域展示標(biāo)簽信息。通過用戶微觀畫像,全方位了解用戶特征、偏好、需求等,為用戶精細(xì)化管理與分析提供決策支持。用戶只需要輸入標(biāo)簽的唯一標(biāo)識信息,系統(tǒng)即可自動輸出對應(yīng)的全息標(biāo)簽畫像。功能界面如圖7所示。
提供開放共享服務(wù)接口,為監(jiān)督管理業(yè)務(wù)應(yīng)用平臺及其他系統(tǒng)提供標(biāo)簽數(shù)據(jù)服務(wù)。
目前,公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng)及其關(guān)鍵技術(shù)已經(jīng)應(yīng)用在公安監(jiān)督管理業(yè)務(wù)場景中,通過對各業(yè)務(wù)警種的數(shù)據(jù)治理,構(gòu)建人員、地點(diǎn)、物品、事件、時間五大類實體標(biāo)簽,以每個實體作為一個分析維度,再通過人、地、事、物、時間多個體系的關(guān)聯(lián)和打通,用一個多維的標(biāo)簽體系來描述一個具體的實體,在監(jiān)督管理具體的業(yè)務(wù)場景中,以這個實體為中心設(shè)計監(jiān)督管理預(yù)警項,建立標(biāo)簽規(guī)則,最終形成與公安監(jiān)督管理業(yè)務(wù)緊密貼合的動態(tài)標(biāo)簽體系,從而改變現(xiàn)有的公安監(jiān)督管理手段、方式,大大提升各級公安監(jiān)督管理工作效能。
本文基于斯坦福本體構(gòu)建七步法,對公安監(jiān)督管理標(biāo)簽體系整體構(gòu)建方法進(jìn)行了詳細(xì)的闡述,通過對監(jiān)督管理業(yè)務(wù)的標(biāo)簽數(shù)據(jù)分析,對照公安監(jiān)督管理標(biāo)簽構(gòu)建方法,初步構(gòu)建了公安監(jiān)督管理動態(tài)標(biāo)簽體系,并實現(xiàn)了公安監(jiān)督管理動態(tài)標(biāo)簽系統(tǒng)。后續(xù)將隨著公安監(jiān)督管理業(yè)務(wù)和應(yīng)用的開展不斷優(yōu)化完善,從而促進(jìn)公安監(jiān)督管理業(yè)務(wù)模型向智能化、自動化方向發(fā)展。