路沙
在明略數(shù)據(jù)副總裁唐日新看來,從事公安大數(shù)據(jù)的研究和應用工作是一件很辛苦的事情。之所以這樣說,一方面是因為這項工作沒有前人的經(jīng)驗可供借鑒,完全是摸著石頭過河;另一方面是因為這項工作涉及到社會及人的生命財產(chǎn)安全,所以要求極其精準的數(shù)據(jù)服務,不能出現(xiàn)絲毫的冗余度。俗話說“越困難的事情就越值得去做,因為做成了會很有成就感?!蹦壳?,明略數(shù)據(jù)以及唐日新正在這樣一條攻堅克難的路上踽踽而行。
如今,隨著公安信息化建設的迅猛發(fā)展,公安大數(shù)據(jù)的建設和應用工作也得到了長足進步。大數(shù)據(jù)時代,公共安全部門可以通過全面采集和整合海量數(shù)據(jù),對數(shù)據(jù)進行處理、分析、挖掘,從而發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在規(guī)律,進而為預防和打擊犯罪提供強有力的支撐。
不過,做好這項工作既需要解決不同部門之間的數(shù)據(jù)孤島,又需要高效、穩(wěn)定的公安大數(shù)據(jù)平臺提供保障。完成如此復雜、技術難度大的工作僅僅依靠公共安全部門本身自然不太現(xiàn)實,這時候就需要像明略數(shù)據(jù)這樣的企業(yè)從頂層設計、平臺搭建以及底層架構建設等方面為公共安全部門提供高效服務。
SCOPA系統(tǒng)讓數(shù)據(jù)更加可視化
采訪中,唐日新提到“實時、實戰(zhàn)”是明略數(shù)據(jù)從事公安大數(shù)據(jù)研究與應用的宗旨和理念。而為了應對實戰(zhàn)要求,明略數(shù)據(jù)也在不斷完善著自身大數(shù)據(jù)的技術能力和應用范圍。目前,結(jié)合具體的實戰(zhàn)經(jīng)驗,明略數(shù)據(jù)可以為公共安全部門提供安全可靠、高效易用的大數(shù)據(jù)平臺MDP和大數(shù)據(jù)關聯(lián)關系挖掘系統(tǒng)SCOPA。
MDP平臺解決的是公共安全部門使用大數(shù)據(jù)技術時出現(xiàn)的網(wǎng)絡、主機、服務和數(shù)據(jù)安全問題。同時,還能夠根據(jù)業(yè)務模型、支撐數(shù)據(jù)的不斷豐富以及數(shù)據(jù)挖掘模型的不斷優(yōu)化,從而實現(xiàn)數(shù)據(jù)的可視化展現(xiàn),為公共安全部門在社會管理、維穩(wěn)處突、警務協(xié)同等方面提供優(yōu)化的決策依據(jù)。
有了基礎的大數(shù)據(jù)平臺和數(shù)據(jù)化展現(xiàn),數(shù)據(jù)的關聯(lián)關系挖掘就顯得至關重要。這個時候,SCOPA系統(tǒng)就派上了用場。SCOPA系統(tǒng)基于軍工級安全的存儲和尖端的運算能力、圖形數(shù)據(jù)庫技術和大量的預測模型和戰(zhàn)法,能夠?qū)θ繑?shù)據(jù)進行秒級運算的關聯(lián)關系挖掘。最重要的是,運算的結(jié)果能夠通過交互可視化方式,幫助公共安全部門快速厘清各種數(shù)據(jù)背后的復雜關系,從而為部門決策采取進一步行動提供有效的指導。
唐日新表示,其實最早的時候公共數(shù)據(jù)安全領域解決的是數(shù)據(jù)匯聚存儲的問題,所以需要建設大規(guī)模的數(shù)據(jù)平臺,而在平臺建設過程中應該從應用部署總體架構方面去分析,也就是說平臺建設要服務于頂層設計和應用愿景。
建設立體、全息的知識圖譜
“由于明略本身擁有大量的社會數(shù)據(jù),再結(jié)合公安內(nèi)部的數(shù)據(jù)可以去搭建全息的知識圖譜。我們希望在未來編織成一張立體的、全方位的、底層的知識圖譜,這個知識圖譜不光包括人、事件,還要包括其他各方面因素?!碧迫招氯绱苏f道。
公安內(nèi)部的數(shù)據(jù)來自于全國公安機關已建成的包括全國人口基本信息資源庫、全國在逃人員信息資源庫、全國出入境人員信息資源庫在內(nèi)的八大資源庫和警綜平臺庫等數(shù)十個內(nèi)部系統(tǒng)庫。而隨著庫內(nèi)數(shù)據(jù)信息的持續(xù)增長,公共安全部門急需對現(xiàn)有信息和資源進行進一步深度挖掘和應用,并利用高效的數(shù)據(jù)治理方法整合打通數(shù)據(jù)之間的關聯(lián),根據(jù)案件發(fā)生規(guī)律和特點,挖掘數(shù)據(jù)之間的隱性關聯(lián),為案件的研判打好堅實基礎。
從另一層面來講,這種數(shù)據(jù)的關聯(lián)關系挖掘需要建立合適的關系人分析、軌跡分析、案件分析等基礎戰(zhàn)法,同時要研究分析各類業(yè)務的規(guī)律特征,例如作案手法、作案人員、活動軌跡等,逐步積累業(yè)務規(guī)律與技戰(zhàn)法,從而不斷完善業(yè)務模型庫和知識庫。
基于立體、全息的知識圖譜,可以讓機器變得更加智慧化和智能化,從而形成智慧的“警察大腦”,做到更精準的預測和預警。
強化數(shù)據(jù)智能化管控和處理能力
唐日新提到,作為所有做數(shù)據(jù)工作的人來說,智能化的數(shù)據(jù)管控和處理能力是一個重要的痛點。之所以這樣說,是因為預測結(jié)果與實際情況不相符的情況是所有數(shù)據(jù)服務提供商所面臨的共同壓力。
為了應對這個挑戰(zhàn)就要在應用戰(zhàn)法方面不斷完善,同時需要在應用過程中不斷進行機器學習和深度學習的技術迭代,從而通過更加智能化的數(shù)據(jù)處理能力提升數(shù)據(jù)預測和判斷的準確性。
與此同時,這項工作與智慧警務的建設也是密切相關的。要做好這項工作,就需要一個聰明的“大腦”,而這個“大腦”,按照唐日新的理解,就是一個引擎或者發(fā)動機。如果這個引擎的效率不高,那么要想去挖掘大量人口的出行、交通、住宿以及社交等信息,就會變得很困難。