隨著信息技術的不斷發(fā)展,尤其以移動互聯(lián)網(wǎng)為代表技術的不斷發(fā)展,產生了海量數(shù)據(jù)。對此,傳統(tǒng)的數(shù)據(jù)存儲和分析等技術顯得無計可施,大數(shù)據(jù)技術由此脫穎而出。2013年是大數(shù)據(jù)發(fā)展元年①劉維貴:《“大數(shù)據(jù)”研究綜述》,《辦公自動化》2014年第1期。,作為一門新興技術,其蘊含著巨大的社會、經(jīng)濟效益,已得到社會各部門的高度重視,正在深度融入各行各業(yè),給相關行業(yè)帶來前所未有的機遇和挑戰(zhàn)。從本質上講,大數(shù)據(jù)屬于一種數(shù)據(jù)處理技術,其核心是數(shù)據(jù)。由于數(shù)據(jù)的質量對大數(shù)據(jù)處理結果起著關鍵性的作用,因而近年來各個行業(yè)日益重視數(shù)據(jù)治理工作。
隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計算等技術的快速發(fā)展,海量的數(shù)據(jù),尤其是非結構化數(shù)據(jù)不斷產生。據(jù)市場調研機構IDC 預計,未來全球數(shù)據(jù)總量年增長率將維持在50%左右,到2020年全球數(shù)據(jù)總量將達到40ZB,其中我國數(shù)據(jù)量將達到8.6ZB,占21%左右。面對海量數(shù)據(jù)處理需求,傳統(tǒng)的數(shù)據(jù)存儲、分析技術難以實時處理海量異構數(shù)據(jù),因此產生了大數(shù)據(jù)技術。
著名咨詢機構麥肯錫將大數(shù)據(jù)定義為一種規(guī)模大到在獲取、存儲、管理、分析方面遠遠超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,其主要具有四個特征(4V):數(shù)據(jù)規(guī)模大(Volume)、數(shù)據(jù)種類多(Variety)、數(shù)據(jù)處理速度快(Velocity)、數(shù)據(jù)價值密度低(Value)。
大數(shù)據(jù)作為專門處理海量數(shù)據(jù)的一種技術,其主要包括數(shù)據(jù)采集、數(shù)據(jù)預處理、數(shù)據(jù)存儲和數(shù)據(jù)挖掘分析等技術。在大數(shù)據(jù)技術中,處于核心地位的是數(shù)據(jù),所有的操作都是圍繞著數(shù)據(jù)。由于數(shù)據(jù)已經(jīng)成為一種重要的資源,各行各業(yè)紛紛對擁有的數(shù)據(jù)進行分析挖掘,利用數(shù)據(jù)創(chuàng)造價值,提升決策能力和執(zhí)行效率。實踐中,數(shù)據(jù)質量的優(yōu)劣直接影響大數(shù)據(jù)的應用效果①張寧、袁勤儉:《數(shù)據(jù)治理研究述評》,《情報雜志》2017年第5期。,因此各個行業(yè)十分重視數(shù)據(jù)治理。
目前,業(yè)界還沒有統(tǒng)一的數(shù)據(jù)治理定義,不同機構的定義各不相同②彭雪濤:《美國高校數(shù)據(jù)治理及其借鑒》,《電化教育研究》2017年第6期。。美國DAMA 認為數(shù)據(jù)治理是指對數(shù)據(jù)資產行使權利和控制的活動集合,包括計劃、監(jiān)控和執(zhí)行等;PTAC(Privacy Technical Assistance Center)則認為數(shù)據(jù)治理是對數(shù)據(jù)和信息進行管理的組織行為,是涵蓋采集、使用到清理的數(shù)據(jù)全生命周期的政策和程序集;ECAR(EDUCAUSE Center for Applied Research)認為數(shù)據(jù)治理維護數(shù)據(jù)完整性,對數(shù)據(jù)訪問實行有效控制,確保組織的數(shù)據(jù)資產安全。
就公安院校而言,其治理的數(shù)據(jù)主要包括學校各業(yè)務部門系統(tǒng)中的數(shù)據(jù)③許曉東、王錦華、卞良、孟倩:《高等教育的數(shù)據(jù)治理研究》,《高等工程教育研究》2015年第5期。。比如,教務處掌握的教師教學和學生成績等數(shù)據(jù),科研處掌握的教師科研相關數(shù)據(jù),學生處掌握學生相關數(shù)據(jù)等等。此外,公安院校治理的數(shù)據(jù)還包括互聯(lián)網(wǎng)中與學校相關各類內容,以及學校內部各種設備采集的數(shù)據(jù),如攝像頭采集的視頻,無線WiFi 采集的設備MAC 地址等。此外,區(qū)別于普通高校,公安院校治理的數(shù)據(jù)還包括與公安教學相關的實戰(zhàn)案例和公安業(yè)務數(shù)據(jù)。對這些數(shù)據(jù)進行治理,特別強調數(shù)據(jù)安全④單勇:《以數(shù)據(jù)治理創(chuàng)新社會治安防控體系》,《中國特色社會主義研究》2015 第4期。。
公安院校數(shù)據(jù)治理的應用可以使相關工作變得更加智能化、精準化和高效率,因而具有十分重要的意義:一是數(shù)據(jù)治理有利于科學決策。傳統(tǒng)決策方式主要依靠決策者的主觀經(jīng)驗,基于數(shù)據(jù)治理則使得每個決策的制定都有可靠數(shù)據(jù)做支撐。例如,后勤部門在采購實驗室計算機時,就可以根據(jù)需要上機實驗的課程數(shù)量及課時數(shù)、課程對機器配置要求和學生人數(shù)等相關數(shù)據(jù)作出科學的決策;二是數(shù)據(jù)治理有利于管理效率。基于數(shù)據(jù)治理,能夠厘清各業(yè)務部門、各管理系統(tǒng)的數(shù)據(jù)流,從而簡化優(yōu)化業(yè)務流程,提升工作效率;三是數(shù)據(jù)治理有利于精準分析?;跀?shù)據(jù)治理,并結合相關分析模型能夠實現(xiàn)精準分析。例如,可以通過教務系統(tǒng)教學數(shù)據(jù)和科研系統(tǒng)中科研數(shù)據(jù)對教師進行多維度、全方位的精準分析;四是數(shù)據(jù)治理有利于有效預警?;跀?shù)據(jù)治理,公安院校能夠對存在的隱患進行有效預警,通過提前介入而將損失降到最低。比如,通過對學生的行為數(shù)據(jù)進行建模分析,對學生的異常情況進行有效預警。
在大數(shù)據(jù)時代,數(shù)據(jù)成了核心資源,合理地利用數(shù)據(jù),對數(shù)據(jù)進行分析挖掘,能夠有利于科學決策,提升業(yè)務效率。因此提升數(shù)據(jù)質量,對數(shù)據(jù)進行治理顯得尤為重要。目前,包括公安院校在內的很多單位的數(shù)據(jù)治理工作還處于初級階段⑤張一鳴:《數(shù)據(jù)治理過程淺析》,《中國信息界》2012年第9期。,還存在以下一些突出問題。
大數(shù)據(jù)時代,數(shù)據(jù)的深度應用成為提高競爭力和生產力的關鍵要素。然而,目前仍存在著部分工作人員缺乏對數(shù)據(jù)治理和大數(shù)據(jù)應用的重視,盲目迷信自己的經(jīng)驗,以個人因果推理取代數(shù)據(jù)分析,對大數(shù)據(jù)分析產生抵制。與此同時,由于缺少必要的數(shù)據(jù)管理,導致數(shù)據(jù)出現(xiàn)不完整、不一致、可用性差等問題,這又會進一步影響數(shù)據(jù)的分析結果。
由于缺少頂層設計,管理規(guī)范缺失,制度不健全,同時又缺少對基礎數(shù)據(jù)的規(guī)劃,導致在各個業(yè)務系統(tǒng)中許多基礎數(shù)據(jù)被重復建設;并且這些系統(tǒng)采用的標準和規(guī)則各不相同,造成數(shù)據(jù)分散存儲和因冗余而產生不一致的現(xiàn)象。另外,由于缺乏數(shù)據(jù)治理的權責體系,又會產生諸如數(shù)據(jù)規(guī)劃應由哪些人員設計、哪些工作應由業(yè)務部門承擔、哪些應由信息化技術管理部門承擔等等權利不清、責任不明的問題,甚至還會出現(xiàn)缺少關鍵基礎數(shù)據(jù)、部分輔助數(shù)據(jù)缺失或不全面、歷史數(shù)據(jù)丟失嚴重等數(shù)據(jù)不完整的問題。
在許多公安院校,各個工作部門都有自己的業(yè)務系統(tǒng)和數(shù)據(jù)。一方面,它們視自己的業(yè)務數(shù)據(jù)為核心競爭力,不愿共享;也有一些部門以業(yè)務數(shù)據(jù)需要保密以及節(jié)省數(shù)據(jù)整理成本為由,不敢共享數(shù)據(jù);還有些部門缺乏數(shù)據(jù)公開共享的動力,因懶政而讓數(shù)據(jù)睡覺,不想公開數(shù)據(jù)。這些都導致大量業(yè)務部門數(shù)據(jù)存在“不愿公開、不敢公開、不想公開”的問題,形成人為的“數(shù)據(jù)孤島”。另一方面,雖然愿意公開共享數(shù)據(jù),但是因為缺乏統(tǒng)一的規(guī)劃和標準數(shù)據(jù)接口而導致數(shù)據(jù)格式標準缺失,無法進行關聯(lián)融合,造成大量業(yè)務部門數(shù)據(jù)存在“不會公開”的問題,形成技術上的“數(shù)據(jù)孤島”?!皵?shù)據(jù)孤島”的形成,使得后期數(shù)據(jù)共享和整合的成本非常高。
目前各單位的數(shù)據(jù)來源單一,主要來自內部業(yè)務系統(tǒng)。但在大數(shù)據(jù)時代,不僅要求數(shù)據(jù)量大,而且要求數(shù)據(jù)種類豐富。因此,在單位內部需將各部門的數(shù)據(jù)進行有效整合,同時也需要整合外部有效數(shù)據(jù),進一步提升大數(shù)據(jù)應用能力。公安院校作為專業(yè)院校,在教學和實戰(zhàn)訓練方面需要加強與公安機關的聯(lián)系,整合公安機關各類自有數(shù)據(jù)以及社會數(shù)據(jù)等外部數(shù)據(jù)。但在目前,公安院校缺少與外部數(shù)據(jù)的交互能力,數(shù)據(jù)融合不充分,這也進一步限制了相關工作的開展。
大數(shù)據(jù)猶如一把雙刃劍,在給各單位帶來便利的同時,數(shù)據(jù)安全和隱私保護等問題也日益凸顯。公安院校數(shù)據(jù)治理所涉及的數(shù)據(jù)既有在校教師和學生的個人信息,也有公安機關實戰(zhàn)案例、公安機關自有數(shù)據(jù)和相關社會數(shù)據(jù)。這些數(shù)據(jù)或是屬于個人隱私,或是具有一定的機密性,都需要加以安全地保管、保護。然而,目前公安院校對這些數(shù)據(jù)治理的方式與普通數(shù)據(jù)沒有區(qū)分,都是以明文的方式存儲于學校的服務器之中,數(shù)據(jù)的安全性完全取決于存儲服務器的口令,缺乏相關安全隱私保護機制。一旦存儲機密隱私數(shù)據(jù)的服務器被黑客攻擊,那么數(shù)據(jù)毫無安全性可言。
近幾年,大數(shù)據(jù)技術已給各行各業(yè)用戶帶來了巨大的經(jīng)濟效益和社會效益。為充分發(fā)揮大數(shù)據(jù)技術的優(yōu)勢,公安院校需要從以下幾個方面進一步做好數(shù)據(jù)治理工作。
公安院校各級領導和教職員工都應強化數(shù)據(jù)治理意識和大數(shù)據(jù)理念,從“經(jīng)驗主義”向“數(shù)據(jù)主義”決策轉變,真正認識到數(shù)據(jù)的價值。要建立“用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新”的管理機制,實現(xiàn)基于數(shù)據(jù)的科學決策,推動管理理念和治理模式的改革。要盡快打破數(shù)據(jù)存在的壁壘,提升數(shù)據(jù)的開放和共享,使數(shù)據(jù)的價值得到充分的挖掘。高校師生需要的是服務,而不是服務器以及里面的數(shù)據(jù)。為此,各級部門要在數(shù)據(jù)治理的基礎上充分利用數(shù)據(jù),簡化優(yōu)化工作流程,使師生得到優(yōu)質服務,實現(xiàn)讓“數(shù)據(jù)多跑路,師生少跑腿”。
為能夠有效進行數(shù)據(jù)治理,公安院校應從頂層設計規(guī)劃數(shù)據(jù)治理,建立數(shù)據(jù)標準體系,成立以校領導為負責人的信息化或智慧校園領導小組作為指導機構,通過行政手段確保各項措施的落實,并由領導小組進行相關工作的協(xié)調,督查督辦。同時,也要落實數(shù)據(jù)治理權責體系,明確各部門在數(shù)據(jù)治理工作中的崗位職責。相關業(yè)務部門聯(lián)合討論數(shù)據(jù)治理的方案,建立交叉數(shù)據(jù)分析模型;技術部門負責具體實施,建立統(tǒng)一數(shù)據(jù)中心,搭建數(shù)據(jù)共享平臺,完善數(shù)據(jù)共享機制。通過機制和技術雙重保證,打破長期存在的數(shù)據(jù)壁壘,實現(xiàn)數(shù)據(jù)共享機制。要做好基礎數(shù)據(jù)保障工作,根據(jù)權責劃分,由指定部門負責更新,供全校各系統(tǒng)共享,避免數(shù)據(jù)重復建設和因冗余而造成數(shù)據(jù)的不一致和可用性差等問題。
公安院校應該建立主數(shù)據(jù)中心,使用Hadoop 等主流分布式計算框架,匯聚全校的業(yè)務數(shù)據(jù),確保能夠快速訪問數(shù)據(jù),并且保證數(shù)據(jù)的準確性、完整性和一致性。作為數(shù)據(jù)治理具體實施部門,技術部門需要加強信息系統(tǒng)的設計,在需求分析階段根據(jù)標準數(shù)據(jù)規(guī)范細化各項需求和數(shù)據(jù)庫設計。針對部分機密數(shù)據(jù),需要通過相關信息安全技術手段加強安全保護機制,在數(shù)據(jù)安全管理制度的指導下,對機密數(shù)據(jù)實施數(shù)據(jù)加密、脫敏、監(jiān)控、審計和數(shù)據(jù)備份、恢復等操作。
在大數(shù)據(jù)時代,數(shù)據(jù)是各部門的核心資源,具有很高的價值。數(shù)據(jù)的價值主要拖過分析、挖掘來實現(xiàn)的。通過數(shù)據(jù)治理,各部門保存著海量數(shù)據(jù),通過對這些數(shù)據(jù)進行統(tǒng)計分析和數(shù)據(jù)挖掘,可以從中提取出有價值的信息,從而提升決策能力和執(zhí)行效率,實現(xiàn)數(shù)據(jù)治理更大價值。
隨著大數(shù)據(jù)時代的到來和數(shù)據(jù)應用的快速發(fā)展,數(shù)據(jù)越來越成為一種核心競爭力。數(shù)據(jù)質量的優(yōu)劣直接影響著數(shù)據(jù)應用的效果,而數(shù)據(jù)治理是保證數(shù)據(jù)質量的必要手段。為此,包括公安院校在內的各類數(shù)據(jù)用戶必須十分重視數(shù)據(jù)治理工作。由于目前數(shù)據(jù)治理工作仍處于初級階段,所以各用戶單位需要從主觀認識和具體措施等兩方面對數(shù)據(jù)治理進行變革,雙管齊下,不斷提升數(shù)據(jù)治理水平,提高數(shù)據(jù)質量,從而獲得持續(xù)的核心競爭力。