□ 文| 劉成秀
大數(shù)據(jù)被稱為是新型戰(zhàn)略資源,它具有量體巨大、來源多樣、生成極快、多變等特點(diǎn)且難以用傳統(tǒng)數(shù)據(jù)體系結(jié)構(gòu)有效處理的包含大量數(shù)據(jù)集的數(shù)據(jù)。通常被認(rèn)為是采用多種數(shù)據(jù)收集方式、整合多種數(shù)據(jù)來源的數(shù)據(jù),由機(jī)器具自動(dòng)化或半自動(dòng)化生成,不是專門為統(tǒng)計(jì)目的而產(chǎn)生,是有高度應(yīng)用價(jià)值和決策支持功能的數(shù)據(jù)。大數(shù)據(jù)作為統(tǒng)計(jì)數(shù)據(jù)的來源“第二規(guī)”,應(yīng)用領(lǐng)域廣泛,幾乎覆蓋數(shù)據(jù)采集、存儲(chǔ)、分析和發(fā)布等整個(gè)統(tǒng)計(jì)過程,對統(tǒng)計(jì)工作具有重要的補(bǔ)充作用。在行政記錄數(shù)據(jù)的獲取方面,國家統(tǒng)計(jì)局積極推進(jìn)與各部門的合作,加快數(shù)據(jù)共享機(jī)制;在商業(yè)記錄數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)的獲取方面,國家統(tǒng)計(jì)局不斷加大與各類數(shù)據(jù)企業(yè)的合作力度,與阿里巴巴、百度、聯(lián)通等大數(shù)據(jù)相關(guān)企業(yè)簽署了大數(shù)據(jù)戰(zhàn)略合作框架協(xié)議,利用企業(yè)數(shù)據(jù)完善、補(bǔ)充政府統(tǒng)計(jì);在遙感數(shù)據(jù)利用方面,積極運(yùn)用高新技術(shù)獲取農(nóng)業(yè)領(lǐng)域的海量數(shù)據(jù),完善農(nóng)作物播種面積和產(chǎn)量估計(jì),提高農(nóng)業(yè)調(diào)查的科學(xué)性、準(zhǔn)確性和實(shí)效性。不同類型的數(shù)據(jù)源可用于政府統(tǒng)計(jì)數(shù)據(jù)的補(bǔ)缺,校驗(yàn)、評估、推算等各個(gè)方面,基于云計(jì)算、互聯(lián)網(wǎng)、遙定位等領(lǐng)域的大數(shù)據(jù)技術(shù),可以為政府統(tǒng)計(jì)數(shù)據(jù)處理提供有力度的技術(shù)支撐。2015年9月,國務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,其中重要任務(wù)之一就是“加快政府?dāng)?shù)據(jù)開放共享,推動(dòng)資源整合,提升治理能力”,并明確了時(shí)間節(jié)點(diǎn),2017年跨部門數(shù)據(jù)資源共享共用格局基本形成;2018年建成政府主導(dǎo)的數(shù)據(jù)共享開放平臺(tái),打通政府部門、企事業(yè)單位間的數(shù)據(jù)壁壘,并在部分領(lǐng)域開展應(yīng)用試點(diǎn);2020年實(shí)現(xiàn)政府?dāng)?shù)據(jù)集的普遍開放。
1.在醫(yī)療衛(wèi)生領(lǐng)域的運(yùn)用。以往政府部門多利用對醫(yī)療機(jī)構(gòu)的個(gè)數(shù)、就診人數(shù)及次數(shù)等事后數(shù)據(jù),對醫(yī)療服務(wù)狀況進(jìn)行研究,但引入互聯(lián)網(wǎng)大數(shù)據(jù)后,可以使用在線數(shù)據(jù)對疾病發(fā)展趨勢進(jìn)行分析。通過對熱搜關(guān)鍵詞的研究,組建大數(shù)據(jù)模型,實(shí)現(xiàn)對某區(qū)域未來疾病動(dòng)態(tài)數(shù)據(jù)的預(yù)測及各城市熱點(diǎn)疾病的重點(diǎn)治療醫(yī)院進(jìn)行排名。通過互聯(lián)網(wǎng)搜索大數(shù)據(jù)的使用,將提高衛(wèi)生監(jiān)測部門對流行疾病發(fā)展?fàn)顩r的掌握程度,使其可以提前做好預(yù)防策略的制定,完善熱點(diǎn)醫(yī)院的管理督查工作。
2.在統(tǒng)計(jì)人口。以往政府進(jìn)行統(tǒng)計(jì)人口的時(shí)候,需要消耗大量的人財(cái)物,才能完成普查,并獲得數(shù)據(jù)包括全國和地區(qū)人口數(shù)量、城市和農(nóng)村人口數(shù)量、人口性別比例、人口地域分布、年齡結(jié)構(gòu)、出生死亡率等;若使用互聯(lián)網(wǎng),將極快的獲取網(wǎng)民所在的地域、性別等數(shù)據(jù),同時(shí)還可以通過對網(wǎng)民行為的研究,得出其消費(fèi)的能力、興趣愛好等特征。
3.在經(jīng)濟(jì)發(fā)展中的使用。以往官方都以月度、季度等對各項(xiàng)經(jīng)濟(jì)指標(biāo)進(jìn)行統(tǒng)計(jì),現(xiàn)如今,互聯(lián)網(wǎng)企業(yè)能夠利用大數(shù)據(jù)實(shí)現(xiàn)所有經(jīng)濟(jì)指標(biāo)的搜索與完善,使其在第一時(shí)間對國民的經(jīng)濟(jì)運(yùn)行情況進(jìn)行展現(xiàn),讓宏觀經(jīng)濟(jì)監(jiān)測及時(shí)性、可靠性及覆蓋面積得以提高,同時(shí)也為宏觀經(jīng)濟(jì)部門對未來經(jīng)濟(jì)的發(fā)展行情、預(yù)測等提供了數(shù)據(jù)支持。
4.在社會(huì)就業(yè)中的運(yùn)用。以往政府部門都利用畢業(yè)生人數(shù)增長數(shù)量與勞動(dòng)力需求增長狀況的數(shù)據(jù)比較,分析就業(yè)形勢。但引入互聯(lián)網(wǎng)大數(shù)據(jù)后,就可以利用對網(wǎng)面搜索關(guān)鍵詞趨勢的研究,了解畢業(yè)生就業(yè)需求與壓力所在。例如,通過對“找工作”一詞的搜索數(shù)量變化,掌握畢業(yè)生求職需求,從而填補(bǔ)人社部數(shù)據(jù)空白,掌握社會(huì)就業(yè)需求及就業(yè)趨勢,做好政策的制定與微調(diào)。
5.在價(jià)格統(tǒng)計(jì)中的運(yùn)用。以GPI統(tǒng)計(jì)為例,價(jià)格統(tǒng)計(jì)的最新數(shù)據(jù)來源包括互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)、電子商務(wù)交易數(shù)據(jù)等,相關(guān)數(shù)據(jù)具有量大、更新速度快等優(yōu)點(diǎn),做好相關(guān)數(shù)據(jù)的使用,將進(jìn)一步減少統(tǒng)計(jì)開支,增加指標(biāo)發(fā)布次數(shù)。一般可通過以下三種方法利用大數(shù)據(jù)完善價(jià)格統(tǒng)計(jì)工作:一是采用搜索方式收集網(wǎng)上交易價(jià)格數(shù)據(jù);二是與電子商務(wù)企業(yè)進(jìn)行合作,獲取交易價(jià)格數(shù)據(jù);三是建立商場、超市、醫(yī)院等實(shí)行電子計(jì)價(jià)的采價(jià)點(diǎn)向統(tǒng)計(jì)部門報(bào)送交易記錄的制度。例如國家統(tǒng)計(jì)局從2014年起開展網(wǎng)絡(luò)抓取部分商品的網(wǎng)絡(luò)價(jià)格來預(yù)測居民消費(fèi)價(jià)格指數(shù)(CPI)的試點(diǎn),積極推進(jìn)有條件的地區(qū)利用商場和超市的電子數(shù)據(jù)進(jìn)行部分商品的價(jià)格收集工作,并利用超市和商場的掃描資料評估CPI新基期權(quán)數(shù),等等。大數(shù)據(jù)在統(tǒng)計(jì)工作中如此廣泛的應(yīng)用,大數(shù)據(jù)時(shí)代的數(shù)據(jù)非常繁雜,數(shù)量驚人,近年來,數(shù)據(jù)安全和隱私數(shù)據(jù)泄露事件頻發(fā),凸顯大數(shù)據(jù)發(fā)展面臨的嚴(yán)峻挑戰(zhàn)。在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)在采集、存儲(chǔ)、跨境跨系統(tǒng)流轉(zhuǎn)、利用、交易和銷毀等環(huán)節(jié)的全生命周期過程中,所有權(quán)與管理權(quán)分離,真假難辨,多系統(tǒng)、多環(huán)節(jié)的信息隱性留存,導(dǎo)致數(shù)據(jù)跨境跨系統(tǒng)流轉(zhuǎn)追蹤難、控制難,數(shù)據(jù)確權(quán)和可信銷毀也更加困難。如何保證這些信息數(shù)據(jù)在有效利用之前的安全是一個(gè)非常嚴(yán)肅的問題。如何防護(hù)數(shù)據(jù)的安全性,加強(qiáng)安全防護(hù)措施顯得非常重要。
加強(qiáng)數(shù)據(jù)結(jié)構(gòu)化管理。結(jié)構(gòu)化的數(shù)據(jù)便于管理和加密,更便于處理和分類,能夠有效的智能分辨非法入侵?jǐn)?shù)據(jù),保證數(shù)據(jù)的安全。數(shù)據(jù)結(jié)構(gòu)化雖然不能夠徹底改變數(shù)據(jù)安全的格局,但是能夠加快數(shù)據(jù)安全系統(tǒng)的處理效率。
加強(qiáng)網(wǎng)絡(luò)層端點(diǎn)的數(shù)據(jù)安全性。常規(guī)的數(shù)據(jù)安全模式通常是分層構(gòu)建?,F(xiàn)有的端點(diǎn)安全方式對于網(wǎng)絡(luò)層的安全防護(hù)并不完美。一方面是大數(shù)據(jù)時(shí)代的信息爆炸,導(dǎo)致服務(wù)端的非法入侵次數(shù)急劇增長,這對于網(wǎng)絡(luò)層的考驗(yàn)十分的嚴(yán)峻;另一方面由于云計(jì)算的大趨勢,現(xiàn)在的網(wǎng)絡(luò)數(shù)據(jù)威脅方式和方法越來越難以預(yù)測辨識(shí),這給現(xiàn)有的端點(diǎn)數(shù)據(jù)安全模式造成了巨大的壓力。在未來,網(wǎng)絡(luò)層安全應(yīng)當(dāng)作為重點(diǎn)發(fā)展的一個(gè)層面。在加強(qiáng)網(wǎng)絡(luò)層數(shù)據(jù)辨識(shí)智能化,結(jié)構(gòu)化的基礎(chǔ)上加上與本地系統(tǒng)的相互監(jiān)控協(xié)調(diào),同時(shí)杜絕非常態(tài)數(shù)據(jù)的運(yùn)行,這樣就能夠在網(wǎng)絡(luò)層構(gòu)筑屬于大數(shù)據(jù)時(shí)代的全面安全堡壘,完善自身的缺陷。加強(qiáng)本地?cái)?shù)據(jù)安全策略。由于大數(shù)據(jù)時(shí)代的數(shù)據(jù)財(cái)富化導(dǎo)致了大量的信息泄露事件,而這些泄露事件中,來自內(nèi)部的威脅更大。雖然終端的數(shù)據(jù)安全已經(jīng)具備了成熟的本地安全防護(hù)系統(tǒng),但還需在本地策略的構(gòu)建上需要加入對于內(nèi)部管理的監(jiān)控,監(jiān)管手段。用純數(shù)據(jù)的模式來避免由于人為原因造成的數(shù)據(jù)流失,信息泄露。在未來的數(shù)據(jù)安全模式中,管理者的角色權(quán)重逐漸分化,數(shù)據(jù)本身的自我監(jiān)控和智能管理將代替一大部分人為的操作。在本地安全策略的構(gòu)建過程中還要加強(qiáng)與各個(gè)環(huán)節(jié)的協(xié)調(diào)。由于現(xiàn)在的數(shù)據(jù)處理方式往往會(huì)依托于網(wǎng)絡(luò),所以在數(shù)據(jù)的處理過程中會(huì)出現(xiàn)大量的數(shù)據(jù)調(diào)用,在調(diào)用過程中就容易出現(xiàn)很大的安全威脅。這樣就必須降本地和網(wǎng)絡(luò)的鏈接做的更細(xì)膩,完善緩存機(jī)制和儲(chǔ)存規(guī)則,有效保證數(shù)據(jù)源的純潔,從根本上杜絕數(shù)據(jù)的安全威脅。建立數(shù)據(jù)中心安全系統(tǒng)。針對傳統(tǒng)的數(shù)據(jù)存儲(chǔ),一般都建立了全面完善的防護(hù)措施。但基于云計(jì)算架構(gòu)的大數(shù)據(jù),還需進(jìn)一步完善數(shù)據(jù)存儲(chǔ)隔離與調(diào)用之間的數(shù)據(jù)邏輯關(guān)系設(shè)定。目前,大數(shù)據(jù)的安全存儲(chǔ)采用虛擬化海量存儲(chǔ)技術(shù)來存儲(chǔ)數(shù)據(jù)資源,數(shù)據(jù)的存儲(chǔ)和操作都是以服務(wù)的形式提供?;谠朴?jì)算的大數(shù)據(jù)存儲(chǔ)在云共享環(huán)境中,為了大數(shù)據(jù)的所有者可以對大數(shù)據(jù)使用進(jìn)行控制,可以通過建立一個(gè)基于數(shù)據(jù)為中心的安全系統(tǒng),從系統(tǒng)管理上保證大數(shù)據(jù)的安全。