孫躍
大數(shù)據(jù)與傳統(tǒng)的安全統(tǒng)計數(shù)據(jù)相比較,首先在理論知識方面具有極大的不同,傳統(tǒng)的安全統(tǒng)計數(shù)據(jù)維數(shù)是單維的;數(shù)據(jù)收集重點是非場景化數(shù)據(jù);數(shù)據(jù)之間具有因果關(guān)系的模型,采用描述性的數(shù)據(jù)使用方式;數(shù)據(jù)組織和存儲方式是關(guān)系型數(shù)據(jù)庫;面向?qū)ο蟮臄?shù)據(jù)結(jié)構(gòu);SQL數(shù)據(jù)庫數(shù)據(jù)存儲管理方法;數(shù)據(jù)生命周期隨研究過程的結(jié)束而終結(jié)。但是大數(shù)據(jù)具有多維的數(shù)據(jù)維數(shù);數(shù)據(jù)收集重點是場景化數(shù)據(jù);數(shù)據(jù)之間具有相關(guān)關(guān)系的模型,采用預(yù)測性的數(shù)據(jù)使用方式;數(shù)據(jù)組織和存儲方式采用關(guān)系型數(shù)據(jù)庫;面向主題的數(shù)據(jù)結(jié)構(gòu);NOSQL數(shù)據(jù)庫數(shù)據(jù)存儲管理方法;數(shù)據(jù)生命周期不隨研究過程的結(jié)束而終結(jié)。
在處理事故方面,通過在安全統(tǒng)計的過程中使用大數(shù)據(jù)的技術(shù),對于不同的數(shù)據(jù)進(jìn)行分析,得出安全事故發(fā)生的一些規(guī)律性的結(jié)論,可以有效地更有針對性的對于相關(guān)的事故進(jìn)行防范,安全科學(xué)領(lǐng)域使用大數(shù)據(jù)技術(shù),如對安全科學(xué)數(shù)據(jù)存儲和分析,找出事故發(fā)生的規(guī)律和特點,可以看到所有的數(shù)據(jù)將被忽略,捕獲潛在風(fēng)險信息之間的關(guān)系,控制情況,提前對于相關(guān)的事故進(jìn)行排查和預(yù)防,降低安全事故的發(fā)生率,在事故的處理過程中,利用大數(shù)據(jù)可以實時地統(tǒng)計到安全事故的發(fā)生情況,對于發(fā)生的原因,解決的方法,采用不同的方法可以達(dá)到的效果均可以通過仿真得到結(jié)果,使得工作人員更容易從不同的解決方案中通過智能化的算法得到最優(yōu)的解決方案。
海量數(shù)據(jù)的出現(xiàn)給傳統(tǒng)的安全統(tǒng)計工作帶來了沖擊。采用先進(jìn)的信息技術(shù)對數(shù)據(jù)進(jìn)行錄入,既可以避免人為數(shù)據(jù)記錄的缺陷,又可以提高數(shù)據(jù)統(tǒng)計的價值。傳統(tǒng)的安全統(tǒng)計分析思路是從“假設(shè)”到“驗證”,在大數(shù)據(jù)背景下,分析思維從“探究”轉(zhuǎn)變?yōu)椤翱偨Y(jié)”。它可以直接從數(shù)據(jù)中探索規(guī)則,不受任何假設(shè)限制,然后進(jìn)行歸納總結(jié),得出結(jié)論。這些變化極大地拓寬和豐富了統(tǒng)計分析的理論和思路。
在安全統(tǒng)計學(xué)的學(xué)習(xí)過程中應(yīng)該加強相關(guān)軟件的學(xué)習(xí),EXCEL、Eviews、SPSS等是目前統(tǒng)計學(xué)課程使用的主要教學(xué)軟件。除了要求學(xué)生掌握基本的統(tǒng)計軟件操作外,學(xué)生還應(yīng)考慮先選修與大數(shù)據(jù)分析相關(guān)的計算機專業(yè)課,如數(shù)據(jù)庫開發(fā)設(shè)計、Hadoop、Hive等計算工具,以處理大規(guī)模的多源異型數(shù)據(jù)和腳本語言Python。
數(shù)據(jù)的采集向著更加智能化的方向發(fā)展,傳統(tǒng)的安全統(tǒng)計數(shù)據(jù)是通過簡單的調(diào)查報告,單純的訪問和了解而獲得的比較片面的統(tǒng)計結(jié)果,結(jié)果中有很多數(shù)據(jù)不具有代表性,所以在安全事故的防護(hù)過程中不能很好的完成任務(wù),但是后期對于結(jié)果的處理將會花費更多的人力和物力,此時大數(shù)據(jù)的智能算法就體現(xiàn)出來了他的優(yōu)勢,能夠在信息的收集階段就排除被采訪者答案主觀性的影響。
對于傳統(tǒng)的安全統(tǒng)計數(shù)據(jù)發(fā)布進(jìn)行完善,工作人員的工作方式在這個過程中起著舉足輕重的作用,對于統(tǒng)計數(shù)據(jù)的公開必須經(jīng)過工作人員提前的審核,確保統(tǒng)計數(shù)據(jù)的正確性和對于行業(yè)趨勢的引導(dǎo)作用,提升用戶對于公開數(shù)據(jù)使用的滿意度,爭取獲得用戶的廣泛好評,滿足用戶的各種要求,從而成為用到這些數(shù)據(jù)的工作人員工作過程中的得力助手,工作人員在工作的過程中也可以利用大數(shù)據(jù)的軟件,捕獲準(zhǔn)確的最新的數(shù)據(jù),將這些數(shù)據(jù)及時提供給相關(guān)的部門,提升安全統(tǒng)計部門的信息及時性和準(zhǔn)確性。
當(dāng)然,大數(shù)據(jù)時代并不意味著傳統(tǒng)的安全統(tǒng)計方法不重要。從必要性、安全性和經(jīng)濟(jì)性的角度來看,并不是所有的數(shù)據(jù)都可以或者需要從大數(shù)據(jù)中獲取。即使是大數(shù)據(jù),也必須輔以傳統(tǒng)統(tǒng)計分析才能得出相應(yīng)的結(jié)論。