王倫生 柳景峰
隨著計(jì)算機(jī)技術(shù)飛速發(fā)展,現(xiàn)代社會(huì)開(kāi)始步入全面的信息化時(shí)代。信息網(wǎng)絡(luò)已經(jīng)成為社會(huì)運(yùn)轉(zhuǎn)不可或缺的一環(huán),許多年輕人已經(jīng)養(yǎng)成了“機(jī)不離手,機(jī)在人在”的習(xí)慣,可見(jiàn)互聯(lián)網(wǎng)技術(shù)在人們?nèi)粘I钪袧B入之深,但隨著信息技術(shù)的發(fā)展不斷加快,一個(gè)危險(xiǎn)的問(wèn)題也在困擾著人們,那就是信息泄露,大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)會(huì)根據(jù)人們?cè)诰W(wǎng)頁(yè)上瀏覽過(guò)的記錄、留置的信息,而主動(dòng)的為潛在客戶推送他們所需的信息,這表面看起來(lái)非常的“善解人意”,可實(shí)際上從側(cè)面來(lái)看這就是一種露骨的“信息泄露”,你的喜好、習(xí)慣、瀏覽記錄都一一陷入了大數(shù)據(jù)的監(jiān)控之一,宛如科幻電影中的“天眼”。還記得不久前播出的電視劇“長(zhǎng)安十二時(shí)辰”嗎?靖安司的“徐斌”最擅長(zhǎng)從重重疊疊的檔案記錄中挖掘出有用的訊息,劇中稱之為“大案牘術(shù)”,其實(shí)就是相當(dāng)于現(xiàn)實(shí)世界中的大數(shù)據(jù)技術(shù)。對(duì)于大數(shù)據(jù)這個(gè)概念,麥肯錫全球研究所將其定義為一種獲取儲(chǔ)存和管理及分析管理方面,遠(yuǎn)超傳統(tǒng)意義上的數(shù)據(jù)庫(kù)的數(shù)據(jù)集合體,相對(duì)一般分析軟件的局限性和有限性不同,大數(shù)據(jù)技術(shù)通過(guò)整個(gè)網(wǎng)絡(luò)羅織信息,將之收集、存儲(chǔ),然后分析信息主人的表達(dá)意圖,提供相應(yīng)的服務(wù)。
隨著現(xiàn)在網(wǎng)速越來(lái)越快,數(shù)據(jù)流動(dòng)和增長(zhǎng)的效率都是呈現(xiàn)直線上升的趨勢(shì),這雖然可以淋漓盡致地發(fā)揮出互聯(lián)網(wǎng)的服務(wù)功能,卻在互聯(lián)網(wǎng)安全工程上埋下了不小的隱患,主要表現(xiàn)在以下兩個(gè)方面:其一,數(shù)據(jù)每分每秒都在進(jìn)行飛速的更新?lián)Q代,網(wǎng)絡(luò)安全分析部門根本無(wú)法駕馭住這種變幻莫測(cè)的更新速度,如何在有限的時(shí)間里及時(shí)分析數(shù)據(jù)信息并將其處理,是互聯(lián)網(wǎng)人必須思考的問(wèn)題,網(wǎng)絡(luò)安全分析系統(tǒng)最重要的基礎(chǔ)就是搜集精確和準(zhǔn)確的信息流,以此加快在處理信息上的效率,同時(shí)又要保證數(shù)據(jù)分析的結(jié)果擁有足夠的可靠性,這給網(wǎng)絡(luò)安全分析工作添加了沉重的負(fù)擔(dān)。其二,相對(duì)傳統(tǒng)的網(wǎng)絡(luò)安全分析系統(tǒng)中,向來(lái)采取結(jié)構(gòu)化數(shù)據(jù)庫(kù)來(lái)儲(chǔ)存數(shù)據(jù),但此種數(shù)據(jù)儲(chǔ)存方式建設(shè)成本太大,網(wǎng)絡(luò)安全部門無(wú)法承擔(dān)這么大的消耗,一般會(huì)降低數(shù)據(jù)的大小,在不超出成本的前提下,提高數(shù)據(jù)儲(chǔ)存的容量,但這種技術(shù)在處理過(guò)程中,容易在過(guò)長(zhǎng)的入庫(kù)儲(chǔ)存過(guò)程中丟失數(shù)據(jù),無(wú)論在分析速度上還是在查詢效率上都十分緩慢,這些問(wèn)題的出現(xiàn)都說(shuō)明了大數(shù)據(jù)技術(shù)替代傳統(tǒng)網(wǎng)絡(luò)技術(shù)的必要性。
在現(xiàn)代的網(wǎng)絡(luò)安全分析中應(yīng)用大數(shù)據(jù)技術(shù)具有顯著的效果。首先,大數(shù)據(jù)技術(shù)對(duì)于安全分析系統(tǒng)的數(shù)據(jù)存儲(chǔ)量非常驚人,可高效率的進(jìn)行網(wǎng)絡(luò)安全分析工作。其次,合理的運(yùn)用大數(shù)據(jù)技術(shù)能夠降低成本,大數(shù)據(jù)技術(shù)的分布式數(shù)據(jù)庫(kù)在運(yùn)營(yíng)成本上的費(fèi)用遠(yuǎn)遠(yuǎn)少于結(jié)構(gòu)化數(shù)據(jù)庫(kù),沒(méi)有硬件要求,在性能很差的端也能穩(wěn)定運(yùn)行。最后,大數(shù)據(jù)技術(shù)的運(yùn)用可以充分提高存儲(chǔ)和處理異構(gòu)數(shù)據(jù)的效率,進(jìn)一步提高網(wǎng)絡(luò)安全分析系統(tǒng)的數(shù)據(jù)分析精度。
(一)數(shù)據(jù)采集
運(yùn)用和等工具,可以分布式采集數(shù)據(jù),這種數(shù)據(jù)采集方式極具效率,每一秒鐘能夠采集到的數(shù)據(jù)信息量有數(shù)百兆之多,在日志數(shù)據(jù)信息上的處理有著巨大幫助 。
(二)數(shù)據(jù)存儲(chǔ)
在網(wǎng)絡(luò)安全分析過(guò)程中需要儲(chǔ)存大量安全數(shù)據(jù),大數(shù)據(jù)技術(shù)可根據(jù)不同類的數(shù)據(jù),采取不同的存儲(chǔ)方式,從而大大提高處理數(shù)據(jù)的效率,以列式存儲(chǔ)方式去儲(chǔ)存日志信息等類型的數(shù)據(jù),使用分布式計(jì)算模式分析經(jīng)過(guò)標(biāo)準(zhǔn)化處理的數(shù)據(jù)。分析處理完數(shù)據(jù)后,將分析結(jié)果存放在列式存儲(chǔ)部分,采用流式計(jì)算處理即時(shí)數(shù)據(jù)。
(三)數(shù)據(jù)查詢
作為系統(tǒng)基礎(chǔ),組建相應(yīng)的查詢模塊,查詢數(shù)據(jù)時(shí)對(duì)應(yīng)的節(jié)點(diǎn),會(huì)分別自動(dòng)采取不同的指令,處理完畢后,整理各個(gè)節(jié)點(diǎn)的處理結(jié)果,這種查詢方式具有高效的反應(yīng)和處理速度。
(四)數(shù)據(jù)分析
網(wǎng)絡(luò)安全分析系統(tǒng)可以從兩個(gè)方面來(lái)分析數(shù)據(jù)的計(jì)算方式,第一種分析實(shí)時(shí)數(shù)據(jù)。以流式計(jì)算作為基礎(chǔ),配合技術(shù),復(fù)雜事件處理和關(guān)聯(lián)分析算法,對(duì)監(jiān)控和處理實(shí)時(shí)數(shù)據(jù)進(jìn)行綜合解析,在極短時(shí)間內(nèi)查找出異常的數(shù)據(jù)信息。第二種是綜合分析處理統(tǒng)計(jì)數(shù)據(jù)和歷史數(shù)據(jù)??梢圆捎梅植际酱鎯?chǔ)和計(jì)算,來(lái)處理這種對(duì)于時(shí)效性沒(méi)有太高要求的數(shù)據(jù),結(jié)合多種數(shù)據(jù)處理技術(shù)對(duì)其深化處理,有效的規(guī)避數(shù)據(jù)風(fēng)險(xiǎn)。
(五)分析處理復(fù)雜數(shù)據(jù)
大數(shù)據(jù)技術(shù)具有儲(chǔ)存、分析和查詢數(shù)據(jù)上得天獨(dú)厚的優(yōu)勢(shì),能夠有效的構(gòu)建異構(gòu)數(shù)據(jù),分析處理系統(tǒng)安全隱患和關(guān)聯(lián)性攻擊。應(yīng)用大數(shù)據(jù)技術(shù),可以全方位分析處理僵尸網(wǎng)絡(luò)等網(wǎng)絡(luò)安全問(wèn)題,綜合檢測(cè)潛在隱患。
大數(shù)據(jù)技術(shù)擁有龐大的信息網(wǎng)絡(luò),但它的優(yōu)勢(shì)并不僅僅于此,它的優(yōu)勢(shì)在于合理的運(yùn)用這些虛擬的卻暗藏?zé)o數(shù)情報(bào)的龐大信息量,換而言之,要是把大數(shù)據(jù)比喻成一座企業(yè),那么讓這座企業(yè)盈利的原因不在于多么過(guò)硬的業(yè)務(wù)能力,而在于清晰的戰(zhàn)略導(dǎo)向和明確的戰(zhàn)略方針。如何能充分利用這些信息中包含的“虛擬價(jià)值”,通過(guò)“信息加工”實(shí)現(xiàn)信息數(shù)據(jù)的“信息增殖”是大數(shù)據(jù)技術(shù)目前不得不思考的一個(gè)問(wèn)題。
以更形象的說(shuō)法來(lái)看,大數(shù)據(jù)和云計(jì)算就人的左右手一樣,缺了左手,缺了右手都不能夠協(xié)調(diào)的運(yùn)作。大數(shù)據(jù)信息量巨大,單臺(tái)計(jì)算機(jī)無(wú)法負(fù)荷,跟何況大數(shù)據(jù)是經(jīng)由無(wú)數(shù)網(wǎng)絡(luò)平臺(tái)共同組建而成的架構(gòu)。它的功用是在海量數(shù)據(jù)中過(guò)濾掉無(wú)用的垃圾信息,找到真實(shí)可靠的有用信息將之加工處理。大數(shù)據(jù)技術(shù)的基礎(chǔ)必須建立在云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)等強(qiáng)大功能之上才能夠運(yùn)作?,F(xiàn)代社會(huì)的信息流通十分的快捷和便利,人們之間的交流通過(guò)“支付寶”“微信”“推特”變得越來(lái)越輕松,生活也越來(lái)越愉快,大數(shù)據(jù)就是這個(gè)時(shí)代應(yīng)運(yùn)而生的產(chǎn)物。“阿里巴巴”前董事長(zhǎng)馬云就曾經(jīng)說(shuō)過(guò),未來(lái)的時(shí)代是取代的時(shí)代,從馬云的話中我們就可以得知大數(shù)據(jù)技術(shù)對(duì)于阿里巴巴的堅(jiān)實(shí)分量,甚至于對(duì)整個(gè)互聯(lián)網(wǎng)行業(yè)來(lái)說(shuō)都是至關(guān)重要的。
有人把數(shù)據(jù)比喻為一座大山,山中有黃金有白銀有黃銅,也有砂礫有巖石有草木,如何能在數(shù)據(jù)的這座大山里挖掘到你想要的黃金或者白銀,就是大數(shù)據(jù)技術(shù)的關(guān)鍵。與此類似,大數(shù)據(jù)的中心不在于龐大而在于運(yùn)用。數(shù)據(jù)量的龐大只是一方面,學(xué)會(huì)如何使用這些龐大的數(shù)據(jù)量獲得利潤(rùn)才是大數(shù)據(jù)要表達(dá)的真實(shí)意義。對(duì)于各行各業(yè)而言,如何利用這些大數(shù)據(jù)技術(shù)在競(jìng)爭(zhēng)激勵(lì)的未來(lái)商場(chǎng)殺出一條血路,是他們冥思苦想的問(wèn)題。大數(shù)據(jù)技術(shù)價(jià)值有以下幾點(diǎn):企業(yè)可以充分利用大數(shù)據(jù)的分析與搜集信息的能力對(duì)大量消費(fèi)者提供產(chǎn)品或服務(wù)的精準(zhǔn)營(yíng)銷;中小企業(yè)可通過(guò)大數(shù)據(jù)進(jìn)行服務(wù)轉(zhuǎn)型;傳統(tǒng)的行業(yè)面臨高新企業(yè)與互聯(lián)網(wǎng)企業(yè)的激烈競(jìng)爭(zhēng),必須改變形態(tài),需要與時(shí)俱進(jìn)充分利用大數(shù)據(jù)的價(jià)值。
大數(shù)據(jù)是一柄云時(shí)代和數(shù)據(jù)時(shí)代培育出來(lái)的“雙刃劍”,這柄寶劍正面可以幫助人類更快更高效的分析數(shù)據(jù)收集信息,解決了人們很多的麻煩,提供了生活中的很多便利,反面則是在信息的搜集和處理中,無(wú)形中將人們的私密信息都泄露了出去,可能在無(wú)形之中,你已經(jīng)向數(shù)據(jù)構(gòu)成的虛擬世界“袒胸露背”,你的信息完全暴露在公眾之下,這也是人類在網(wǎng)絡(luò)技術(shù)不斷發(fā)展和升級(jí)的今天所要警惕的,到底大數(shù)據(jù)技術(shù)利大于弊還是弊大于利,該如何防止大數(shù)據(jù)技術(shù)本身的弊端,取其長(zhǎng)處,是現(xiàn)在要思考的問(wèn)題。
大數(shù)據(jù)與傳統(tǒng)網(wǎng)絡(luò)技術(shù)相比具有無(wú)與倫比的決策力,敏銳入微的洞察發(fā)現(xiàn)力和改革創(chuàng)新的流程優(yōu)化能力,海量處理多樣化的信息流的能力。隨著大數(shù)據(jù)融進(jìn)我們的日常生活當(dāng)中,可以幫助企業(yè)做出更多廣泛的業(yè)務(wù)決策,減少風(fēng)險(xiǎn)。
作者單位:山東濟(jì)南市山東商業(yè)職業(yè)技術(shù)學(xué)院