付盼晴 褚含冰
摘要:現(xiàn)階段網(wǎng)絡(luò)信息數(shù)據(jù)存有量不斷增長(zhǎng)且速度加快,對(duì)目前的網(wǎng)絡(luò)安全分析工作提出了更高的要求,而大數(shù)據(jù)技術(shù)作為一種新型技術(shù),在網(wǎng)絡(luò)安全分析工作中得到了廣泛應(yīng)用.本文從大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中的意義、應(yīng)用情況和基于大數(shù)據(jù)技術(shù)應(yīng)用的網(wǎng)絡(luò)安全分析平臺(tái)三大方面,對(duì)網(wǎng)絡(luò)安全分析中的大數(shù)據(jù)技術(shù)應(yīng)用進(jìn)行了深入探析.
關(guān)鍵詞:網(wǎng)絡(luò);安全分析;大數(shù)據(jù)技術(shù);應(yīng)用;信息數(shù)據(jù)
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-260X(2019)03-0054-03
伴隨著現(xiàn)如今計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展升級(jí),網(wǎng)絡(luò)世界中的數(shù)據(jù)存有量呈現(xiàn)出逐步擴(kuò)大趨勢(shì),在信息數(shù)據(jù)向多元化、復(fù)雜化方向發(fā)展的同時(shí),也暴露出了諸多網(wǎng)絡(luò)安全問題,而這一問題與人們的個(gè)人隱私乃至于國(guó)家安全息息相關(guān),所以有必要提高對(duì)網(wǎng)絡(luò)安全分析工作的重視度.傳統(tǒng)的網(wǎng)絡(luò)安全防護(hù)技術(shù)在當(dāng)前形勢(shì)下顯得不夠完善,過多漏洞的暴露也導(dǎo)致預(yù)防效果減弱,對(duì)于信息安全而言形成了嚴(yán)重威脅[1].而大數(shù)據(jù)技術(shù)作為一種新型技術(shù),有信息吞吐量大、內(nèi)容更新速度快且非結(jié)構(gòu)化的特點(diǎn),加之現(xiàn)如今大數(shù)據(jù)技術(shù)一直處在升級(jí)改進(jìn)形勢(shì)中,在網(wǎng)絡(luò)安全分析工作中得到了廣泛應(yīng)用,能夠全面提升網(wǎng)絡(luò)安全性.
1 網(wǎng)絡(luò)安全分析中的大數(shù)據(jù)技術(shù)應(yīng)用意義
1.1 提升數(shù)據(jù)存儲(chǔ)容量
面對(duì)非結(jié)構(gòu)化的海量且復(fù)雜數(shù)據(jù)的分析處理,大數(shù)據(jù)仍舊能夠確保其高效性,在保證數(shù)據(jù)信息的大容量存儲(chǔ)的同時(shí),還能夠保障數(shù)據(jù)信息的完整與安全.
1.2 有效降低投入成本
分布式數(shù)據(jù)庫(kù)是大數(shù)據(jù)技術(shù)的主要特點(diǎn),這一數(shù)據(jù)庫(kù)形式的投入成本要比結(jié)構(gòu)化數(shù)據(jù)庫(kù)的投入成本更低,同時(shí)對(duì)硬件標(biāo)準(zhǔn)不做過高要求,即便是硬件設(shè)備性能偏低,同樣可保證運(yùn)行的穩(wěn)定性,從而確保網(wǎng)絡(luò)安全分析平臺(tái)構(gòu)建的經(jīng)濟(jì)性.
1.3 提升運(yùn)行效率
通過應(yīng)用大數(shù)據(jù)技術(shù),可保證網(wǎng)絡(luò)安全分析平臺(tái)實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)的有效分析處理與存儲(chǔ),并且速度極快,大幅提升了數(shù)據(jù)信息的分析處理效率;
1.4 提升數(shù)據(jù)處理精度
在網(wǎng)絡(luò)安全分析中應(yīng)用大數(shù)據(jù)技術(shù)可收獲到顯著效果,有著重要的應(yīng)用意義.大數(shù)據(jù)技術(shù)的應(yīng)用可從不同層級(jí)、不同角度對(duì)數(shù)據(jù)信息進(jìn)行關(guān)聯(lián)分析,以此提升網(wǎng)絡(luò)安全分析平臺(tái)對(duì)數(shù)據(jù)處理的準(zhǔn)確度.
2 大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中的應(yīng)用
大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)應(yīng)用中可以將網(wǎng)絡(luò)日志數(shù)據(jù)與流量數(shù)據(jù)進(jìn)行數(shù)據(jù)整合,并且通過大數(shù)據(jù)采集與挖掘功能的發(fā)揮,去實(shí)現(xiàn)對(duì)數(shù)據(jù)的存儲(chǔ)聚集,進(jìn)而通過大數(shù)據(jù)技術(shù)對(duì)所有數(shù)據(jù)展開檢索,將其中暗藏安全隱患的數(shù)據(jù)剔除,最終保障網(wǎng)絡(luò)世界的安全性[2].大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中的應(yīng)用,大大縮減了分析工作的時(shí)間,同時(shí)降低了信息數(shù)據(jù)的遺漏概率,由傳統(tǒng)的被動(dòng)防御向主動(dòng)防御升級(jí).
2.1 采集數(shù)據(jù)信息
大數(shù)據(jù)技術(shù)可使用Chukwa、Flume、Scribe等工具開展數(shù)據(jù)信息的采集工作,一方面可采取分布式采集法去做好日志數(shù)據(jù)采集工作,該采集方法在工作效率方面表現(xiàn)良好;另一方面可采取鏡像數(shù)據(jù)策略方法對(duì)流量數(shù)據(jù)予以采集,相對(duì)來講該采集方法全面性表現(xiàn)更好.
2.2 存儲(chǔ)數(shù)據(jù)信息
數(shù)量多、種類復(fù)雜、應(yīng)用方式多元化等是大數(shù)據(jù)具備的基本特點(diǎn),為了確保網(wǎng)絡(luò)安全分析能夠符合大數(shù)據(jù)存儲(chǔ)的需求,則需要進(jìn)一步提升網(wǎng)絡(luò)安全分析的工作效率,因此需要用到多樣化的存儲(chǔ)手段對(duì)各類數(shù)據(jù)信息進(jìn)行有效存儲(chǔ).比如,針對(duì)日志信息數(shù)據(jù)等內(nèi)容的檢索有用原始信息數(shù)據(jù)的需求,在此應(yīng)用Hbase手段存儲(chǔ)數(shù)據(jù),此方法的數(shù)據(jù)處理速度較快;對(duì)經(jīng)過處理的安全信息數(shù)據(jù),選用Hahoop分布法展開數(shù)據(jù)構(gòu)架計(jì)算,并存儲(chǔ)運(yùn)算結(jié)果在列式存儲(chǔ)中[3];如果安全信息數(shù)據(jù)需繼續(xù)實(shí)時(shí)化分析,可繼續(xù)用Spark或是Stom流式計(jì)算法對(duì)數(shù)值計(jì)算分析,并進(jìn)一步將存儲(chǔ)運(yùn)算結(jié)果在列式存儲(chǔ)中.
2.3 檢索數(shù)據(jù)信息
可采取基于MapReduce的查詢檢索框架來實(shí)現(xiàn),主要將數(shù)據(jù)查詢情況分布在不同的計(jì)算節(jié)點(diǎn)中,應(yīng)用時(shí)用戶輸入相應(yīng)檢索信息,這一架構(gòu)即可以將檢索信息自動(dòng)傳送不同的分析節(jié)點(diǎn)展開處理,用分布式計(jì)算方式來提升安全數(shù)據(jù)的檢索效率,以此來保證海量的原始安全數(shù)據(jù)條件化查詢速度提升至秒級(jí)響應(yīng).
2.4 分析數(shù)據(jù)信息
對(duì)于實(shí)時(shí)數(shù)據(jù)的分析,可采用Spark或是Stom等流式計(jì)算法用為數(shù)據(jù)信息分析的根本,并通過電聯(lián)分析、CEP技術(shù)的互相融合,來達(dá)到實(shí)時(shí)的監(jiān)控分析數(shù)據(jù)信息,此分析方法能夠及時(shí)且精準(zhǔn)地捕捉到網(wǎng)絡(luò)中出現(xiàn)的異常行為數(shù)據(jù);而針對(duì)非實(shí)時(shí)性數(shù)據(jù)而言,則可采取分布式計(jì)算或是存儲(chǔ)的手段,還可與多種數(shù)據(jù)信息處理技術(shù)相結(jié)合,展開更深層次的離線處理,目的則是為了全面分析數(shù)據(jù)信息的潛藏風(fēng)險(xiǎn),并找出影響安全性的攻擊源頭.
2.5 分析復(fù)雜數(shù)據(jù)信息
就數(shù)據(jù)信息的存儲(chǔ)、檢索與分析等性能而言,在大數(shù)據(jù)技術(shù)的應(yīng)用加持下有了大幅提升,尤其是針對(duì)負(fù)載數(shù)據(jù)信息的分析,大數(shù)據(jù)技術(shù)不僅能夠?qū)⒍嘣串悩?gòu)數(shù)據(jù)精準(zhǔn)且快速地挖掘出來并予以分析,同時(shí)還能對(duì)整個(gè)系統(tǒng)中暗藏的安全危機(jī)與攻擊性行為有效分析.其中,針對(duì)僵尸網(wǎng)絡(luò)首先基于DNS訪問特征與流量數(shù)據(jù)信息著手,綜合數(shù)據(jù)源展開關(guān)聯(lián)分析,這樣的分析策略不僅效率高,且更為全面[4].此外,倘若系統(tǒng)當(dāng)中還存有隱藏的安全問題,還需對(duì)關(guān)聯(lián)主機(jī)進(jìn)行全面復(fù)查,確認(rèn)相同問題是否存在,之后便可采取針對(duì)性措施補(bǔ)救,進(jìn)而確保整個(gè)網(wǎng)絡(luò)系統(tǒng)的安全性.
3 基于大數(shù)據(jù)技術(shù)應(yīng)用的網(wǎng)絡(luò)安全分析平臺(tái)
通過對(duì)大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中應(yīng)用可知,底層大數(shù)據(jù)采集、存儲(chǔ)、分析與檢索等各類技術(shù)的相互融合,能夠全面提升安全分析工作效率,但要想從海量安全數(shù)據(jù)信息中準(zhǔn)確捕捉到安全隱患,還需結(jié)合不同的攻擊場(chǎng)景去設(shè)置關(guān)聯(lián)分析方法,進(jìn)而在大數(shù)據(jù)技術(shù)的分析與存儲(chǔ)優(yōu)勢(shì)發(fā)揮下,更深層次地對(duì)數(shù)據(jù)源展開關(guān)聯(lián)分析.
3.1 應(yīng)用大數(shù)據(jù)技術(shù)搭建網(wǎng)絡(luò)安全分析平臺(tái)
3.1.1 數(shù)據(jù)源模塊.平臺(tái)利用分布式采集器對(duì)內(nèi)部各硬件設(shè)備與軟件展開信息采集操作,之后將結(jié)果存儲(chǔ)在存儲(chǔ)部分當(dāng)中.隨著計(jì)算機(jī)數(shù)據(jù)處理的水平不停地提升,網(wǎng)絡(luò)安全系統(tǒng)中存儲(chǔ)的數(shù)據(jù)信息源逐漸增多,不僅有以前防火墻、訪問檢測(cè)等部分,還包含服務(wù)器、存儲(chǔ)器等計(jì)算機(jī)硬件設(shè)備的運(yùn)維以及對(duì)平臺(tái)軟件、數(shù)據(jù)庫(kù)等維護(hù)信息.
3.1.2 數(shù)據(jù)采集和存儲(chǔ)模塊.基于大數(shù)據(jù)技術(shù),可將數(shù)據(jù)與原始數(shù)據(jù)進(jìn)行分離,能夠?qū)?shù)據(jù)信息的采集與存儲(chǔ)進(jìn)行合理優(yōu)化,從而獲得分布式數(shù)據(jù)基礎(chǔ).這類數(shù)據(jù)存儲(chǔ)方式可確保數(shù)據(jù)從誕生到消失,都能夠?qū)崿F(xiàn)正常穩(wěn)定的訪問與存儲(chǔ),這一點(diǎn)對(duì)于現(xiàn)如今數(shù)據(jù)量逐漸擴(kuò)張的時(shí)代而言,在確保網(wǎng)絡(luò)安全中發(fā)揮著重要作用,可全面提升網(wǎng)絡(luò)安全分析平臺(tái)的數(shù)據(jù)存儲(chǔ)容量及數(shù)據(jù)庫(kù)的穩(wěn)定性.
3.1.3 數(shù)據(jù)分析模塊.大數(shù)據(jù)技術(shù)的應(yīng)用可確保平臺(tái)在分析實(shí)時(shí)數(shù)據(jù)與歷史數(shù)據(jù)的過程中都能體現(xiàn)出良好的工作效率.基于大數(shù)據(jù)分布式處理手段,進(jìn)行數(shù)據(jù)分析模塊的搭建,其數(shù)據(jù)分析處理能力會(huì)更加高效且穩(wěn)定,進(jìn)而確保平臺(tái)能夠在短時(shí)間內(nèi)運(yùn)算完一系列的高難度數(shù)據(jù)分析處理,像多維度與聯(lián)合分析處理等類.
3.1.4 數(shù)據(jù)呈現(xiàn)模塊.此模塊最為重視的是用戶體驗(yàn),保證用戶通過該模塊可高效地應(yīng)用網(wǎng)絡(luò)安全分析平臺(tái),確保各項(xiàng)功能得以實(shí)現(xiàn).
3.2 網(wǎng)絡(luò)安全分析平臺(tái)中應(yīng)用到的大數(shù)據(jù)技術(shù)
3.2.1 數(shù)據(jù)采集技術(shù).在搭建的網(wǎng)絡(luò)安全分析平臺(tái)中,所采用的數(shù)據(jù)采集技術(shù)通常是以Stom、Kafka、Flume等方式實(shí)現(xiàn)數(shù)據(jù)信息采集功能的,比如Flume則負(fù)責(zé)采集安全數(shù)據(jù),同時(shí)實(shí)現(xiàn)對(duì)安全數(shù)據(jù)信息的整合與傳送,相較于其他方式而言,有著更高的可靠性與實(shí)用性,之后便可展開數(shù)據(jù)定制,保證數(shù)據(jù)傳送者能夠采集到不同源數(shù)據(jù)信息[5].而在處理流式數(shù)據(jù)的過程中,Kafka則能為數(shù)據(jù)采集和流式數(shù)據(jù)處理提供重要緩存.
3.2.2 數(shù)據(jù)存儲(chǔ)技術(shù).在應(yīng)用大數(shù)據(jù)技術(shù)的網(wǎng)絡(luò)安全分析平臺(tái)中的數(shù)據(jù)存儲(chǔ)可以HDFS的形式存在,這一技術(shù)有著吞吐量大、容錯(cuò)性高的優(yōu)勢(shì),能夠保證數(shù)據(jù)信息存儲(chǔ)的完整性與安全性.
3.2.3 數(shù)據(jù)分析技術(shù).重點(diǎn)采用了Hive的手段去分析數(shù)據(jù),這一技術(shù)中的HiveQL語(yǔ)言有助于提高HDFS對(duì)非結(jié)構(gòu)式數(shù)據(jù)的檢索工作效率.另外技術(shù)的運(yùn)用還能遵循數(shù)據(jù)信息的類別差異進(jìn)行分析處理,用構(gòu)建結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù)安全事件關(guān)系序列庫(kù),進(jìn)而全面提高數(shù)據(jù)信息的復(fù)雜程度,保證了數(shù)據(jù)信息的安全性.同時(shí),這一數(shù)據(jù)分析技術(shù)還能夠在大體量數(shù)據(jù)信息中捕捉到安全隱患,同樣大幅度降低了網(wǎng)絡(luò)潛藏的安全風(fēng)險(xiǎn).
4 結(jié)束語(yǔ)
綜上分析可知,計(jì)算機(jī)大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中的高效應(yīng)用,顯著地提高了安全分析工作效果.伴隨著互聯(lián)網(wǎng)技術(shù)在生活、生產(chǎn)中的深入應(yīng)用,互聯(lián)網(wǎng)信息數(shù)據(jù)的體量也在逐年的不斷增加,這也對(duì)目前的網(wǎng)絡(luò)安全分析工作提出了更高的要求,隨著大數(shù)據(jù)技術(shù)的深入運(yùn)用,一方面提升了計(jì)算機(jī)互聯(lián)網(wǎng)數(shù)據(jù)的處理速度,同時(shí)也為新時(shí)期更為安全的網(wǎng)絡(luò)數(shù)據(jù)分析平臺(tái)增加了更為穩(wěn)定的維護(hù)基礎(chǔ).文章通過對(duì)網(wǎng)絡(luò)安全分析中的大數(shù)據(jù)技術(shù)應(yīng)用進(jìn)行深入探析,希望能夠?yàn)橄嚓P(guān)從業(yè)人員提供參考與借鑒.
參考文獻(xiàn):
〔1〕吳世嘉,李言鵬.大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中的應(yīng)用[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2018(08):56+76.
〔2〕劉德松.大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全管理中的應(yīng)用分析[J].通訊世界,2018(06):110-111.
〔3〕張寧,盛武.基于CiteSpace的大數(shù)據(jù)時(shí)代信息安全研究現(xiàn)狀[J].華北水利水電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2018(03):156-160.
〔4〕費(fèi)思源.大數(shù)據(jù)技術(shù)在配電網(wǎng)中的應(yīng)用綜述[J].中國(guó)電機(jī)工程學(xué)報(bào),2018(01):85-96+345.
〔5〕王長(zhǎng)杰,王衛(wèi)華.大數(shù)據(jù)時(shí)代下信息安全保護(hù)研究[J].清遠(yuǎn)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2016(01):42-47.
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2019年3期