李英杰
摘要:在計算機網(wǎng)絡(luò)病毒防御技術(shù)中,關(guān)于數(shù)據(jù)挖掘技術(shù)的應(yīng)用能夠迅速將其所處范圍內(nèi)的數(shù)據(jù)進行收集分類,從而為計算機病毒相關(guān)信息判定提供參考。本文則對數(shù)據(jù)挖掘技術(shù)在計算機網(wǎng)絡(luò)病毒防御技術(shù)中的應(yīng)用分析。
關(guān)鍵字:數(shù)據(jù)挖掘技術(shù);計算機;網(wǎng)絡(luò);病毒防御技術(shù)
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2015)02-0001-02
Abstract: In the computer network virus prevention technology, with respect to the application of data mining technology can quickly within its geographical scope of the data collected classification, so as to provide a reference for computer virus-related information determination. In this paper, the analysis of data mining techniques in computer network virus defense techniques.
Key words: data mining technology; computers; networks; virus defense technology
隨著社會的進步,計算機技術(shù)迅速發(fā)展革新,人們已經(jīng)進入暫新的網(wǎng)絡(luò)時代,但與此同時,伴隨著計算機技術(shù)的發(fā)展,與計算機網(wǎng)絡(luò)一直都存在密切關(guān)系的計算機網(wǎng)絡(luò)病毒技術(shù)也保持著同步發(fā)展,甚至推進到更高水平,給計算機網(wǎng)絡(luò)系統(tǒng)安全造成極大的威脅,同時給廣大計算機網(wǎng)絡(luò)用戶帶來很大損失,因此,計算機網(wǎng)絡(luò)病毒防御技術(shù)一直是人們比較關(guān)注的問題。數(shù)據(jù)挖掘技術(shù)是一種新型計算機技術(shù),用于計算機網(wǎng)絡(luò)病毒的防御系統(tǒng)中可以有效的解決目前發(fā)展猖獗的蠕蟲病毒,進一步保障計算機網(wǎng)絡(luò)系統(tǒng)的安全。
1 計算機網(wǎng)絡(luò)病毒特點
第一,計算機網(wǎng)絡(luò)病毒種類的多樣性。計算機網(wǎng)絡(luò)病毒的設(shè)計和開發(fā)沒有太大難度,簡單的幾個程序編寫指令就可以開發(fā)設(shè)計出各種各樣的網(wǎng)絡(luò)病毒,尤其是對于一些技術(shù)水平比較高的程序編寫員來講,很容易就可以完成計算機網(wǎng)絡(luò)病毒程序的編寫和修改,而且網(wǎng)絡(luò)病毒的種類增長和繁殖速度特別快[1]。
第二,計算機網(wǎng)絡(luò)病毒傳播形式的多樣性。計算機網(wǎng)絡(luò)系統(tǒng)的傳播形式有很多種,網(wǎng)絡(luò)病毒在網(wǎng)絡(luò)系統(tǒng)漏洞中的傳播就是常見的一種病毒傳播方式,計算機網(wǎng)絡(luò)病毒程序通過對Internet 遠程主機系統(tǒng)的搜索和掃描,利用系統(tǒng)漏洞到達控制對方計算機的控制。同時也有一種病毒通過對文件夾的搜索掃描,進行病毒復(fù)制,以到達入侵網(wǎng)絡(luò)系統(tǒng)的目的。
第三,計算機網(wǎng)絡(luò)病毒的針對性。在計算機網(wǎng)絡(luò)技術(shù)發(fā)展初期,計算機網(wǎng)絡(luò)病毒主要目標就是干擾網(wǎng)絡(luò)技術(shù)人員的程序編寫,隨著計算機技術(shù)的快速發(fā)展,計算機網(wǎng)絡(luò)病毒的開發(fā)技術(shù)和功能作用也發(fā)生了很多變化,如今,計算機網(wǎng)絡(luò)病毒的設(shè)計和開發(fā)已經(jīng)開始商業(yè)化,針對性的對計算機網(wǎng)絡(luò)系統(tǒng)實施破壞,如通過盜用網(wǎng)銀賬號和密碼等方式已到達非法獲取利益的目的。
2 數(shù)據(jù)挖掘技術(shù)的基本認識
數(shù)據(jù)挖掘技術(shù)是通過對所處一定范圍之內(nèi)的所有數(shù)據(jù)進行數(shù)據(jù)收集、數(shù)據(jù)分類以及數(shù)據(jù)歸類,進而來判斷是否存在某種潛在的關(guān)系和數(shù)據(jù)規(guī)律,主要環(huán)節(jié)有3個:第一個是準備數(shù)據(jù);第二個是尋找數(shù)據(jù)存在的規(guī)律;第三個是表現(xiàn)數(shù)據(jù)規(guī)律。數(shù)據(jù)挖掘技術(shù)的基本應(yīng)用結(jié)構(gòu)如下圖所示:
數(shù)據(jù)挖掘模式設(shè)置好之后,技術(shù)系統(tǒng)中的挖掘引擎就會以數(shù)據(jù)庫中的要求為依據(jù),對準備好的數(shù)據(jù)進行數(shù)據(jù)分析和數(shù)據(jù)歸類,找出各個數(shù)據(jù)之間存在的關(guān)系和相應(yīng)的數(shù)據(jù)規(guī)律,以便成為之后數(shù)據(jù)分析的有利依據(jù),數(shù)據(jù)挖掘步技術(shù)是比較全面的挖掘技術(shù)和數(shù)據(jù)應(yīng)用技術(shù),工作過程比較繁雜,工作操作步驟較多,其中存在很大部分的準備環(huán)節(jié)和規(guī)劃工作,數(shù)據(jù)挖掘技術(shù)的重點工作是對數(shù)據(jù)的預(yù)處理階段,對數(shù)據(jù)的預(yù)處理階段是數(shù)據(jù)挖掘技術(shù)的基礎(chǔ),是后期的進行數(shù)據(jù)分析的必要條件[2]。
3 數(shù)據(jù)挖掘技術(shù)下的計算機網(wǎng)絡(luò)病毒防御技術(shù)
3.1 數(shù)據(jù)挖掘技術(shù)的構(gòu)成分析
在計算機網(wǎng)絡(luò)病毒進行傳播的時候,為了給數(shù)據(jù)挖掘技術(shù)提供相應(yīng)的數(shù)據(jù)依據(jù),需要對有關(guān)數(shù)據(jù)進行掃描,可以對網(wǎng)絡(luò)用戶方面數(shù)據(jù)進行掃描,也可以對系統(tǒng)數(shù)據(jù)進行掃描。數(shù)據(jù)挖掘技術(shù)在計算機網(wǎng)絡(luò)病毒防御中的應(yīng)用過程比較復(fù)雜,步驟繁多,為了便于日常操作應(yīng)用,掌握每個環(huán)節(jié)的基本特征,可以對預(yù)處理模塊、決策模塊、數(shù)據(jù)收集模塊、數(shù)據(jù)挖掘模塊以及規(guī)則庫模塊進行分模塊分析研究。基于數(shù)據(jù)挖掘技術(shù)的計算機網(wǎng)絡(luò)病毒防御流程如下圖所示:
3.1.1 數(shù)據(jù)預(yù)處理模塊分析
簡化數(shù)據(jù)挖掘技術(shù)中數(shù)據(jù)挖掘和數(shù)據(jù)分析之間的處理操作可以通過數(shù)據(jù)預(yù)處理模塊來實現(xiàn),利用數(shù)據(jù)預(yù)處理模塊可以整體上提高數(shù)據(jù)挖掘效果,提高數(shù)據(jù)辨識度和準確度。在完成數(shù)據(jù)收集后需要把數(shù)據(jù)導(dǎo)入到預(yù)處理模塊,實現(xiàn)數(shù)據(jù)的分析歸類和數(shù)據(jù)變換,通過這樣額方式把數(shù)據(jù)轉(zhuǎn)換成可以被系統(tǒng)識別和處理的數(shù)據(jù)內(nèi)容。以目標 IP地址、源 IP地址、端口信息等這些據(jù)數(shù)據(jù)包當(dāng)中所包括的信息內(nèi)容為依據(jù),實施數(shù)據(jù)集合、數(shù)據(jù)歸納、數(shù)據(jù)處理等流程等[3]。
3.1.2 決策模塊分析
在數(shù)據(jù)挖掘技術(shù)中的決策功能模塊中,通過對數(shù)據(jù)的挖掘?qū)?shù)據(jù)庫進行構(gòu)建,然后對數(shù)據(jù)進行匹配,同時數(shù)據(jù)庫還要和規(guī)則庫密切聯(lián)系起來。如果數(shù)據(jù)庫有與規(guī)則庫存在高度聯(lián)系的信息出現(xiàn),證明在決策模塊里有病毒特征存在,很可能會感染到計算機病毒。如果是結(jié)果數(shù)據(jù)庫的數(shù)據(jù)信息和規(guī)則庫的數(shù)據(jù)不能相互匹配,那也就是說該數(shù)據(jù)包中存在有帶有新型特征病的毒帶,也就是出現(xiàn)了新型的規(guī)則類,這樣的情況下就需要把該帶有新型特征的病毒導(dǎo)入到系統(tǒng)的規(guī)則庫當(dāng)中,規(guī)則庫的一種較新型的規(guī)則類別也就形成了。
3.1.3 數(shù)據(jù)收集模塊分析
實現(xiàn)數(shù)據(jù)挖掘的基本要求是提供充分的數(shù)據(jù)信息,只有通過數(shù)據(jù)收集才能實現(xiàn)數(shù)據(jù)收集模塊的功能。數(shù)據(jù)收集模塊通過對計算機網(wǎng)絡(luò)中數(shù)據(jù)包的抓取和收集來實現(xiàn)數(shù)據(jù)信息,數(shù)據(jù)信息被收集后就會具有一定的數(shù)據(jù)結(jié)構(gòu)和比較重要的功能信息。
3.1.4 數(shù)據(jù)挖掘模塊分析
數(shù)據(jù)挖掘技術(shù)的一個最關(guān)鍵部分就是數(shù)據(jù)挖掘模塊。數(shù)據(jù)挖掘模塊中的事件庫和數(shù)據(jù)挖掘算法是數(shù)據(jù)挖掘模塊的關(guān)鍵部分。數(shù)據(jù)挖掘?qū)ο嚓P(guān)數(shù)據(jù)的收集構(gòu)成了事件庫,通過對事件庫中數(shù)據(jù)的分類和數(shù)據(jù)整理,進而可以獲取較為準確的數(shù)據(jù)結(jié)構(gòu)。
3.2 以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ)的網(wǎng)絡(luò)病毒防御系統(tǒng)
3.2.1 數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析
數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)規(guī)則就是指在同一類別的數(shù)據(jù)中有可以被發(fā)現(xiàn)的知識存在,通過對兩個或者超過兩個的變量進行取值,如果發(fā)現(xiàn)數(shù)據(jù)具體一定規(guī)律的話說明這些數(shù)據(jù)和數(shù)據(jù)之間存在著某種關(guān)聯(lián)性。因果關(guān)聯(lián)、及時序關(guān)聯(lián)以及簡單關(guān)聯(lián)是存在數(shù)據(jù)挖掘技術(shù)中的幾種主要關(guān)聯(lián)關(guān)系。要找到數(shù)據(jù)庫中的關(guān)聯(lián)網(wǎng),就需要進行關(guān)聯(lián)分析,然后結(jié)合數(shù)據(jù)和數(shù)據(jù)之間的關(guān)聯(lián)性進行數(shù)據(jù)挖掘,進而得到數(shù)據(jù)和數(shù)據(jù)存在的關(guān)聯(lián)規(guī)則。
3.2.2 數(shù)據(jù)挖掘技術(shù)中的聚類分析
根據(jù)數(shù)據(jù)的不同特點和類別,對所獲取的數(shù)據(jù)進行分解,把它們分成多個不同的組別,各組數(shù)據(jù)之間在特征上都存在不同程度的相似之處,而且每組數(shù)據(jù)同時又存在著各種不同特征。系統(tǒng)對所有數(shù)據(jù)進行聚類之后,就可以發(fā)現(xiàn)并識別出整個系統(tǒng)數(shù)據(jù)分布的疏密情況,這樣不僅可以呈現(xiàn)出組與組之間數(shù)據(jù)存在的聯(lián)系,同時也可以對全局的分布模式有所體現(xiàn)。
3.2.3 數(shù)據(jù)挖掘技術(shù)中的分類分析
對個體進行分類并歸類到預(yù)先設(shè)定的類別當(dāng)中就是分類分析。分類的目的就是通過對各種各樣的機器學(xué)習(xí)方法和各種統(tǒng)計方法的利用,建立數(shù)據(jù)的分類模型,進而把數(shù)據(jù)庫中存在的所有數(shù)據(jù)按照一定的規(guī)律劃分成各個類別,然后依據(jù)這個分類規(guī)則結(jié)果實現(xiàn)對其他數(shù)據(jù)的分析和歸類。
4 結(jié)束語
計算機網(wǎng)絡(luò)已經(jīng)很大程度上滲透入人們的生活和工作當(dāng)中,徹底改變了人們的生活和工作方式,同時也促進了計算機網(wǎng)絡(luò)技術(shù)的進一步發(fā)展,但面對無法徹底避免的計算機網(wǎng)絡(luò)病毒,大家一定要提高網(wǎng)絡(luò)系統(tǒng)安全意識,把這場抵制計算機網(wǎng)絡(luò)病毒入侵的持久戰(zhàn)堅持下去。
參考文獻:
[1] 李智勇. 數(shù)據(jù)挖掘在計算機網(wǎng)絡(luò)病毒防御中的應(yīng)用探究[J]. 電子測試, 2014 (12): 46-48.
[2] 黃應(yīng)紅, 孫發(fā), 張坤,等. 計算機網(wǎng)絡(luò)病毒檢測的數(shù)據(jù)挖掘技術(shù)應(yīng)用[J]. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用, 2014(11): 37, 39.
[3] 孫健, 陳浩.論數(shù)據(jù)挖掘在計算機網(wǎng)絡(luò)病毒防御中的應(yīng)用[J]. 科學(xué)與財富, 2013 (12): 239-239.