機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)入侵檢測中的應(yīng)用探討

2017-11-22 20:04:30韋紹毅

智富時(shí)代 2017年10期

關(guān)鍵詞：入侵檢測機(jī)器學(xué)習(xí)網(wǎng)絡(luò)通信

韋紹毅

【摘要】伴隨著網(wǎng)絡(luò)通信數(shù)據(jù)的幾何呈現(xiàn)出不斷增長的趨勢，這讓系統(tǒng)的自動檢測能力受到了人為分析網(wǎng)絡(luò)入侵檢測方法的極大限制，軟計(jì)算機(jī)模擬技術(shù)對分析系統(tǒng)能力的提高具有非常大的幫助，其中對于網(wǎng)絡(luò)入侵自動檢測上，則可以通對機(jī)器學(xué)習(xí)方法的利用。而這些技術(shù)都是通過對網(wǎng)絡(luò)數(shù)據(jù)統(tǒng)計(jì)分析的借助，實(shí)現(xiàn)使用之前發(fā)現(xiàn)的數(shù)據(jù)模式進(jìn)行數(shù)據(jù)處理算法的目的，進(jìn)而對網(wǎng)絡(luò)通信新數(shù)據(jù)作出更好的決策。本文主要對多種機(jī)器學(xué)習(xí)方法及軟件計(jì)算機(jī)技術(shù)，在智能網(wǎng)絡(luò)入侵檢測系統(tǒng)中的應(yīng)用方法進(jìn)行探討，切實(shí)的為智能網(wǎng)絡(luò)入侵檢測系統(tǒng)的建立奠定基礎(chǔ)，進(jìn)而讓網(wǎng)絡(luò)入侵檢測和防御系統(tǒng)變得更加的高效率。

【關(guān)鍵詞】機(jī)器學(xué)習(xí)；入侵檢測；網(wǎng)絡(luò)通信；軟計(jì)算

伴隨著互聯(lián)網(wǎng)迅速的發(fā)展，這讓本就非常脆弱的信息系統(tǒng)和通信網(wǎng)絡(luò)，成為了不同網(wǎng)絡(luò)類型主要攻擊的對象，因此這也讓網(wǎng)路安全成為了大家關(guān)注的重點(diǎn)。網(wǎng)絡(luò)受到的安全威脅呈現(xiàn)出不斷上漲的趨勢，基于智能網(wǎng)絡(luò)而言，入侵檢測和防御系統(tǒng)的建立就顯得尤為的重要。在當(dāng)前網(wǎng)絡(luò)安全研究課題上，網(wǎng)絡(luò)入侵檢測已經(jīng)成為了主要的課題，雖然在多種網(wǎng)絡(luò)攻擊風(fēng)險(xiǎn)在因特網(wǎng)環(huán)境當(dāng)中存在，但同時(shí)也有諸多針對網(wǎng)絡(luò)攻擊的預(yù)防系統(tǒng)，尤其是基于入侵檢測的網(wǎng)絡(luò)防御系統(tǒng)。

一、簽名和異常檢測

簽名檢測工作的原理主要是對比觀察和數(shù)據(jù)庫的簽名。全部的簽名模式是借助檢測環(huán)境當(dāng)中的數(shù)據(jù)包，然后將與數(shù)據(jù)庫當(dāng)中相匹配的簽名全部提取，如果標(biāo)記和安全政策不相符合，那就將其作為一個(gè)攻擊對象。簽名檢測能夠?qū)σ呀?jīng)指導(dǎo)的攻擊，或者是侵犯進(jìn)行有效的預(yù)防，但是它沒有辦法對新的攻擊對象進(jìn)行檢測，一直到已經(jīng)更新了它的簽名。基于簽名的入侵檢測系統(tǒng)，具有預(yù)處理和計(jì)算量小的顯著特征。

異常檢測能夠?qū)π碌墓?，或者是潛在的新的攻擊進(jìn)行檢測，它借助已經(jīng)構(gòu)建好的配置文件，從而對其的正常行為進(jìn)行表示，然后把它現(xiàn)下的行為進(jìn)行對比和匹配?；诋惓z測的機(jī)制，能夠判定任意的通信行為，尤其是擅長掃描和探測網(wǎng)絡(luò)硬件。從網(wǎng)絡(luò)和端口異常中，這些系統(tǒng)對任意錯(cuò)誤所造成的攻擊進(jìn)行檢測。

二、機(jī)器學(xué)習(xí)技術(shù)

基于機(jī)器學(xué)習(xí)技術(shù)的異常入侵檢測系統(tǒng)，能夠通過數(shù)據(jù)來達(dá)到學(xué)習(xí)的目的。進(jìn)而建立起一個(gè)決策系統(tǒng)，也就是可以分析潛在數(shù)據(jù)的系統(tǒng)。

（一）神經(jīng)網(wǎng)絡(luò)

在特征精簡當(dāng)中，神經(jīng)網(wǎng)絡(luò)模型可以對問題進(jìn)行分類，同時(shí)并能夠形成決策邊界，進(jìn)而讓非線性判別函數(shù)得到有效的構(gòu)建。每個(gè)特征微量元素在用于分類問題的過程中，都會和一個(gè)輸入節(jié)點(diǎn)相對應(yīng)，與此同時(shí)每個(gè)輸出節(jié)點(diǎn)所對應(yīng)的分類，可以作為對分配的類別。通過輸入節(jié)點(diǎn)和隱層節(jié)點(diǎn)的連接，并對初始權(quán)值進(jìn)行分配，調(diào)整權(quán)值在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。經(jīng)過對神經(jīng)網(wǎng)絡(luò)的觀察發(fā)現(xiàn)，其訓(xùn)練時(shí)間比較長的重要原因就是因?yàn)橛芯薮蟮木W(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)量。但是此類入侵近側(cè)系統(tǒng)，能夠在線分類攻擊類型。

（二）支持向量機(jī)

支持向量機(jī)在分類和回歸問題當(dāng)中，是一種較為常見的任務(wù)式學(xué)習(xí)方法。此種方法中，兩個(gè)類別的一種救贖屬于一個(gè)訓(xùn)練例子，然后通過對支持向量算法的利用，從而建立起，模型，然后再對新的實(shí)例是不是屬于其中的類別進(jìn)行預(yù)測。這里首先需要定義一個(gè)輸入空間，也就是X，然后開始連接每個(gè)網(wǎng)絡(luò)，對是n維的屬性特征進(jìn)行選擇。一個(gè)網(wǎng)路連接則用一個(gè)維度矢量x表示，x=（x1，x2，...，xn），其中i=1，2，...，n，代表樣本的特征值。Y表示的是定義輸出的區(qū)域，只需要對每個(gè)網(wǎng)絡(luò)連接是否正常進(jìn)行判斷即可。可以對Y=（+1，-1）進(jìn)行定義，當(dāng)正常連接時(shí)為Y=+1，當(dāng)連接為異常時(shí)為Y=-1。支持向量機(jī)的分類問題，主要是對非線性映射函數(shù)進(jìn)行表示，也即為樣本空間對高緯的映射。此種方式具有兩個(gè)主要優(yōu)點(diǎn)，分別就是高決策速度和高訓(xùn)練速度。

（三）遺傳算法

找到問題優(yōu)化的近似解就是遺傳算法的一個(gè)主要目標(biāo)。爬山法為遺傳算法的采用的一種方法，對任意基因數(shù)目的進(jìn)行選定，其分別有選擇、交叉、變異及初始化四個(gè)操作。一個(gè)單獨(dú)的染色體包括諸如服務(wù)等基因響度應(yīng)的屬性。分類規(guī)則可以通過遺傳算法的方式產(chǎn)生，與此同時(shí)對參數(shù)在檢測的過程中進(jìn)行優(yōu)化。

（四）決策樹

大部分情況下決策樹是在分類問題上進(jìn)行應(yīng)用的，在此算法當(dāng)中已經(jīng)對學(xué)習(xí)和模型化過數(shù)據(jù)集。同樣決策樹算法也可以在網(wǎng)絡(luò)入侵檢測當(dāng)中進(jìn)行應(yīng)用。而首先需要在訓(xùn)練數(shù)據(jù)的基礎(chǔ)上，對此種算法進(jìn)行學(xué)習(xí)并建立相應(yīng)的模型。決策樹模型在入侵檢測中，具有一個(gè)非常顯著的優(yōu)點(diǎn)，就是對龐大的數(shù)據(jù)集進(jìn)行處理。與此同時(shí)其在實(shí)時(shí)入侵檢測中的應(yīng)用也具有著非常明顯的效果，因此在性能上決策樹可以提供非常高的檢測，非常容易構(gòu)建和解釋模型。而其的另外一個(gè)優(yōu)點(diǎn)就是，決策樹具有非常泛化的精度，因?yàn)樵诓痪玫膶恚倳幸恍撛诘男鹿舫霈F(xiàn)，而借助決策樹對研究的精度進(jìn)行泛化，可以對諸如此類的攻擊進(jìn)行更好的檢測。

三、機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)入侵檢測應(yīng)用的優(yōu)缺點(diǎn)

面對越來越復(fù)雜的網(wǎng)絡(luò)環(huán)境，這給傳統(tǒng)的網(wǎng)絡(luò)入侵檢測技術(shù)帶來了很大的沖擊，因此在入侵檢測系統(tǒng)上，就非常需要提高其防御性能。而通過將機(jī)器學(xué)習(xí)的算法在入侵檢測系統(tǒng)當(dāng)中的應(yīng)用，不但可以讓系統(tǒng)的檢測效率得到顯著的提高，同時(shí)也讓智能優(yōu)化了系統(tǒng)的功能。機(jī)器學(xué)習(xí)當(dāng)中有著各種各樣的算法，并且各自有各自的優(yōu)點(diǎn)和缺點(diǎn)，以下就是對各個(gè)算法存在的優(yōu)點(diǎn)和缺點(diǎn)的簡單總結(jié)，基于決策樹的網(wǎng)路入侵檢測系統(tǒng)，具有簡單易懂的優(yōu)點(diǎn)，因?yàn)閷傩栽趯Ρ鹊倪^程中，是沿著一條支線進(jìn)行的，因此決策樹構(gòu)建的也是最優(yōu)的，這讓入侵檢測系統(tǒng)的效率得到了大大的提高?；谏窠?jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)入侵檢測系統(tǒng)，具有的計(jì)算高速的優(yōu)勢。不管是決策樹，還是神經(jīng)網(wǎng)絡(luò)都讓入侵檢測系統(tǒng)的性能得到了極大的提高，但是這兩種方法都極易會出現(xiàn)擬合的情況發(fā)生。支持向量機(jī)入侵檢測系統(tǒng)在泛化能力上比較強(qiáng)，而遺傳算法對端口掃描檢測時(shí)會非常的有效。在網(wǎng)絡(luò)入侵檢測系統(tǒng)當(dāng)中，將各個(gè)機(jī)器的學(xué)習(xí)算法應(yīng)用在其中，沒有辦法對某個(gè)具體算法的最佳進(jìn)行準(zhǔn)確的斷定，而是需要按照算法自身所有的優(yōu)缺點(diǎn)，以及網(wǎng)絡(luò)環(huán)境具有的特殊性進(jìn)行合適的選擇，需要較高的針對性。上述各種技術(shù)都是為了能夠讓高的檢測率得到更好的實(shí)現(xiàn)，但各自的技術(shù)都有自己的特點(diǎn)，總結(jié)如下。

（一）神經(jīng)網(wǎng)絡(luò)

無需專家知識，神經(jīng)網(wǎng)絡(luò)也能夠?qū)ξ粗彤惓５娜肭智闆r進(jìn)行及時(shí)的發(fā)現(xiàn)，但是采用技術(shù)在實(shí)時(shí)監(jiān)測的過程中并不適用，且訓(xùn)練過程也非常的緩慢。

（二）支持向量機(jī)

具有高訓(xùn)練速度和高決策速度，且不敏感數(shù)據(jù)維度。但是采用此種技術(shù)會需要較長的訓(xùn)練時(shí)間，無法給出攻擊類型的信息等。

（三）遺傳算法

和推理非常的近似，尤其是端口掃描檢測時(shí)會非常的有效，但是此種技術(shù)消耗的資源大，運(yùn)行過程中相關(guān)規(guī)則的降低較為困難。

（四）決策樹

可以對大數(shù)據(jù)進(jìn)行處理，有著非常高的檢測精度。但是此種技術(shù)的建立是需要在計(jì)算機(jī)密集型的基礎(chǔ)之上的。

四、結(jié)束語

不管在入侵檢測上采取何種方法都具有一定的優(yōu)勢和劣勢，因此只有不斷的加強(qiáng)對網(wǎng)絡(luò)入侵檢測的研究，才能夠找出機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)入侵檢測當(dāng)中的最佳方法。

【參考文獻(xiàn)】

[1] 解男男. 機(jī)器學(xué)習(xí)方法在入侵檢測中的應(yīng)用研究[D]. 吉林大學(xué)， 2015.

[2] 朱琨，張琪. 機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)入侵檢測中的應(yīng)用[J]. 數(shù)據(jù)采集與處理， 2017， 32（3）：479-488.

[3] 徐慧，劉翔，方策，等. 一種基于可拓距的特征變換方法及其在網(wǎng)絡(luò)入侵檢測中的應(yīng)用[J]. 河南師范大學(xué)學(xué)報(bào)（自然版）， 2017（5）：101-107.endprint