國(guó)家電網(wǎng)蚌埠供電公司 易 飛
基于進(jìn)化神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)安全態(tài)勢(shì)要素提取方法研究
國(guó)家電網(wǎng)蚌埠供電公司 易 飛
針對(duì)網(wǎng)絡(luò)安全態(tài)勢(shì)要素提取不全面和不準(zhǔn)確的近況,以神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),展開(kāi)了基于遺傳進(jìn)化算法的進(jìn)化神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)安全態(tài)勢(shì)要素提取方法研究。擬使用遺傳進(jìn)化算法對(duì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,進(jìn)而建立一種進(jìn)化神經(jīng)網(wǎng)絡(luò)模型。研究表明,在該種模型下,對(duì)提取大量網(wǎng)絡(luò)安全狀態(tài)數(shù)據(jù)中的態(tài)勢(shì)要素的精確度方面有了很大程度的提升,此外,還能對(duì)其進(jìn)行較為廣泛的推廣和普及。同時(shí),為實(shí)現(xiàn)網(wǎng)絡(luò)安全態(tài)勢(shì)感知的實(shí)現(xiàn)提供了一個(gè)全新的想法和突破點(diǎn),可以證實(shí)該模型的準(zhǔn)確性和有效性。
進(jìn)化神經(jīng)網(wǎng)絡(luò);網(wǎng)絡(luò)安全;態(tài)勢(shì)要素;優(yōu)化設(shè)計(jì)
近年來(lái),隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展和網(wǎng)絡(luò)攻擊工具的傻瓜式使用,網(wǎng)絡(luò)攻擊手段正朝著多元化方向發(fā)展,信息泄露等安全事件發(fā)生頻率不斷提升。當(dāng)下網(wǎng)絡(luò)安全態(tài)勢(shì)感知被公認(rèn)為是網(wǎng)絡(luò)安全這門學(xué)科的主要研究方向,而對(duì)精確實(shí)現(xiàn)網(wǎng)絡(luò)安全態(tài)勢(shì)要素提取則是實(shí)現(xiàn)感知系統(tǒng)的第一步。在國(guó)內(nèi),網(wǎng)絡(luò)安全學(xué)科的發(fā)展也正迎頭趕上,特別是在聚類分析和分類分析等方面。一些研究工作者已經(jīng)對(duì)相關(guān)問(wèn)題做出了一定程度上的優(yōu)化和解決,這些工作為以后的安全態(tài)勢(shì)要素的研究工作奠定了基石。其中華東理工大學(xué)的張學(xué)琴團(tuán)隊(duì)提出了一種基于Fisher分和支持向量機(jī)的網(wǎng)絡(luò)入侵檢測(cè)特征提取方法;哈爾濱工程大學(xué)的王慧強(qiáng)教授將進(jìn)化策略和神經(jīng)網(wǎng)絡(luò)應(yīng)用到網(wǎng)絡(luò)安全態(tài)勢(shì)要素提取技術(shù)中,提出了一種基于進(jìn)化神經(jīng)網(wǎng)絡(luò)的態(tài)勢(shì)要素提取模型[3]。
1.1態(tài)勢(shì)要素獲取的本質(zhì)分析
網(wǎng)絡(luò)安全態(tài)勢(shì)要素提取的實(shí)質(zhì)就是發(fā)現(xiàn)存在于網(wǎng)絡(luò)中的各種引起異常的安全問(wèn)題,并轉(zhuǎn)化為某種方式告知安全系統(tǒng)。王慧強(qiáng)教授將網(wǎng)態(tài)勢(shì)要素定義為一種二元組SF=(N,W)。其中N代表態(tài)勢(shì)要素的名稱,W代表態(tài)勢(shì)要素所占的權(quán)重,即該態(tài)勢(shì)要素對(duì)你系統(tǒng)的影響程度。由此可看出,網(wǎng)絡(luò)安全態(tài)勢(shì)要素提取的實(shí)質(zhì)是一個(gè)分類識(shí)別的問(wèn)題,是對(duì)于網(wǎng)絡(luò)中的每條連接,判斷它是否屬于網(wǎng)絡(luò)中的正常連接,如果不是正常連接,用系統(tǒng)模型去識(shí)別它屬于哪種異常連接,進(jìn)而作為網(wǎng)絡(luò)安全要素反饋給系統(tǒng)模型。
1.2態(tài)勢(shì)感知分層實(shí)現(xiàn)模型
由于現(xiàn)階段正是安全態(tài)勢(shì)感知研究的發(fā)展時(shí)期,該學(xué)科的發(fā)展需要學(xué)習(xí)和借鑒專業(yè)領(lǐng)域的成熟先進(jìn)的理念和技術(shù)。Endsley于1995年提出了態(tài)勢(shì)感知理論模型,該理論模型著重于對(duì)態(tài)勢(shì)感知進(jìn)行理論上的了解,并對(duì)相關(guān)因素進(jìn)行量化融合分析的處理[1]。至此,態(tài)勢(shì)感知理論模型的應(yīng)用主要被分為對(duì)態(tài)勢(shì)要素的提取、理解和預(yù)測(cè)三個(gè)層面,這也為科研工作者提供了真實(shí)可靠的決策思路與依據(jù)。
在此模型中,我們定義大規(guī)模網(wǎng)絡(luò)安全態(tài)勢(shì)來(lái)源于網(wǎng)絡(luò)系統(tǒng)提供的網(wǎng)絡(luò)服務(wù)程序,一般計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)中出現(xiàn)的各種異常問(wèn)題都會(huì)間接或直接的影響大量的網(wǎng)絡(luò)服務(wù)的正常工作。為了更好的分析系統(tǒng)網(wǎng)絡(luò)所面臨的異常問(wèn)題及所受到的攻擊行為對(duì)安全狀況的影響,需要明確網(wǎng)絡(luò)安全態(tài)勢(shì)的主要影響層面,并且對(duì)其逐一分析。
從查閱文獻(xiàn)可知,對(duì)網(wǎng)絡(luò)安全態(tài)勢(shì)的威脅可以從三個(gè)角度來(lái)進(jìn)行闡述,隨后分別從這三個(gè)角度來(lái)對(duì)網(wǎng)絡(luò)的狀態(tài)加以評(píng)價(jià)。具體說(shuō)來(lái),就是從行為層次方面、在線服務(wù)方面和網(wǎng)絡(luò)安全性方面。上述三個(gè)方面的安全性檢驗(yàn)可依照關(guān)鍵信息點(diǎn)的采集、態(tài)勢(shì)分析及預(yù)判等三個(gè)過(guò)程依次進(jìn)行。
BP神經(jīng)網(wǎng)絡(luò)算法是當(dāng)前使用最多、最成熟的提取網(wǎng)絡(luò)安全態(tài)勢(shì)要素的算法之一,它憑借著強(qiáng)大的兼容并行的特性、易于使用掌握的便捷性以及減少計(jì)算復(fù)雜程度的簡(jiǎn)化性而成為一種被普羅大眾所廣泛接受的算法。我們可以將這種算法的核心定義為搜尋最小誤差。但是同時(shí),他也存在著一些不足,特別在求安全態(tài)勢(shì)要素方面,通常存在收斂速度慢,學(xué)習(xí)效率低下不足的問(wèn)題。究其原因,是由于其在處理非線性規(guī)劃時(shí)采用了最速下降的理論,以至于造成了上述不足。
結(jié)合上述的優(yōu)劣勢(shì)分析,筆者根據(jù)自身經(jīng)驗(yàn),提出了一種采用進(jìn)化策略來(lái)改進(jìn)神經(jīng)網(wǎng)絡(luò)算法的訓(xùn)練方法。該方法的優(yōu)勢(shì)在于可以使訓(xùn)練處的網(wǎng)絡(luò)模型分類準(zhǔn)確度高并且不容易陷入局部循環(huán)的情況。這恰好彌補(bǔ)了BP算法的缺陷,使得搜索效率得到較大提升。
想要將網(wǎng)絡(luò)安全態(tài)勢(shì)的相關(guān)信息提取出來(lái),可分為如下兩個(gè)大的方向:首先要進(jìn)化訓(xùn)練神經(jīng)網(wǎng)絡(luò),再根據(jù)相關(guān)需求對(duì)數(shù)據(jù)和參數(shù)進(jìn)行提取。其進(jìn)化步驟分別為∶結(jié)構(gòu)編碼(染色體表示法)、變異策略、適度函數(shù)選取。
2.1進(jìn)化策略結(jié)構(gòu)編碼
神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理能力不但跟神經(jīng)元之間的協(xié)同強(qiáng)度相關(guān)聯(lián),而且與神經(jīng)元所構(gòu)成的拓?fù)浣Y(jié)構(gòu)、處理單元之間的輸入輸出特性相關(guān)。所以利用進(jìn)化策略對(duì)態(tài)勢(shì)要素提取模型進(jìn)行優(yōu)化處理,最重要的是染色體如何表示,即如何基因編碼。首先假設(shè)r,s,t為態(tài)勢(shì)要素提取模型中的輸入層、隱藏層和輸出層的處理單元個(gè)數(shù)。在該進(jìn)化模型中我們采用的是個(gè)體表示法,采用比較傳統(tǒng)的十進(jìn)制進(jìn)行表示,其中個(gè)體的編碼分為兩大塊:(Xk, αk),其中Xk表示進(jìn)化到第k代的個(gè)體,αk表示進(jìn)化到第k代個(gè)體的連接權(quán)值或閡值。并且這兩大部分滿足:
式中,Xk表示第k代個(gè)體;N(0,σ)代表服從正態(tài)分布的隨機(jī)數(shù),其均值為零,標(biāo)準(zhǔn)差為σ。新個(gè)體Xk+1,是在舊個(gè)體Xk的基礎(chǔ)上添加一個(gè)獨(dú)立隨機(jī)變量N(0,σ)生成的。
2. 2 適應(yīng)度函數(shù)選取
在進(jìn)化策略模型中,衡量個(gè)體好壞的比的標(biāo)準(zhǔn)是適應(yīng)度函數(shù)選取的是否合適。分類選擇計(jì)算是按照一種準(zhǔn)確的方式進(jìn)行,故可以將該優(yōu)化模型的目標(biāo)函數(shù)值設(shè)定為每個(gè)處理單元的適應(yīng)度函數(shù),而不需要對(duì)目標(biāo)函數(shù)進(jìn)行任何變換處理。在這里定義模型的適應(yīng)度函數(shù)為:
2.3算法描述
利用遺傳進(jìn)化策略構(gòu)建的進(jìn)化神經(jīng)網(wǎng)絡(luò)模型的主要步驟如下:第一步:初始化相關(guān)參數(shù),設(shè)定神經(jīng)網(wǎng)絡(luò)模型的輸入層,輸出層,隱層神經(jīng)元個(gè)數(shù)分別為r,s,t;設(shè)定算法終止精度要求為ξ,令初始化進(jìn)化代數(shù)k=1;第二步:隨機(jī)產(chǎn)生一系列初始父本,初始父本個(gè)數(shù)n應(yīng)滿足對(duì)神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練精度要求,按公式一計(jì)算每個(gè)父本的適應(yīng)度;第三步:對(duì)任一父本,變異產(chǎn)生子代,并計(jì)算其子代的適應(yīng)度函數(shù);第四步:進(jìn)化代數(shù)為k+1,若,則完成進(jìn)化,否則進(jìn)入第二步繼續(xù)迭代。
3.1原始數(shù)據(jù)描述
實(shí)驗(yàn)所用的初始數(shù)據(jù)來(lái)自WenkeLee等人于1998年在美國(guó)國(guó)防部高級(jí)研究計(jì)劃局作IDS評(píng)測(cè)時(shí)獲得的數(shù)據(jù)基礎(chǔ)上恢復(fù)出來(lái)的連接數(shù)據(jù)信息,即DARPA入侵檢測(cè)數(shù)據(jù)集[1],見(jiàn)表1。
表1 DARPA數(shù)據(jù)集攻擊分布統(tǒng)計(jì)表
鑒于原始數(shù)據(jù)的數(shù)據(jù)量過(guò)于龐大,故在數(shù)據(jù)采納之前采用了分層抽樣的概率統(tǒng)計(jì)方式,采用這種方法主要旨在使抽樣數(shù)據(jù)和原始數(shù)據(jù)保持一定的一致性。反饋數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的比例是7∶3,但是相異的數(shù)據(jù)可能具有同樣的比重。
3.2實(shí)驗(yàn)結(jié)果
本次實(shí)驗(yàn)的誤差分析主要從算法的平方和誤差和適度函數(shù)值這兩個(gè)方面來(lái)著手進(jìn)行,利用MATLAB進(jìn)行仿真分析驗(yàn)證,再?gòu)钠浣Y(jié)果中對(duì)網(wǎng)絡(luò)安全狀態(tài)數(shù)據(jù)的分類性能做出反饋。通過(guò)誤差分析和曲線擬合,即可得到兩種算法下的誤差判定指標(biāo)的值,即誤差平方和與適應(yīng)度函數(shù)隨進(jìn)化代數(shù)的增加曲線。如圖1、圖2圖實(shí)線所示為基于進(jìn)化策略的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練算法,虛線所示為基于遺傳算法的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練算法。
圖1 誤差平方和變化曲線圖
圖2 適應(yīng)度函數(shù)變化曲線圖
通過(guò)進(jìn)行誤差分析可知,基于進(jìn)化策略的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練算法在進(jìn)化到100代時(shí),便可以看出基于進(jìn)化策略的神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法的收斂性較基于遺傳算法的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練算法好。因此,在進(jìn)行網(wǎng)絡(luò)安全態(tài)勢(shì)要素提取實(shí)驗(yàn)時(shí),算法必然具有較好的數(shù)據(jù)分類精度,并且算法性能穩(wěn)定。
網(wǎng)絡(luò)的安全性始終是一個(gè)不會(huì)過(guò)時(shí)的話題,它的態(tài)勢(shì)感知也將是極具可持續(xù)性的一個(gè)話題。本文提出了神經(jīng)網(wǎng)絡(luò)算法模型,可在網(wǎng)絡(luò)安全狀態(tài)和分析維護(hù)中起到關(guān)鍵性作用,在快速防止網(wǎng)絡(luò)被攻擊方面的作用同樣不容小覷。當(dāng)然,從整體來(lái)看,本文還有很多的不足和缺憾,比如沒(méi)有具體量化影響網(wǎng)絡(luò)安全的相關(guān)因素并確定其量化響應(yīng)機(jī)制,這也將是將來(lái)的研究的方向和重點(diǎn)需要考慮的地方。
[1]梁穎.基于數(shù)據(jù)融合的網(wǎng)絡(luò)安全態(tài)勢(shì)定量感知方法研究[D].哈爾濱:哈爾濱工程大學(xué),2007.
[2]蕭海東.網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估與趨勢(shì)感知的分析研究[D].上海:上海交通大學(xué),2007.
[3]郭劍.網(wǎng)絡(luò)安全態(tài)勢(shì)感知中態(tài)勢(shì)要素獲取技術(shù)的研究[D].東北:東北大學(xué),2011.
[4]梁穎,王慧強(qiáng),劉磊.基于網(wǎng)絡(luò)服務(wù)狀態(tài)分析的安全態(tài)勢(shì)定量感知方法[J].北京交通大學(xué)學(xué)報(bào),2009(4).
[5]卿松.網(wǎng)絡(luò)安全態(tài)勢(shì)感知綜述[J].計(jì)算機(jī)安全,2011(10).
易飛(1983—),男,安徽蚌埠人,工程師,碩士,主要從事信息通信研究。