王振東,王思如,王俊嶺,李大海
(江西理工大學(xué) 信息工程學(xué)院,江西 贛州 341000)
隨著互聯(lián)網(wǎng)的普及和計(jì)算機(jī)技術(shù)的更新發(fā)展,網(wǎng)絡(luò)中產(chǎn)生的數(shù)據(jù)規(guī)模愈發(fā)龐大,其中存在著大量的網(wǎng)絡(luò)攻擊行為威脅互聯(lián)網(wǎng)環(huán)境和網(wǎng)絡(luò)安全。再加之5G、云計(jì)算和物聯(lián)網(wǎng)等技術(shù)的廣泛應(yīng)用,數(shù)據(jù)在互聯(lián)網(wǎng)中的傳輸速度極大提高,大數(shù)據(jù)時(shí)代來臨,其集中化、高透明、大規(guī)模的特征為信息安全維護(hù)帶來了巨大挑戰(zhàn)。因此,大數(shù)據(jù)背景下的網(wǎng)絡(luò)信息安全是目前各界聚焦的關(guān)鍵難題。為應(yīng)對(duì)上述問題,防火墻作為一種安全設(shè)備被廣泛應(yīng)用,通過管理員們所制定的安全規(guī)則防止某些數(shù)據(jù)流的傳播,提高了接收數(shù)據(jù)流的準(zhǔn)確性。然而,僅憑借防火墻自身無法辨別出正常數(shù)據(jù)流和異常數(shù)據(jù)流,入侵檢測(cè)(Intrusion Detection,ID)作為具有主動(dòng)防御能力并能動(dòng)態(tài)檢測(cè)入侵行為的一種新型安全機(jī)制,已逐漸成為大數(shù)據(jù)時(shí)代下網(wǎng)絡(luò)安全的關(guān)鍵技術(shù)。傳統(tǒng)入侵檢測(cè)方法對(duì)檢測(cè)效率、檢測(cè)規(guī)模、檢測(cè)體系結(jié)構(gòu)等存在某些限制,而智能入侵檢測(cè)技術(shù)應(yīng)用模糊信息識(shí)別、規(guī)則產(chǎn)生式專家系統(tǒng)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)等技術(shù),極大提高了入侵檢測(cè)率和檢測(cè)速度,最大可能地防御病毒入侵。
當(dāng)前,入侵檢測(cè)技術(shù)相關(guān)研究大多聚焦在以下3 個(gè)方面:①基于數(shù)據(jù)挖掘的入侵檢測(cè),如王意潔等[1]基于同一網(wǎng)絡(luò)威脅行為的預(yù)警間存在特定關(guān)系這一思想,應(yīng)用數(shù)據(jù)挖掘算法尋找隱匿在數(shù)據(jù)分布背后的關(guān)系,并依據(jù)所發(fā)現(xiàn)的關(guān)聯(lián)信息數(shù)據(jù)對(duì)威脅行為序列進(jìn)行重構(gòu);②基于機(jī)器學(xué)習(xí)的入侵檢測(cè),Martins 等[2]提出對(duì)抗性機(jī)器學(xué)習(xí)方法被應(yīng)用于入侵及惡意軟件檢測(cè)場景中,實(shí)驗(yàn)結(jié)果表明,該方法在惡意軟件及入侵檢測(cè)中有效;③基于神經(jīng)網(wǎng)絡(luò)的入侵檢測(cè),Yang 等[3]將改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)算法應(yīng)用于無線網(wǎng)絡(luò)模型,并進(jìn)行相應(yīng)的入侵檢測(cè),該算法優(yōu)化的模型與其他機(jī)器學(xué)習(xí)算法相比,在執(zhí)行效率和分類準(zhǔn)確率等指標(biāo)上均有良好效果,相比于傳統(tǒng)入侵檢測(cè)分類模型有明顯提升。Yang 等[4]針對(duì)物聯(lián)網(wǎng)安全問題,結(jié)合LM 算法優(yōu)化速度快、魯棒性強(qiáng)的特點(diǎn),提出LM-BP 神經(jīng)網(wǎng)絡(luò)模型,并將其應(yīng)用于入侵檢測(cè)系統(tǒng),該模型通過LM 算法對(duì)傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)的權(quán)值閾值進(jìn)行優(yōu)化,再利用BP 算法對(duì)數(shù)據(jù)集進(jìn)行分類,具有更高的檢測(cè)率和更低的虛警率,但學(xué)習(xí)速率較低。Wang 等[5]利用深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)學(xué)習(xí)網(wǎng)絡(luò)數(shù)據(jù)流量的低層空間特征,然后利用LSTM 網(wǎng)絡(luò)學(xué)習(xí)高層時(shí)間特征,設(shè)計(jì)出一種新型網(wǎng)絡(luò)入侵檢測(cè)模型HAST-IDS,該模型通過多組基準(zhǔn)測(cè)試,其結(jié)果表明HAST-IDS 在準(zhǔn)確率、檢測(cè)率等方面均優(yōu)于其他已有方法,提高了入侵檢測(cè)實(shí)時(shí)性。
深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)的進(jìn)一步發(fā)展,也是對(duì)人工智能技術(shù)的加強(qiáng),它通過模仿人腦機(jī)制分析處理數(shù)據(jù),利用深度神經(jīng)網(wǎng)絡(luò),將模型處理得更為復(fù)雜,從而使模型對(duì)數(shù)據(jù)的理解更加深入,例如圖像、聲音和文本[6]。深度學(xué)習(xí)已經(jīng)在控制領(lǐng)域[7]、自然語言處理[8]、情感分析[9]等領(lǐng)域取得成效,這些成果也證明了深度學(xué)習(xí)是具有實(shí)用性的分類識(shí)別工具。在入侵檢測(cè)領(lǐng)域,Khan 等[10]提出兩階段深度學(xué)習(xí)模型,第一階段將網(wǎng)絡(luò)流量分為正常和異常兩類,第二階段將第一階段得到的特征狀態(tài)作為檢測(cè)的附加特征,該模型的優(yōu)點(diǎn)在于從無標(biāo)記的網(wǎng)絡(luò)數(shù)據(jù)中提取有用的特征表示。Su 等[11]在注意力機(jī)制與雙向長短期記憶(BLSTM)的前提下,設(shè)計(jì)了交通異常檢測(cè)模型BAT,該模型可快速有效地提高異常檢測(cè)能力。Lee 等[12]開發(fā)了基于事件分析的人工智能系統(tǒng),用于處理數(shù)據(jù)并更好地運(yùn)用不同的人工神經(jīng)網(wǎng)絡(luò)方法。
綜上,雖然上述模型在入侵檢測(cè)過程中展現(xiàn)出優(yōu)越的性能,但在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)流量的高速傳輸和龐大規(guī)模這兩個(gè)特性要求入侵檢測(cè)模型必須具有良好的實(shí)時(shí)性,若不能及時(shí)處理高速傳輸?shù)木W(wǎng)絡(luò)流量,模型將出現(xiàn)嚴(yán)重時(shí)滯現(xiàn)象,無法抵御實(shí)時(shí)網(wǎng)絡(luò)的安全威脅。因此,上述模型還存在以下問題:①兩階段深度學(xué)習(xí)模型中第一階段在面對(duì)海量的網(wǎng)絡(luò)數(shù)據(jù)時(shí)會(huì)大幅增加時(shí)間成本;②僅在一個(gè)數(shù)據(jù)集上的測(cè)試結(jié)果不能展現(xiàn)模型的泛化性和可移植性;③模型評(píng)價(jià)指標(biāo)系統(tǒng)單一,沒有其他評(píng)價(jià)指標(biāo)進(jìn)行交叉分析,不夠全面。對(duì)此,本文在大數(shù)據(jù)背景下提出了一種輕量級(jí)神經(jīng)網(wǎng)絡(luò)的入侵檢測(cè)模型(PCA-DELM),模型首先使用主成分分析方法(Principal Component Analysis,PCA)對(duì)含有正?;蚬舻木W(wǎng)絡(luò)數(shù)據(jù)進(jìn)行降維處理,這在龐大的數(shù)據(jù)集上能大幅減少時(shí)間成本,加快分類速率。鑒于極限學(xué)習(xí)機(jī)優(yōu)秀的表征能力,將其引入到入侵檢測(cè)領(lǐng)域,結(jié)合自動(dòng)編碼器(Auto Encoder,AE)對(duì)數(shù)據(jù)進(jìn)行監(jiān)督分類,再在UNSW-NB15 數(shù)據(jù)集上進(jìn)行二分類和多分類實(shí)驗(yàn),測(cè)試其入侵檢測(cè)性能并驗(yàn)證模型可移植性,最后在實(shí)時(shí)網(wǎng)絡(luò)流量CIDDS-001 數(shù)據(jù)集上模仿驗(yàn)證該模型在實(shí)際復(fù)雜的網(wǎng)絡(luò)中對(duì)入侵行為的檢測(cè)能力。以上實(shí)驗(yàn)均通過多個(gè)評(píng)價(jià)指標(biāo)交叉分析本文分類模型與傳統(tǒng)分類算法、經(jīng)典機(jī)器學(xué)習(xí)分類器分類結(jié)果,實(shí)驗(yàn)結(jié)果表明,本文所提出的智能入侵檢測(cè)方法在準(zhǔn)確率、精確率、真正率等指標(biāo)上有顯著提高。
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)[13]是一種針對(duì)于單隱層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden Layer Feedforward Neural Network,SLFN)[14]的機(jī)器學(xué)習(xí)算法。與傳統(tǒng)的SLFN 算法不同,ELM 可隨機(jī)選擇輸入層權(quán)重和隱藏層偏置,輸出層權(quán)重通過最小化由訓(xùn)練誤差項(xiàng)和輸出層權(quán)重范數(shù)的正則項(xiàng)構(gòu)成的損失函數(shù),依據(jù)Moore-Penrose 廣義逆矩陣?yán)碚撚?jì)算求出[15]。相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需人工設(shè)置大量參數(shù),極限學(xué)習(xí)機(jī)訓(xùn)練參數(shù)更少、學(xué)習(xí)速度更快、泛化能力更強(qiáng)。
給定有N個(gè)標(biāo)記樣本數(shù)據(jù)的訓(xùn)練集,k(xi,ti),xi=[xi1,…,xin]T∈Rn表示第i個(gè)樣本示例,ti=[ti1,…,tim]T∈Rm是每個(gè)樣本示例所對(duì)應(yīng)的標(biāo)簽,n表示訓(xùn)練數(shù)據(jù)集的特征個(gè)數(shù),m表示訓(xùn)練數(shù)據(jù)集的類別個(gè)數(shù)。若樣本xj對(duì)應(yīng)第k類,則將標(biāo)簽xj的第k個(gè)值設(shè)定為1,剩余(m-1)個(gè)值設(shè)成-1。如圖1所示,ELM 的網(wǎng)絡(luò)結(jié)構(gòu)和單隱層前饋神經(jīng)網(wǎng)絡(luò)相似。
Fig.1 ELM network structure圖1 ELM網(wǎng)絡(luò)結(jié)構(gòu)
包含L個(gè)隱藏節(jié)點(diǎn)的ELM 表示如下:
βi=[βi1,βi2,…,βi m]T是整個(gè)輸出層的權(quán)重系數(shù),βi1代表g1(x) 和ti1兩個(gè)神經(jīng)元之間的權(quán)重系數(shù),αi=[αi1,αi2,…,αi m]T是連接輸入層和第i個(gè)隱含層的輸入權(quán)重,bi是第i個(gè)隱藏層的偏置,G(αi,bi,xj)是第i個(gè)隱藏層的輸出矩陣。若第i個(gè)隱藏層的激活函數(shù)為g(x),則隱藏層的輸出為:
式(1)用矩陣形式表示為:
為達(dá)到輸出數(shù)據(jù)的期望值,訓(xùn)練網(wǎng)絡(luò)后需得出參數(shù)最優(yōu)值,使:
深度極限學(xué)習(xí)機(jī)最終是要最小化實(shí)際輸出和期望輸出間的誤差,也即最小化損失函數(shù):
ELM 算法中參數(shù)(αi,bi)是隨機(jī)生成,因此也唯一確定。其解決方法可以轉(zhuǎn)化為:
根據(jù)文獻(xiàn)[16]可知,要求解的范數(shù)最小且唯一。為提高模型泛化能力,加入了正則項(xiàng),求解問題則轉(zhuǎn)化為:
其中,λ是正則化系數(shù),其解如下:
其中,I是單位矩陣。
1.2.1 基于極限學(xué)習(xí)機(jī)的自編碼器
自動(dòng)編碼器(Auto Encoder,AE)是一種無監(jiān)督神經(jīng)網(wǎng)絡(luò)模型,它利用輸入X自身作為監(jiān)督,通過訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型期望得到一個(gè)重構(gòu)輸出X'。因此AE 無需標(biāo)記訓(xùn)練數(shù)據(jù)。在ELM 中引入AE 的思想,使ELM 的輸入也被視為目標(biāo)輸出,即輸出Y=X,引入自編碼器的極限學(xué)習(xí)機(jī)ELMAE(Extreme Learning Machineasan Auto Encoder)的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
Fig.2 ELM-AE network structure圖2 ELM-AE網(wǎng)絡(luò)結(jié)構(gòu)
簡言之,ELM-AE 類似于一個(gè)逼近器,其目標(biāo)是盡可能讓網(wǎng)絡(luò)的輸出與輸入相同,同時(shí)使隱藏層的輸入?yún)?shù)(αi,bi)隨機(jī)生成后正交。其優(yōu)勢(shì)如下:
(1)可將輸入數(shù)據(jù)映射到不同或等維度的空間,實(shí)現(xiàn)維度壓縮、稀疏表達(dá)或等維度的特征表達(dá)。
(2)可清除特征之外的噪聲,使特征之間分布更為均勻和線性獨(dú)立,提高系統(tǒng)泛化性。
ELM-AE 的輸出可由式(1)轉(zhuǎn)化為式(9)求出。
其中,α是由αi構(gòu)成的矩陣,b是由bi構(gòu)成的向量。
針對(duì)維度壓縮和稀疏表達(dá),隱藏層的輸出權(quán)重β可由式(8)轉(zhuǎn)化為式(10)求出。
其中,X=[x1,…,xN]是輸入數(shù)據(jù)。
針對(duì)同維度的特征映射,權(quán)重β可由式(11)計(jì)算求出。
由文獻(xiàn)[16]可知,βT β=I。
1.2.2 深度極限學(xué)習(xí)機(jī)
基于ELM-AE 的3 種不同的特征表達(dá)功能,可以將其作為深度極限學(xué)習(xí)機(jī)(Deep Extreme Learning Machine,DELM)的基礎(chǔ)模塊。與傳統(tǒng)深度學(xué)習(xí)算法相同,DELM 應(yīng)用逐層貪婪的方式訓(xùn)練網(wǎng)絡(luò),DELM 每個(gè)隱藏層的輸入權(quán)重都用ELM-AE 初始化,執(zhí)行分層無監(jiān)督訓(xùn)練。與傳統(tǒng)深度學(xué)習(xí)算法相比,DELM 沒有反向微調(diào)的步驟。
DELM 的目的是使輸出信息無限逼近原輸入信息,其基本思想是通過對(duì)每一層的訓(xùn)練,最大程度地減小重構(gòu)誤差,最終得到輸入信息的高級(jí)特性。DELM 模型的主要訓(xùn)練步驟則是將原始輸入信息樣本X視為下一個(gè)ELM-AE的目標(biāo)輸出(X1=X),從而得到輸出權(quán)值β1。然后,將DELM 的第一個(gè)隱藏層的目標(biāo)輸出矩陣H1,當(dāng)作下一個(gè)ELM-AE 的輸入和目標(biāo)輸出(X2=H1),依次逐步地展開訓(xùn)練,最后一層用ELM 訓(xùn)練,可以使用式(6)求解DELM 的最后一個(gè)隱藏的輸出矩陣βi+1。DELM 每一層隱藏層的輸入權(quán)重矩陣為。
主成分分析PCA(Principal Component Analysis)是統(tǒng)計(jì)學(xué)中的一種降維方法,它通過削減特征向量的數(shù)量降低矩陣維度。在神經(jīng)網(wǎng)絡(luò)中,可以采用PCA 減少輸入數(shù)據(jù)樣本的特征維度,從而降低神經(jīng)網(wǎng)絡(luò)模型計(jì)算量,提升模型計(jì)算速度 。假設(shè)給定原始數(shù)據(jù)集A={a11,a12,ai j,…,am n},其中i代表樣本數(shù)據(jù),j表示對(duì)應(yīng)樣本的特征維度,m和n分別表示樣本個(gè)數(shù)和特征數(shù)量,數(shù)據(jù)集矩陣可用式(12)表示。
PCA 采用線性變換將原始數(shù)據(jù)變量轉(zhuǎn)變成非線性相關(guān)的數(shù)據(jù)變量。通過求出協(xié)方差矩陣的特征向量和特征值,保留累計(jì)貢獻(xiàn)率超過85%的特征向量,用原始數(shù)據(jù)矩陣乘以特征向量矩陣得到一個(gè)新的特征矩陣,從而降低維度。式(13)定義了數(shù)據(jù)集中不同維度上的均值μ。
使用式(14)計(jì)算樣本點(diǎn)在不同維度上的偏差。
數(shù)據(jù)集協(xié)方差矩陣H定義為。
對(duì)輸入數(shù)據(jù)集協(xié)方差矩陣做奇異值分解(Singular Value Decomposition,SVD)可以得到一組特征值和特征向量(λ1,μ1),(λ2,μ2),…,(λn,μn),它表示協(xié)方差矩陣H的n組特征值和特征向量,將原始數(shù)據(jù)映射到協(xié)方差矩陣中k個(gè)最大特征值所對(duì)應(yīng)的特征向量張成的子空間中。式(16)給出了k的確定方法。
其中,β是子空間的特征值之和與原始空間的所有特征值之和的比值。選取最大的k個(gè)特征值后,可生成一個(gè)大小為m*k的矩陣B,按照式(17)將原始數(shù)據(jù)投影到k維子空間中。
式(12)—式(17)給出了去除不同特征間相關(guān)性的具體步驟。分別在兩個(gè)數(shù)據(jù)集上調(diào)用上述方法實(shí)現(xiàn)降維。依據(jù)經(jīng)驗(yàn)將β設(shè)置為0.85,并由式(16)在UNSW-NB15 數(shù)據(jù)集和CIDDS-001 數(shù)據(jù)集上分別保留前14、前6 個(gè)特征向量,這種方法在消除不同維度相關(guān)性的同時(shí),還可減少模型在訓(xùn)練過程中的存儲(chǔ)開銷。
PCA 降維的時(shí)間復(fù)雜度為O(min(m3,k3)),m是樣本數(shù)量,k為經(jīng)PCA 降維后保留的子空間維數(shù)。顯然,k 本文提出的PCA-DELM 入侵檢測(cè)算法需通過3 個(gè)階段,檢測(cè)前先對(duì)數(shù)據(jù)作預(yù)處理,然后用PCA 對(duì)數(shù)據(jù)集進(jìn)行降維處理,最后通過具有深度學(xué)習(xí)能力的極限學(xué)習(xí)機(jī)(Deep Extreme Learning Machine,DELM)對(duì)數(shù)據(jù)進(jìn)行監(jiān)督分類,完成入侵檢測(cè)過程。PCA-DELM 入侵檢測(cè)流程包括以下步驟,流程如圖3所示。 Fig.3 Flow of DELM intrusion detection圖3 PCA-DELM 入侵檢測(cè)流程 (1)數(shù)據(jù)預(yù)處理。標(biāo)準(zhǔn)化UNSW-NB15 和CIDDS-001數(shù)據(jù)集,對(duì)數(shù)據(jù)進(jìn)行歸一化處理后得到數(shù)值型數(shù)據(jù),形成標(biāo)準(zhǔn)化數(shù)據(jù)集。 (2)定義DELM 神經(jīng)網(wǎng)絡(luò)模型參數(shù)。根據(jù)尋參實(shí)驗(yàn)結(jié)果可知,網(wǎng)絡(luò)迭代100 次,隱含層共3 層,在7070-120 時(shí),網(wǎng)絡(luò)分類性能最佳。 (3)PCA 降維。對(duì)預(yù)處理后的高維數(shù)據(jù)集進(jìn)行降維并得到低維表示的數(shù)據(jù)。 (4)數(shù)據(jù)分離。將降維后的數(shù)據(jù)按比例分為訓(xùn)練集、驗(yàn)證集、測(cè)試集。 (5)形成DELM 有監(jiān)督分類模型,將訓(xùn)練集和驗(yàn)證集數(shù)據(jù)輸入到DELM 分類模型中進(jìn)行訓(xùn)練,調(diào)整模型。 (6)輸出最優(yōu)的DELM 分類模型。 (7)輸入測(cè)試集數(shù)據(jù)并輸出分類規(guī)范化結(jié)果。 本文共做了2 組實(shí)驗(yàn)。①在UNSW-NB15 數(shù)據(jù)集及CIDDS-001 數(shù)據(jù)集上進(jìn)行二分類實(shí)驗(yàn),在2 個(gè)數(shù)據(jù)集上驗(yàn)證PCA-DELM 入侵檢測(cè)算法模型的分類檢測(cè)性能;②在上述數(shù)據(jù)集上進(jìn)行多分類實(shí)驗(yàn),進(jìn)一步驗(yàn)證該模型的網(wǎng)絡(luò)分類性能及泛化能力,在實(shí)際包含不同攻擊的復(fù)雜網(wǎng)絡(luò)中對(duì)入侵行為的檢測(cè)能力進(jìn)行驗(yàn)證。 UNSW-NB15 數(shù)據(jù)集包含2×105條數(shù)據(jù),共49 個(gè)特征。除正常數(shù)據(jù)外,還包含F(xiàn)uzzers、Analysis、Backdoors、Dos、Exploits、Generic、Reconnaissance、Shellcode 及Worms 在內(nèi)的9 種攻擊。CIDDS-001 數(shù)據(jù)集包含6.8×105條數(shù)據(jù),是來自于網(wǎng)絡(luò)中的實(shí)時(shí)流量,包括在內(nèi)部服務(wù)器(Web、文件、備份和郵件)和外部服務(wù)器(文件同步和Web 服務(wù)器)上捕獲的實(shí)時(shí)流量,包括14個(gè)特征。 為更好地評(píng)估本文模型及算法的有效性,在二分類實(shí)驗(yàn)中,將數(shù)據(jù)集中的攻擊合并為Abnormal,記為2,正常數(shù)據(jù)Nornal 記為1。利用入侵檢測(cè)準(zhǔn)確率(Accuracy,Acc)、精確率(Precision,P)、真正率(True Postive Rate,TPR)、假正率(False Postive Rate,F(xiàn)PR)、F 值、召回率(Recall)等指標(biāo)對(duì)二分類實(shí)驗(yàn)進(jìn)行評(píng)價(jià)。具體計(jì)算方法參考文獻(xiàn)[17]。 實(shí)驗(yàn)環(huán)境為Windows10,64 位操作系統(tǒng),處理器Intel(R)Core(TM)i5-6500CPU3.20GHz,安裝內(nèi)存(RAM)8.00GB,仿真環(huán)境是MatlabR2017b。在進(jìn)行二分類和多分類實(shí)驗(yàn)前為驗(yàn)證PCA-DELM 的分類性能,與ELM、DELM方法在UCI 的Iris 和Wine 數(shù)據(jù)集上做了分類對(duì)比試驗(yàn)。本文提出的PCA-DELM 分類器在所測(cè)試的數(shù)據(jù)集上的分類精度不低于ELM 和DELM 分類器,在Iris 數(shù)據(jù)集上的分類準(zhǔn)確率高達(dá)100%,在Wine 數(shù)據(jù)集上的分類準(zhǔn)確率高達(dá)93%。 仿真實(shí)驗(yàn)中,使用UNSW-NB15 數(shù)據(jù)集和CIDDS-001數(shù)據(jù)集上進(jìn)行入侵測(cè)試,將本文所提出的分類模型PCADELM 與ELM 分類模型、SOM 網(wǎng)絡(luò)分類模型、深度神經(jīng)網(wǎng)絡(luò)分類模型(DNN、DBN)、經(jīng)典機(jī)器學(xué)習(xí)分類器進(jìn)行對(duì)比實(shí)驗(yàn),通過各種評(píng)價(jià)指標(biāo)對(duì)算法模型進(jìn)行比較,驗(yàn)證算法模型的性能。將數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,進(jìn)行入侵檢測(cè)仿真實(shí)驗(yàn),各算法在兩個(gè)數(shù)據(jù)集上的二分類測(cè)試結(jié)果如表1、表2所示。 Table 1 UNSW-NB15 binary classification test results表1 UNSW-NB15二分類測(cè)試結(jié)果 Table 2 CIDDS-001 binary classification test results表2 CIDDS-001二分類測(cè)試結(jié)果 由二分類實(shí)驗(yàn)結(jié)果可知,在UNSW-NB15 和CIDDS-001 數(shù)據(jù)集上,PCA-DELM 入侵檢測(cè)模型的測(cè)試準(zhǔn)確率分別為73.49%、81.76%,在CIDDS-001 數(shù)據(jù)集上的準(zhǔn)確率較高。PCA-DELM 方法在準(zhǔn)確率方面十分穩(wěn)定,波動(dòng)較小,且處于較高的檢測(cè)水平。 由表1 可知,在UNSW-NB15 數(shù)據(jù)集上,除SOM 方法外,其余算法檢測(cè)準(zhǔn)確率均達(dá)60%以上,由于該數(shù)據(jù)集較為分散,分類難度高,故準(zhǔn)確率普遍偏低。其中,PCADELM 的準(zhǔn)確率、精確率、召回率及F 值分別為73.49%、68.35%、96.57%、80.05%,與較為穩(wěn)定的SVM 分類器相比分別高出4.84%、3.22%、3.86%、3.54%,在時(shí)間方面,PCADELM 用時(shí)要少19 h以上。 由表2 可知,DELM 方法的檢測(cè)準(zhǔn)確率最高,為99.25%,接近100%,比效果最差的SOM 高出81.01%,次優(yōu)的分類模型為DBN,準(zhǔn)確率為97.66%,在傳統(tǒng)的機(jī)器學(xué)習(xí)分類器中,DT 表現(xiàn)最佳。PCA-DELM 的測(cè)試準(zhǔn)確率在80%以上,且精確率、召回率為100%,時(shí)間為3 872 s,除去效果最差的SOM,時(shí)間在其余算法中最少。 綜上,SVM 分類器的性能在不同的數(shù)據(jù)集上能夠保持相同的范圍,且維持較高的準(zhǔn)確率。然而,PCA-DELM 分類模型的準(zhǔn)確率與其他方法相比,在兩個(gè)數(shù)據(jù)集上均較高且穩(wěn)定,且高出0%~70.47%。當(dāng)精確率和召回率發(fā)生沖突時(shí),對(duì)模型性能的比較會(huì)困難得多,但F 值能夠兼顧精確率和召回率,因此可看作是調(diào)和平均,以更好地對(duì)模型進(jìn)行評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明,SVM 和DT 分類器表現(xiàn)較好,說明SVM 和DT 方法適合二分類問題,但深度神經(jīng)網(wǎng)絡(luò)總體性能明顯優(yōu)于經(jīng)典機(jī)器學(xué)習(xí)算法,在二分類方面頗具優(yōu)勢(shì)。 本文使用的2 個(gè)數(shù)據(jù)集均為非平衡數(shù)據(jù)集,各攻擊之間有所差異,故進(jìn)行多分類實(shí)驗(yàn),利用各種評(píng)價(jià)指標(biāo)進(jìn)一步分析各算法的入侵檢測(cè)性能,驗(yàn)證比較算法模型可靠性。表3和表4為各算法模型多分類詳細(xì)結(jié)果。 Table 3 UNSW-NB15 multi-classification test results(1)表3 UNSW-NB15多分類測(cè)試結(jié)果(1) Table 4 UNSW-NB15 multi-classification test results(2)表4 UNSW-NB15多分類測(cè)試結(jié)果(2) 在UNSW-NB15 數(shù)據(jù)集上,包含正常數(shù)據(jù)和9 種攻擊。對(duì) 于Normal,PCA-DELM 與DT 的AUC 值最高,分別為0.823 1、0.848 5,AUC 值最小的是SOM,為0.138 0。SOM、DELM、PCA-DELM 的真正率低于60%,其余算法高于64%,其中最高的是SVM 分類器,高達(dá)87.35%,但DT 和PCA-DELM 的假正率很低,分別為5.05%、12.98%。對(duì)于Fuzzers 攻擊,SVM、DNN、SOM、DBN 的真正率為0%,除DNN 算法的假正率和AUC 值分別為0.5%、49.96%外,上述其余算法的假正率和AUC 值均為0%,ELM 的AUC 值最高,為79.43%。對(duì)于Analysis 攻擊,除DT 算法的真正率為8.27%,其余算法的真正率均為0%,DT、ELM 的假正率分別為3.31%、0.64%,其余算法的假正率均為0%,各算法的AUC 值均在0.5 左右。對(duì)于Backdoors 攻擊,DT、DELM、PCA-DELM 算法的真正率分別為24.87%、0.86%、1.21%,其余算法的真正率為0%,各算法的AUC 值均在0.5 左右。對(duì)于Dos 攻擊,除ELM 算法的真正率最高為44.44%外,其余算法的真正率均低于22%,PCA-DELM 的效果最好,AUC 值最高,為0.783 2。對(duì)于Exploit 攻擊,PCA-DELM 的真正率為78.1%,AUC 值為0.721 3,對(duì)于Generic 攻擊,除SOM 算法外,其余算法的真正率均能達(dá)到95%以上,其中DBN 最高為96.95%,PCA-DELM 的真正率為96.43%,除SOM 算法外,其余算法模型表現(xiàn)較好,AUC 值均能達(dá)到0.8以上。對(duì)于Reconnaissance 攻擊,所有算法模型的AUC 值均在0.5 以上,其中ELM 的真正率最高,為13.21%。對(duì)于Shellcode 攻 擊,AdaBoost、DT 的真正率分別為7.14%、52.38%,假正率分別為0.2%、1.11%,其余算法的真正率和假正率均為0%,大部分算法的AUC 值為0.5,包括本文提出的PCA-DELM 模型。對(duì)于Worms 攻擊,僅DT 的真正率為13.64%,其余算法均為0%,除DT 的AUC 值為0.567 7,其余算法的AUC 值為0.5。 在CIDDS-001 數(shù)據(jù)集上,對(duì)于Normal,PCA-DELM 的真正率高達(dá)95.99%,且AUC 值高達(dá)0.9649;對(duì)于Attackers,DELM 與AdaBoost 算法的AUC 值最高,分別為0.923 1、1,其余算法的AUC 值均在0.5 上下,所有算法的假正率趨近于0%或者為0%;對(duì)于Suspicious,除SOM 算法外,其余算法的真正率均達(dá)到85%以上,其中DNN 的真正率為100%,PCA-DELM 的真正率為97.31%,AUC 值為0.707 6,模型性能優(yōu)于大部分其他算法模型;對(duì)于Unknown,PCADELM 的真正率僅31.55%,但其AUC 值為0.642 9,假正率低至2.98%,其余算法的AUC 值大部分集中在0.5 左右;對(duì)于Victim,DT、SOM 的真正率為100%,DELM 算法的真正率為99.45%,剩余算法的真正率為0%,DT、DELM 的AUC值分別為0.957 5、0.990 5,其余算法均低于0.6。圖4 和圖5 分別為兩個(gè)數(shù)據(jù)集上的ROC 曲線,直觀地說明了AUC 及真、假正率之間的聯(lián)系。表5 為各算法在不同數(shù)據(jù)集上檢測(cè)所花費(fèi)的時(shí)間,顯然,PCA-DELM 模型檢測(cè)時(shí)間明顯少于其他算法,更具實(shí)時(shí)性,在大數(shù)據(jù)時(shí)代下更具優(yōu)勢(shì)。 Table 5 Time execution evaluation indicators表5 時(shí)間執(zhí)行評(píng)價(jià)指標(biāo) Fig.4 UNSW-NB15-Generic ROC curve圖4 UNSW-NB15-Generic ROC 曲線 Fig.5 CIDDS-001-Suspicious ROC curve圖5 CIDDS-001-Suspicious ROC 曲線 二分類實(shí)驗(yàn)及進(jìn)一步的多分類實(shí)驗(yàn)結(jié)果表明,在準(zhǔn)確性方面,PCA-DELM 模型性能明顯優(yōu)于經(jīng)典神經(jīng)網(wǎng)絡(luò)和經(jīng)典機(jī)器學(xué)習(xí)算法,在二分類和多類方面都有很大優(yōu)勢(shì),在其他評(píng)價(jià)指標(biāo)上也體現(xiàn)出較大優(yōu)勢(shì)。 本文利用PCA 的降維能力,設(shè)計(jì)了一種基于主成分分析的強(qiáng)化深度極限學(xué)習(xí)機(jī)分類模型,并提出了PCA-DELM模型。一方面,使用PCA保證模型對(duì)數(shù)據(jù)的特征降維能力;另一方面,利用DELM 保證對(duì)數(shù)據(jù)快速分類的能力。實(shí)驗(yàn)結(jié)果表明:①PCA-DELM 入侵檢測(cè)模型的數(shù)據(jù)分類性能穩(wěn)定,不管是復(fù)雜高維數(shù)據(jù),還是攻擊類型多數(shù)據(jù)集,都能實(shí)現(xiàn)較優(yōu)的入侵檢測(cè)效果,且不敏感于特定數(shù)據(jù)集;②PCADELM 入侵檢測(cè)模型成功解決了現(xiàn)有方法(數(shù)據(jù)挖掘、傳統(tǒng)機(jī)器學(xué)習(xí)等方法)存在的準(zhǔn)確率、精確率、召回率、真正率等指標(biāo)偏低的問題;③在2 個(gè)網(wǎng)絡(luò)入侵檢測(cè)數(shù)據(jù)集上,PCADELM 入侵檢測(cè)模型與現(xiàn)有方法相比,在各類評(píng)價(jià)指標(biāo)上均具有明顯優(yōu)勢(shì)。特別是在實(shí)時(shí)網(wǎng)絡(luò)數(shù)據(jù)集CIDDS-001上仍能表現(xiàn)穩(wěn)定。PCA-DELM 入侵檢測(cè)模型為車聯(lián)網(wǎng)、物聯(lián)網(wǎng)等不同領(lǐng)域的安全問題方面提供全新、可行的解決方案及思路。本文采用的是有監(jiān)督分類模型,因此對(duì)真實(shí)網(wǎng)絡(luò)環(huán)境中未知攻擊的檢測(cè)還存在一定局限性。未來工作中,將考慮引入生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)學(xué)習(xí)正常樣本的檢測(cè)入侵行為且不受限于特定樣本的特性,以提升對(duì)未知攻擊的檢測(cè)率。2.2 算法流程
3 實(shí)驗(yàn)設(shè)置與分析
3.1 評(píng)價(jià)指標(biāo)
3.2 分類性能分析實(shí)驗(yàn)
3.3 二分類實(shí)驗(yàn)
3.4 多分類實(shí)驗(yàn)
4 結(jié)語