田 偉,劉文祺
(1. 中國人民解放軍95333部隊,湖南 長沙 410114;2. 電子科技大學(xué)計算機(jī)科學(xué)與工程學(xué)院,四川 成都 611731)
網(wǎng)絡(luò)信息可以加強(qiáng)社會的治理,但由于網(wǎng)絡(luò)信息的開放性,導(dǎo)致網(wǎng)絡(luò)信息會受到大量的惡意攻擊,網(wǎng)絡(luò)信息安全問題已經(jīng)成為信息領(lǐng)域的一大難點[1]。隱蔽網(wǎng)絡(luò)信息也同樣具有安全的難題,通常情況下,大多數(shù)學(xué)者會采用安全指數(shù)對隱蔽網(wǎng)絡(luò)信息安全進(jìn)行相應(yīng)的衡量,其主要指的是在網(wǎng)絡(luò)安全的狀態(tài)下,網(wǎng)絡(luò)信息反映的數(shù)據(jù)特征變化程度是一個相對的數(shù)值變化,主要是對網(wǎng)絡(luò)信息安全狀態(tài)進(jìn)行相應(yīng)的反映與度量,將其簡稱為網(wǎng)絡(luò)信息安全指數(shù)[2]。隱蔽網(wǎng)絡(luò)信息安全指數(shù)具有多維屬性的特性。如何對隱蔽網(wǎng)絡(luò)信息安全進(jìn)行正確的評估已經(jīng)成為學(xué)者研究的重點課題之一,而隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類則是其中的關(guān)鍵步驟,只有對隱蔽網(wǎng)絡(luò)信息安全指數(shù)進(jìn)行合理的分類,才能對其網(wǎng)絡(luò)信息安全進(jìn)行正確的評估,從而對其進(jìn)行相應(yīng)的保護(hù)。
就現(xiàn)有的研究來看,使用較為廣泛的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法主要有三種,分別為粗糙集理論方法、支持向量機(jī)方法與K-最近鄰域方法。其中,基于粗糙集理論的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法主要是區(qū)分確定性與完整性較低的數(shù)據(jù),并對其進(jìn)行有效分析,同時對該類數(shù)據(jù)中包含的不相關(guān)信息進(jìn)行剔除,這種方法具有易于執(zhí)行、操作簡單的優(yōu)勢;基于支持向量機(jī)的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法主要是針對線性與非線性數(shù)據(jù)進(jìn)行分類的[3]。支持向量機(jī)實質(zhì)是一種學(xué)習(xí)算法,其主要是通過創(chuàng)建平面來對信息進(jìn)行合理的分類;基于K-最近鄰域的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法通過選擇K個與樣本相似的訓(xùn)練實例,對樣本的標(biāo)簽進(jìn)行預(yù)測,以此來實現(xiàn)樣本的分類。但是上述三種方法均存在著分類準(zhǔn)確率及效率低的缺陷,無法適應(yīng)現(xiàn)今網(wǎng)絡(luò)的需求,為此提出隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法,并采用仿真對比實驗對提出方法的分類性能進(jìn)行驗證與分析。
對于隱蔽網(wǎng)絡(luò)來說,其特點在于復(fù)雜程度較高、節(jié)點的規(guī)模較大,同時網(wǎng)絡(luò)信息之間的關(guān)系也較為復(fù)雜[4]。將隱蔽網(wǎng)絡(luò)信息安全指數(shù)看作為一個復(fù)雜的信息系統(tǒng),其表現(xiàn)形式可分為三種,分別為實體、關(guān)聯(lián)與整體。
其中,信息實體指的是處于網(wǎng)絡(luò)信息節(jié)點處的原數(shù)據(jù),其不僅具有實體屬性,同時還具備關(guān)聯(lián)屬性。而實體屬性指的是網(wǎng)絡(luò)信息的具體表現(xiàn)形式,關(guān)聯(lián)屬性指的是網(wǎng)絡(luò)信息中信息實體所在的位置與層級之間的關(guān)系;信息關(guān)聯(lián)指的是兩個或者兩個以上的信息實體之間的聯(lián)系,信息之間的關(guān)聯(lián)屬性主要是通過網(wǎng)絡(luò)信息結(jié)構(gòu)來體現(xiàn);信息整體指的是將網(wǎng)絡(luò)信息看作為一個整體,其中包含信息實體與信息關(guān)聯(lián),實質(zhì)上是一個具有信息關(guān)聯(lián)的信息實體,與信息實體具有同樣的屬性。
為得到隱蔽網(wǎng)絡(luò)信息安全指數(shù)屬性,采用混合法對其屬性進(jìn)行相應(yīng)的篩選?;旌戏ㄖ饕獙b法與過濾法進(jìn)行有效的結(jié)合,將各自優(yōu)勢充分發(fā)揮,得到更加適合安全指數(shù)分類需求的屬性集合[5]。隱蔽網(wǎng)絡(luò)信息安全指數(shù)屬性集合主要分為三種,分別為實體屬性集合、關(guān)聯(lián)屬性集合與時間屬性集合,而其具體定義如表1所示。
表1 隱蔽網(wǎng)絡(luò)信息安全指數(shù)屬性分類情況表
根據(jù)上述分類情況可知,一般情況下網(wǎng)絡(luò)信息安全指數(shù)映射可視化劃分關(guān)系,可分為結(jié)構(gòu)映射與圖形映射關(guān)系。其中,圖形映射方法能夠提供隱蔽網(wǎng)絡(luò)信息安全指數(shù)實體屬性,而結(jié)構(gòu)映射方法可顯示關(guān)聯(lián)屬性與時間屬性隱形結(jié)構(gòu)[6]。隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性映射關(guān)系如圖1所示。
圖1 隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性映射關(guān)系圖
通過上述過程完成了隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性的分析,并采用混合法對屬性進(jìn)行提取,得到適合安全指數(shù)分類需求的屬性集合,為下述網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類打下夯實的基礎(chǔ)。
以上述隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性的分析為基礎(chǔ),構(gòu)建多維貝葉斯分類模型,為安全指數(shù)多維屬性分類提供模型支撐[7]。
多維貝葉斯分類模型主要以多維貝葉斯分類器為主,采用分類器對安全指數(shù)多維屬性進(jìn)行分類。在安全指數(shù)多維屬性分類中,主要采用具有有限頂點集的貝葉斯網(wǎng)絡(luò),其屬性集合為
V={C1,…Cm,X1,…Xn}
(1)
其中,Cm表示的是具有m個類變量;Xn表示的是具有n個屬性變量。任意類變量Ci與任意屬性變量Xi均提取于有限集合;而多維貝葉斯分類器主要是通過參數(shù)πijk與參數(shù)θijk對其進(jìn)行相應(yīng)的控制,參數(shù)表達(dá)式為
(2)
其中,ck表示的是類變量的取值;Pa(Ci)表示的是類變量的節(jié)點集合;xk表示的是屬性變量的取值;Pa(Xi)表示的是屬性變量的節(jié)點集合。
多維貝葉斯分類器主要采用雙分裂有向圖對類變量與屬性變量之間的關(guān)系進(jìn)行連接與顯示。多維貝葉斯分類器對其進(jìn)行表示
S=(V,A)
V=(VC,VF)
A=(AC,AF,AAC)
(3)
其中,V表示的是屬性集合,由VC={C1,…,Cm}與VF={X1,…Xn}組成;A表示的是弧集,其主要由三個集合組成,分別為類變量集合AC、屬性變量集合AF與屬性變量與類變量乘積集合ACF。
多維貝葉斯分類模型可以采用圖形進(jìn)行表示,其包含三個子圖,分別為類子圖、屬性子圖與橋子圖。多維貝葉斯分類模型示意圖如圖2所示。
圖2 多維貝葉斯分類模型示意圖
其中類子圖SC=(VC,AC)如圖3所示,屬性子圖SF=(VF,AF)如圖4所示,橋子圖SCF=(V,ACF)如圖5所示。
圖3 類子圖示意圖
圖4 屬性子圖示意圖
圖5 橋子圖示意圖
多維屬性分類問題實質(zhì)上是對最大后驗概率的估計問題,也是一個非確定性問題,而多維貝葉斯分類模型可以極大簡化分類的過程,提升分類方法的分類效率[8]。
通過上述過程實現(xiàn)多維貝葉斯分類模型的構(gòu)建,可以極大地提升隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法的分類效率。
以上述構(gòu)建的多維貝葉斯分類模型為基礎(chǔ),對隱蔽網(wǎng)絡(luò)信息安全指數(shù)屬性集合進(jìn)行處理,為安全指數(shù)多維屬性分類提供硬件設(shè)備支撐。
采用屬性選擇算法對2.1小節(jié)得到的屬性集合進(jìn)行約簡。常用的屬性選擇算法主要有三種,分別為蟻群優(yōu)化算法、菌群優(yōu)化算法以及類電磁機(jī)制算法。根據(jù)安全指數(shù)多維屬性的特點,選擇菌群優(yōu)化算法作為分類方法中的屬性選擇算法[9]。
菌群優(yōu)化算法主要是采用加權(quán)策略對冗余變量進(jìn)行消除,以此來提升所提方法的分類準(zhǔn)確率。安全指數(shù)的每個屬性權(quán)重隨著頻數(shù)與屬性變量之間的關(guān)系及類變量與屬性變量之間的關(guān)系發(fā)生變化。菌群優(yōu)化算法對得到的安全指數(shù)屬性集合進(jìn)行加權(quán),權(quán)重表示為
ωi={ω1,ω2,…,ωn}
(4)
根據(jù)式(4)對屬性進(jìn)行相應(yīng)的選擇,但是會出現(xiàn)屬性重復(fù)的情況,因此需要對其進(jìn)行約簡處理,主要通過屬性子集的適應(yīng)度函數(shù)值對權(quán)重進(jìn)行更新,對上述步驟進(jìn)行重復(fù)直至函數(shù)值穩(wěn)定,菌群優(yōu)化算法結(jié)束。菌群優(yōu)化算法流程如圖4所示。
圖6 菌群優(yōu)化算法流程圖
通過上述過程完成了隱蔽網(wǎng)絡(luò)信息安全指數(shù)屬性集合的約簡,得到約簡屬性集合為V′F={x1,…xn},簡化了安全指數(shù)多維屬性分類的過程,為下述隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類提供數(shù)據(jù)支撐。
由于隱蔽網(wǎng)絡(luò)信息安全指數(shù)數(shù)據(jù)具有多維屬性的特征,計算復(fù)雜程度較高,無法直接對其進(jìn)行分類處理,因此需要對其多維屬性分類,降低數(shù)據(jù)的維度,為安全指數(shù)的分類提供方便。以上述得到的約簡屬性集合及多維貝葉斯分類模型為依據(jù),對隱蔽網(wǎng)絡(luò)信息安全指數(shù)進(jìn)行多維屬性分類[10]。具體的過程如下所示。
1)對給定的類變量Ci(i=1,2,…,m)創(chuàng)建一個對應(yīng)的貝葉斯分類器S,以菌群優(yōu)化算法得到約簡屬性集合為V′F。
2)在約簡屬性集合V′F中隨機(jī)抽取m個數(shù)據(jù),將其轉(zhuǎn)化為多維二進(jìn)制向量,采用0或1對其屬性選擇狀態(tài)進(jìn)行顯示,其中0表示屬性未被選擇,1表示屬性被選擇[11-12]。同時,必須保證抽取的數(shù)據(jù)不能重復(fù),對數(shù)據(jù)的目標(biāo)函數(shù)值進(jìn)行相應(yīng)的計算,將最優(yōu)目標(biāo)函數(shù)值對應(yīng)的數(shù)據(jù)進(jìn)行提取,為xV′F;
3)將xV′F賦值到數(shù)據(jù)y上,選擇一個隨機(jī)數(shù)λ,若λ大于0.5,則y對應(yīng)的屬性被選擇;反之則y對應(yīng)的屬性未被選擇,并對y的目標(biāo)函數(shù)值進(jìn)行相應(yīng)的計算。在迭代的過程中,若y的目標(biāo)函數(shù)值超過xbest,則迭代結(jié)束,并對xbest值進(jìn)行更新;
4)對數(shù)據(jù)的總力向量進(jìn)行計算,以數(shù)據(jù)的目標(biāo)函數(shù)值為基礎(chǔ),對其進(jìn)行迭代計算,則數(shù)據(jù)的總量為
(5)
5)根據(jù)式(5)計算出來的結(jié)果為依據(jù),按照分類規(guī)則對隱蔽網(wǎng)絡(luò)信息安全指數(shù)進(jìn)行多屬性分類,分類規(guī)則表示為
(6)
通過上述過程實現(xiàn)了隱蔽網(wǎng)絡(luò)信息安全指數(shù)的多屬性分類,為隱蔽網(wǎng)絡(luò)信息安全提供更加有效的數(shù)據(jù)支撐。
上述完成了隱蔽網(wǎng)絡(luò)信息安全指數(shù)多屬性分類方法的設(shè)計,并實現(xiàn)了安全指數(shù)的多屬性分類,對該方法的可行性進(jìn)行驗證。但是對其是否能夠解決現(xiàn)有方法存在的問題依然無從可知,因此設(shè)計仿真對比實驗對其進(jìn)行驗證。仿真對比實驗主要采用提出的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多屬性分類方法與基于粗糙集理論的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法(現(xiàn)有方法1)、基于支持向量機(jī)的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法(現(xiàn)有方法2)與基于K-最近鄰域的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法(現(xiàn)有方法3)進(jìn)行對比分析,為了方便實驗進(jìn)行,將實驗方法簡稱為提出方法與現(xiàn)有方法1、2和3。
在仿真對比實驗中,主要通過分類準(zhǔn)確率與分類效率對方法的性能進(jìn)行描述。具體的實驗過程如下所示。
分類準(zhǔn)確率直接決定著方法的分類性能,分類準(zhǔn)確率越高,則方法性能也就越好。通過實驗得到分類準(zhǔn)確率對比情況如表2所示。
表2 分類準(zhǔn)確率對比情況表
如表2所示,提出方法的分類準(zhǔn)確率遠(yuǎn)遠(yuǎn)的高于現(xiàn)有三種方法。由于所提方法通過菌群優(yōu)化算法在抽取數(shù)據(jù)過程中有效避免重復(fù)信息的出現(xiàn),并對數(shù)據(jù)的目標(biāo)函數(shù)值進(jìn)行相應(yīng)的計算,最終提取到最優(yōu)目標(biāo)函數(shù)值對應(yīng)的數(shù)據(jù),以提高對隱蔽網(wǎng)絡(luò)信息安全指數(shù)進(jìn)行多維屬性分類的準(zhǔn)確率,其分類準(zhǔn)確率最高可以達(dá)到95%。
通過實驗得到分類效率對比情況如圖7所示。
圖7 分類效率對比情況圖
如圖7所示,提出方法的分類效率遠(yuǎn)遠(yuǎn)的高于現(xiàn)有三種方法,所提方法采用雙分裂有向圖對類變量與屬性變量之間的關(guān)系進(jìn)行連接顯示構(gòu)建多維貝葉斯分類器。完成對安全指數(shù)多維屬性進(jìn)行分類。有效提高分類效率,其分類效率最高可以達(dá)到95%。
通過上述實驗結(jié)果發(fā)現(xiàn),提出的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法極大的提升了分類準(zhǔn)確率與分類效率,充分說明提出的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法具備更好的分類性能。
提出的隱蔽網(wǎng)絡(luò)信息安全指數(shù)多維屬性分類方法極大的提升了分類準(zhǔn)確率與分類效率,可以為隱蔽網(wǎng)絡(luò)信息安全評估提供更為可靠的數(shù)據(jù)支撐。由于實驗對實際情況中干擾因素的忽視,導(dǎo)致實驗結(jié)果具有一定的誤差,因此需要對提出方法進(jìn)行進(jìn)一步的優(yōu)化與探索。