王夢(mèng)曉,劉學(xué)軍,操鳳萍
(1. 東南大學(xué)成賢學(xué)院,江蘇 南京 210088;2. 南京航空航天大學(xué)計(jì)算機(jī)學(xué)院,江蘇 南京 211106)
信息全面化具有巨大網(wǎng)絡(luò)通信便利的同時(shí),也存在信息販賣、數(shù)據(jù)丟失、隱私泄露等弊端,在通信網(wǎng)絡(luò)的建設(shè)中,提高信息傳輸?shù)目煽啃院桶踩允茄芯款I(lǐng)域的研究重點(diǎn),因此通信的安全問題成為目前亟需解決的熱點(diǎn)問題[1,2]。
針對(duì)通信網(wǎng)絡(luò)涉密信息的安全問題,魏墨濟(jì)[3]等人抽取先驗(yàn)知識(shí)作為模型頂層,并通過擴(kuò)展頂層本體構(gòu)建模型構(gòu)架,然后定向采集通信網(wǎng)絡(luò)涉密信息的社會(huì)立場(chǎng)庫(kù)集合,并根據(jù)應(yīng)用實(shí)例推算出相關(guān)主題的社會(huì)立場(chǎng),最后將社會(huì)立場(chǎng)輸入到模型中得到預(yù)警相悖度,完成通信網(wǎng)絡(luò)涉密信息安全預(yù)警。該方法沒有利用樣本估計(jì)理論確定異常狀態(tài)下的網(wǎng)絡(luò)涉密信息,導(dǎo)致預(yù)警的準(zhǔn)確率較低。焦萍萍[4]等人利用大數(shù)據(jù)采集技術(shù)中的采集函數(shù)獲取通信網(wǎng)絡(luò)的涉密信息數(shù)據(jù),然后構(gòu)建網(wǎng)絡(luò)安全預(yù)警神經(jīng)網(wǎng)絡(luò)模型,最后將涉密信息輸入到模型中學(xué)習(xí)訓(xùn)練,完成通信網(wǎng)絡(luò)信息安全的預(yù)警。該方法沒有利用樣本估計(jì)理論找出異常狀態(tài)下的網(wǎng)絡(luò)涉密信息,導(dǎo)致預(yù)警結(jié)果的準(zhǔn)確率較低,并且預(yù)警誤報(bào)率較高。黃志勝[5]等人利用層次分析法計(jì)算出通信網(wǎng)絡(luò)涉密信息的各級(jí)權(quán)重指標(biāo),然后使用隸屬度函數(shù)算法對(duì)各級(jí)權(quán)重指標(biāo)做歸一化處理,并建立基于層次分析與區(qū)間預(yù)測(cè)的風(fēng)險(xiǎn)度評(píng)估等級(jí)標(biāo)準(zhǔn),最后在此基礎(chǔ)上構(gòu)建反向傳播的神經(jīng)網(wǎng)絡(luò)模型,通過多目標(biāo)加權(quán)函數(shù)計(jì)算出動(dòng)態(tài)預(yù)警范圍,完成大規(guī)模通信網(wǎng)絡(luò)涉密信息安全的動(dòng)態(tài)預(yù)警。該方法沒有對(duì)網(wǎng)絡(luò)涉密信息作出聚類處理,導(dǎo)致預(yù)警耗費(fèi)的時(shí)間長(zhǎng)、效率低。
通信網(wǎng)絡(luò)具有自身安全性的缺陷以及脆弱性、易受攻擊性等,因此,通信雙方用戶的信息安全性逐漸成為通信網(wǎng)絡(luò)可靠性控制的關(guān)鍵問題。為了進(jìn)一步解決該問題,提出大規(guī)模通信網(wǎng)絡(luò)涉密信息安全動(dòng)態(tài)預(yù)警方法。
為了得到大規(guī)模通信網(wǎng)絡(luò)中涉密信息的特征流量,采用模糊聚類算法對(duì)網(wǎng)絡(luò)涉密信息做聚類處理[6],具體步驟如下:
1)模糊聚類算法通過計(jì)算網(wǎng)絡(luò)涉密信息流量的最小代價(jià)函數(shù)來確定信息流量之間的相似關(guān)系,進(jìn)而將具有相似特征的數(shù)據(jù)匯集到一起。公式如下所示
(1)
式中,K表示聚類表達(dá)數(shù)量;?代表最小代價(jià)函數(shù);e代表非相似性;M、N分別表示矩陣模型的長(zhǎng)度與寬度;i、j均代表網(wǎng)絡(luò)涉密信息流量;V表示矩陣模型。
2)大規(guī)模通信網(wǎng)絡(luò)涉密信息安全的動(dòng)態(tài)預(yù)警方法,引入拉格朗日函數(shù)[7]對(duì)最小代價(jià)函數(shù)求導(dǎo),進(jìn)而得到聚類表達(dá)合集,公式如下所示
(2)
其中,v表示聚類表達(dá)合集。
3)通過聚類表達(dá)合集對(duì)最小代價(jià)函數(shù)二次求導(dǎo),得到如下公式
(3)
式中,β表示二次偏導(dǎo)數(shù)。
4)大規(guī)模通信網(wǎng)絡(luò)涉密信息安全的動(dòng)態(tài)預(yù)警方法,將式(2)與式(3)結(jié)合,得到矩陣模型與聚類表達(dá)集合的估計(jì)值,即為大規(guī)模通信網(wǎng)絡(luò)涉密信息的流量特征。
基于涉密信息的聚類結(jié)果,通過流量特征的樣本均值與標(biāo)準(zhǔn)差設(shè)定一個(gè)固定閾值,然后將超過閾值的流量視為異常流量,具體步驟如下:
1)初始化大規(guī)模通信網(wǎng)絡(luò)信息[8],假設(shè)任意時(shí)刻采集的網(wǎng)絡(luò)涉密信息數(shù)據(jù)包長(zhǎng)度是固定的,并且在這段時(shí)間內(nèi)采集的網(wǎng)絡(luò)涉密信息的時(shí)間長(zhǎng)度也是固定的,則此刻網(wǎng)絡(luò)涉密信息特征流量的固定閾值可用如下公式表示。
(4)
式中,U描述的是網(wǎng)絡(luò)涉密信息特征流量的固定閾值;Δtl表示第l小時(shí)采集的網(wǎng)絡(luò)涉密信息的時(shí)間長(zhǎng)度;g表示起始時(shí)刻;len(t)代表數(shù)據(jù)包長(zhǎng)度;t代表著任意時(shí)刻。
(5)
3)根據(jù)式(5)得到的樣本均值,可以計(jì)算出第l小時(shí)網(wǎng)絡(luò)涉密信息特征流量的樣本標(biāo)準(zhǔn)差Rl,公式如下所示
(6)
4)大規(guī)模通信網(wǎng)絡(luò)涉密信息安全的動(dòng)態(tài)預(yù)警方法,根據(jù)樣本估計(jì)理論[9],采用涉密信息特征流量的樣本均值與標(biāo)準(zhǔn)差代替網(wǎng)絡(luò)整體的樣本均值和標(biāo)準(zhǔn)差。引入樣本均值與標(biāo)準(zhǔn)差的距離相關(guān)參數(shù)[10],則大規(guī)模通信網(wǎng)絡(luò)涉密信息特征流量測(cè)量值maxUl可用如下公式表示。當(dāng)流量測(cè)量值小于等于固定閾值時(shí),表明此時(shí)的流量正常;當(dāng)流量測(cè)量值大于固定閾值時(shí),表明此時(shí)的流量處于異常狀態(tài)。
(7)
其中,c為特征流量樣本均值與標(biāo)準(zhǔn)差的距離相關(guān)參數(shù)。
圖1 樣本估計(jì)流程圖
構(gòu)建基于決策者互相評(píng)價(jià)的主觀-客觀綜合賦權(quán)模型確定決策者的權(quán)重,然后采用妥協(xié)率算法對(duì)處于異常狀態(tài)的網(wǎng)絡(luò)涉密信息實(shí)行風(fēng)險(xiǎn)排序,完成動(dòng)態(tài)預(yù)警,具體步驟如下:
1)針對(duì)大規(guī)模通信網(wǎng)絡(luò)的多決策多屬性問題[11],首先構(gòu)造關(guān)于網(wǎng)絡(luò)涉密信息屬性的決策矩陣,公式如下所示
(8)
其中,m表示涉密信息屬性的決策矩陣;a表示方案集合;b表示屬性的個(gè)數(shù);h表示決策者數(shù)量;i、j均表示網(wǎng)絡(luò)涉密信息流量;ν代表屬性集合。
2)為了消除網(wǎng)絡(luò)信息分散化帶來的量綱影響,采用極差變換法將決策矩陣規(guī)范法處理[12],規(guī)范化公式如下所示
(9)
式中,N代表規(guī)范化后的矩陣。
3)確定網(wǎng)絡(luò)涉密信息的屬性權(quán)重[13-14],然后根據(jù)屬性權(quán)重推算出屬性加權(quán)規(guī)范矩陣為
(10)
其中,T代表屬性加權(quán)規(guī)范矩陣;θ為理想權(quán)重。
4)根據(jù)式(10)得到的屬性加權(quán)規(guī)范矩陣,引入權(quán)重偏好系數(shù),確定出決策者的主觀綜合權(quán)重與客觀綜合權(quán)重為:
(11)
式中,?表示決策者的客觀權(quán)重;χ代表決策者的主觀權(quán)重;δ代表主觀權(quán)重偏好系數(shù);μ表示客觀權(quán)重偏好系數(shù)。
5)利用加權(quán)平均算子[15]將步驟(4)得到的主觀綜合權(quán)重與客觀綜合權(quán)重相融合,得到主觀-客觀綜合賦權(quán)模型Qij,可用如下公式表示。
(12)
6)在主觀-客觀綜合賦權(quán)模型中尋找出正、負(fù)目標(biāo)點(diǎn)。然后將正、負(fù)目標(biāo)點(diǎn)代入到公式(9)中,得到各個(gè)決策者的所有方案,即為網(wǎng)絡(luò)涉密信息流量的風(fēng)險(xiǎn)要素。將方案按照貼近度大小排序后,獲得大規(guī)模通信網(wǎng)絡(luò)涉密信息的風(fēng)險(xiǎn)評(píng)估結(jié)果,完成大規(guī)模通信網(wǎng)絡(luò)信息安全的動(dòng)態(tài)預(yù)警。
為了驗(yàn)證大規(guī)模通信網(wǎng)絡(luò)涉密信息安全動(dòng)態(tài)預(yù)警方法的整體有效性,需要對(duì)大規(guī)模通信網(wǎng)絡(luò)涉密信息安全動(dòng)態(tài)預(yù)警方法作出如下測(cè)試。將算法消耗的預(yù)警時(shí)間、預(yù)警準(zhǔn)確率和誤報(bào)率作為評(píng)價(jià)指標(biāo),采用大規(guī)模通信網(wǎng)絡(luò)涉密信息安全動(dòng)態(tài)預(yù)警方法、文獻(xiàn)[4]提出的基于大數(shù)據(jù)采集的信息安全預(yù)警方法和文獻(xiàn)[5]提出的基于層次分析法的信息安全預(yù)警方法完成對(duì)比測(cè)試。
通過不同方法檢測(cè)1500組大規(guī)模通信網(wǎng)絡(luò)涉密信息,對(duì)比不同方法消耗的預(yù)警時(shí)間。預(yù)警時(shí)間越長(zhǎng),說明算法的效率越低,相反,預(yù)警時(shí)間越短,說明算法的效率越高,不同方法的測(cè)試結(jié)果用表1表示。
表1 不同算法的預(yù)警時(shí)間
分析表1中的數(shù)據(jù)可知,針對(duì)大規(guī)模通信網(wǎng)絡(luò)涉密信息安全的動(dòng)態(tài)預(yù)警,研究方法的預(yù)警時(shí)間平均為12.47ms,基于大數(shù)據(jù)采集的信息安全預(yù)警方法和基于層次分析法的信息安全預(yù)警方法的預(yù)警平均耗時(shí)分別為36.27ms和45.47ms附近波動(dòng)。通過對(duì)比可以發(fā)現(xiàn),在不同實(shí)驗(yàn)序號(hào)下研究方法的預(yù)警時(shí)間均低于文獻(xiàn)方法的預(yù)警時(shí)間,表明當(dāng)前已有方法的預(yù)警效率遠(yuǎn)低于研究方法的預(yù)警效率。
設(shè)A表示各個(gè)算法的預(yù)警準(zhǔn)確率,其計(jì)算公式如下所示
(13)
式中,p表示網(wǎng)絡(luò)涉密信息樣本集數(shù)量;I代表引入的檢測(cè)函數(shù)。
利用所提方法、基于大數(shù)據(jù)采集的信息安全預(yù)警方法和基于層次分析法的信息安全預(yù)警方法檢測(cè)五組大規(guī)模通信網(wǎng)絡(luò)涉密信息,將不同方法的預(yù)警準(zhǔn)確率結(jié)果繪制成柱形圖,方便分析,如圖2所示。
圖2 不同方法的準(zhǔn)確率測(cè)試結(jié)果
由圖2可知,針對(duì)大規(guī)模通信網(wǎng)絡(luò)涉密信息安全的動(dòng)態(tài)預(yù)警,所提方法的預(yù)警準(zhǔn)確率數(shù)值均高于文獻(xiàn)方法的預(yù)警準(zhǔn)確率數(shù)值。并且在不同實(shí)驗(yàn)序號(hào)下,所提方法的準(zhǔn)確率數(shù)值比較穩(wěn)定,沒有發(fā)生明顯變動(dòng)。而已有傳統(tǒng)方法的準(zhǔn)確率數(shù)值上下波動(dòng)較大。所提方法在對(duì)大規(guī)模通信網(wǎng)絡(luò)涉密信息安全動(dòng)態(tài)預(yù)警過程中,采用樣本估計(jì)理論尋找出異常狀態(tài)下的網(wǎng)絡(luò)涉密信息區(qū)域,然后在這個(gè)范圍中完成預(yù)警過程,進(jìn)而提高了算法的準(zhǔn)確率。
誤報(bào)率是指在大規(guī)模通信網(wǎng)絡(luò)涉密信息安全動(dòng)態(tài)監(jiān)測(cè)結(jié)果中,預(yù)警錯(cuò)誤的信息量占總體信息量的比例。誤報(bào)率越高,說明算法的預(yù)警精度越低;誤報(bào)率越低,說明算法的預(yù)警精度越高,其計(jì)算公式如下所示
(14)
式中,F表示誤報(bào)率;f表示誤報(bào)事項(xiàng)數(shù)量。
將不同方法的誤報(bào)率測(cè)試結(jié)果繪制成柱形圖以完成對(duì)比分析,如圖3所示。
圖3 不同算法的誤報(bào)率測(cè)試結(jié)果
分析圖3可知,研究方法的誤報(bào)率區(qū)間在5%以下;基于大數(shù)據(jù)采集的信息安全預(yù)警方法的誤報(bào)率區(qū)間為50%至70%;基于層次分析法的信息安全預(yù)警方法的誤報(bào)率區(qū)間為40%至70%。
針對(duì)目前大規(guī)模通信網(wǎng)絡(luò)涉密信息安全的動(dòng)態(tài)預(yù)警方法存在預(yù)警時(shí)間過長(zhǎng)、預(yù)警準(zhǔn)確率低、預(yù)警誤報(bào)率高的問題,提出大規(guī)模通信網(wǎng)絡(luò)涉密信息安全動(dòng)態(tài)預(yù)警方法。利用模糊聚類算法對(duì)網(wǎng)絡(luò)涉密信息作出聚類處理,結(jié)合樣本估計(jì)理論尋找出具有異常狀態(tài)的流量特征。最后采取妥協(xié)率法構(gòu)建決策者模型,通過對(duì)異常流量的風(fēng)險(xiǎn)要素排序,完成大規(guī)模通信網(wǎng)絡(luò)涉密信息安全的動(dòng)態(tài)預(yù)警,降低了預(yù)警時(shí)間和誤報(bào)率的同時(shí),在一定程度上也提高了算法的預(yù)警準(zhǔn)確率,為網(wǎng)絡(luò)信息安全預(yù)警技術(shù)奠定了基礎(chǔ)。