胡俊荷 李芯蕊 馬雙斌
摘 要:網(wǎng)絡(luò)態(tài)勢值是衡量網(wǎng)絡(luò)安全的重要指標(biāo),其值的高低直接影響網(wǎng)絡(luò)安全的優(yōu)劣。能夠有效地建立起網(wǎng)絡(luò)態(tài)勢預(yù)測模型,其意義對于預(yù)防網(wǎng)絡(luò)安全事件的發(fā)生以及網(wǎng)絡(luò)安全防護(hù)來講非同尋常。通過對網(wǎng)絡(luò)態(tài)勢的理解和分析,可知影響網(wǎng)絡(luò)態(tài)勢的因素很多且關(guān)系比較復(fù)雜,難以建立較為準(zhǔn)確的數(shù)學(xué)表達(dá)式來描述網(wǎng)絡(luò)態(tài)勢。因此,文章采用改進(jìn)的粒子群算法優(yōu)化支持向量回歸機(jī)模型的參數(shù),構(gòu)建起網(wǎng)絡(luò)態(tài)勢與影響因素兩者中的非線性映射關(guān)系,提出一種多種群的混沌粒子優(yōu)化算法,建立MSCPO-SVR網(wǎng)絡(luò)態(tài)勢預(yù)測模型,并得出預(yù)測結(jié)果。最后,通過與BP神經(jīng)網(wǎng)絡(luò)和SVR預(yù)測模型進(jìn)行對比,驗(yàn)證MSCPO-SVR預(yù)測模型的預(yù)測值與真實(shí)值的擬合性比較強(qiáng)。
關(guān)鍵詞:計劃行為理論;涉密人員;保密行為;保密行為意向
中圖分類號:TP 309;TP 393 文獻(xiàn)標(biāo)識碼:A
Abstract: The Network trend value is an important index of network security, and it affects the merits of Network security directly. Its significant to effectively establish the Network Security Situation Prediction Model (NSSP) for the precaution of network intrusion and protection of the network. Through the comprehension and analysis of network security situation, we know there are many factors that can affect the security situation of network and the relationship between them are very complex. Therefore its difficult for us to describe the net security situation in a specific mathematical formula. Under these circumstances, in this essay, an improved particle swarm optimization is used to optimize the parameters of the Support Vector Regression Model, and constructs a non-linear mapping relation between the network situation and the influencing factors. We also proposes a multi-population chaotic particle optimization algorithm, establishes the MSCPO-SVR network trend prediction model and obtains the predicted result. Finally, by comparing the MSCPO-SVR prediction model with BP neural network and SVR prediction model, we prove that the prediction value of MSCPO-SVR prediction model is more fitted with the real value.
Key words: situation prediction; particle swarm optimization algorithm; support vector regression; prediction model
1 引言
“互聯(lián)網(wǎng)+”的提出,使很多行業(yè)與互聯(lián)網(wǎng)進(jìn)行融合,網(wǎng)絡(luò)成為了人們?nèi)粘I钪忻懿豢煞值囊徊糠?。隨著其規(guī)模日益壯大,網(wǎng)絡(luò)已經(jīng)普遍應(yīng)用于各個領(lǐng)域?,F(xiàn)在攻擊者不僅對各種網(wǎng)絡(luò)數(shù)據(jù)的竊取,而且也開始對一些關(guān)鍵性基礎(chǔ)設(shè)施、政府、金融機(jī)構(gòu)和能源行業(yè)等進(jìn)行攻擊,給社會和國家?guī)砹艘欢ǖ挠绊憽?/p>
張偉麗[1]分析了我國等級保護(hù)存在的問題,并提出了進(jìn)一步做好信息安全等級保護(hù)工作的建議;李連等[2]分析了云計算的基本特征及面臨的安全問題,總結(jié)了目前國際上關(guān)于云計算安全問題的研究現(xiàn)狀,討論了云計算安全技術(shù)框架和關(guān)鍵技術(shù);施超[3]從計算機(jī)網(wǎng)絡(luò)信息管理內(nèi)容的分類、計算機(jī)網(wǎng)絡(luò)信息管理工作中的安全問題分析以及計算機(jī)網(wǎng)絡(luò)信息安全防護(hù)策略分析這三個方面入手,對網(wǎng)絡(luò)信息管理進(jìn)行了較為詳細(xì)的分析與闡述,并據(jù)此論證了做好這一工作在進(jìn)一步提升計算機(jī)網(wǎng)絡(luò)信息管理質(zhì)量與管理效率的過程中所起到的至關(guān)重要的作用與意義;楊家興[4]對新時期的計算網(wǎng)絡(luò)通信的現(xiàn)狀和問題進(jìn)行分析,從而提出發(fā)展的策略并研究計算機(jī)網(wǎng)絡(luò)通信的發(fā)展趨勢。
但是,以往傳統(tǒng)的網(wǎng)絡(luò)安全保護(hù)技術(shù)最多只可以描述過去和當(dāng)前的網(wǎng)絡(luò)安全態(tài)勢,都無法預(yù)測出未來的網(wǎng)絡(luò)安全態(tài)勢[5]。而本文提出的網(wǎng)絡(luò)態(tài)勢預(yù)測模型能通過模型本身的算法將影響因素與網(wǎng)絡(luò)態(tài)勢建立復(fù)雜的聯(lián)系,還可以對未來的網(wǎng)絡(luò)安全態(tài)勢進(jìn)行預(yù)測分析,使網(wǎng)絡(luò)安全的管理從被動變?yōu)橹鲃樱A(yù)防網(wǎng)絡(luò)安全事件的發(fā)生,降低網(wǎng)絡(luò)安全隱患給人們帶來不必要的損失。
本文對國家互聯(lián)網(wǎng)應(yīng)急中心每周在網(wǎng)站上公布的態(tài)勢報告進(jìn)行分析,并對2013年第4期至2016年第37期的態(tài)勢報告進(jìn)行統(tǒng)計,確定了樣本數(shù)據(jù)集[6]。
通過研究支持向量回歸機(jī),將多種群混沌粒子優(yōu)化算法(MSCPO)優(yōu)化支持向量機(jī)回歸機(jī)模型的參數(shù),通過對樣本數(shù)據(jù)集進(jìn)行訓(xùn)練,建立MSCPO-SVR網(wǎng)絡(luò)態(tài)勢預(yù)測模型,并得出預(yù)測結(jié)果。
2 粒子群優(yōu)化算法及其改進(jìn)算法
設(shè)在一個維數(shù)為D的搜索空間中,有一個種群x=(x1,x2,…,xn)由n個粒子組成,其中D維空間中第i個粒子的位置用一個D維的向量xi=[xi1,xi2,…xiD]T表示出來,同時這也表示為問題的一個潛在解。其中第i個粒子的速度為Vi=[Vi1,Vi2,…ViD]T,其粒子個體的極值為Pi=[Pi1,Pi2,…PiD]T,種群的全局極值為Pg=[Pg1,Pg2,…PgD]T。
粒子每進(jìn)行一次尋優(yōu),都需要判斷個體極值和全局極值來更新自身的位置和速度,公式如下:
式中:k為當(dāng)前迭代次數(shù);ω為慣性權(quán)重;d=1,2…,D;i=1,2…,n;Vid為粒子速度[7,8];
非負(fù)常數(shù)C1、C2稱為加速度因子,取值一般根據(jù)實(shí)際情況確定;r1和r2為區(qū)間[0,1]之間的隨機(jī)數(shù)。
在算法運(yùn)行的過程中,可能會出現(xiàn)某個粒子發(fā)現(xiàn)了疑似最優(yōu)的位置,而使得其他粒子迅速向其靠攏,使得算法陷入局部最優(yōu),早熟收斂的困境,從而導(dǎo)致算法無法在搜索空間中重新繼續(xù)搜索[9]。因此本文提出一種多種群混沌粒子優(yōu)化算法(Multi-Swarm Chaotic Particle Optimization,MSCPO)。該算法是利用混沌原理的隨機(jī)性,在初始階段對種群粒子進(jìn)行初始化,并將粒子分成三個種群,不同種群采用不同的更新策略,通過三個種群之間協(xié)同配合和實(shí)時信息共享,加快算法的收斂速度。通過種群適應(yīng)度方差這個指標(biāo)來判斷粒子是否陷入局部收斂,如果陷入則對其進(jìn)行混沌處理,幫助其逃離局部收斂點(diǎn),從而提高算法的優(yōu)化性能。
MSCPO算法的具體步驟如下所示:
Step1.利用混沌原理的隨機(jī)性對種群進(jìn)行初始化。搜尋空間為[ld,ud],
通過適應(yīng)度函數(shù)算出所有粒子的適應(yīng)度的值(Fitness Value),對其值進(jìn)行排序,取種群較優(yōu)的2/5粒子作為第一種群,慣性權(quán)重系數(shù)w取最小值0.4;取種群較差的1/5粒子作為第二種群,慣性權(quán)重系數(shù) 取最大值0.9;剩下種群中間2/5粒子為第三種群[10]。
Step2.對第一個和第二個種群采更新粒子的速度和位置;第三個種群采用本節(jié)的自適應(yīng)更新策略進(jìn)行更新。
Step3.通過適應(yīng)度函數(shù)算出所有粒子的適應(yīng)度的值,若其值優(yōu)于粒子所經(jīng)歷過的個體最優(yōu)位置PBesti,則將其值更新為PBesti。若其值優(yōu)于種群的全局最優(yōu)位置GBest,則將其值更新為GBest。
Step4.判斷否滿足結(jié)束條件,若滿足則輸出其值,不滿足則繼續(xù)執(zhí)行。
Step5.通過種群適應(yīng)度方差σ2的值來判斷粒子是否陷入局部收斂,如式(5)所示,若σ2小于設(shè)定的閾值,繼續(xù)執(zhí)行,否則跳轉(zhuǎn)到Step2
從而實(shí)現(xiàn)種群的混沌變異操作。
多種群混沌粒子優(yōu)化算法的流程圖如圖1所示。
3 支持向量機(jī)
支持向量機(jī)(Support Vector Machine,SVM)的主要思想是建立一個分類超平面作為決策曲面,從而使正反例之間的隔離邊緣最大化;支持向量機(jī)的理論基礎(chǔ)是結(jié)構(gòu)風(fēng)險最小化的近似實(shí)現(xiàn)。這個原理基于泛化誤差率,即學(xué)習(xí)機(jī)器在測試數(shù)據(jù)上的誤差率,也就是以訓(xùn)練誤差率和一個依賴于VC(Vapnik-Chervonenkis dimension)的項(xiàng)的和為界,在可分模式情況下,其置前一項(xiàng)的值為零,并且使第二項(xiàng)的值最小化[11]。所以,支持向量機(jī)對于模式分類問題上可以提供良好的泛化性能,這是它特有的屬性。支持向量機(jī)具有幾個優(yōu)點(diǎn)[12]:
通用性:能夠在很廣的各種函數(shù)集中構(gòu)造函數(shù);
魯莽性:不需要微調(diào);
有效性:在解決實(shí)際問題中總是屬于最好的方法之一;
計算簡單:方法的實(shí)現(xiàn)只需要簡單的優(yōu)化技術(shù);
理論上完善:基于VC推廣性理論的框架。
支持向量機(jī)的體系結(jié)構(gòu)如圖所示。
其中K為核函數(shù),其種類主要有:
4 建立MSCPO-SVR預(yù)測模型
根據(jù)支持向量機(jī)的理論,確定偏離參數(shù) 、懲罰參數(shù)C和核函數(shù)參數(shù) 三個參數(shù)才能確定SVR的網(wǎng)絡(luò)態(tài)勢預(yù)測模型。設(shè)置合理的參數(shù)對支持向量回歸模型的泛化能力的優(yōu)劣具有重要作用,通過判斷模型算法誤差率的大小,可以判斷模型參數(shù)的取值是否最優(yōu)。
本節(jié)采用國家互聯(lián)網(wǎng)應(yīng)急中心網(wǎng)站上公布態(tài)勢報告,對2013年第4期至2016年第37期每期的態(tài)勢報告進(jìn)行統(tǒng)計,共統(tǒng)計190條樣本數(shù)據(jù),其數(shù)據(jù)包括感染網(wǎng)絡(luò)病毒主機(jī)數(shù)量、被篡改的網(wǎng)站數(shù)量、被植入后門的網(wǎng)站總數(shù)、網(wǎng)站的仿冒頁面數(shù)量和新增信息安全漏洞數(shù)量五個安全事件指標(biāo)[13]?;緫B(tài)勢分為:優(yōu)、良、中、差、危。為了便于實(shí)驗(yàn)的進(jìn)行,需將其轉(zhuǎn)化為具體數(shù)字來看待,如表1所示。
將感染網(wǎng)絡(luò)病毒的主機(jī)數(shù)量(x1)、被篡改的網(wǎng)站數(shù)量(x2)、被植入后門的網(wǎng)站總數(shù)(x3)、網(wǎng)站的仿冒頁面數(shù)量(x4)和新增信息安全漏洞數(shù)量(x5)作為網(wǎng)絡(luò)態(tài)勢值的自變量,將網(wǎng)絡(luò)態(tài)勢值作為因變量。為了減小樣本數(shù)據(jù)不同量綱對結(jié)果引起不必要的誤差,需對樣本數(shù)據(jù)進(jìn)歸一化處理。利用MSCPO算法來優(yōu)化支持向量機(jī)的模型參數(shù),對本文采用的樣本數(shù)據(jù)集對模型進(jìn)行測試,選擇較優(yōu)的偏離參數(shù)ε、懲罰參數(shù)C和核函數(shù)參數(shù)σ三個參數(shù),建立MSCPO-SVR預(yù)測模型。
MSCPO算法的適應(yīng)度函數(shù)為支持向量回歸模型的均方差,如式(5)所示。
MSCPO-SVR預(yù)測模型的建立流程圖如圖3所示。
5 模型預(yù)測結(jié)果
取樣本數(shù)據(jù)的前180條數(shù)據(jù)作為訓(xùn)練集,后10條數(shù)據(jù)作為測試集。使用軟件MATLAB 2014b對上述模型進(jìn)行驗(yàn)證。MSCPO-SVR預(yù)測模型的結(jié)果如表2所示。
其預(yù)測值與真實(shí)值的進(jìn)行對比,如圖4所示。
由表2和圖4可知,對本文提出的MSCPO-SVR預(yù)測模型得出預(yù)測結(jié)果的絕對誤差均比較小,且預(yù)測值與真實(shí)值較為接近,擬合性較好。
為了驗(yàn)證本文提出的MSCPO-SVR預(yù)測模型的預(yù)測性能,將其與BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型和SVR預(yù)測模型的預(yù)測結(jié)果進(jìn)行對比。其結(jié)果如表3所示。
使用平均絕對誤差MAE、平均相對誤差MAPE和平均平方根誤差RMSE這三個評價指標(biāo)來對比MSCPO-SVR預(yù)測模型、BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型和SVR預(yù)測模型。三個預(yù)測模型預(yù)測結(jié)果的評價指標(biāo)值如表3所示。
6 結(jié)束語
本文采用MSCPO-SVR預(yù)測模型對網(wǎng)絡(luò)態(tài)勢進(jìn)行預(yù)測,得出的預(yù)測值與真實(shí)值的誤差比較小,具有較強(qiáng)的擬合性,通過與BP神經(jīng)網(wǎng)絡(luò)和SVR預(yù)測模型進(jìn)行對比,該模型預(yù)測值的評價指標(biāo)均比其它兩個預(yù)測模型低,可知該模型的預(yù)測效果比較好,且預(yù)測值與真實(shí)值的擬合性較高。
由實(shí)驗(yàn)表明,MSCPO-SVR預(yù)測模型可以較好地預(yù)測網(wǎng)絡(luò)態(tài)勢,取得了較好的效果,增強(qiáng)網(wǎng)絡(luò)安全防御的主動性,降低網(wǎng)絡(luò)攻擊給人們帶來的損失,具有良好的實(shí)用性。
參考文獻(xiàn)
[1] 張偉麗.信息安全等級保護(hù)現(xiàn)狀淺析[J].網(wǎng)絡(luò)空間安全, 2014(9):9-13.
[2] 李連,朱愛紅.云計算安全技術(shù)研究綜述[J].網(wǎng)絡(luò)空間安全, 2013, 4(5):42-45.
[3] 施超.計算機(jī)網(wǎng)絡(luò)信息管理及其安全防護(hù)策略[J].網(wǎng)絡(luò)空間安全, 2012, 3(3):8-10.
[4] 楊家興.新時期計算機(jī)網(wǎng)絡(luò)通信現(xiàn)狀及發(fā)展趨勢研究[J].網(wǎng)絡(luò)空間安全, 2013, 4(3):6-7.
[5] 謝麗霞,王亞超,于巾博.基于神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)安全態(tài)勢感知[J].清華大學(xué)學(xué)報(自然科學(xué)版), 2013(12):1750-1760.
[6] 中國互聯(lián)網(wǎng)信息中心(CNNIC/CC).第39次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》,http://www.cnnic.net.cn.
[7] 高昆侖,劉建明,徐茹枝,等.基于支持向量機(jī)和粒子群算法的信息網(wǎng)絡(luò)安全態(tài)勢復(fù)合預(yù)測模型[J].電網(wǎng)技術(shù), 2011(4):176-182.
[8] 陳善學(xué),楊政,朱江,等.一種基于累加PSO-SVM的網(wǎng)絡(luò)安全態(tài)勢預(yù)測模型[J].計算機(jī)應(yīng)用研究, 2015, 32(6):1778-1781.
[9] Mohandes M A. Modeling global solar radiation using Particle Swarm Optimization (PSO)[J]. Solar Energy, 2012, 86(11):3137-3145.
[10] Xue L, Cai J, Li J, et al. Application of Particle Swarm Optimization (PSO) Algorithm to Determine Dichlorvos Residue on the Surface of Navel Orange with Vis-NIR Spectroscopy[J]. Procedia Engineering, 2012, 29(4):4124-4128.
[11] 王霞,王占岐,金貴,等.基于核函數(shù)支持向量回歸機(jī)的耕地面積預(yù)測[J].農(nóng)業(yè)工程學(xué)報, 2014, 30(4):204-211.
[12] Sch C, Laptev I, Caputo B. Recognizing Human Actions: A Local SVM Approach[C]// International Conference on Pattern Recognition. IEEE, 2004:32-36 Vol.3.
[13] CNCERT.網(wǎng)絡(luò)安全基本態(tài)勢月報[J].2014(14):68。
作者簡介:
胡俊荷(1983-),女,漢族,甘肅蘭州人,甘肅省廣播電視學(xué)校,大專;主要研究方向和關(guān)注領(lǐng)域:計算機(jī)網(wǎng)絡(luò)。
李芯蕊(1982-),女,漢族,甘肅蘭州人,蘭州大學(xué),本科;主要研究方向和關(guān)注領(lǐng)域:信息安全。
馬雙斌(1990-),女,漢族,甘肅平?jīng)鋈?,蘭州城市學(xué)院,本科;主要研究方向和關(guān)注領(lǐng)域:信息安全。