米洪+楊習(xí)貝
摘 要: 為了提高網(wǎng)絡(luò)運動可靠性和安全性,針對傳統(tǒng)的防火墻檢測方法對網(wǎng)絡(luò)異常數(shù)據(jù)檢測準(zhǔn)確性不高的問題,提出一種基于入侵特征選擇的網(wǎng)絡(luò)異常數(shù)據(jù)檢測模型。對網(wǎng)絡(luò)傳輸信道中的數(shù)據(jù)采用關(guān)聯(lián)維求解方法進(jìn)行特征挖掘提取,并對提取的關(guān)聯(lián)維信息特征進(jìn)行優(yōu)選實現(xiàn)入侵信息識別和分類,結(jié)合模糊C均值聚類算法實現(xiàn)對網(wǎng)絡(luò)異常數(shù)據(jù)的有效挖掘和檢測。仿真結(jié)果表明,該檢測模型能提高對網(wǎng)絡(luò)異常數(shù)據(jù)和入侵信息的有效識別和檢測能力。
關(guān)鍵詞: 異構(gòu)集成網(wǎng)絡(luò); 異常數(shù)據(jù); 數(shù)據(jù)檢測; 數(shù)據(jù)挖掘
中圖分類號: TN911.23?34; TP393 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)12?0069?03
Abstract: Since the detection accuracy of the traditional firewall detection method for network abnormal data is not high, a novel network intrusion data detection model based on feature selection is proposed in this paper to improve the network reliability and security. The correlation dimension solution method is adopted to realize feature mining and extraction of information data in network channel. The extracted correlation dimension information features are optimized to achieve intrusion information identification and classification, and finally implement effective mining and detection of abnormal network data in combination with fuzzy C means clustering algorithm. The simulation results show that the proposed detection model can improve the effective identification and detection abilities to deal with network abnormal data and intrusion information.
Keywords: heterogeneous integrated network; abnormal data; data detection; data mining
大規(guī)模異構(gòu)集成網(wǎng)絡(luò)通過集成無線網(wǎng)絡(luò)、光纖網(wǎng)絡(luò)和移動通信網(wǎng)絡(luò)實現(xiàn)超寬帶、大容量的數(shù)據(jù)信息傳輸。在大規(guī)模異構(gòu)集成網(wǎng)絡(luò)中由于路由鏈路的開放性,容易導(dǎo)致節(jié)點斷開入侵鏈接,產(chǎn)生異常數(shù)據(jù),對網(wǎng)絡(luò)中異常數(shù)據(jù)的檢測是保障網(wǎng)絡(luò)可靠穩(wěn)定運行的關(guān)鍵[1]。對大規(guī)模異構(gòu)集成網(wǎng)絡(luò)的異常數(shù)據(jù)檢測算法的研究主要采用統(tǒng)計信息分析方法[2]、防火墻檢測方法[3]、模糊推理檢測方法和異常信息特征重排方法等[4?5]。采用相應(yīng)的特征提取算法進(jìn)行網(wǎng)絡(luò)異常數(shù)據(jù)信息的特征提取和信息分類,實現(xiàn)對大規(guī)模異構(gòu)集成網(wǎng)絡(luò)中信號模擬和狀態(tài)重組,實現(xiàn)網(wǎng)絡(luò)異常數(shù)據(jù)檢測,但是傳統(tǒng)方法在異常數(shù)據(jù)檢測中容易受到干擾因素的影響,導(dǎo)致檢測性能不好。對此,本文進(jìn)行網(wǎng)絡(luò)異常數(shù)據(jù)檢測模型的改進(jìn)設(shè)計,得出可行性結(jié)論。
1 網(wǎng)絡(luò)異常數(shù)據(jù)檢測模型改進(jìn)實現(xiàn)
1.1 基于模糊C均值聚類的入侵特征選擇
在上述進(jìn)行了網(wǎng)絡(luò)異常數(shù)據(jù)的信息建模和特征提取的基礎(chǔ)上,對提取的關(guān)聯(lián)維特征進(jìn)行模糊C均值聚類[6],實現(xiàn)對入侵特征的優(yōu)選和控制,進(jìn)行網(wǎng)絡(luò)異常數(shù)據(jù)檢測。實現(xiàn)本文提出的基于入侵特征選擇的網(wǎng)絡(luò)異常數(shù)據(jù)檢測模型的設(shè)計。網(wǎng)絡(luò)異常數(shù)據(jù)入侵特征模糊C均值聚類的過程描述為:
(1) 首先選擇一個C值,確定網(wǎng)絡(luò)異常數(shù)據(jù)分類簇的總數(shù)。若網(wǎng)絡(luò)入侵關(guān)聯(lián)維特征集規(guī)模為m,令作為聚類中心,其中,并計算入侵關(guān)聯(lián)維特征集聚類簇的根節(jié)點與簇心的距離。
(2) 在關(guān)聯(lián)維特征集中選擇C個實例,初始化采樣頻率中心為,,。
(3) 使用簡單的歐拉距離將網(wǎng)絡(luò)入侵特征信息采樣簇分配到最近的簇中心,如滿足:
那么。執(zhí)行交叉變異,得到的一組標(biāo)量采樣序列為異常數(shù)據(jù)時間序列。
(4) 使用每個簇的實例來計算網(wǎng)絡(luò)入侵特征信息時間序列的分布時滯:
(5) 如果網(wǎng)絡(luò)入侵特征信息時間序列的分布時滯等于上次迭代的平均值,當(dāng)滿足時,則中止程序,否則返回第(3)步,令,并且計算新的模糊C均值聚類中心。
通過上述模糊C均值聚類,實現(xiàn)入侵特征選擇。
模糊C均值聚類一般處理偽碼如下:
double Distance(feature extractio&, intrusion informatio&);
//確定初始聚類中心點
struct point{double x;double y;}; //簇對象
integrated network{
private:
point fuzzy C means //簇的值
pointnovel data networ; //簇的平均值
list
public:
cluster(const point& Point){
//構(gòu)造入侵特征信息的時間窗口函數(shù)
tag.x = Point.x;
tag.y = gtrhbbt.y;}
point GetAverage(); //計算簇的平均值
point integrated network Value(); //獲得簇的值
void Clearfeaturesampling(); //清空元素
void SetTagValue(const point&); //設(shè)置設(shè)計檢測器
void AddEfrgrgent(pgrgt);
//添加一個異常數(shù)據(jù)的搜索元素
};
void K Average(pofrgtgt[],list
在終止條件約束下進(jìn)行模糊C均值聚類的簇間分類,使得局部誤差平方和最小,從而實現(xiàn)對網(wǎng)絡(luò)異常數(shù)據(jù)的入侵特征優(yōu)選。
1.2 網(wǎng)絡(luò)異常數(shù)據(jù)檢測的模型設(shè)計
通過上述對網(wǎng)絡(luò)入侵關(guān)聯(lián)維特征提取和分類,把有限數(shù)據(jù)集合分為C類,根據(jù)分類結(jié)果進(jìn)行網(wǎng)絡(luò)異常數(shù)據(jù)檢測,大規(guī)模異構(gòu)集成網(wǎng)絡(luò)節(jié)點數(shù)據(jù)傳輸?shù)陌j(luò)模型為:
2 實驗測試分析
本實驗仿真計算機使用Intel i5?3230M 2.6 GHz 雙核CPU,4 GB DDR3 RAM作為硬件配置,算法編輯軟件為VC++結(jié)合Matlab 7,對大規(guī)模異構(gòu)集成網(wǎng)絡(luò)中的CUP2015實驗數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行異常數(shù)據(jù)檢測仿真分析,數(shù)據(jù)庫中分布有4組數(shù)據(jù)集,分別記為D1,D2,D3,D4,數(shù)據(jù)量分布為1 TB,2 TB,3 TB,4 TB,特征點檢測權(quán)重系數(shù)ω設(shè)定為0.67,測試樣本的訓(xùn)練集長度為100,數(shù)據(jù)在網(wǎng)絡(luò)傳輸信道中的分布譜圖如圖1所示。
由圖1的數(shù)據(jù)分布譜圖可見,原始的數(shù)據(jù)受到網(wǎng)絡(luò)傳輸介質(zhì)和網(wǎng)絡(luò)空間中的干擾因素較多,導(dǎo)致數(shù)據(jù)分布的狀態(tài)具有無序性,需要進(jìn)行特征提取和聚類處理。采用關(guān)聯(lián)維求解方法進(jìn)行特征挖掘提取,結(jié)合模糊C均值聚類方法進(jìn)行數(shù)據(jù)聚類,得到網(wǎng)絡(luò)異常數(shù)據(jù)聚類處理后的譜分析結(jié)果如圖2所示。
從圖2得知,通過C均值聚類處理和入侵特征選擇,提高了異常數(shù)據(jù)的特征分類性能。表1給出了采用本文方法進(jìn)行異常數(shù)據(jù)的檢測測試結(jié)果,采用500次實驗計算準(zhǔn)確檢測的均值,得到本文方法和傳統(tǒng)方法的對比結(jié)果如圖3所示,從表1的結(jié)果得知,本文方法對4組數(shù)據(jù)集的準(zhǔn)確檢測率較高,誤檢率角度、檢測時間開銷較小,從圖3的結(jié)果對比得知,本文方法的平均準(zhǔn)確檢測精度高于傳統(tǒng)方法,證明了本文方法的優(yōu)越性。
表1 改進(jìn)算法的測試結(jié)果
3 結(jié) 語
本文提出一種基于入侵特征選擇的網(wǎng)絡(luò)異常數(shù)據(jù)檢測模型。對網(wǎng)絡(luò)傳輸信道中的數(shù)據(jù)采用關(guān)聯(lián)維求解方法進(jìn)行特征挖掘提取,對提取的關(guān)聯(lián)維信息特征進(jìn)行優(yōu)選實現(xiàn)入侵信息識別和分類,結(jié)合模糊C均值聚類算法實現(xiàn)對網(wǎng)絡(luò)異常數(shù)據(jù)的有效挖掘和檢測。實驗測試結(jié)果表明,該檢測模型能提高對網(wǎng)絡(luò)異常數(shù)據(jù)和入侵信息的有效識別和檢測能力,精度較高、性能較好。
參考文獻(xiàn)
[1] REN Tianpeng, YUEN Chau, GUAN Yongliang. High?order intensity modulations for OSTBC in free?space optical MIMO communications [J]. Wireless communications letters, IEEE, 2013, 2(6): 607?610.
[2] ZHANG Q, ZHU Q Y, ZHANI M F, et al. Dynamic service placement in geographically distributed clouds [J]. IEEE journal on selected areas in communications, 2013, 31(12): 762?772.
[3] 吳鴻華,穆勇,屈忠鋒,等.基于面板數(shù)據(jù)的接近性和相似性關(guān)聯(lián)度模型[J].控制與決策,2016,31(3):555?558.
[4] 余曉東,雷英杰,岳韶華,等.基于粒子群優(yōu)化的直覺模糊核聚類算法研究[J].通信學(xué)報,2015(5):74?80.
[5] 孫超,楊春曦,范莎,等.能量高效的無線傳感器網(wǎng)絡(luò)分布式分簇一致性濾波算法[J].信息與控制,2015,44(3):379?384.
[6] 何信旺,芮赟,王宗杰,等.濾波器組UMTS系統(tǒng)的信道估計研究[J].計算機技術(shù)與發(fā)展,2015(9):57?60.
[7] 周立軍,張杰,呂海燕.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)入侵檢測技術(shù)研究[J].現(xiàn)代電子技術(shù),2016,39(6):10?13.