胡志英
(安徽文達(dá)信息工程學(xué)院 計算機工程學(xué)院,安徽 合肥 231201)
隨著網(wǎng)絡(luò)信息傳輸技術(shù)的發(fā)展,數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的數(shù)量越來越多,規(guī)模越來越大,需要構(gòu)建數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的優(yōu)化捕獲和特征提取模型,結(jié)合模糊特征檢測和信息重構(gòu)的方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的優(yōu)化捕獲和特征提取,通過層次化的數(shù)據(jù)信息融合聚類,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的信息聚類分析,在層次化結(jié)構(gòu)模型中,實現(xiàn)數(shù)據(jù)鏈路層網(wǎng)絡(luò)包檢測和魯棒性分析,提高數(shù)據(jù)鏈路層網(wǎng)絡(luò)包檢測和自適應(yīng)性[1-2],相關(guān)的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲和特征檢測方法研究在智慧網(wǎng)絡(luò)構(gòu)建中具有重要意義,相關(guān)的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲方法研究受到人們的極大關(guān)注.
傳統(tǒng)方法中,對數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的方法主要有關(guān)聯(lián)規(guī)則挖掘方法、基于空間像素序列重組的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲方法及基于統(tǒng)計特征分析的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲方法等[3].文獻(xiàn)[4]中提出基于遞歸熵特征提取的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲方法,采用模糊相關(guān)性融合聚類方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包調(diào)度,通過自相關(guān)特征匹配,采用層次化演化聚類方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包檢測和捕獲,提高了數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲能力,但該方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的自適應(yīng)性不好,特征辨識度不高.文獻(xiàn)[5]中提出基于關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲方法,采用匹配濾波和模糊度尋優(yōu)檢測額的方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲過程中的干擾抑制,根據(jù)關(guān)聯(lián)規(guī)則特征檢測結(jié)果,實現(xiàn)數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲,提高檢測的精度,但該方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的計算開銷較大,復(fù)雜度較高.
針對上述問題,本文提出基于多空間內(nèi)存共享的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲方法.采用網(wǎng)格分塊特征匹配方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的分塊融合處理,結(jié)合分區(qū)域的統(tǒng)計特征分析方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的大數(shù)據(jù)挖掘和統(tǒng)計信息分析,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的分塊融合和遞歸分析,采用定量遞歸分析方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的多尺度融合處理,實現(xiàn)數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的優(yōu)化捕獲,在多空間內(nèi)存共享環(huán)境下,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲過程的自動化配準(zhǔn)和收斂性控制,提高數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的自適應(yīng)性.最后進(jìn)行仿真實驗分析,展示了本文方法在提高數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲能力方面的優(yōu)越性.
為了實現(xiàn)數(shù)據(jù)鏈路層網(wǎng)絡(luò)包大數(shù)據(jù)挖掘,采用網(wǎng)格分塊特征匹配方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的分塊拆分處理,結(jié)合分區(qū)域的統(tǒng)計特征分析方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的大數(shù)據(jù)挖掘和統(tǒng)計信息分析.采用分層結(jié)構(gòu)挖掘的方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的網(wǎng)絡(luò)分格特征挖掘和信息分析[6],在數(shù)據(jù)鏈路層中,通過自適應(yīng)的結(jié)構(gòu)重組方法[7-9],進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的層次化分割,分割模型為
(1)
(1)式中,Mi表示數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的遞歸熵分布中位數(shù),Lm為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包檢測的最小分辨閾值,fm為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的模糊度檢測分量,fless表示各維度下數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的模糊度因素.在得到層次分割模型后,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的大數(shù)據(jù)特征分析,分析數(shù)據(jù)特征的分布結(jié)構(gòu)式為
(2)
根據(jù)(2)式,運用分區(qū)域的統(tǒng)計特征分析方法,將數(shù)據(jù)鏈路層網(wǎng)絡(luò)包大數(shù)據(jù)通過層次分割所獲取的數(shù)據(jù)信息進(jìn)行特征分析,并結(jié)合決策樹特征分割的方法,得到多空間內(nèi)存共享下的分布集為
Xi={?v(x1),?v(x2),…,?v(xn)}.
(3)
根據(jù)多空間內(nèi)存共享下的分布情況,通過空間區(qū)域化重建,構(gòu)建數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的大數(shù)據(jù)挖掘模型為
(4)
通過上述分析,完成對數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的大數(shù)據(jù)挖掘.
通過對數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的大數(shù)據(jù)挖掘和統(tǒng)計信息分析,提取數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的相似度特征量,形成對數(shù)據(jù)鏈路層網(wǎng)絡(luò)包大數(shù)據(jù)的預(yù)處理.通過演化特征融合分析方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的分塊融合和遞歸分析,在層次化聚類中心,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的聚類過程的收斂性控制,建立數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的關(guān)聯(lián)規(guī)則分布集.采用統(tǒng)計分析方法,建立數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的相似度特征分布矩陣為
(5)
其中,Wij為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包標(biāo)記特征點,構(gòu)建數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的包絡(luò)特征檢測模型,統(tǒng)計數(shù)據(jù)鏈路層網(wǎng)絡(luò)包標(biāo)記點,結(jié)合模糊聚類方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的融合分析,在有限的數(shù)據(jù)鏈路分布集X={x1,x2,…,xn}?Rs中,得到數(shù)據(jù)鏈路層網(wǎng)絡(luò)包標(biāo)記的n個樣本,其中樣本xi通過空間區(qū)域融合,得到數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的多空間融合度分布序列表示為(w1,j,w2,j,…,wtj),其中t表示為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的編號數(shù)目,wtj為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包挖掘的加權(quán)系數(shù),采用語義特征分解和本體結(jié)構(gòu)映射,得到數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的自適應(yīng)加權(quán)系數(shù)為
(6)
其中,maxlFreqi,j為dj之間數(shù)據(jù)鏈路層網(wǎng)絡(luò)包之間的差異性特征量,表示為
(7)
(7)式中,
(8)
其中,di和dj為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的相似度屬性,通過數(shù)據(jù)鏈路層網(wǎng)絡(luò)包標(biāo)記特征點,進(jìn)行數(shù)據(jù)信息融合,構(gòu)建數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的信息融合模型為
(9)
(9)式中eij表示數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的全局變量.根據(jù)上述分析,完成數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的信息融合.
在上述所構(gòu)建的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包大數(shù)據(jù)檢測模型的基礎(chǔ)上,采用定量遞歸分析方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的多尺度融合處理,實現(xiàn)數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的優(yōu)化捕獲,完成數(shù)據(jù)鏈路層網(wǎng)絡(luò)包大數(shù)據(jù)的優(yōu)化統(tǒng)計和自適應(yīng)捕獲[10].在進(jìn)行分塊特征匹配和信息融合處理時,結(jié)合分區(qū)域的統(tǒng)計特征分析方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的大數(shù)據(jù)挖掘和統(tǒng)計信息分析,建立數(shù)據(jù)鏈路層網(wǎng)絡(luò)包碼元分布序列[11].采用層次化融合方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包檢測的模糊度函數(shù)為
(10)
其中,z0為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的自相關(guān)特征量,zi為i點處采集的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的實測值,di表示數(shù)據(jù)捕獲點i和點0的距離,S為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的實測點統(tǒng)計特征量,K為自適應(yīng)加權(quán)系數(shù).通過相似度特征分析[12],采用基于位置的自動化協(xié)議融合方法,得到數(shù)據(jù)鏈路層網(wǎng)絡(luò)的相空間分布特征解,得到基于位置的關(guān)鍵詞分布序列A={a1,a2,…,an},B={b1,b2,…,bm}.數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的報文標(biāo)記函數(shù)為
(11)
基于位置的協(xié)議逆分析方法,得到報文標(biāo)記的格式分組模型為
(12)
通過模糊度尋優(yōu)方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的狀態(tài)轉(zhuǎn)移控制,得到關(guān)聯(lián)規(guī)則集定義為
(13)
其中,dm+1(m)為數(shù)據(jù)鏈路層網(wǎng)絡(luò)包集在第m點的預(yù)測值,dk+1(m)為采用第m點處采集的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的頻繁項集.通過包絡(luò)特征提取和標(biāo)記樣本分析,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的特征融合和優(yōu)化提取.
在進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的聚類過程的收斂性控制,建立數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的關(guān)聯(lián)規(guī)則分布集后,通過演化特征融合分析方法,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的多空間內(nèi)存共享,演化特征融合分布函數(shù)為
(14)
在網(wǎng)絡(luò)會話報文協(xié)議中,建立數(shù)據(jù)鏈路層網(wǎng)絡(luò)包檢測的權(quán)重因子集為
(15)
其中,
P(K=T)=C(A+di)+s(B-dj),
(16)
P(K=1|K=T)=(NB+dj)*C,
(17)
P(R=1)=(NS-di)+S2,
(18)
(17)式中,NB為數(shù)據(jù)鏈路層網(wǎng)絡(luò)的分布維數(shù),(18)式中NS為表示模糊度標(biāo)記特征量.通過網(wǎng)格分塊區(qū)域融合分析,對數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲過程的自動化配準(zhǔn)和收斂性進(jìn)行有效控制,從而完成多空間內(nèi)存共享.
(19)
(20)
其中,Oabj(U;c)=(uaj+ubj)+(uaj-ubj)-1,uaj和ubj表示多空間內(nèi)存共享維數(shù).
根據(jù)數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲輸出結(jié)果,結(jié)和多維度參數(shù)融合,對數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲進(jìn)行優(yōu)化,優(yōu)化結(jié)果為
(21)
綜上所述,根據(jù)優(yōu)化結(jié)果可知,運用本文方法,數(shù)據(jù)鏈路層網(wǎng)絡(luò)包特征提取、多空間內(nèi)存共享、捕獲輸出,能夠使得數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的捕獲得到優(yōu)化.
為了驗證本文方法在實現(xiàn)數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲中的應(yīng)用性能,進(jìn)行仿真測試分析,采用Matlab進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的算法處理,得到數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的采樣節(jié)點數(shù)為150,對數(shù)據(jù)鏈路層網(wǎng)絡(luò)包信息捕獲的維數(shù)為24,數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的匹配系數(shù)為0.34,多空間融合度為0.17,信息捕獲的延遲為12 ms,特征采樣的頻率為16 Hz,根據(jù)上述參數(shù)設(shè)定,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包采樣和捕獲優(yōu)化,得到原始的數(shù)據(jù)鏈路層數(shù)據(jù)如圖1所示.
圖1 原始的數(shù)據(jù)鏈路層數(shù)據(jù)
以圖1的數(shù)據(jù)鏈路層網(wǎng)絡(luò)數(shù)據(jù)為研究對象, 進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲,數(shù)據(jù)包捕獲輸出如圖2所示.
圖2 數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲輸出
分析圖2得知,利用本文方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的輸出特征聚類性較好,測試數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的召回率,得到對比結(jié)果如圖3所示.
圖3 數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的召回率對比
分析圖3得知,本文方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的召回率較高,測試其捕獲精度,得到對比結(jié)果見表1.
表1 數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的準(zhǔn)確概率對比
分析表1得知,本文方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的精準(zhǔn)度較高.
通過層次化的數(shù)據(jù)信息融合聚類,進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包的信息聚類分析,本文提出基于多空間內(nèi)存共享的數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲方法.實驗結(jié)果表明,采用本文方法進(jìn)行數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的自適應(yīng)性較好,數(shù)據(jù)的召回率較高,對數(shù)據(jù)鏈路層網(wǎng)絡(luò)包捕獲的準(zhǔn)確概率較高.