米 捷, 王旭輝
(1.河南工程學(xué)院 計算機(jī)學(xué)院,河南 鄭州 451191; 2.河南工程學(xué)院 工程訓(xùn)練中心,河南 鄭州 451191)
隨著智慧物聯(lián)網(wǎng)建設(shè)的發(fā)展,物聯(lián)網(wǎng)應(yīng)用越來越廣泛,通過構(gòu)建層次化物聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)分布式探測設(shè)計,可實(shí)現(xiàn)組網(wǎng)優(yōu)化,提高物聯(lián)網(wǎng)量化分析能力。在進(jìn)行層次化物聯(lián)網(wǎng)設(shè)計時,需要進(jìn)行數(shù)據(jù)優(yōu)化檢測,構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)優(yōu)化檢測模型[1],結(jié)合模糊相關(guān)性分析方法進(jìn)行物聯(lián)網(wǎng)優(yōu)化檢測和信息挖掘,以提高大數(shù)據(jù)的挖掘分析能力。
過去的物聯(lián)網(wǎng)數(shù)據(jù)檢測模型,在數(shù)據(jù)檢測過程中受網(wǎng)絡(luò)環(huán)境中重復(fù)數(shù)據(jù)和干擾雜質(zhì)數(shù)據(jù)的影響,導(dǎo)致數(shù)據(jù)檢測的準(zhǔn)確率不高、抗干擾性不好[2]。本研究提出了基于遞歸熵特征提取的層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測方法,首先進(jìn)行數(shù)據(jù)存儲結(jié)構(gòu)的特征分析,然后進(jìn)行數(shù)據(jù)的特征分析和融合聚類處理,結(jié)合數(shù)據(jù)遞歸熵特征的提取結(jié)果進(jìn)行數(shù)據(jù)的優(yōu)化檢測,最后進(jìn)行仿真測試,得出了有效性結(jié)論。
為了實(shí)現(xiàn)對層次化物聯(lián)網(wǎng)數(shù)據(jù)信息處理系統(tǒng)數(shù)據(jù)庫的訪問和調(diào)度,需要構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)的存儲結(jié)構(gòu)模型,根據(jù)層次化物聯(lián)網(wǎng)數(shù)據(jù)庫的存儲特征進(jìn)行信息聚類,采用分塊特征匹配方法[3]建立數(shù)據(jù)的存儲空間配對模型,結(jié)合坐標(biāo)指針?biāo)饕椒ㄟM(jìn)行數(shù)據(jù)的優(yōu)化檢測,得到數(shù)據(jù)的存儲結(jié)構(gòu)如圖1所示。
圖1 層次化物聯(lián)網(wǎng)數(shù)據(jù)存儲結(jié)構(gòu)Fig.1 Hierarchical network data storage structure
根據(jù)圖1所示的層次化物聯(lián)網(wǎng)數(shù)據(jù)存儲結(jié)構(gòu)進(jìn)行數(shù)據(jù)的模糊信息聚類,建立數(shù)據(jù)碼元分布序列,采用層次化融合方法進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)檢測過程中的自適應(yīng)加權(quán)學(xué)習(xí)[4],學(xué)習(xí)式為
(1)
式中:z0為數(shù)據(jù)的關(guān)聯(lián)估計值;zi為i點(diǎn)數(shù)據(jù)的實(shí)測值;di為數(shù)據(jù)檢測點(diǎn)i和零點(diǎn)的距離;S為實(shí)測點(diǎn)統(tǒng)計特征量;K為分塊特征匹配權(quán)重。
根據(jù)自適應(yīng)加權(quán)學(xué)習(xí)方法,進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的空間特征加權(quán)。提取層次化物聯(lián)網(wǎng)數(shù)據(jù)的關(guān)聯(lián)規(guī)則[5],把數(shù)據(jù)通過多維空間重組方法聚焦到特征空間中,得到分布時間序列A={a1,a2,…,an},B={b1,b2,…,bm}。層次化物聯(lián)網(wǎng)數(shù)據(jù)的空間聚類模型定義為
(2)
計算模糊聚類特征系數(shù),定義為
(3)
通過模糊度尋優(yōu)方法進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)的統(tǒng)計分析,分析差異度特征量,進(jìn)行數(shù)據(jù)模糊度匹配,得到關(guān)聯(lián)規(guī)則集為
(4)
式中:dm+1(m)為數(shù)據(jù)集在第m點(diǎn)的預(yù)測值;dk+1(m)為第m點(diǎn)的模糊性特征量。根據(jù)上述分析,實(shí)現(xiàn)了數(shù)據(jù)存儲結(jié)構(gòu)的優(yōu)化重組。
通過挖掘數(shù)據(jù)集統(tǒng)計的屬性特征,實(shí)現(xiàn)數(shù)據(jù)集統(tǒng)計檢測。采用統(tǒng)計分析方法[6],建立層次化物聯(lián)網(wǎng)數(shù)據(jù)的關(guān)聯(lián)規(guī)則分布矩陣:
(5)
根據(jù)式(5)構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)的特征提取模型,根據(jù)特征提取結(jié)果進(jìn)行數(shù)據(jù)挖掘。
采用模糊C均值聚類方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的融合聚類。假設(shè)有限數(shù)據(jù)集X={x1,x2,…,xn}?Rs中含有n個樣本,樣本數(shù)據(jù)為xi。數(shù)據(jù)聚類算法是把對數(shù)據(jù)的分割轉(zhuǎn)化為對空間的分割,它不需要直接對數(shù)據(jù)進(jìn)行處理,而是采用Lagrange定理求得聚類標(biāo)函數(shù)的極值來確定數(shù)據(jù)聚類中心。采用模糊信息聚類算法進(jìn)行數(shù)據(jù)聚類處理[7],得到傳感節(jié)點(diǎn)i處采集到的數(shù)碼元序列(w1 j,w2 j,wtj),其中t為層次化物聯(lián)網(wǎng)數(shù)據(jù)的編號數(shù)目,wtj為層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的加權(quán)系數(shù)。結(jié)合語義特征分析方法,建立層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的模糊語義特征規(guī)則分析模型[8],得到層次化物聯(lián)網(wǎng)數(shù)據(jù)的自適應(yīng)加權(quán)系數(shù)
(6)
式中:maxlFreqi, j為數(shù)據(jù)的模糊度辨識特征量。
采用模糊聚類方法,計算層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的蟻群搜索最短路徑:
(7)
式中:di和dj為相似度屬性。
采用統(tǒng)計信息分析方法[9]建立層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的模糊特征分布集:
(8)
根據(jù)上述分析,構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)的融合聚類模型,根據(jù)聚類結(jié)果進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)檢測[10]。
在采用網(wǎng)格分塊區(qū)域融合方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)存儲結(jié)構(gòu)分析的基礎(chǔ)上,進(jìn)行數(shù)據(jù)檢測優(yōu)化,提出基于遞歸熵特征提取的層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測方法。根據(jù)特征提取結(jié)果,采用模糊C均值聚類方法進(jìn)行信息處理:
(9)
式中:Mid表示數(shù)據(jù)檢測的遞歸熵分布中位數(shù);Lm為最小閾值;fm為數(shù)據(jù)的中位數(shù);fless表示各維度下數(shù)據(jù)的最小統(tǒng)計特征量。構(gòu)建定量遞歸分析模型,得到遞歸熵特征提取結(jié)果為
(10)
在決策樹模型下,采用自適應(yīng)尋優(yōu)方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)遞歸熵的特征提取,根據(jù)提取結(jié)果進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)檢測[11]。
提取數(shù)據(jù)的遞歸熵特征量,采用層次化演化聚類方法進(jìn)行數(shù)據(jù)的自適應(yīng)分塊匹配,結(jié)合匹配濾波檢測器進(jìn)行干擾抑制[12],實(shí)現(xiàn)流程描述如下:
(1)考察層次化物聯(lián)網(wǎng)數(shù)據(jù)信息流矢量x和xn+τ,選擇一個C值,確定數(shù)據(jù)的匹配濾波系數(shù),若數(shù)據(jù)集為m,令A(yù)j(L)作為濾波階數(shù),其中j=1,2,…,k,使用關(guān)聯(lián)性融合聚類分析方法進(jìn)行數(shù)據(jù)分布式檢測。
(2)根據(jù)遞歸熵的規(guī)則性分布關(guān)系,得到時刻t和t+τ之前的相互關(guān)聯(lián)性和數(shù)據(jù)的融合聚類中心F(xi,Aj(L)),其中i=1,2,…,m,j=1,2,…,k。
(3)使用模糊相關(guān)性匹配方法,得到遞歸熵特征分布式檢測輸出滿足
D(xi,Aj(L))=min{D(xi,Aj(L))},
(11)
那么xi∈ωk。
(4)采用互信息特征分析方法,得到數(shù)據(jù)屬性檢測的類別特征量S(t),在數(shù)據(jù)聚類中心進(jìn)行多層迭代,得到迭代輸出的平均值:
(12)
(5)當(dāng)滿足收斂條件‖C(l)-C(l-1)‖<ξ時,則中止程序,否則返回步驟(2)。令層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測的迭代步長l=l+1,則數(shù)據(jù)檢測的優(yōu)化輸出為
(13)
通過上述分析,結(jié)合遞歸熵的規(guī)則性分布關(guān)系實(shí)現(xiàn)了層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測優(yōu)化。
為了驗(yàn)證本方法在層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測時的性能,進(jìn)行仿真測試。采用MATLAB進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測的算法處理,物聯(lián)網(wǎng)的分布節(jié)點(diǎn)數(shù)為200,數(shù)據(jù)特征重構(gòu)的嵌入維數(shù)為12,采樣時延為1.4 ms,數(shù)據(jù)存儲的根節(jié)點(diǎn)數(shù)為36,層次化物聯(lián)網(wǎng)數(shù)據(jù)的屬性類別數(shù)為8,數(shù)據(jù)的初始頻率f1=1.5 Hz,終止采樣頻率f2=2.3 Hz。實(shí)驗(yàn)分別選取1維、10維和100維數(shù)據(jù),根據(jù)上述參數(shù)設(shè)定,進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)采樣和檢測優(yōu)化,分析數(shù)據(jù)的聚類性能和特征檢測能力,得到層次化物聯(lián)網(wǎng)數(shù)據(jù)如圖2所示。
圖2 層次化物聯(lián)網(wǎng)數(shù)據(jù)Fig.2 Hierarchical Internet of Things data
以圖2的數(shù)據(jù)為研究對象,采用網(wǎng)格分塊區(qū)域融合方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的優(yōu)化存儲設(shè)計,提取數(shù)據(jù)的遞歸熵特征量,在不同的迭代步數(shù)下得到特征提取結(jié)果如圖3所示。
圖3 數(shù)據(jù)遞歸熵特征提取Fig.3 Data recursive entropy feature extraction
分析圖3可知,本方法能有效實(shí)現(xiàn)對層次化物聯(lián)網(wǎng)數(shù)據(jù)的特征聚類分析,特征檢測的聚類性較好,說明數(shù)據(jù)檢測的抗干擾性較好。分析數(shù)據(jù)檢測過程中的聚類性能,得到對比結(jié)果如圖4所示。
圖4 數(shù)據(jù)聚類性能對比Fig.4 Comparison of the data clustering performance
表1 層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測準(zhǔn)確率對比Tab.1 Comparison of the exact probability of the detection of the hierarchical Internet of Thing data
分析圖4發(fā)現(xiàn),采用本方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測的聚類性能較好,抗干擾能力較強(qiáng)。采用不同方法進(jìn)行數(shù)據(jù)檢測準(zhǔn)確率測試,得到的對比結(jié)果見表1。分析表1數(shù)據(jù)得知,采用本方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測的準(zhǔn)確率較高。
構(gòu)建層次化物聯(lián)網(wǎng)數(shù)據(jù)的優(yōu)化檢測模型,結(jié)合模糊相關(guān)性分析方法進(jìn)行層次化物聯(lián)網(wǎng)的優(yōu)化檢測和信息挖掘,以提高數(shù)據(jù)的檢測能力。提出基于遞歸熵特征提取的層次化物聯(lián)網(wǎng)數(shù)據(jù)檢測方法,根據(jù)自適應(yīng)加權(quán)學(xué)習(xí)方法,進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的空間特征加權(quán),結(jié)合語義特征分析方法,建立層次化物聯(lián)網(wǎng)數(shù)據(jù)挖掘的模糊語義特征規(guī)則分析模型,采用網(wǎng)格分塊區(qū)域融合方法進(jìn)行層次化物聯(lián)網(wǎng)數(shù)據(jù)的存儲結(jié)構(gòu)分析,結(jié)合匹配濾波檢測方法進(jìn)行數(shù)據(jù)檢測過程中的干擾抑制。仿真分析得知,采用本方法進(jìn)行數(shù)據(jù)檢測的準(zhǔn)確率較高、抗干擾性較好。