唐賓徽 陳睿 周振興
摘? 要: 由于移動通信網(wǎng)和無線傳感網(wǎng)各有特點,且各自的網(wǎng)絡(luò)結(jié)構(gòu)和協(xié)議棧差別較大,兩網(wǎng)異構(gòu)融合產(chǎn)生的多業(yè)務(wù)數(shù)據(jù)流量將同時具備局部性、周期性、隨機(jī)性、突發(fā)性等多重特點,結(jié)構(gòu)復(fù)雜,對網(wǎng)絡(luò)運營能力及安全監(jiān)測帶來了技術(shù)難題。文中針對多業(yè)務(wù)流的場景,分析各類業(yè)務(wù)流模型的特點,提出一種基于異構(gòu)網(wǎng)的融合業(yè)務(wù)流模型,并對業(yè)務(wù)流量通過預(yù)測算法進(jìn)行預(yù)測。仿真結(jié)果表明,該模型算法的預(yù)測精度較高,為異構(gòu)網(wǎng)的多業(yè)務(wù)融合起到了重要的支撐作用。
關(guān)鍵詞: 異構(gòu)網(wǎng); 融合業(yè)務(wù)流模型; 預(yù)測算法; 無線傳感網(wǎng); 移動通信網(wǎng); 模型分析
中圖分類號: TN92?34? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)05?0014?05
Research on service flow model and prediction algorithm for integration of wireless sensor networks and mobile communication networks
TANG Binhui1, CHEN Rui2, ZHOU Zhenxing3
(1. School of Computer and Software, Jincheng College of Sichuan University, Chengdu 610000, China;
2. School of Humanities, Xihua University, Chengdu 610000, China;
3. A Military Representative Office of PLA Rocket Force, Chengdu 610000, China)
Abstract: Since both the mobile communication networks and the wireless sensor networks have their own characteristics, and their network structures and protocol stacks are quite different, the multi?service data flow generated by the heterogeneous integration of the two networks are of the characteristics of locality, periodicity, randomness and burst property, as well as complex structure, which brings technical problems to network operation capability and security monitoring. In view of the above mentioned, the characteristics of various service flow models are analyzed on the basis of multi?service flow scenarios, and an integrated service flow model based on heterogeneous network is proposed, and the service flow is predicted by the prediction algorithm. The simulation results show that the prediction accuracy of the model algorithm is high, which plays an important supporting role for multi?service integration of heterogeneous networks.
Keywords: heterogeneous network; converged service flow model; prediction algorithm; wireless sensor network; mobile communication network; model analysis
0? 引? 言
隨著新一代移動通信網(wǎng)絡(luò)技術(shù)和物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,大力推進(jìn)無線傳感網(wǎng)與移動通信網(wǎng)的異構(gòu)融合已是大勢所趨。無線傳感網(wǎng)通過末端感知可為移動通信網(wǎng)提供有效、可靠且實時的前端數(shù)據(jù);而移動通信網(wǎng)作為信息傳送的承載網(wǎng)可為無線傳感網(wǎng)提供有效的管理、運營和維護(hù)。兩網(wǎng)的異構(gòu)融合,不僅有助于海量傳感信息的傳輸、分發(fā)與共享,還可作為一種全新的增值業(yè)務(wù)推動移動通信網(wǎng)的發(fā)展,為建立無處不在的泛在網(wǎng)絡(luò)[1]奠定基礎(chǔ)。本文主要針對異構(gòu)網(wǎng)融合業(yè)務(wù)流的特點,建立與之相適應(yīng)的業(yè)務(wù)流模型,并使用預(yù)測算法對其進(jìn)行流量預(yù)測,為異構(gòu)網(wǎng)絡(luò)性能評估提供解決方案。
泛在網(wǎng)絡(luò)就是將通信服務(wù)的對象從人擴(kuò)展到任何一件物品,通信不只發(fā)生在人和人之間,還發(fā)生在人與物之間、物與物之間,泛在網(wǎng)絡(luò)的聯(lián)網(wǎng)設(shè)備規(guī)模將比傳統(tǒng)網(wǎng)絡(luò)大得多,它們可像互聯(lián)網(wǎng)上的計算機(jī)一樣形成機(jī)器對機(jī)器(Machine to Machine,M2M)的通信方式。無線傳感網(wǎng)與移動通信網(wǎng)融合而成的異構(gòu)網(wǎng),就是為滿足上述需求而采用的最現(xiàn)實和最便捷的通信方案。無線傳感器網(wǎng)絡(luò)(WSN)將大量微型、有計算能力的傳感器節(jié)點部署在監(jiān)測區(qū)域內(nèi),以短距離無線低功率的通信方式形成一種多跳自組織網(wǎng)絡(luò)系統(tǒng)。在這個系統(tǒng)中,傳感節(jié)點將監(jiān)測到的數(shù)據(jù)按照約定的路由規(guī)則傳輸給匯聚節(jié)點,再將接收到的傳感數(shù)據(jù)發(fā)送給管理節(jié)點,用戶可通過管理節(jié)點對整個傳感網(wǎng)絡(luò)進(jìn)行配置、控制和管理?;谝苿油ㄐ畔到y(tǒng)的WSN可以將傳感節(jié)點數(shù)據(jù)通過有限的分層傳輸?shù)絽R聚節(jié)點[2],再通過具有移動終端功能的傳感網(wǎng)關(guān)回傳到移動通信系統(tǒng),或者直接由移動基站直連具有移動終端能力的傳感器,此時這些傳感器既是傳感節(jié)點也是網(wǎng)關(guān),可以最大限度地降低傳輸延遲來支持對實時性要求很高的監(jiān)控應(yīng)用。
1? 融合業(yè)務(wù)流量特性與技術(shù)分析
移動通信網(wǎng)與WSN的融合,不僅要考慮基于移動終端的無線傳感節(jié)點的網(wǎng)絡(luò)通信以及移動基站與無線傳感節(jié)點的網(wǎng)絡(luò)融合問題,還需要從業(yè)務(wù)融合角度考慮應(yīng)用層的開發(fā)、承載雙網(wǎng)的移動傳感設(shè)備以及網(wǎng)絡(luò)資源分配、業(yè)務(wù)流量分析等。該系統(tǒng)在實現(xiàn)有效數(shù)據(jù)傳輸基礎(chǔ)上,對移動傳感終端進(jìn)行合理分配,監(jiān)視終端的連接狀態(tài)、異常告警和業(yè)務(wù)流量預(yù)測,為融合網(wǎng)絡(luò)的運營、管理和維護(hù)奠定堅實基礎(chǔ)。
傳統(tǒng)的業(yè)務(wù)流分析模型都是將預(yù)測數(shù)值和監(jiān)控數(shù)值與歷史數(shù)據(jù)進(jìn)行比對分析,業(yè)務(wù)流的建模方法主要包括半馬爾柯夫模型、Poisson模型、基于自回歸滑動平均ARMA(Auto Regressive Moving Average)模型及ON/OFF模型等[3?6]。這些方法的特點是將業(yè)務(wù)流數(shù)據(jù)理解為一個平穩(wěn)的隨機(jī)過程,通過對過往數(shù)據(jù)建模來分析數(shù)據(jù)流量的變化。雖然這些方法運算簡單,也取得了良好的預(yù)測效果,但基于移動通信網(wǎng)與WSN這種異構(gòu)網(wǎng)絡(luò)融合的業(yè)務(wù)數(shù)據(jù)來說,這些方法就過于簡單了。異構(gòu)網(wǎng)的業(yè)務(wù)數(shù)據(jù)流具有局部性、周期性、突發(fā)性和隨機(jī)性等特點,因此將業(yè)務(wù)數(shù)據(jù)簡單理解為平穩(wěn)的隨機(jī)過程是不全面的?;诋悩?gòu)網(wǎng)這些特點,國內(nèi)外很多研究者引入了小波多尺度分析以及固態(tài)模函數(shù)分解(Empirical Mode Decomposition,EMD)[7]等手段,將異構(gòu)網(wǎng)絡(luò)信號在特定尺度上建立起ARMA模型,使其分解后的業(yè)務(wù)流量信號平穩(wěn)或近似平穩(wěn),從而提高模型預(yù)測的準(zhǔn)確性[8?11]。也有不少研究者基于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)及模糊決策等理論,通過非線性擬合近似的方法來分析業(yè)務(wù)流量的變化規(guī)律,這些方法為解決業(yè)務(wù)流量預(yù)測問題提供了參考。但是,小波分析或者EMD等方法在特定尺度上分析業(yè)務(wù)數(shù)據(jù)時有可能丟失其他尺度上的信息,通過神經(jīng)網(wǎng)絡(luò)來分析則存在過擬合問題,即模型對于擬合使用數(shù)據(jù)的解釋能力強而外展能力差,這是因為基于神經(jīng)網(wǎng)絡(luò)這類方法通常會將部分噪聲也當(dāng)成信號進(jìn)行擬合,使得模型過度解釋當(dāng)前的觀測數(shù)據(jù)[12?13]。本文針對異構(gòu)網(wǎng)特點,研究構(gòu)建基于多傳感節(jié)點的融合業(yè)務(wù)流模型,并通過多元自適應(yīng)濾波算法對預(yù)測數(shù)值進(jìn)行平均,對該業(yè)務(wù)的數(shù)據(jù)流量精確預(yù)測,這一方法相比傳統(tǒng)的ARMA模型,更能準(zhǔn)確地預(yù)測業(yè)務(wù)數(shù)據(jù)流量。
2? 融合業(yè)務(wù)流量模型研究
這幾年,隨著物聯(lián)網(wǎng)的發(fā)展,基于移動通信網(wǎng)與WSN融合的多業(yè)務(wù)M2M設(shè)備將會越來越多。設(shè)備里集成的數(shù)據(jù)流差異較大,在設(shè)計業(yè)務(wù)流量模型時,為了更好地使其在異構(gòu)網(wǎng)狀態(tài)下傳輸,必須對各種不同業(yè)務(wù)流量模型的特點進(jìn)行分析,這種多類型傳感集成將會帶來新的業(yè)務(wù)特性。目前常見的數(shù)據(jù)流大多數(shù)是多媒體數(shù)據(jù)流和語音流,這類應(yīng)用延遲要求相對較低,也可以容忍少量丟包,如遠(yuǎn)程視頻監(jiān)控業(yè)務(wù);網(wǎng)絡(luò)中也存在對實時性要求較高的控制和報警業(yè)務(wù),這類業(yè)務(wù)對時延和可靠性具有苛刻的指標(biāo)要求。對多業(yè)務(wù)M2M終端來說,針對突發(fā)性的業(yè)務(wù)分析,可以用指數(shù)分布來表征發(fā)送數(shù)據(jù)的長度和突發(fā)間隔的概率密度:
[f(x;λ)=λe-λx,? ? ? x>00,? ? ?x<0]
式中:[λ=1t],[t]表示傳輸時間。
突發(fā)間隔的均值為:
[EX=1λ]
突發(fā)間隔的均值方差為:
[DX=1λ2]
針對周期性的數(shù)據(jù)流,將[x]設(shè)為常數(shù)[d],根據(jù)周期性業(yè)務(wù)數(shù)據(jù)構(gòu)成的Poisson分布建模可得概率密度函數(shù)為:
[f(d)=λ1+λ2+…+λne-λ1+λ2+…+λnd,? ? d>0]
間隔均值為:
[Ed=1(λ1+λ2+…+λn)]
間隔方差為:
[Dd=1(λ1+λ2+…+λn)2]
針對長時間連續(xù)發(fā)送的數(shù)據(jù)流量,可以用高斯分布來表征數(shù)據(jù)長度的概率分布:
[f(x)=1(2λσ)2exp-(x-μ)22σ2]
長度均值為[μ],長度方差為[σ2],隨機(jī)變量長度落在[(α,β)]內(nèi)的概率函數(shù)為:
[pα 多種不同的業(yè)務(wù)數(shù)據(jù)流由多維高斯分布建??傻?,概率密度函數(shù)為: [fl1,l2,…,ln=22πnDσ1σ2…σn?exp-12Di=1nk=1nDik(li-ai)σi(lk-ak)σk] 長度方差為[n]階行列式: [D=r11r12r13…r1nr21r22r23…r2nr31r32r33…r3n?????rn1rn2rn3…rnn=1r12r13…r1nr211r23…r2nr31r321…r3n?????rn1rn2rn3…1] 式中:[rii=1],[rik=rki]。 在任意時刻,管理節(jié)點可收集到傳感器發(fā)送過來的多業(yè)務(wù)數(shù)據(jù),這些業(yè)務(wù)數(shù)據(jù)在時間序列上的分布是相似的。假定時間序列是平穩(wěn)時間序列,為[X1],[X2],…,[XK],其中,[Y]是預(yù)測對象的量測值,[Z]為誤差,則: [YT=β1X1+β2X2+…+βPXP+Z] 作為預(yù)測對象,[YT]受到自身變化的影響,其規(guī)律可由下式體現(xiàn): [YT=β1XT-1+β2XT-2+…+βPXT-P+ZT] 誤差項在不同時期具有依存關(guān)系,由下式表示: [ZT=ξT+a1ξT-1+a2ξT-2+…+aqξT-q] 由此,獲得模型表達(dá)式如下: [YT=β0+β1YT-1+β2YT-2+…+βPYT-P+ξT+a1ξT-1+a2ξT-2+…+aqξT-q] 從上式可以看出,這個統(tǒng)計模型的主要缺點是丟失了流量序列中重要的周期信息和趨勢信息,異構(gòu)網(wǎng)的數(shù)據(jù)結(jié)構(gòu)復(fù)雜,宏觀流量往往多變,業(yè)務(wù)流量數(shù)據(jù)中又含有多種周期類波動數(shù)據(jù),針對隨機(jī)因素的干擾很難用單一的模型來描述。本文采用多元的自適應(yīng)模型對異構(gòu)網(wǎng)中的業(yè)務(wù)流量使用平均誤差估計原理[14?15]來建模。根據(jù)多個時刻收集到的樣本數(shù)據(jù),對相關(guān)系數(shù)進(jìn)行回歸計算,該模型建立的前提是管理節(jié)點隨時間推移而收集到的業(yè)務(wù)數(shù)據(jù)形成的數(shù)據(jù)序列看作是一個隨機(jī)序列,這組隨機(jī)變量所具有的依存關(guān)系體現(xiàn)著原始數(shù)據(jù)在時間上的延續(xù)性,假設(shè)[f(t)]代表1個測量間隔收集到的樣本流量數(shù)據(jù),[fm(k)]表示[m]個測量間隔收集到的流量數(shù)據(jù)的平均值,如下所示: [fm(k)=1mi=(k-1)m+1kmf(i)] 從上式可得,如果已知[fm(1),fm(2),…,fm(k)],可通過計算前[K]個流量的加權(quán)和來預(yù)測下一個測量間隔的業(yè)務(wù)流量[fm(k+1)]。本文研究的業(yè)務(wù)應(yīng)用場景中多業(yè)務(wù)的M2M節(jié)點在不同時刻可收集到不同類的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)之間的表現(xiàn)關(guān)系如下所示: [vT=a1v1+a2v2+…+aqvq] 式中:[v1,v2,vq]是各類傳感器的業(yè)務(wù)數(shù)據(jù);[a1,a2,aq]是該任意時刻下各類數(shù)據(jù)的相關(guān)系數(shù)。根據(jù)多個時刻收集到的多個樣本數(shù)據(jù),對相關(guān)系數(shù)進(jìn)行回歸計算,可求得各類數(shù)據(jù)的損失函數(shù)[af1,af2,…,afn],當(dāng)對下一個時刻[fm(k+1)]進(jìn)行預(yù)測時,可得: [fm(k+1)]=[af1,af2,…,afn?fm(1)fm(2)?fm(k)] [af0,af1,af2,…,afn=R(n)? ? …? ? R(1)?R(1)…R(n)R(2)…R(n-1)???R(n)…R(1)-1] 式中[R(n)]為時間序列的協(xié)方差函數(shù)。從此過程中不難看出,此模型根據(jù)預(yù)測過程中各類數(shù)據(jù)所產(chǎn)生的誤差,運用誤差原理,通過多元的自適應(yīng)模型來建模,提高流量預(yù)測的準(zhǔn)確性。 3? 仿真驗證及結(jié)果 用于流量預(yù)測的基本方法都普遍采用事先獲取一段時間的正常(異常)流量,少則1天,多則數(shù)月,然后對采集到的歷史流量數(shù)據(jù)進(jìn)行模式訓(xùn)練、正常(異常)行為的刻畫或方差分析等,在得到某個間接統(tǒng)計量后再進(jìn)行流量預(yù)測和異常檢測。 具體步驟如下: 1) 獲取[m]個不同時刻的業(yè)務(wù)數(shù)據(jù)流量[FX(t)]; 2) 對[FX(t)]選用[m]個不同時間尺度的線性濾波器對網(wǎng)絡(luò)流量信號進(jìn)行多元的低通濾波,每個時刻的窗體點長為[2m],窗體選擇高斯窗,得到[m]個濾波信號,表示為[FXm(t)]; 3) 對[m]個不同的濾波信號按上文提及的業(yè)務(wù)流量模型進(jìn)行預(yù)測,從而得到下一個時刻的預(yù)測值; 4) 對各個預(yù)測值取數(shù)值平均值作為異構(gòu)模型的預(yù)測值,并與傳統(tǒng)的ARMA模型的預(yù)測值進(jìn)行對比。 本文使用[σ2]表示[X]時刻以前[M]個原始值和預(yù)測值之間的估計誤差的平方和均值,即[σ2=ξ2n(n-1)m],用檢測統(tǒng)計量[τ]表示[n]時刻估計誤差與[σ]的比值,即當(dāng)[σ>0]時,[σ2=ξ2n(n-1)m,γ=ξ(n+1n)σ],否則,[τ=0]。進(jìn)行異常檢測時,若當(dāng)前[τ]值超出容許范圍,則表示異常(為1),否則表示正常(為0)。 為了對算法性能進(jìn)行評估,本文利用實驗室采集的傳感器數(shù)據(jù)集在Matlab 10.1平臺上進(jìn)行仿真實驗[16?17],選取區(qū)域集合里1 000個傳感節(jié)點作為ARMA流量預(yù)測模型的預(yù)測數(shù)據(jù)點,再將這1 000個傳感節(jié)點作為異構(gòu)網(wǎng)業(yè)務(wù)模型測試算法性能的預(yù)測數(shù)據(jù)點,通過比較兩者之間的誤差值,可以證明后者的算法預(yù)測能力更強。本文采用高斯窗,主要考慮其設(shè)計簡便,在處理濾波前對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,[M]取3,得到3個不同間隔時刻的濾波信號,以及各自的預(yù)測值,最后取預(yù)測值的平均值。 兩種不同模型在3個不同時刻的對照圖如圖1~圖3所示。 ARMA建模數(shù)據(jù)平均后的預(yù)測值波形圖和頻譜圖如圖4所示。 異構(gòu)網(wǎng)建模數(shù)據(jù)平均后的預(yù)測值波形圖和頻譜圖如圖5所示。 從以上各圖的對比可以看到,相比ARMA模型,異構(gòu)網(wǎng)模型的濾波信號波形圖更多地保留了信號變化的趨勢和特點。通過異構(gòu)網(wǎng)模型進(jìn)行數(shù)值預(yù)測,可以將信號在不同時間與能量上的特點看得更清晰,從而進(jìn)一步得到準(zhǔn)確度較高的預(yù)測數(shù)據(jù)。 將異構(gòu)網(wǎng)的預(yù)測模型與實測數(shù)據(jù)模型進(jìn)行對比,可以看出,異構(gòu)網(wǎng)模型的預(yù)測數(shù)據(jù)與實測數(shù)據(jù)非常接近,誤差基本控制在±0.050之間,預(yù)測誤差在10-3量級。 4? 結(jié)? 語 本文針對異構(gòu)網(wǎng)融合將出現(xiàn)的多業(yè)務(wù)集成場景下的數(shù)據(jù)流特點,提出與之相匹配的業(yè)務(wù)流量模型以及有效的流量預(yù)測算法,通過數(shù)據(jù)仿真比對,證實了其預(yù)測精度相比傳統(tǒng)的ARMA模型預(yù)測算法更優(yōu),可廣泛應(yīng)用于異構(gòu)網(wǎng)環(huán)境下的網(wǎng)絡(luò)流量預(yù)測。下一步,將充分考慮針對多元業(yè)務(wù)數(shù)據(jù)的自適應(yīng)權(quán)重,以期進(jìn)一步提高流量預(yù)測精度。 注:本文通訊作者為陳睿。 參考文獻(xiàn) [1] 陳智,羅平,岳文靜,等.一種用于無線傳感器網(wǎng)絡(luò)絡(luò)的能量拓?fù)淇刂扑惴╗J].中國傳感器與驅(qū)動器學(xué)報,2013,23(3):382?387. [2] 潘立強,高慧君,洪高,等.一種基于空間相關(guān)的無線傳感器網(wǎng)絡(luò)絡(luò)自適應(yīng)缺失數(shù)據(jù)估計算法[J].國際無線信息網(wǎng)絡(luò)雜志,2014,21(4):280?289. [3] 姚萌.網(wǎng)絡(luò)流量組合預(yù)測模型的研究[D].無錫:江南大學(xué),2008. [4] LEI Jianjun, XIA Ying, ZHAO Kuo. Energy efficient data collection protocol for wireless sensor net?works [J]. Journal of Chongqing University of Posts and Telecommunications (Natural science edition), 2014, 26(5): 582?586. [5] TIAN Haimei, HUANG Nan. Network traffic prediction based on ACO?LSSVM [J]. Computer engineering and applications, 2014, 50(1): 91?95. [6] 顏若愚,鄭慶華,牛國林.自適應(yīng)濾波實時網(wǎng)絡(luò)流量異常檢測方法[J].西安交通大學(xué)學(xué)報,2009,43(12):1?5. [7] 鄭若金,韓力群,陳天華.基于小波分析和神經(jīng)網(wǎng)絡(luò)的心音信號研究[J].計算機(jī)仿真,2010,27(5):170?173. [8] 周強,彭輝.基于自回歸滑動平均的網(wǎng)絡(luò)數(shù)據(jù)流量預(yù)測模型[J].計算機(jī)科學(xué),2014,41(4):75?79. [9] 段文軒,蔣文賢.無線傳感器網(wǎng)絡(luò)中一種ARMA流量預(yù)測的擁塞控制算法[J].小型微型計算機(jī)系統(tǒng),2012,33(5):1098?1103. [10] 劉亮,江漢紅,王潔,等.基于小波分析的ARMA?SVR網(wǎng)絡(luò)流量預(yù)測方法[J].計算機(jī)工程與設(shè)計,2015,36(8):2021?2025. [11] 朱苗苗.基于結(jié)構(gòu)方程模型改進(jìn)ARMA模型參數(shù)估計[[J].軟件導(dǎo)刊,2016,15(9):6?9. [12] 陳文清.一種基于多標(biāo)簽學(xué)習(xí)的網(wǎng)絡(luò)流量預(yù)測算法[J].科學(xué)通報,2016,32(4):147?151. [13] LIU Yang, ZHANG Linfeng, GUAN Yong. A distributed data streaming algorithm for network?wide traffic anomaly detection [J]. ACM SIGMETRICS performance evaluation review, 2009, 37(2): 81. [14] 季琳琳,廖軍,宗先鵬.異方差線性測量誤差模型的平均估計[J].系統(tǒng)科學(xué)與數(shù)學(xué),2018,38(6):688?701. [15] FENG Feifei, PENG Fenghua, YAN Bo, et al. QoS?based LTE downlink scheduling algorithm for smart grid communication [C]// IEEE 9th International Conference on Communication Software and Networks. Guangzhou, China: IEEE, 2017: 548?552. [16] 溫祥西,孟相如,馬志強,等.小時間尺度網(wǎng)絡(luò)流量混沌性分析及趨勢預(yù)測[J].電子學(xué)報,2012,40(8):1609?1616. [17] 邱婧,夏靖波,吳吉祥.網(wǎng)絡(luò)流量預(yù)測模型研究進(jìn)展[J].計算機(jī)工程與設(shè)計,2012,33(3):865?869.