歐家成,吳援明
(電子科技大學(xué)光電信息學(xué)院,成都610054)
近年來(lái)對(duì)局域網(wǎng)和廣域網(wǎng)的流量采集和測(cè)量表明,網(wǎng)絡(luò)流量普遍存在自相似或長(zhǎng)相關(guān)的特性[1]。自相似流量大時(shí)間尺度上的突發(fā)性會(huì)造成網(wǎng)絡(luò)延遲增加和由于緩沖溢出的失去增大,造成系統(tǒng)資源不必要的浪費(fèi)。所以網(wǎng)絡(luò)流量的自相似性給流量控制和網(wǎng)絡(luò)資源的管理帶來(lái)了更多的困難,有必要對(duì)業(yè)務(wù)流量作出預(yù)測(cè)。針對(duì)傳統(tǒng)的短相關(guān)模型在自相似業(yè)務(wù)分析和預(yù)測(cè)上的局限性,許多學(xué)者根據(jù)網(wǎng)絡(luò)流量的統(tǒng)計(jì)特性提出了 FARIMA[2]、小波[3]等數(shù)學(xué)模型。
相對(duì)于復(fù)雜的統(tǒng)計(jì)模型,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單,并具有自組織、自學(xué)習(xí)、非線性逼近能力,一些學(xué)者提出利用神經(jīng)網(wǎng)絡(luò)來(lái)解決通信網(wǎng)系統(tǒng)中的一些非線性問(wèn)題:文獻(xiàn)[4]提出用 ARIMA和人工神經(jīng)網(wǎng)絡(luò)的組合模型用于流量的短期預(yù)測(cè);文獻(xiàn)[5]提出一種基于RBF神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量建模與預(yù)測(cè)。針對(duì)通信流量預(yù)測(cè)的問(wèn)題,提出用一種簡(jiǎn)單的徑向基(RBF,Radial Basis Function)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)構(gòu)實(shí)現(xiàn)自相似業(yè)務(wù)流的預(yù)測(cè),并采用小波方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,簡(jiǎn)化了輸入輸出關(guān)系,提高了預(yù)測(cè)精度。通過(guò)仿真結(jié)果與其他預(yù)測(cè)模型比較,驗(yàn)證了預(yù)測(cè)結(jié)果的精確性和有效性。
引入極大重疊離散小波變換(MODWT)[6]對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,DWT的計(jì)算基于離散緊致集Daubechies小波濾波器。MODWT能夠應(yīng)用于任意大小的樣本而且小波系數(shù)具有平移不變性,保證了序列具有原始信息一樣的有序性和完整性。分別以{gl:l=0,1,...,L -1}和{hl:l=0,1,...,L -1}表示尺度濾波器和小波濾波器,L表示濾波器長(zhǎng)度。為了構(gòu)造 MODWT,重新定義,令cj-1,n=xn,xn為樣本序列,j表示分解層數(shù)。MODWT塔式算法由{cj-1,n}產(chǎn)生小波系數(shù){dj,n}和尺度系數(shù){cj,n}。
其中,n=1,1,...N -1。在分解層數(shù) j-1 和 j上利用神經(jīng)網(wǎng)絡(luò)作逼近會(huì)有所不同,因此分解層數(shù)j-1上時(shí)間序列必須由分解層數(shù)j上的序列進(jìn)行重構(gòu)。原始信號(hào)可以通過(guò)逆塔式算法從dj和cj還原得到。
經(jīng)過(guò)預(yù)處理的數(shù)據(jù)在頻率成份上比原始流單一,分解后的流量平穩(wěn)性比原始的流量好得多,有助于簡(jiǎn)化數(shù)據(jù)擬合過(guò)程。
對(duì)業(yè)務(wù)流經(jīng)過(guò)小波分解后,將尺度系數(shù)的延遲{cj,n-1,cj,n-2,...,cj,n-q}作為神經(jīng)網(wǎng)絡(luò)的輸入,q 為神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)目。網(wǎng)絡(luò)數(shù)據(jù)的擬合可以用(4)式來(lái)表示。
其中,右邊第一項(xiàng)表示網(wǎng)絡(luò)輸出,p為預(yù)測(cè)步長(zhǎng),ej,n+p為預(yù)測(cè)值和真實(shí)值之間的誤差。
RBF神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)如圖1所示,隱層為徑向基層,輸出為一線性層。dist表示取輸入向量和權(quán)值的歐幾里得距離。
圖1 RBF網(wǎng)絡(luò)模型
隱層單元的變換函數(shù)是徑向基函數(shù),一般用高斯函數(shù)作為徑向基函數(shù)。
網(wǎng)絡(luò)的隱層單元數(shù)目、基函數(shù)的中心和權(quán)值都需要通過(guò)學(xué)習(xí)決定,采用正交最小二乘(OLS,Orthogonal Least Squares)算法進(jìn)行網(wǎng)絡(luò)訓(xùn)練。它是S.Chen[7]等人提出來(lái)的,該方法從樣本輸入中選取數(shù)據(jù)中心,同時(shí)算出輸出權(quán)值。設(shè) y=[y(1),y(2),...,y(N)]T為期望輸出序列;隱層輸出矩陣為 p= [p1,p2,...,pM],其中 pi= [pi(1),pi(2),...,pi(N)]T,1≤i≤M,M 表示隱層神經(jīng)元數(shù);w=[w1,w2,...,wM]T,為輸出權(quán)值;E=[ε(1),ε(2),...ε(N)]T為學(xué)習(xí)后誤差。將 P 進(jìn)行奇異值分解P=C×A,A是n×n階奇異陣。C是N×n階矩陣且列向量ci是正交的,即CTC=H,H是對(duì)角陣,其對(duì)角線元素滿足基于 OLS解得權(quán)值矩陣
確定隱層單元中心的步驟如下:
(1)第一步,令 c1i=pi,對(duì)于1≤i≤M 計(jì)算
(2)第 k 步,k≥2,對(duì)于 1≤i≤M,i≠i1,...,i≠ik-1計(jì)算
進(jìn)行自相似業(yè)務(wù)流量預(yù)測(cè)的主要思路分為“小波預(yù)處理”和“RBF預(yù)測(cè)”兩部分,基本步驟如下:
(1)對(duì)業(yè)務(wù)流量以時(shí)間單位進(jìn)行聚合處理;(2)將數(shù)據(jù)大小映射到[0,1]之間,選擇小波濾波器}和尺度濾波器及分解層數(shù)J(本文仿真最大分解層數(shù)為2),根據(jù)(1)式和(2)式對(duì)1000點(diǎn)數(shù)據(jù)作MODWT變換;
(3)將變換后的尺度系數(shù)構(gòu)造為神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本,訓(xùn)練結(jié)束后保存神經(jīng)網(wǎng)絡(luò)用作預(yù)測(cè)結(jié)構(gòu);
(4)用訓(xùn)練后的RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)訓(xùn)練樣本后100點(diǎn)值,并用(3)式進(jìn)行數(shù)據(jù)還原。
采用Bellcore實(shí)驗(yàn)室收集的以太網(wǎng)數(shù)據(jù)pAug89.TL[8]進(jìn)行預(yù)測(cè)研究。首先對(duì)數(shù)據(jù)以時(shí)間單位1s進(jìn)行聚合,選取其中1000點(diǎn)作為樣本,將數(shù)據(jù)大小映射到[0,1]之間,并選擇和對(duì)樣本序列作MODWT變換。將尺度系數(shù)作為訓(xùn)練神經(jīng)網(wǎng)絡(luò)的輸入輸出訓(xùn)練樣本,仿真中RBF神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)為20。用訓(xùn)練后的網(wǎng)絡(luò)預(yù)測(cè)樣本后的100點(diǎn)值。一步預(yù)測(cè)結(jié)果與真實(shí)值之間的比較如圖2所示。
圖2 RBF網(wǎng)絡(luò)一步預(yù)測(cè)結(jié)果與真實(shí)值的比較
引入信噪比(SNR,signal to noise ratio)和作為預(yù)測(cè)性能的評(píng)價(jià)標(biāo)準(zhǔn),信噪比越大預(yù)測(cè)結(jié)果越精確。
根據(jù)一步預(yù)測(cè)結(jié)果比較了在不同時(shí)間尺度下幾種不同自相似業(yè)務(wù)模型的預(yù)測(cè)性能,這里用作比較的BP神經(jīng)網(wǎng)絡(luò)具有三層的10-20-1結(jié)構(gòu)。從表1中可以看出,在不同時(shí)間尺度上,網(wǎng)絡(luò)流量的突發(fā)特性仍然不能被平滑掉,具有長(zhǎng)相關(guān)的性質(zhì)。RBF預(yù)測(cè)模型在不同時(shí)間尺度上一步預(yù)測(cè)結(jié)果的SNR比AR和FARIMA等數(shù)學(xué)模型提高了1-2個(gè)dB,同BP網(wǎng)絡(luò)相比有訓(xùn)練過(guò)程不受初始值影響,不存在局部極小點(diǎn)的優(yōu)點(diǎn),預(yù)測(cè)結(jié)果也更加精確。
表1 不同預(yù)測(cè)模型的性能比較
仿照一步預(yù)測(cè)的實(shí)驗(yàn),用此RBF網(wǎng)絡(luò)提前五步預(yù)測(cè)樣本之后的100點(diǎn)值,結(jié)果如圖3所示。
圖3 RBF網(wǎng)絡(luò)提前5步預(yù)測(cè)結(jié)果與真實(shí)值間的比較
當(dāng)預(yù)測(cè)步長(zhǎng)變大時(shí),預(yù)測(cè)的精度變低。但是此預(yù)測(cè)方法在多步預(yù)測(cè)中仍然優(yōu)于AR和FARIMA等數(shù)學(xué)模型,這些模型一般預(yù)測(cè)步長(zhǎng)不超過(guò)5步時(shí)就很快地接近均值了[9],所以基于小波分解的RBF預(yù)測(cè)模型在長(zhǎng)期預(yù)測(cè)中仍然有很好的推廣性。
提出一種基于MODWT小波預(yù)處理的RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,在數(shù)據(jù)處理中引入了MODWT小波分解,簡(jiǎn)化了對(duì)輸入輸出關(guān)系的擬合,提高了對(duì)數(shù)據(jù)局部信息的跟蹤能力和神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)的處理能力。將RBF神經(jīng)網(wǎng)絡(luò)用于自相似業(yè)務(wù)流的預(yù)測(cè)研究,采用基于OLS算法的RBF網(wǎng)絡(luò),具有結(jié)構(gòu)簡(jiǎn)單,學(xué)習(xí)速度快,逼近能力好的優(yōu)點(diǎn),能很好地?cái)M合自相似業(yè)務(wù)流非線性和非平穩(wěn)的特性。通過(guò)仿真比較了在不同時(shí)間尺度上一步預(yù)測(cè)結(jié)果的SNR,此預(yù)測(cè)模型比AR、FARIMA、BP等模型提高了1-2個(gè)dB。多步預(yù)測(cè)的仿真結(jié)果說(shuō)明此預(yù)測(cè)模型在業(yè)務(wù)的長(zhǎng)期預(yù)測(cè)中也有很好的推廣能力。
[1]W E Leland,M S Taqqu,D V Wilson.On the Self- similar Nature of Ethernet Traffic[J].IEE/ACM Transactions on Networking,1994,2(1):1 -15.
[2]Yantai Shu,Zhigang Jin.Traffic Prediction Using FARIMA Models[C].ICC’99,1999 IEEE International Conference on Communications,1999:891 -895.
[3]Zhang Shuo,Zhao Rongcai,An ke.On Generating Selfsimilar Network Traffic Using Multi-core Processors[C].2008 International Symposium on Computer Science and Computational Technology.2008:667 -672.
[4]Zeng Dehuai,Xu Jianmin,Liu Liyan.Short Term Traffic Flow Prediction Using Hybrid ARIMA and ANN Models[C].2008 Workshop on Power Electronics and Intelligent Transportation System.2008:621-625.
[5]王俊松,高志偉.基于RBF神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量建模與預(yù)測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(13):6 -11.
[6]D B Percival,A T Walden.Wavelet Methods for Time Series Analysis[M].北京:機(jī)械工業(yè)出版社,2006:159-182.
[7]S Chen,C F N Cowan,P M Grant.Orthogonal Least Squares Learning Algorithm for Radial Basis Function Networks[J].IEEE Transactions on Neural Networks,1991,2(2):302 -309.
[8]Internet traffic archive[EB/OL].http://ita.ee.lbl.gov/.
[9]Nayera Sadek.Alireza Khotanzad and Thomas Chen.ATM Dynamic Bandwidth Allocation Using F-ARIMA Prediction Model[C].The 12th Conference on Computer Communications and Networks.2003:359 -363.