王雪松,李蘇洋
基于組合模型的網(wǎng)絡(luò)流量預(yù)測(cè)
王雪松,李蘇洋
網(wǎng)絡(luò)流量是多種因素綜合作用的結(jié)果,具有一定的混沌性和非線性,為了對(duì)網(wǎng)絡(luò)流量將來(lái)變化趨勢(shì)進(jìn)行準(zhǔn)確預(yù)測(cè),提出了一種網(wǎng)絡(luò)流量的組合預(yù)測(cè)模型(PHR-ELM)。分別采用C-C算法和Cao算法對(duì)原始網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行混沌分析,構(gòu)建極限學(xué)習(xí)機(jī)的訓(xùn)練樣本集和測(cè)試樣本集,然后將訓(xùn)練樣本輸入到極限學(xué)習(xí)機(jī)進(jìn)行學(xué)習(xí),建立網(wǎng)絡(luò)流量預(yù)測(cè)模型,最后測(cè)試樣本集輸入到模型中進(jìn)行單步和多步預(yù)測(cè)的驗(yàn)證性實(shí)驗(yàn)。結(jié)果表明,PHR-ELM可以反映網(wǎng)絡(luò)流量的混沌性和非線性變化趨勢(shì),獲得了高精度的網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果,且預(yù)測(cè)結(jié)果要優(yōu)于其它模型。
網(wǎng)絡(luò)流量;組合建模;混沌特性;極限學(xué)習(xí)機(jī);相空間重構(gòu)
隨著網(wǎng)絡(luò)用戶數(shù)量的不斷增加,以及各種網(wǎng)絡(luò)業(yè)務(wù)增加,網(wǎng)絡(luò)阻塞的頻率日益增加,如何保證網(wǎng)絡(luò)正常工作面臨巨大的挑戰(zhàn)[1,2]。網(wǎng)絡(luò)流量預(yù)測(cè)是解決該問(wèn)題的一種途徑,其預(yù)測(cè)結(jié)果可幫助人們提前知道網(wǎng)絡(luò)的變化信息,因此如何提高網(wǎng)絡(luò)流量的預(yù)測(cè)精度直接影響網(wǎng)絡(luò)管理水平的高低[3]。
為了更好的保證網(wǎng)絡(luò)正常運(yùn)行,防止網(wǎng)絡(luò)擁塞現(xiàn)象的出現(xiàn),人們通過(guò)各種途徑、采用多種技術(shù)對(duì)網(wǎng)絡(luò)流量預(yù)測(cè)進(jìn)行了探索和研究,當(dāng)前使用最為廣泛的方法為時(shí)間序列分析法[3],它們按時(shí)間收集網(wǎng)絡(luò)流量變化的歷史數(shù)據(jù),然后采用線性回歸方法對(duì)數(shù)據(jù)進(jìn)行分析,找出其中隱藏的變化規(guī)律,對(duì)于小規(guī)模的網(wǎng)絡(luò),它們具有建模速度快、效率高,預(yù)測(cè)結(jié)果可靠等特點(diǎn)[4,5],然而現(xiàn)代網(wǎng)絡(luò)的規(guī)模大,使得網(wǎng)絡(luò)流量具有強(qiáng)烈的非線性,時(shí)間序列分析法僅能描述線性變化趨勢(shì),無(wú)法實(shí)現(xiàn)網(wǎng)絡(luò)流量的非線性建模與預(yù)測(cè),局限性明顯[6]。為了解決傳統(tǒng)時(shí)間序列方法存在的問(wèn)題,學(xué)者們引入了一些非線性預(yù)測(cè)算法對(duì)網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行建模與分析,如BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、最小二支持向量機(jī)等,取得了更好的網(wǎng)絡(luò)流量預(yù)測(cè)效果[7-10]。對(duì)大規(guī)模網(wǎng)絡(luò)流量數(shù)據(jù),支持向量機(jī)以及最小二支持向量機(jī)的訓(xùn)練時(shí)間長(zhǎng),無(wú)法實(shí)現(xiàn)網(wǎng)絡(luò)流量的在線預(yù)測(cè)[11];BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)要經(jīng)過(guò)多次迭代才能確定網(wǎng)絡(luò)結(jié)構(gòu),收斂速度慢,且參數(shù)難以確定[12]。隨著網(wǎng)絡(luò)流量預(yù)測(cè)研究的不斷深入,人們發(fā)現(xiàn)網(wǎng)絡(luò)流量具有一定的混沌特性,因此在網(wǎng)絡(luò)流量預(yù)測(cè)建模,如何將混沌理論與非線性理論結(jié)合起來(lái)以提高網(wǎng)絡(luò)流量預(yù)測(cè)的準(zhǔn)確性,是當(dāng)前主要研究的方向[13,14]。
極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)是一種根據(jù)Moore-Penrose廣義逆矩陣?yán)碚摰纳窠?jīng)網(wǎng)絡(luò),通過(guò)線性方程組對(duì)訓(xùn)練迭代進(jìn)行求解,一次可以完成訓(xùn)練,不存在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的問(wèn)題,且具有支持向量機(jī)的預(yù)測(cè)性能[15]。本文將混沌理論和ELM組合在一起,提出一種網(wǎng)絡(luò)流量預(yù)測(cè)的給合模型(PHR-ELM),首先采用C-C算法和Cao算法構(gòu)建網(wǎng)絡(luò)流量的訓(xùn)練樣本集和測(cè)試樣本集,然后采用極限學(xué)習(xí)機(jī)對(duì)訓(xùn)練樣本集和測(cè)試樣本集進(jìn)行學(xué)習(xí)和性能測(cè)試,驗(yàn)證PHR-ELM的網(wǎng)絡(luò)流量預(yù)測(cè)的有效性和優(yōu)越性。
1.1混沌理論
網(wǎng)絡(luò)流量受到網(wǎng)絡(luò)價(jià)格、用戶上網(wǎng)時(shí)間以及上網(wǎng)人心理因素的影響,且因素之間互相影響,導(dǎo)致網(wǎng)絡(luò)流量變化一定的混沌特性,要進(jìn)行網(wǎng)絡(luò)流量準(zhǔn)確建模,首先就要分析其混沌性,重建模學(xué)習(xí)樣本。設(shè)網(wǎng)絡(luò)流量數(shù)據(jù)為{x(tj), j=1,2,…,n},那么網(wǎng)絡(luò)流能夠重構(gòu)為公式(1):
式中,τ為延遲時(shí)間,m為嵌入維數(shù)。
1.1.1C-C算法
(1)本文選擇C-C算法對(duì)網(wǎng)絡(luò)流量的τ進(jìn)行分析,得到網(wǎng)絡(luò)流量數(shù)據(jù)之間的時(shí)間相關(guān)性,設(shè)X(i)=[x(i), x(i+τ),L ,x(i+(m-1)τ)]和X(j)=[x(j), x(j+τ),L ,x(j+(m-1)τ)]分別表示相空間的相鄰點(diǎn),則兩點(diǎn)間的距離為公式(2):
采用關(guān)聯(lián)積分描述點(diǎn)對(duì)數(shù)所占比例,具體為公式(3):
公式(3)中,r為臨界半徑為;N為序列規(guī)模;H(·)表示Heaviside函數(shù),具體為公式(4):
全部網(wǎng)絡(luò)流量被劃為t個(gè)子序列,得到它們的統(tǒng)計(jì)量為公式(5):
設(shè)ΔS(m,t)=max[S(m, rj,τ)]-min[S(m, rj,τ)],則有公式(6):
公式(6)中,l和k分別表示可能的最大和最小嵌入維數(shù)。
1.1.2CAO算法
采用Cao算法對(duì)網(wǎng)絡(luò)流量數(shù)據(jù)的嵌入維數(shù)m進(jìn)行分析,設(shè)Xi(m+1)和Xn(i,m)(m+1)分別表示第i個(gè)重構(gòu)向量Xi(m+1)和其最近鄰,則有公式(7):
1.2極限學(xué)習(xí)機(jī)(ELM)
公式(8)中,k為訓(xùn)練集規(guī)模;αi為輸入權(quán)值,bi為偏差;βi為輸出權(quán)值。
對(duì)公式(8)進(jìn)行矩陣變換,可以得到公式(9):
公式(9)中,Tk為輸出向量;Hk為神經(jīng)元矩陣,其定義如公式(10):
一般條件下,K>>L,通過(guò)式(10)可以得到輸出權(quán)值為公式(11):
根據(jù)
iβ就可以確定ELM,然后采用ELM對(duì)網(wǎng)絡(luò)流量訓(xùn)練樣本進(jìn)行重新學(xué)習(xí),建立如下的網(wǎng)絡(luò)流量預(yù)測(cè)模型為公式(12):
1.2網(wǎng)絡(luò)流量的預(yù)測(cè)過(guò)程
(1)對(duì)一個(gè)具體網(wǎng)絡(luò)服務(wù)器,采用數(shù)據(jù)采集軟件收集原始網(wǎng)絡(luò)流量。
(2)網(wǎng)絡(luò)流量具有一定的波動(dòng)性,為了消除數(shù)據(jù)值波動(dòng)過(guò)大帶來(lái)的負(fù)面作用,其對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,具體為
公式(13):
公式(13)中,Ex和σx分別為網(wǎng)絡(luò)流量的均值和標(biāo)準(zhǔn)差。
(3)分別采用C-C算法和Cao算法對(duì)原始網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行混沌分析,構(gòu)建極限學(xué)習(xí)機(jī)的訓(xùn)練樣本集和測(cè)試樣本集。
(4)訓(xùn)練樣本輸入到極限學(xué)習(xí)機(jī)進(jìn)行學(xué)習(xí),建立網(wǎng)絡(luò)流量預(yù)測(cè)模型。
(5)測(cè)試樣本集輸入到模型中進(jìn)行單步和多步預(yù)測(cè)的驗(yàn)證性實(shí)驗(yàn)。
2.1網(wǎng)絡(luò)流量數(shù)據(jù)
為了分析PHR-ELM的網(wǎng)絡(luò)流量預(yù)測(cè)效果,選擇一個(gè)主節(jié)點(diǎn)路由器的每小時(shí)網(wǎng)絡(luò)流量作為研究對(duì)象,具體如圖1所示:
圖1 仿真對(duì)象
選擇最后100個(gè)數(shù)據(jù)對(duì)PHR-ELM的泛化能力進(jìn)行分析,其它樣本作為訓(xùn)練樣本集建立基于PHR-ELM的預(yù)測(cè)模型。
2.2重建網(wǎng)絡(luò)流量樣本
分別采用C-C算法和Cao算法對(duì)圖1中的網(wǎng)絡(luò)流量進(jìn)行分析,它們仿真結(jié)果變化曲線如圖2所示:
圖2 網(wǎng)絡(luò)流量的τ和m確定
2.3單步預(yù)測(cè)性能分析
將訓(xùn)練樣本集輸入到ELM進(jìn)行學(xué)習(xí),并建立單步預(yù)測(cè)模型,測(cè)試樣本的預(yù)測(cè)結(jié)果如圖3所示:
圖3 PHR-ELM的預(yù)測(cè)結(jié)果
從圖3可以看出,PHR-ELM可以很好的跟蹤網(wǎng)絡(luò)流量變化態(tài)勢(shì),預(yù)測(cè)值與網(wǎng)絡(luò)流量值之間的偏差很小,可以忽略不計(jì),從而獲得較高的網(wǎng)絡(luò)流量預(yù)測(cè)精度高,初步驗(yàn)證了PHR-ELM應(yīng)用于網(wǎng)絡(luò)流量預(yù)測(cè)中的有效性。
2.4多步預(yù)測(cè)性能分析
網(wǎng)絡(luò)流量建模的目的是對(duì)網(wǎng)絡(luò)將來(lái)狀態(tài)進(jìn)行描述,而單步預(yù)測(cè)只是一種短期預(yù)測(cè)方式,無(wú)法對(duì)將來(lái)的網(wǎng)絡(luò)流量進(jìn)行刻畫,為此要進(jìn)行網(wǎng)絡(luò)流量的多步預(yù)測(cè)性能分析,本文進(jìn)行提前2步和4步預(yù)測(cè)實(shí)驗(yàn),結(jié)果如圖4(a)、(b)所示:
圖4 PHR-ELM的多步預(yù)測(cè)結(jié)果
對(duì)圖4(a)、(b)的預(yù)測(cè)結(jié)果進(jìn)行分析發(fā)現(xiàn),隨著預(yù)測(cè)步長(zhǎng)的增加,PHR-ELM的網(wǎng)絡(luò)流量預(yù)測(cè)誤差越來(lái)越大,但預(yù)測(cè)誤差仍然還是控制在實(shí)際要求的范圍內(nèi)。
2.5與當(dāng)前其它模型的性能比較
為了分析PHR-ELM的結(jié)果更具說(shuō)服力,選擇當(dāng)前預(yù)測(cè)性能較好的網(wǎng)絡(luò)流量預(yù)測(cè)模型進(jìn)行對(duì)照測(cè)試,具體為:極限學(xué)習(xí)機(jī)+沒(méi)有混沌分析(ELM)、PHR-BPNN、文獻(xiàn)[14]和文獻(xiàn)[15]模型,采用平均百分相對(duì)誤差(MAPE)進(jìn)行衡量,其定義如公式(14):
公式(14)中,n為測(cè)試樣本的數(shù)量。
PHR-ELM與對(duì)照模型預(yù)測(cè)結(jié)果的MAPE如表1所示:
表1 與其它網(wǎng)絡(luò)流量預(yù)測(cè)模型的誤差比較
對(duì)表1模型的MAPE進(jìn)行對(duì)比分析可以發(fā)現(xiàn),與其它模型相比,PHR-ELM有效降低了網(wǎng)絡(luò)流量的預(yù)測(cè)誤差,獲得了更高的預(yù)測(cè)精度,驗(yàn)證了PHR-ELM的優(yōu)勢(shì)。
網(wǎng)絡(luò)流量預(yù)測(cè)可以幫助網(wǎng)絡(luò)管理人員提前了解網(wǎng)絡(luò)流量的態(tài)勢(shì),有利于防止網(wǎng)絡(luò)阻塞,一直是學(xué)者們關(guān)注的焦點(diǎn),本文提出一種基于PHR-ELM的網(wǎng)絡(luò)流量組合預(yù)測(cè)模型,首先挖掘原始網(wǎng)絡(luò)流量數(shù)據(jù)的混沌特征,對(duì)數(shù)據(jù)進(jìn)行重建,然后采用極限學(xué)習(xí)機(jī)挖掘網(wǎng)絡(luò)流量的非線性變化特征,建立網(wǎng)絡(luò)流量預(yù)測(cè)模型。驗(yàn)證性實(shí)驗(yàn)結(jié)果表明:PHR-ELM可以獲得高精度的網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果,且相對(duì)于其它預(yù)測(cè)模型,具有比較明顯的優(yōu)勢(shì),可以為網(wǎng)絡(luò)管理員提供價(jià)值的信息。
[1] Nguyen T T, Armitage G. A survey of techniques for internet traffic classification using machine learning [J]. IEEE Communications Surveys and Tutorials, 2008,10(4): 56- 76.
[2] 姜明,吳春明,張曼,胡大民. 網(wǎng)絡(luò)流量預(yù)測(cè)中的時(shí)間序列模型比較研究[J]. 電子學(xué)報(bào), 2009, 37(11):2353-2358
[3] Callado A, Keu R J, Sadok D, et a1. Better network traffic identification through the independent combination of techniques [J]. Journal of Network and Computer Applications, 2010, 33(4):433-446.
[4] 董夢(mèng)麗,楊庚,曹曉梅. 網(wǎng)絡(luò)流量預(yù)測(cè)方法[J]. 計(jì)算機(jī)工程. 2011, 37(16):98-100
[5] 高波,張欽宇,梁永生,等. 基于EMD及ARMA的自相似網(wǎng)絡(luò)流量預(yù)測(cè)[J]. 通信學(xué)報(bào), 2011, 32(4): 47-56.
[6] Jin Yi, Zhou Gan. Theoretical mean-variance relationship of IP network traffic based on ON/OFF model [J]. Article Science in China Series F: Information Sciences, 2009,52(4): 645-655.
[7] 賴錦輝,梁松. 一種新的基于GCS-SVM的網(wǎng)絡(luò)流量預(yù)測(cè)模型[J]. 計(jì)算機(jī)工程與應(yīng)用, 2013, 49(21): 75-78.
[8] 趙振江. 基于PSO-BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測(cè)與研究[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2009, 26(1): 218-221.
[9] 姚奇富,李翠鳳,馬華林,張森. 灰色系統(tǒng)理論和馬爾柯夫鏈相結(jié)合的網(wǎng)絡(luò)流量預(yù)測(cè)方法[J]. 浙江大學(xué)學(xué)報(bào)(理學(xué)版), 2012, 34(4):396-400.
[10] 李明迅,孟相如,袁榮坤. 融合提升小波降噪和 LSSVM的網(wǎng)絡(luò)流量在線預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用, 2012,32(2):340-342,346.
[11] 魏永濤,汪晉寬,王翠榮,張琨. 基于小波變換與組合模型的網(wǎng)絡(luò)流量預(yù)測(cè)算法[J]. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版), 2011, 32(10):1382-139.
[12] 王雪松、梁昔明. 基于BPSO-RBF神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2014, 31(9):102-105
[13] 王雪松,趙躍龍. 遺傳算法優(yōu)化延遲時(shí)間和嵌入維的網(wǎng)絡(luò)流量預(yù)測(cè)[J], 計(jì)算機(jī)工程與應(yīng)用, 2014, 50(12):66-70
[14] 羅贅騫,夏靖波,王煥彬. 混沌-支持向量機(jī)回歸在流量預(yù)測(cè)中的應(yīng)用研究[J]. 計(jì)算機(jī)科學(xué), 2009, 36(7):244-246.
[15] 黨小超,郝占軍. 季節(jié)周期性Elman網(wǎng)絡(luò)的網(wǎng)絡(luò)流量分析與應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用, 2010, 46(28): 98-101.錦軍, 王執(zhí)銓. 一種基于混沌特性的網(wǎng)絡(luò)流量改進(jìn)預(yù)測(cè)算法. 兵工學(xué)報(bào), 2007, 28(11): 1346-1350.
Network Traffic Prediction by Using Combination Model
Wang Xuesong1, Li Suyang2
(1.Department of Electronic Information, FoShan Polytechnic College, FoShan 528137, China;2. Faculty of Electromechanics Engineering, Guangdong University of Technology, Guangzhou 510006, China)
Network traffic is the result of many factors, which is chaos and nonlinear. A combined prediction model of network traffic is proposed to predict the future trend of network traffic accurately by using combination model. C-C algorithm and Cao algorithm are separately used for chaotic analysis of original network traffic data to construct training set and test set, and then training samples are input into extreme learning machine to learn and establish prediction model, finally, test samples are input into the model to verify the performance by using single step and multi-step prediction experiments. The results show that PHR-ELM can reflect the network traffic chaos and nonlinear trend, predict the results of network traffic with high accuracy, and the prediction results are better than other models.
Network Traffic; Establish Model; Chaotic Characteristics Extreme Learning Machine; Phase Space Reconstruction
TP391
A
1007-757X(2016)06-0011-04
2015.12.02)
廣東工業(yè)大學(xué)校博士啟動(dòng)基金資助項(xiàng)目(405105015);佛山職業(yè)技術(shù)學(xué)院科研專項(xiàng)(KY2013G04).
王雪松(1974-),男,佛山職業(yè)技術(shù)學(xué)院,電子信息系,副教授,碩士,研究方向:神經(jīng)網(wǎng)絡(luò)、粒子群算法、物聯(lián)網(wǎng)應(yīng)用,佛山,528137
李蘇洋(1974-),女,廣東工業(yè)大學(xué),電機(jī)工程學(xué)院,講師,博士,研究方向:RFID研發(fā)、數(shù)值優(yōu)化設(shè)計(jì),廣州,510006