沈燁 李琳琳
摘?要:近年來,隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)傳輸業(yè)務(wù)也在不斷增加,網(wǎng)絡(luò)業(yè)務(wù)流量數(shù)據(jù)與日俱增。飛速增長的流量數(shù)據(jù)給網(wǎng)絡(luò)結(jié)構(gòu)和信息傳輸帶來深刻的影響,大量的網(wǎng)絡(luò)數(shù)據(jù)在有限的空間內(nèi)進(jìn)行傳輸,網(wǎng)絡(luò)擁塞現(xiàn)象難以避免,造成網(wǎng)絡(luò)傳輸時延增大、傳輸速率降低的后果。因此,為了更有效地進(jìn)行網(wǎng)絡(luò)管理,改善網(wǎng)絡(luò)傳輸性能,有效預(yù)測業(yè)務(wù)流量數(shù)據(jù)的變化趨勢,實(shí)行具體、全面的網(wǎng)絡(luò)管理是十分必要的。該文針對網(wǎng)絡(luò)流量表現(xiàn)出的自相似性和可預(yù)測性,提出了改進(jìn)PSO-BP算法,并建立其預(yù)測模型。結(jié)果顯示,在網(wǎng)絡(luò)流量預(yù)測領(lǐng)域內(nèi),與常規(guī)BP網(wǎng)絡(luò)流量預(yù)測算法相比,引入改進(jìn)PSO-BP算法的神經(jīng)網(wǎng)絡(luò)預(yù)測模型表現(xiàn)出更為優(yōu)異的性能。
關(guān)鍵詞:粒子群??神經(jīng)網(wǎng)絡(luò)??自相似??流量預(yù)測
中圖分類號:TN915.06?????文獻(xiàn)標(biāo)識碼:A
The?Realization?of?Traffic?Prediction?by?Improving?Particle?Swarm?Optimization?and?Optimizing?BP?Network
SHEN?Ye1??LI?Linlin2(1.Shenyang?Ligong?University,?Shenyang,?Liaoning?Province,?110159?China;?2.Shenyang?Open?University,?Shenyang,?Liaoning?Province,?110003?China)
Abstract:?In?recent?years,?with?the?continuous?development?of?network?technology,?network?transmission?services?are?also?increasing,?and?network?traffic?data?is?increasing?day?by?day.?The?traffic?data?of?rapid?growth?has?a?profound?impact?on?the?network?structure?and?information?transmission,?a?large?amount?of?network?data?is?transmitted?in?a?limited?space,?and?network?congestion?is?unavoidable,?resulting?in?the?consequence?of?the?increase?of?network?transmission?delay?and?the?decrease?of?transmission?rate.?Therefore,?in?order?to?manage?the?network?more?effectively,?improve?the?network?transmission?performance,?and?effectively?predict?the?change?trend?of?traffic?data,?it?is?necessary?to?implement?specific?and?comprehensive?network?management.?Aiming?at?the?self-similarity?and?predictability?of?network?traffic,?this?paper?proposes?an?improved?PSO-BP?algorithm?and?establishes?its?prediction?model.?Results?show?that?in?the?field?of?network?traffic?prediction,?compared?with?the?conventional?BP?network?traffic?prediction?algorithm,?the?neural?network?prediction?model?with?the?improved?PSO-BP?algorithm?shows?better?performance.
Key?Words:?Particle?swarm;?Neural?network;?Self-similarity;?Traffic?prediction
自相似理論最初在數(shù)學(xué)領(lǐng)域內(nèi)被發(fā)現(xiàn)[1],它體現(xiàn)了事物的本質(zhì)屬性,即事物的局部特征(如形態(tài)、結(jié)構(gòu)等)和其整體特征相似。1997年,Leland、Willnger和Wilson等人采集了不同以太網(wǎng)段上的大量的數(shù)據(jù)包,對其進(jìn)行深入研究后首次明確提出:網(wǎng)絡(luò)流量具有自相似性。此后有大量研究人員對此進(jìn)行了研究與探討,研究表明,任何業(yè)務(wù)流量都能檢測到自相似特性,無論何時何地,無論網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、業(yè)務(wù)類型和信源編碼方式如何變化。網(wǎng)絡(luò)流量具有突發(fā)性,而傳統(tǒng)線性模型在對流量突發(fā)性的處理上具有明顯不足[2],因此該文建立了一種引入改進(jìn)PSO-BP算法的神經(jīng)網(wǎng)絡(luò)預(yù)測模型,利用疊加ON/OFF信息源產(chǎn)生自相似流量,將流量數(shù)據(jù)保存下來作為樣本,將樣本數(shù)據(jù)劃分為訓(xùn)練集和測試集兩部分,并對其進(jìn)行訓(xùn)練學(xué)習(xí),最終得到流量預(yù)測結(jié)果。
1?自相似流量介紹
自相似這一概念最早由數(shù)學(xué)家Mandelbrot提出,他在研究水文問題時發(fā)現(xiàn)海岸線的局部和整體呈現(xiàn)出相似的形態(tài),也就是說海岸線在形態(tài)上是自相似的。因此,如果事物的局部和整體表現(xiàn)出相似的特性,就可以說它是自相似的。分形理論認(rèn)為,自相似是一種尺度變換下的不變性。事實(shí)上,大量事物都具有自相似性,網(wǎng)絡(luò)流量也不例外。
網(wǎng)絡(luò)流量的自相似過程呈現(xiàn)出長相關(guān)性(Long?Range?Dependence,LRD),長程相關(guān)性是自相似過程的重要性質(zhì)之一。正如自相似的概念起源于水文現(xiàn)象,許多自然現(xiàn)象也蘊(yùn)含著長相關(guān)性。分形理論的創(chuàng)始人B.?B.?Mandelbrot根據(jù)尼羅河水位的變化提出了約瑟夫效應(yīng),它說明了過程中的長期記憶性,網(wǎng)絡(luò)流量當(dāng)前時刻的流量數(shù)據(jù)和過去時刻的數(shù)據(jù)在數(shù)值上具有相關(guān)性,也就是說,如果過去時間的流量數(shù)據(jù)包數(shù)值較大,那么當(dāng)前時間的數(shù)據(jù)包也有很大概率是一個較大的值。
事實(shí)上,Web文件的大小在網(wǎng)絡(luò)傳輸中呈現(xiàn)出重尾分布,重尾分布通俗意義上可以闡述為少量個體占據(jù)大量資源。也就是說,Web文件大小在一個很大的范圍內(nèi),其中少量文件占據(jù)了大量空間。研究表明,大量具有重尾分布的相互獨(dú)立的信源相疊加產(chǎn)生的流量最終呈現(xiàn)出自相似性。Pareto分布是最簡單的重尾分布,因此該文采用具有Pareto分布的ON/OFF疊加源來建立自相似流量產(chǎn)生模型。
2?算法描述
經(jīng)典的BP神經(jīng)網(wǎng)絡(luò)通常為三層結(jié)構(gòu),包括正向、反向兩個傳播過程[3]。在這兩個計算過程中,根據(jù)鏈?zhǔn)椒▌t和損失函數(shù)不斷更新網(wǎng)絡(luò)各層的權(quán)值和閾值,以此形成網(wǎng)絡(luò)訓(xùn)練。
隱含層節(jié)點(diǎn)的輸出公式為
式(1),式(2)中,下標(biāo),下標(biāo)非線性傳遞函數(shù),為隱含層傳遞函數(shù),為輸出層傳遞函數(shù),為輸入神經(jīng)元個數(shù),為隱含層神經(jīng)元個數(shù),為輸出神經(jīng)元個數(shù),為輸入,為輸出,、分別為各層神經(jīng)元連接權(quán)值和閾值。
王榮等人[4],JI??F?C[5]研究者們考慮到BP神經(jīng)網(wǎng)絡(luò)初始值的選定這一問題,不恰當(dāng)?shù)娜≈禃鹁W(wǎng)絡(luò)收斂性能下降,從而導(dǎo)致流量預(yù)測結(jié)果不準(zhǔn)確,因此BP網(wǎng)絡(luò)的權(quán)值閾值需要通過粒子群算法來進(jìn)行改進(jìn),以解決該問題帶來的不良影響。由于傳統(tǒng)的粒子群算法優(yōu)化到后期迭代效率較低,所以采用動態(tài)調(diào)整學(xué)習(xí)因子這一策略來優(yōu)化PSO算法[6],以避免局部最優(yōu)。將學(xué)習(xí)因子設(shè)為,迭代次數(shù)設(shè)為,最大迭代次數(shù)設(shè)為,的取值范圍在之間,的取值范圍在之間,具體公式如下:
步驟1,得到樣本數(shù)據(jù)。將服從重尾分布的ON/OFF源疊加模型產(chǎn)生的自相似流量劃成兩個部分,分別為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。
步驟2,進(jìn)行BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)初始化設(shè)置,確定其輸入神經(jīng)元個數(shù)、輸出神經(jīng)元數(shù)、各層間的連接權(quán)值和閾值。
步驟3,建立粒子群與權(quán)值、閾值的對應(yīng)關(guān)系,進(jìn)行粒子群的初始化設(shè)置,包括初始速度和位置、學(xué)習(xí)因子等。
步驟4,計算適應(yīng)度函數(shù)值,適應(yīng)度函數(shù)為網(wǎng)絡(luò)訓(xùn)練所得到的誤差范數(shù),范數(shù)越小說明預(yù)測結(jié)果越準(zhǔn)確。
步驟5,更新粒子的移動速度,再通過速度更新位置,判斷是否滿足終止條件,若不符合則回到步驟4進(jìn)行下一輪循環(huán),若滿足,就進(jìn)行下一步。
步驟6,獲得粒子群最優(yōu)解,用其對BP網(wǎng)絡(luò)參數(shù)進(jìn)行賦值,并計算誤差,該文采用MAE作為評價指標(biāo)。
步驟7,若MAE符合預(yù)設(shè)條件則結(jié)束訓(xùn)練,反之回到步驟6。
3?仿真分析及結(jié)論
該文采用的自相似流量數(shù)據(jù)集由具有Parote分布的ON/OFF疊加信源在Matlab平臺仿真產(chǎn)生。流量產(chǎn)生模型參數(shù)設(shè)置為:處于活躍期的信源到達(dá)數(shù)服從泊松分布,為到達(dá)率,設(shè)為0.4;其持續(xù)發(fā)包時間服從Pareto分布,在Matlab中表述為:,其中,K為形狀參數(shù),設(shè)為0.1,為尺度參數(shù),設(shè)為1.2,為位置參數(shù),設(shè)為1;R=30,即每秒發(fā)送30個數(shù)據(jù)包。對仿真流量數(shù)據(jù)進(jìn)行分類,選取前350組數(shù)據(jù)作為訓(xùn)練樣本,每組訓(xùn)練數(shù)據(jù)需要當(dāng)前時刻之前的7個時刻的歷史流量數(shù)據(jù)來作為樣本數(shù)據(jù),以預(yù)測當(dāng)前時刻的流量數(shù)據(jù),因此輸入節(jié)點(diǎn)數(shù)為7,隱含層節(jié)點(diǎn)數(shù)15,輸出節(jié)點(diǎn)數(shù)為1,將剩下的100組數(shù)據(jù)包作為測試樣本。改進(jìn)粒子群算法參數(shù)設(shè)置為:種群數(shù)設(shè)為10,最大迭代次數(shù)設(shè)為10。訓(xùn)練次數(shù)設(shè)為1?000,允許誤差設(shè)為0.001。同時對傳統(tǒng)BP網(wǎng)絡(luò)進(jìn)行預(yù)測仿真,以便于和改進(jìn)粒子群算法優(yōu)化后的BP網(wǎng)絡(luò)預(yù)測仿真進(jìn)行對比,并不斷重復(fù)仿真對比實(shí)驗以得到普遍結(jié)果。
圖1為流量測試樣本期望值仿真結(jié)果圖,圖2為改進(jìn)PSO-BP算法優(yōu)化后的網(wǎng)絡(luò)預(yù)測流量值仿真結(jié)果圖。如圖1所示和如圖2所示,選取6個坐標(biāo)點(diǎn)進(jìn)行對比,在時間點(diǎn)分別為13?s、28?s、37?s、55?s、72?s、98?s,其對應(yīng)的數(shù)據(jù)包預(yù)測值分別為541、868.3、690.1、839.3、870.4、749.8,相對應(yīng)的實(shí)際流量值即期望值分別為540、870、690、840、870、750。該文的預(yù)設(shè)誤差為2,計算可得,該模型的絕對平均誤差MAE=1.217?9,比預(yù)設(shè)誤差要小。圖3為優(yōu)化后的BP網(wǎng)絡(luò)模型的預(yù)測值與期望值對比圖,從圖中可以看到該模型期望值與預(yù)測值曲線走向基本一致,誤差值在0周圍有微小浮動,可見仿真結(jié)果較好,預(yù)測精度較高。圖4為傳統(tǒng)BP網(wǎng)絡(luò)模型的預(yù)測值和期望值對比圖,從圖中可以看到預(yù)測值和期望值重合度不高,誤差上下波動較大,計算可得其絕對平均誤差MAE=44.047?4,預(yù)測結(jié)果不夠好。綜上所述,在自相似流量預(yù)測領(lǐng)域,改進(jìn)粒子群算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測精確度更高。
基于對網(wǎng)絡(luò)流量自相似特性的研究,該文針對傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)預(yù)測的不足,提出了改進(jìn)PSO-BP算法并建立其預(yù)測模型,并將兩者在Matlab平臺進(jìn)行了仿真對比分析。仿真結(jié)果表明,該預(yù)測模型能夠產(chǎn)生更為精準(zhǔn)的預(yù)測結(jié)果,為有效預(yù)測網(wǎng)絡(luò)流量的變化趨勢,提前掌握網(wǎng)絡(luò)運(yùn)行狀態(tài),實(shí)現(xiàn)全面有效的網(wǎng)絡(luò)管理和實(shí)時監(jiān)控帶來積極影響。
參考文獻(xiàn)
欒干.自相似流量隊列分析及其仿真工具設(shè)計[D].北京:北京郵電大學(xué),2020.
康夢軒,宋俊平,范鵬飛,等.基于深度學(xué)習(xí)的網(wǎng)絡(luò)流量預(yù)測研究綜述[J].計算機(jī)工程與應(yīng)用,2021,57(10):1-9.
ZHANG?Z?G,YIN?J?C,WANG?N?N,et?al.Vessel?Traffic?Flow?Analysis?and?Prediction?by?an?Improved?PSO-BP?Mechanism?Based?on?AIS?Data[J].Evolving?Systems,2019,10(3):397-407.?.
王榮,白尚旺,黨偉超,等.粒子群退火算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J].計算機(jī)系統(tǒng)應(yīng)用,2020,29(1):244-249.[5]?JI?F?C.Application?of?Particle?Swarm?Optimization?and?Improved?PSO-BP?Algorithm?in?Computer?Forecasting?Model[C]//Journal?of?Physics:Conference?Series.IOP?Publishing,2021,2033(1):012099.