鄂曉晨 劉立士
摘 ?要:網(wǎng)絡(luò)流量預(yù)測(cè)對(duì)于設(shè)計(jì)新一代網(wǎng)絡(luò)協(xié)議、實(shí)現(xiàn)網(wǎng)絡(luò)規(guī)劃和流量管理以及提升網(wǎng)絡(luò)的高質(zhì)量服務(wù)具有重大意義。該文研究了網(wǎng)絡(luò)流量的自相似特性,并在此基礎(chǔ)上采用FARIMA時(shí)間序列模型進(jìn)行流量預(yù)測(cè)。首先對(duì)網(wǎng)絡(luò)流量進(jìn)行平穩(wěn)化預(yù)處理,其次估算Hurst系數(shù)來確定差分次數(shù),最后通過AIC準(zhǔn)則確定該型階數(shù)并進(jìn)行預(yù)測(cè)。比較結(jié)果表明,雖然FARIMA模型相對(duì)于傳統(tǒng)的ARMA模型建模和計(jì)算復(fù)雜度較高,但是可以對(duì)非平穩(wěn)數(shù)據(jù)預(yù)測(cè)且受流量突發(fā)性影響較小,預(yù)測(cè)精準(zhǔn)度較高。
關(guān)鍵詞:自相似性 ?流量預(yù)測(cè) ?ARMA模型 ?FARIMA模型
中圖分類號(hào):TP393 ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-3791(2021)04(c)-0062-04
Research on Time Series Model of Self Similar Traffic
E Xiaochen ? LIU Lishi*
(Shenyang Ligong University, Shenyang, Liaoning Province, 110159 ?China)
Abstract: Network traffic prediction is of great significance for the design of new generation network protocol, the realization of network planning and traffic management,and the improvement of network quality service. In this paper, the self similarity of network traffic is studied, and on this basis, FARIMA time series model is used for traffic prediction. Firstly, the network traffic is smoothed. Secondly, the Hurst coefficient is estimated to determine the difference times. Finally, the AIC criterion is used to determine the order of this type and predict it. The comparison results show that although FARIMA model has higher modeling and computational complexity than traditional ARMA model, it can predict non-stationary data with less impact of traffic burst and higher prediction accuracy.
Key Words: Self-similarity; Traffic prediction; ARMA model; FARIMA model
隨著網(wǎng)絡(luò)業(yè)務(wù)量的增長(zhǎng)和互聯(lián)網(wǎng)環(huán)境的日益復(fù)雜,網(wǎng)絡(luò)擁塞現(xiàn)象也在不斷發(fā)生。網(wǎng)絡(luò)擁塞可能會(huì)導(dǎo)致網(wǎng)絡(luò)的性能降低、網(wǎng)絡(luò)中間節(jié)點(diǎn)丟棄大量的數(shù)據(jù)包等問題。網(wǎng)絡(luò)流量是網(wǎng)絡(luò)規(guī)劃的重要指標(biāo),反映了網(wǎng)絡(luò)的運(yùn)行狀態(tài),為了保證信息傳輸?shù)挠行院途珳?zhǔn)性,必須采用適宜的手段對(duì)網(wǎng)絡(luò)流量進(jìn)行監(jiān)控。通過研究發(fā)現(xiàn),網(wǎng)絡(luò)流量也呈現(xiàn)出自相似性[1]以及可預(yù)測(cè)性,因此可以通過選擇合適的預(yù)測(cè)模型實(shí)現(xiàn)對(duì)自相似網(wǎng)絡(luò)流量的預(yù)測(cè),并根據(jù)預(yù)測(cè)得到的數(shù)據(jù)流量提前進(jìn)行網(wǎng)絡(luò)規(guī)劃和流量管理,如果將預(yù)測(cè)結(jié)果引入到其他網(wǎng)絡(luò)管理機(jī)制,將會(huì)極大地提高網(wǎng)絡(luò)性能和服務(wù)質(zhì)量。
1 ?自相似流量特性與預(yù)測(cè)模型
在實(shí)際測(cè)量研究中發(fā)現(xiàn),現(xiàn)實(shí)中的網(wǎng)絡(luò)流量普遍具有自相似性(或長(zhǎng)相關(guān)性)。網(wǎng)絡(luò)流量的自相似性實(shí)際上就是局部特征和整體相似。長(zhǎng)相關(guān)特性的問題可以同時(shí)存在于多個(gè)網(wǎng)絡(luò)時(shí)間點(diǎn)的范圍內(nèi),并且對(duì)于整個(gè)網(wǎng)絡(luò)的時(shí)延、丟包率以及網(wǎng)絡(luò)吞吐量都有很大程度的影響。為了更好地滿足網(wǎng)絡(luò)流量的長(zhǎng)相關(guān)特征(Long range dependence,LRD),于是通過增加計(jì)算Hurst系數(shù)和差分過程,得到基于分形自回歸差分滑動(dòng)平均模型(Fractional Auto-regressive Integrated Moving Average,F(xiàn)ARIMA)[2]。雖然提高了復(fù)雜度和運(yùn)算量,但也極大地提高了精準(zhǔn)度。該文采用基于FARIMA時(shí)序模型的自相似流量預(yù)測(cè)方法,通過改進(jìn)使其能夠準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)流量趨勢(shì)。
2 ?FARIMA時(shí)序模型原理和預(yù)測(cè)
2.1 原理
FARIMA(p,d,q)即分形自回歸差分滑動(dòng)平均過程,該模型可以能夠同時(shí)描述自相似網(wǎng)絡(luò)流量的短相關(guān)結(jié)構(gòu)和長(zhǎng)相關(guān)特性,但在實(shí)際應(yīng)用過程中會(huì)受到一定的限制。FARIMA可以用式(1)來表示,其中d是分?jǐn)?shù)差分階數(shù),p是自回歸項(xiàng)數(shù),且是p階自回歸(AR)多項(xiàng)式,q是滑動(dòng)平均項(xiàng)數(shù),且是q階滑動(dòng)平均(MA)多項(xiàng)式。其中d,。
(1)
設(shè)定為差分算子,分?jǐn)?shù)差分算子為?d,可用式(2)表示。
(2)
FARIMA模型是基于ARMA預(yù)測(cè),并進(jìn)行相關(guān)參數(shù)的判定,唯一的區(qū)別就是FARIMA模型存在分?jǐn)?shù)差分過程。因此,分形自回歸差分滑動(dòng)平均過程在滿足p,q不同時(shí)為零的前提下,可以看作是一個(gè)基于ARMA(p,q)預(yù)測(cè)上增加了d階分?jǐn)?shù)差分FARIMA(0,d,0)的過程。
2.2 預(yù)測(cè)過程
(1)對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,因?yàn)閷?shí)際情況下的時(shí)間序列不一定完全是平穩(wěn)的,如果序列非平穩(wěn),則需要進(jìn)行相應(yīng)的平穩(wěn)化處理,并通過ADF和KPSS單位根檢驗(yàn)[3]來判斷平穩(wěn)性。該文采用ON/OFF源模型模擬產(chǎn)生自相似流量,數(shù)據(jù)具有隨機(jī)性,因此選擇添加一個(gè)周期性函數(shù)來平滑其隨機(jī)性。
(2)計(jì)算Hurst系數(shù),并進(jìn)行d階分?jǐn)?shù)差分。通過R/S分析法求得Hurst系數(shù)[4],即計(jì)算不同時(shí)刻的極差R(n)和標(biāo)準(zhǔn)差S(n),并求出R(n)和S(n)的比值。R/S與Hurst的關(guān)系如式(3)所示。
loglog(3)
在對(duì)數(shù)坐標(biāo)下進(jìn)行擬合并用最小二乘法來近似估算曲線斜率,即為近似估算的Hurst系數(shù)值,且d=h-0.5,即可求出FARIMA模型分?jǐn)?shù)差分系數(shù)。
(3)基于ARMA模型的項(xiàng)數(shù)定階,可通過ACF和PACF來確定p,q項(xiàng)數(shù),但會(huì)存在系數(shù)過大計(jì)算復(fù)雜的問題,所以該文采用AIC(赤池信息準(zhǔn)則)和BIC(貝葉斯信息準(zhǔn)則)自動(dòng)懲罰判決獲得p、q項(xiàng)數(shù)。其中參數(shù)k為模型設(shè)定參量的數(shù)量,參數(shù)n為樣本總體數(shù)量,參數(shù)L為極大似然函數(shù)。
AIC(4)
BIC(5)
在測(cè)試模型過程中,針對(duì)可能出現(xiàn)的過擬合問題,兩種信息準(zhǔn)則都增加與參量相關(guān)的懲罰判決項(xiàng),并有效防止因樣本總體數(shù)量過大和模型高精度判決而導(dǎo)致的模型過于復(fù)雜的問題。
(4)判斷殘差檢驗(yàn)是否為一段白噪聲信號(hào),確保有用的信號(hào)都已經(jīng)提取到ARMA模型中,也可以通過Durbin-Watson針對(duì)時(shí)間序列數(shù)據(jù)檢驗(yàn)回歸分析中統(tǒng)計(jì)量殘差的一階自相關(guān)性,該統(tǒng)計(jì)量值越接近2越好,一般在(1,3)之間說明沒問題。
(5)通過ARMA模型對(duì)差分濾波后的數(shù)據(jù)進(jìn)行預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行差分還原處理得到預(yù)處理后的流量序列,并去掉預(yù)處理時(shí)添加的周期函數(shù)來獲得通過基于FARIMA模型實(shí)際預(yù)測(cè)流量。通過和原始流量對(duì)比分析,對(duì)FARIMA模型預(yù)測(cè)效果進(jìn)行評(píng)估[5-7]。
3 ?仿真結(jié)果與分析
該文基于ON/OFF源模型模擬產(chǎn)生自相似流量,并使用Matlab軟件進(jìn)行仿真,參數(shù)設(shè)置如下:信源到達(dá)過程服從泊松分布(λ=0.5),信源時(shí)間間隔服從指數(shù)分布(μ=2),持續(xù)時(shí)間服從帕累托分布gprnd(0.01,1.5,1),傳輸速率R=30(packet/s)。仿真結(jié)果:圖2、圖3為傳統(tǒng)ARMA模型預(yù)測(cè)效果對(duì)比圖,圖4、圖5為FARIMA模型預(yù)測(cè)效果對(duì)比圖。
圖2、圖3中隨機(jī)抽取了6個(gè)點(diǎn)作為數(shù)據(jù)對(duì)比依據(jù),在時(shí)間軸坐標(biāo)為10 s、46 s、87 s、92 s、142 s、152 s時(shí),產(chǎn)生的自相似流量數(shù)據(jù)包個(gè)數(shù)為240、180、240、180、180、270,經(jīng)過ARMA預(yù)測(cè)過得數(shù)據(jù)包個(gè)數(shù)約為246、185、246、185、185、275,相對(duì)誤差百分比為2.5%、3.3%、2.5%、3.3%、3.3%、2.5%。
圖4、圖5中隨機(jī)抽取了6個(gè)點(diǎn)作為數(shù)據(jù)對(duì)比依據(jù),在時(shí)間軸坐標(biāo)為128 s、410 s、722 s、1 091 s、1 174 s、1 608 s時(shí),產(chǎn)生的自相似流量數(shù)據(jù)包個(gè)數(shù)為600、240、300、420、300、450,而經(jīng)過FARIMA預(yù)測(cè)過得數(shù)據(jù)包個(gè)數(shù)約為603、243、303、423、303、453,其相對(duì)誤差百分比為0.5%、1.25%、1%、0.71%、1%、0.67%。
選擇使用MAE、MAPE、RMSE、NMSE這4種誤差指標(biāo)對(duì)預(yù)測(cè)效果評(píng)估。傳統(tǒng)ARMA模型和FARIMA模型預(yù)測(cè)結(jié)果誤差率見表1。
通過上述指標(biāo)來量化誤差,ARMA模型和FARIMA模型的MAE分別為3.275和1.417,均小于預(yù)設(shè)值4,且MAPE和NMSE都遠(yuǎn)小于1,接近于0,誤差較小,因此ARMA和FARIMA均可以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè),并通過誤差分析FARIMA預(yù)測(cè)模型各項(xiàng)數(shù)據(jù)均優(yōu)于傳統(tǒng)的ARMA模型,因此有相對(duì)更高的精確度。
4 ?結(jié)語(yǔ)
該文基于ON/OFF模型產(chǎn)生自相似網(wǎng)絡(luò)流量,并選擇FARIMA時(shí)序模型對(duì)網(wǎng)絡(luò)流量進(jìn)行預(yù)測(cè),通過多次改進(jìn)驗(yàn)證以及多項(xiàng)量化指標(biāo)論證,雖然FARIMA模型建模以及分?jǐn)?shù)差分計(jì)算過程較為復(fù)雜,但能反映流量的長(zhǎng)相關(guān)特性,并相對(duì)于傳統(tǒng)的ARMA模型預(yù)測(cè)具有相對(duì)更高的精準(zhǔn)度。下一步的研究重點(diǎn)是針對(duì)FARIMA模型更準(zhǔn)確計(jì)算Hurst系數(shù)值,以及優(yōu)化分?jǐn)?shù)差分過程來消除流量的長(zhǎng)相關(guān)性,更為準(zhǔn)確地預(yù)測(cè)網(wǎng)絡(luò)流量趨勢(shì)。
參考文獻(xiàn)
[1] 王曉婷,王憶文,李平.一種自相似網(wǎng)絡(luò)流量生成器的設(shè)計(jì)與實(shí)現(xiàn)[J].微電子學(xué)與計(jì)算機(jī),2016,33(8):54-58.
[2] 史明虎.基于FARIMA模型的自相似業(yè)務(wù)流量預(yù)測(cè)[D].西安電子科技大學(xué),2013.
[3] 翟靜,曹俊.基于時(shí)間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型[J].統(tǒng)計(jì)與決策,2016(4):29-32.
[4] 付鈺,劉立士,胡俊超,等.一種基于Matlab仿真模擬估計(jì)Hurst參數(shù)的方法[J].科技資訊,2017,15(23):241-242.
[5] 邱艷,張洪.一種有效的網(wǎng)絡(luò)流量預(yù)測(cè)算法[j].成都大學(xué)學(xué)報(bào):自然科學(xué)版,2016,35(2):150-152.
[6] 孫強(qiáng),周洋,張治鵬.基于FARIMA的鐵路數(shù)據(jù)網(wǎng)流量趨勢(shì)預(yù)測(cè)[J].鐵道學(xué)報(bào),2019,41(2):84-88.
[7] 耿傳鑫.基于自相似流量預(yù)測(cè)的AOS擁塞控制技術(shù)研究[D].沈陽(yáng)理工大學(xué),2019.
①作者簡(jiǎn)介:鄂曉晨(1997—),男,碩士,研究方向?yàn)楝F(xiàn)代通信技術(shù)與系統(tǒng)。
通信作者:劉立士(1973—),男,碩士,副教授,研究方向?yàn)闊o線通信,E-mail:liulishi2005@sina.com。