• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于FARIMA的鐵路數(shù)據(jù)網(wǎng)流量趨勢預(yù)測

      2019-03-14 07:56:46張治鵬
      鐵道學(xué)報(bào) 2019年2期
      關(guān)鍵詞:數(shù)據(jù)網(wǎng)置信區(qū)間差分

      孫 強(qiáng),周 洋,張治鵬

      (北京交通大學(xué)電子信息工程學(xué)院,北京 100044)

      近年來隨著中國高速鐵路的快速發(fā)展,鐵路通信業(yè)務(wù)的多樣化程度迅速提升,其對(duì)通信網(wǎng)絡(luò)的信息化要求日益增高。作為鐵路通信MIS系統(tǒng)的基礎(chǔ),鐵路數(shù)據(jù)網(wǎng)承載的業(yè)務(wù)應(yīng)用越來越多,其重要性提升的同時(shí),復(fù)雜程度也逐漸增加。準(zhǔn)確了解當(dāng)前及未來網(wǎng)絡(luò)的負(fù)載情況,對(duì)于網(wǎng)絡(luò)運(yùn)營、網(wǎng)絡(luò)規(guī)劃具有重要意義,能夠避免由于局部資源緊張而帶來的網(wǎng)絡(luò)擁塞[1],實(shí)現(xiàn)未來網(wǎng)絡(luò)動(dòng)態(tài)帶寬管理以及智能化調(diào)度平臺(tái)。當(dāng)前鐵路數(shù)據(jù)網(wǎng)還處于簡單粗略的監(jiān)控階段,因此對(duì)網(wǎng)絡(luò)流量進(jìn)行合理高效的建模分析,預(yù)測網(wǎng)絡(luò)流量趨勢迫在眉睫。針對(duì)網(wǎng)絡(luò)流量建模預(yù)測,科研人員提出了很多優(yōu)秀的模型和算法[2],例如自回歸滑動(dòng)平均模型ARMA(Auto-Regressive and Moving Average Model),但ARMA模型不能表示長相關(guān)性。因此,本文結(jié)合鐵路網(wǎng)絡(luò)特性以及周期性,提出基于分形自回歸綜合滑動(dòng)平均FARIMA(Fractional Autoregressive Integrated Moving Average)模型的鐵路數(shù)據(jù)網(wǎng)流量預(yù)測方法,能夠準(zhǔn)確預(yù)測鐵路數(shù)據(jù)網(wǎng)流量趨勢,優(yōu)化網(wǎng)絡(luò)性能[3-4],幫助網(wǎng)絡(luò)及時(shí)進(jìn)行擴(kuò)容。

      1 FARIMA模型原理

      流量建模分析的基礎(chǔ)和參考依據(jù)主要來源于網(wǎng)絡(luò)中流量的特性,其中最重要的兩個(gè)特性分別是流量數(shù)據(jù)自相關(guān)性和流量數(shù)據(jù)長相關(guān)性。同時(shí)數(shù)據(jù)周期性也是流量建模時(shí)可以參考的特性之一[5-6]。FARIMA模型是一個(gè)自相似模型,能夠同時(shí)捕獲流量數(shù)據(jù)的長相關(guān)特性LRD(Long-Range Dependence)和短相關(guān)特性SRD(Short-Range Dependence)。對(duì)于任意時(shí)序序列{Z(n),n∈Z+},其FARIMA(p,d,q)模型可表示為[7]

      φ(B)dZ(n)=θ(B)e(n)

      ( 1 )

      式中:e(n)為均值為0、方差為σ2的白噪聲序列;d=H-0.5,為模型的差分因子,可以反映序列的長相關(guān)特性,H為赫斯特(Hurst)指數(shù);d為分形差分算子,其公式為

      ( 2 )

      φ(B)和θ(B)為穩(wěn)定的多項(xiàng)式。

      φ(B)=1-φ1B-φ2B2-…-φpBp

      ( 3 )

      θ(B)=1-θ1B-θ2B2-…-θqBq

      ( 4 )

      式中:φ(B)為自回歸項(xiàng)AR(Auto Regressive);θ(B)為滑動(dòng)平均項(xiàng)MA(Moving Average);p為自回歸階次;q為滑動(dòng)平均階次。

      ARMA(p,q)模型可表示為φ(B)Z(n)=θ(B)e(n),F(xiàn)ARIMA模型的不同在于d。對(duì)任意的時(shí)序序列Y(n)=dZ(n),可以把Y(n)當(dāng)成是一個(gè)保留了短相關(guān)特性的新過程,符合ARMA(p,q)的定義,通過ARMA(p,q)對(duì)新過程選擇合適的階數(shù)和參數(shù),便可得出FARIMA的參數(shù)。

      2 基于FARIMA模型的預(yù)測方法設(shè)計(jì)

      FARIMA模型預(yù)測可以分為模型建立過程和算法預(yù)測過程。模型建立過程中最為重要的問題是FARIMA模型中參數(shù)d,p,q的選擇。而FARIMA過程可以分為差分過程以及ARMA過程。整個(gè)趨勢預(yù)測過程如下:

      步驟1檢驗(yàn)流量數(shù)據(jù)是否平滑,如果不平滑進(jìn)行數(shù)據(jù)聚合處理。

      步驟2對(duì)流量序列進(jìn)行零均值化處理,使其轉(zhuǎn)換為均值為0的數(shù)據(jù)序列。

      步驟3計(jì)算序列的Hurst指數(shù),并進(jìn)行d階分?jǐn)?shù)差分處理,消除序列的長相關(guān)性,使其符合ARMA建模過程。

      步驟4進(jìn)行ARMA模式識(shí)別,對(duì)模型進(jìn)行定階定量。

      步驟5通過判斷ARMA過程擬合殘差是否為白噪聲。

      步驟6通過多個(gè)模型對(duì)給定的序列進(jìn)行擬合,從中選擇最優(yōu)的擬合模型。

      步驟7預(yù)測ARMA過程序列的趨勢數(shù)據(jù)。

      步驟8對(duì)ARMA預(yù)測的數(shù)據(jù)進(jìn)行d階分?jǐn)?shù)差分得到FARIMA模型預(yù)測值。

      2.1 Hurst指數(shù)估計(jì)

      ( 5 )

      R/S統(tǒng)計(jì)量可表示為

      ( 6 )

      若隨機(jī)過程具有長相關(guān)特性,則

      ( 7 )

      式中:C為常數(shù)。尋找一條滿足最小均方差準(zhǔn)則的直線,該直線斜率即為Hurst指數(shù)的值H。通過d=H-0.5得到d值。經(jīng)過d階差分,便可將數(shù)據(jù)的長相關(guān)轉(zhuǎn)化為短相關(guān)過程Y(n),可用ARMA模型對(duì)其進(jìn)行擬合,Y(n)具體表達(dá)式為

      ( 8 )

      ( 9 )

      根據(jù)遞推關(guān)系可以得出

      (10)

      2.2 ARMA過程模型定階

      根據(jù)樣本自相關(guān)函數(shù)ACF(Auto-Correlation Function)和偏自相關(guān)函數(shù)PACF(Partial Auto-Correlation Function)表現(xiàn)出來的性質(zhì)來選擇適當(dāng)?shù)哪P蚚9],模式確定原則見表1。

      表1 ARMA模型定階方法

      (11)

      2.3 參量估計(jì)

      (12)

      本文根據(jù)Kalman算法進(jìn)行ARMA多步預(yù)測[12],驗(yàn)證模型的平穩(wěn)特性。當(dāng)序列ACF和PACF處于95%置信區(qū)間時(shí),可證明殘差序列為隨機(jī)序列。在建立的多個(gè)模型中,選擇擬合程度最好的模型,本文使用AIC信息準(zhǔn)則來選擇最優(yōu)模型,AIC計(jì)算公式[13]如式(13)所示。ARMA模型預(yù)測得到的結(jié)果,經(jīng)過反d階差分可得到FARIMA預(yù)測值。

      (13)

      3 實(shí)驗(yàn)結(jié)果與分析

      本文選取鐵路數(shù)據(jù)骨干網(wǎng)6個(gè)月的鏈路入口實(shí)際流量作為建模數(shù)據(jù)基礎(chǔ),預(yù)測接下來2個(gè)月的流量趨勢,并與真實(shí)的數(shù)據(jù)進(jìn)行對(duì)比。對(duì)基礎(chǔ)數(shù)據(jù)做聚合處理生成平滑的以天為時(shí)間軸的序列。同時(shí)根據(jù)鐵路數(shù)據(jù)承載網(wǎng)絡(luò)的實(shí)際特性,其具有一定的周期性,因此對(duì)原始數(shù)據(jù)進(jìn)行差分,差分周期選擇為7,并對(duì)其進(jìn)行零均值化處理(即每一個(gè)樣本值都減去所有樣本值的平均值),處理后的流量數(shù)據(jù)如圖1所示。

      圖1 預(yù)處理后的流量波形

      通過MATLAB平臺(tái)進(jìn)行R/S估計(jì),如圖2(a)所示,得出H為0.687,根據(jù)d=H-0.5,進(jìn)而能得到差分階數(shù)為0.187,對(duì)數(shù)據(jù)進(jìn)行分?jǐn)?shù)差分,再次檢驗(yàn)差分后Hurst值H,如圖2(b)所示,得出差分后的H為0.515,基本去除了流量數(shù)據(jù)的長相關(guān)性。

      (a)差分前 (b)差分后圖2 數(shù)據(jù)集差分前后R/S統(tǒng)計(jì)量

      根據(jù)周期特性,本文選取21階自相關(guān)函數(shù)值和偏自相關(guān)函數(shù)值進(jìn)行輔助定階,計(jì)算結(jié)果如圖3所示。

      由圖3可知,左側(cè)ACF取值在4,5階(最底部為1階)落入置信區(qū)間,6階處超出置信區(qū)間,之后取值均處于置信區(qū)間內(nèi),同時(shí)取值出現(xiàn)拖尾,基于前文分析,q值可以取6(若忽略6階超出置信區(qū)間的情況,q值也可以選擇3)。右側(cè)PACF取值在4,5階落入置信區(qū)間,同樣在6階處超出,但之后取值均落在置信區(qū)間內(nèi),因此p值可以取6。本文基于統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案SPSS(Statistical Product and Service Solutions)仿真得到ARMA(3,6)和ARMA(6,6)參數(shù),見表2,表3。

      (a)ACF (b)PACF

      圖3 21階ACF和PACF

      表2 ARMA(3,6)參數(shù)選擇

      表3 ARMA(6,6)參數(shù)選擇

      表2、表3中,顯著性檢驗(yàn)值數(shù)值越大表明參數(shù)對(duì)因變量的影響越大,由表中數(shù)據(jù)可知,ARMA(3,6)相對(duì)于ARMA(6,6)的擬合程度更好。其擬合曲線如圖4所示,且ARMA(3,6)的AIC值更低。因此,本文選用ARMA(3,6)模型。

      (a)ARMA(3,6) (b)ARMA(6,6)圖4 ARMA(3,6)和ARMA(6,6)擬合對(duì)比

      根據(jù)上述得出的ARMA模型以及d參數(shù),可以得出FARIMA模型關(guān)系如下

      0.187z′(t)=0.653z′(t-1)-0.183z′(t-2)+

      0.176z′(t-3)+e(t)-0.398e(t-1)+

      0.156e(t-2)+0.09e(t-3)-0.047e(t-4)-

      0.189e(t-5)-0.312e(t-6)

      (14)

      (a)FARIMA (b)ARMA圖5 FARIMA模型與ARMA模型結(jié)果

      為了驗(yàn)證模型的準(zhǔn)確度,本文通過計(jì)算FARIMA模型和ARMA模型的平均絕對(duì)誤差MAE、均方根誤差RMSE、歸一化均方誤差NMSE、絕對(duì)百分比誤差MAPE和信噪比SNR5項(xiàng)參數(shù),對(duì)兩種模型擬合結(jié)果進(jìn)行對(duì)比,其結(jié)果見表4。其中MAE,RMSE,NMSE,MAPE值越低證明擬合程度越好,SNR值越高越好,可見FARIMA模型各項(xiàng)參數(shù)均優(yōu)于ARMA模型。

      表4 FARIMA與ARMA評(píng)估

      4 結(jié)束語

      本文提出的基于FARIMA鐵路數(shù)據(jù)網(wǎng)流量趨勢預(yù)測方法以FARIMA模型為基礎(chǔ),并對(duì)流量序列模型構(gòu)建和參量選擇等原理進(jìn)行詳細(xì)分析,通過選取實(shí)際流量數(shù)據(jù)集搭建數(shù)據(jù)建模平臺(tái),驗(yàn)證方法的可行性,并根據(jù)多項(xiàng)技術(shù)指標(biāo)進(jìn)行擬合效果檢驗(yàn)。實(shí)驗(yàn)結(jié)果表明,使用該方法能夠準(zhǔn)確預(yù)測網(wǎng)絡(luò)流量趨勢,預(yù)測平均絕對(duì)誤差達(dá)到6.27、平均絕對(duì)誤差率達(dá)到0.091,比傳統(tǒng)的基于ARMA模型的預(yù)測方法擬合精準(zhǔn)度更高。但隨著預(yù)測步長的增加,擬合殘差會(huì)越來越大。因此,在進(jìn)行大步長預(yù)測的前提下可增加數(shù)據(jù)集的數(shù)量。

      猜你喜歡
      數(shù)據(jù)網(wǎng)置信區(qū)間差分
      定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
      p-范分布中參數(shù)的置信區(qū)間
      數(shù)列與差分
      多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
      鐵路信號(hào)安全數(shù)據(jù)網(wǎng)安全分析
      列車定位中置信區(qū)間的確定方法
      全新網(wǎng)優(yōu)解決方案-亨通大數(shù)據(jù)網(wǎng)優(yōu)平臺(tái)
      全新網(wǎng)優(yōu)解決方案-亨通大數(shù)據(jù)網(wǎng)優(yōu)平臺(tái)
      鐵路信號(hào)系統(tǒng)安全數(shù)據(jù)網(wǎng)口令攻擊技術(shù)初探
      基于差分隱私的大數(shù)據(jù)隱私保護(hù)
      兰溪市| 遂川县| 乌鲁木齐县| 若羌县| 清水河县| 东乌珠穆沁旗| 遵义市| 恭城| 昌黎县| 西林县| 合肥市| 华安县| 龙泉市| 林甸县| 射阳县| 溧水县| 万荣县| 修水县| 太和县| 铁岭市| 安陆市| 双牌县| 乳源| 南充市| 龙山县| 山东| 门头沟区| 读书| 呼图壁县| 邵东县| 临武县| 高唐县| 辽中县| 宁海县| 永仁县| 乐清市| 崇仁县| 潼关县| 内丘县| 资中县| 高邮市|