• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于趨勢(shì)擬合法、平滑法和ARIMA 模型的流量預(yù)測(cè)

      2023-08-11 14:54:30馬政達(dá)中國(guó)聯(lián)通研究院北京100048
      郵電設(shè)計(jì)技術(shù) 2023年7期
      關(guān)鍵詞:誤差率時(shí)序預(yù)測(cè)值

      馬政達(dá)(中國(guó)聯(lián)通研究院,北京 100048)

      1 研究背景

      隨著寬帶用戶(hù)網(wǎng)絡(luò)需求的快速增長(zhǎng)和固網(wǎng)數(shù)據(jù)的大幅提升,運(yùn)營(yíng)商越來(lái)越重視寬帶用戶(hù)的使用體驗(yàn),并投入更多的精力用于固網(wǎng)寬帶網(wǎng)絡(luò)設(shè)備的擴(kuò)容和維護(hù)[1?2],科學(xué)規(guī)劃網(wǎng)絡(luò)容量已成為運(yùn)營(yíng)商發(fā)展的重要議題。網(wǎng)絡(luò)流量指標(biāo)是評(píng)價(jià)網(wǎng)絡(luò)管理質(zhì)量的重要參數(shù),對(duì)流量的預(yù)測(cè)是指依據(jù)設(shè)備歷史數(shù)據(jù)對(duì)未來(lái)一段時(shí)間的流量進(jìn)行建模與估計(jì),相較于流量達(dá)到告警閾值后再升級(jí)設(shè)備,流量預(yù)測(cè)可以幫助網(wǎng)絡(luò)管理員掌握網(wǎng)絡(luò)變化的規(guī)律,更合理地安排預(yù)算、設(shè)備升級(jí)和割接計(jì)劃,也極大地改善了用戶(hù)上網(wǎng)體驗(yàn)。此外,隨著運(yùn)營(yíng)商算力的提升,流量預(yù)測(cè)甚至可以應(yīng)用到用戶(hù)級(jí)別,為提供個(gè)性化服務(wù)做支撐,因此流量預(yù)測(cè)一直是網(wǎng)絡(luò)研究領(lǐng)域的重要研究方向[3?5]。

      通常當(dāng)OLT 上聯(lián)口的寬帶利用率峰值到達(dá)70%時(shí)就需要開(kāi)始考慮流量擴(kuò)容[6],同時(shí)用戶(hù)的下行網(wǎng)絡(luò)流量往往要高于上行網(wǎng)絡(luò)流量,因此對(duì)OLT 上聯(lián)口的下行流量速率峰值進(jìn)行時(shí)間序列的分析、預(yù)測(cè)具有重要意義,是OLT擴(kuò)容的主要技術(shù)指標(biāo)。

      寬帶設(shè)備的流量速率是網(wǎng)管系統(tǒng)記錄的主要數(shù)據(jù)之一,OLT 下行流量速率峰值數(shù)據(jù)可以看做是一組時(shí)間序列,對(duì)于時(shí)間序列的分析主要包括模型識(shí)別、模型擬合、模型診斷3個(gè)步驟[7]。

      在模型識(shí)別階段需要根據(jù)時(shí)間序列的時(shí)序圖特征和統(tǒng)計(jì)量特征選擇合適的模型。時(shí)間序列的統(tǒng)計(jì)學(xué)模型有很多,包括趨勢(shì)擬合法、平滑法及ARIMA 等模型。運(yùn)營(yíng)商積累了大量流量數(shù)據(jù),但對(duì)這類(lèi)數(shù)據(jù)的處理往往比較粗獷,經(jīng)常使用到的流量預(yù)測(cè)方法有線(xiàn)性擬合法和移動(dòng)平均法,這些方法操作簡(jiǎn)單,模型直觀,但也存在擬合度低、預(yù)測(cè)效果差的缺點(diǎn)[8]。相比而言,Holt?Winters 模型和ARIMA 模型增加了更復(fù)雜的模型維度和參數(shù)類(lèi)別,可以更充分地?cái)M合復(fù)雜的流量趨勢(shì)及短期的隨機(jī)趨勢(shì)。

      2 建模及預(yù)測(cè)

      選取一臺(tái)典型的OLT 的上聯(lián)口,將其周末的下行速率峰值數(shù)據(jù)(以下簡(jiǎn)稱(chēng)流量數(shù)據(jù))作為研究對(duì)象,時(shí)間跨度為2018年9月到2019年5月,共33周。將前30周數(shù)據(jù)作為訓(xùn)練集,后3 周數(shù)據(jù)作為測(cè)試集。圖1 所示為流量數(shù)據(jù)訓(xùn)練集的時(shí)序圖、自相關(guān)系數(shù)圖(ACF)和偏自相關(guān)系數(shù)圖(PACF)。

      圖1 流量數(shù)據(jù)訓(xùn)練集的時(shí)序圖和相關(guān)性分析

      2.1 趨勢(shì)擬合法

      趨勢(shì)擬合法就是將時(shí)間作為自變量,對(duì)應(yīng)的流量觀察值作為因變量,建立序列值隨時(shí)間變化的回歸模型的方法。依據(jù)觀察值的時(shí)序圖,如果時(shí)序圖中序列表現(xiàn)出線(xiàn)性的長(zhǎng)期趨勢(shì),可以考慮使用線(xiàn)性擬合;如果長(zhǎng)期趨勢(shì)呈現(xiàn)出非線(xiàn)性特征,則可以嘗試使用曲線(xiàn)擬合[9]。

      從圖1的流量時(shí)序圖中可以看出流量趨勢(shì)平穩(wěn)上升,呈現(xiàn)出線(xiàn)性趨勢(shì),因此進(jìn)行線(xiàn)性擬合,結(jié)果如圖2所示。

      圖2 線(xiàn)性擬合模型

      該線(xiàn)性擬合模型可以表示為:

      依據(jù)式(1),可以計(jì)算出未來(lái)3期線(xiàn)性擬合模型的預(yù)測(cè)值,如表1所示。

      表1 線(xiàn)性擬合模型的3期預(yù)測(cè)值與誤差率

      2.2 平滑法

      平滑法通過(guò)對(duì)過(guò)去數(shù)據(jù)的加權(quán)平均處理,減少短期波動(dòng)對(duì)序列的影響,盡可能地展示數(shù)據(jù)的直觀趨勢(shì)。

      移動(dòng)平均法是最常見(jiàn)的數(shù)據(jù)統(tǒng)計(jì)分析方法之一,通過(guò)計(jì)算過(guò)去n期數(shù)據(jù)的平均值作為預(yù)測(cè)值,其表達(dá)式為:

      圖3所示為4期平均移動(dòng)法的流量擬合。

      圖3 移動(dòng)平均擬合模型

      依據(jù)式(2),可以計(jì)算出未來(lái)3期移動(dòng)平均模型的流量預(yù)測(cè)值和預(yù)測(cè)誤差率,如表2所示。

      表2 移動(dòng)平均模型的3期預(yù)測(cè)值與誤差率

      移動(dòng)平均法簡(jiǎn)單直觀,以前n期數(shù)據(jù)的平均值作為最后一期的預(yù)測(cè)值,往期數(shù)據(jù)的權(quán)重都是1/n,即在移動(dòng)平均法中,n期的每一條數(shù)據(jù)對(duì)預(yù)測(cè)值的影響是相同的。但在實(shí)際流量分析中,不同時(shí)間的數(shù)據(jù)對(duì)當(dāng)前流量大小的影響是不同的(一般時(shí)間越近,影響越大),為了更好地反映這種情況,需要調(diào)整往期數(shù)據(jù)的權(quán)重。美國(guó)統(tǒng)計(jì)學(xué)家Holt 在簡(jiǎn)單指數(shù)平滑法的基礎(chǔ)上,添加了對(duì)長(zhǎng)期趨勢(shì)擬合,提出了Holt 兩參數(shù)指數(shù)平滑模型,該模型適用于含有遞增趨勢(shì)的序列,Holt兩參數(shù)指數(shù)平滑模型的平滑公式為:

      式中:

      θt——序列每階遞增量

      α,β——2個(gè)平滑系數(shù)

      該模型后經(jīng)Winters 改進(jìn),形成了Holt?Winters 三參數(shù)指數(shù)平滑模型,該模型除了可以擬合長(zhǎng)期趨勢(shì),還可以擬合周期性變化。

      考慮到圖1 流量時(shí)序圖中僅包含遞增趨勢(shì),為其建立Holt 兩參數(shù)指數(shù)平滑模型并進(jìn)行3 期數(shù)據(jù)預(yù)測(cè),結(jié)果如圖4所示。

      圖4 Holt兩參數(shù)指數(shù)平滑擬合模型

      圖4 中黑色實(shí)線(xiàn)是流量觀測(cè)值,藍(lán)色虛線(xiàn)是模型擬合值,藍(lán)色點(diǎn)為預(yù)測(cè)值,淺色陰影為95%的預(yù)測(cè)值置信區(qū)間,深色陰影為80%的預(yù)測(cè)值置信區(qū)間。預(yù)測(cè)值和預(yù)測(cè)誤差率如表3所示。

      表3 Holt兩參數(shù)指數(shù)平滑模型的3期預(yù)測(cè)值和預(yù)測(cè)誤差率

      2.3 ARIMA模型

      ARIMA(Autoregressive Integrated Moving Average Model)模型全稱(chēng)為差分自回歸移動(dòng)平均模型,由美國(guó)統(tǒng)計(jì)學(xué)家Box 和英國(guó)統(tǒng)計(jì)學(xué)家Jenkins 提出[11],是在ARMA模型的基礎(chǔ)上增加了差分運(yùn)算的時(shí)間序列分析模型。ARMA模型對(duì)平穩(wěn)序列的分析技術(shù)已經(jīng)非常成熟,如果一個(gè)序列可以通過(guò)差分使之變?yōu)槠椒€(wěn),那么使用ARIMA 模型對(duì)該序列的分析也將是可靠、易行的[12?15]。ARMA 模型是AR 模型和MA 模型的有機(jī)組合,具有如下結(jié)構(gòu)的模型稱(chēng)為ARMA(p,q)模型:

      式中:

      φp、θq——AR部分和MA部分的待估參數(shù)

      εt——零均值、方差記為的白噪聲

      如果一個(gè)序列{X(t),t∈T}可以通過(guò)d次差分得到一個(gè)平穩(wěn)的過(guò)程,且該過(guò)程服從ARMA(p,q)模型,則稱(chēng){X(t),t∈T}是ARIMA(p,d,q)過(guò)程[16]。

      圖1 的流量時(shí)序圖中有明顯的遞增趨勢(shì),且ACF圖中自相關(guān)系數(shù)衰減較慢,在16階延遲附近又落在了2 倍標(biāo)準(zhǔn)差的參考線(xiàn)之外,顯著不為0,因此可以認(rèn)為該流量數(shù)據(jù)為非平穩(wěn)時(shí)間序列??紤]到時(shí)序圖中的遞增趨勢(shì),嘗試使用差分運(yùn)算將其轉(zhuǎn)化為平穩(wěn)時(shí)間序列。

      對(duì)流量數(shù)據(jù)進(jìn)行一階差分運(yùn)算,做出其時(shí)序圖、自相關(guān)系數(shù)圖、偏自相關(guān)系數(shù)圖(見(jiàn)圖5)。

      圖5 一階差分序列的時(shí)序圖和相關(guān)性分析圖

      從圖5可以看出,該差分?jǐn)?shù)列時(shí)序圖的均值穩(wěn)定、波動(dòng)范圍有限且無(wú)明顯趨勢(shì)或周期,自相關(guān)系數(shù)迅速衰減到0 附近,該差分序列可能為平穩(wěn)時(shí)間序列。進(jìn)一步使用ADF 檢驗(yàn)對(duì)該序列的平穩(wěn)性進(jìn)行統(tǒng)計(jì)檢驗(yàn),檢驗(yàn)結(jié)果如表4所示。

      表4 一階差分序列的ADF檢驗(yàn)

      從表4可以看出,3種類(lèi)型的p值均明顯小于0.05,因此拒絕原假設(shè),該序列為平穩(wěn)時(shí)間序列。

      在平穩(wěn)時(shí)間序列中,若某一時(shí)刻的狀態(tài)對(duì)下一時(shí)刻沒(méi)有相關(guān)性,則意味著該序列未來(lái)的數(shù)據(jù)無(wú)法通過(guò)現(xiàn)在及過(guò)去的狀態(tài)進(jìn)行推斷,對(duì)這樣的流量數(shù)據(jù)進(jìn)行預(yù)測(cè)是沒(méi)有價(jià)值的。因此要進(jìn)行純隨機(jī)性檢驗(yàn),判斷該流量數(shù)據(jù)是否有預(yù)測(cè)價(jià)值。

      在圖5 中,一階差分序列的ACF 圖中,1、3、4 階自相關(guān)系數(shù)明顯不為零,初步判斷該序列不是純隨機(jī)序列,進(jìn)一步考察該序列的LB統(tǒng)計(jì)量,結(jié)果如表5所示。

      表5 一階差分序列的純隨機(jī)性檢驗(yàn)

      從表5 可以看出,一階差分序列延遲6 階、12 階的LB統(tǒng)計(jì)量的p值均明顯小于0.05,所以拒絕原假設(shè),該一階差分序列不是純隨機(jī)序列,可以用來(lái)做預(yù)測(cè)分析。

      通過(guò)上面的分析可知,原流量數(shù)據(jù)經(jīng)過(guò)一階差分運(yùn)算后是一個(gè)平穩(wěn)的非純隨機(jī)性序列,這樣就可以為差分序列構(gòu)建ARMA 模型。在圖5的ACF圖中可以看出一階差分序列的自相關(guān)系數(shù)呈現(xiàn)逐漸衰減的趨勢(shì),符合拖尾特征;PACF 圖中,只有一階和三階偏自相關(guān)系數(shù)落在了2 倍標(biāo)準(zhǔn)差范圍外,剩下的系數(shù)趨向于0,可認(rèn)為是一階、三階截尾或拖尾。嘗試選擇MA(1)、MA(3)、ARMA(1,1)、ARMA(4,1)模型擬合該差分序列。模型的選取應(yīng)遵從從簡(jiǎn)原則,在能充分表示序列的前提下所含參數(shù)個(gè)數(shù)應(yīng)該最少[16],因此對(duì)4 個(gè)ARMA 模型進(jìn)行最小信息量檢測(cè),檢測(cè)結(jié)果如表6 所示。

      表6 ARMA模型參數(shù)評(píng)估

      從表6 可以看出,無(wú)論是AIC 還是BIC,MA(1)模型都是最優(yōu)選擇,結(jié)合該序列為流量數(shù)據(jù)通過(guò)一階差分得到,因此使用帶漂移項(xiàng)的ARIMA(0,1,1)模型來(lái)擬合原流量數(shù)據(jù)。為考察ARIMA(0,1,1)的有效性,對(duì)其進(jìn)行顯著性檢驗(yàn),即對(duì)殘差序列的檢驗(yàn),結(jié)果如圖6所示。

      圖6 殘差序的標(biāo)準(zhǔn)化殘差圖、ACF和純隨機(jī)性檢驗(yàn)圖

      從圖6 可以看出,殘差序列的各階白噪聲檢驗(yàn)統(tǒng)計(jì)量的p值均大于0.05,原假設(shè)成立,殘差序列是白噪聲,即該擬合模型顯著成立,因此為流量數(shù)據(jù)建立ARIMA(0,1,1)模型,并進(jìn)行3 期流量預(yù)測(cè),圖7 為擬合模型的預(yù)測(cè)效果,表7列出了預(yù)測(cè)值和預(yù)測(cè)誤差率。

      表7 ARIMA(0,1,1)模型的3期預(yù)測(cè)值、置信區(qū)間與誤差率

      圖7 ARIMA(0,1,1)擬合模型的預(yù)測(cè)效果

      圖7 中黑色實(shí)線(xiàn)是流量觀測(cè)值,藍(lán)色虛線(xiàn)是模型擬合值,藍(lán)色點(diǎn)為預(yù)測(cè)值,淺色陰影為95%的預(yù)測(cè)值置信區(qū)間,深色陰影為80%的預(yù)測(cè)值置信區(qū)間。

      2.4 模型預(yù)測(cè)結(jié)果比較

      文章針對(duì)OLT 流量構(gòu)建了線(xiàn)性擬合、平均移動(dòng)、Holt兩參數(shù)指數(shù)平滑和ARIMA(0,1,1)4 種模型,為評(píng)估各模型的預(yù)測(cè)性能,采用平均絕對(duì)百分比誤差(MAPE)作為評(píng)價(jià)指標(biāo),4種模型的平均絕對(duì)百分誤差(MAPE)如表8 所示。從表8 可以看出,ARIMA(0,1,1)和Holt 兩參數(shù)指數(shù)平滑模型的預(yù)測(cè)平均誤差率為2.06%、2.68%,誤差相對(duì)都比較小,預(yù)測(cè)效果表現(xiàn)較好;而線(xiàn)性擬合和平均移動(dòng)模型的預(yù)測(cè)誤差分別為4.43%、4.01%,誤差較大,不適合用來(lái)對(duì)精度有較高要求的流量進(jìn)行預(yù)測(cè)。

      表8 4種模型的平均絕對(duì)百分誤差(MAPE)

      3 預(yù)測(cè)評(píng)價(jià)

      網(wǎng)絡(luò)流量信息具有很大的隨機(jī)性,前一日的流量大小理論上不能影響到當(dāng)日的流量,對(duì)流量預(yù)測(cè)的本質(zhì)是對(duì)用戶(hù)上網(wǎng)習(xí)慣的推斷,個(gè)人行為具有很大的隨機(jī)性,群體行為表現(xiàn)出的規(guī)律性更大,因此越是靠近北向的端口,對(duì)流量進(jìn)行的統(tǒng)計(jì)學(xué)分析的意義越大,這也是文章對(duì)OLT 上聯(lián)口分析的原因。對(duì)應(yīng)地,越是南向的設(shè)備,流量表現(xiàn)出的隨機(jī)性越強(qiáng),此時(shí)篩選出有意義的數(shù)據(jù)比逐個(gè)預(yù)測(cè)更有價(jià)值。

      本文使用到趨勢(shì)擬合法和平滑法對(duì)流量數(shù)據(jù)進(jìn)行建模預(yù)測(cè),這些方法具有原理簡(jiǎn)單、操作簡(jiǎn)便、易于解釋等優(yōu)點(diǎn),在提取明顯的、確定的信息時(shí)有一定優(yōu)勢(shì),缺點(diǎn)是相關(guān)性信息在加權(quán)平均中丟失,隨機(jī)性信息浪費(fèi)嚴(yán)重,這可能是本文在流量預(yù)測(cè)時(shí)ARIMA 模型略?xún)?yōu)于Holt模型的原因,使用ARIMA 模型在處理平穩(wěn)序列、差分平穩(wěn)序列時(shí)可以更加充分地體現(xiàn)流量中的短期相關(guān)關(guān)系。

      4 展望

      本文以周數(shù)據(jù)進(jìn)行數(shù)據(jù)建模與網(wǎng)絡(luò)流量預(yù)測(cè),預(yù)測(cè)獲得了不錯(cuò)的效果。伴隨著運(yùn)營(yíng)商算力的提升,未來(lái)若能夠拿到海量的流量數(shù)據(jù),則可以考慮使用LSTM 等機(jī)器學(xué)習(xí)來(lái)擬合更加復(fù)雜的模型。但并不是所有預(yù)測(cè)問(wèn)題都適合使用機(jī)器學(xué)習(xí),在多變量的非線(xiàn)性時(shí)間序列預(yù)測(cè)時(shí),特別是在大樣本的情況下機(jī)器學(xué)習(xí)會(huì)獲得更好的表現(xiàn),針對(duì)平穩(wěn)或差分平穩(wěn)時(shí)間序列,在樣本較少的情況下,使用ARIMA 等統(tǒng)計(jì)建模法更具優(yōu)勢(shì)[17?20]。

      流量數(shù)據(jù)會(huì)受到多種因素影響,在后續(xù)的研究中應(yīng)該考慮將現(xiàn)有模型與其他預(yù)測(cè)模型進(jìn)行組合,構(gòu)建多因素的組合模型,以緩解模型預(yù)測(cè)的滯后問(wèn)題,提高預(yù)測(cè)靈敏度和準(zhǔn)確性[21?24]。

      猜你喜歡
      誤差率時(shí)序預(yù)測(cè)值
      IMF上調(diào)今年全球經(jīng)濟(jì)增長(zhǎng)預(yù)期
      企業(yè)界(2024年8期)2024-07-05 10:59:04
      基于時(shí)序Sentinel-2數(shù)據(jù)的馬鈴薯遙感識(shí)別研究
      加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預(yù)測(cè)值
      基于Sentinel-2時(shí)序NDVI的麥冬識(shí)別研究
      ±800kV直流輸電工程合成電場(chǎng)夏季實(shí)測(cè)值與預(yù)測(cè)值比對(duì)分析
      法電再次修訂2020年核發(fā)電量預(yù)測(cè)值
      生化檢驗(yàn)全程中質(zhì)量控制管理方式及應(yīng)用意義
      健康大視野(2020年1期)2020-03-02 11:33:53
      降低評(píng)吸人員單料煙感官評(píng)分誤差率探討
      無(wú)線(xiàn)傳感器網(wǎng)絡(luò)定位算法在環(huán)境監(jiān)測(cè)中的應(yīng)用研究
      一種毫米波放大器時(shí)序直流電源的設(shè)計(jì)
      電子制作(2016年15期)2017-01-15 13:39:08
      揭东县| 尉氏县| 芜湖县| 永济市| 东兰县| 浦城县| 皋兰县| 綦江县| 施秉县| 门头沟区| 含山县| 新兴县| 香港 | 庐江县| 无棣县| 长宁区| 武义县| 怀来县| 土默特右旗| 铜鼓县| 津南区| 水城县| 项城市| 怀来县| 明溪县| 合作市| 无为县| 辽源市| 海口市| 泽普县| 肥城市| 教育| 武乡县| 南乐县| 中西区| 邮箱| 勐海县| 洛扎县| 台南市| 安国市| 桓仁|