陳 晶
(江蘇城鄉(xiāng)建設(shè)職業(yè)學(xué)院 江蘇常州 213147)
隨著無線通技術(shù)的不斷發(fā)展和成熟,無線網(wǎng)絡(luò)得到了長足發(fā)展,并在許多領(lǐng)域得到了成功的應(yīng)用。相對于有線網(wǎng)絡(luò),無線網(wǎng)絡(luò)具有一定的優(yōu)點(diǎn),如可以隨時(shí)隨地進(jìn)行上網(wǎng),但是無線網(wǎng)絡(luò)由于在一個(gè)開放的環(huán)境中工作,受多種因素的影響,導(dǎo)致無線網(wǎng)絡(luò)流量具有比較強(qiáng)的復(fù)雜時(shí)變、非線性、強(qiáng)耦合等屬性,為提升無線網(wǎng)絡(luò)流量預(yù)測精度,需設(shè)計(jì)合理的無線網(wǎng)絡(luò)流量計(jì)算方法,因此無線網(wǎng)絡(luò)流量預(yù)測與建模成為當(dāng)前一個(gè)研究熱點(diǎn)[1-3]。
針對無線網(wǎng)絡(luò)流量預(yù)測與建模問題,許多學(xué)者進(jìn)行了深入的研究,當(dāng)前存在許多無線網(wǎng)絡(luò)流量預(yù)測與建模方法[4-5],最常見的為線性無線網(wǎng)絡(luò)流量預(yù)測與建模方法,該方法缺陷比較明顯,無線網(wǎng)絡(luò)流量預(yù)測誤差比較大;而基于神經(jīng)網(wǎng)絡(luò)的無線網(wǎng)絡(luò)流量預(yù)測與建模方法,無線網(wǎng)絡(luò)流量預(yù)測與建模效果要優(yōu)于線性方法,但是同樣存在一定的缺陷,如對噪聲敏感等[6];極限學(xué)習(xí)算法屬于一種前饋神經(jīng)網(wǎng)絡(luò),可解決經(jīng)典神經(jīng)網(wǎng)絡(luò)存在的效率低問題,具備較快的訓(xùn)練速度以及較優(yōu)的泛化性能,且該方法的預(yù)測精度較高。
為了精準(zhǔn)預(yù)測無線網(wǎng)絡(luò)流量,文章設(shè)計(jì)了基于大數(shù)據(jù)驅(qū)動(dòng)的無線網(wǎng)絡(luò)流量預(yù)測方法。采集無線網(wǎng)絡(luò)流量,基于混沌理論重構(gòu)無線網(wǎng)絡(luò)流量數(shù)據(jù),利用粒子群算法對ELM內(nèi)的權(quán)值與閾值進(jìn)行優(yōu)化,建立無線網(wǎng)絡(luò)流量預(yù)測模型,提升極限學(xué)習(xí)算法的無線網(wǎng)絡(luò)流量預(yù)測精度。經(jīng)試驗(yàn)驗(yàn)證可知,文章方法預(yù)測無線網(wǎng)絡(luò)流量時(shí)的AIC值呈上升趨勢,MCC值呈下降趨勢,但最高AIC值并未超過設(shè)定的閾值,表明無線網(wǎng)絡(luò)流量預(yù)測精度較高。
采集無線網(wǎng)絡(luò)流量數(shù)據(jù)時(shí),因?yàn)樵紵o線網(wǎng)絡(luò)流量數(shù)據(jù)受到多種因素影響,具有一定的非線性,直接進(jìn)行建模與預(yù)測,無法獲得高精度無線網(wǎng)絡(luò)流量預(yù)測結(jié)果,所以利用混沌理論對無線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu),濾除無線網(wǎng)絡(luò)流量數(shù)據(jù)的無線性變化因素,為后續(xù)無線網(wǎng)絡(luò)流量預(yù)測提供更為精準(zhǔn)的學(xué)習(xí)樣本。設(shè)采集無線網(wǎng)絡(luò)流量數(shù)據(jù)是x,x的第i個(gè)混沌時(shí)間序列是{x(i),i=1,2,…,N},其中,x的混沌時(shí)間序列數(shù)量是N。根據(jù)Takens定理獲取無線網(wǎng)絡(luò)流量數(shù)據(jù)的重構(gòu)公式,即:
[x(t),x(t+θ),…x(t+(m-1)θ)]
(1)
(2)
式(2)中,在I(θ)達(dá)到首個(gè)極小值點(diǎn)情況下,對應(yīng)θ的便是最佳延遲時(shí)間。
若m過小,則混沌吸引子僅會(huì)形成部分投影,不能全面展開,此時(shí)無線網(wǎng)絡(luò)流量數(shù)據(jù)樣本點(diǎn)x和x的投影點(diǎn)間產(chǎn)生的點(diǎn),叫作偽最鄰近點(diǎn)。通過偽最鄰近點(diǎn)比例,確定無線網(wǎng)絡(luò)流量數(shù)據(jù)重構(gòu)時(shí)的嵌入維數(shù)m。具體步驟如下:
(3)
(2)偽最鄰近點(diǎn)的確定規(guī)則,公式如下:
(4)
式(4)中,嵌入維數(shù)是m與m+1時(shí),無線網(wǎng)絡(luò)流量數(shù)據(jù)樣本點(diǎn)的偽最鄰近點(diǎn)比例是Hm(i,j)、Hm+1(i,j);門限值是H′。
(3)不斷提升m,即令m=m+1,當(dāng)偽最鄰近點(diǎn)比例降至最低情況下,對應(yīng)m的便是最佳嵌入維數(shù)。
圖1 ELM的結(jié)構(gòu)拓?fù)鋱D
(5)
式(5)中,O2內(nèi)第j′個(gè)神經(jīng)元閾值是bj′;激活函數(shù)是φ(·)。
(6)
(7)
(8)
其中,R的Moore-Penrose廣義逆矩陣是R+。
為提升極限學(xué)習(xí)算法的無線網(wǎng)絡(luò)流量預(yù)測精度,利用粒子群算法對ELM內(nèi)的w權(quán)值與閾值b進(jìn)行改進(jìn)及優(yōu)化。大數(shù)據(jù)驅(qū)動(dòng)無線網(wǎng)絡(luò)流量預(yù)測模型總體結(jié)構(gòu)如圖3所示。
圖2 大數(shù)據(jù)驅(qū)動(dòng)無線網(wǎng)絡(luò)流量預(yù)測模型總體結(jié)構(gòu)
粒子群算法內(nèi)的每個(gè)粒子均代表一組極限學(xué)習(xí)算法的w與b,第a個(gè)粒子的初始速度與位置是va、za。va與za的更新公式如下:
(9)
za(s+1)=za(s)+va(s+1)
(10)
(11)
利用粒子群算法優(yōu)化ELM內(nèi)的w權(quán)值與閾值b的具體步驟如下:
(2)依據(jù)訓(xùn)練樣本確定ELM網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。
(3)初始化粒子群算法的參數(shù),種群內(nèi)各粒子均代表一組w與b,以ELM訓(xùn)練的均方根誤差為適應(yīng)度值F,公式如下:
(12)
(4)在ELM內(nèi)輸入無線網(wǎng)絡(luò)流量數(shù)據(jù)訓(xùn)練樣本,按照ELM輸出的無線網(wǎng)絡(luò)流量預(yù)測結(jié)果,計(jì)算各粒子的F值。
(6)利用式(11)修正粒子權(quán)重。
(9)判斷是否達(dá)到smax,若達(dá)到smax,則繼續(xù)步驟(10),反之,返回步驟(7)。
(10)輸出最佳的w與b,代入式(5),獲取最佳無線網(wǎng)絡(luò)流量預(yù)測結(jié)果。
(1)對無線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行采集。
(2)采用如下形式對無線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行處理
(13)
式中,x表示原始無線網(wǎng)絡(luò)流量數(shù)據(jù),xmin和xmax分別為無線網(wǎng)絡(luò)流量數(shù)據(jù)的最小和最大值。
(3)采用混沌理論對無線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu),得到無線網(wǎng)絡(luò)流量預(yù)測的訓(xùn)練和測試樣本集合。
(4)根據(jù)無線網(wǎng)絡(luò)流量數(shù)據(jù)設(shè)計(jì)極限學(xué)習(xí)機(jī)的結(jié)構(gòu),并確定相關(guān)參數(shù)初始值。
(4)根據(jù)無線網(wǎng)絡(luò)流量定訓(xùn)練樣本,極限學(xué)習(xí)進(jìn)行自適應(yīng)學(xué)習(xí),并通過粒子算法搜索最優(yōu)閾值和權(quán)值。
(5)根據(jù)最優(yōu)閾值和權(quán)值構(gòu)建無線網(wǎng)絡(luò)流量預(yù)測模型。
(6)通過測試樣本集合驗(yàn)證構(gòu)建的無線網(wǎng)絡(luò)流量預(yù)測模型性能。
由以上可知,大數(shù)據(jù)驅(qū)動(dòng)的無線網(wǎng)絡(luò)非線性流量預(yù)測流程如圖3所示。
圖3 大數(shù)據(jù)驅(qū)動(dòng)的無線網(wǎng)絡(luò)流量預(yù)測流程
為了測試大數(shù)據(jù)驅(qū)動(dòng)的無線網(wǎng)絡(luò)流量預(yù)測模型有性能,從一個(gè)無線網(wǎng)絡(luò)網(wǎng)絡(luò)系統(tǒng)的服務(wù)器中采用每小時(shí)的無線網(wǎng)絡(luò)流量數(shù)據(jù),其采集到5000個(gè)無線網(wǎng)絡(luò)流量數(shù)據(jù),具體如圖4所示。
圖4 采集的無線網(wǎng)絡(luò)流量數(shù)據(jù)
從圖4可知,無線網(wǎng)絡(luò)流量數(shù)據(jù)存在較為嚴(yán)重的隨機(jī)性變化情況,為此需要對其進(jìn)行相應(yīng)的預(yù)處理操作。
利用文章方法對采集的無線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu),無線網(wǎng)絡(luò)流量數(shù)據(jù)重構(gòu)前,需先確定延遲時(shí)間與嵌入維數(shù),提升無線網(wǎng)絡(luò)流量數(shù)據(jù)重構(gòu)精度,延遲時(shí)間與嵌入維數(shù)確定結(jié)果如圖5所示。
(a)延遲時(shí)間確定結(jié)果
分析圖5(a)可知,當(dāng)延遲時(shí)間為3時(shí),互信息值首次出現(xiàn)最小值,即將3作為最佳的延遲時(shí)間;分析圖5(b)可知,隨著嵌入維數(shù)的提升,偽最鄰近點(diǎn)比例隨之下降,當(dāng)嵌入維數(shù)為6維時(shí),偽最鄰近點(diǎn)比例不再發(fā)生改變,說明6維是最佳的嵌入維數(shù)。延遲時(shí)間與嵌入維數(shù)分別選擇3與6維。
采用傳統(tǒng)極限學(xué)習(xí)的無線網(wǎng)絡(luò)流量預(yù)測方法,沒有重構(gòu)數(shù)據(jù)的粒子群優(yōu)化極限學(xué)習(xí)機(jī)的無線網(wǎng)絡(luò)流量預(yù)測方法進(jìn)行對比實(shí)驗(yàn),進(jìn)行5次實(shí)驗(yàn),每一次實(shí)驗(yàn)隨機(jī)選擇50%作為訓(xùn)練樣本,其它作為測試樣本,無線網(wǎng)絡(luò)流量平均預(yù)測精度如圖6所示。
圖6 三種方法的無線網(wǎng)絡(luò)流量預(yù)測結(jié)果
分析圖6可知,三種方法均可有效預(yù)測無線網(wǎng)絡(luò)流量值,其中文章方法的無線網(wǎng)絡(luò)流量預(yù)測結(jié)果與實(shí)際值非常接近,且變化趨勢基本相同;其余兩種方法的無線網(wǎng)絡(luò)流量預(yù)測結(jié)果與實(shí)際值存在較大差距,且變化趨勢也不相同。實(shí)驗(yàn)證明:文章方法可精準(zhǔn)預(yù)測無線網(wǎng)絡(luò)流量,更好地描述無線網(wǎng)絡(luò)流量變化情況。
利用赤池信息準(zhǔn)則(akashi information criterion,AIC)與馬修斯系數(shù)(matthews correlation coefficient,MCC),衡量文章方法無線網(wǎng)絡(luò)流量預(yù)測的抗干擾效果,AIC代表無線網(wǎng)絡(luò)流量預(yù)測結(jié)果與實(shí)際無線網(wǎng)絡(luò)流量間的差距,其值越小,無線網(wǎng)絡(luò)流量預(yù)測誤差越低,AIC的閾值是65,AIC的取值區(qū)間是[50,100];MCC代表無線網(wǎng)絡(luò)流量預(yù)測結(jié)果與實(shí)際無線網(wǎng)絡(luò)流量間的相關(guān)系數(shù),其值越接近1,說明無線網(wǎng)絡(luò)流量預(yù)測精度越高,MCC的取值區(qū)間是[-1,1]。在不同噪聲比例時(shí),分析文章方法無線網(wǎng)絡(luò)流量預(yù)測結(jié)果的AIC與MCC值,分析結(jié)果如表1所示。分析表1可知,隨著噪聲比例提升,文章方法預(yù)測無線網(wǎng)絡(luò)流量時(shí)的AIC值呈上升趨勢,MCC值呈下降趨勢,但最高AIC值并未超過設(shè)定的閾值,說明文章方法預(yù)測無線網(wǎng)絡(luò)流量時(shí)的AIC值較低,即無線網(wǎng)絡(luò)流量預(yù)測誤差較小;在不同噪聲比例時(shí),文章方法預(yù)測無線網(wǎng)絡(luò)流量時(shí)的MCC值均與1較為接近,最低MCC值為0.96,說明文章方法預(yù)測無線網(wǎng)絡(luò)流量時(shí)的MCC值較高,即無線網(wǎng)絡(luò)流量預(yù)測精度較高,表明文章方法的抗干擾能力強(qiáng)。
表1 文章方法的AIC與MCC值分析結(jié)果
無線網(wǎng)絡(luò)系統(tǒng)在工作過程,受到許多因素的干擾和影響,無線網(wǎng)絡(luò)流量具有一定的混沌性和隨機(jī)性,影響無線網(wǎng)絡(luò)流量預(yù)測精度。為此,設(shè)計(jì)基于大數(shù)據(jù)驅(qū)動(dòng)無線網(wǎng)絡(luò)流量預(yù)測方法,通過改進(jìn)極限學(xué)習(xí)算法,建立無線網(wǎng)絡(luò)流量預(yù)測模型,引入粒子群算法優(yōu)化極限學(xué)習(xí)算法的連接權(quán)值和閾值,解決極限學(xué)習(xí)算法參數(shù)優(yōu)化問題,在該模型內(nèi)輸入無線網(wǎng)絡(luò)流量數(shù)據(jù),輸出無線網(wǎng)絡(luò)流量預(yù)測結(jié)果。實(shí)驗(yàn)結(jié)果表明:文章方法可精準(zhǔn)預(yù)測無線網(wǎng)絡(luò)流量。經(jīng)實(shí)驗(yàn)驗(yàn)證,文章方法對無線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu)后,可有效去除外界因素對無線網(wǎng)絡(luò)流量建模影響,無線網(wǎng)絡(luò)流量預(yù)測結(jié)果與實(shí)際無線網(wǎng)絡(luò)流量非常接近,且變化趨勢基本相同,而且在噪聲干擾環(huán)境下,文章方法仍然可以獲得較高精度的無線網(wǎng)絡(luò)流量預(yù)測結(jié)果。
九江學(xué)院學(xué)報(bào)(自然科學(xué)版)2023年1期