曾雨桐,錢(qián)學(xué)榮
(南京郵電大學(xué) 通信與信息工程學(xué)院, 江蘇 南京 210003)
基于支持向量機(jī)的多因素話務(wù)量預(yù)測(cè)研究
曾雨桐,錢(qián)學(xué)榮
(南京郵電大學(xué) 通信與信息工程學(xué)院, 江蘇 南京 210003)
提高移動(dòng)通信話務(wù)量的預(yù)測(cè)精度對(duì)提高網(wǎng)絡(luò)性能、增進(jìn)用戶(hù)體驗(yàn)具有重要意義。由于多種因素會(huì)影響到移動(dòng)通信話務(wù)量的準(zhǔn)確預(yù)測(cè),故選擇多因素灰色話務(wù)量預(yù)測(cè)模型來(lái)預(yù)測(cè)話務(wù)量。先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,用關(guān)聯(lián)分析法找到影響話務(wù)量預(yù)測(cè)的主要因素。但此模型對(duì)波動(dòng)較大的數(shù)據(jù)預(yù)測(cè)精度較低,用支持向量機(jī)的模型來(lái)改善預(yù)測(cè)結(jié)果,選取擁有較強(qiáng)的斂散性和全局尋優(yōu)能力的復(fù)高斯小波核函數(shù)優(yōu)化向量機(jī)。從仿真結(jié)果可以看出該模型有更好的收斂作用和較為理想的預(yù)測(cè)效果。
復(fù)高斯小波核函數(shù);支持向量機(jī);多因素;話務(wù)量預(yù)測(cè)
話務(wù)量預(yù)測(cè),是指以歷史話務(wù)量數(shù)據(jù)為基礎(chǔ),從一定的規(guī)律性與特點(diǎn)出發(fā),通過(guò)統(tǒng)計(jì)調(diào)查,運(yùn)用科學(xué)有效的建模方法對(duì)未來(lái)某一時(shí)段的話務(wù)量進(jìn)行預(yù)測(cè)。通過(guò)對(duì)預(yù)測(cè)結(jié)果的分析,可以清楚地知道哪些網(wǎng)絡(luò)需要擴(kuò)容,哪些網(wǎng)絡(luò)需要優(yōu)化壓縮。通常情況下預(yù)測(cè)話務(wù)量所采用的方法有線性自回歸移動(dòng)平均模型(ARIMA)[1]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[2]、支持向量機(jī)(SVM)[3]等。其中線性自回歸移動(dòng)平均模型[4]要求訓(xùn)練數(shù)據(jù)的時(shí)間序列應(yīng)具有正態(tài)分布、全局平穩(wěn)等特征,但在實(shí)際應(yīng)用中,話務(wù)量的時(shí)間序列往往是不規(guī)則、非平穩(wěn)且非線性的。人工神經(jīng)網(wǎng)絡(luò)[5]相比線性自回歸移動(dòng)平均模型有較好的非線性預(yù)測(cè)能力,但要求訓(xùn)練樣本數(shù)據(jù)量較大,且易于陷入局部極值,會(huì)導(dǎo)致最終的預(yù)測(cè)效果不穩(wěn)定。普通的預(yù)測(cè)模型大多數(shù)是根據(jù)過(guò)去的話務(wù)量去預(yù)測(cè)未來(lái)的話務(wù)量,但并沒(méi)有將相關(guān)因素考慮在內(nèi),如果沒(méi)有考慮影響因子,預(yù)測(cè)結(jié)果就會(huì)有一定的失真。為了能夠準(zhǔn)確地預(yù)測(cè)未來(lái)話務(wù)量的變化趨勢(shì),本文從多因素的角度,提出了一種改進(jìn)的復(fù)高斯小波核函數(shù)優(yōu)化支持向量機(jī)的多因素灰色預(yù)測(cè)模型[6]。根據(jù)收集到的話務(wù)量數(shù)據(jù)和影響因素,用灰色關(guān)聯(lián)分析法計(jì)算出對(duì)話務(wù)量影響較大的因素有系統(tǒng)接通率、忙時(shí)用戶(hù)數(shù)、開(kāi)機(jī)用戶(hù)數(shù)、小區(qū)切換次數(shù)。使用MATLAB進(jìn)行仿真,將預(yù)測(cè)結(jié)果與粒子群優(yōu)化支持向量機(jī)的多因素灰色模型、多因素灰色模型、真實(shí)值比較,本文算法的預(yù)測(cè)結(jié)果與真實(shí)值更接近。
1.1 數(shù)據(jù)的選擇及預(yù)處理
分析往年的話務(wù)量數(shù)據(jù)可以發(fā)現(xiàn),話務(wù)量會(huì)隨著時(shí)間和季節(jié)的改變而明顯發(fā)生變化,比如白天的話務(wù)量比夜晚高,節(jié)假日的話務(wù)量明顯高于平時(shí)。假如將話務(wù)量看做一個(gè)時(shí)間序列,那它具有季節(jié)性和周期性。
由于收集到的話務(wù)量數(shù)據(jù)有限,本文將側(cè)重于傳統(tǒng)節(jié)假日忙時(shí)話務(wù)量的預(yù)測(cè)。收集了安慶移動(dòng)2011年~2015年每年五一之前20天的話務(wù)量數(shù)據(jù)以及影響因素的資料。在此基礎(chǔ)上,對(duì)其在五一的忙時(shí)數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),預(yù)測(cè)忙時(shí)話務(wù)量數(shù)據(jù)。首先將實(shí)際數(shù)據(jù)進(jìn)行歸一化,將歸一化后的數(shù)據(jù)通過(guò)灰色關(guān)聯(lián)分析后得出結(jié)果數(shù)據(jù),再用提出的改進(jìn)模型進(jìn)行預(yù)測(cè)。
1.2 灰色關(guān)聯(lián)分析
由于話務(wù)量受多種因素的影響,本文采用灰色關(guān)聯(lián)分析法[7]來(lái)判斷話務(wù)量與多種影響因素間的相關(guān)度大小,選擇與話務(wù)量相關(guān)性較大的因素。
灰色關(guān)聯(lián)分析的主要原理是根據(jù)序列曲線幾何形狀的相似程度來(lái)判別其聯(lián)系是否緊密。通過(guò)計(jì)算數(shù)據(jù)間相關(guān)度的大小來(lái)判別話務(wù)量與各因素相關(guān)性的大小。
(1)設(shè)系統(tǒng)特征序列X1,相關(guān)因素序列Xk:
(1)
(2)對(duì)各數(shù)據(jù)序列進(jìn)行處理:
Yk=Xk/xk(1)=(yk(1),yk(2),...yk(m))
k=1,2,...,m
(2)
(3)計(jì)算相關(guān)系數(shù):
(3)
(4)根據(jù)各數(shù)據(jù)序列關(guān)聯(lián)系數(shù)的大小,計(jì)算關(guān)聯(lián)度的值:
(4)
對(duì)話務(wù)量影響較大的因素與話務(wù)量間的關(guān)聯(lián)度結(jié)果如表1所示。
表1 影響話務(wù)量較大的因素與關(guān)聯(lián)度
1.3 多因素灰色模型
多因素灰色模型MGM(1,n)[8]是利用n元一階常微分方程組來(lái)描述n元相關(guān)聯(lián)變量的狀態(tài),并進(jìn)行未知狀態(tài)預(yù)測(cè)。核心思想是先進(jìn)行數(shù)據(jù)預(yù)處理,使得新生成的數(shù)列具有單調(diào)性,再對(duì)新生成的序列構(gòu)建n個(gè)一元微分方程組,優(yōu)化目標(biāo)函數(shù),找到相對(duì)誤差最小的模型參數(shù),最終可以實(shí)現(xiàn)預(yù)測(cè)未來(lái)的話務(wù)量。算法步驟如下:
假設(shè)某個(gè)系統(tǒng)經(jīng)過(guò)灰色關(guān)聯(lián)分析后有n個(gè)影響因子,每個(gè)影響因子有m個(gè)數(shù)據(jù):
(1)輸入原始序列,進(jìn)行累加:
(5)
(2)多變量灰色模型MGM(1,n)對(duì)累加后的數(shù)據(jù)建立n元一階微分方程組,簡(jiǎn)寫(xiě)為:
(6)
(7)
令D=(A,B)T=[ai1ai2…ainbi]T,i=(1,2,…,n),若LTL可逆,則可得D的辨識(shí)值:
D′=(A′,B′)T=(LTL)-1LTY,i=1,2,...,n
(8)
計(jì)算模型參數(shù)的估計(jì)值,由式(8)得到A、B的辨識(shí)值A(chǔ)′、B′:
(9)
(3)計(jì)算模型的擬合值或預(yù)測(cè)值。由式(6)可得到預(yù)測(cè)值:
(10)
最終的預(yù)測(cè)值為:
(11)
通過(guò)以上多因素灰色模型的計(jì)算公式,可計(jì)算出時(shí)間序列的模擬值。但對(duì)于波動(dòng)較大的時(shí)間序列,計(jì)算出的模擬值誤差較大。把安慶移動(dòng)2011年~2015年每年“五一”之前20天的話務(wù)量數(shù)據(jù)及表1中相關(guān)因素的數(shù)據(jù)作為MGM(1,4)模型的輸入變量進(jìn)行預(yù)測(cè),可得到2015年“五一”話務(wù)量的預(yù)測(cè)趨勢(shì),預(yù)測(cè)結(jié)果如圖1。
圖1 基于多因素灰色模型2015年5月1日的話務(wù)量預(yù)測(cè)值
1.4 基于復(fù)高斯小波核函數(shù)優(yōu)化的向量機(jī)
支持向量機(jī)預(yù)測(cè)模型[9]的預(yù)測(cè)精度,主要受到兩個(gè)參數(shù)的影響:懲罰因子和核函數(shù)。由于復(fù)高斯小波核函數(shù)[10]擁有較強(qiáng)的斂散性和全局尋優(yōu)能力,為了進(jìn)一步提高預(yù)測(cè)精度,提出了基于復(fù)高斯小波核函數(shù)的支持向量機(jī)預(yù)測(cè)模型對(duì)殘差序列進(jìn)行預(yù)測(cè)[11]。殘差序列是由原始的真實(shí)序列與上一步多變量灰色模型得到的模擬值對(duì)應(yīng)相減得到。
設(shè)有樣本集{(xi,yi),i=1,2,...,n},其中xi∈Rd為輸入樣本,yi為輸出,不敏感損失函數(shù)ε的定義是:
|y-f(x)|ε=
(12)
回歸函數(shù)的表達(dá)式為:
f(x)=[ω·φ(x)]+b
(13)
其中φ(x)是從低維到高維的映射函數(shù),ω表示權(quán)值參數(shù),b表示偏差參數(shù)。
回歸函數(shù)的優(yōu)化目標(biāo)函數(shù)為:
(14)
目標(biāo)函數(shù)的約束條件為:
構(gòu)造拉格朗日函數(shù),將帶約束條件的目標(biāo)函數(shù)轉(zhuǎn)變?yōu)闊o(wú)條件下的目標(biāo)規(guī)劃問(wèn)題。
(15)
對(duì)上式中的參數(shù)分別求導(dǎo),并令偏導(dǎo)為零:
(16)
由庫(kù)恩-塔克條件,下列等式組成立:
(17)
上式中,α,α*中至少有一個(gè)為零,α≠0對(duì)應(yīng)的樣本點(diǎn)xi被定義為支持向量,根據(jù)支持向量進(jìn)行求解,便可得到支持向量機(jī)的預(yù)測(cè)函數(shù)表達(dá)式:
(18)
K(xi, x)為支持向量機(jī)預(yù)測(cè)函數(shù)表達(dá)式中的核函數(shù), 采用的是復(fù)高斯小波核函數(shù)[12]。
使用安慶移動(dòng)2011~2014四年的“五一”前20天的數(shù)據(jù)以及2015年“五一”數(shù)據(jù)的殘差序列作為已知數(shù)據(jù)來(lái)訓(xùn)練預(yù)測(cè)模型,仿真結(jié)果如圖2所示。
圖2 復(fù)高斯小波核函數(shù)優(yōu)化支持向量機(jī)的五一殘差預(yù)測(cè)值
1.5 本文算法主要思想
(1)用灰色關(guān)聯(lián)分析法計(jì)算出特征序列與各相關(guān)因素序列之間相關(guān)度的大小,根據(jù)相關(guān)度的大小,找出影響話務(wù)量較大的因素。
(2)將對(duì)話務(wù)量影響較大的因素作為MGM(1,n)模型的輸入,實(shí)現(xiàn)對(duì)話務(wù)量基本規(guī)律的預(yù)測(cè),并得到預(yù)測(cè)的殘差序列。
(3)利用復(fù)高斯小波核函數(shù)優(yōu)化的支持向量機(jī)模型建立殘差序列預(yù)測(cè)模型,從而實(shí)現(xiàn)對(duì)殘差序列的預(yù)測(cè)。
(4)將MGM(1,n)的預(yù)測(cè)結(jié)果與殘差序列預(yù)測(cè)結(jié)果疊加,實(shí)現(xiàn)對(duì)話務(wù)量的預(yù)測(cè)。
為了驗(yàn)證本文所提算法的預(yù)測(cè)結(jié)果,選取了粒子群[13]優(yōu)化的支持向量機(jī)的多因素灰色模型、多因素灰色模型作為比較模型。其中粒子群算法的基本參數(shù)為:粒子群種群規(guī)模m=100,最大迭代次數(shù)為1 000,學(xué)習(xí)因子c1=c2=2,慣性權(quán)重ω=0.9,松弛因子ε=0.54,粒子的初始化速度為0,最小適應(yīng)值ξ=0.01,通過(guò)粒子群優(yōu)化算法確定C=0.616 0,g=10.983 6。對(duì)2015年“五一”的忙時(shí)話務(wù)量進(jìn)行預(yù)測(cè),仿真結(jié)果如圖3所示。
圖3 幾種模型的預(yù)測(cè)值及與真實(shí)值的對(duì)比圖
通過(guò)對(duì)話務(wù)量的仿真分析,證明了該模型相較傳統(tǒng)的多因素灰色模型預(yù)測(cè)精度高,對(duì)波動(dòng)較大的數(shù)據(jù)預(yù)測(cè)比較準(zhǔn)確。采用相對(duì)誤差的方法對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析,計(jì)算結(jié)果如表2所示。
表2 幾種預(yù)測(cè)方法的相對(duì)誤差比較
本文選擇預(yù)測(cè)精度較高的預(yù)測(cè)模型對(duì)話務(wù)量進(jìn)行預(yù)測(cè),話務(wù)量的預(yù)測(cè)精度越高,對(duì)移動(dòng)網(wǎng)絡(luò)通信的指導(dǎo)意義就越大,越能及時(shí)應(yīng)對(duì)網(wǎng)絡(luò)可能出現(xiàn)的擁塞情況。在研究了國(guó)內(nèi)外預(yù)測(cè)領(lǐng)域的最新進(jìn)展后,針對(duì)話務(wù)量的預(yù)測(cè),本文提出了基于復(fù)高斯小波核函數(shù)改進(jìn)支持向量機(jī)的多因素灰色預(yù)測(cè)模型。在進(jìn)行預(yù)測(cè)之前,搜集了大量話務(wù)量的歷史數(shù)據(jù)和相關(guān)因素?cái)?shù)據(jù),對(duì)2015年“五一”的忙時(shí)話務(wù)量進(jìn)行了預(yù)測(cè)。
由于話務(wù)量受多種因素的影響,選擇多因素灰色話務(wù)量預(yù)測(cè)模型。此模型適合由多種因素影響的話務(wù)量的預(yù)測(cè),而且算法比較簡(jiǎn)單。但是當(dāng)數(shù)據(jù)波動(dòng)較大時(shí),多因素灰色預(yù)測(cè)模型預(yù)測(cè)精確度較低,針對(duì)這種情況,本文提出用支持向量機(jī)的模型來(lái)修正灰色模型的預(yù)測(cè)結(jié)果。
核函數(shù)與支持向量機(jī)的預(yù)測(cè)精度相關(guān),通過(guò)改進(jìn)核函數(shù),可提高預(yù)測(cè)精度。復(fù)高斯小波核函數(shù)擁有較強(qiáng)的斂散性和全局尋優(yōu)的能力,通過(guò)實(shí)驗(yàn)仿真,得出改進(jìn)的模型相比多因素灰色模型、粒子群優(yōu)化支持向量機(jī)補(bǔ)償?shù)亩嘁蛩鼗疑P陀懈玫氖諗啃Ч洼^為理想的預(yù)測(cè)結(jié)果。
[1] 彭宇,雷苗,郭嘉,等.基于先驗(yàn)知識(shí)的移動(dòng)通信話務(wù)量預(yù)測(cè)[J].電子學(xué)報(bào),2011,39(1):190-194.
[2] 張一農(nóng),劉伯龍,王文婷.基于神經(jīng)網(wǎng)絡(luò)的客服中心話務(wù)量預(yù)測(cè)模型[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2011,29(2):97-101.
[3] Chen Dianbo, Xu Fucang, Wu Min. Traffic based on clustering and support vector machine forcasting model [J]. Journal of Control Engineering, 2009, 16(2):195-198.
[4] 張偉, 張新波. 移動(dòng)GSM網(wǎng)話務(wù)量的ARIMA模型的建立及其預(yù)測(cè)[J].數(shù)學(xué)理論與應(yīng)用,2008(2):70-74.
[5] 吳永明,吳晟. 改進(jìn)的遺傳算法在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化中的應(yīng)用[J]. 微型機(jī)與應(yīng)用,2011,30(3):79-81,85.
[6] Pai Pingfeng,LIN C. A hybrid ARIMA and support vector machines model in stock price forecasting[J].Omega,2005,33(6):497-505.
[7] 李鵬,劉思峰.基于灰色關(guān)聯(lián)分析和D—S證據(jù)理論的區(qū)間直覺(jué)模糊決策方法[J].自動(dòng)化學(xué)報(bào), 2011, 37(8): 993-998.
[8] LUO Y. Non-equidistant MGM(1,n) based on vector continued factions theory and its application[J]. Information Technology Journal, 2014,13(6) ,1186-1191.
[9] 陳電波,徐福倉(cāng),吳敏. 基于聚類(lèi)和支持向量機(jī)向量機(jī)的話務(wù)量預(yù)測(cè)模型[J]. 控制工程, 2009, 16( 2) : 195-199.
[10] 陳中杰,蔡勇,蔣剛.基于復(fù)高斯小波核函數(shù)的支持向量機(jī)的研究[J].計(jì)算機(jī)應(yīng)用研究,2012, 29(9):3263-3265.
[11] 侯偉真,潘美芹. 高斯核支持向量機(jī)最優(yōu)模型參數(shù)選擇搜索算法[C]. 中國(guó)運(yùn)籌學(xué)會(huì)第八屆學(xué)術(shù)交流會(huì)論文集. 2006:716-722.
[12] 林繼鵬, 劉君華. 基于小波的支持向量機(jī)算法研究[J]. 西安交通大學(xué)學(xué)報(bào), 2005,39(8):816-819.
[13] WANG F S, CHEN L H. Particle swarm optimization(PSO)[J]. Encyclopedia of Systems Biology, 2013,12(8):1649-1650.
Research on multi factor traffic forecasting based on support vector machine
Zeng Yutong, Qian Xuerong
(College of Telecommunication and Information Engineering, Nanjing University of Posts and Telecommunications, Nanjing 210003, China)
It is very important to improve the network performance and user experience by forecasting mobile communication traffic volume accurately. According to the characteristics of traffic load, the multi factor grey model for traffic forecast is put forward. It needs to find main factors which affect the traffic volume forecast by using correlation analysis method firstly. Due to the low prediction accuracy of data fluctuation,so it selects complex Gaussian wavelet kernel function which has strong convergence and divergence and global optimization ability to optimize the vector machine. The simulation results show that the model has better convergence effect and prediction results.
complex Gaussian wavelet kernel function; Support Vector Machine; multi factor; traffic forecast
TN929.5
A
1674-7720(2016)01-0063-04
曾雨桐,錢(qián)學(xué)榮.基于支持向量機(jī)的多因素話務(wù)量預(yù)測(cè)研究[J].微型機(jī)與應(yīng)用,2016,35(1):63-66.
2015-08-24)
曾雨桐(1990-),女,碩士研究生,主要研究方向:無(wú)線通信與移動(dòng)計(jì)算。
錢(qián)學(xué)榮(1956-),男,博士,教授,主要研究方向:通信與信號(hào)處理、信源與信道編碼、寬帶移動(dòng)通信與移動(dòng)計(jì)算網(wǎng)絡(luò)技術(shù)。
____________________