• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      LIBSVM回歸算法在話務預測中的應用

      2014-02-10 01:29:44
      電信工程技術與標準化 2014年9期
      關鍵詞:話務量特征向量向量

      (福建省郵電規(guī)劃設計院有限公司,福州 350001)

      LIBSVM回歸算法在話務預測中的應用

      鐘壇旺,林昭語

      (福建省郵電規(guī)劃設計院有限公司,福州 350001)

      話務量預測在工程規(guī)劃建設中有重要的意義,但常用的預測方法總體準確率不高,而LIBSVM算法在解決回歸問題上表現(xiàn)出優(yōu)良的性能。本文以H市連續(xù)587天早忙時話務量樣本作為LIBSVM模型訓練,之后用60個樣本點作為測試數(shù)據(jù),驗證LIBSVM模型的預測性能,并對結果進行均方誤差和平均相對誤差的指標評價分析。

      話務量預測;LIBSVM;模型訓練;樣本集

      在工程規(guī)劃與建設中需要根據(jù)對目標期的話務量預測來確定目標無線網(wǎng)絡容量、擴容需要的設備類型和數(shù)量等,話務預測結果的準確與否直接關系到目標無線網(wǎng)絡利用率、投資效益等企業(yè)發(fā)展的關鍵指標,因此以相對準確的話務量預測來指導運營商網(wǎng)絡建設,能成功應對用戶行為的變化及其趨勢,為移動網(wǎng)絡長久、穩(wěn)定的運行奠定基礎。在通信網(wǎng)絡的規(guī)劃和設計中,常用的預測方法主要有趨勢外推法、回歸預測法、業(yè)務模型法、市場調查法等,常用的預測方法在網(wǎng)絡快速工程建設中,起到一定的積極作用,但總體準確率不高。

      支持向量機(SVM,Support Vector Machine)是近年來出現(xiàn)的一種機器學習方法,在解決分類和回歸問題方面都表現(xiàn)出優(yōu)良的性能。借助于支持向量機方法,通過使用LIBSVM工具箱對話務量的特征向量進行學習訓練,經(jīng)過交叉驗證確定了回歸機的最優(yōu)參數(shù)組合,經(jīng)實驗驗證預測效果較理想,針對話務量的預測提供了一種新思路。

      1 SVM 綜述

      SVM是建立在統(tǒng)計學的VC維理論和結構風險最小化原則基礎上的機器學習方法,它能夠根據(jù)有限樣本信息,在模型的復雜性和學習能力之間尋求最佳折衷,是SLT的一種成功實現(xiàn)。

      當SVM用于回歸估計時,稱為SVM回歸機。假設訓練樣本為(xi,yi),(i=1,…,l)。最簡單的SVM回歸機使用線性函數(shù)對樣本點進行擬合。對于無法用線性函數(shù)擬合的問題,則將樣本映射到高維特征空間,在高維特征空間中建立線性模型,其中是將樣本點映射到高維空間的非線性變換,SVM回歸機可以表示為

      滿足以下約束條件:

      式(1)中,‖ω‖2代表與模型復雜度相關的因素;C>0為懲罰系數(shù),它控制對超出誤差的樣本的懲罰程度;ε為不敏感損失函數(shù),其取值大小影響支持向量的數(shù)目;為松弛變量,表示樣本偏離ε不敏感區(qū)域的程度。

      對于式(1),通常通過求解上述模型的Lagrange對偶問題獲得原問題的最優(yōu)解

      其中,K(xi+xj)稱為核函數(shù),滿足Mercer條件且K(xi+xj)=φ(xi)φ(xj)。徑向基核(radial basis function,RBF)是普適的核函數(shù),K(x+x')=exp(-‖x+x'‖2/σ2) =exp(-γ‖x+x'‖2),其中σ>0是核寬度系數(shù),γ=1/σ2。懲罰系數(shù)C、不敏感系數(shù)ε、核函數(shù)及相關參數(shù)的選擇,對SVM的效果有顯著影響。

      LIBSVM是國立臺灣大學林智仁博士等開發(fā)設計的通用SVM軟件包,可以解決分類問題(包括C-SVC、v-SVC)、回歸問題(包括SVR、v-SVR)以及分布估計(one-class-SVM)等問題,提供了線性、多項式、徑向基和S形函數(shù)4種常用的核函數(shù)供選擇,可以有效地解決多類問題、交叉驗證選擇參數(shù)、對不平衡樣本加權、多類問題的概率估計等。

      2 基于LIBSVM的話務量預測方法

      采用支持向量機求解回歸問題,關鍵是核函數(shù)與參數(shù)的選擇,通過對LIBSVM軟件包中核函數(shù)類型及其相關參數(shù)的對比分析,以找到最適合本預測方法的模型。基于LIBSVM的話務量預測方法流程如圖1所示。

      圖1 基于LIBSVM的話務量預測方法流程圖

      2.1 數(shù)據(jù)樣本采集、構造特征向量、預處理

      2.1.1 數(shù)據(jù)樣本采集、構造特征向量

      話務量是一種動態(tài)的、隨機的時間序列,受政策因素、經(jīng)濟發(fā)展、人口數(shù)量、季節(jié)及其它自然因素等的影響,這些因素均與預測目標值有一定的關聯(lián),但較難完全量化為回歸模型的輸入向量,而歷史話務量數(shù)據(jù)在時間序列上一定程度的反映了某些因素的影響;因此選取容易量化的時間序列與歷史的話務量相結合,構造一個多元回歸預測特征向量如下。

      式中:year(d),mon(d),day(d)為數(shù)據(jù)樣本的對應年月日,體現(xiàn)出話務數(shù)據(jù)與時間序列的對應關系。

      user(d)為數(shù)據(jù)樣本的對應日期的VLR登記用戶數(shù),用戶規(guī)模的發(fā)展趨勢與話務量的發(fā)展密切相關,加入該維度用來表達話務量與用戶數(shù)量間的關聯(lián)性。

      x(d-1),x(d-2),x(d-3)為數(shù)據(jù)樣本對應前3天的話務量實際值,加入該維度體現(xiàn)相鄰時段話務量的相關性。平均話務量,體現(xiàn)相鄰時段話務量的相關性及一定時段內的發(fā)展趨勢,同時弱化短期內不合理的話務波動。

      預測過程就是通過LIBSVM算法,以獲取能反映上述特征向量模型的最優(yōu)函數(shù)關系f。本文中取H市連續(xù)647天早忙時的話務量,按以上的特征向量模型建立樣本集,其中用587個樣本點進行模型訓練,之后用60個樣本點作為測試數(shù)據(jù)。

      2.1.2 樣本集預處理

      將樣本數(shù)據(jù)按LIBSVM要求的數(shù)據(jù)格式進行整理,具體格式為(1abel>[index1]: [value1] [index2]:[value2]……

      其中:label是訓練數(shù)據(jù)集的目標值,index是從l開始的整數(shù),表示特征的序號;value是用來訓練或預測的數(shù)據(jù),即預測模型的相關輸入維度,部分樣本集實例如表1所示。

      表1 部分樣本集實例

      為了避免輸入向量中各變量數(shù)量級相差過大影響訓練效果,調用scale工具對訓練數(shù)據(jù)和測試數(shù)據(jù)進行歸一化處理,歸一化區(qū)間設為[-1,1]。

      2.2 樣本集訓練建模及預測

      2.2.1 樣本集訓練建模

      LIBSVM回歸算法關鍵步驟之一,就是選取最合適的參數(shù),以達到最佳的預測效果,而進行人工試驗工作量大且較難實現(xiàn)最優(yōu)化。因此本文中直接調用gridregression.py函數(shù)進行自動尋優(yōu),通過設定SVM類型、核函數(shù)、10分交叉驗證方式等,得到模型訓練中所需的最優(yōu)參數(shù)為c=1 024,g=0.25,p=128。

      應用e -SVR與RBF函數(shù),并結合以上的參數(shù)進行模型訓練,得到預測模型顯示為

      #iter=1 368(為迭代次數(shù));

      nu=0.658 622(n-SVC、one-class-SVM與 n-SVR中參數(shù));

      obj=-150 064 894.68(SVM文件轉換為的二次規(guī)劃求解得到的最小值);

      rho=-7 462.401(為判決函數(shù)的常數(shù)項b);

      nSV=407(為支持向量個數(shù));

      nBSV=369(為邊界上的支持向量個數(shù))。

      2.2.2 預測

      根據(jù)得到的預測模型對測試樣本進行預測,輸出結果包括均方誤差(Mean Squared Error)=251 743;相關系數(shù)(Squared Correlation Coefficient)=0.692 042,同時輸出預測的話務量數(shù)據(jù),擬合的效果如圖2所示。

      圖2 LIBSVM模型話務量預測擬合的效果

      從圖2中可以看出預測數(shù)據(jù)曲線與真實數(shù)據(jù)曲線的趨勢基本吻合,預測曲線更為平緩,當實際值波動較大時,預測結果出現(xiàn)較大偏差。

      2.3 預測結果評價

      本次的評價過程是將LIBSVM模型預測結果與趨勢外推法的預測結果進行指標對比。

      2.3.1 評價指標定義

      對不同的預測結果進行均方誤差和平均相對誤差這兩個指標的評價,這兩個指標定義如下:

      式中:mse為均方誤差,n為樣本總個數(shù),yi表示實際值,表示預測值。

      式中:E為平均相對誤差,n為樣本總個數(shù),yi表示實際值,表示預測值。

      2.3.2 趨勢外推法的預測結果

      將587天的忙時話務量樣本模型進行指數(shù)、線性、對數(shù)、冪、移動平均、二次曲線和三次曲線等的擬合,選擇擬合度最高的三次曲線建立趨勢模型,如圖3所示。

      圖3 話務量增長趨勢擬合曲線

      根據(jù)圖3中的趨勢模型y=-3E-05x3+0.0183x2+9.456x+4500.9,計算得到的60個測試樣本的預測值與實際擬合的效果如圖4所示。

      2.3.3 評價指標對比

      兩種預測方法的均方誤差和平均相對誤差指標對比如表2所示。

      從以上評價指標可以看出,LIBSVM回歸方法通過時間序列和活躍用戶數(shù)刻畫趨勢量、相鄰時段的相關維度輸入等,并利用SVM突出的高維識別能力進行擬合,預測數(shù)據(jù)曲線與真實數(shù)據(jù)曲線發(fā)展趨勢基本吻合,與趨勢外推法相比預測精度有較大的提高。

      表2 兩種預測方法指標對比

      圖4 趨勢外推法話務量預測擬合的效果

      3 結論

      LIBSVM回歸算法通過分析建立合適的輸入樣本集、通過參數(shù)選優(yōu)確定最優(yōu)參數(shù),并利用SVM突出的高維識別能力進行擬合,能實現(xiàn)與目前常用預測方法相比誤差更小的預測,體現(xiàn)LIBSVM回歸算法的優(yōu)越性。在無線網(wǎng)絡工程規(guī)劃建設中,應用本算法對規(guī)劃期的目標預測值進行必要的修正,在設備配置合理化等方面將會起到積極的作用。

      Application of LIBSVM regression algorithm in traffic prediction

      ZHONG Tan-wang,LIN Zhao-yu
      (Fujian Posts and Telecommunications Planning and Design Institute Co., Ltd., Fuzhou 350001, China)

      Traffic prediction has an important significance in the project, overall accuracy is not high by some common methods, but the LIBSVM algorithm shows good performance quality in solving the regression problems. This paper takes the samples as LIBSVM model training ,basing on the early busy traff c of H city for 587 consecutive days, and verify the predicted performance of LIBSVM model by testing data for following 60 samples. Finally, analyzes the results by the methods of evaluation error and average relative error.

      traff c prediction; LIBSVM; model training; sample set

      TN929.5

      A

      1008-5599(2014)09-0080-04

      2014-07-08

      猜你喜歡
      話務量特征向量向量
      二年制職教本科線性代數(shù)課程的幾何化教學設計——以特征值和特征向量為例
      向量的分解
      克羅內克積的特征向量
      聚焦“向量與三角”創(chuàng)新題
      基于時間序列模型的異常話務量分塊建模和預測
      一類特殊矩陣特征向量的求法
      EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應用
      中華建設(2017年1期)2017-06-07 02:56:14
      S1240交換機實時話務量統(tǒng)計的分析與實現(xiàn)研究
      向量垂直在解析幾何中的應用
      向量五種“變身” 玩轉圓錐曲線
      巨野县| 清流县| 德保县| 柳州市| 朝阳市| 万安县| 邹平县| 安义县| 合川市| 台山市| 乌什县| 金华市| 张北县| 五峰| 隆子县| 仙游县| 安义县| 平定县| 南城县| 滦平县| 枞阳县| 清丰县| 丹棱县| 晋州市| 湘潭市| 盐源县| 阿鲁科尔沁旗| 渑池县| 齐河县| 阿城市| 深泽县| 金溪县| 吴桥县| 海原县| 云梦县| 南安市| 离岛区| 灯塔市| 吴桥县| 卢龙县| 沙坪坝区|