• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于蟻群算法優(yōu)化支持向量機的移動話務量預測

      2014-09-26 19:07宋秀秀賈振紅覃錫忠
      中國新通信 2014年16期
      關(guān)鍵詞:蟻群算法預測模型支持向量機

      宋秀秀 賈振紅 覃錫忠

      【摘要】 移動通信話務量的準確預測對于提高網(wǎng)絡的性能,增進終端用戶體驗均具有重要的意義。支持向量機作為一種新的機器學習方法其可以有效地應對小樣本、非線性等問題。然而支持向量機的訓練參數(shù)對基于其所構(gòu)建的預測模型的精度具有決定性的影響,因此本文選取具有全局優(yōu)化能力的蟻群算法進行參數(shù)搜索優(yōu)化過程,通過對某市移動通信話務量的數(shù)據(jù)進行試驗仿真,結(jié)果顯示該方法在預測精度及時效性方面具有較好的性能。

      【關(guān)鍵詞】 蟻群算法 支持向量機 移動話務量 預測模型

      話務量預測問題,是指通過精準的統(tǒng)計調(diào)查方法,以歷史話務量數(shù)據(jù)為基礎,從其內(nèi)在蘊含的規(guī)律性與特點出發(fā),運用科學有效的建?;貧w方法對未來某一時段的話務量進行預測。話務量的多少直接影響到移動通信網(wǎng)絡的設計、規(guī)劃以及運營情況,對于終端客戶的服務質(zhì)量具有決定性的影響。

      目前對移動話務量預測常采用的方法為線性自回歸移動平均模型(ARIMA)、人工神經(jīng)網(wǎng)絡(ANN)、支持向量回歸機(SVR),其中線性自回歸移動平均模型對訓練數(shù)據(jù)具有較高的要求,具體為時間序列應具有正態(tài)分布、全局平穩(wěn)等特征,然而在實際應用中,話務量的時間序列往往是不規(guī)則、非平穩(wěn)且非線性的,因此線性自回歸移動平均模型對于移動話務量的預測具有一定的缺陷。相比于線性自回歸移動平均模型,人工神經(jīng)網(wǎng)絡具有較好的非線性預測能力,然而其對所需的訓練樣本數(shù)據(jù)數(shù)量較大,且易于陷入局部極值,因而導致最終的預測效果不穩(wěn)定[1];支持向量回歸機中相關(guān)參數(shù)的選擇對于最終預測模型的泛化能力及預測結(jié)果,因此構(gòu)建相關(guān)參數(shù)科學、合理的選取機制是基于支持向量回歸機進行時間序列數(shù)據(jù)預測的一個關(guān)鍵問題[2,3]。

      一、支持向量回歸機模型

      作為一種新型的機器學習方法,支持向量機(Support Vector Machine, SVM)的基本思想是構(gòu)造一個恰當?shù)姆蔷€性映射,將低維度的非線性函數(shù)映射至高維度的空間內(nèi)。需要注意的是,對于支持向量機SVM的求解過程不需要事先對非線性映射的具體表達式進行表述,只需要選取合適的核函數(shù)即可,利用對核函數(shù)進行優(yōu)化求解過程,將高維特征空間的點積轉(zhuǎn)換為低維空間的核函數(shù)進行計算,從而避免了高維空間中求解所帶來的維數(shù)災難問題??梢哉f,核函數(shù)的選取是支持向量機應用中的一個關(guān)鍵問題,對于核函數(shù)的選取要求是其必須滿足Mercer條件,此外應盡可能的準確反映訓練樣本數(shù)據(jù)點的分布特征。在支持向量機的實際應用中,大多選擇多項式核函數(shù)、高斯徑向基核函數(shù)以及Sigmoid核函數(shù)。

      支持向量機在實際使用中性能的好壞取決于相關(guān)參數(shù)的選擇,其中包括:正則化參數(shù)C,核參數(shù)σ,以及不敏感參數(shù)ε等。支持向量機目前在回歸算法的應用及研究方面表現(xiàn)出了良好的性能,在宏觀經(jīng)濟、工程應用如電力需求預測、證劵市場時間序列分析等方面均有成功的應用范例。

      給定一組訓練集合T={(xi,yi),i=1,2,…,m},其中xi∈Rn,yi=R,i=1,2,…,m。假設該組訓練數(shù)據(jù)是按照Rn·R上的某一個分布P(x,y)所選取的獨立且同分布的樣本點,我們的目的在于試圖尋找一個實值函數(shù),從而實現(xiàn)以y=f(x)推斷任意一組輸入xi∈Rn所對應的的輸出值y∈R,同時使得對訓練集的期望風險值達到最小程度。

      R(f)=∫c(x,y,f)dp(x,y)

      其中c(x,y,f)是給定的損失函數(shù)。

      二、蟻群算法

      蟻群算法由Dorigo等在上個世紀90年代首次提出之后,在國際學術(shù)界引起了廣泛的關(guān)注。作為一種人工智能仿生算法,其借鑒生物界中螞蟻在覓食的過程中通過自身所釋放出的信息素進行社會化溝通、交流及協(xié)作的機制,通過多次迭代過程實現(xiàn)對最優(yōu)解的尋找。

      下面以TSP問題為例,介紹蟻群算法ACO的數(shù)學模型。假定給定的城市數(shù)目為n,di,j(i,j=1,2,…,n)為第i個城市到第j個城市之間的距離,Bi(t)表示在t時刻,第i個城市上停留的蟻群數(shù)量,則有M=B(t)。螞蟻的狀態(tài)轉(zhuǎn)移是依靠分布在城市路徑上的信息素作為線索進行完成的。在具體的算法運行過程中,蟻群利用狀態(tài)轉(zhuǎn)移定律p(t)來選擇具體的行進路徑,從而到達下一個城市。在t時刻,p(t)的含義為

      其中,allowedk表示螞蟻k下一次迭代可選擇的具體城市,α和β的作用為調(diào)節(jié)信息素和啟發(fā)式信息重要性程度。從上面的式子可以看出,兩個城市之間的距離愈小,則其對應的信息素濃度值愈高,這也就意味著螞蟻從這兩個城市之間進行移動的概率愈大。信息素的全局更新規(guī)則如下所示,其中ρ∈(0,1]為信息素的揮發(fā)因子。

      參數(shù)是影響蟻群算法運行性能及效率的一個關(guān)鍵因素,算法的啟發(fā)式因子α、期望啟發(fā)式因子β、信息素殘留因子1-ρ、信息素強度Q以及蟻群規(guī)模數(shù)M等等均是比較重要的參數(shù),這些參數(shù)選取及配置的好壞直接影響到蟻群算法的全局收斂性及算法的運行效率。

      三、基于蟻群算法優(yōu)化支持向量機參數(shù)

      支持向量機的預測精確度與其自身所選定的相關(guān)參數(shù)取值緊密相關(guān),如懲罰參數(shù)、不敏感損失參數(shù)、RBF核參數(shù)等等。故而,通過蟻群優(yōu)化算法在一定范圍內(nèi)對支持向量機的相關(guān)參數(shù)進行搜索尋優(yōu),尋找其最優(yōu)組合配置,從而獲得預測性能較好的支持向量機。蟻群算法作為一種新的仿生智能算法,其模擬社會化昆蟲螞蟻在覓食等活動中通過信息素進行相互交流以尋找最短路徑的優(yōu)化機制。

      具體的算法優(yōu)化流程如下:(1)算法初始化設置,設置最大迭代次數(shù)Mmax,且令M=0。(2)每只螞蟻個體依靠輪盤賭方法,依次先后在每個集合中選擇元素,直至所有的螞蟻找到食物。(3)劃分訓練樣本為相互獨立且不包含的k個子集合S1,S2,…,Sk,其中Si為測試集合,其他均為訓練集合,經(jīng)過訓練得到支持向量機的預測值平均誤差,逐次循環(huán)過程,將每次所得到的結(jié)果平均,計算適應度值。(4)一旦達到所設定的迭代次數(shù)Mmax,則終止迭代過程,輸出最終解,否則轉(zhuǎn)到步驟(2)。

      四、實驗結(jié)果及仿真

      以歷史話務量數(shù)據(jù)為基礎,構(gòu)建相應地預測模型以對未來的話務量進行準確的預測,需要指出的是,在構(gòu)建預測模型中我們忽略相關(guān)其他因素對于話務量的影響作用。話務量需求是一個收到多元素重疊影響的動態(tài)非線性系統(tǒng),重大事件、活動及節(jié)日,異常天氣等等均會造成話務量的異常。因此,本文在構(gòu)建預測模型的過程中,充分考慮到了用戶數(shù)、短信數(shù)以及系統(tǒng)的接通率對于最終話務量的影響。

      對每日產(chǎn)生的話務量進行周期為一小時的統(tǒng)計調(diào)查,一天中則會產(chǎn)生24個話務量的數(shù)據(jù)值,分布對應于每日的0點到23點,以對每天的24個話務量數(shù)據(jù)中的Max值作為今日的最忙時話務量。本文的數(shù)據(jù)統(tǒng)計來源于某市的移動通信數(shù)據(jù),其中包括2013年3月到2013年9月間隨即選取的40天數(shù)據(jù),其中每日的統(tǒng)計數(shù)據(jù)包含用戶數(shù)、短信發(fā)送數(shù)、系統(tǒng)接通率、話務量值。其中前39日的數(shù)據(jù)作為預測模型的訓練樣本數(shù)據(jù),第40日的數(shù)據(jù)作為測試樣本數(shù)據(jù)。每個輸入樣本包含8個不同的變量值:前日的話務量值、用戶數(shù)、短信發(fā)送量、系統(tǒng)接通率;前兩日的話務量值、用戶數(shù)、短信發(fā)送量、系統(tǒng)接通率。輸出值為所預測當天的移動通信話務量。

      圖1和圖2分別為采用高斯核函數(shù)及K型核函數(shù)構(gòu)建的基于支持向量機的預測模型,由圖可見,預測值與真實值之間的相對誤差基本上控制在5%左右,最小可到0.01%,這說明該方法對于移動通信話務量的預測結(jié)果精度是比較高的。然而,選取K型核函數(shù)構(gòu)建的預測模型其訓練時間較高斯核函數(shù)的訓練時間減少了將近50%左右,因此總體性能上K型核函數(shù)要優(yōu)于高斯核函數(shù)。

      五、結(jié)語

      本文研究了基于蟻群算法優(yōu)化支持向量機相關(guān)參數(shù)以構(gòu)建預測模型,從而對移動通信話務量數(shù)據(jù)值進行預測,以某市的GSM網(wǎng)40天內(nèi)的數(shù)據(jù)為研究對象,構(gòu)建了基于支持向量機的預測模型。通過優(yōu)化參數(shù)選取,對移動話務量進行了準確的預測,結(jié)果表明支持向量機對樣本數(shù)據(jù)具有較好的學習及泛化能力。

      【摘要】 移動通信話務量的準確預測對于提高網(wǎng)絡的性能,增進終端用戶體驗均具有重要的意義。支持向量機作為一種新的機器學習方法其可以有效地應對小樣本、非線性等問題。然而支持向量機的訓練參數(shù)對基于其所構(gòu)建的預測模型的精度具有決定性的影響,因此本文選取具有全局優(yōu)化能力的蟻群算法進行參數(shù)搜索優(yōu)化過程,通過對某市移動通信話務量的數(shù)據(jù)進行試驗仿真,結(jié)果顯示該方法在預測精度及時效性方面具有較好的性能。

      【關(guān)鍵詞】 蟻群算法 支持向量機 移動話務量 預測模型

      話務量預測問題,是指通過精準的統(tǒng)計調(diào)查方法,以歷史話務量數(shù)據(jù)為基礎,從其內(nèi)在蘊含的規(guī)律性與特點出發(fā),運用科學有效的建?;貧w方法對未來某一時段的話務量進行預測。話務量的多少直接影響到移動通信網(wǎng)絡的設計、規(guī)劃以及運營情況,對于終端客戶的服務質(zhì)量具有決定性的影響。

      目前對移動話務量預測常采用的方法為線性自回歸移動平均模型(ARIMA)、人工神經(jīng)網(wǎng)絡(ANN)、支持向量回歸機(SVR),其中線性自回歸移動平均模型對訓練數(shù)據(jù)具有較高的要求,具體為時間序列應具有正態(tài)分布、全局平穩(wěn)等特征,然而在實際應用中,話務量的時間序列往往是不規(guī)則、非平穩(wěn)且非線性的,因此線性自回歸移動平均模型對于移動話務量的預測具有一定的缺陷。相比于線性自回歸移動平均模型,人工神經(jīng)網(wǎng)絡具有較好的非線性預測能力,然而其對所需的訓練樣本數(shù)據(jù)數(shù)量較大,且易于陷入局部極值,因而導致最終的預測效果不穩(wěn)定[1];支持向量回歸機中相關(guān)參數(shù)的選擇對于最終預測模型的泛化能力及預測結(jié)果,因此構(gòu)建相關(guān)參數(shù)科學、合理的選取機制是基于支持向量回歸機進行時間序列數(shù)據(jù)預測的一個關(guān)鍵問題[2,3]。

      一、支持向量回歸機模型

      作為一種新型的機器學習方法,支持向量機(Support Vector Machine, SVM)的基本思想是構(gòu)造一個恰當?shù)姆蔷€性映射,將低維度的非線性函數(shù)映射至高維度的空間內(nèi)。需要注意的是,對于支持向量機SVM的求解過程不需要事先對非線性映射的具體表達式進行表述,只需要選取合適的核函數(shù)即可,利用對核函數(shù)進行優(yōu)化求解過程,將高維特征空間的點積轉(zhuǎn)換為低維空間的核函數(shù)進行計算,從而避免了高維空間中求解所帶來的維數(shù)災難問題。可以說,核函數(shù)的選取是支持向量機應用中的一個關(guān)鍵問題,對于核函數(shù)的選取要求是其必須滿足Mercer條件,此外應盡可能的準確反映訓練樣本數(shù)據(jù)點的分布特征。在支持向量機的實際應用中,大多選擇多項式核函數(shù)、高斯徑向基核函數(shù)以及Sigmoid核函數(shù)。

      支持向量機在實際使用中性能的好壞取決于相關(guān)參數(shù)的選擇,其中包括:正則化參數(shù)C,核參數(shù)σ,以及不敏感參數(shù)ε等。支持向量機目前在回歸算法的應用及研究方面表現(xiàn)出了良好的性能,在宏觀經(jīng)濟、工程應用如電力需求預測、證劵市場時間序列分析等方面均有成功的應用范例。

      給定一組訓練集合T={(xi,yi),i=1,2,…,m},其中xi∈Rn,yi=R,i=1,2,…,m。假設該組訓練數(shù)據(jù)是按照Rn·R上的某一個分布P(x,y)所選取的獨立且同分布的樣本點,我們的目的在于試圖尋找一個實值函數(shù),從而實現(xiàn)以y=f(x)推斷任意一組輸入xi∈Rn所對應的的輸出值y∈R,同時使得對訓練集的期望風險值達到最小程度。

      R(f)=∫c(x,y,f)dp(x,y)

      其中c(x,y,f)是給定的損失函數(shù)。

      二、蟻群算法

      蟻群算法由Dorigo等在上個世紀90年代首次提出之后,在國際學術(shù)界引起了廣泛的關(guān)注。作為一種人工智能仿生算法,其借鑒生物界中螞蟻在覓食的過程中通過自身所釋放出的信息素進行社會化溝通、交流及協(xié)作的機制,通過多次迭代過程實現(xiàn)對最優(yōu)解的尋找。

      下面以TSP問題為例,介紹蟻群算法ACO的數(shù)學模型。假定給定的城市數(shù)目為n,di,j(i,j=1,2,…,n)為第i個城市到第j個城市之間的距離,Bi(t)表示在t時刻,第i個城市上停留的蟻群數(shù)量,則有M=B(t)。螞蟻的狀態(tài)轉(zhuǎn)移是依靠分布在城市路徑上的信息素作為線索進行完成的。在具體的算法運行過程中,蟻群利用狀態(tài)轉(zhuǎn)移定律p(t)來選擇具體的行進路徑,從而到達下一個城市。在t時刻,p(t)的含義為

      其中,allowedk表示螞蟻k下一次迭代可選擇的具體城市,α和β的作用為調(diào)節(jié)信息素和啟發(fā)式信息重要性程度。從上面的式子可以看出,兩個城市之間的距離愈小,則其對應的信息素濃度值愈高,這也就意味著螞蟻從這兩個城市之間進行移動的概率愈大。信息素的全局更新規(guī)則如下所示,其中ρ∈(0,1]為信息素的揮發(fā)因子。

      參數(shù)是影響蟻群算法運行性能及效率的一個關(guān)鍵因素,算法的啟發(fā)式因子α、期望啟發(fā)式因子β、信息素殘留因子1-ρ、信息素強度Q以及蟻群規(guī)模數(shù)M等等均是比較重要的參數(shù),這些參數(shù)選取及配置的好壞直接影響到蟻群算法的全局收斂性及算法的運行效率。

      三、基于蟻群算法優(yōu)化支持向量機參數(shù)

      支持向量機的預測精確度與其自身所選定的相關(guān)參數(shù)取值緊密相關(guān),如懲罰參數(shù)、不敏感損失參數(shù)、RBF核參數(shù)等等。故而,通過蟻群優(yōu)化算法在一定范圍內(nèi)對支持向量機的相關(guān)參數(shù)進行搜索尋優(yōu),尋找其最優(yōu)組合配置,從而獲得預測性能較好的支持向量機。蟻群算法作為一種新的仿生智能算法,其模擬社會化昆蟲螞蟻在覓食等活動中通過信息素進行相互交流以尋找最短路徑的優(yōu)化機制。

      具體的算法優(yōu)化流程如下:(1)算法初始化設置,設置最大迭代次數(shù)Mmax,且令M=0。(2)每只螞蟻個體依靠輪盤賭方法,依次先后在每個集合中選擇元素,直至所有的螞蟻找到食物。(3)劃分訓練樣本為相互獨立且不包含的k個子集合S1,S2,…,Sk,其中Si為測試集合,其他均為訓練集合,經(jīng)過訓練得到支持向量機的預測值平均誤差,逐次循環(huán)過程,將每次所得到的結(jié)果平均,計算適應度值。(4)一旦達到所設定的迭代次數(shù)Mmax,則終止迭代過程,輸出最終解,否則轉(zhuǎn)到步驟(2)。

      四、實驗結(jié)果及仿真

      以歷史話務量數(shù)據(jù)為基礎,構(gòu)建相應地預測模型以對未來的話務量進行準確的預測,需要指出的是,在構(gòu)建預測模型中我們忽略相關(guān)其他因素對于話務量的影響作用。話務量需求是一個收到多元素重疊影響的動態(tài)非線性系統(tǒng),重大事件、活動及節(jié)日,異常天氣等等均會造成話務量的異常。因此,本文在構(gòu)建預測模型的過程中,充分考慮到了用戶數(shù)、短信數(shù)以及系統(tǒng)的接通率對于最終話務量的影響。

      對每日產(chǎn)生的話務量進行周期為一小時的統(tǒng)計調(diào)查,一天中則會產(chǎn)生24個話務量的數(shù)據(jù)值,分布對應于每日的0點到23點,以對每天的24個話務量數(shù)據(jù)中的Max值作為今日的最忙時話務量。本文的數(shù)據(jù)統(tǒng)計來源于某市的移動通信數(shù)據(jù),其中包括2013年3月到2013年9月間隨即選取的40天數(shù)據(jù),其中每日的統(tǒng)計數(shù)據(jù)包含用戶數(shù)、短信發(fā)送數(shù)、系統(tǒng)接通率、話務量值。其中前39日的數(shù)據(jù)作為預測模型的訓練樣本數(shù)據(jù),第40日的數(shù)據(jù)作為測試樣本數(shù)據(jù)。每個輸入樣本包含8個不同的變量值:前日的話務量值、用戶數(shù)、短信發(fā)送量、系統(tǒng)接通率;前兩日的話務量值、用戶數(shù)、短信發(fā)送量、系統(tǒng)接通率。輸出值為所預測當天的移動通信話務量。

      圖1和圖2分別為采用高斯核函數(shù)及K型核函數(shù)構(gòu)建的基于支持向量機的預測模型,由圖可見,預測值與真實值之間的相對誤差基本上控制在5%左右,最小可到0.01%,這說明該方法對于移動通信話務量的預測結(jié)果精度是比較高的。然而,選取K型核函數(shù)構(gòu)建的預測模型其訓練時間較高斯核函數(shù)的訓練時間減少了將近50%左右,因此總體性能上K型核函數(shù)要優(yōu)于高斯核函數(shù)。

      五、結(jié)語

      本文研究了基于蟻群算法優(yōu)化支持向量機相關(guān)參數(shù)以構(gòu)建預測模型,從而對移動通信話務量數(shù)據(jù)值進行預測,以某市的GSM網(wǎng)40天內(nèi)的數(shù)據(jù)為研究對象,構(gòu)建了基于支持向量機的預測模型。通過優(yōu)化參數(shù)選取,對移動話務量進行了準確的預測,結(jié)果表明支持向量機對樣本數(shù)據(jù)具有較好的學習及泛化能力。

      【摘要】 移動通信話務量的準確預測對于提高網(wǎng)絡的性能,增進終端用戶體驗均具有重要的意義。支持向量機作為一種新的機器學習方法其可以有效地應對小樣本、非線性等問題。然而支持向量機的訓練參數(shù)對基于其所構(gòu)建的預測模型的精度具有決定性的影響,因此本文選取具有全局優(yōu)化能力的蟻群算法進行參數(shù)搜索優(yōu)化過程,通過對某市移動通信話務量的數(shù)據(jù)進行試驗仿真,結(jié)果顯示該方法在預測精度及時效性方面具有較好的性能。

      【關(guān)鍵詞】 蟻群算法 支持向量機 移動話務量 預測模型

      話務量預測問題,是指通過精準的統(tǒng)計調(diào)查方法,以歷史話務量數(shù)據(jù)為基礎,從其內(nèi)在蘊含的規(guī)律性與特點出發(fā),運用科學有效的建?;貧w方法對未來某一時段的話務量進行預測。話務量的多少直接影響到移動通信網(wǎng)絡的設計、規(guī)劃以及運營情況,對于終端客戶的服務質(zhì)量具有決定性的影響。

      目前對移動話務量預測常采用的方法為線性自回歸移動平均模型(ARIMA)、人工神經(jīng)網(wǎng)絡(ANN)、支持向量回歸機(SVR),其中線性自回歸移動平均模型對訓練數(shù)據(jù)具有較高的要求,具體為時間序列應具有正態(tài)分布、全局平穩(wěn)等特征,然而在實際應用中,話務量的時間序列往往是不規(guī)則、非平穩(wěn)且非線性的,因此線性自回歸移動平均模型對于移動話務量的預測具有一定的缺陷。相比于線性自回歸移動平均模型,人工神經(jīng)網(wǎng)絡具有較好的非線性預測能力,然而其對所需的訓練樣本數(shù)據(jù)數(shù)量較大,且易于陷入局部極值,因而導致最終的預測效果不穩(wěn)定[1];支持向量回歸機中相關(guān)參數(shù)的選擇對于最終預測模型的泛化能力及預測結(jié)果,因此構(gòu)建相關(guān)參數(shù)科學、合理的選取機制是基于支持向量回歸機進行時間序列數(shù)據(jù)預測的一個關(guān)鍵問題[2,3]。

      一、支持向量回歸機模型

      作為一種新型的機器學習方法,支持向量機(Support Vector Machine, SVM)的基本思想是構(gòu)造一個恰當?shù)姆蔷€性映射,將低維度的非線性函數(shù)映射至高維度的空間內(nèi)。需要注意的是,對于支持向量機SVM的求解過程不需要事先對非線性映射的具體表達式進行表述,只需要選取合適的核函數(shù)即可,利用對核函數(shù)進行優(yōu)化求解過程,將高維特征空間的點積轉(zhuǎn)換為低維空間的核函數(shù)進行計算,從而避免了高維空間中求解所帶來的維數(shù)災難問題??梢哉f,核函數(shù)的選取是支持向量機應用中的一個關(guān)鍵問題,對于核函數(shù)的選取要求是其必須滿足Mercer條件,此外應盡可能的準確反映訓練樣本數(shù)據(jù)點的分布特征。在支持向量機的實際應用中,大多選擇多項式核函數(shù)、高斯徑向基核函數(shù)以及Sigmoid核函數(shù)。

      支持向量機在實際使用中性能的好壞取決于相關(guān)參數(shù)的選擇,其中包括:正則化參數(shù)C,核參數(shù)σ,以及不敏感參數(shù)ε等。支持向量機目前在回歸算法的應用及研究方面表現(xiàn)出了良好的性能,在宏觀經(jīng)濟、工程應用如電力需求預測、證劵市場時間序列分析等方面均有成功的應用范例。

      給定一組訓練集合T={(xi,yi),i=1,2,…,m},其中xi∈Rn,yi=R,i=1,2,…,m。假設該組訓練數(shù)據(jù)是按照Rn·R上的某一個分布P(x,y)所選取的獨立且同分布的樣本點,我們的目的在于試圖尋找一個實值函數(shù),從而實現(xiàn)以y=f(x)推斷任意一組輸入xi∈Rn所對應的的輸出值y∈R,同時使得對訓練集的期望風險值達到最小程度。

      R(f)=∫c(x,y,f)dp(x,y)

      其中c(x,y,f)是給定的損失函數(shù)。

      二、蟻群算法

      蟻群算法由Dorigo等在上個世紀90年代首次提出之后,在國際學術(shù)界引起了廣泛的關(guān)注。作為一種人工智能仿生算法,其借鑒生物界中螞蟻在覓食的過程中通過自身所釋放出的信息素進行社會化溝通、交流及協(xié)作的機制,通過多次迭代過程實現(xiàn)對最優(yōu)解的尋找。

      下面以TSP問題為例,介紹蟻群算法ACO的數(shù)學模型。假定給定的城市數(shù)目為n,di,j(i,j=1,2,…,n)為第i個城市到第j個城市之間的距離,Bi(t)表示在t時刻,第i個城市上停留的蟻群數(shù)量,則有M=B(t)。螞蟻的狀態(tài)轉(zhuǎn)移是依靠分布在城市路徑上的信息素作為線索進行完成的。在具體的算法運行過程中,蟻群利用狀態(tài)轉(zhuǎn)移定律p(t)來選擇具體的行進路徑,從而到達下一個城市。在t時刻,p(t)的含義為

      其中,allowedk表示螞蟻k下一次迭代可選擇的具體城市,α和β的作用為調(diào)節(jié)信息素和啟發(fā)式信息重要性程度。從上面的式子可以看出,兩個城市之間的距離愈小,則其對應的信息素濃度值愈高,這也就意味著螞蟻從這兩個城市之間進行移動的概率愈大。信息素的全局更新規(guī)則如下所示,其中ρ∈(0,1]為信息素的揮發(fā)因子。

      參數(shù)是影響蟻群算法運行性能及效率的一個關(guān)鍵因素,算法的啟發(fā)式因子α、期望啟發(fā)式因子β、信息素殘留因子1-ρ、信息素強度Q以及蟻群規(guī)模數(shù)M等等均是比較重要的參數(shù),這些參數(shù)選取及配置的好壞直接影響到蟻群算法的全局收斂性及算法的運行效率。

      三、基于蟻群算法優(yōu)化支持向量機參數(shù)

      支持向量機的預測精確度與其自身所選定的相關(guān)參數(shù)取值緊密相關(guān),如懲罰參數(shù)、不敏感損失參數(shù)、RBF核參數(shù)等等。故而,通過蟻群優(yōu)化算法在一定范圍內(nèi)對支持向量機的相關(guān)參數(shù)進行搜索尋優(yōu),尋找其最優(yōu)組合配置,從而獲得預測性能較好的支持向量機。蟻群算法作為一種新的仿生智能算法,其模擬社會化昆蟲螞蟻在覓食等活動中通過信息素進行相互交流以尋找最短路徑的優(yōu)化機制。

      具體的算法優(yōu)化流程如下:(1)算法初始化設置,設置最大迭代次數(shù)Mmax,且令M=0。(2)每只螞蟻個體依靠輪盤賭方法,依次先后在每個集合中選擇元素,直至所有的螞蟻找到食物。(3)劃分訓練樣本為相互獨立且不包含的k個子集合S1,S2,…,Sk,其中Si為測試集合,其他均為訓練集合,經(jīng)過訓練得到支持向量機的預測值平均誤差,逐次循環(huán)過程,將每次所得到的結(jié)果平均,計算適應度值。(4)一旦達到所設定的迭代次數(shù)Mmax,則終止迭代過程,輸出最終解,否則轉(zhuǎn)到步驟(2)。

      四、實驗結(jié)果及仿真

      以歷史話務量數(shù)據(jù)為基礎,構(gòu)建相應地預測模型以對未來的話務量進行準確的預測,需要指出的是,在構(gòu)建預測模型中我們忽略相關(guān)其他因素對于話務量的影響作用。話務量需求是一個收到多元素重疊影響的動態(tài)非線性系統(tǒng),重大事件、活動及節(jié)日,異常天氣等等均會造成話務量的異常。因此,本文在構(gòu)建預測模型的過程中,充分考慮到了用戶數(shù)、短信數(shù)以及系統(tǒng)的接通率對于最終話務量的影響。

      對每日產(chǎn)生的話務量進行周期為一小時的統(tǒng)計調(diào)查,一天中則會產(chǎn)生24個話務量的數(shù)據(jù)值,分布對應于每日的0點到23點,以對每天的24個話務量數(shù)據(jù)中的Max值作為今日的最忙時話務量。本文的數(shù)據(jù)統(tǒng)計來源于某市的移動通信數(shù)據(jù),其中包括2013年3月到2013年9月間隨即選取的40天數(shù)據(jù),其中每日的統(tǒng)計數(shù)據(jù)包含用戶數(shù)、短信發(fā)送數(shù)、系統(tǒng)接通率、話務量值。其中前39日的數(shù)據(jù)作為預測模型的訓練樣本數(shù)據(jù),第40日的數(shù)據(jù)作為測試樣本數(shù)據(jù)。每個輸入樣本包含8個不同的變量值:前日的話務量值、用戶數(shù)、短信發(fā)送量、系統(tǒng)接通率;前兩日的話務量值、用戶數(shù)、短信發(fā)送量、系統(tǒng)接通率。輸出值為所預測當天的移動通信話務量。

      圖1和圖2分別為采用高斯核函數(shù)及K型核函數(shù)構(gòu)建的基于支持向量機的預測模型,由圖可見,預測值與真實值之間的相對誤差基本上控制在5%左右,最小可到0.01%,這說明該方法對于移動通信話務量的預測結(jié)果精度是比較高的。然而,選取K型核函數(shù)構(gòu)建的預測模型其訓練時間較高斯核函數(shù)的訓練時間減少了將近50%左右,因此總體性能上K型核函數(shù)要優(yōu)于高斯核函數(shù)。

      五、結(jié)語

      本文研究了基于蟻群算法優(yōu)化支持向量機相關(guān)參數(shù)以構(gòu)建預測模型,從而對移動通信話務量數(shù)據(jù)值進行預測,以某市的GSM網(wǎng)40天內(nèi)的數(shù)據(jù)為研究對象,構(gòu)建了基于支持向量機的預測模型。通過優(yōu)化參數(shù)選取,對移動話務量進行了準確的預測,結(jié)果表明支持向量機對樣本數(shù)據(jù)具有較好的學習及泛化能力。

      猜你喜歡
      蟻群算法預測模型支持向量機
      基于神經(jīng)網(wǎng)絡的北京市房價預測研究
      云計算中虛擬機放置多目標優(yōu)化
      基于蟻群算法的一種無人機二維航跡規(guī)劃方法研究
      動態(tài)場景中的視覺目標識別方法分析
      論提高裝備故障預測準確度的方法途徑
      中國石化J分公司油氣開發(fā)投資分析與預測模型研究
      基于熵技術(shù)的公共事業(yè)費最優(yōu)組合預測
      一種多項目調(diào)度的改進蟻群算法研究
      基于支持向量機的金融數(shù)據(jù)分析研究
      基于IOWHA法的物流需求組合改善與預測模型構(gòu)建
      瓦房店市| 卢氏县| 阿克陶县| 长兴县| 虎林市| 麟游县| 闵行区| 桐梓县| 芦山县| 剑川县| 姚安县| 库尔勒市| 任丘市| 吴江市| 新巴尔虎左旗| 凯里市| 清水县| 溧水县| 固阳县| 武清区| 环江| 武宣县| 自贡市| 凤冈县| 桐梓县| 马尔康县| 荣成市| 馆陶县| 安平县| 噶尔县| 恩平市| 华亭县| 安福县| 唐海县| 九龙坡区| 鄄城县| 怀来县| 南漳县| 卢氏县| 博湖县| 安庆市|