李霞 劉建平 紀佳琪
摘 要:為了達到準確預測河北省旅游客流量的目標,首先利用量子Bloch球面坐標和邏輯自映射混沌對樽海鞘群算法(SSA)進行修正,得到改良的樽海鞘群算法(ISSA)。然后利用ISSA對快速學習網(FLN)的輸入權值和閾值進行尋優(yōu),建立泛化能力更好的混合智能模型(ISSA-FLN)。利用建立的ISSA-FLN模型預測河北省旅游客流量,并與其他模型進行比較,結果表明,ISSA-FLN比其他模型更能準確地預測旅游客流量,為旅游客流量預測提供一種方法。
關鍵詞:旅游客流量;樽海鞘群算法;快速學習網;Bloch球面坐標;邏輯自映射混沌
中圖分類號:TP399;F59 ?文獻標識碼:A ?文章編號:1673-260X(2021)06-0033-05
旅游業(yè)在21世紀已經成為許多地區(qū)新興的經濟增長點。旅游客流量預測是旅游經濟學中常研究的課題之一。準確地預測旅游客流量,便于對基礎設施改建、交通工具選擇和住宿地點規(guī)劃等任務做出明智的選擇,能夠預防突發(fā)事件的發(fā)生,是政府和旅游部門制定旅游有關決策的一個重要依據(jù),同時為游客制定出行計劃提供必要參考。因此,開發(fā)有效的模型來預測旅游需求成為關鍵問題。
國際上對旅游客流量的研究始于20世紀80年代初期,主要采用的是計量經濟學模型和時間序列模型。近些年,基于人工智能(AI)的預測模型引起了越來越多的關注[1]。AI模型有三個優(yōu)點:首先,考慮到旅游客流量序列的內在復雜性和旅游市場的演化性質,旅游客流量序列往往是嘈雜的、條件非平穩(wěn)的。這些特點對用于分析平穩(wěn)時間序列的傳統(tǒng)預測技術,如計量經濟模型和時間序列模型構成了巨大的障礙。其次,基于人工智能的模型具有強大的可行性和靈活性,這使得它們對不完美的數(shù)據(jù)具有魯棒性。這類模型能夠解釋非線性復雜的數(shù)據(jù),即使在沒有輸入和輸出變量之間關系的先驗知識的情況下,依據(jù)它們強大的可行性和靈活性同樣能夠處理非平穩(wěn)和不完美的數(shù)據(jù)。再次,基于人工智能的模型泛化能力強,可以識別和學習輸入和輸出數(shù)據(jù)間的相關模式。一旦經過訓練,就可以用來預測新數(shù)據(jù)集的輸出。這些優(yōu)點使它們非常適合解決多元非線性的復雜分析與預測問題。
考慮到這些優(yōu)點,越來越多的AI技術被應用于旅游客流量預測,包括支持向量機回歸[2]、模糊時間序列[3]、人工神經網絡[4]等。大量的實驗驗證表明,這些模型通常預測性能表現(xiàn)良好。作為最常用的AI技術,人工神經網絡模型已證明在處理數(shù)據(jù)中具有強大的可行性和靈活性,可以用于處理幾乎任何類型的非線性數(shù)據(jù)。
快速學習網(FLN)[5]是最近幾年提出的一種新型并行前饋神經網絡。FLN在訓練過程中,輸入權重和隱藏層閾值隨機生成,輸出權值不用迭代計算,極大地減少了訓練時間。而且,由于該網絡是并行結構,輸出層既可以接受隱藏層傳輸?shù)男畔ⅲ挚梢灾苯咏邮茌斎雽觽鬏數(shù)男畔?,提高了對未知樣本的泛化性能。目前,F(xiàn)LN已經被廣泛應用于污染物排放[6]、汽輪機熱耗率[7]、高爐鐵水硅含量[8]等各種工程預測中,且取得了良好的預測效果。因此,本文利用FLN建立河北省旅游客流量預測模型。
樽海鞘群算法(SSA)[9]是一種新提出的元啟發(fā)式智能優(yōu)化算法。樽海鞘在覓食期間形成樽海鞘鏈,SSA是從這種群智能行為中抽象出來的一種優(yōu)化方法,具有魯棒性強、參數(shù)少、操作簡便、速度快等優(yōu)點。因此被用于許多領域。如垃圾郵件分類[10]、機器人路徑規(guī)劃[11]等。然而,基于群體的智能優(yōu)化算法在求解多模態(tài)問題時,容易出現(xiàn)早熟現(xiàn)象,陷入局部極小,SSA也是如此。因此,對SSA進行改進提高,顯得非常有必要。
為了進一步提高SSA收斂精度,加快收斂速度,防止過早收斂,本論文利用量子比特的Bloch球面坐標編碼生成高質量的初始種群,然后利用邏輯自映射混沌替代原算法均勻分布生成SSA重要的參數(shù),提高迭代過程中解的多樣性,增強探索能力,從而提出改良的樽海鞘群算法(ISSA)。另一方面,隨機生成的FLN輸入權值和閾值,可能不是最優(yōu)的網絡參數(shù),導致泛化性能降低,故本論文采用ISSA對FLN參數(shù)進行尋優(yōu),找到最優(yōu)的模型參數(shù),從而建立更加精確的旅游客流量預測ISSA-FLN模型,并與FLN、SCA[12]-FLN和ISSA-FLN三種模型進行比較。
1 FLN網絡
FLN是一種單隱藏層前饋并行神經網絡結構,如圖1所示。
假設有任意M個不同的樣本,(xs,ys)∈Rn×M×Rl×M,s=1,2,…,M,F(xiàn)LN的隱藏層神經元設置為m個,隱藏層的閾值向量=[b1,b2,…,bm]T,隱藏層激勵函數(shù)為可微函數(shù)g(·),輸入權值矩陣為W=(wji)m×n,輸出層與隱藏層之間的輸出權值矩陣為U=(ukj)l×m,輸出層與輸入層之間的輸出權值矩陣為V=(vk×i)l×n。FLN輸出可用公式(1)得到。
在FLN中,W和b在區(qū)間[-1,1]上隨機產生,U和V根據(jù)最小二乘原理,利用矩陣的廣義逆解析得到[5]。
2 樽海鞘群算法
SSA是受到深海中的樽海鞘游行和覓食行為啟發(fā)提出的。多個樽海鞘在群體活動中形成許多個樽海鞘鏈,每個鏈的前端都有一個領導者,其余作為追隨者。領導者指導鏈中每個樽海鞘的活動,跟隨者遵循領導者以及鏈中的每個成員的行為。
假設由食物源F構成的d維搜索空間,領導者根據(jù)公式(2)更新其位置。
x1j=Fj+r1[(ubj-lbj)r2+lbj],r3≥0.5Fj-r1[(ubj-lbj)r2+lbj],r3<0.5 ?(2)
其中,F(xiàn)j是食物源的第j維位置;x1j表示第一個樽海鞘的第j維位置,即為領導者;ubj與lbj分別代表搜索空間第j維的最大值和最小值;r2和r3為[0,1]上服從均勻分布的隨機數(shù),r1由下面(3)確定。
其中t為當前迭代次數(shù),T為最大迭代次數(shù)。由(3)可知,r1隨著迭代次數(shù)自適應遞減,用來平衡算法的探索能力和開采性能。
領導者位置更新后,跟隨者也隨之移動,其位置更新的公式如下:
其中xij表示第i個跟隨者的第j維位置,N為樽海鞘鏈的個數(shù)。
3 改良的樽海鞘群算法
SSA原理簡單,控制參數(shù)少,魯棒性強。然而,由于SSA中隨機產生初始種群,有可能影響初始解的質量和算法的收斂速度。為此,本論文提出基于量子比特的Bloch球面坐標生成初始種群。
3.1 利用量子比特的Bloch球面坐標生成初始種群
最后,根據(jù)適應度值選出最優(yōu)的N個樽海鞘鏈作為ISSA的初始種群。這種生成解的方式擴大了最優(yōu)解的選擇范圍,能更大概率地找到性能更優(yōu)良的初始解,從而提高算法的性能。
3.2 邏輯自映射混沌替代均勻分布產生
混沌是一種現(xiàn)象,它不僅有與隨機性相同的特性,而且有更好的動態(tài)和統(tǒng)計特性以及對初始條件的敏感性和遍歷性。這些特性可以保證生成解的多樣性,這種多樣性就足以達到多模態(tài)問題的每一個模態(tài)[14]。結合這些特性可知,混沌可以顯著提高群智能優(yōu)化算法的性能。
邏輯自映射混沌結構簡單,生成的軌跡有很好的遍歷性和均勻性[15],因此本論文使用該混沌替代SSA算法中的均勻分布產生參數(shù)r2,嵌入到領導者更新位置(2)中幫助SSA跳出局部極小,增加找到全局最優(yōu)解的概率。邏輯自映射混沌的迭代公式如下:
wt+1=1-2wt2,-1≤wt≤1,t=0,1,2,… ?(10)
本論文把基于量子Bloch球面坐標產生初始種群和邏輯自映射混沌產生參數(shù)r2的SSA稱為ISSA。綜上所述,ISSA偽代碼如表1所示。
5 ISSA-FLN預測河北省旅游客流量
5.1 數(shù)據(jù)描繪
旅游數(shù)據(jù)為從1990年至2019年共30年的河北省旅游人次,如表2所示,數(shù)據(jù)來源于河北省統(tǒng)計年鑒。由表2可以看出河北省旅游人數(shù)從1990年的1541.8萬人次到2019年的78188.0萬人次,上升趨勢非常明顯。本文選取1990-2018年河北省游客數(shù)量構成的輸入變量作為訓練數(shù)據(jù),以2018年、2019年客流量作為測試數(shù)據(jù)用于驗證模型的性能。在FLN中,輸入變量為依次三個年份的客流量,輸出變量為輸入變量對應的下一個年份的客流量,激勵函數(shù)為g(x)=1/(1+e-x)。
5.2 ISSA-FLN模型的建立
為了增強FLN的逼近能力和泛化性能,利用ISSA調整FLN的輸入權值和閾值,得到最優(yōu)的模型參數(shù),然后建立河北省旅游客流量混合預測SSA-FLN模型。為建立ISSA-FLN模型,優(yōu)化目標函數(shù)為
其中M為訓練樣本的個數(shù),wji∈[-1,1],?著=[w11,w12,…,w1n,…,wm1,wm2…,wmn,b1,…,bm]T和bj∈[-1,1],j=1,2,…,m。通過多次仿真實驗,F(xiàn)LN隱藏層神經元的個數(shù)設置為10,所有優(yōu)化算法的種群個數(shù)為30。為了防止FLN過擬合,所有優(yōu)化算法的最大迭代次數(shù)設置為20。ISSA-FLN建模過程如圖3所示。
5.3 仿真結果分析
為了說明ISSA-FLN模型的預測效果,本文使用均方根誤差RMSE,平均絕對誤差MAE和平均絕對百分比誤差MAPE 3個指標來評價模型性能。
表3和表4給出了四種模型預測的河北省旅游客流量的精度比較。從表3可以看出,ISSA-FLN模型在預測樣本上的RMSE為0.6751×103,MAE為0.4940×103,MAPE為7.4%,3個性能評價指標均小于其他3種模型,表明ISSA-FLN逼近能力在四種方法上是最好的。從表4可以看出,ISSA-FLN模型在預測樣本上的RMSE為1.2591×103,MAE為1.0792×103,MAPE為1.4%,與其他模型相比,ISSA-FLN模型的3個性能指標明顯下降。因此ISSA-FLN模型泛化性能優(yōu)于其他3種模型。
圖4和圖5清晰地展示了ISSA-FLN的逼近性能和泛化能力??梢奍SSA-FLN較為準確的跟蹤客流量變化趨勢,誤差較小,為準確預測河北省旅游客流量提供一種方法。
6 結論
以近些年河北省旅游客流量為研究對象,利用基于量子比特的Bloch球面坐標編碼和邏輯自映射混沌的ISSA優(yōu)化FLN的模型參數(shù),建立了河北省旅游客流量預測ISSA-FLN混合模型。為了驗證提出模型的預測性能,本論文比較了FLN、SCA-FLN和SSA-FLN模型的預測結果。結果表明ISSA-FLN比其他模型預測旅游客流量精度更高,預測結果更加準確。
參考文獻:
〔1〕Tang L A, Wang J B, Zhao C B. Mode decomposition method integrating mode reconstruction, feature extraction, and ELM for tourist arrival forecasting[J]. Chaos, Solitons & Fractals, 2021, 143: 110423.
〔2〕王蘭梅,陳崇成,葉曉燕,等.網絡搜索數(shù)據(jù)和GWO-SVR模型的旅游短期客流量預測[J].福州大學學報(自然科學版),2019,47(05):598-603.
〔3〕趙娟,江立輝.旅游客流量預測的模糊時間序列模型——以黃山風景區(qū)為例[J].合肥學院學報(自然科學版),2014,31(04):26-31.
〔4〕宮園園,艾宏志.RBF神經網絡的境外旅游人數(shù)預測模型研究[J].計算技術與自動化,2020,39(04):159-162.
〔5〕Li G Q, Niu P F, Duan X H, et al. Fast learning network: a novel artificial neural network with a fast learning speed[J]. Neural Computing & Applications, 2014, 24 (7-8): 1683-1695.
〔6〕李霞,牛培峰,馬云鵬,等.基于改良的雞群優(yōu)化算法優(yōu)化鍋爐NOx排放質量濃度[J].動力工程學報,2017,37(04):293-300.
〔7〕牛培峰,吳志良,馬云鵬,等.基于鯨魚優(yōu)化算法的汽輪機熱耗率模型預測[J].化工學報,2017,95(03):1049-1057.
〔8〕Zhao X D, Fang Y M, Lu L, et al. Ameliorated moth-flame algorithm and its application for modeling of silicon content in liquid iron of blast furnace based fast learning network[J]. Applied Soft Computing, 2020, 94: 106418.
〔9〕Mirjalili S, AMIR H. G, Mirjalili S Z, et al. Salp Swarm Algorithm: A bio-inspired optimizer for engineering design problems [J]. Advances in Engineering Software, 2017, 114: 163-191.
〔10〕劉芳瑞,陳宏偉.基于改進樽海鞘群算法的垃圾郵件分類[J].湖北工業(yè)大學學報,2021,36(01):61 -64.
〔11〕王秋萍,王彥軍,戴芳.多策略集成的樽海鞘群算法的機器人路徑規(guī)劃[J].電子學報,2020,48(11):2101-2113.
〔12〕Bhadoria A, Marwaha S, Kamboj V K. An optimum forceful generation scheduling and unit commitment of thermal power system using sine cosine algorithm[J]. Neural Computing and Applications, 2020, 32(01): 1-30.
〔13〕Li P C. A quantum-behaved evolutionary algorithm based on the Bloch spherical search [J]. Communications in Nonlinear Science & Numerical Simulation, 2014, 19(04): 763-771.
〔14〕Wang G G, Guo L, Gandomi A H, et al. Chaotic Krill Herd algorithm[J]. Information Sciences, 2014, 274: 17-34.
〔15〕Li X, Niu P F, Liu J P. Combustion optimization of a boiler based on the chaos and lévy flight vortex search algorithm[J]. Applied Mathematical Modelling, 2018: 58: 3:18.