王馨玉
(西安石油大學(xué) 計算機(jī)學(xué)院, 西安 710065)
隨著社會的發(fā)展,越來越多的人選擇出門旅游。對于城市、景區(qū)、酒店而言,需要依據(jù)淡旺季、客流量等因素調(diào)整規(guī)劃和安排。因此,準(zhǔn)確預(yù)測旅游需求量顯得至關(guān)重要。
目前有很多的旅游需求量預(yù)測模型,但可解釋性高的旅游需求量預(yù)測模型更值得信賴,也更有可能被有關(guān)部門所采納。對于旅游規(guī)劃者而言,探索出最影響旅游規(guī)劃統(tǒng)籌的因素是非常重要的。通過對模型應(yīng)用的解釋,找出對旅游量影響的最主要的因素,從而制定出更好的旅游規(guī)劃。對于模型開發(fā)者而言,模型的可解釋性有助于在特定的情況(如過擬合等)下對模型進(jìn)行修改。因此,本文針對旅游需求量預(yù)測模型進(jìn)行了研究。
時間序列模型解釋了一個關(guān)于其自身過去的變量和一個隨機(jī)干擾項,探索所涉及的時間序列的歷史趨勢和相關(guān)因素(如季節(jié)性),并根據(jù)模型中確定的趨勢和因素預(yù)測該序列的未來。
在使用時間序列預(yù)測技術(shù)的研究中,超過2/3的研究使用了不同版本的ARIMA模型。根據(jù)時間序列的頻率,可以是簡單的ARIMA,也可以是季節(jié)性的ARIMA。由于季節(jié)性是旅游業(yè)的一個主要特征,因此決策者對旅游需求的季節(jié)性變化非常感興趣,所以在近幾年中,季節(jié)性的ARIMA來越受歡迎。關(guān)于ARIMA和SARIMA模型的預(yù)測性能,實證研究提供了相互矛盾的證據(jù)。例如,ARIMA模型在所有情況下都優(yōu)于AR模型和MA模型。SARIMA模型優(yōu)于ARIMA、ARMA等其他8種時間序列方法,而非季節(jié)性ARIMA模型的性能高于所有考慮的預(yù)測模型的平均值。
與時間序列模型相比,計量經(jīng)濟(jì)學(xué)方法的主要優(yōu)勢之一在于能夠分析旅游需求(因變量)及其影響因素(解釋變量)之間的因果關(guān)系。計量經(jīng)濟(jì)學(xué)分析“除了作為一種產(chǎn)生預(yù)測的工具之外,還發(fā)揮了許多有益的作用;例如,這些模型鞏固了現(xiàn)有的關(guān)于經(jīng)濟(jì)如何運作的經(jīng)驗和理論知識,為漸進(jìn)的研究戰(zhàn)略提供了框架,并有助于解釋其自身的失敗”。就旅游需求而言,計量經(jīng)濟(jì)學(xué)分析從經(jīng)濟(jì)學(xué)家的角度解釋旅游需求變化、證明政策建議以及評價現(xiàn)有旅游政策的有效性等方面具有實證意義。相反,在企業(yè)和政府主要關(guān)注的情況下,時間序列模型對于旅游需求和其他相關(guān)因素之間相互依賴的關(guān)系是沒有幫助的。
粗糙集方法通過結(jié)合經(jīng)典集理論對不精確、不確定或不完整的知識(數(shù)據(jù))進(jìn)行分類分析,是一種決策規(guī)則歸納法,用于對一組混合的數(shù)值變量和非數(shù)值變量之間的關(guān)系進(jìn)行建模。它在旅游需求分析中的應(yīng)用分別用于旅游購物、餐飲和觀光支出分析。與經(jīng)典的回歸模型不同,粗糙集方法非常關(guān)注人口特征等分類變量,并根據(jù)這些變量之間的模型關(guān)系,預(yù)測與每個人口類別相關(guān)的旅游需求水平(而不是精確值),因此被認(rèn)為是從微觀角度分析旅游需求的計量經(jīng)濟(jì)模型的一個有用的補(bǔ)充工具。
模糊時間序列法在分析具有有限觀測值的短時間序列時具有優(yōu)勢?;疑碚撏瑯雨P(guān)注模型的不確定性和信息不足。研究者將模糊時間序列和灰色理論應(yīng)用于旅游需求預(yù)測,利用模糊時間序列、灰色模型和馬爾科夫修正灰色模型等三種模型,僅利用12項年度數(shù)據(jù),對香港、德國和美國赴臺旅游人數(shù)進(jìn)行建模和預(yù)測。模糊時間序列模型預(yù)測性能的一致性有待進(jìn)一步研究。
遺傳算法(GAs)是基于自然選擇和遺傳進(jìn)化思想的自適應(yīng)、啟發(fā)式搜索算法,通常被認(rèn)為是一種優(yōu)化方法。大量研究表明 , GAs適合解釋旅游需求構(gòu)成的變化。支持向量機(jī)(SVM)是另一種可用于解決分類、非線性回歸估計和預(yù)測問題的人工智能技術(shù)[1]。
為了實現(xiàn)對時間維度和數(shù)據(jù)特征的可解釋預(yù)測,本文開發(fā)了一個兩階段CNN架構(gòu)。第一階段是一個卷積層和一個k×1維卷積濾波器,學(xué)習(xí)過濾器識別出的,出現(xiàn)在不同情況下的重要的行為模式;第二階段是一個1×1維卷積濾波器,可用于最先進(jìn)的網(wǎng)絡(luò),如應(yīng)用于最初的模型中,將第一階段生成的特征映射的數(shù)量減少到1,即可以在第二階段使用一維卷積。一維卷積使用的濾波器大小為k×n,其中n是特征數(shù)。使用一維過濾器可以提取所有特征中出現(xiàn)的重要行為模式。
通過這兩個階段,在網(wǎng)絡(luò)模型中保持了多元時間序列的時間和空間動態(tài),基于梯度的方法來生成顯著性圖,也稱為屬性圖,以提取網(wǎng)絡(luò)的注意力,可以認(rèn)為它與對時間間隔和特征的預(yù)測最相關(guān)。
使用grad-CAM方法生成屬性圖。分別對產(chǎn)生fmaps=[f2d,f1d]特征圖的兩個階段的最后一層應(yīng)用grad-CAM,對于每個通用特征映射A上的每個激活單元u,獲得一個與特定類輸出c相關(guān)聯(lián)的重要性權(quán)重wc,計算輸出分?jǐn)?shù)yc相對于A的梯度,對A進(jìn)行全局平均,公式(1):
(1)
其中,Z為a的單位總數(shù),在二維情況下,激活單位u為二維坐標(biāo){i,j}。
使用wc計算c類所有特征映射之間的加權(quán)組合,使用ReLU來刪除負(fù)面影響,公式(2):
(2)
一些模型本身是具有可解釋性的,如線性模型、決策樹等。而很多機(jī)器學(xué)習(xí)模型是不具備可解釋性的,對不可解釋性模型的解釋需要通過可解釋性模型,即用可解釋性模型去模擬擬合不可解釋性模型。
模型擬合過程如圖1所示。
圖1模型擬合
無法用一個新模型去完全地模擬黑盒模型的行為,只能用新模型模仿一部分黑盒模型的行為。LIME模型的原理如圖2所示。
(1)找出一個待解釋的數(shù)據(jù)點;
(2)在該數(shù)據(jù)點的附近進(jìn)行數(shù)據(jù)點的取樣;
(3)訓(xùn)練一個新模型使其可以模仿這個黑盒模型在樣本點這個區(qū)域內(nèi)的行為;
圖2 LIME方法
可解釋性是指人能夠理解模型在其決策過程中所做出的選擇,例如怎么決策、為什么決策和決策了什么,模型的可解釋性對于相關(guān)單位解釋模型的每一個決策至關(guān)重要。本文綜合探討了常見的旅游需求量預(yù)測模型以及模型的構(gòu)建及其可解釋性。有關(guān)單位提供的數(shù)據(jù)通過可解釋性模型預(yù)測出的可解釋性的數(shù)據(jù),能夠使這些單位更加具有針對性的做出決策(如旅游淡旺季分別開設(shè)旅游大巴數(shù)量、門票設(shè)置、安保人員設(shè)置等等),模型的可解釋性研究將進(jìn)一步發(fā)展,今后會為有關(guān)單位反饋更加精準(zhǔn)的決策數(shù)據(jù)。