趙烜
摘 要:收益管理對(duì)于航空公司而言至關(guān)重要,訂座需求預(yù)測(cè)是實(shí)現(xiàn)收益精細(xì)化管理的重要手段,直接影響航空公司對(duì)未來(lái)市場(chǎng)的把控。準(zhǔn)確預(yù)測(cè)訂座需求,可以增強(qiáng)航空公司市場(chǎng)競(jìng)爭(zhēng)力。面對(duì)目前收益管理軟件較難適應(yīng)國(guó)內(nèi)市場(chǎng),對(duì)未來(lái)訂座預(yù)測(cè)不準(zhǔn)確的現(xiàn)狀,深入分析國(guó)內(nèi)外研究成果,探討幾種主流訂座需求預(yù)測(cè)模型優(yōu)缺點(diǎn),并介紹每個(gè)模型在民航訂座領(lǐng)域的適用性,最后給出結(jié)論及下一步研究方向。
關(guān)鍵詞:收益管理;訂座需求;預(yù)測(cè)模型;機(jī)器學(xué)習(xí);組合模型;研究綜述
DOI:10. 11907/rjdk. 201348??????????????????????????????????????????????????????????????????????????????????????????????????????? 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
中圖分類號(hào):TP312文獻(xiàn)標(biāo)識(shí)碼:A?????????????????????????????? 文章編號(hào):1672-7800(2020)011-0279-03
Review of Civil Aviation Reservation Demand Forecasting Algorithms
ZHAO Xuan
(School of Mathematics, Shandong University, Jinan 250100, China)
Abstract: Forecasting reservation demand is an important means for airlines to achieve refined revenue management, and it directly affects airlines control over the future market. Accurate prediction can enhance the market competitiveness of the airline. Facing the situation that the current revenue management software is difficult to adapt to domestic market and could not forecast future reservation accurately, this paper deeply analyzes the domestic and foreign research,discusses the advantages and disadvantages of several mainstream reservation demand forecasting models, and introduces the applicability of each model in the field of civil aviation reservation. Finally, the conclusions and possible research direction in the future are given.
Key Words:? revenue management; reservation demand; prediction model; machine learning; combined model; literature review
0 引言
目前,國(guó)內(nèi)民航業(yè)發(fā)展迅速,各航空公司在保障安全飛行的同時(shí),不斷引進(jìn)飛機(jī),擴(kuò)大機(jī)隊(duì)規(guī)模,導(dǎo)致航司之間的競(jìng)爭(zhēng)異常激烈,熱門航線通常有幾家航司共飛。占據(jù)市場(chǎng)優(yōu)勢(shì)、收益精細(xì)化管理是各家航司實(shí)現(xiàn)發(fā)展的重要手段,科學(xué)、嚴(yán)密、高效的收益管理策略將助力航空公司在競(jìng)爭(zhēng)中勝出。收益管理系統(tǒng)通過(guò)對(duì)客流量的預(yù)測(cè)進(jìn)行艙位控制,確定艙位最佳組合,然后進(jìn)行收艙、放艙操作,以達(dá)到收益最大化目的。訂座需求預(yù)測(cè)是收益管理的重要組成部分,其受諸多因素影響,比如數(shù)據(jù)本身錯(cuò)綜復(fù)雜,內(nèi)在規(guī)律難以確定,既有線性特征關(guān)系,又有非線性特征關(guān)系,同時(shí)也受重大事件、天氣、節(jié)假日、季節(jié)等因素影響,對(duì)預(yù)測(cè)模型建立帶來(lái)巨大困難。目前,行業(yè)內(nèi)常用手段是利用國(guó)內(nèi)外收益管理軟件包含的一些常規(guī)預(yù)測(cè)算法,將數(shù)據(jù)導(dǎo)入預(yù)測(cè)模塊,簡(jiǎn)單預(yù)測(cè)后進(jìn)行可視化分析。這些算法通?;趥鹘y(tǒng)統(tǒng)計(jì)學(xué)理論知識(shí)而建立,對(duì)于客源穩(wěn)定、競(jìng)爭(zhēng)不激烈甚至獨(dú)飛航線的預(yù)測(cè)效果較好,基本可以滿足航班管控需求。由于國(guó)內(nèi)航空不同于國(guó)外市場(chǎng),本土公司較多、市場(chǎng)復(fù)雜,各航司之間的競(jìng)爭(zhēng)也日益激烈,基于簡(jiǎn)單統(tǒng)計(jì)計(jì)算往往準(zhǔn)確性不高、誤差較大。針對(duì)此現(xiàn)狀,本文研究多種主流預(yù)測(cè)模型在旅客訂座中的應(yīng)用,并分析模型預(yù)測(cè)效果,給出合理使用建議。
1 傳統(tǒng)模型
傳統(tǒng)模型采用經(jīng)典統(tǒng)計(jì)學(xué)理論知識(shí),通過(guò)待預(yù)測(cè)日期與某些日期之間的內(nèi)在關(guān)系,建立特定模型進(jìn)行預(yù)測(cè)分析。在進(jìn)行訂座數(shù)據(jù)預(yù)測(cè)時(shí),常用的傳統(tǒng)預(yù)測(cè)算法包括:增量法[1]、ARIMA模型、回歸分析法。
增量法是目前使用較為廣泛的預(yù)測(cè)訂座需求算法,已被收益管理軟件PROS采用,可分為古典增量法、改進(jìn)增量法。預(yù)測(cè)原理是根據(jù)航班歷史訂座成長(zhǎng)趨勢(shì)數(shù)據(jù),計(jì)算未來(lái)航班訂座潛在增量,加上當(dāng)前已產(chǎn)生的訂座數(shù)據(jù),將其作為最終預(yù)測(cè)結(jié)果。計(jì)算公式如式(1)所示。
BKDn=BKDn0+δBKD??????? (1)
其中,BKDn表示待預(yù)測(cè)訂座數(shù),BKDn0表示當(dāng)前訂座數(shù),δBKD表示產(chǎn)生的訂座增量。古典增量法與改進(jìn)增量法的區(qū)別是改進(jìn)增量法采用了未離港航班訂座數(shù)據(jù),將訂座大區(qū)間劃分為更小區(qū)間,在每個(gè)小區(qū)間上計(jì)算一個(gè)增量,然后進(jìn)行累加。但是,這兩種算法并無(wú)本質(zhì)區(qū)別,都是利用特定歷史航班日期的訂座數(shù)據(jù)規(guī)律,經(jīng)過(guò)統(tǒng)計(jì)計(jì)算,對(duì)未來(lái)航班的可能增量進(jìn)行預(yù)測(cè)。增量法原理較為簡(jiǎn)單,容易實(shí)現(xiàn),可用于客源穩(wěn)定市場(chǎng)的短期預(yù)測(cè),算法魯棒性較弱,對(duì)于競(jìng)爭(zhēng)激烈、客源不穩(wěn)定航線預(yù)測(cè)誤差較大。
ARIMA模型是最為常用的時(shí)間序列預(yù)測(cè)模型,在各行業(yè)應(yīng)用良好。該算法描述了待預(yù)測(cè)值與滯后值、隨機(jī)誤差項(xiàng)之間的線性關(guān)系,即使用有限個(gè)歷史訂座數(shù)據(jù)以及訂座誤差的線性組合,也能夠較準(zhǔn)確捕捉線性關(guān)系。模型計(jì)算公式如式(2)所示。
BKDt=k=1pαkBKDt-k+k=1qμkρt-k+ρt+c??? (2)
其中,p表示自回歸系數(shù),q表示滑動(dòng)平均數(shù),BKDt-k表示t-k時(shí)刻訂座數(shù),ρt-k表示殘差,αk、c表示待定系數(shù)。
文獻(xiàn)[2]—文獻(xiàn)[4]以月度為維度,研究ARIMA模型在民航訂座預(yù)測(cè)中的應(yīng)用,得到較為準(zhǔn)確的預(yù)測(cè)結(jié)果。文獻(xiàn)[5]以年度為單維度,采用ARIMA(2,2,1)模型對(duì)客運(yùn)量進(jìn)行分析,得到較好擬合效果,可用于短期預(yù)測(cè)。上述研究均是基于月度或者年度數(shù)據(jù),基數(shù)較大,數(shù)據(jù)穩(wěn)定性較好,能夠得到較高預(yù)測(cè)精度。然而,如果以天為維度,將會(huì)影響模型穩(wěn)定性。此外,ARIMA模型僅能描述數(shù)據(jù)之間的線性關(guān)系,在近似非線性關(guān)系方面準(zhǔn)確性不高。對(duì)于客源波動(dòng)較小的航線,往往能夠得到較為準(zhǔn)確的預(yù)測(cè)結(jié)果;反之,對(duì)于波動(dòng)較大的航線,預(yù)測(cè)誤差較大。
回歸分析法是一種比較經(jīng)典的預(yù)測(cè)算法,通過(guò)已知?dú)v史數(shù)據(jù)及影響因素建立一元或多元回歸模型,選擇擬合效果最好的模型進(jìn)行未來(lái)訂座數(shù)據(jù)預(yù)測(cè)。蔡文婷等[6]基于多元線性回歸模型、多元對(duì)數(shù)回歸模型對(duì)航空客運(yùn)量進(jìn)行建模分析,得到預(yù)測(cè)相對(duì)誤差小于0.1%的結(jié)果,但其僅僅考慮了數(shù)據(jù)序列內(nèi)部關(guān)系,并未引入社會(huì)、經(jīng)濟(jì)、政治等因素的影響;李維等[7]通過(guò)分析影響客流量的各種因素,建立偏最小二乘回歸模型,分析經(jīng)濟(jì)發(fā)展、對(duì)外開放等6個(gè)因素的影響效果,但并未深入分析各種因素的影響程度大小。
回歸分析法數(shù)學(xué)模型選取是一項(xiàng)較為困難的任務(wù),通常經(jīng)過(guò)反復(fù)實(shí)驗(yàn)才能得到準(zhǔn)確性較高的模型。此外,回歸模型建立需綜合考慮多種因素影響,并對(duì)各種因素進(jìn)行主成分分析、因子分析,挑選主影響因素,最終才能有效提高模型預(yù)測(cè)準(zhǔn)確度。
2 機(jī)器學(xué)習(xí)模型
近年來(lái),隨著大數(shù)據(jù)、人工智能的快速發(fā)展,以及計(jì)算機(jī)運(yùn)算能力的提升,機(jī)器學(xué)習(xí)算法在各行各業(yè)都有重要應(yīng)用?;跈C(jī)器學(xué)習(xí)的模型預(yù)測(cè)采用留出法等數(shù)據(jù)劃分技術(shù),將歷史訂座數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,在訓(xùn)練集上通過(guò)模型自主學(xué)習(xí)、自我優(yōu)化得到泛化能力強(qiáng)的模型,最終選擇出在測(cè)試集合中表現(xiàn)最好的模型。機(jī)器學(xué)習(xí)模型建模、預(yù)測(cè)過(guò)程如圖1所示。
模型通過(guò)自主學(xué)習(xí)得到最佳的權(quán)重參數(shù)組合,其準(zhǔn)確性決定了模型性能。目前,常用的權(quán)重參數(shù)更新方法是誤差逆向傳播法(BP),稱為BP神經(jīng)網(wǎng)絡(luò),如圖2所示,通過(guò)誤差的反向傳播,確定各環(huán)節(jié)權(quán)重參數(shù)的最優(yōu)組合。
航空公司數(shù)據(jù)庫(kù)中保存大量旅客訂座數(shù)據(jù),充分利用龐大的數(shù)據(jù)資產(chǎn),采用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行有價(jià)值的數(shù)據(jù)分析,是眾多學(xué)者研究的方向。演克武等[8]通過(guò)建立支持向量機(jī)模型對(duì)客流量進(jìn)行預(yù)測(cè),得到相對(duì)誤差均小于BPANN和線性回歸算法;Yang等[9]分別采用隨機(jī)森林、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)模型對(duì)北京至三亞的客流量進(jìn)行預(yù)測(cè),得到隨機(jī)森林預(yù)測(cè)精度更高的結(jié)果;王子位[10]構(gòu)建LSTM網(wǎng)絡(luò)預(yù)測(cè)民航流量,預(yù)測(cè)精度高于線性回歸、GM(1,1)算法。
上述研究成果僅僅依靠順序時(shí)間序列建立預(yù)測(cè)模型,即待預(yù)測(cè)訂座數(shù)只受相鄰時(shí)間點(diǎn)訂座數(shù)據(jù)影響,沒有考慮民航業(yè)的季節(jié)性、周期性。為此,王興云等[11]通過(guò)對(duì)歷史數(shù)據(jù)的主成分分析,得到一種考慮時(shí)間間隔的BP神經(jīng)網(wǎng)絡(luò)模型,此模型分析了節(jié)假日、季節(jié)等影響因素,其預(yù)測(cè)速度、精度均高于傳統(tǒng)增量法、回歸法。
目前研究中,從數(shù)據(jù)序列本身出發(fā),可以利用大量歷史數(shù)據(jù)挖掘數(shù)據(jù)之間的內(nèi)在關(guān)系,建立優(yōu)于傳統(tǒng)模型的預(yù)測(cè)算法,但是均未引入除數(shù)據(jù)序列本身之外的特征屬性,有效的特征提取有助于提高機(jī)器學(xué)習(xí)的準(zhǔn)確性及泛化能力。在訂座預(yù)測(cè)領(lǐng)域,旅客搜索熱度數(shù)據(jù)、大型會(huì)議數(shù)據(jù)、天氣數(shù)據(jù)等都是影響出行的重要特征,研究基于此類特征工程的機(jī)器學(xué)習(xí)算法對(duì)旅客訂座預(yù)測(cè)至關(guān)重要。
3 組合模型
組合模型預(yù)測(cè)的概念最早于1969年提出,Bates等[12]通過(guò)簡(jiǎn)單統(tǒng)計(jì)方法進(jìn)行權(quán)值確定進(jìn)而提高其精度。根據(jù)不同預(yù)測(cè)模型特點(diǎn),以及各自存在的問(wèn)題,組合模型成為一種較為普遍的預(yù)測(cè)方法[13-15]。其思想是先利用若干個(gè)單項(xiàng)模型進(jìn)行預(yù)測(cè),然后根據(jù)不同模型預(yù)測(cè)結(jié)果及誤差建立更加準(zhǔn)確的組合模型,流程如圖3所示。
組合模型預(yù)測(cè)訂座數(shù)統(tǒng)一表示如式(3)所示。
BKD=k=1nαkBKDk????? (3)
其中,BKDk表示各單項(xiàng)模型預(yù)測(cè)值,αk表示對(duì)應(yīng)權(quán)重。組合模型對(duì)各單項(xiàng)模型預(yù)測(cè)誤差的容忍度較高,通過(guò)權(quán)重組合可以減小單項(xiàng)模型預(yù)測(cè)偏差。權(quán)重參數(shù)的確定方法決定模型預(yù)測(cè)精度,常用優(yōu)化方法包括標(biāo)準(zhǔn)差法、最小誤差平方和法、最小絕對(duì)誤差法等。
張千露[16]通過(guò)指數(shù)平滑法、灰色預(yù)測(cè)法、ARIMA建立組合分析模型,結(jié)果顯示組合模型更加適用于中期預(yù)測(cè);楊新渥等[17]建立指數(shù)平滑模型、灰色預(yù)測(cè)、線性趨勢(shì)外推法的組合模型,對(duì)珠三角區(qū)域的民航運(yùn)輸量進(jìn)行分析。這兩種組合模型方法可以較為準(zhǔn)確地捕捉線性關(guān)系,對(duì)于非線性關(guān)系較強(qiáng)的數(shù)據(jù)序列預(yù)測(cè)效果較差。
為了克服上述研究缺陷,許多學(xué)者測(cè)試了不同組合模型的預(yù)測(cè)效果。堯姚等[18]利用ARIMA在線性預(yù)測(cè)以及BP神經(jīng)網(wǎng)絡(luò)在非線性預(yù)測(cè)方面的優(yōu)勢(shì),建立組合模型,得到優(yōu)于ARIMA模型的預(yù)測(cè)效果;王翠[19]討論灰色理論和RBF神經(jīng)網(wǎng)絡(luò)優(yōu)缺點(diǎn),綜合利用各自優(yōu)勢(shì),建立了灰色—RBF模型。實(shí)驗(yàn)結(jié)果顯示,組合模型在歷史數(shù)據(jù)擬合及計(jì)算簡(jiǎn)便性上都有較好表現(xiàn);文獻(xiàn)[20]—文獻(xiàn)[21]分別采用不同組合模型建模預(yù)測(cè),得到較高預(yù)測(cè)精度。
上述組合模型研究成果雖然在一定程度上達(dá)到了較高精度,但是建立過(guò)程依賴于單個(gè)模型,還需通過(guò)解決優(yōu)化問(wèn)題計(jì)算權(quán)重參數(shù),導(dǎo)致復(fù)雜度增加、耗時(shí)較長(zhǎng)。此外,權(quán)重參數(shù)選擇方法是模型建立的關(guān)鍵,不合適的權(quán)重組合反而會(huì)使組合后的模型誤差進(jìn)一步擴(kuò)大,參數(shù)優(yōu)化策略依然是值得研究的方向。
4 結(jié)語(yǔ)
本文選擇民航訂座預(yù)測(cè)常用算法,參考國(guó)內(nèi)外研究成果,對(duì)各算法優(yōu)缺點(diǎn)進(jìn)行分析。①傳統(tǒng)模型過(guò)程簡(jiǎn)單、容易操作,大部分都可以通過(guò)現(xiàn)有軟件模塊實(shí)現(xiàn),比較適合非技術(shù)人員使用,但是其預(yù)測(cè)能力有限,很難精準(zhǔn)捕捉數(shù)據(jù)信息所蘊(yùn)含的復(fù)雜非線性特征,并且預(yù)測(cè)之前一般需要先確定好使用模型,容錯(cuò)性較低;②機(jī)器學(xué)習(xí)模型理論復(fù)雜,操作繁瑣,需通過(guò)大量實(shí)驗(yàn)確定超參數(shù)設(shè)置,一般需根據(jù)新產(chǎn)生的數(shù)據(jù)反復(fù)訓(xùn)練模型,并且技術(shù)門檻較高,需要通過(guò)專業(yè)學(xué)習(xí),不適合非技術(shù)人員直接使用,但是模型確定后,利用模型預(yù)測(cè)未來(lái)訂座數(shù)據(jù)的流程較為簡(jiǎn)單,準(zhǔn)確性也較高;③組合模型可以利用不同模型的優(yōu)勢(shì),得到優(yōu)于各單項(xiàng)模型的結(jié)果,模型組合過(guò)程較為困難,需要選擇合適的組合方法,建模復(fù)雜性依賴于所采用的單項(xiàng)模型。
從目前研究成果可以看到,對(duì)于某個(gè)固定日期的訂座數(shù)據(jù)預(yù)測(cè)已有較為豐富的模型,訂座成長(zhǎng)過(guò)程分析預(yù)測(cè)模型可能是未來(lái)研究方向。此外,目前還沒有較為穩(wěn)定的預(yù)測(cè)模型,下一步將重點(diǎn)研究模型穩(wěn)定性。
參考文獻(xiàn):
[1] HEUREUX E. A new twist in forecasting short-term passenger pickup[C]. Proceedings of the 26th Annual AGIFORS Symposium,1986:234-247.
[2] 王婷. 民航客運(yùn)量的ARIMA模型與預(yù)測(cè)[J]. 五邑大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,21(1):42-46.
[3] 黃若冰. 基于ARIMA模型的中國(guó)民航客運(yùn)量預(yù)測(cè)[J]. 環(huán)球市場(chǎng),2016,24(6):103.
[4] 王蓉. 基于ARIMA模型的我國(guó)民航客運(yùn)量時(shí)序分析[J]. 蘭州石化職業(yè)技術(shù)學(xué)院學(xué)報(bào),2019,34(1):18-20.
[5] ZHAO X,ZHAO H. Empirical analysis and predictions of civil aviation passenger traffic based on ARIMA model[C]. Qingdao:3rd International Conference on Machinery, Materials and Information Technology Applications,2015.
[6] 蔡文婷,彭怡,陳秋吉. 基于多元回歸模型的航空運(yùn)輸客運(yùn)量預(yù)測(cè)[J]. 航空計(jì)算技術(shù),2019,49(4):50-53.
[7] 李維,肖紅專. 基于偏最小二乘回歸的民航客運(yùn)量預(yù)測(cè)與分析[J]. 科學(xué)技術(shù)創(chuàng)新,2017,21(26):45-46.
[8] 演克武,朱金福. 基于支持向量機(jī)回歸算法的航空公司客流量預(yù)測(cè)研究[J]. 企業(yè)經(jīng)濟(jì),2010,31(3):89-91.
[9] YANG H T,LIU X.Predictive simulation of airline passenger volume based on three models[C]. Internation Conference of Pioneering Computer Scientis-ts. Engineers and Educators, 2018:350-358.
[10] 王子位. 基于長(zhǎng)短期記憶網(wǎng)絡(luò)的民航流量預(yù)測(cè)方法[J]. 數(shù)字通信世界,2018,160(4):264-272.
[11] 王興云,樊瑋,吳桐水,等. 基于BP神經(jīng)網(wǎng)絡(luò)的航班需求預(yù)測(cè)模型[J]. 中國(guó)民航大學(xué)學(xué)報(bào),2004,22(6):44-49.
[12] BATES J M,GRANGER C W J.The combination of forecasts[J]. Journal of the Operational Research Society,1969,20(4): 451-468.
[13] RAPACHDE,STRAUSSJK.Forecasting US employment growth using forecast combining methods[J]. Journal of Forecasting,2008,27(1):75-93.
[14] 郭建利,程蕾,孫博超,等. 基于ARIMA-SVM的煤炭?jī)r(jià)格預(yù)測(cè)及實(shí)證研究[J]. 煤炭經(jīng)濟(jì)研究,2016,416(2):12-16.
[15] 袁磊. 基于ARIMA-LSSVM混合模型的股指預(yù)測(cè)研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2015.
[16] 張千露. 組合預(yù)測(cè)在我國(guó)民航客運(yùn)量預(yù)測(cè)的應(yīng)用[D]. 武漢:華中師范大學(xué),2018.
[17] 楊新渥,王翩然. 基于組合預(yù)測(cè)的民航運(yùn)輸量分析——以珠三角地區(qū)為例[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2019,49(8):301-309.
[18] 堯姚,陶靜,李毅. 基于ARIMA-BP組合模型的民航旅客運(yùn)輸量預(yù)測(cè)[J]. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015,25(12):147-151.
[19] 王翠. 基于灰色理論和RBF神經(jīng)網(wǎng)絡(luò)民航客運(yùn)量預(yù)測(cè)方法研究[D]. 北京:北京交通大學(xué),2008.
[20] CHENG L.Combined forecasting of civil aviation passenger volume based on ARIMA-regression[J].? International Journal of System Assurance Engineering and Management,2019,10(5):945-952.
[21] BAI D D,WEI J Y. The combined forecasting model based on wavelet analysis in the application of the civil aviation passenger traffic[C]. International Conference on Social Science,2015:2401-2404.
(責(zé)任編輯:孫 娟)