曹衛(wèi)東, 梁 陳
(中國(guó)民航大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 天津 300300)
航空公司為提高飛機(jī)使用率,通常采用由單架飛機(jī)一天內(nèi)連續(xù)執(zhí)行多個(gè)航班任務(wù)的航班鏈運(yùn)行方式,某架飛機(jī)若在執(zhí)行航班鏈的過(guò)程中未出現(xiàn)延誤情況,各過(guò)站機(jī)場(chǎng)的實(shí)際過(guò)站時(shí)間與計(jì)劃過(guò)站時(shí)間相差不大;但是當(dāng)航班鏈中發(fā)生了前航延誤,后續(xù)航班若再受到過(guò)站機(jī)場(chǎng)運(yùn)行效率較低或惡劣天氣等因素的影響,較大可能出現(xiàn)延誤波及,產(chǎn)生更多的航班延誤[1].因此,精準(zhǔn)估計(jì)航班過(guò)站時(shí)間可以幫助航空公司適時(shí)調(diào)整航班計(jì)劃,為機(jī)場(chǎng)進(jìn)行資源調(diào)配提供決策依據(jù),降低航空公司由航班鏈運(yùn)行的脆弱性導(dǎo)致的成本損失[2],同時(shí)幫助旅客及時(shí)調(diào)整出行計(jì)劃,降低旅客時(shí)間和經(jīng)濟(jì)損失.
針對(duì)航班延誤吸收與波及問(wèn)題,眾多學(xué)者從不同角度進(jìn)行研究.Chen等[3]通過(guò)隨機(jī)森林、LightGBM和XGBoost三種模型分別預(yù)測(cè)的結(jié)果進(jìn)行二次訓(xùn)練,提出了一種多模型融合的航班延誤預(yù)測(cè)模型;朱星輝等[4]依據(jù)基于航班延誤等級(jí),調(diào)整過(guò)站時(shí)間,提高航班計(jì)劃的魯棒性;高強(qiáng)等[5]利用波及延誤樹構(gòu)建以初始航班延誤為根節(jié)點(diǎn)觸發(fā)的延誤傳播過(guò)程,對(duì)航班過(guò)站松弛時(shí)間重分配,降低延誤時(shí)間.丁建立等[6]利用貝葉斯網(wǎng)絡(luò)增量學(xué)習(xí)的特性,依賴貝葉斯估計(jì)動(dòng)態(tài)修正貝葉斯網(wǎng)絡(luò)參數(shù),動(dòng)態(tài)更新過(guò)站時(shí)間估計(jì)值;邢志偉等[7]針對(duì)單機(jī)場(chǎng)服務(wù)保障流程數(shù)據(jù)采用貝葉斯網(wǎng)絡(luò)架構(gòu),再結(jié)合條件概率推理方法動(dòng)態(tài)估計(jì)了航班預(yù)計(jì)離港時(shí)間.何堅(jiān)等[8]基于多機(jī)場(chǎng)真實(shí)運(yùn)營(yíng)數(shù)據(jù),構(gòu)建了基于LightGBM的航班中轉(zhuǎn)時(shí)間預(yù)測(cè)模型.以上學(xué)者研究方法多采用有監(jiān)督的機(jī)器學(xué)習(xí)方法,預(yù)測(cè)效果受影響因素個(gè)數(shù)限制,為降低模型復(fù)雜度,提高模型準(zhǔn)確度,需先對(duì)航班、天氣等數(shù)據(jù)進(jìn)行特征提取,而深度學(xué)習(xí)模型可以增加輸入數(shù)據(jù)維度,自動(dòng)提取特征并較好地挖掘其中的潛在關(guān)系.
此外,航班鏈各機(jī)場(chǎng)過(guò)站數(shù)據(jù)隨航班計(jì)劃執(zhí)行航班狀態(tài)不斷更新,具有時(shí)序特性,數(shù)據(jù)更新時(shí)間間隔隨航班計(jì)劃安排長(zhǎng)短不一.LIM等[9]經(jīng)過(guò)實(shí)驗(yàn)探索發(fā)現(xiàn),基于深度學(xué)習(xí)的時(shí)間序列預(yù)測(cè)效果較優(yōu).注意力機(jī)制[10]模仿人類大腦的注意力思維方式,可通過(guò)網(wǎng)絡(luò)自主學(xué)習(xí)出的一組權(quán)重系數(shù),并以概率動(dòng)態(tài)加權(quán)的方式來(lái)強(qiáng)調(diào)關(guān)注目標(biāo)和抑制無(wú)效信息.Du等[11]采用一種融合注意力機(jī)制和雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Bi-LSTM)進(jìn)行時(shí)序數(shù)據(jù)預(yù)測(cè)方法,在預(yù)測(cè)精度和算法魯棒性方面取得較好的效果.綜上可以得到采用Bi-LSTM模型[12]在解決非固定時(shí)間步長(zhǎng)時(shí)序任務(wù)時(shí),具有充分探索全局上下文信息的能力,注意力機(jī)制[13]可以高效提取關(guān)注目標(biāo)主要特征信息.基于此,結(jié)合航班鏈過(guò)站數(shù)據(jù)的時(shí)序特征、數(shù)據(jù)量大、影響因素多等特性,提出了一種基于MA-BiLSTM (Mixed Attention based Bidirectional Long Short-Term Memory)的多時(shí)間窗航班過(guò)站時(shí)間估計(jì)方法.采用具有可以獲得雙向信息的Bi-LSTM模型進(jìn)行基礎(chǔ)建模,為更加高效選擇聚焦屬性,在Bi-LSTM網(wǎng)絡(luò)模型的基礎(chǔ)上增加時(shí)間和多維屬性的混合注意力機(jī)制,最后根據(jù)航班鏈執(zhí)行狀態(tài)設(shè)置不同長(zhǎng)度的時(shí)間窗,采用多時(shí)間窗滑動(dòng)推進(jìn)的方法對(duì)各機(jī)場(chǎng)過(guò)站時(shí)間進(jìn)行動(dòng)態(tài)估計(jì).
單架飛機(jī)一天內(nèi)通常會(huì)連續(xù)到達(dá)多個(gè)過(guò)站機(jī)場(chǎng),執(zhí)行多段航班,稱為航班鏈[14].如圖1所示,長(zhǎng)度為7的航班鏈.
圖1 長(zhǎng)度為7的航班鏈
在航班鏈中,飛機(jī)到達(dá)過(guò)站機(jī)場(chǎng)后,完成一系列航班過(guò)站保障流程和旅客登機(jī)程序等.如圖2所示,實(shí)際過(guò)站時(shí)間等于實(shí)際離港時(shí)間和前序?qū)嶋H到港時(shí)間之差.
圖2 航班過(guò)站流程
多數(shù)研究受限于數(shù)據(jù)難以收集,同時(shí)傳統(tǒng)機(jī)器學(xué)習(xí)方法對(duì)影響因素選擇個(gè)數(shù)有較高要求,既往研究選用的影響因素較少[6].本文在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上,結(jié)合專家經(jīng)驗(yàn),從天氣因素、機(jī)場(chǎng)因素、飛機(jī)因素及航班相關(guān)時(shí)間信息四個(gè)方面選擇影響因素.
根據(jù)機(jī)場(chǎng)天氣狀況可以判斷是否進(jìn)行航班起降,主要包括能見度等參考指標(biāo).其中天氣描述參考指標(biāo)綜合概括機(jī)場(chǎng)的天氣狀況,本文將其劃分為5個(gè)等級(jí),如表1所示.
用于量化機(jī)場(chǎng)規(guī)模和機(jī)場(chǎng)運(yùn)行效率,主要包括機(jī)場(chǎng)類型等.其中標(biāo)準(zhǔn)機(jī)場(chǎng)地面滑行時(shí)間是民航局為客觀反映不同機(jī)場(chǎng)實(shí)際地面運(yùn)行效率而設(shè)定的,如表2所示,將國(guó)內(nèi)機(jī)場(chǎng)分為4類,并給出對(duì)應(yīng)的標(biāo)準(zhǔn)機(jī)場(chǎng)地面滑行時(shí)間.
此外,過(guò)站機(jī)場(chǎng)小時(shí)吞吐量是指過(guò)站機(jī)場(chǎng)每小時(shí)到港航班架次和離港航班架次總和,為更準(zhǔn)確地描述機(jī)場(chǎng)實(shí)時(shí)運(yùn)營(yíng)效率,增加過(guò)站機(jī)場(chǎng)小時(shí)吞吐量為過(guò)站時(shí)間影響因素;機(jī)場(chǎng)停機(jī)位的遠(yuǎn)近會(huì)影響實(shí)際到港時(shí)間,增加是否為遠(yuǎn)機(jī)位作為影響因素.
表1 天氣描述等級(jí)
表2 全國(guó)機(jī)場(chǎng)等級(jí)
用于量化航空公司對(duì)航班計(jì)劃制定合理性以及應(yīng)急保障能力.其中,航空公司、機(jī)齡和座位數(shù)等飛機(jī)屬性不同,航班過(guò)站時(shí)間也會(huì)不同.當(dāng)航空公司和過(guò)站機(jī)場(chǎng)相同,機(jī)型越大,座位數(shù)越多,則過(guò)站時(shí)間越長(zhǎng).以某大型航空公司為例,根據(jù)不同機(jī)型的座位數(shù)、過(guò)站機(jī)場(chǎng),統(tǒng)計(jì)最小過(guò)站時(shí)間如表3所示.
表3 某大型航空公司最小過(guò)站時(shí)間(分鐘)
用于量化航班鏈相關(guān)時(shí)間信息,航班過(guò)站關(guān)鍵時(shí)間節(jié)點(diǎn)如圖2所示.首先,為探究各航段計(jì)劃飛行時(shí)間松弛度對(duì)航班延誤時(shí)間的影響,增加了計(jì)劃飛行時(shí)間和實(shí)際飛行時(shí)間作為影響因素.其次,為凸顯出季節(jié)、節(jié)假日和工作日對(duì)機(jī)場(chǎng)進(jìn)離港流量的影響,增加了相應(yīng)字段作為影響因素.同時(shí),為進(jìn)一步探究繁忙時(shí)段對(duì)航班鏈過(guò)站延誤波及的影響,增加了繁忙時(shí)段作為影響因素.
綜上,航班鏈航班的機(jī)場(chǎng)過(guò)站時(shí)間影響因素如圖3所示,其中灰色部分表示前序航班相關(guān)信息.
圖3 過(guò)站時(shí)間影響因素
構(gòu)建基于MA-BiLSTM網(wǎng)絡(luò)的航班過(guò)站時(shí)間動(dòng)態(tài)估計(jì)模型,以航班上、下游過(guò)站機(jī)場(chǎng)天氣因素、機(jī)場(chǎng)因素、飛機(jī)因素及航班相關(guān)時(shí)間因素作為模型輸入;再根據(jù)航班鏈執(zhí)行狀態(tài)設(shè)置不同長(zhǎng)度的時(shí)間窗,采用MA-BiLSTM模型預(yù)測(cè)出下游不同過(guò)站機(jī)場(chǎng)的預(yù)計(jì)過(guò)站時(shí)間;最后采用加權(quán)平均方法融合多時(shí)間窗估計(jì)結(jié)果,提高預(yù)測(cè)精度.
MA-BiLSTM模型由Bi-LSTM網(wǎng)絡(luò)層、Mixed Attention層和Dense層組成,結(jié)構(gòu)如圖4所示.模型是基于Bi-LSTM網(wǎng)絡(luò)對(duì)航班過(guò)站數(shù)據(jù)進(jìn)行建模,得到上游和下游機(jī)場(chǎng)過(guò)站數(shù)據(jù)序列之間的關(guān)系,再增加感知時(shí)間(Time)和多維屬性(Factor)的混合注意力機(jī)制(Mixed Attention),獲取上下游不同過(guò)站機(jī)場(chǎng)不同因素的影響重要程度,最終全連接層(Dense)輸出下游不同過(guò)站機(jī)場(chǎng)的預(yù)計(jì)過(guò)站時(shí)間.
圖4 MA-BiLSTM模型
Bi-LSTM[13]網(wǎng)絡(luò)層利用Bi-LSTM網(wǎng)絡(luò)可獲得雙向時(shí)序信息的特性,得到上游和下游機(jī)場(chǎng)間的時(shí)序記憶信息.Bi-LSTM是在LSTM[15]上擴(kuò)展,結(jié)合BRNN[16]原理,在輸入序列上分別地向前和向后訓(xùn)練兩個(gè)LSTM,其輸出由這兩個(gè)LSTM共同決定,從而可以充分學(xué)習(xí)某時(shí)刻過(guò)去和未來(lái)的時(shí)序信息[17].LSTM是在RNN[18]基礎(chǔ)上改進(jìn),其特有的記憶和遺忘方式,能夠解決許多使用固定長(zhǎng)度的時(shí)間窗無(wú)法解決的時(shí)間序列任務(wù).
遺忘門:
ft=σ(Wf[ht-1,xt]+bf)
(1)
輸入門:
it=σ(Wi[ht-1,xt]+bi)
(2)
(3)
(4)
輸出門:
yt=σ(Wy[ht-1,xt]+by)
(5)
ht=yt*tanh(ct)
(6)
(7)
(8)
(9)
設(shè)H表示對(duì)過(guò)站數(shù)據(jù)輸入時(shí)間序列進(jìn)行Bi-LSTM網(wǎng)絡(luò)構(gòu)建后得到的隱狀態(tài)矩陣,其中行向量代表同一變量的所有時(shí)間步構(gòu)成的向量集合,列向量代表同一時(shí)間步下的所有變量構(gòu)成的向量集合,H1和H2分別表示向前和向后兩個(gè)方向得到的隱狀態(tài)矩陣.具體描述如下:
(10)
Mixed Attention層分別針對(duì)時(shí)間和多維屬性進(jìn)行注意力訓(xùn)練,得到了混合注意力權(quán)重矩陣.具體計(jì)算如下:
(11)
(12)
(13)
(14)
qt=τ(Wc[Ct;ht;Cs;hs])+bq
(15)
式(11)~(15)中:αt表示當(dāng)前輸入的時(shí)間步為t時(shí)隱藏層的注意力權(quán)重,Ct表示各時(shí)間步加權(quán)平均后的權(quán)重;βs表示影響因素s對(duì)應(yīng)的注意力權(quán)重,Cs表示各因素加權(quán)平均后的權(quán)重;qt表示混合注意力機(jī)制結(jié)果輸出.
Dense層通過(guò)線性運(yùn)算得出下游各過(guò)站機(jī)場(chǎng)的預(yù)計(jì)過(guò)站時(shí)間.主要進(jìn)行MA-BiLSTM網(wǎng)絡(luò)層和輸出層之間的過(guò)渡,最終輸出預(yù)計(jì)過(guò)站時(shí)間向量y.
本文預(yù)測(cè)場(chǎng)景為:假設(shè)某飛機(jī)的航班計(jì)劃為一天連續(xù)飛行N趟航班,已知首航起飛已完成,后續(xù)經(jīng)過(guò)N-1個(gè)過(guò)站機(jī)場(chǎng),完成前i-1趟航班,到達(dá)第i個(gè)過(guò)站機(jī)場(chǎng),依據(jù)第i-k個(gè)至第i-1個(gè)過(guò)站數(shù)據(jù),預(yù)測(cè)此飛機(jī)在第i個(gè)至第i+j-1個(gè)過(guò)站機(jī)場(chǎng)的過(guò)站時(shí)間.其中,k表示上游過(guò)站機(jī)場(chǎng)個(gè)數(shù),j表示預(yù)測(cè)下游過(guò)站機(jī)場(chǎng)個(gè)數(shù).
定義I為模型輸入的航班鏈過(guò)站數(shù)據(jù)集合,表示如下:
(16)
式(16)中:n表示輸入過(guò)站數(shù)據(jù)總條數(shù),Xi表示第i條輸入過(guò)站數(shù)據(jù),xi,t表示第i條數(shù)據(jù)的第t個(gè)過(guò)站數(shù)據(jù)序列,分為離散型數(shù)據(jù)變量和連續(xù)型數(shù)據(jù)變量.離散型數(shù)據(jù)變量主要包括機(jī)場(chǎng)類型、航空公司等變量,由原始數(shù)據(jù)進(jìn)行One-Hot編碼[19]處理得到.連續(xù)型數(shù)據(jù)變量主要包括溫度、過(guò)站機(jī)場(chǎng)小時(shí)吞吐量和飛行時(shí)間等變量,使用Min-Max標(biāo)準(zhǔn)化法[11]對(duì)原始數(shù)據(jù)進(jìn)行歸一化得到.
定義O為模型輸出的過(guò)站數(shù)據(jù)集合,表示如下:
(17)
式(17)中:n表示輸出預(yù)計(jì)過(guò)站時(shí)間總條數(shù),Yi表示第i條輸出預(yù)計(jì)過(guò)站時(shí)間向量,yi,t為第i條數(shù)據(jù)預(yù)計(jì)第t個(gè)過(guò)站機(jī)場(chǎng)的過(guò)站時(shí)間,由模型輸出結(jié)果進(jìn)行歸一化還原后得到.
隨著航班鏈運(yùn)行狀態(tài)的變化,為及時(shí)降低因前航延誤帶來(lái)的延誤波及,采用多時(shí)間窗滑動(dòng)的方式進(jìn)行過(guò)站時(shí)間估計(jì),圖5為多時(shí)間窗航班過(guò)站時(shí)間估計(jì)流程圖.
圖5 多時(shí)間窗過(guò)站時(shí)間估計(jì)流程
具體流程如下所示:
步驟1輸入或更新航班鏈數(shù)據(jù).
步驟2判斷航班鏈最新過(guò)站完成狀態(tài),當(dāng)過(guò)站個(gè)數(shù)大于2時(shí),分別采用時(shí)間窗長(zhǎng)度為1,2,3模型進(jìn)行預(yù)測(cè),跳轉(zhuǎn)至第5步;否則跳轉(zhuǎn)至第3步.
步驟3當(dāng)過(guò)站個(gè)數(shù)為2時(shí),分別采用輸入時(shí)間窗長(zhǎng)度為1,2模型進(jìn)行預(yù)測(cè),跳轉(zhuǎn)至第5步;否則跳轉(zhuǎn)至第4步.
步驟4當(dāng)過(guò)站個(gè)數(shù)為1時(shí),采用輸入時(shí)間窗長(zhǎng)度為1模型進(jìn)行預(yù)測(cè),跳轉(zhuǎn)至第5步.
步驟5對(duì)多時(shí)間窗預(yù)測(cè)結(jié)果進(jìn)行融合,跳轉(zhuǎn)至第6步.
步驟6判斷航班鏈?zhǔn)欠駡?zhí)行完畢,如果否,等待更新航班鏈狀態(tài),跳轉(zhuǎn)至步驟1;否則流程結(jié)束.
實(shí)驗(yàn)原始數(shù)據(jù)為全國(guó)2019年一整年的真實(shí)航班數(shù)據(jù),覆蓋全國(guó)136個(gè)機(jī)場(chǎng),數(shù)據(jù)量約350萬(wàn)條.一條航班數(shù)據(jù)主要包含航班過(guò)站關(guān)鍵時(shí)間節(jié)點(diǎn)(見圖2)等字段,不包含前序航班相關(guān)數(shù)據(jù).需要先對(duì)航班數(shù)據(jù)進(jìn)行預(yù)處理轉(zhuǎn)化為航班鏈過(guò)站數(shù)據(jù),使用JetBrains PyCharm進(jìn)行編程實(shí)現(xiàn),運(yùn)行內(nèi)存為16G.
4.1.1 航班數(shù)據(jù)清洗
某飛機(jī)一天內(nèi)先后到達(dá)A、B、…等多個(gè)機(jī)場(chǎng),若航空公司售賣聯(lián)程機(jī)票,航班數(shù)據(jù)中可能同時(shí)包含A-B、B-C、…等單航段及A-(B)-C、B-(C)-D、…等多航段數(shù)據(jù),或者包含部分單航段和部分多航段數(shù)據(jù),對(duì)重復(fù)航段的數(shù)據(jù)進(jìn)行重組,保留最小的單航段數(shù)據(jù).
4.1.2 航班鏈過(guò)站數(shù)據(jù)集成
將得到的航班數(shù)據(jù)通過(guò)飛機(jī)注冊(cè)號(hào)這一唯一標(biāo)識(shí)來(lái)匹配同一架飛機(jī)執(zhí)行的航班;通過(guò)機(jī)場(chǎng)唯一標(biāo)識(shí)匹配天氣相關(guān)屬性數(shù)據(jù);通過(guò)飛機(jī)機(jī)型匹配飛機(jī)相關(guān)屬性數(shù)據(jù);通過(guò)日期拼接成航班鏈過(guò)站數(shù)據(jù).
4.1.3 航班鏈數(shù)據(jù)選擇
對(duì)航班鏈中每條過(guò)站數(shù)據(jù)的過(guò)站時(shí)間進(jìn)行過(guò)站時(shí)間等級(jí)統(tǒng)計(jì).根據(jù)時(shí)間長(zhǎng)度分為5個(gè)等級(jí),如表4所示.
表4 時(shí)間長(zhǎng)度等級(jí)
分析不同過(guò)站時(shí)間等級(jí)航班數(shù)占總過(guò)站架次百分比,其中計(jì)劃過(guò)站時(shí)間在Level 1范圍內(nèi)占比33%,但實(shí)際過(guò)站時(shí)間在Level 1范圍內(nèi)占比9%,大約24%航班過(guò)站時(shí)間高于計(jì)劃過(guò)站時(shí)間;計(jì)劃過(guò)站時(shí)間長(zhǎng)度和實(shí)際過(guò)站時(shí)間長(zhǎng)度在Level 5范圍內(nèi)占比穩(wěn)定,說(shuō)明當(dāng)過(guò)站時(shí)間大于4 h時(shí),過(guò)站時(shí)間安排較為充裕,較大可能將前序航班延誤吸收,因此設(shè)定當(dāng)過(guò)站時(shí)間大于4 h,表示航班鏈執(zhí)行末班航班.對(duì)數(shù)據(jù)集中航班鏈過(guò)站延誤時(shí)間進(jìn)行統(tǒng)計(jì),航班鏈執(zhí)行過(guò)程中發(fā)生過(guò)站延誤時(shí)間的航班占比約為20%,發(fā)生首航延誤的航班占比約為14%.
為探究航班鏈不同執(zhí)行狀態(tài)下,機(jī)場(chǎng)過(guò)站時(shí)間對(duì)后續(xù)航班延誤的影響,對(duì)航班鏈中占較大比重的未發(fā)生延誤數(shù)據(jù)進(jìn)行隨機(jī)采樣處理,使延誤與未延誤數(shù)據(jù)保持平衡,提高訓(xùn)練模型的魯棒性.
(18)
(19)
4.2.1 多模型對(duì)比分析
通常單架飛機(jī)單日過(guò)站機(jī)場(chǎng)個(gè)數(shù)約為2至6個(gè),即航班鏈長(zhǎng)度為3至7,航班鏈長(zhǎng)度為5占比總航班鏈個(gè)數(shù)的40%.選擇航班鏈長(zhǎng)度為5的航班鏈數(shù)據(jù)進(jìn)行MA-BiLSTM模型的準(zhǔn)確度評(píng)估,選用RNN[18]、LSTM[18]、Bi-LSTM[17]和Bi-LSTM+Att[11]四種作為對(duì)比模型.各模型基于Tensorflow框架進(jìn)行網(wǎng)絡(luò)構(gòu)建和訓(xùn)練,對(duì)每個(gè)模型多次訓(xùn)練調(diào)優(yōu),得到各模型超參數(shù)(學(xué)習(xí)率、訓(xùn)練輪次、隨機(jī)失活比例);依賴sklearn編程庫(kù),對(duì)數(shù)據(jù)集按照8∶2的比例多次劃分訓(xùn)練集和測(cè)試集.
同時(shí),為探索輸入前序過(guò)站機(jī)場(chǎng)個(gè)數(shù)和輸出預(yù)測(cè)后續(xù)過(guò)站機(jī)場(chǎng)個(gè)數(shù)對(duì)預(yù)測(cè)模型預(yù)測(cè)本機(jī)場(chǎng)過(guò)站時(shí)間的影響,各模型設(shè)置不同長(zhǎng)度時(shí)間窗的輸入和輸出進(jìn)行實(shí)驗(yàn),表5和表6為其5次MAE和RMSE評(píng)價(jià)結(jié)果的平均值,其中,時(shí)間窗長(zhǎng)(k,j)表示輸入過(guò)站數(shù)據(jù)的前序過(guò)站機(jī)場(chǎng)個(gè)數(shù)為k和輸出預(yù)計(jì)過(guò)站時(shí)間的機(jī)場(chǎng)個(gè)數(shù)為j.
多個(gè)模型結(jié)果對(duì)比分析發(fā)現(xiàn),當(dāng)選擇相同的時(shí)間步時(shí),MA-BiLSTM模型的MAE值和RMSE值均小于四種對(duì)比模型,MA-BiLSTM模型在預(yù)測(cè)航班過(guò)站時(shí)間方面有較好的準(zhǔn)確性.其中,當(dāng)時(shí)間窗長(zhǎng)為(2,1)時(shí),MA-BiLSTM模型評(píng)估效果最好,MAE值和RMSE值分別為2.45 min和3.95 min,較Bi-LSTM+Att模型MAE值提升1.1 min,RMSE值提升1.92 min,即輸入已完成2個(gè)機(jī)場(chǎng)的過(guò)站數(shù)據(jù),能夠更為準(zhǔn)確預(yù)測(cè)后續(xù)1個(gè)機(jī)場(chǎng)的過(guò)站時(shí)間.
表5 長(zhǎng)度為5的航班鏈各模型MAE結(jié)果
表6 長(zhǎng)度為5的航班鏈各模型RMSE結(jié)果
4.2.2 模型準(zhǔn)確度驗(yàn)證
為進(jìn)一步驗(yàn)證MA-BiLSTM模型的準(zhǔn)確性,選擇時(shí)間窗長(zhǎng)(3,1)時(shí),分別按照月份和工作日對(duì)結(jié)果進(jìn)行MAE和RMSE值驗(yàn)證,圖6為各月份的評(píng)估結(jié)果,圖7為各季度工作日與節(jié)假日的評(píng)預(yù)測(cè)估結(jié)果.
依據(jù)民航航班計(jì)劃安排將12個(gè)月分為夏秋季和冬春季,夏秋季是指4月至10月,其余月份為冬春季,其中夏秋季平均航班延誤率高于冬春季,且6月份至8月份的延誤率最高.如圖6所示,全年12月份驗(yàn)證結(jié)果均勻分布在全年的綜合評(píng)估結(jié)果上下,其中,6月份至8月份評(píng)估結(jié)果高于全年的綜合評(píng)估結(jié)果受臺(tái)風(fēng)、暴雨等天氣影響因素較大.
對(duì)比全年節(jié)假日和工作日平均延誤率發(fā)現(xiàn),節(jié)假日平均每日運(yùn)輸量高于工作日,但節(jié)假日延誤率低于工作日延誤率.如圖7所示,整體評(píng)估結(jié)果分布均勻,說(shuō)明MA-BiLSTM模型預(yù)測(cè)效果良好.其中各季度節(jié)假日優(yōu)于工作日評(píng)估指標(biāo)受節(jié)假日調(diào)整運(yùn)營(yíng)保障計(jì)劃的影響.
圖6 月份評(píng)估結(jié)果
圖7 工作日與節(jié)假日評(píng)估結(jié)果
4.2.3 多航班鏈實(shí)驗(yàn)分析
為驗(yàn)證航班過(guò)站時(shí)間動(dòng)態(tài)估計(jì)精度,選擇數(shù)據(jù)集中航班鏈長(zhǎng)度為4、5、6和7根據(jù)圖5流程進(jìn)行多時(shí)間窗滑動(dòng)方法估計(jì)航班過(guò)站時(shí)間.首先采用多次訓(xùn)練調(diào)優(yōu)得到不同長(zhǎng)度時(shí)間窗預(yù)測(cè)模型作為基礎(chǔ)模型,隨著多時(shí)間窗的推進(jìn)增加模型訓(xùn)練數(shù)據(jù),由于新增數(shù)據(jù)量較歷史數(shù)據(jù)較小,調(diào)整模型訓(xùn)練超參數(shù),動(dòng)態(tài)更新模型參數(shù),表7和表8為MA-BiLSTM模型預(yù)測(cè)結(jié)果,表中“-”表示不存在數(shù)據(jù)結(jié)果,表中“A、B、…”表示航班鏈第1個(gè)、第2個(gè)、…過(guò)站機(jī)場(chǎng).
表7 MA-BiLSTM模型MAE結(jié)果
表8 MA-BiLSTM模型RMSE結(jié)果
通過(guò)對(duì)比不同航班鏈長(zhǎng)度評(píng)價(jià)指標(biāo)發(fā)現(xiàn),當(dāng)航班鏈長(zhǎng)度為4時(shí),3個(gè)過(guò)站機(jī)場(chǎng)預(yù)測(cè)結(jié)果隨時(shí)間窗推動(dòng)波動(dòng)不大,說(shuō)明預(yù)測(cè)效果較為穩(wěn)定;當(dāng)航班鏈為7時(shí),6個(gè)過(guò)站機(jī)場(chǎng)預(yù)測(cè)結(jié)果隨多時(shí)間窗滑動(dòng)推進(jìn)在一定范圍內(nèi)波動(dòng)相對(duì)較大.當(dāng)航班鏈為5時(shí),MA-BiLSTM模型預(yù)測(cè)結(jié)果比單時(shí)間窗預(yù)測(cè)結(jié)果MAE值和RMSE值均有顯著提升,說(shuō)明基于MA-BiLSTM的多時(shí)間窗航班過(guò)站時(shí)間估計(jì)方法有良好效果.
本文充分提取航班過(guò)站時(shí)間的影響因素,從天氣因素、機(jī)場(chǎng)因素、飛機(jī)因素和航班相關(guān)時(shí)間信息四個(gè)方面進(jìn)行影響因素選擇,基于可充分學(xué)習(xí)前后段時(shí)序特征的Bi-LSTM網(wǎng)絡(luò),融合時(shí)間和多屬性兩維度的混合注意力機(jī)制,提出了基于MA-BiLSTM的多時(shí)間窗航班過(guò)站時(shí)間估計(jì)方法.首先,與常用模型對(duì)比實(shí)驗(yàn),進(jìn)一步探究了輸入和輸出過(guò)站機(jī)場(chǎng)個(gè)數(shù)對(duì)多模型預(yù)測(cè)模型的影響,采用不同模型和不同時(shí)間步長(zhǎng)進(jìn)行訓(xùn)練預(yù)測(cè),得出了MA-BiLSTM模型預(yù)測(cè)效果最好.最后采用了多時(shí)間窗滑動(dòng)推進(jìn)的方式,分別對(duì)不同長(zhǎng)度的航班鏈進(jìn)行航班過(guò)站時(shí)間動(dòng)態(tài)估計(jì),驗(yàn)證了MA-BiLSTM的多時(shí)間窗航班過(guò)站時(shí)間估計(jì)方法有較好的預(yù)測(cè)準(zhǔn)確性.在今后的研究中,如果能夠加入機(jī)場(chǎng)保障數(shù)據(jù),將進(jìn)一步提高航班過(guò)站時(shí)間預(yù)測(cè)模型性能.