• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      Dueling DQN優(yōu)化下的航班延誤自適應(yīng)圖卷積循環(huán)網(wǎng)絡(luò)預(yù)測方法

      2025-03-20 00:00:00劉曉琳郭夢嬌李卓
      關(guān)鍵詞:強(qiáng)化學(xué)習(xí)深度學(xué)習(xí)

      摘 要:為充分挖掘機(jī)場網(wǎng)絡(luò)航班間的時(shí)空動(dòng)態(tài)相關(guān)性以減小預(yù)測誤差,提出一種基于對(duì)偶深度Q網(wǎng)絡(luò)(dueling deep Q network, Dueling DQN)優(yōu)化的多組件自適應(yīng)圖卷積循環(huán)網(wǎng)絡(luò)航班延誤預(yù)測模型。首先,結(jié)合自適應(yīng)圖卷積網(wǎng)絡(luò)與多頭空間注意力機(jī)制,并行捕獲并融合多個(gè)子空間的延誤信息,充分挖掘非線性空間動(dòng)態(tài)特征。其次,采用門控循環(huán)單元為時(shí)間特征提取模塊的基礎(chǔ)結(jié)構(gòu),并引入時(shí)間注意力機(jī)制以學(xué)習(xí)歷史延誤數(shù)據(jù)間的關(guān)注權(quán)重。然后,設(shè)置多個(gè)時(shí)間維輸入組件,增加對(duì)不同時(shí)間模式構(gòu)建的多樣性。最后,采用Dueling DQN優(yōu)化多組件自適應(yīng)圖卷積門控循環(huán)單元(multi component adaptive graph convolution gated recurrent unit,MAGC GRU)模型的超參數(shù)。實(shí)驗(yàn)結(jié)果表明,所提模型的平均絕對(duì)誤差相對(duì)于歷史平均法、隨機(jī)森林法、梯度增強(qiáng)回歸樹法、門控循環(huán)單元法、時(shí)空?qǐng)D卷積網(wǎng)絡(luò)法,分別降低了10.6%、6.07%、9.18%、3.79%和3.12%。

      關(guān)鍵詞: 航班延誤預(yù)測; 深度學(xué)習(xí); 強(qiáng)化學(xué)習(xí); 多組件融合; 圖卷積

      中圖分類號(hào): V 351

      文獻(xiàn)標(biāo)志碼: ADOI:10.12305/j.issn.1001 506X.2025.02.23

      Adaptive graph convolutional recurrent network prediction method for

      flight delay based on Dueling DQN optimization

      LIU Xiaolin1, GUO Mengjiao1, LI Zhuo2,*

      (1. College of Electronic Information and Automation, Civil Aviation University of China, Tianjin 300300, China;

      2. School of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China)

      Abstract:To fully explore the spatio temporal dynamic correlation between airport network flights to reduce prediction errors, a multi component adaptive graph convolutional recurrent network flight delay prediction model based on dueling deep Q network (Dueling DQN) optimization is proposed. Firstly, by combining adaptive graph convolutional network (GCN) with multi head spatial attention mechanisms, parallel capture and fusion of delay information from multiple subspaces is achieved, fully exploiting nonlinear spatial dynamic features. Secondly, grated recurrent unit (GRU) is used as the basis for the time feature extraction module, and time attention mechanism is introduced to learn the attention weights between historical delay data. Then, multiple time dimension input components are set up to increase the diversity of constructing different time patterns. Finally, Dueling DQN is used to optimize the hyperparameters of the multi componet adaptive graph convolution GRU (MAGC GRU) model. The experimental results show that the mean absolute error (MAE) of the proposed model decreased by 10.6%, 6.07%, 9.18%, 3.79%, and 3.12% compared to historical average,random forest,gradient boosting regression tree,GRU,and spatial temporal GCN, respectively.

      Keywords:flight delay prediction; deep learning; reinforcement learning; multi component fusion; graph convolution network (GCN)

      0 引 言

      隨著航班運(yùn)輸量的迅猛增長,民航運(yùn)輸系統(tǒng)有限的承載能力對(duì)航班延誤治理工作提出了挑戰(zhàn)。航班延誤現(xiàn)象的頻繁發(fā)生,會(huì)擾亂旅客的行程計(jì)劃、給航空公司造成巨大經(jīng)濟(jì)損失,從而嚴(yán)重阻礙航空業(yè)的發(fā)展。因此,準(zhǔn)確預(yù)測航班延誤未來態(tài)勢,對(duì)航空公司、空中交通管制部門提前制定應(yīng)對(duì)措施以提高機(jī)場運(yùn)行效率而言具有重要意義1。

      針對(duì)航班延誤預(yù)測問題,國內(nèi)外學(xué)者已進(jìn)行廣泛的研究。目前的研究成果主要可以歸納為仿真分析法、機(jī)器學(xué)習(xí)法以及深度學(xué)習(xí)法3類。文獻(xiàn)[2]通過構(gòu)建易感-感染-易感流行病傳播模型,對(duì)單航班和機(jī)場間的延誤傳播機(jī)制進(jìn)行建模分析。文獻(xiàn)[3]基于Agent構(gòu)建融合多航班的機(jī)場網(wǎng)絡(luò)延誤模型,實(shí)現(xiàn)對(duì)大范圍機(jī)場網(wǎng)絡(luò)延誤的有效仿真。早期的仿真分析方法僅適用于線性數(shù)據(jù),對(duì)復(fù)雜非線性數(shù)據(jù)的處理能力有限。部分學(xué)者采用支持向量機(jī)4、貝葉斯網(wǎng)絡(luò)5、決策樹6等傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行航班延誤預(yù)測,此類方法均缺乏對(duì)機(jī)場間航班影響的考慮,導(dǎo)致其預(yù)測精度不高。

      近年來,越來越多的研究采用深度學(xué)習(xí)方法進(jìn)行航班延誤預(yù)測。文獻(xiàn)[7]基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks, RNN)建立空中交通延誤預(yù)測模型,發(fā)現(xiàn)預(yù)測準(zhǔn)確度隨著網(wǎng)絡(luò)架構(gòu)的深入而提高。文獻(xiàn)[8]綜合考慮天氣、機(jī)場擁擠程度等因素,結(jié)合深度信念網(wǎng)絡(luò)和支持向量機(jī)構(gòu)建預(yù)測模型,實(shí)現(xiàn)對(duì)延誤關(guān)鍵特征的捕獲。圖卷積網(wǎng)絡(luò)(graph convolution network, GCN)的快速發(fā)展,促進(jìn)了對(duì)交通預(yù)測的研究,隨之在航班延誤預(yù)測領(lǐng)域中得到應(yīng)用。文獻(xiàn)[9]采用GCN從機(jī)場網(wǎng)絡(luò)角度捕獲機(jī)場間的空間依賴性,結(jié)果表明以圖結(jié)構(gòu)為輸入的深度學(xué)習(xí)方法能有效提高延誤預(yù)測精度。文獻(xiàn)[10]將門控線性單元(gated linear unit, GLU)和GCN結(jié)合,構(gòu)建時(shí)空GCN (spatio temporal GCN, STGCN),有效捕獲航班延誤的時(shí)空特征。文獻(xiàn)[11]提出采用擴(kuò)散卷積核捕獲機(jī)場間的延遲傳播特征,并將其集成到長短時(shí)記憶(long short term memory, LSTM)網(wǎng)絡(luò)模型,構(gòu)建深度圖學(xué)習(xí)的航班延誤預(yù)測框架。文獻(xiàn)[12]基于GCN改進(jìn),通過設(shè)計(jì)能夠聚合交互和地理信息的圖卷積核,有效提高模型對(duì)機(jī)場節(jié)點(diǎn)特征的表達(dá)能力。上述研究說明將GCN應(yīng)用于航班延誤預(yù)測的可行性,但仍未能充分捕獲圖結(jié)構(gòu)的空間動(dòng)態(tài)相關(guān)性。

      此外,深度學(xué)習(xí)預(yù)測模型的超參數(shù)對(duì)預(yù)測精度的影響較大,使得超參數(shù)優(yōu)化成為深度學(xué)習(xí)模型應(yīng)用中的一大難點(diǎn)。尤其對(duì)于含有多個(gè)超參數(shù)的預(yù)測模型,其在面對(duì)不同的預(yù)測任務(wù)時(shí),同樣的超參數(shù)組合也可能無法發(fā)揮出最佳性能,導(dǎo)致模型的預(yù)測效果不穩(wěn)定。在實(shí)踐中,往往需要不斷調(diào)整超參數(shù),通過對(duì)比不同的實(shí)驗(yàn)結(jié)果以獲得最優(yōu)的超參數(shù)組合。然而,對(duì)于具有較大搜索空間的超參數(shù)而言,人工手動(dòng)的調(diào)參方式暴露出耗時(shí)過長、操作繁瑣等缺陷13。因此,群智能優(yōu)化算法開始被應(yīng)用于深度學(xué)習(xí)模型的超參數(shù)優(yōu)化問題。文獻(xiàn)[14]采用粒子群優(yōu)化算法對(duì)反向傳播神經(jīng)網(wǎng)絡(luò)進(jìn)行超參數(shù)優(yōu)化,有效提高平流層風(fēng)場的短期快速預(yù)測精度。文獻(xiàn)[15]構(gòu)建灰色神經(jīng)融合模型并采用遺傳算法優(yōu)化其參數(shù),從而更加準(zhǔn)確、有效地對(duì)極地光伏發(fā)電功率做出預(yù)測。但是,群智能優(yōu)化算法因側(cè)重搜索而缺乏自探索的學(xué)習(xí)能力,易陷入局部最優(yōu)解,從而限制模型預(yù)測性能16。強(qiáng)化學(xué)習(xí)算法通過不斷學(xué)習(xí)策略以達(dá)成回報(bào)最大化,具有強(qiáng)大的問題最優(yōu)化求解能力。已有學(xué)者將雙重深度Q網(wǎng)絡(luò)(double deep Q network,DDQN)17、Q學(xué)習(xí)(Q learning)18、深度確定性策略梯度(deep deterministic policy gradient,DDPG)19等強(qiáng)化學(xué)習(xí)優(yōu)化算法運(yùn)用于風(fēng)電功率預(yù)測問題中,能夠有效減少深度學(xué)習(xí)模型的超參數(shù)對(duì)于預(yù)測精度的影響并提高模型的魯棒性,驗(yàn)證深度強(qiáng)化學(xué)習(xí)在模型超參數(shù)最優(yōu)化領(lǐng)域的可行性。

      盡管最新的深度學(xué)習(xí)方法兼顧了航班延誤序列的時(shí)間和空間特征挖掘,但仍存在以下局限性:機(jī)場網(wǎng)絡(luò)中不同機(jī)場間的相互影響程度不同且隨時(shí)間動(dòng)態(tài)變化,現(xiàn)有的方法對(duì)空間動(dòng)態(tài)相關(guān)性的挖掘不充分;大部分深度學(xué)習(xí)模型的超參數(shù)最優(yōu)化方法仍停留在繁瑣的人工手動(dòng)調(diào)整層面,這在一定程度上限制了模型最佳預(yù)測效果的發(fā)揮。

      本文提出一種基于對(duì)偶深度Q網(wǎng)絡(luò)(dueling deep Q network, Dueling DQN)優(yōu)化的多組件自適應(yīng)圖卷積門控循環(huán)單元(multi component adaptive graph convolution gated recurrent unit, MAGC GRU)模型。首先,采用自適應(yīng)GCN為空間特征提取模塊的基礎(chǔ)結(jié)構(gòu),并結(jié)合多頭空間注意力機(jī)制對(duì)不同子空間信息自適應(yīng)加權(quán)融合,以充分提取機(jī)場節(jié)點(diǎn)航班延誤信息間的空間依賴性。其次,采用門控循環(huán)單元(gated recurrent unit, GRU)為時(shí)間特征提取模塊的基礎(chǔ)結(jié)構(gòu),并引入時(shí)間注意力機(jī)制以增強(qiáng)長期時(shí)間動(dòng)態(tài)特征的顯著性水平。然后,設(shè)計(jì)引入近期、以1周為周期及以1月為周期的3個(gè)時(shí)間維拓展組件,自動(dòng)挖掘航班延誤數(shù)據(jù)集的多時(shí)間維模式。最后,采用Dueling DQN算法對(duì)MAGC GRU網(wǎng)絡(luò)的超參數(shù)進(jìn)行優(yōu)化,以自適應(yīng)獲取模型的最佳預(yù)測性能,并基于美國機(jī)場離港準(zhǔn)點(diǎn)率數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果表明所提方法能夠有效提升航班延誤預(yù)測的精度。

      所提方法的創(chuàng)新點(diǎn)主要為以下兩點(diǎn):

      (1) 采用自適應(yīng)GCN為結(jié)構(gòu)基礎(chǔ)構(gòu)建空間特征提取模塊,并引入多頭空間注意力機(jī)制。通過同時(shí)關(guān)注多個(gè)子空間的信息,自適應(yīng)地為不同機(jī)場延誤數(shù)據(jù)微弱特征分配相應(yīng)的關(guān)注權(quán)重,從而實(shí)現(xiàn)對(duì)空間特征的充分挖掘和全局提取。

      (2) 設(shè)計(jì)引入多個(gè)時(shí)間維拓展組件,并采用Dueling DQN實(shí)現(xiàn)對(duì)主要超參數(shù)的自適應(yīng)最優(yōu)化,不僅可以充分捕獲多時(shí)間模式特征,而且能夠減少冗余信息的資源占用,實(shí)現(xiàn)高精度航班延誤預(yù)測。

      1 問題定義

      在介紹所提航班延誤預(yù)測方法前,先對(duì)機(jī)場網(wǎng)絡(luò)拓?fù)鋱D的構(gòu)建方式以及航班延誤預(yù)測任務(wù)的定義進(jìn)行簡要闡述。

      1.1 機(jī)場網(wǎng)絡(luò)拓?fù)鋱D

      由于機(jī)場間的航班延誤易傳播擴(kuò)散,充分考慮機(jī)場空間動(dòng)態(tài)依賴性是提高航班延誤預(yù)測精度的關(guān)鍵。為研究機(jī)場間的空間拓?fù)潢P(guān)系,將機(jī)場網(wǎng)絡(luò)定義為拓?fù)鋱D:

      Gt={Vt,E,A}(1)

      式中: Vt為機(jī)場網(wǎng)絡(luò)所包含節(jié)點(diǎn)的集合,可表示為Vt={vi|i=1,2,…,N},N為機(jī)場數(shù);E為機(jī)場航線的集合;A為圖結(jié)構(gòu)的鄰接矩陣且A∈RN×N,其元素aij反映出節(jié)點(diǎn)vi與節(jié)點(diǎn)vj間的空間依賴性。

      1.2 航班延誤預(yù)測

      機(jī)場網(wǎng)絡(luò)拓?fù)鋱DGt在時(shí)間戳t觀測到的航班延誤特征Xt∈RN×d

      Xt={x1,t,x2,t,…,xN,t}(2)

      式中: d為節(jié)點(diǎn)的特征維數(shù)。在圖結(jié)構(gòu)Gt上引入時(shí)間維度,獲得按時(shí)間排列的機(jī)場拓?fù)鋱D時(shí)間序列,如圖1所示。

      已知過去T個(gè)時(shí)間步長機(jī)場網(wǎng)絡(luò)拓?fù)鋱D中的航班延誤數(shù)據(jù)與機(jī)場網(wǎng)絡(luò)拓?fù)鋱DGt,預(yù)測目標(biāo)是未來所有機(jī)場節(jié)點(diǎn)在時(shí)間窗口長度為τ的航班延誤特征Y∈RN×d×τ,Y=[X1,X2,…,Xτ]。

      2 Dueling DQN優(yōu)化的MAGCN GRU延誤預(yù)測模型

      基于機(jī)場拓?fù)鋱D時(shí)間序列,以GCN和GRU為基礎(chǔ)結(jié)構(gòu),引入自適應(yīng)鄰接矩陣和多頭注意力機(jī)制,并設(shè)計(jì)集成多個(gè)組件的輸出結(jié)果以捕獲多時(shí)間維特征,最后采用Dueling DQN算法對(duì)模型的重要參數(shù)進(jìn)行優(yōu)化,提出基于Dueling DQN優(yōu)化的MAGC GRU的延誤預(yù)測模型,模型的整體框架圖如圖2所示。圖2中,Xm、Xw、Xr分別為近期、以1周為周期、以1月為周期的時(shí)空組件輸入;{X1,X2,…,XN}為各個(gè)機(jī)場延誤數(shù)據(jù)的集合;ht為t時(shí)刻隱藏單元的輸出值;βt為t時(shí)刻GRU單元輸出對(duì)應(yīng)的注意力得分;Ht為時(shí)間注意力機(jī)制的輸出值;Y^m、Y^w、Y^r分別為近期、以1周為周期、以1月為周期的時(shí)空組件輸出值;Y^為多組件MAGC GRU融合層的預(yù)測輸出值;Y為航班延誤的真實(shí)值;st為Dueling DQN優(yōu)化t時(shí)刻的超參數(shù)組合;dt、nt分別為自適應(yīng)嵌入節(jié)點(diǎn)維數(shù)和GRU單元個(gè)數(shù);ε為ε greedy策略中用于控制探索和利用比例的參數(shù);at為t時(shí)刻的動(dòng)作值;rt為當(dāng)前狀態(tài)的獎(jiǎng)勵(lì)值;Qt+1為t+1時(shí)刻Q網(wǎng)絡(luò)的輸出值。

      2.1 多時(shí)間模式提取

      考慮到航班安排時(shí)刻表的周期性,設(shè)計(jì)引入3個(gè)相同的時(shí)空組件,在時(shí)間維度上充分捕獲近期、以1周為周期及以1月為周期的時(shí)間模式,同時(shí)減少冗余信息的資源占用。設(shè)當(dāng)前時(shí)刻為t0,待預(yù)測時(shí)間窗口長度為Tp,截取出窗口長度為Tr、Tw和Tm的時(shí)序片段,分別輸入給近期、以1周為周期及以1月為周期的時(shí)空組件。若預(yù)測窗口長度Tp設(shè)置為1天,Tr、Tw和Tm為Tp的整數(shù)倍,相應(yīng)的時(shí)間序列片段輸入如下。

      (1) 近期時(shí)空組件輸入

      Xr=(xt0-Tr+1,xt0-Tr+2,…,xt0),Xr∈RN×d×Tr,此為與待預(yù)測時(shí)間窗口直接相鄰的一段歷史時(shí)序數(shù)據(jù),如圖3中的綠色部分所示。近期的航班延誤情況可在一定程度上反映機(jī)組、空管等影響因素的運(yùn)行情況,因此對(duì)近期航班延誤數(shù)據(jù)的時(shí)間模式進(jìn)行建模是至關(guān)重要的。

      (2) 以1周為周期的時(shí)空組件輸入

      Xw=(xt0-7×(Tw/TP)+1,…,xt0-7×(Tw/TP)+TP,xt0-7×(Tw/TP-1)+1,…,xt0-7×(Tw/TP-1)+TP,…,xt0-7+1,…,xt0-7+Tp),Xw∈RN×d×Tw,此為與待預(yù)測時(shí)間窗口之前的若干周中與預(yù)測目標(biāo)星期屬性相同的一段歷史時(shí)序數(shù)據(jù),如圖3中的紅色部分所示。由于航班時(shí)刻表以周為單位安排排班,航班延誤數(shù)據(jù)存在一定的以1周為周期的相似性,故構(gòu)建以1周為周期的時(shí)空組件,以挖掘航班延誤數(shù)據(jù)中以周為單位的時(shí)間模式。

      (3) 以1月為周期的時(shí)空組件輸入

      Xm=(xt0-30×(Tm/TP)+1,…,xt0-30×(Tm/TP)+TP,xt0-30×(Tm/TP-1)+1,…,xt0-30×(Tm/TP-1)+TP,…,xt0-30+1,…,xt0-30+Tp),Xm∈RN×d×Tm,此為與待預(yù)測時(shí)間窗口之前的若干月中與預(yù)測目標(biāo)日期屬性相同的一段歷史時(shí)序數(shù)據(jù),如圖3中的藍(lán)色部分所示。人們的出行計(jì)劃與日期具有一定的規(guī)律映射,航班延誤數(shù)據(jù)存在一定的以1月為周期的相似性,故構(gòu)建以1月為周期的時(shí)空組件,以挖掘航班延誤數(shù)據(jù)中以月為單位的時(shí)間模式。

      2.2 MAGCN GRU模型構(gòu)建

      基于多組件AGCN的航班延誤預(yù)測模型框架如圖4所示。為了充分捕獲不同時(shí)間維的時(shí)間模式并消除冗余的歷史信息,該模型主要由3個(gè)部分組成,分別負(fù)責(zé)對(duì)未來航班延誤的近期、以1周為周期、以1月為周期3個(gè)時(shí)間維特征建模。3個(gè)組件的網(wǎng)絡(luò)結(jié)構(gòu)相同,主體由空間特征提取模塊、時(shí)間特征提取模塊和輸出層組成。在自適應(yīng)GCN(adaptive GCN, AGCN)中嵌入多頭空間注意力機(jī)制,組成空間特征提取模塊,從而提高模型對(duì)空間動(dòng)態(tài)特征的提取能力;結(jié)合GRU與時(shí)間注意力機(jī)制,構(gòu)建時(shí)間特征提取模塊,自動(dòng)挖掘時(shí)間維的動(dòng)態(tài)特征。

      2.2.1 空間特征提取層

      考慮到機(jī)場間共享資源的有限性以及部分航班運(yùn)行過程中上下游機(jī)場的相連性,設(shè)計(jì)空間特征提取層,通過采用自適應(yīng)圖卷積來實(shí)現(xiàn)對(duì)機(jī)場節(jié)點(diǎn)間動(dòng)態(tài)相關(guān)性的自動(dòng)學(xué)習(xí),并構(gòu)建多頭空間注意力機(jī)制,以用于子空間內(nèi)微弱特征的捕獲。

      (1) 自適應(yīng)圖卷積

      由于機(jī)場網(wǎng)絡(luò)中的機(jī)場分布無規(guī)律,針對(duì)規(guī)整網(wǎng)格結(jié)構(gòu)的普通卷積不適用于機(jī)場拓?fù)鋱D的空間特征提取。故采用拓展到圖結(jié)構(gòu)的圖卷積20方法,通過傅里葉變換實(shí)現(xiàn)從空間域到譜域操作的轉(zhuǎn)換。根據(jù)圖譜理論,圖結(jié)構(gòu)的拉普拉斯矩陣及特征值能表征其內(nèi)部性質(zhì),對(duì)稱歸一化后的拉普拉斯矩陣為

      L=IN-D-12AD-12(3)

      式中: A為圖G的鄰接矩陣;IN為單位對(duì)角矩陣;對(duì)角陣D為A的度矩陣,其對(duì)角元素Dii=∑jAij;將L進(jìn)行特征值分解后有

      L=UΛUT(4)

      式中:U為特征向量矩陣;Λ為由特征值構(gòu)成的對(duì)角矩陣。圖卷積通過將輸入信號(hào)與卷積核作乘積來實(shí)現(xiàn)卷積運(yùn)算,由公式表示為

      gθx=UgθUTx(5)

      式中:gθ為卷積核參數(shù); 為圖卷積操作;x為輸入圖信號(hào)。針對(duì)式(5)中譜圖卷積運(yùn)算復(fù)雜度高的問題,切比雪夫多項(xiàng)式21被提出用于K階截?cái)鄶M合以約簡計(jì)算。而后,Kipf等22又提出二次簡化后的一階多項(xiàng)式近似,得到式(5)的近似表達(dá)式為

      gθx≈θ(IN+D-12AD-12)x(6)

      式中:θ為可學(xué)習(xí)的權(quán)重參數(shù)。

      由式(6)可知,鄰接矩陣的定義方式直接決定對(duì)圖結(jié)構(gòu)的學(xué)習(xí)效果,固定的鄰接矩陣亦難以反映機(jī)場網(wǎng)絡(luò)的空間動(dòng)態(tài)相關(guān)性。因此,采用能自動(dòng)挖掘機(jī)場間航班數(shù)據(jù)交互信息的自適應(yīng)鄰接矩陣。根據(jù)節(jié)點(diǎn)嵌入的思想對(duì)節(jié)點(diǎn)向量隨機(jī)初始化,而后采用節(jié)點(diǎn)間的歐氏距離來表征機(jī)場間的相互依賴。自適應(yīng)鄰接矩陣的計(jì)算公式為

      D-12AD-12=Softmax(ReLU(EA·ETA))(7)

      式中:Softmax為激活函數(shù);EA為由N個(gè)機(jī)場節(jié)點(diǎn)的嵌入向量構(gòu)成的矩陣。引入自適應(yīng)鄰接矩陣后,圖卷積操作為

      z=gθ*x≈θ(IN+Softmax(ReLu(EAETA)))x(8)

      式中:z為自適應(yīng)圖卷積神經(jīng)網(wǎng)絡(luò)的輸出;EA為可學(xué)習(xí)的節(jié)點(diǎn)嵌入矩陣,且有EA∈RN×r,r為可設(shè)置的節(jié)點(diǎn)嵌入維度。由此,采用自適應(yīng)圖卷積提取航班延誤數(shù)據(jù)的空間動(dòng)態(tài)依賴性,不僅可避免對(duì)鄰接矩陣的定義僵化,還能實(shí)現(xiàn)對(duì)機(jī)場間航班相互影響的動(dòng)態(tài)捕獲。

      (2) 多頭空間注意力

      考慮到航班延誤受到空管、機(jī)務(wù)、機(jī)場容量、天氣等多方面因素的影響,微弱延誤特征往往存在于多子空間中,故引入多頭注意力機(jī)制,對(duì)特征矩陣中不同子空間的延誤信息進(jìn)行加權(quán)融合。

      多頭注意力機(jī)制最早在自然語言處理領(lǐng)域的Transformer模型23中被提出,是多個(gè)縮放點(diǎn)積模型的集成。通過同時(shí)關(guān)注多個(gè)子空間的信息,并行捕捉輸入數(shù)據(jù)的不同特征和模式,以豐富注意力機(jī)制特征提取的多樣性。為避免計(jì)算資源的浪費(fèi)并提高預(yù)測速度,自適應(yīng)地學(xué)習(xí)延誤數(shù)據(jù)子空間內(nèi)微弱特征的關(guān)注權(quán)重,在空間卷積模塊中嵌入多頭空間注意力機(jī)制,其結(jié)構(gòu)如圖5所示。

      假設(shè)注意力頭數(shù)為n1,則內(nèi)部包含n1個(gè)單頭注意力。每個(gè)單頭的操作過程是一樣的。首先,由3個(gè)不同的線性全連接層輸出分別得到查詞(Query)、鏈(Key)和值(Value),簡稱Q、K、V;然后,對(duì)Q、K、V進(jìn)行縮放點(diǎn)積運(yùn)算,運(yùn)算公式如下:

      Yi=SoftmaxQiKTidkVi(9)

      式中:dk為鍵矩陣Ki的維度。

      最后,將n1個(gè)單頭注意力的結(jié)果按維度拼接,便可獲得最終的加權(quán)融合輸出。

      2.2.2 時(shí)間特征提取層

      航班延誤數(shù)據(jù)在時(shí)間維上呈現(xiàn)顯著的周期性、時(shí)變性特點(diǎn),其時(shí)間特征表現(xiàn)為歷史延誤情況毫無規(guī)律地影響著未來的延誤趨勢。基于航班延誤的時(shí)間特性,設(shè)計(jì)GRU與時(shí)間注意力結(jié)合的機(jī)制,以得到時(shí)間特征提取層。

      (1) GRU

      由于每一個(gè)機(jī)場節(jié)點(diǎn)的航班延誤數(shù)據(jù)是基礎(chǔ)的時(shí)間序列,僅利用圖卷積無法提取其長距離特征,因此在空間卷積提取層后引入時(shí)間特征提取層,以加強(qiáng)捕獲圖卷積所忽略的時(shí)間動(dòng)態(tài)依賴性。在研究中常用的RNN主要為GRU和LSTM,其改進(jìn)原理極為相似,均是通過引入門結(jié)構(gòu)自適應(yīng)地篩選重要信息,有效彌補(bǔ)了傳統(tǒng)RNN梯度易消失或梯度易爆炸的缺陷。相較于LSTM,GRU具有更簡單的結(jié)構(gòu)與更快的收斂速度24,故選用GRU對(duì)航班延誤數(shù)據(jù)建模以提取長期時(shí)間特征。GRU通過重置門和更新門自適應(yīng)地篩選重要信息并濾除次要信息,其內(nèi)部結(jié)構(gòu)圖如圖6所示。

      GRU的迭代計(jì)算公式為

      ut=σ(Wu·[xt,ht-1]+bu)

      rt=σ(Wr·[xt,ht-1]+br)

      ct=tanh(Wc·[xt,(rt⊙ht-1)]+bc)

      ht=ut⊙ht-1+(1-ut)⊙ct(10)

      式中:⊙為哈達(dá)瑪乘積;σ為Sigmoid激活函數(shù);tanh為雙曲正切激活函數(shù);W和b分別為各個(gè)門的權(quán)重矩陣和偏置項(xiàng);ht-1為GRU上一時(shí)刻隱藏狀態(tài)的輸出值;xt為當(dāng)前時(shí)刻的時(shí)間序列輸入值;ut為更新門的輸出值;rt為重置門的輸出值;ct為用于儲(chǔ)藏當(dāng)前時(shí)刻信息的記憶儲(chǔ)存單元的輸出值。

      (2) 時(shí)間注意力

      注意力機(jī)制最早由Bahdanau等25提出,被用于以RNN為基礎(chǔ)結(jié)構(gòu)的編碼解碼器模型,能夠在解碼時(shí)為長輸入序列的不同時(shí)間節(jié)點(diǎn)賦予相應(yīng)的關(guān)注權(quán)重,實(shí)現(xiàn)計(jì)算資源利用最大化,從而提高模型的預(yù)測精度。首先,引入時(shí)間維的注意力機(jī)制,輔助GRU自適應(yīng)關(guān)注最關(guān)鍵的延誤時(shí)間節(jié)點(diǎn);然后,選用多層感知機(jī)為打分機(jī)制,計(jì)算出各個(gè)時(shí)間節(jié)點(diǎn)相應(yīng)的注意力概率分布值;最后,將各時(shí)間節(jié)點(diǎn)輸出值與對(duì)應(yīng)的注意力得分加權(quán)求和,提取出全局時(shí)間變化趨勢。

      時(shí)間注意力機(jī)制的相關(guān)公式為

      z=w2(w1hi-1+b1)+b2(11)

      式中:hi-1為GRU隱藏狀態(tài)的輸出值;w1、w2和b1、b2分別為權(quán)重系數(shù)及偏置項(xiàng)。

      βi=expzi∑Tk=1zk(12)

      式中:T為輸入數(shù)據(jù)的序列長度;z為表征歷史延誤數(shù)據(jù)相對(duì)影響的中間變量;βi為隱藏狀態(tài)hi對(duì)應(yīng)的關(guān)注權(quán)重;k為歷史延誤數(shù)據(jù)的序號(hào)。

      將各時(shí)刻的GRU輸出值與時(shí)間注意力輸出的相應(yīng)得分權(quán)重相乘并求和,提取得到航班延誤時(shí)間動(dòng)態(tài)特征的概括值Ht。Ht可用數(shù)學(xué)公式表示為

      Ht=∑ni=1βi·hi(13)

      最后,采用全連接層將時(shí)間特征提取層的輸出維度調(diào)整為預(yù)測目標(biāo)維度。

      2.3 多時(shí)間維度融合

      將3個(gè)代表不同時(shí)間模式的時(shí)序片段分別輸入對(duì)應(yīng)的時(shí)空組件后,采用全連接層將3個(gè)組件的輸出結(jié)果進(jìn)行融合,所得最終預(yù)測結(jié)果可表示為

      Y^=Wd⊙Y^d+Ww⊙Y^w+Wm⊙Y^m(14)

      式中:Wd、Ww、Wm均為可學(xué)習(xí)的參數(shù)矩陣,用于控制近期、以1周為周期和以1月為周期的組件預(yù)測結(jié)果所對(duì)應(yīng)的融合權(quán)重;Y^d、Y^w、Y^m分別為近期、以1周為周期、以1月為周期的組件的預(yù)測結(jié)果。在結(jié)合GRU與自適應(yīng)GCN的基礎(chǔ)上,嵌入時(shí)空注意力機(jī)制以及多組件時(shí)間維拓展模塊,能夠有效捕獲航班延誤數(shù)據(jù)的時(shí)空動(dòng)態(tài)特征。

      2.4 Dueling DQN優(yōu)化

      由于模型內(nèi)部參數(shù)對(duì)預(yù)測精度有較大影響,采用強(qiáng)化學(xué)習(xí)算法Dueling DQN優(yōu)化MAGC GRU模型的超參數(shù),以獲得更高的預(yù)測精度。Dueling DQN是一種基于值的深度強(qiáng)化學(xué)習(xí)算法,根據(jù)“狀態(tài)-動(dòng)作”價(jià)值(Q值)篩選出在各種狀態(tài)下的最優(yōu)動(dòng)作,以找到使未來期望獎(jiǎng)勵(lì)值最大化的最優(yōu)策略26。Dueling DQN的結(jié)構(gòu)圖如圖7所示,其主要組件包含經(jīng)驗(yàn)池、當(dāng)前估計(jì)網(wǎng)絡(luò)(Q網(wǎng)絡(luò))、目標(biāo)Q網(wǎng)絡(luò)和優(yōu)化器。

      當(dāng)前估計(jì)網(wǎng)絡(luò)為主體網(wǎng)絡(luò),基于以下策略進(jìn)行迭代訓(xùn)練:首先由當(dāng)前估計(jì)網(wǎng)絡(luò)計(jì)算出各種動(dòng)作對(duì)應(yīng)的Q值,從中選出最大Q值所對(duì)應(yīng)的動(dòng)作a并作為最優(yōu)動(dòng)作;估計(jì)網(wǎng)絡(luò)的復(fù)制體——目標(biāo)Q網(wǎng)絡(luò)接收動(dòng)作a后,輸出下一時(shí)刻的預(yù)測Q值(st+1,a;θ′,α′,δ′),θ′,α′,δ′為目標(biāo)Q網(wǎng)絡(luò)的可訓(xùn)練參數(shù)。Dueling DQN的訓(xùn)練目標(biāo)值計(jì)算公式為

      Q′=Rt+γmaxaQtar(st+1,a;θ′,α′,δ′)(15)

      式中:Q′為訓(xùn)練目標(biāo)值;Rt為下一時(shí)間步的獎(jiǎng)勵(lì)值;γ∈[0,1]為折扣因子,能夠決定對(duì)已獲獎(jiǎng)勵(lì)和未來獎(jiǎng)勵(lì)值的關(guān)注度27;maxaQtar(st+1,a;θ′,α′,δ′)為目標(biāo)Q網(wǎng)絡(luò)對(duì)各動(dòng)作估計(jì)價(jià)值中的最高值。

      為降低學(xué)習(xí)樣本間的順序相關(guān)性,Dueling DQN采用經(jīng)驗(yàn)回放機(jī)制,將當(dāng)前狀態(tài)st、動(dòng)作at、所獲獎(jiǎng)勵(lì)Rt以及下一狀態(tài)st+1打包作為一條學(xué)習(xí)經(jīng)驗(yàn),存儲(chǔ)在經(jīng)驗(yàn)池中,待經(jīng)驗(yàn)存儲(chǔ)量足夠,再從中隨機(jī)抽樣并將其作為當(dāng)前估計(jì)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集。此外,針對(duì)由目標(biāo)不穩(wěn)定導(dǎo)致的訓(xùn)練難以收斂的問題,引入當(dāng)前估計(jì)網(wǎng)絡(luò)的復(fù)制體目標(biāo)Q網(wǎng)絡(luò),為其設(shè)置更低的網(wǎng)絡(luò)參數(shù)更新頻率。Dueling DQN在傳統(tǒng)DQN的基礎(chǔ)上,引入對(duì)偶網(wǎng)絡(luò)結(jié)構(gòu),通過狀態(tài)值函數(shù)V(st,θ,δ)及優(yōu)勢函數(shù)A(st,at)表征當(dāng)前估計(jì)網(wǎng)絡(luò)Q值。優(yōu)勢函數(shù)的計(jì)算方式為

      Aπ(st,at)=Qπ(st,at)-Vπ(st)(16)

      式中:Qπ(st,at)為當(dāng)前狀態(tài)的估計(jì)網(wǎng)絡(luò)輸出值;Vπ(st)為當(dāng)前狀態(tài)對(duì)應(yīng)的狀態(tài)價(jià)值;π為“狀態(tài)-動(dòng)作”策略。故當(dāng)前估計(jì)網(wǎng)絡(luò)的輸出可表示為

      Q(st,at;θ,α,δ)=V(st;θ,δ)+A(st,at;θ,α)(17)

      式中:α為優(yōu)勢函數(shù)的網(wǎng)絡(luò)相關(guān)參數(shù);δ為狀態(tài)價(jià)值函數(shù)的網(wǎng)絡(luò)相關(guān)參數(shù);θ為當(dāng)前估計(jì)網(wǎng)絡(luò)的超參數(shù)。

      根據(jù)在最優(yōu)策略下有Vπ(st)=arg maxatQπ(st,at),可得優(yōu)勢函數(shù)arg maxa Aπ(st,at)=0,進(jìn)一步可知Qπ(st,at)=Vπ(st)。由于當(dāng)前估計(jì)網(wǎng)絡(luò)的輸出為兩項(xiàng)之和,因而在學(xué)習(xí)過程中,難以確定唯一的優(yōu)勢函數(shù)與狀態(tài)價(jià)值函數(shù)。為解決不唯一性問題,在式(17)的基礎(chǔ)上,從等式右邊減去優(yōu)勢函數(shù)的最大項(xiàng)arg maxa Aπ(st,at),等號(hào)不變,原等式變?yōu)?/p>

      Q(st,at;θ,α,δ)=V(st;θ,δ)+A(st,at;θ,α)-

      arg maxa Aπ(st,at)(18)

      為提高實(shí)際訓(xùn)練中的穩(wěn)定性,用均值替代最大值,得到當(dāng)前估計(jì)網(wǎng)絡(luò)的最終輸出為

      Q(st,at;θ,α,δ)=V(st;θ,δ)+A(st,at;θ,α)-

      1|A|∑at+1A(st,at+1;θ,α)(19)

      在MAGC GRU模型中,自適應(yīng)鄰接矩陣的節(jié)數(shù)與GRU個(gè)數(shù)均對(duì)所提模型的預(yù)測性能有較大影響。因此,基于Dueling DQN的優(yōu)化原理,對(duì)這兩個(gè)參數(shù)進(jìn)行優(yōu)化,具體的流程圖如圖8所示,其中tcopy為目標(biāo)網(wǎng)絡(luò)的更新步長間隔;Tmax為單輪學(xué)習(xí)的最大步長;Lmax為最大學(xué)習(xí)輪數(shù)。

      3 實(shí)例分析

      3.1 數(shù)據(jù)集介紹

      根據(jù)美國機(jī)場航班運(yùn)營量排序,選取全美前76個(gè)大型機(jī)場作為研究對(duì)象,收集其2011年1月1日至2018年12月31日的機(jī)場間飛行數(shù)據(jù)。航班數(shù)據(jù)來源于美國交通部運(yùn)輸統(tǒng)計(jì)局官網(wǎng),每條數(shù)據(jù)記錄包括航班的飛行日期、承運(yùn)單位、航班運(yùn)營公司、起飛和落地機(jī)場、離港到港延誤時(shí)長、起飛和落地機(jī)場的間距等信息。

      為了深入對(duì)空間相關(guān)性的研究,以機(jī)場為主體,選取航班的離港準(zhǔn)點(diǎn)率作為預(yù)測對(duì)象。根據(jù)美國聯(lián)邦航空局對(duì)航班延誤的定義,將機(jī)場一天內(nèi)離港延誤時(shí)間在15 min內(nèi)的航班所占比例作為機(jī)場的離港準(zhǔn)點(diǎn)率。為進(jìn)一步提高數(shù)據(jù)集的質(zhì)量,統(tǒng)計(jì)各機(jī)場的日均航班量,選取排名前76的機(jī)場,篩選出其來往飛行數(shù)據(jù)記錄,從而避免小型機(jī)場數(shù)據(jù)隨機(jī)波動(dòng)過大對(duì)預(yù)測結(jié)果的影響。通過計(jì)算得到各機(jī)場航班的離港準(zhǔn)點(diǎn)率時(shí)間序列,并將結(jié)果按照機(jī)場三字碼進(jìn)行排序。

      3.2 實(shí)驗(yàn)環(huán)境與超參數(shù)設(shè)置

      實(shí)驗(yàn)采用Python 3.6.13進(jìn)行編寫,深度學(xué)習(xí)框架為TensorFlow 1.14.0,在Pycharm軟件中完成模型搭建及優(yōu)化等。處理器為AMD Ryzen R5 5600U, 中央處理器頻率為4.20 GHz;圖形處理器為 NVIDIA GeForce MX450。實(shí)驗(yàn)采用Python 3.6.13進(jìn)行編寫,深度學(xué)習(xí)框架為TensorFlow 1.14.0,在Pycharm開發(fā)環(huán)境中對(duì)航班延誤預(yù)測模型進(jìn)行搭建及訓(xùn)練。

      在實(shí)驗(yàn)之前,對(duì)原數(shù)據(jù)集進(jìn)行均值填充和標(biāo)準(zhǔn)歸一化的前置處理,以簡化后續(xù)的模型訓(xùn)練和測試。按照8∶2的比例將機(jī)場離港準(zhǔn)點(diǎn)率數(shù)據(jù)集劃分為訓(xùn)練集和測試集。在實(shí)驗(yàn)中發(fā)現(xiàn),3個(gè)組件時(shí)間序列輸入的時(shí)間窗口長度會(huì)對(duì)預(yù)測精度產(chǎn)生影響,根據(jù)多次實(shí)驗(yàn)選定Tr=7、Tw=2、Tm=3的參數(shù)組合。在模型訓(xùn)練中,為評(píng)判模型輸出的預(yù)測值與延誤真實(shí)值間的擬合程度,采用L2損失為損失函數(shù)。其他參數(shù)設(shè)置如下:處理批量數(shù)為64;訓(xùn)練批次設(shè)置為100;優(yōu)化器為Adam;將學(xué)習(xí)率模型設(shè)置為指數(shù)衰減式,將初始值和衰減率分別設(shè)置為0.01和0.7。

      3.3 模型評(píng)價(jià)指標(biāo)介紹

      實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)選取的是預(yù)測研究中常用的均方根誤差(root mean square error,RMSE)、平均絕對(duì)誤差(mean absolute error,MAE)和平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE),以n為樣本個(gè)數(shù),上述評(píng)價(jià)指標(biāo)的計(jì)算公式分別為

      RMSE=1n∑ni=1(y^i-yi)2(20)

      MAE=1n∑ni=1|y^i-yi|(21)

      MAPE=100%n∑ni=1|y^i-yiyi|(22)

      3.4 模型性能分析

      為驗(yàn)證所提模型在航班延誤預(yù)測任務(wù)中的優(yōu)異性和有效性,進(jìn)行以下4種性能分析實(shí)驗(yàn):

      (1) 將模型與幾種經(jīng)典的時(shí)間序列預(yù)測模型進(jìn)行誤差對(duì)比分析,以驗(yàn)證所提模型的優(yōu)異性能。

      (2) 針對(duì)所提預(yù)測模型中的多時(shí)空組件及Dueling DQN部分,分別進(jìn)行消融實(shí)驗(yàn),以驗(yàn)證各模塊的不可或缺性。

      (3) 對(duì)機(jī)場網(wǎng)絡(luò)中不同機(jī)場的模型預(yù)測效果進(jìn)行分析,驗(yàn)證模型的有效性。

      (4) 基于不同機(jī)場網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行模型誤差對(duì)比實(shí)驗(yàn),驗(yàn)證模型的泛化性。

      3.4.1 與基線模型的對(duì)比實(shí)驗(yàn)

      為驗(yàn)證所提模型的實(shí)際預(yù)測性能,選取以下5種方法作為基線對(duì)比模型。

      (1) 歷史平均法(history average method, HA)通過對(duì)歷史值取平均作為預(yù)測輸出。該方法計(jì)算簡單而快速,但預(yù)測精度較低。

      (2) 隨機(jī)森林(random forest, RF)[28是基于多個(gè)決策樹的投票選擇來執(zhí)行回歸或分類任務(wù)的機(jī)器學(xué)習(xí)方法。

      (3) 梯度提升回歸樹(gradient boosting regression tree,GBRT)[29將多個(gè)弱學(xué)習(xí)器的輸出集成,得到模型的預(yù)測輸出。

      (4) GRU通過引入門機(jī)制有效彌補(bǔ)了傳統(tǒng)RNN梯度消失的缺陷。

      (5) STGCN[10采用“三明治”結(jié)構(gòu)結(jié)合了GLU和GCN。

      每個(gè)模型均利用過去一周的機(jī)場離港準(zhǔn)點(diǎn)率數(shù)據(jù)觀測值來預(yù)測未來N(N=1,2,3,4,5)天的機(jī)場準(zhǔn)點(diǎn)情況,即模型的輸入時(shí)間序列窗口長度設(shè)置為7,預(yù)測目標(biāo)的時(shí)間窗口長度設(shè)置為N,最終得到各模型的預(yù)測結(jié)果如表1所示。

      由表1可知,MAGC GRU模型的3個(gè)預(yù)測誤差指標(biāo)在長、短期預(yù)測任務(wù)中均要優(yōu)于HA、RF、GBRT、GRU對(duì)比模型,這是因?yàn)樯鲜鰝鹘y(tǒng)的時(shí)間序列預(yù)測方法僅局限于對(duì)航班延誤數(shù)據(jù)時(shí)間相關(guān)性的捕獲,而缺乏對(duì)機(jī)場間空間依賴性的提取。作為結(jié)合GCN及GRU的深度學(xué)習(xí)方法,MAGC GRU相比于其他對(duì)比模型均表現(xiàn)更優(yōu),這說明GCN的加入能夠有效挖掘機(jī)場之間的空間依賴性,從而提高模型預(yù)測精度。隨著預(yù)測窗口的增加,在短期預(yù)測任務(wù)中優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)模型的GRU預(yù)測性能明顯下降,這是長序列的信息傳遞中易發(fā)生梯度消失現(xiàn)象的原因所致。此外,STGCN模型的預(yù)測誤差也隨預(yù)測窗口的增加而大幅增長。經(jīng)分析,這可能是GLU對(duì)于長時(shí)間序列的處理效果不太穩(wěn)定而導(dǎo)致的。然而,MAGC GRU模型的長期預(yù)測效果表現(xiàn)出更好的性能,這說明引入時(shí)間注意力機(jī)制的GRU,通過區(qū)分不同歷史時(shí)間步的影響程度,能夠有效提高模型對(duì)歷史輸入序列重要信息和全局特征的學(xué)習(xí)能力。為直觀地展示MAGC GRU模型對(duì)各機(jī)場的離港準(zhǔn)點(diǎn)率的預(yù)測效果,選取測試集中某一天的真實(shí)值與預(yù)測值進(jìn)行對(duì)比,結(jié)果如圖9所示,圖9中橫坐標(biāo)為不同機(jī)場名稱。由圖9中76個(gè)機(jī)場的預(yù)測結(jié)果可知,所提模型能夠很好地?cái)M合大部分機(jī)場的航班離港準(zhǔn)點(diǎn)率。

      為了進(jìn)一步分析各個(gè)模型對(duì)機(jī)場網(wǎng)絡(luò)離港準(zhǔn)點(diǎn)率的預(yù)測性能表現(xiàn),以MAE為評(píng)價(jià)指標(biāo),機(jī)場網(wǎng)絡(luò)的MAE分布如圖10所示。根據(jù)四分位差(interquartile range, IQR)描述數(shù)據(jù)分布的離散程度。由圖10可知,對(duì)比模型中的STGCN雖然誤差中位線較低,但是整體預(yù)測誤差過于分散,針對(duì)機(jī)場網(wǎng)絡(luò)中不同機(jī)場的預(yù)測效果發(fā)揮不穩(wěn)定。相比之下,MAGC GRU模型的誤差分布最為集中,整體誤差也較小,說明所提方法對(duì)機(jī)場網(wǎng)絡(luò)整體的預(yù)測性能表現(xiàn)最好。此外,預(yù)測誤差的可能來源主要是天氣情況的隨機(jī)波動(dòng)較大,后續(xù)可考慮通過引入天氣特征提取模塊以進(jìn)一步提高模型的預(yù)測精度。

      3.4.2 消融實(shí)驗(yàn)

      為了驗(yàn)證所提模型內(nèi)重要模塊的有效性,在原模型的基礎(chǔ)上分別針對(duì)多時(shí)空組件和Dueling DQN優(yōu)化算法進(jìn)行了消融實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。

      (1) 多時(shí)空組件設(shè)置對(duì)預(yù)測結(jié)果的影響

      為了分析多時(shí)空組件設(shè)置對(duì)MAGC GRU模型預(yù)測性能的影響,在原模型的基礎(chǔ)上進(jìn)行消融實(shí)驗(yàn),構(gòu)建僅采用近期時(shí)間維輸入的AGCN,用于與MAGC GRU模型進(jìn)行對(duì)比實(shí)驗(yàn)。選取MAE和RMSE作為預(yù)測評(píng)價(jià)指標(biāo),針對(duì)多時(shí)空組件的消融實(shí)驗(yàn)結(jié)果如圖11所示,MAE為柱狀圖,RMSE為點(diǎn)線圖。

      由圖11可知,當(dāng)僅采用近期航班延誤時(shí)間序列作為輸入時(shí),模型的預(yù)測效果較融合3個(gè)時(shí)間組件預(yù)測結(jié)果的MAGC GRU模型更差。由此說明,多時(shí)空組件的設(shè)置能夠充分捕獲多時(shí)間維模式,更好地挖掘動(dòng)態(tài)時(shí)間特征,從而有效提高模型的預(yù)測精度??傮w而言,設(shè)置近期、以1周為周期和以1月為周期3個(gè)時(shí)間拓展維輸入組件的MAGC GRU模型與消融模型相比,性能得到了明顯提升,這說明將多組件預(yù)測結(jié)果融合在航班延誤預(yù)測時(shí)有著積極的貢獻(xiàn)。

      (2) 不同優(yōu)化算法的預(yù)測效果對(duì)比

      為了比較分析深度強(qiáng)化學(xué)習(xí)算法和元啟發(fā)式算法在模型超參數(shù)優(yōu)化問題上的優(yōu)化性能,針對(duì)MAGC GRU模型中節(jié)點(diǎn)嵌入維度和GRU單元個(gè)數(shù)的優(yōu)化任務(wù),對(duì)比了Dueling DQN、雙深度Q網(wǎng)絡(luò)(double deep Q network, DDQN)和粒子群優(yōu)化(particle swarm optimization, PSO)算法的優(yōu)化結(jié)果,其中DDQN的參數(shù)與Dueling DQN保持一致。在PSO算法參數(shù)中,粒子群數(shù)目設(shè)置為10,最大和最小慣性權(quán)重分別為0.9和0.4,最大迭代次數(shù)為200。

      采用3種算法分別對(duì)MAGC GRU模型的自適應(yīng)圖卷積節(jié)點(diǎn)嵌入維度和GRU單元個(gè)數(shù)參數(shù)優(yōu)化后,將近期組件、以1周為周期組件、以1月為周期組件的時(shí)間窗口長度分別設(shè)置為7、3、2,用以預(yù)測未來一天的機(jī)場離港準(zhǔn)點(diǎn)率,所得預(yù)測結(jié)果如表2所示。

      由表2分析可知,Dueling DQN的優(yōu)化效果要優(yōu)于DDQN和PSO,采用該算法優(yōu)化的MAGC GRU網(wǎng)絡(luò)具有更高的預(yù)測精度。基于各算法的優(yōu)化原理分析實(shí)驗(yàn)結(jié)果的內(nèi)部原因:PSO算法作為一種經(jīng)典的啟發(fā)式算法,相較于學(xué)習(xí)更擅長搜索任務(wù),并且僅根據(jù)當(dāng)前樣本進(jìn)行求解的機(jī)制使得最終結(jié)果不一定為最優(yōu)解,因此預(yù)測誤差相對(duì)較大;在DDQN的基礎(chǔ)上采用對(duì)偶網(wǎng)絡(luò)結(jié)構(gòu)的Dueling DQN能夠直接對(duì)影響重大的狀態(tài)進(jìn)行學(xué)習(xí),無需學(xué)習(xí)每個(gè)動(dòng)作對(duì)每個(gè)狀態(tài)的影響,從而快速找到最佳動(dòng)作,得到最好的優(yōu)化效果。因此,基于Dueling DQN對(duì)模型超參數(shù)的優(yōu)化是有效的,能夠自適應(yīng)地篩選出最好的參數(shù)組合,有助于航班延誤預(yù)測模型發(fā)揮出最佳的性能。

      3.4.3 不同機(jī)場的預(yù)測效果對(duì)比實(shí)驗(yàn)

      為進(jìn)一步分析模型對(duì)機(jī)場網(wǎng)絡(luò)中具體機(jī)場節(jié)點(diǎn)的航班延誤預(yù)測效果,選取預(yù)測時(shí)間窗口長度為1天的模型預(yù)測表現(xiàn),對(duì)不同機(jī)場的預(yù)測誤差進(jìn)行對(duì)比分析。選用MAE評(píng)價(jià)指標(biāo)評(píng)估模型對(duì)各機(jī)場離港準(zhǔn)點(diǎn)率的預(yù)測效果,根據(jù)MAE從機(jī)場網(wǎng)絡(luò)中挑選出預(yù)測性能表現(xiàn)最好、最差及中等水平的3個(gè)機(jī)場,用折線圖展示MAGC GRU模型預(yù)測值與真實(shí)值的對(duì)比結(jié)果,如圖12所示。

      在3個(gè)機(jī)場中,MAE值最低的是CMH機(jī)場,僅為4.21,該機(jī)場的預(yù)測效果是最好的;AUS機(jī)場MAE的值為5.97,該機(jī)場是預(yù)測性能表現(xiàn)處于中間值的機(jī)場;LAS機(jī)場的MAE值為8.54,是所有機(jī)場中MAE值最高的機(jī)場,這表明模型預(yù)測值對(duì)該機(jī)場真實(shí)值的擬合程度最差。通過分析圖12可知,對(duì)于延誤變化趨勢較為緩和的機(jī)場,所提模型均能表現(xiàn)出更優(yōu)的預(yù)測效果;對(duì)于短期動(dòng)蕩幅度大的機(jī)場,模型的預(yù)測誤差變大,說明此預(yù)測模型在處理不穩(wěn)定數(shù)據(jù)時(shí),預(yù)測航班延誤值未來峰谷值的精確度有限,不過仍能較好地?cái)M合各機(jī)場準(zhǔn)點(diǎn)率曲線大部分峰谷的轉(zhuǎn)換時(shí)間點(diǎn)。整體來看,針對(duì)MAE值不同的3個(gè)機(jī)場,模型的預(yù)測值曲線均能夠較好地?cái)M合真實(shí)值的變化趨勢。

      由對(duì)各機(jī)場的預(yù)測誤差值分析可知,MAE值較高的機(jī)場均為交通繁忙的大型機(jī)場,這類機(jī)場旅客吞吐量大且與機(jī)場網(wǎng)絡(luò)中鄰居節(jié)點(diǎn)的空間相關(guān)性復(fù)雜,導(dǎo)致其離港航班準(zhǔn)點(diǎn)率未來變化趨勢難以捕獲。

      3.4.4 泛化性實(shí)驗(yàn)

      為進(jìn)一步驗(yàn)證所提模型的泛化性,從美國運(yùn)輸統(tǒng)計(jì)局官網(wǎng)所得數(shù)據(jù)集中篩選得到航班客運(yùn)量排名前51的機(jī)場間來往航班記錄,生成一個(gè)新的機(jī)場網(wǎng)絡(luò)數(shù)據(jù)集,用以進(jìn)行模型的泛化能力分析實(shí)驗(yàn)。數(shù)據(jù)預(yù)處理操作及實(shí)驗(yàn)參數(shù)設(shè)置與前述實(shí)驗(yàn)一致。基線模型的輸入時(shí)間序列窗口長度設(shè)置為7,預(yù)測目標(biāo)的時(shí)間窗口長度設(shè)置為1。選用MAE、RMSE、MAPE作為機(jī)場航班準(zhǔn)點(diǎn)率評(píng)價(jià)指標(biāo),將所提模型與5組基線模型進(jìn)行仿真對(duì)比,預(yù)測結(jié)果如表3所示。

      由表3分析可知,MAGC GRU模型的各項(xiàng)評(píng)價(jià)指標(biāo)均比基線模型更優(yōu),對(duì)于不同的機(jī)場網(wǎng)絡(luò)數(shù)據(jù)集亦能表現(xiàn)出較好的預(yù)測性能,由此有效驗(yàn)證了該模型能夠勝任不同的航班延誤預(yù)測任務(wù),具有一定的泛化能力。

      4 結(jié) 論

      為了提高航班延誤預(yù)測精度,本文提出一種基于Dueling DQN優(yōu)化的MAGC GRU的航班延誤預(yù)測模型,采用美國機(jī)場網(wǎng)絡(luò)航班離港準(zhǔn)點(diǎn)率數(shù)據(jù)集對(duì)所提方法進(jìn)行實(shí)驗(yàn)驗(yàn)證,并與不同經(jīng)典預(yù)測方法進(jìn)行預(yù)測性能對(duì)比,由實(shí)驗(yàn)結(jié)果得到的主要結(jié)論如下。

      (1) 采用自適應(yīng)圖卷積能夠有效提取機(jī)場網(wǎng)絡(luò)動(dòng)態(tài)空間相關(guān)性,在此基礎(chǔ)上引入多頭注意力機(jī)制,通過同時(shí)關(guān)注多個(gè)子空間的特征信息,從而并行捕獲節(jié)點(diǎn)間的微弱空間特征。

      (2) 采用Dueling DQN算法對(duì)MAGC GRU模型超參數(shù)進(jìn)行優(yōu)化,自動(dòng)捕獲使得模型發(fā)揮出最佳預(yù)測性能的參數(shù)組合,降低了人為設(shè)定參數(shù)對(duì)模型預(yù)測結(jié)果準(zhǔn)確度的影響。

      (3) 設(shè)置多個(gè)以不同時(shí)間維序列為輸入的時(shí)空組件,對(duì)近期、以1周為周期、以1月為周期的時(shí)間模式分別建模,從而充分捕獲多樣的時(shí)間特征,并有效提高了模型的預(yù)測精度。

      參考文獻(xiàn)

      [1]HENRIQUES R, FEITEIRA I. Predictive modelling: flight delays and associated factors, Hartsfield Jackson Atlanta International Airport[J]. Procedia Computer Science, 2018, 138: 638-645.

      [2]BASPINAR B, KOYUNCU E. A data driven air transportation delay propagation model using epidemic process models[J]. International Journal of Aerospace Engineering, 2016, 2016(1): 4836260.

      [3]王春政, 胡明華, 楊磊, 等. 基于Agent模型的機(jī)場網(wǎng)絡(luò)延誤預(yù)測[J]. 航空學(xué)報(bào), 2021, 42(7): 452-465.

      WANG C Z, HU M H, YANG L, et al. Airport network delay prediction based on Agent model[J]. Acta Aeronautica et Astronautica Sinica, 2021, 42(7): 452-465.

      [4]羅赟騫, 陳志杰, 湯錦輝, 等. 采用支持向量機(jī)回歸的航班延誤預(yù)測研究[J]. 交通運(yùn)輸系統(tǒng)工程與信息, 2015, 15(1): 143-149.

      LUO Y Q, CHEN Z J, TANG J H, et al. Flight delay prediction using support vector machine regression[J]. Journal of Transportation Systems Engineering and Information Technology, 2015, 15(1): 143-149.

      [5]LI Q, JING R Z. Characterization of delay pro pagation in the air traffic network[J]. Journal of Air Transport Management, 2021, 94: 102075.

      [6]程華, 李艷梅, 羅謙, 等. 基于C4.5決策樹方法的到港航班延誤預(yù)測問題研究[J]. 系統(tǒng)工程理論與實(shí)踐, 2014, 34(S1): 239-247.

      CHENG H, LI Y M, LUO Q, et al. Study on flight delay with C4.5 decision tree based prediction method[J]. Systems Engineering Theory and Practice, 2014, 34(S1): 239-247.

      [7]KIM Y J, CHOI S, BRICENO S, et al. A deep learning approach to flight delay prediction[C]∥Proc.of the 35th Digital Avionics Systems Conference, 2016.

      [8]YU B, GUO Z, ASIAN S, et al. Flight delay prediction for commercial air transport: a deep learning approach[J]. Transportation Research Part E: Logistics and Transportation Review, 2019, 125(5): 203-221.

      [9]CAI K Q, LI Y, FANG Y P, et al. A deep learning approach for flight delay prediction through time evolving graphs[J]. IEEE Trans.on Intelligent Transportation Systems, 2021, 23(8): 11397-11407.

      [10]姜雨, 陳名揚(yáng), 袁琪, 等. 基于時(shí)空?qǐng)D卷積神經(jīng)網(wǎng)絡(luò)的離港航班延誤預(yù)測[J]. 北京航空航天大學(xué)學(xué)報(bào), 2023, 49(5): 1044-1052.

      JIANG Y, CHEN M Y, YUAN Q, et al. Departure flight delay prediction based on spatio temporal graph convolutional networks[J]. Journal of Beijing University of Aeronautics and Astronautics, 2023, 49(5): 1044-1052.

      [11]ZENG W L, LI J, QUAN Z B, et al. A deep graph embedded LSTM neural network approach for airport delay prediction[J]. Journal of Advanced Transportation, 2021, 2021(1): 6638130.

      [12]CAI K Q, LI Y, ZHU Y W, et al. A geographical and operational deep graph convolutional approach for flight delay prediction[J]. Chinese Journal of Aeronautics, 2023, 36(3): 357-367.

      [13]TAN R K, BORA S. Parameter tuning in modeling and simulations by using swarm intelligence optimization algorithms[C]∥Proc.of the International Conference on Computational Intelligence and Communication Network, 2018: 148-152.

      [14]龍遠(yuǎn), 鄧小龍, 楊希祥, 等. 基于PSO BP神經(jīng)網(wǎng)絡(luò)的平流層風(fēng)場短期快速預(yù)測[J]. 北京航空航天大學(xué)學(xué)報(bào), 2022, 48(10): 1970-1978.

      LONG Y, DENG X L, YANG X X, et al. Short term rapid prediction of stratospheric wind field based on PSO BP neural network[J]. Journal of Beijing University of Aeronautics and Astronautics, 2022, 48(10): 1970-1978.

      [15]楊帆, 申亞, 李東東, 等. 基于GA GNNM的極地光伏發(fā)電功率預(yù)測方法[J]. 太陽能學(xué)報(bào), 2022, 43(4): 167-174.

      YANG F, SHEN Y, LI D D, et al. Polar photovoltaic power forecasting method based on GA GNNM[J]. Acta Energiae Solaris Sinica, 2022, 43(4): 167-174.

      [16]陳超逸, 魯娟, 陳楷, 等. 車削表面粗糙度解析模型與DDQN SVR預(yù)測模型研究[J]. 機(jī)械工程學(xué)報(bào), 2021, 57(13): 262-272.

      CHEN C Y, LU J, CHEN K, et al. Research on analytical model and DDQN SVR prediction model of turning surface roughness[J]. Journal of Mechanical Engineering, 2021, 57(13): 262-272.

      [17]陳海鵬, 李赫, 闞天洋, 等. 考慮風(fēng)電時(shí)序特性的深度小波-時(shí)序卷積網(wǎng)絡(luò)的超短期風(fēng)功率預(yù)測[J]. 電網(wǎng)技術(shù), 2023, 47(4): 1653-1665.

      CHEN H P, LI H, KAN T Y, et al. Ultra short term wind power prediction of deep wavelet timing convolutional network considering wind power timing characteristics[J]. Power System Technology, 2023, 47(4): 1653-1665.

      [18]SHI Y, HUI L. Wind power prediction based on outlier correction, ensemble reinforcement learning, and residual correction[J]. Energy, 2022, 250: 123857.

      [19]YU C Q, YAN G X, YU C M, et al. A multi factor driven spatio temporal wind power prediction model based on ensemble deep graph attention reinforcement learning networks[J]. Energy, 2023, 263: 126034.

      [20]BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[EB/OL]. [2023-11-05].https:∥doi.org/10.48550/arXiv.1312.6203.

      [21]DEFFERRARD M, BRESSON X, VANDERGHEYNST P. Convolutional neural networks on graphs with fast localized spectral filtering[C]∥Proc.of the Advances in Neural Information Processing Systems, 2016.

      [22]KIPF T N, WELLING M. Semi supervised classification with graph convolutional networks[EB/OL]. [2023-11-05].https:∥doi.org/10.48550/arXiv.1609.02907.

      [23]ASHISH V, NOAM S, NIKI P, et al. Attention is all you need[C]∥Proc.of the Conference on Neural Information Processing Systems, 2017: 5998-6008.

      [24]CHUNG J, GULCEHRE C, CHO K H, et al. Empirical evaluation of gated recurrent neural networks on sequence modeling[EB/OL]. [2023-11-05].https:∥doi.org/10.48550/arXiv.1609.

      [25]BAHDANAU D, CHO K, BENGIO Y. Neural machine translation by jointly learning to align and translate[J]. https:∥arXiv preprint arxiv: 1409. 0473, 2014.

      [26]SUN G L, AYEPAHMENSAH D, XU R, et al. End to end CNN based dueling deep Q Network for autonomous cell activation in Cloud RANs[J]. Journal of Network and Computer Applications, 2020, 169: 102757.

      [27]MNIH V, KAVUKCUOGLU K, SILVER D, et al. Playing atari with deep reinforcement learning[EB/OL]. [2023-11-05].https:∥people.engr.tamu.edu/guni/ccsce642/files/clqn.pdf.

      [28]REBOLLO J J, BALAKRISHNAN H. Characterization and prediction of air traffic delays[J]. Transportation Research Part C: Emerging Technologies, 2014, 44: 231-241.

      [29]XIA Y, CHEN J G. Traffic flow forecasting method based on gradient boosting decision tree[C]∥Proc.of the 5th International Conference on Frontiers of Manufacturing Science and Measuring Technology, 2017: 436-439.

      作者簡介

      劉曉琳(1978—),女,副教授,博士,主要研究方向?yàn)橹悄芸刂婆c故障診斷。

      郭夢嬌(1999—),女,碩士研究生,主要研究方向?yàn)楹桨嘌诱`預(yù)測。

      李 卓(1994—),女,博士研究生,主要研究方向?yàn)殡娏ο到y(tǒng)自動(dòng)化、新能源發(fā)電。

      猜你喜歡
      強(qiáng)化學(xué)習(xí)深度學(xué)習(xí)
      智能車自主避障路徑規(guī)劃研究綜述
      一種記憶可修剪型仿生機(jī)器人的速度跟蹤算法研究
      基于強(qiáng)化學(xué)習(xí)的在線訂單配送時(shí)隙運(yùn)能分配
      論“以讀促寫”在初中英語寫作教學(xué)中的應(yīng)用
      智能交通車流自動(dòng)導(dǎo)引系統(tǒng)
      有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
      電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
      MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
      大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
      分布式系統(tǒng)中基于非合作博弈的調(diào)度算法
      松原市| 梅河口市| 达日县| 获嘉县| 金寨县| 宕昌县| 馆陶县| 丰顺县| 恩施市| 丹东市| 五台县| 荔波县| 巴塘县| 镶黄旗| 和顺县| 泊头市| 阿拉尔市| 犍为县| 肃宁县| 大名县| 紫阳县| 息烽县| 盘锦市| 台前县| 申扎县| 精河县| 绥宁县| 苏尼特左旗| 木里| 雅江县| 嘉荫县| 阿拉善左旗| 郓城县| 吉林市| 女性| 阿图什市| 云龙县| 双峰县| 胶南市| 滕州市| 乐清市|