張?zhí)熨n, 萬(wàn)莉莉, 王倩, 彭秋萍
(南京航空航天大學(xué)民航學(xué)院, 南京 211106)
隨著民航業(yè)快速發(fā)展,航班延誤問(wèn)題日益凸顯,其根本原因是航空公司旺盛的時(shí)刻需求和機(jī)場(chǎng)有限的容量之間的不平衡。民航局在制訂航班時(shí)刻表時(shí),雖然考慮了航空公司的時(shí)刻需求和機(jī)場(chǎng)的容量之間的平衡,但實(shí)際運(yùn)行中可能出現(xiàn)各種情況造成機(jī)場(chǎng)容量下降,以至于不能滿足航空公司旺盛的時(shí)刻需求,進(jìn)而導(dǎo)致航班延誤等情況的發(fā)生。對(duì)航班時(shí)刻表執(zhí)行過(guò)程中可能發(fā)生的航班延誤等情況進(jìn)行預(yù)測(cè),并以此作為指標(biāo)評(píng)估航班時(shí)刻表,可以得知制作的航班時(shí)刻表的優(yōu)劣程度,進(jìn)而指導(dǎo)航班時(shí)刻表的優(yōu)化,對(duì)緩解機(jī)場(chǎng)的容需矛盾,減少航班延誤,具有重要意義。
目前對(duì)航班時(shí)刻表評(píng)估的研究還在起步階段,Lambelho等[1]首次對(duì)航班時(shí)刻表評(píng)估展開(kāi)研究,使用機(jī)器學(xué)習(xí)算法預(yù)測(cè)航班延誤并以此作為指標(biāo),使用基于帕累托面的方法評(píng)估航班時(shí)刻表。但在實(shí)際運(yùn)行中,航班時(shí)刻表樣本較少,基于帕累托面的方法只有在指標(biāo)間滿足特定條件時(shí),才能區(qū)分航班時(shí)刻表之間的優(yōu)劣關(guān)系,具有一定的局限性。
航班時(shí)刻表評(píng)估指標(biāo)尚無(wú)行業(yè)規(guī)范,但中外學(xué)者從航班延誤、滑行時(shí)間等方面對(duì)航班時(shí)刻表展開(kāi)了較多研究,為評(píng)估指標(biāo)的選取與計(jì)算奠定了基礎(chǔ)。Wang等[2]發(fā)現(xiàn)航班延誤和滑行時(shí)間對(duì)航班時(shí)刻表中航班輪檔時(shí)間設(shè)置都有較大影響;Kim等[3]使用遞歸神經(jīng)網(wǎng)絡(luò)和天氣相關(guān)特征對(duì)美國(guó)幾個(gè)機(jī)場(chǎng)航班延誤進(jìn)行分類;馮霞等[4-5]提出了一種場(chǎng)面交通狀況衡量指標(biāo)及基于該指標(biāo)的無(wú)障礙滑出時(shí)間計(jì)算模型,并基于K最近鄰和支持向量回歸,構(gòu)建了離港航班滑出時(shí)間預(yù)測(cè)模型;Choi等[6]利用隨機(jī)森林和天氣相關(guān)特征對(duì)航班延誤進(jìn)行分類;Diana[7]預(yù)測(cè)了飛機(jī)的滑行時(shí)間,并使用不同的機(jī)器學(xué)習(xí)方法測(cè)試了多個(gè)案例;周潔敏等[8]利用隨機(jī)森林特征選擇模型篩選21個(gè)重要特征,引入正則化L1、L2范數(shù),建立彈性神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)航班落地延誤時(shí)間進(jìn)行預(yù)測(cè);Klein等[9]用天氣條件作為特征來(lái)進(jìn)行機(jī)場(chǎng)航班延誤預(yù)測(cè);Chen等[10]使用多標(biāo)簽隨機(jī)森林分類算法分析航班延誤的傳播;徐海文等[11]基于航班時(shí)刻表數(shù)據(jù),建立了離港延誤時(shí)間預(yù)測(cè)模型;張舜堯等[12]從航空公司的角度建立了航班延誤預(yù)測(cè)模型,并以此為基礎(chǔ)建立了航班時(shí)刻表優(yōu)化模型,模型可有效減少航班延誤。
以上研究都是對(duì)航班時(shí)刻表中的航班延誤或者滑行時(shí)間進(jìn)行預(yù)測(cè)或建立優(yōu)化模型等,從單方面對(duì)航班時(shí)刻表進(jìn)行研究,還沒(méi)有學(xué)者綜合考慮航班延誤、滑行時(shí)間等因素的影響對(duì)航班時(shí)刻表進(jìn)行評(píng)估,而且現(xiàn)有的評(píng)估方法具有一定的局限性,亟須提出一種普適性更強(qiáng)的航班時(shí)刻表評(píng)估方法,為航班時(shí)刻表優(yōu)化做鋪墊。因此,現(xiàn)對(duì)航班時(shí)刻表評(píng)估展開(kāi)研究,首先,基于現(xiàn)有評(píng)估指標(biāo)集,引入滑行時(shí)間評(píng)估指標(biāo),從航班延誤和滑行時(shí)間兩方面選取4個(gè)評(píng)估指標(biāo);其次,由于航班時(shí)刻表中航班延誤和滑行時(shí)間在航班執(zhí)行前是未知的,采用分類算法預(yù)測(cè)航班延誤和滑行時(shí)間,并以此計(jì)算評(píng)估指標(biāo);最后,使用灰色關(guān)聯(lián)逼近理想解排序法(technique for order preference by similarity to an ideal solution-grey correlation, TOPSIS-GC)對(duì)多個(gè)航班時(shí)刻表的性能進(jìn)行比較并進(jìn)行優(yōu)劣排序。
對(duì)執(zhí)行前航班時(shí)刻表的評(píng)估問(wèn)題進(jìn)行研究,由于對(duì)航班時(shí)刻表執(zhí)行時(shí)的氣象條件、空域結(jié)構(gòu)等外部條件是未知的,所以只針對(duì)航班時(shí)刻表進(jìn)行研究,故做出如下假設(shè):①不考慮雷暴、冰雹等惡劣天氣的影響;②認(rèn)為航班時(shí)刻表在執(zhí)行時(shí)的終端區(qū)空域結(jié)構(gòu)、停機(jī)位、滑行道、管制策略等外部條件與評(píng)估時(shí)一致,未發(fā)生改變。
現(xiàn)有評(píng)估指標(biāo)集包含預(yù)測(cè)的進(jìn)港延誤和離港延誤百分比兩個(gè)評(píng)估指標(biāo)[1],同時(shí)航班延誤和滑行時(shí)間對(duì)航班輪檔時(shí)間設(shè)置都有較大影響[2],且目前對(duì)航班延誤和滑行時(shí)間預(yù)測(cè)的研究已經(jīng)比較成熟,評(píng)估指標(biāo)的計(jì)算精度可以得到保證,所以從航班延誤和滑行時(shí)間兩方面選取了4個(gè)評(píng)估指標(biāo)。
航班延誤指航班實(shí)際進(jìn)港擋輪檔/離港撤輪檔時(shí)間晚于計(jì)劃進(jìn)港/離港時(shí)間超過(guò)15 min的情況,反之為航班準(zhǔn)點(diǎn)。準(zhǔn)點(diǎn)率可體現(xiàn)航班時(shí)刻表的整體延誤情況,選取進(jìn)港準(zhǔn)點(diǎn)率和離港準(zhǔn)點(diǎn)率作為航班延誤評(píng)估指標(biāo)。
(1)進(jìn)港準(zhǔn)點(diǎn)率是航班時(shí)刻表中進(jìn)港準(zhǔn)點(diǎn)的航班在進(jìn)港航班中的比例,公式為
(1)
式(1)中:IA為航班時(shí)刻表進(jìn)港準(zhǔn)點(diǎn)率;NAO為航班時(shí)刻表中進(jìn)港準(zhǔn)點(diǎn)航班數(shù)量;NA為航班時(shí)刻表進(jìn)港航班數(shù)量。
(2)離港準(zhǔn)點(diǎn)率是航班時(shí)刻表中離港準(zhǔn)點(diǎn)的航班在離港航班中的比例,公式為
(2)
式(2)中:ID為航班時(shí)刻表離港準(zhǔn)點(diǎn)率;NDO為航班時(shí)刻表中離港準(zhǔn)點(diǎn)航班數(shù)量;ND為航班時(shí)刻表離港航班數(shù)量。
滑行時(shí)間分為滑入時(shí)間和滑出時(shí)間,滑入時(shí)間即航班著陸接地到擋輪檔所經(jīng)過(guò)的時(shí)間,滑出時(shí)間即航班撤輪檔到起飛離地所經(jīng)過(guò)的時(shí)間。當(dāng)航班的滑入/滑出時(shí)間在機(jī)場(chǎng)地面滑行時(shí)間標(biāo)準(zhǔn)以內(nèi)為滑入/滑出時(shí)間可靠,否則為不可靠。為體現(xiàn)航班時(shí)刻表的整體滑行時(shí)間可靠情況,選取滑入可靠性和滑出可靠性作為滑行時(shí)間評(píng)估指標(biāo)。
(1)滑入可靠性是航班時(shí)刻表中滑入時(shí)間可靠的航班在進(jìn)港航班中的比例,公式為
(3)
式(3)中:II為航班時(shí)刻表滑入可靠性;NIO為航班時(shí)刻表中滑入時(shí)間可靠的航班數(shù)量。
(2)滑出可靠性是航班時(shí)刻表中滑出時(shí)間可靠的航班在離港航班中的比例,公式為
(4)
式(4)中:IO為航班時(shí)刻表滑出可靠性;NOO為航班時(shí)刻表中滑出時(shí)間可靠的航班數(shù)量。
由于航班時(shí)刻表是在航班執(zhí)行前制訂的,其評(píng)估指標(biāo)不能直接得到,所以使用分類算法對(duì)航班時(shí)刻表中每個(gè)航班的延誤和滑行時(shí)間可靠情況進(jìn)行預(yù)測(cè),進(jìn)而計(jì)算評(píng)估指標(biāo)。
分類預(yù)測(cè)算法,首先輸入包含特征和標(biāo)簽(類別)的訓(xùn)練數(shù)據(jù);然后通過(guò)學(xué)習(xí),找到特征與標(biāo)簽間的關(guān)系,即映射。所以說(shuō)分類預(yù)測(cè)模型是求取一個(gè)從輸入變量(特征)到離散的輸出變量(標(biāo)簽)之間的映射函數(shù)。在此當(dāng)輸入有特征而無(wú)標(biāo)簽的未知數(shù)據(jù)時(shí),可以通過(guò)映射函數(shù)預(yù)測(cè)未知數(shù)據(jù)的標(biāo)簽。
構(gòu)建了進(jìn)行航班延誤和滑行時(shí)間可靠性預(yù)測(cè)的特征集,采用實(shí)數(shù)編碼、三角函數(shù)變換和目標(biāo)編碼3種方法進(jìn)行特征編碼[1],如表1所示。
表1 數(shù)據(jù)特征描述Table 1 Data feature description
與目標(biāo)編碼方法相結(jié)合的特征:以航班延誤預(yù)測(cè)為例,基于該航班延誤的概率對(duì)字段Airline進(jìn)行編碼,例如,總共有3個(gè)國(guó)航的航班,其中有2個(gè)航班準(zhǔn)點(diǎn),則航空公司國(guó)航編碼為2/3=0.67。
根據(jù)選擇的數(shù)據(jù)特征,使用LightGBM算法對(duì)航班時(shí)刻表中每個(gè)航班的進(jìn)港延誤、離港延誤、滑入時(shí)間可靠性和滑出時(shí)間可靠性進(jìn)行預(yù)測(cè),并根據(jù)式(1)~式(4)計(jì)算評(píng)估指標(biāo)。
根據(jù)評(píng)估指標(biāo),使用TOPSIS-GC法對(duì)多個(gè)航班時(shí)刻表的性能進(jìn)行相對(duì)比較。與同一航季制訂的多個(gè)航班時(shí)刻表相比,可以選出更優(yōu)的航班時(shí)刻表;與其他航季已執(zhí)行的航班時(shí)刻表相比,可以體現(xiàn)制訂的航班時(shí)刻表的優(yōu)劣程度。航班時(shí)刻表評(píng)估流程如下。
步驟1對(duì)n個(gè)待評(píng)估的航班時(shí)刻表的4個(gè)評(píng)估指標(biāo),構(gòu)建原始數(shù)據(jù)矩陣為
(5)
式(5)中:xij為第i個(gè)航班時(shí)刻表的第j個(gè)評(píng)估指標(biāo),i=1,2…,n,j=1,2,3,4。
步驟2構(gòu)建參考數(shù)據(jù)行。
X0=[x0(1),x0(2),x0(3),x0(4)]
(6)
式(6)中:x0(1)、x0(2)、x0(3)、x0(4)為各評(píng)估指標(biāo)的參考值,高優(yōu)指標(biāo)的參考值為最大值,低優(yōu)指標(biāo)的參考值為最小值。
步驟3計(jì)算原始數(shù)據(jù)矩陣X各指標(biāo)行與參考數(shù)據(jù)行對(duì)應(yīng)元素的差值的絕對(duì)值|x0(j)-xij|。
步驟4根據(jù)|x0(j)-xij|計(jì)算原始數(shù)據(jù)矩陣X各指標(biāo)與參考數(shù)據(jù)行中對(duì)應(yīng)元素的關(guān)聯(lián)系數(shù),計(jì)算公式為
(7)
式(7)中:ξij為第i個(gè)航班時(shí)刻表的第j個(gè)評(píng)估指標(biāo)與參考數(shù)據(jù)行對(duì)應(yīng)元素的關(guān)聯(lián)系數(shù);ρ為分辨系數(shù),在(0,1)內(nèi)取值,若ρ越小,關(guān)聯(lián)系數(shù)間差異越大,區(qū)分能力越強(qiáng),通常ρ取0.5。
計(jì)算結(jié)果構(gòu)成的關(guān)聯(lián)系數(shù)矩陣為
(8)
步驟5由關(guān)聯(lián)系數(shù)矩陣Zij中各列的最大值構(gòu)成最優(yōu)方案,各列的最小值構(gòu)成最劣方案,即
Z+=(ζmax1,ζmax2,ζmax3,ζmax4)
(9)
Z-=(ζmin1,ζmin2,ζmin3,ζmin4)
(10)
步驟6計(jì)算各航班時(shí)刻表與最優(yōu)方案距離和與最劣方案距離,公式為
(11)
(12)
步驟7計(jì)算各航班時(shí)刻表與最優(yōu)方案的相對(duì)貼近度,公式為
(13)
式(13)中:Ci為第i個(gè)航班時(shí)刻表與最優(yōu)方案的相對(duì)貼近度,Ci越大,表示該航班時(shí)刻表越好。
步驟8根據(jù)航班時(shí)刻表與最優(yōu)方案的相對(duì)貼近度進(jìn)行排序,Ci越大,航班時(shí)刻表排名越靠前。
北京首都國(guó)際機(jī)場(chǎng)是中國(guó)三大門戶復(fù)合樞紐之一,世界超大型機(jī)場(chǎng),交通量在高峰時(shí)期接近100架次/h,其日高峰量接近2 000架次,位列全國(guó)第一。而越繁忙的機(jī)場(chǎng),其反映出來(lái)的問(wèn)題也更加全面,故選取北京首都國(guó)際機(jī)場(chǎng)作為典型機(jī)場(chǎng)進(jìn)行分析。將2019年冬春、夏秋航季的航班時(shí)刻表與2017、2018年已執(zhí)行的航班時(shí)刻表進(jìn)行相對(duì)性能比較,以評(píng)估2019年執(zhí)行前航班時(shí)刻表的優(yōu)劣程度。
使用北京首都國(guó)際機(jī)場(chǎng)2017年和2018年冬春、夏秋航季的4個(gè)已執(zhí)行的航班時(shí)刻表數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),2019年冬春、夏秋航季執(zhí)行前的航班時(shí)刻表數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù)。
4.1.1 LightGBM算法建模
應(yīng)用Python中的sklearn和lightgbm工具包完成LightGBM算法的調(diào)參、訓(xùn)練及測(cè)試。訓(xùn)練集與測(cè)試集數(shù)據(jù)比為4∶1,采用五折交叉驗(yàn)證進(jìn)行參數(shù)調(diào)優(yōu)。預(yù)測(cè)航班是否延誤、滑行時(shí)間是否可靠為二分類問(wèn)題,所以參數(shù)application設(shè)置為binary,boosting設(shè)置為gbdt。使用工具包中的GridSearchCV函數(shù)完成參數(shù)調(diào)優(yōu)過(guò)程,最佳參數(shù)下,重復(fù)進(jìn)行3次實(shí)驗(yàn)后,訓(xùn)練集和測(cè)試集預(yù)測(cè)準(zhǔn)確率如表2所示。
進(jìn)港延誤、離港延誤和滑出時(shí)間可靠性的預(yù)測(cè)準(zhǔn)確率達(dá)到了0.78以上,滑入時(shí)間可靠性的預(yù)測(cè)準(zhǔn)確率達(dá)到了0.9,說(shuō)明使用LightGBM算法可以較為準(zhǔn)確地預(yù)測(cè)評(píng)估指標(biāo)。
表2 LightGBM算法驗(yàn)證集和測(cè)試集預(yù)測(cè)準(zhǔn)確率Table 2 Prediction accuracy of verification set and test set of LightGBM algorithm
4.1.2 評(píng)估指標(biāo)
使用表2中的最佳參數(shù)預(yù)測(cè)后,由式(1)~式(4)預(yù)測(cè)得到2019年航班時(shí)刻表的評(píng)估指標(biāo);2017年和2018年航班時(shí)刻表評(píng)估指標(biāo)直接計(jì)算獲得,6個(gè)航班時(shí)刻表評(píng)估指標(biāo)如表3所示。
表3 2017—2019年的6個(gè)航班時(shí)刻表評(píng)估指標(biāo)Table 3 Six flight schedule evaluation indicators from 2017 to 2019
根據(jù)表3中的評(píng)估指標(biāo),將2019年航班時(shí)刻表與2017年和2018年航班時(shí)刻表進(jìn)行相對(duì)性能比較,評(píng)估結(jié)果如表4所示。
表4 TOPSIS-GC法評(píng)估結(jié)果Table 4 Evaluation results of TOPSIS-GC
2019年冬春航季航班時(shí)刻表,在進(jìn)港準(zhǔn)點(diǎn)率、離港準(zhǔn)點(diǎn)率、滑入可靠性和滑出可靠性4個(gè)方面表現(xiàn)均最好,排名處在第一位。前四個(gè)航季的已執(zhí)行的航班時(shí)刻表評(píng)估結(jié)果逐步上升,這表明了北京首都國(guó)際機(jī)場(chǎng)在2017—2018年期間,制定的航班時(shí)刻表越來(lái)越適合機(jī)場(chǎng)的發(fā)展,機(jī)場(chǎng)的運(yùn)行保障能力逐步加強(qiáng),航班不正常情況逐漸減少,保持著良好發(fā)展的態(tài)勢(shì)。2019年的兩個(gè)執(zhí)行前的航班時(shí)刻表與2017年和2018年的4個(gè)航班時(shí)刻表相比,各項(xiàng)評(píng)估指標(biāo)均有較大提升,評(píng)估結(jié)果排名在前兩位,航班時(shí)刻表制定的更加合理,但兩個(gè)航班時(shí)刻表的進(jìn)港準(zhǔn)點(diǎn)率分別為0.719 6和0.834 1,還有較大提升空間,可以考慮從提升進(jìn)港準(zhǔn)點(diǎn)率的角度對(duì)航班時(shí)刻表進(jìn)行優(yōu)化,以進(jìn)一步提升2019年兩個(gè)航班時(shí)刻表的合理性,減少潛在的航班不正常情況。
為探究航班時(shí)刻表的最佳評(píng)估方法,使用基于帕累托面的方法對(duì)航班時(shí)刻表進(jìn)行評(píng)估,并與TOPSIS-GC法進(jìn)行對(duì)比,結(jié)果如表5所示。
表5 兩種方法排序結(jié)果對(duì)比Table 5 Comparison of sorting results of two methods
表5中,兩種評(píng)估方法對(duì)2018年和2019年的4個(gè)航班時(shí)刻表的排序完全相同,但在2017年冬春和夏秋航季的兩個(gè)航班時(shí)刻表的評(píng)估中,由于指標(biāo)變化較小,不能滿足各項(xiàng)指標(biāo)均優(yōu)于另一個(gè)航班時(shí)刻表的條件,基于帕累托面的方法無(wú)法評(píng)價(jià)兩個(gè)航班時(shí)刻表之間的優(yōu)劣關(guān)系,而TOPSIS-GC法可以明顯地區(qū)分兩個(gè)航班時(shí)刻表之間的優(yōu)劣關(guān)系,避免了基于帕累托面的方法在樣本較少時(shí)無(wú)法區(qū)分航班時(shí)刻表優(yōu)劣的問(wèn)題,這表明TOPSIS-GC法對(duì)航班時(shí)刻表評(píng)估的普適性更強(qiáng)。
為驗(yàn)證添加滑行時(shí)間指標(biāo)對(duì)評(píng)估結(jié)果的影響,使用TOPSIS-GC法,將添加滑行時(shí)間指標(biāo)前后的評(píng)估結(jié)果進(jìn)行了對(duì)比。
圖1為添加滑行時(shí)間指標(biāo)前后的評(píng)估結(jié)果均方差對(duì)比,僅使用航班延誤指標(biāo)的評(píng)估結(jié)果均方差為0.353,添加滑行時(shí)間指標(biāo)后評(píng)估結(jié)果均方差為0.369。對(duì)多個(gè)航班時(shí)刻表的性能進(jìn)行相對(duì)比較,評(píng)估結(jié)果的均方差越大,表明航班時(shí)刻表間的差異越大。與僅使用航班延誤指標(biāo)相比,添加滑行時(shí)間指標(biāo)后,評(píng)估結(jié)果均方差由0.353提高到了0.369,這說(shuō)明添加滑行時(shí)間指標(biāo)后,能更好地體現(xiàn)航班時(shí)刻表之間的差異性,提高了TOPSIS-GC法對(duì)航班時(shí)刻表的優(yōu)劣區(qū)分能力。
圖1 添加滑行時(shí)間指標(biāo)前后TOPSIS-GC法評(píng)估 結(jié)果均方差對(duì)比Fig.1 Comparison of mean square deviation of TOPSIS-GC evaluation results before and after adding taxiing time index
針對(duì)航班時(shí)刻表評(píng)估問(wèn)題,使用LightGBM算法對(duì)評(píng)估指標(biāo)進(jìn)行預(yù)測(cè),提出了TOPSIS-GC法評(píng)估航班時(shí)刻表,以北京首都國(guó)際機(jī)場(chǎng)為例證明了方法的有效性。
(1)相較于現(xiàn)有研究從航班延誤方面選取評(píng)估指標(biāo)而言,考慮航班時(shí)刻表在航班延誤和滑行時(shí)間兩個(gè)方面的表現(xiàn),引入滑入可靠性、滑出可靠性兩個(gè)新的評(píng)估指標(biāo),能夠更加全面地根據(jù)航班運(yùn)行特性進(jìn)行評(píng)估,提高了TOPSIS-GC法對(duì)航班時(shí)刻表的優(yōu)劣區(qū)分能力。
(2)提出了TOPSIS-GC法評(píng)估航班時(shí)刻表,對(duì)多個(gè)航班時(shí)刻表進(jìn)行相對(duì)性能比較。TOPSIS-GC法避免了基于帕累托面的方法在樣本較少時(shí)不能有效評(píng)估航班時(shí)刻表的問(wèn)題,具有更強(qiáng)的普適性。
(3)只選擇了航班延誤和滑行時(shí)間兩方面的指標(biāo),進(jìn)一步研究可以從航空公司效益和機(jī)場(chǎng)容量等方面增加指標(biāo),使評(píng)估更加全面。