王興隆 許晏豐 紀(jì)君柔
(1.中國(guó)民航大學(xué)空中交通管理學(xué)院 天津 300300;2.中國(guó)東方航空股份有限公司 上海 200135)
隨著我國(guó)民航業(yè)的不斷發(fā)展,航班數(shù)量和客貨吞吐量逐年遞增[1],可用的空域資源日漸不足,航班延誤數(shù)量也日益增多。對(duì)航班延誤做出合理評(píng)價(jià)是分析航班延誤總體水平、降低延誤成本,以及制定相關(guān)處置預(yù)案的重要基礎(chǔ),有著重要的現(xiàn)實(shí)運(yùn)用價(jià)值。
近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)航班延誤有關(guān)問(wèn)題進(jìn)行了深入研究。在國(guó)外,Henriques 等[2]提出了空中交通網(wǎng)絡(luò)延誤過(guò)程的新變量,并在此基礎(chǔ)上對(duì)空中交通延誤模式進(jìn)行了預(yù)測(cè)。Suvojit 等[3]采集6 個(gè)維度的延誤屬性有關(guān)數(shù)據(jù),通過(guò)構(gòu)建增強(qiáng)決策樹(shù)模型來(lái)分析航班延誤。Yi等[4]采用多元線性回歸的方法對(duì)進(jìn)場(chǎng)航班的延誤情況進(jìn)行了研究。Bin等[5]通過(guò)深度學(xué)習(xí)有關(guān)方法對(duì)航班延誤產(chǎn)生原因進(jìn)行分析,并建立了延誤預(yù)測(cè)模型。Miticic 等[6]將混合密度網(wǎng)絡(luò)和隨機(jī)森林回歸2種概率預(yù)測(cè)算法應(yīng)用于歐洲機(jī)場(chǎng)的航班延誤預(yù)測(cè),較好地估計(jì)了到達(dá)和起飛航班延誤的等級(jí),平均絕對(duì)誤差小15 min。Shi 等[7]在提取飛行操作的關(guān)鍵因素后,采用機(jī)器學(xué)習(xí)的方法,提出了1種新的航班延誤預(yù)測(cè)模型。
國(guó)內(nèi)方面,曹悅琪等[8]考慮到航班數(shù)量的實(shí)時(shí)性,給出了基于Logistic模型的延誤航班數(shù)量與航班累計(jì)延誤時(shí)間的預(yù)測(cè)方法,對(duì)航班延誤的后續(xù)發(fā)展做出準(zhǔn)確的預(yù)測(cè),從而減少損失。黃俊生等[9]對(duì)航班延誤、飛機(jī)置換和航班取消3 種類型的航班延誤和恢復(fù)過(guò)程建模分析,得出乘客導(dǎo)向的航班延誤預(yù)測(cè)。王語(yǔ)桐等[10]提出1 種支持向量回歸和多元線性回歸相結(jié)合的方法建立組合預(yù)測(cè)模型。丁建立等[11]提出1種基于輕量級(jí)梯度效應(yīng)的多目標(biāo)航班延誤預(yù)測(cè)模型,該模型結(jié)合了航班信息和氣象信息,提高了對(duì)航班延誤的預(yù)測(cè)準(zhǔn)確度。姜雨等[12]提出通過(guò)時(shí)空?qǐng)D卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)離港航班延誤狀況的預(yù)測(cè)。劉繼新等[13]采用KNN 算法建模,在結(jié)合了以往航班運(yùn)行數(shù)據(jù)和氣象數(shù)據(jù),預(yù)測(cè)了機(jī)場(chǎng)內(nèi)短期航班延誤情況。朱代武等[14]采用深度置信網(wǎng)絡(luò)支持向量機(jī)回歸方法來(lái)挖掘航班延誤的內(nèi)在模式,使其能在預(yù)測(cè)延誤的同時(shí)進(jìn)行管理措施,從而減少整體延誤。
綜上所述,對(duì)于航班延誤問(wèn)題的研究存在以下不足:①將航班延誤視作相同樣本,并將樣本數(shù)據(jù)直接作為所構(gòu)建模型的輸入端,僅使用數(shù)值屬性指標(biāo)對(duì)所有航班延誤問(wèn)題作出評(píng)價(jià);②分析航班延誤只考慮數(shù)值屬性指標(biāo)去評(píng)估延誤等級(jí),尚未形成科學(xué)的延誤等級(jí)分類規(guī)則,無(wú)法直觀有效的判斷航班延誤程度。因此,在已有的研究基礎(chǔ)上,綜合考慮數(shù)值屬性及類屬性數(shù)據(jù)構(gòu)建延誤指標(biāo),提出1 種基于變分模態(tài)分解(variational mode decomposition,VMD)、馬氏深度(Mahalanobis depth,MD)函數(shù)和數(shù)據(jù)聚類(K-means clustering)的VMC-MD-clustering方法(以下簡(jiǎn)稱為V-M-C方法),研究大樣本下的機(jī)場(chǎng)終端區(qū)航班延誤情況,并以某大型樞紐機(jī)場(chǎng)的航班延誤數(shù)據(jù)進(jìn)行實(shí)例驗(yàn)證,本文所提方法有較好效果。
從時(shí)間、空間和效率3個(gè)維度,選擇航班延誤時(shí)間、航班飛行時(shí)間、延誤影響人數(shù)和航程4個(gè)數(shù)值屬性以及是否過(guò)站經(jīng)停、執(zhí)機(jī)機(jī)型2 個(gè)類屬性指標(biāo)對(duì)航班延誤等級(jí)進(jìn)行評(píng)價(jià)。共6個(gè)航班延誤評(píng)價(jià)指標(biāo)的具體說(shuō)明及其影響介紹,見(jiàn)表1。
本文選取包含類屬性及數(shù)值屬性在內(nèi)的6個(gè)指標(biāo)衡量航班延誤情況,但是因?yàn)楦鲊?guó)對(duì)于航班延誤的規(guī)定并不一致,航班延誤也是1 種發(fā)展變化的概念,所以航班延誤數(shù)據(jù)具有數(shù)據(jù)量巨大、特征復(fù)雜、具有高維特征等特點(diǎn)[15]。本文提出的V-M-C航班延誤等級(jí)分類方法的整體流程見(jiàn)圖1。
圖1中的具體步驟如下。
圖1 航班延誤等級(jí)分類流程圖Fig.1 Flow chart of flight delay classification
步驟1。收集數(shù)據(jù)并整理,對(duì)某大型機(jī)場(chǎng)樞紐的實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行分析,提取其中航班延誤數(shù)據(jù)。
步驟2。選擇延誤有關(guān)評(píng)估指標(biāo),本文綜合考慮機(jī)場(chǎng)、航空公司、管制等運(yùn)行需求提出6個(gè)航班延誤有關(guān)指標(biāo)見(jiàn)表1。
表1 航班延誤等級(jí)評(píng)價(jià)指標(biāo)Tab.1 Evaluation index of flight delay level
步驟3。選取延誤航班數(shù)據(jù)中的航班延誤時(shí)長(zhǎng),采用變分模態(tài)分解方法去除延誤時(shí)長(zhǎng)維度中的噪聲因子,減少由于過(guò)長(zhǎng)延誤時(shí)間對(duì)總體分布帶來(lái)的影響。
步驟4。對(duì)延誤數(shù)據(jù)進(jìn)行歸一化處理,通過(guò)深度函數(shù)計(jì)算樣本中每組延誤數(shù)據(jù)對(duì)于總體的離心程度,采用馬氏深度函數(shù)對(duì)樣本數(shù)據(jù)進(jìn)行計(jì)算得到數(shù)據(jù)深度值。
步驟5。對(duì)一維數(shù)據(jù)深度值進(jìn)行聚類處理,確定聚類系數(shù)K,判斷航班延誤等級(jí)。
步驟6。對(duì)得到的航班延誤等級(jí)分類結(jié)果進(jìn)行準(zhǔn)確度評(píng)估分析。
聚類分析是1種無(wú)監(jiān)督的學(xué)習(xí)[16],該方法在大規(guī)模的數(shù)據(jù)集分類時(shí),具有一定的優(yōu)勢(shì)。其中由于K-means 有著簡(jiǎn)單易用,對(duì)一維數(shù)據(jù)有較好的處理效果等特點(diǎn),因此本文將通過(guò)K-means 算法對(duì)航班延誤等級(jí)進(jìn)行聚類分類。但是該算法存在著如:K值不好選??;最終結(jié)果容易陷入局部最優(yōu);對(duì)方差不同的隱含類別聚類效果不佳;對(duì)非平穩(wěn)數(shù)據(jù)難收斂等缺點(diǎn)。故選擇在K-means算法之前先通過(guò)變分模態(tài)分解VMD和馬氏深度MD來(lái)對(duì)數(shù)據(jù)進(jìn)行處理,從而實(shí)現(xiàn)K-means算法更加快速準(zhǔn)確的進(jìn)行聚類。
VMD 是1 種自適應(yīng)的時(shí)頻信號(hào)分析方法[17],對(duì)非平穩(wěn)信號(hào)有著較好的處理效果。通過(guò)對(duì)數(shù)據(jù)使用VMD 方法進(jìn)行分解,獲得相對(duì)穩(wěn)定的數(shù)據(jù)集,便于后續(xù)使用K-means算法進(jìn)行聚類。
MD 是建立在馬氏距離基礎(chǔ)上的1 種數(shù)據(jù)深度函數(shù),其復(fù)雜度不隨數(shù)據(jù)維數(shù)的增大而增大[18]。故本文選取MD 來(lái)處理較為復(fù)雜的航班延誤數(shù)據(jù),在降低數(shù)據(jù)處理難度的同時(shí)進(jìn)一步提高了數(shù)據(jù)穩(wěn)定性,提高了K-means算法的運(yùn)行效率,有利于探索最優(yōu)解。
利用VMD分解信號(hào),計(jì)算分解后所有本征模態(tài)函數(shù)(intrinsic mode function,IMF)的總和,在IMF重構(gòu)信號(hào)總和等于給定輸入信號(hào)條件下,分解出m個(gè)IMF函數(shù)um(t),并使得到的IMF的估計(jì)帶寬之和最小。
對(duì)于每個(gè)um(t),對(duì)其進(jìn)行希爾伯特變換得到其單邊頻率譜,見(jiàn)式(1)。
由傅里葉變換性質(zhì),將式(1)得到的頻譜轉(zhuǎn)移至對(duì)應(yīng)基帶,見(jiàn)式(2)。
通過(guò)高斯平滑解調(diào)信號(hào)計(jì)算帶寬,求解式(2)的梯度平方范數(shù)[19],約束變分模型的表達(dá)式,見(jiàn)式(3)。
采用拉格朗日乘子法將式(3)中的約束問(wèn)題轉(zhuǎn)化為非約束的變分問(wèn)題,見(jiàn)式(4)。
式中:μS為航班延誤數(shù)據(jù)集的均值向量;σS為航班延誤數(shù)據(jù)集的協(xié)方差矩陣。
MD(S;q)值越趨近于1 時(shí),航班f距總體S越近;MD(S;q)越趨近于0,航班f距總體S中心越遠(yuǎn)。
2.3.1 聚類數(shù)K的確定
對(duì)聚類的有效性的評(píng)價(jià)標(biāo)準(zhǔn)分為外部和內(nèi)部2種。聚類數(shù)K就是內(nèi)部評(píng)價(jià)的重要指標(biāo),通常用來(lái)確定數(shù)據(jù)集的最佳聚類數(shù)。本文綜合1維數(shù)據(jù)深度序列的誤差平方和與輪廓系數(shù)值確定聚類數(shù)K值,來(lái)解決隨機(jī)性導(dǎo)致的K值選取穩(wěn)定性差的情況。
手肘法是1種基于誤差平方和簇內(nèi)誤方差(error sum of squares,SSE)的K值選擇算法,SSE會(huì)隨著K的增加,先大幅下降,后小幅下降,形成類似手肘的下降曲線而得名手肘法。SSE的計(jì)算見(jiàn)式(7)。
輪廓系數(shù)法的核心指標(biāo)是輪廓系數(shù),而輪廓系數(shù)是對(duì)聚類效果優(yōu)劣的1 個(gè)重要評(píng)判方式,平均輪廓系數(shù)越大,聚類效果越好。某個(gè)延誤航班fdi輪廓系數(shù)定義,見(jiàn)式(8)。
式中:a為fdi與同類中其他延誤航班的平均距離,km;b為fdi與最近類中所有延誤航班的平均距離,km。
最近簇的定義,見(jiàn)式(9)。
式中:fdk為某個(gè)類Ck中的1個(gè)延誤航班。
2.3.2 數(shù)據(jù)深度值聚類流程
數(shù)據(jù)深度值K-means聚類算法流程,見(jiàn)圖2。
圖2 K-means算法流程圖Fig.2 Flow chart of K-means algorithm
步驟1。確定最佳聚類數(shù)K,隨機(jī)初始化選取k個(gè)點(diǎn)作為聚類中心。
步驟2。將數(shù)據(jù)深度值序列分配到距離中心樣本最近的類,每次分配后更新類的中心樣本。
步驟3。把每個(gè)樣本分類為相應(yīng)的類之后,然后重新計(jì)算中心樣本和原始樣本間距。若1個(gè)樣本比原有的核心樣本更靠近新的核心樣本,則將其分配到包含新中心樣本的簇中。將每個(gè)中心樣本分類為自己的類后,計(jì)算樣本與新中心樣本的間距。如果1個(gè)樣本比原始中心樣本更接近新中心樣本,將被重新分配至新中心樣本簇。
步驟4。重復(fù)步驟3 的過(guò)程,直至算法收斂,聚類結(jié)束。
為確定分類結(jié)果的精確性,本文在航班延誤等級(jí)分類的基礎(chǔ)上進(jìn)行了延誤等級(jí)檢測(cè),采用帶懲罰權(quán)重的支持向量機(jī)(SVM)模型對(duì)基于V-M-C 方法的航班延誤等級(jí)分類情況進(jìn)行預(yù)測(cè)。
支持向量機(jī)是1種分類算法,它在處理小樣本、非線性和高維模式分類問(wèn)題中顯示了很多獨(dú)特的優(yōu)點(diǎn),本文選擇帶懲罰權(quán)重的支持向量機(jī)可以將問(wèn)題轉(zhuǎn)化為如下的二次規(guī)劃模型,見(jiàn)式(10)。
式中:P為懲罰參數(shù),P越大代表SVM對(duì)錯(cuò)誤分類的懲罰越大;ξi為松弛變量。
采用支持向量機(jī)對(duì)航班延誤等級(jí)的分類結(jié)果進(jìn)行分析,不僅可以確認(rèn)結(jié)果的精確性,也在一定程度上提高V-M-C模型的普適性。
選取某大型樞紐機(jī)場(chǎng)1個(gè)月共計(jì)4 557條航班延誤數(shù)據(jù)作為樣本,通過(guò)所提V-M-C方法對(duì)樣本中的航班延誤等級(jí)分類,并在此基礎(chǔ)上,采用帶懲罰權(quán)重的支持向量機(jī)模型對(duì)航班延誤等級(jí)結(jié)果分析,實(shí)驗(yàn)數(shù)據(jù),見(jiàn)表2,其中“是否經(jīng)?!表?xiàng),0為未經(jīng)停,1為經(jīng)停。
表2 航班延誤實(shí)驗(yàn)數(shù)據(jù)(局部)Tab.2 Flight delay experimental data(local)
由于不同部門(mén)對(duì)延誤時(shí)間的記錄存在一定差異且少部分長(zhǎng)時(shí)間延誤航班對(duì)總體延誤分布產(chǎn)生較大影響,因此導(dǎo)致延誤時(shí)間數(shù)據(jù)存在一定的噪聲,為了增加結(jié)果的準(zhǔn)確性,將延誤時(shí)間序列數(shù)據(jù)通過(guò)變分模態(tài)分解進(jìn)行降噪重構(gòu)。變分模態(tài)分解參數(shù)中對(duì)信號(hào)處理結(jié)果起到主要作用的參數(shù)分別是二次懲罰因子α及IMF 信號(hào)分量個(gè)數(shù)m。本文中,α取常用的默認(rèn)值α=2 000[20],m的選取兼顧信號(hào)分解的個(gè)數(shù)與重構(gòu)后信號(hào)的均方誤差,取m=10。延誤原始信號(hào)及重構(gòu)后信號(hào)見(jiàn)圖3。由圖3可見(jiàn):通過(guò)變分模態(tài)分解重構(gòu)延誤時(shí)間序列后,較好的維持了總體延誤時(shí)間分布,減少了長(zhǎng)時(shí)間延誤航班的延誤時(shí)長(zhǎng),使延誤時(shí)間數(shù)據(jù)更貼近實(shí)際研究需求。
圖3 延誤時(shí)間序列重構(gòu)對(duì)比圖Fig.3 Comparison chart of delay time series reconstruction
將重構(gòu)后的延誤時(shí)間序列及表1中的其他維度信息作為輸入,帶入式(6),得到航班延誤的數(shù)據(jù)深度值,航班延誤的數(shù)據(jù)深度分布見(jiàn)圖4。
圖4 延誤航班數(shù)據(jù)深度值Fig.4 Flight delay data depth value
對(duì)得到的數(shù)據(jù)深度值進(jìn)行聚類,劃分出延誤過(guò)程中的航班等級(jí)。最佳聚類數(shù)的決定方法是利用式(7)~(8)中給出的評(píng)估指標(biāo),從而對(duì)不同聚類數(shù)下樣本的聚類效果加以評(píng)價(jià)。K=2~8時(shí)的誤差平方和及輪廓系數(shù)變化見(jiàn)圖5。
圖5 聚類有關(guān)指標(biāo)折線圖Fig.5 Line chart of clustering related indicators
綜合誤差平方和與輪廓系數(shù)隨聚類數(shù)的變化趨勢(shì),取k=2時(shí)聚類效果最佳。因此對(duì)航班延誤的數(shù)據(jù)深度值進(jìn)行聚類,即可對(duì)航班延誤中的延誤等級(jí)分類。
為揭示航班延誤運(yùn)行模式及其產(chǎn)生的原因,對(duì)航班延誤等級(jí)的有關(guān)信息進(jìn)行聚類,仍以式(7)和式(8)作為聚類數(shù)據(jù)類間分類標(biāo)準(zhǔn),發(fā)現(xiàn)航班延誤等級(jí)數(shù)據(jù)在k=2時(shí)聚類效果最佳,即航班延誤等級(jí)可分為2個(gè)部分,記為延誤等級(jí)Ι 類與延誤等級(jí)Ⅱ類。
將Ι 類、Ⅱ類延誤等級(jí)及其他航班延誤等級(jí)信息進(jìn)行統(tǒng)計(jì)對(duì)比,根據(jù)不同維度繪制延誤雷達(dá)圖,見(jiàn)圖6。
圖6 延誤信息雷達(dá)圖Fig.6 Radar chart of Delay information
由圖6 可見(jiàn):延誤等級(jí)Ι 類航班主要為遠(yuǎn)程航班,該類航班多為大機(jī)型執(zhí)飛,影響顧客較多的國(guó)際航線??梢钥吹?,該類延誤航班延誤時(shí)長(zhǎng)略高于其他等級(jí)的延誤航班,在整體數(shù)據(jù)集中被分為Ι 類等級(jí)的主要原因是遠(yuǎn)距離航程及較高的飛行時(shí)長(zhǎng)降低了航班延誤時(shí)間維度的影響。因此在對(duì)延誤航班制定有關(guān)計(jì)劃時(shí),應(yīng)對(duì)遠(yuǎn)程航線進(jìn)行單獨(dú)考慮。
航班延誤等級(jí)Ⅱ類的航班主要為有過(guò)站經(jīng)停的航班,該類航班延誤平均時(shí)長(zhǎng)明顯高于延誤等級(jí)Ι類及其他延誤等級(jí)航班,而在其他延誤有關(guān)維度與其他延誤數(shù)據(jù)相差不大。造成延誤時(shí)長(zhǎng)較高的原因是由于在經(jīng)停過(guò)站的過(guò)程中造成由于后續(xù)航段流量控制或過(guò)站地服準(zhǔn)備措施不完備等造成的,因此對(duì)航班延誤等級(jí)Ⅱ類制定有關(guān)計(jì)劃時(shí),可適當(dāng)提高延誤時(shí)間容限,著重對(duì)過(guò)站保障過(guò)程進(jìn)行關(guān)注。
通過(guò)對(duì)航班延誤等級(jí)進(jìn)行分析,發(fā)現(xiàn)遠(yuǎn)程航線與經(jīng)停過(guò)站航班是產(chǎn)生航班延誤等級(jí)差異的原因,且平均延誤時(shí)長(zhǎng)較長(zhǎng)。對(duì)于被分為其他延誤等級(jí)類型的航班,平均延誤時(shí)間為31.55 min,平均航程為2 165.47 km,平均飛行時(shí)長(zhǎng)為216 min,主要由為中或大型機(jī)執(zhí)飛航班,平均延誤影響人數(shù)為213.5人。在對(duì)延誤航班進(jìn)行分析時(shí),可將其他延誤等級(jí)航班各維度指標(biāo)的平均值作為參考。
基于帶懲罰權(quán)重的支持向量機(jī)模型對(duì)航班延誤等級(jí)分類情況進(jìn)行精確性評(píng)估,本文采用準(zhǔn)確率Acc及召回率R來(lái)衡量該等級(jí)分類規(guī)則對(duì)預(yù)測(cè)精度進(jìn)行判定,見(jiàn)式(11)~(12)。
式中:L00為V-M-C 方法分類結(jié)果與預(yù)測(cè)結(jié)果均為其他延誤等級(jí)航班;L01為V-M-C 方法分類結(jié)果為其他延誤等級(jí)而SVM預(yù)測(cè)結(jié)果為Ι、Ⅱ類延誤等級(jí)航班;L11為通過(guò)V-M-C分類方法與svm預(yù)測(cè)結(jié)果均為Ι、Ⅱ類延誤等級(jí)航班;L10為分類成Ι、Ⅱ類延誤等級(jí)航班,但預(yù)測(cè)結(jié)果為其他延誤等級(jí)航班;Acc為從總體預(yù)測(cè)精度進(jìn)行評(píng)價(jià);R為對(duì)航班延誤等級(jí)預(yù)測(cè)精度進(jìn)行評(píng)價(jià)。
對(duì)數(shù)據(jù)集進(jìn)行隨機(jī)分類,選取其中的70%作為訓(xùn)練集,剩余的數(shù)據(jù)作為測(cè)試集,在rbf 核函數(shù)下,gamma=0.17,P=0.41 時(shí)模型有著較好的訓(xùn)練效果,此時(shí)Acc=99.56% ,R=95.41% 。由該結(jié)果可知,基于V-M-C 方法對(duì)于航班延誤的分類精準(zhǔn)度達(dá)到99.56%,對(duì)延誤等級(jí)的分類精度達(dá)到95.41%。
V-M-C方法是基于數(shù)據(jù)聚類K-means算法融合的,因此本文選擇加權(quán)K-means 算法作為對(duì)比算法。對(duì)相應(yīng)的評(píng)價(jià)指標(biāo)設(shè)置不同的權(quán)重。結(jié)合實(shí)際情況,不同指標(biāo)的權(quán)重值,見(jiàn)表3。
表3 評(píng)價(jià)指標(biāo)權(quán)重Tab.3 Evaluation index weight
同樣取聚類數(shù)K=2 時(shí),采用加權(quán)K-means算法得出結(jié)果,并采取等級(jí)判別率對(duì)航班延誤等級(jí)分類情況進(jìn)行精確性評(píng)估。精確性評(píng)估公式,見(jiàn)式(13)。
式中:N為總樣本航班量;GID為分類航班延誤等級(jí)與實(shí)際延誤等級(jí)有差異的航班數(shù)。
對(duì)分類結(jié)果進(jìn)行檢驗(yàn),加權(quán)K-means 的航班延誤等級(jí)分類精準(zhǔn)度只有81.9%
由以上對(duì)比實(shí)驗(yàn)可見(jiàn),V-M-C 方法對(duì)航班延誤等級(jí)分類精度比單一算法精度有較明顯提升,在rbf核函數(shù)的支持向量機(jī)模型下總體判別結(jié)果穩(wěn)定,能較為準(zhǔn)確的分類航班延誤等級(jí)情況。
針對(duì)航班延誤分類問(wèn)題,提出了6個(gè)指標(biāo),既包含了數(shù)值屬性,也囊括了類屬性。評(píng)估指標(biāo)的選取較為全面,能較好的刻畫(huà)出航班延誤等級(jí);同時(shí)提出基于多種方法的V-M-C 算法對(duì)航班延誤等級(jí)進(jìn)行分類,通過(guò)建立帶懲罰權(quán)重的支持向量機(jī)模型對(duì)分類結(jié)果進(jìn)行分析,實(shí)現(xiàn)了簡(jiǎn)單準(zhǔn)確的航班延誤等級(jí)判斷。
今后可以在以下方面進(jìn)行深入研究:①本文只研究單一機(jī)場(chǎng)的航班延誤分類,后續(xù)可研究適用全國(guó)機(jī)場(chǎng)的分類規(guī)則;②可以進(jìn)一步思考航路點(diǎn)、扇區(qū)的航班延誤,考慮流量等指標(biāo)的構(gòu)建。