單晶晶,吳建軍,張晨,趙芳霞
(1.北京交通大學(xué)交通運輸學(xué)院,北京 100044;2.中國民航科學(xué)技術(shù)研究院,北京 100028)
經(jīng)濟全球化推動著我國民航運輸業(yè)的不斷發(fā)展,同時,飛行安全問題也日益引起人們的關(guān)注。最近發(fā)生的MH370事件,在全球引起了對飛行事故的恐慌。目前我國在航空安全管理上與國際先進水平還有相當(dāng)?shù)牟罹?,如何提高航空公司的安全服?wù)水平,最大程度地降低事故率,是國內(nèi)外人士都非常關(guān)心的問題[1]。民航事故的類型是錯綜復(fù)雜的,導(dǎo)致民航事故發(fā)生的因素也具有多樣性,但這并不表示導(dǎo)致空難事故發(fā)生的原因無跡可尋。對產(chǎn)生風(fēng)險事故的風(fēng)險因素做好科學(xué)的分析和預(yù)測,是保障人民生命財產(chǎn)安全以及推動航空業(yè)可持續(xù)發(fā)展的關(guān)鍵問題。
針對民航風(fēng)險事故,國內(nèi)外學(xué)者已經(jīng)做了許多研究工作。2000年,Milan提出了風(fēng)險、安全及其評價的基本概念和定義,依據(jù)總體行業(yè)指標(biāo)和事故死亡率描述了造成飛機事故的主要原因是由于飛行器的過度使用及老化,并提出了一種量化風(fēng)險和事故的方法[2]。Zhou等[3]構(gòu)建了一個灰色關(guān)聯(lián)模型來分析民航不安全事件的各種誘發(fā)因素。Knecht[4]通過分析飛行員總的飛行小時數(shù)之間的關(guān)系,采用連續(xù)非線性模型預(yù)測了飛行事故發(fā)生率。Wong等[5]在分析了能見度、溫度和推動力等因素比例的基礎(chǔ)上進行了差異檢驗,并對事故的不同級別進行了風(fēng)險量化。Gong等[6]提出了一種名為事故數(shù)的集成分析方法來識別重要的人為因素。國內(nèi)學(xué)者王衍洋等[7]參考美國聯(lián)邦航空局的單一安全指數(shù)的計算方法,通過計算行業(yè)運行事故、事故征候、不安全事件的發(fā)生頻率及后果嚴(yán)重程度(死亡人數(shù)和受傷人數(shù)、直接經(jīng)濟損失等),建立了一個新的安全指數(shù)評估模型。姚前、成媛等[8-10]綜合考慮了機場安全的影響因素,從行為人、機務(wù)、環(huán)境及組織管理4個影響機場安全的角度入手,構(gòu)建了機場安全預(yù)警評價指標(biāo)體系,并應(yīng)用層次分析和模糊綜合評價方法進行分析,建立了民航企業(yè)不安全事件風(fēng)險評估方法。金迪[11]運用灰色預(yù)測模型對不安全事件發(fā)生的可能性進行了預(yù)測,建立了安全風(fēng)險的分析和評價模型,運用SHEL模型找出安全風(fēng)險中所存在的危險源,通過運用計數(shù)抽檢程序、風(fēng)險矩陣評價法和風(fēng)險值評價法為風(fēng)險控制措施的制定提供了依據(jù)。
對于民航業(yè)出現(xiàn)的各種風(fēng)險因素,國內(nèi)外學(xué)者從不同的角度進行了研究,并建立了相應(yīng)的風(fēng)險事故評價與預(yù)測模型。但以往的計算研究方法數(shù)據(jù)調(diào)查復(fù)雜性高、時效性低、可信度較低、模型計算復(fù)雜且精確度較低,已經(jīng)不能滿足現(xiàn)實的要求。目前亟需一種分析簡單、數(shù)據(jù)獲取較為容易且實用性強的分析預(yù)測方法,為民航安全管理和決策提供參考依據(jù)。支持向量機(support vector machine,SVM)和徑向基(radical basis function,RBF)神經(jīng)網(wǎng)絡(luò)模型的預(yù)測功能已經(jīng)成功地應(yīng)用在房地產(chǎn)價格、股票以及水華問題預(yù)測等許多方面,但在民航事故的預(yù)測方面尚未得到應(yīng)用。本文在綜合參考現(xiàn)存各類研究成果的基礎(chǔ)上,采用了同比和環(huán)比加權(quán)組合的預(yù)測方法,此方法在預(yù)測中國消費價格指數(shù)[12](CPI)方面已被證明有較好的預(yù)測效果。在保證預(yù)測結(jié)果可行性與有效性的基礎(chǔ)上,本文建立了基于同比和環(huán)比的SVM和RBF神經(jīng)網(wǎng)絡(luò)加權(quán)組合預(yù)測模型。
數(shù)據(jù)挖掘最重要的是數(shù)據(jù)源的科學(xué)性與合理性,本文所使用的數(shù)據(jù)均來自于北京市民航不安全事件研究所對全國民航歷年發(fā)生的不安全事件的統(tǒng)計。由于設(shè)備、技術(shù)等原因,早期記錄的數(shù)據(jù)出現(xiàn)部分的遺漏或者缺失,在可信度方面稍差。為了研究分析的準(zhǔn)確性,我們選取分析的數(shù)據(jù)為2002年2月至2014年2月間的不安全事件,并對2014年2月和4月引起不安全事件的原因和飛行階段進行了短期預(yù)測。引起不安全事件原因和飛行階段所包含的因素可參見表1~2。
為提高預(yù)測準(zhǔn)確率,本文將收集到的數(shù)據(jù)分為兩部分,并建立SVM和RBF神經(jīng)網(wǎng)絡(luò)模型分別進行預(yù)測。
數(shù)據(jù)1:2002年2月至2012年2月間每年2月的數(shù)據(jù)作為同比基數(shù),建立SVM預(yù)測模型,對2014年2月的事故進行同比預(yù)測;2013年1月至2014年1月這段時間中每月發(fā)生的事故數(shù)量作為環(huán)比基數(shù),建立RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型,對2014年2月事故進行環(huán)比預(yù)測。
數(shù)據(jù)2:2002年4月至2012年4月間每年4月的數(shù)據(jù)和2013年1月至2014年2月的數(shù)據(jù)對2014年4月發(fā)生的不安全事件進行預(yù)測。
鑒于單一預(yù)測模型在預(yù)測問題上存在的可靠性問題,本文應(yīng)用一種組合預(yù)測模型——SVM和RBF神經(jīng)網(wǎng)絡(luò)混合預(yù)測模型[13]。該模型能夠組合各單一模型的優(yōu)點,進一步提高預(yù)測精度,為民航不安全事件的預(yù)測提供依據(jù)。
對數(shù)據(jù)1中的兩部分?jǐn)?shù)據(jù)分別建立SVM和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型,將其預(yù)測結(jié)果分別加權(quán)求和作為最后的預(yù)測結(jié)果,即Yf=αY0+(1-α)Yp。其中Y0表示同比的預(yù)測結(jié)果,Yp表示環(huán)比的預(yù)測結(jié)果,Yf表示最后的預(yù)測結(jié)果,α表示權(quán)重,預(yù)測過程見圖1。
圖1 模型預(yù)測過程Fig.1 Prediction process of a model
SVM是Cortes等于1995年首先提出的,在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,在函數(shù)擬合等其他機器學(xué)習(xí)問題中得到廣泛應(yīng)用。SVM方法建立在結(jié)構(gòu)風(fēng)險最小化原理的基礎(chǔ)上,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以期獲得最好的推廣能力[14]。根據(jù)SVM的以上特點,在前人研究的基礎(chǔ)上,本文采用了一種基于SVM的同比預(yù)測模型。
對不安全事故發(fā)生頻數(shù)的時間序列{X1,X2,X3,…,Xn}建模,其中前m個數(shù)據(jù)作為訓(xùn)練樣本及進行參數(shù)估計,其余的數(shù)據(jù)用來驗證模型的有效性。輸入變量即為原因變量和飛行階段變量,輸出變量為不同事件類型對應(yīng)的事故數(shù)量。在預(yù)測過程中,核函數(shù)選用高斯函數(shù),參數(shù)設(shè)定分別為c=100(拉格朗日乘子上界)和ε=0.01(不敏感損失函數(shù)的參數(shù)),將訓(xùn)練好的模型對未來民航不安全事件進行預(yù)測。
RBF神經(jīng)網(wǎng)絡(luò)是一種性能良好的前饋型人工神經(jīng)網(wǎng)絡(luò),能夠逼近任意的非線性函數(shù),具有良好的泛化能力,結(jié)構(gòu)簡單,并有很快的學(xué)習(xí)收斂速度,已成功應(yīng)用于非線性函數(shù)逼近、時間序列分析和系統(tǒng)建模等方面。網(wǎng)絡(luò)由輸入層、隱含層和輸出層組成,隱含層采用徑向基函數(shù)作為激勵函數(shù)[15]。網(wǎng)絡(luò)的輸入為(X1,X2,…,Xn),X1,X2,…,Xn代表不同類型的事故數(shù)量,是單變量時間序列輸入,中間層取20個神經(jīng)元,輸出為(Y1,Y2…,Yn),即預(yù)測的對應(yīng)類型的事故數(shù)量。對應(yīng)輸入 Xi的實際輸出為:Y(Xi)= Σ wijφ(Xi,ti),其中φ(Xi,ti)為第i個隱單元的輸出ti為基函數(shù)的中心,徑向基函數(shù)wij為第j個隱含層到輸出層之間的權(quán)重。網(wǎng)絡(luò)的單層拓撲結(jié)構(gòu)見圖2。
重復(fù)訓(xùn)練網(wǎng)絡(luò)直到滿足誤差要求,將訓(xùn)練好的網(wǎng)絡(luò)用于環(huán)比預(yù)測,能夠有效提高預(yù)測的精度。
(1)將2014年2月份的真實數(shù)據(jù)與模型預(yù)測值進行比較,考察模型的預(yù)測準(zhǔn)確性。
(2)為了評價模型的預(yù)測性能,采用均方根誤差(root mean square error,RMSE)對預(yù)測效果進行評估,考察模型的逼近能力。其中xj表示預(yù)測值,n表示樣本的數(shù)量。
文中通過采用SVM、RBF神經(jīng)網(wǎng)絡(luò)預(yù)測以及二者的組合預(yù)測結(jié)果的RMSE作對比,來考察組合模型的預(yù)測能力。
本文采用SVM和RBF神經(jīng)網(wǎng)絡(luò)算法分別預(yù)測了2014年2月由不同事件原因及飛行階段引起的不安全事件的數(shù)量。考慮到實際情況中環(huán)比時間同預(yù)測時間非常接近,必然對預(yù)測的最后結(jié)果影響較大,因此設(shè)定環(huán)比預(yù)測的權(quán)重α=0.6,同比預(yù)測權(quán)重為1-α=0.4,預(yù)測結(jié)果如表1~2所示。
表1 2014年2月事件原因事故數(shù)量的預(yù)測結(jié)果Table 1 The Prediction result of accident causes in Feb.2014
表2 2014年2月飛行階段事故數(shù)量的預(yù)測結(jié)果Table 2 The prediction result of flight stages in Feb.2014
從表1~2中可以看出,模型預(yù)測結(jié)果與真實結(jié)果很接近,雖然有些局部的同比和環(huán)比預(yù)測數(shù)據(jù)同真實值也較近似,但從整體的預(yù)測趨勢來看,組合預(yù)測模型存在較大的優(yōu)勢,說明在允許的誤差范圍內(nèi),這種預(yù)測方法是行之有效的。
圖3給出了由SVM、RBF神經(jīng)網(wǎng)絡(luò)模型及組合模型預(yù)測結(jié)果的RMSE。
圖3 3種預(yù)測方法誤差對比圖Fig.3 Error comparison chart of three prediction methods
由圖3可見,組合模型都較單項預(yù)測模型進一步縮小了誤差,說明該組合預(yù)測方法明顯優(yōu)于任一單項預(yù)測方法,對預(yù)測不安全事件的數(shù)量是行之有效的。
通過訓(xùn)練好的模型2002至2012年間每年4月份的數(shù)據(jù)和2013年1月至2014年2月這段時間中每月發(fā)生的事故數(shù)量對2014年4月份進行了預(yù)測。事件原因及飛行階段系數(shù)數(shù)量預(yù)測結(jié)果見表3~4。
表3 2014年4月事件原因事故數(shù)量的預(yù)測結(jié)果Table 3 The prediction result of accident causes in Apr.2014
表4 2014年4月飛行階段事故數(shù)量的預(yù)測結(jié)果Table 4 The prediction result of flight stages in Apr.2014
對民航系統(tǒng)進行安全管理的核心之一就是對系統(tǒng)中存在的風(fēng)險進行預(yù)測,以便找出對系統(tǒng)安全有影響的頻發(fā)事件,分析其可能導(dǎo)致的后果,制定出消除和控制危險的措施,防止或減輕災(zāi)害對人與財產(chǎn)造成的損失。本文采用SVM和RBF神經(jīng)網(wǎng)絡(luò)組合預(yù)測模型對民航不安全事件進行了預(yù)測,并將預(yù)測結(jié)果同真實值進行了比較,表明在允許的誤差范圍內(nèi),預(yù)測結(jié)果是較為精確的。此外還將3種預(yù)測方法的均方根誤差進行了對比,證明了有效性,同時提高預(yù)測的精度。使用訓(xùn)練好的模型對2014年4月份的不安全事件進行預(yù)測,結(jié)果表明該研究對民航的風(fēng)險管理具有很好的推廣性,為以后民航不安全事件的分析與預(yù)防奠定了理論基礎(chǔ)。但是組合模型的預(yù)測對小樣本數(shù)據(jù)是否同樣具有精確性,還需要做進一步的研究。
[1]劉剛.機場安全風(fēng)險識別和評價預(yù)警問題研究[D].江蘇:南京航空航天大學(xué),2008.
[2]NETJASOV F,JANIC M.A review of research on risk and safety modelling in civil aviation[J].Journal of Air Transport Management,2008,14(4):213 -220.
[3]ZHOU C C,HU D D.Research on inducement to accident/incident of civil aviation in southwest of China based on grey incidence analysis[J].Procedia Engineering,2012,45:942 -949.
[4]KNECHT W R.The“killing zone”revisited:Serial nonlinearities predict general aviation accident rates from pilot total flight hours[J].Accident Analysis& Prevention,2013,60:50-56.
[5]WONG D K Y,PITFIELD D E,CAVES R E,et al.Quantifying and characterising aviation accident risk factors[J].Journal of Air Transport Management,2006,12(6):352 -357.
[6]GONG L,ZHANG S,TANG P,et al.An integrated graphic-taxonomic-associative approach to analyze human factors in aviation accidents[J].Chinese Journal of Aeronautics,2014,27(2):226 -240.
[7]王衍洋,李敬,曹義華.中國民航安全評價方法研究[J].中國安全生產(chǎn)科學(xué)技術(shù),2008,4(5):111-113.
[8]姚前.民航機場安全預(yù)警評價體系研究[J].交通標(biāo)準(zhǔn)化,2009(15):198-201.
[9]成媛.民用機場安全風(fēng)險評估模式研究[D].天津:中國民航大學(xué),2006.
[10]曾亮.多層次模糊評估法在民航不安全事件風(fēng)險評估中的應(yīng)用[J].中國安全科學(xué)學(xué)報,2008,18(1):131-138.
[11]金迪.航空公司運行不安全事件安全風(fēng)險管理方法研究[D].上海:上海交通大學(xué),2013.
[12]張健.SARIMA模型在預(yù)測中國 CPI中的應(yīng)用[J].統(tǒng)計與決策,2011(5):28-30.
[13]徐富強,謝如龍,郝江鋒.基于神經(jīng)網(wǎng)絡(luò)與SVM的組合預(yù)測模型——以房地產(chǎn)價格預(yù)測為例[J].巢湖學(xué)院學(xué)報,2012,14(6):1-7.
[14]李元誠,方廷健,于爾鏗.短期負荷預(yù)測的SVM方法研究[J].中國電機工程學(xué)報,2003,23(6):55-59.
[15]李曦,王青,萬云輝,等.基于 RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型及其應(yīng)用研究[J].泰山學(xué)院學(xué)報,2008(3):118-120.