葉雪飛,傅 強
(中國民用航空飛行學院飛行技術學院,廣漢 618307)
國際民用航空組織的事故統(tǒng)計數(shù)據(jù)表明,超過70%的不安全事件/事故與人為差錯直接或間接相關。文獻[1]著眼于飛行員的疲勞問題分析。文獻[2]提出了兩種度量方法來評估和比較飛行過程中的人類行為。文獻[3]從人機工效、人誤、組織這三方面對現(xiàn)有各類民航人因方法的特點進行了詳細的分析。文獻[4]針對典型的人為因素事故案例,采用基元事件分析法進行深度分析。文獻[5]基于信息加工過程設計管制人因差錯量化工具,將管制任務中的差錯界定為錯報、虛報、漏報三種差錯。文獻[6]提出適用于航空維修人誤概率計算的人因失誤率預測法和認知可靠性預測法綜合分析模型。文獻[7]提出一種飛機駕駛人因可靠性評估模型。文獻[8]根據(jù)對飛機控制系統(tǒng)開發(fā)原理的分析,提出將飛行員能力的定量標記整合到系統(tǒng)中。文獻[9]分析了由人為因素導致飛行事故的各種危險情況,提出了利用開發(fā)的模型預防此類事故的方法。
上述文獻對民航人因要素的識別判斷有很大的指導意義,但通過對以往文獻的回顧,尚未發(fā)現(xiàn)針對暴露安全問題的人因要素之間是否存在關聯(lián)關系而開展的研究。在民航運行各階段中存在著眾多人因要素,各人因要素綜合作用導致不安全事件的發(fā)生。因此本文提出如下假設:
假設同時暴露民航安全隱患的人因要素之間存在隱含關聯(lián)規(guī)則。
本文提出利用關聯(lián)分析的方法,探究民航不安全事件中人因要素間的關聯(lián),關聯(lián)規(guī)則[10]是數(shù)據(jù)挖掘領域的重要分支,近年來,關聯(lián)規(guī)則的應用涉及多個領域。文獻[11]提出一種基于改進Apriori 算法的肺癌風險評估因素分析的方法。文獻[12]提出了一種基于Apriori 關聯(lián)規(guī)則算法的功能區(qū)識別算法。文獻[13]使用Apriori 算法,深入探討數(shù)據(jù)挖掘技術的實現(xiàn)過程,明確課程間關聯(lián)關系的強弱。文獻[14]結合層次分析法(AHP)與灰色關聯(lián)分析法建立高速公路服務區(qū)運營風險評價指標體系。
基于上述研究,本文提出基于Apriori 關聯(lián)分析和灰色關聯(lián)分析的綜合分析方法,研究民航不安全事件中的人因要素,找到不安全事件中最關鍵的人因要素,進一步探究不安全事件內(nèi)部演化機理,促進民航安全運行。
關聯(lián)規(guī)則的Apriori 算法[15]是一種先驗概率算法,在分類上屬于單維、單層、布爾關聯(lián)規(guī)則。它利用頻繁項集特性的先驗知識,采取層次順序搜索的循環(huán)方法來完成頻繁項集的挖掘工作。
Apriori算法中定義如下。
定義1項與項集:數(shù)據(jù)庫中不可分割的最小單位信息稱為項;項的集合稱為項集。設I={i1,i2,…,in}表示數(shù)據(jù)集D全體項的集合,則I 中任意一個子集X為D的項集,若X有k個項,則稱X為k-項集。
定義2關聯(lián)規(guī)則:關聯(lián)規(guī)則是形如X→Y的表達式,其中X和Y為項集。
定義3支持度(Support):Support( )X是指X出現(xiàn)在數(shù)據(jù)集D中的比例,即描述關聯(lián)樣本中某個特征出現(xiàn)的概率。存在如下關系:
式中:σX和 ||D分別為數(shù)據(jù)集D中包含項集X的事務數(shù)目和數(shù)據(jù)集D的事務總數(shù)。
定義4置信度(Confidence):描述兩個特征之間相互關聯(lián)的強度,指在事物B中包含X、Y事物數(shù)的百分比,置信度則表示出現(xiàn)前項時,后項同時出現(xiàn)的概率。關系如下:
定義5強關聯(lián)規(guī)則:強關聯(lián)規(guī)則需同時滿足最小支持度閾值和最小置信度閾值,其中,最小支持度閾值和最小置信度閾值為設定值。
Apriori 關聯(lián)分析算法主要以搜索滿足最小支持度和最小置信度的強關聯(lián)規(guī)則為目標,Apriori算法的流程主要分為四個步驟:
一是設置閾值;二是通過連接步得到候選k-項集;三是通過剪枝步得到頻繁k-項集并判斷是否為最高階;四是判斷強關聯(lián)規(guī)則。
流程如圖1所示。
圖1 Apriori算法邏輯
灰色關聯(lián)分析[16]是根據(jù)因素之間發(fā)展趨勢的相似或相異程度,來分析和確定系統(tǒng)諸因素間的關聯(lián)程度或因素對系統(tǒng)主行為的貢獻程度的一種方法,其目的是尋求系統(tǒng)中各因素間的主要關系,找出影響目標值的重要因素,從而掌握系統(tǒng)的主要特征?;疑P聯(lián)算法中定義如下。
定義6母數(shù)列與子數(shù)列:母數(shù)列即為參考數(shù)列,記作A0=( )A0(1),A0(2),…,A0(n) ;子數(shù)列即為被比較數(shù)列,依次記作,A1,A2,…,Am。
定義7關聯(lián)系數(shù):關聯(lián)系數(shù)描述了系統(tǒng)發(fā)展過程中因素之間相對變化的情況,也就是關聯(lián)程度大小。其計算公式為
式中:ρ為分辨系數(shù),通常取ρ=0.5;Δ0i(k)為數(shù)據(jù)變換后數(shù)列的差值,而Δmin和Δmax分別為最小差值和最大差值。
定義8關聯(lián)度:關聯(lián)度為同一子數(shù)列中關聯(lián)系數(shù)的均值。其計算公式為
灰色關聯(lián)分析算法主要以計算關聯(lián)系數(shù)和關聯(lián)度為目標,需要確定分析序列并進行數(shù)據(jù)變換,灰色關聯(lián)分析算法的流程如圖2所示。
圖2 灰色關聯(lián)算法邏輯
(1)確定分析序列。不安全事件的產(chǎn)生可能是眾人因要素共同作用的結果,而不同人因要素出現(xiàn)的頻次隨著時間的變化而變化,對人因要素的灰色關聯(lián)分析本質(zhì)就是比較分析眾多人因要素在不安全事件中時間趨勢發(fā)展的變化。因此,使用分類匯總的辦法,以各人因要素在不同時間段的頻率為子序列(被比較數(shù)列),以不同時間段的頻率的總數(shù)為母數(shù)列(參考數(shù)列)。
(2)數(shù)據(jù)變換。由于要分析母數(shù)列與子數(shù)列的變化趨勢,而數(shù)據(jù)的量綱不一定相同,各數(shù)列差別較大,因此需要對原始數(shù)列進行處理,使之無量綱化和規(guī)一化。在灰色關聯(lián)分析中常用的數(shù)據(jù)變換方法有三種,分別是初值化處理、均值化處理和區(qū)間值化處理,本文采用均值化處理方法。
本文選取的數(shù)據(jù)來自美國航空安全自愿報告系統(tǒng)(aviation safety reporting system,ASRS)。研究數(shù)據(jù)時間跨度為2015 年1 月至2019 年12月。本文主要研究其中Human Factors,Local Time Of Day 這兩個字段的內(nèi)容,其中,Human Factors 主要記錄不安全事件中的人因要素。Local Time Of Daye 記錄不安全事件在當?shù)匕l(fā)生的時間,按6 個小時劃分為四個時間段。Human Factors 涉及12 類人因要素,每一個個案涉及到的人因要素并不固定,本文針對人因要素重新進行編碼,HF表示人因,見表1。
依據(jù)Human Factors 字段,對案例中的人因要素進行0-1編碼。1表示某一起不安全事件涉及該人因要素,0表示該起不安全事件與該人因要素無關。遍歷所有個案后,將數(shù)據(jù)集轉(zhuǎn)化為0-1矩陣。
基于對人因要素之間聯(lián)系的探究,針對0-1矩陣進行數(shù)據(jù)分析,繪制關聯(lián)網(wǎng)絡圖。人因要素網(wǎng)絡如圖3所示。
圖3 人因要素關聯(lián)性網(wǎng)絡
在圖3 中,設置顯示字段為12 類人因要素的真值(即只顯示=1 的值)。人因要素間連線的粗細代表人因要素同時出現(xiàn)的頻數(shù),同時出現(xiàn)的頻數(shù)越高,其連線越粗,反之則越細。圖中顯示的連線分為三個類別,頻次依次為1500 以上、1000到1500和1000以下。
通過人因要素網(wǎng)絡圖可以對人因要素兩兩之間的關聯(lián)關系進行初判。由圖3結合網(wǎng)絡輸出數(shù)據(jù),不難得出以下結論:①情景感知問題和溝通不當問題同時出現(xiàn)的頻次最高,達2178次;②情景感知問題和困惑問題同時出現(xiàn)的頻次較高,達1912 次;③情景感知問題與分心問題同時出現(xiàn)的頻次較高,達1672次。
SPSS Modeler軟件中設置最低條件支持度為6%,最小規(guī)則置信度為50%,最大前項數(shù)為5,找到如表2所示的7條關聯(lián)規(guī)則。
表2 人因要素關聯(lián)規(guī)則挖掘結果
結合各人因要素含義,對支持度和置信度的實際意義可以解釋為:當出現(xiàn)前項中的人因問題時,通常會存在后項中的人因問題,這7條規(guī)則的后項都是情景感知問題。支持度最高為18.46%,該規(guī)則表明同時出現(xiàn)困惑和情景感知問題的概率最大。置信度最高為67.01%,該規(guī)則表明同時出現(xiàn)困惑和分心問題時,出現(xiàn)情景感知問題的概率最大。
(1)關聯(lián)系數(shù)代表著該子序列(即該人因要素)與母序列時間維度上的關聯(lián)程度值。圖4 為各人因要素不同時間段的關聯(lián)系數(shù),其值越大,顏色越深,代表關聯(lián)性越強。其 中, Time1=0001-0600, Time2=0601-1200,Time3=1201-1800,Time4=1801-2400。圖中顏色最深的子序列為HF07,即情景感知問題,表明情景感知問題與不安全事件的關聯(lián)性最強,其次為HF01,即溝通不當問題。
圖4 人因要素關聯(lián)系數(shù)熱力
(2)由關聯(lián)系數(shù)的均值得到關聯(lián)度,關聯(lián)度值介于0~1 之間,關聯(lián)度越高,意味著子序列與“參考序列”(母序列)之間關系越緊密,因而該人因要素評價越高。針對所有子序列進行排序,得到各人因要素排名。表3 為12 類人因要素關聯(lián)度及其排名。
從表3 可以看出:針對12 類人因要素,情景感知問題評價最高(關聯(lián)度為0.949),其次是溝通不當問題(關聯(lián)度為0.877)和分心問題(關聯(lián)度為0.840)。
強關聯(lián)規(guī)則中后項均為情景感知問題,支持度最高為18.46%,該規(guī)則表明同時出現(xiàn)困惑和情景感知問題的概率最大;置信度最高為67.01%,該規(guī)則表明同時出現(xiàn)困惑和分心問題時,出現(xiàn)情景感知問題的概率最大。
對12 類人因要素進行關聯(lián)度計算,分析得出情景感知問題、溝通不當、分心、時間壓力、困惑、故障排除能力不足、工作負擔、其他生理問題、疲勞、人機交互問題、培訓或資格認證缺失和其他/未知導致不安全事件的關聯(lián)度依次為0.949、0.877、0.84、0.797、0.766、0.705、0.675、0.617、0.604、0.57、0.562、0.432,從而確定情景感知問題為關鍵因素。
利用Apriori 和灰色關聯(lián)分析綜合分析模型對民航不安全事件中的人因要素進行關聯(lián)規(guī)則的挖掘,為未來民用航空安全管理和控制提供了輔助手段,為今后制定短期的安全目標提供了理論參考。
建議完善安全管理體系,明確管理人員職能,完善監(jiān)督檢查機制,增強應急突發(fā)事件處置的培訓和訓練,強化情景意識和決斷意識。