胡甚平,謝瑩,張欣欣,江帥,席永濤
(上海海事大學(xué)商船學(xué)院,上海 201306)
在“一帶一路”大背景下,經(jīng)濟高速發(fā)展,水上交通越來越繁忙。隨著水上運輸需求的顯著增加,航運業(yè)在過去三十年中取得了迅速發(fā)展。然而,水上運輸需求的顯著增加導(dǎo)致船舶交通事故發(fā)生概率增加。韓國“歲月”號傾覆事故、“桑吉”號與“長峰水晶”號碰撞事故的發(fā)生,引起國際社會廣泛關(guān)注。決策者有責(zé)任實施有效的通航策略,以減少嚴(yán)重船舶交通事故發(fā)生的概率。因為事故及災(zāi)害的發(fā)生是由物的隱患狀態(tài)與人的不安全行為在環(huán)境條件、管理缺陷等共同作用下持續(xù)演化的結(jié)果,所以在采取有效措施前,確定特征與促成因素之間的關(guān)聯(lián)關(guān)系是非常重要的。
當(dāng)前國內(nèi)外學(xué)者一致認(rèn)為,人的不安全行為既是事故的最后表現(xiàn),也是事故的形成原因。CHOI等提出一種程序驅(qū)動操作過程中船員交互作用下的不安全行為分類方法。YILDIRIM等利用人為因素分析與分類系統(tǒng)(human factors analysis and classification system, HFACS)對碰撞和擱淺事故進(jìn)行評估,提出了不安全行為的表現(xiàn)和前提條件。HOOPER等進(jìn)一步指出采用HFACS框架下的認(rèn)知錯誤分類法能加強對不安全行為的分析。CHOUDHRY則提出基于行為的安全管理方法改善現(xiàn)場環(huán)境安全。隨后,研究者從系統(tǒng)的視角確定人的安全行為體系中的關(guān)鍵因素,并對人的安全行為風(fēng)險因素的層次性及各層次因素間的結(jié)構(gòu)關(guān)聯(lián)性進(jìn)行探究。HUANG等提出Apriori算法分析事故影響因素之間的關(guān)系。ZHANG等采用系統(tǒng)動力學(xué)方法分析HFACS框架下事故影響因素間的耦合關(guān)系,提出事故影響因素在組織管理、安全監(jiān)督、前提條件等方面的關(guān)聯(lián)問題。HU等采用結(jié)構(gòu)方程模型進(jìn)一步論證關(guān)聯(lián)假設(shè)的合理性,提出事故形成因素層次結(jié)構(gòu)的路徑依賴性問題。船員的不安全行為(事故直接影響因素)及其關(guān)聯(lián)因素比較多,因素之間的關(guān)聯(lián)結(jié)構(gòu)關(guān)系也存在著許多不確定性,因而可引入高效率機器學(xué)習(xí)算法研究船員不安全行為及其關(guān)聯(lián)因素間的不確定結(jié)構(gòu)關(guān)聯(lián)特性。
鑒于此,筆者在辨識船員不安全行為及其關(guān)聯(lián)因素的基礎(chǔ)上,結(jié)合船舶交通事故場景數(shù)據(jù),采用優(yōu)化后的頻繁模式增長(frequent pattern growth, FP-growth)算法對這些因素進(jìn)行支持度和關(guān)聯(lián)度分析,找出不確定結(jié)構(gòu)下船員不安全行為發(fā)展路徑。
早在20世紀(jì)70年代,學(xué)界就已經(jīng)開始對人的不安全行為進(jìn)行研究。目前有關(guān)不安全行為的研究多集中于公路交通、礦業(yè)工程、建筑工程等安全事故頻發(fā)的領(lǐng)域,涉及海事領(lǐng)域的研究較少。
多數(shù)研究都將不安全行為界定為結(jié)果偏離既定的目標(biāo),導(dǎo)致系統(tǒng)失效或事故發(fā)生等不良后果的行為,并且大多從決策判斷錯誤(未及時決策或決策錯誤)和操作不當(dāng)(違規(guī)和冒險行為)這兩個方面進(jìn)行表征。在案例信息中,船員在確定場景下,借助自己意識的支配,出現(xiàn)與法律法規(guī)、安全操作規(guī)程或規(guī)章制度博弈的狀態(tài),使船舶陷入險情或者發(fā)生事故的行為,被視為船員的不安全行為。船員的不安全行為是導(dǎo)致船舶交通事故發(fā)生的最直接的因素。
船員不安全行為指船舶在拋起錨、航行、靠離碼頭過程中由于船員的疏忽、知識匱乏、技能不精、規(guī)則意識不強導(dǎo)致的錯誤行為。船舶在港口水域航行,引航員加入駕駛臺團(tuán)隊工作,此時局面最為復(fù)雜,不安全行為表現(xiàn)更為突出,故本文以引航場景為例,研究船員的不安全行為。根據(jù)船舶航行實際情況,共辨識出35種船員不安全行為,主要表現(xiàn)在信息交互(F)、情境感知(I)、行為決策(J)、處理輸出(K)和違章(L)等5個方面,具體見表1。
表1 船員不安全行為的基本組成
通常情況下,外界環(huán)境會對人產(chǎn)生影響,人經(jīng)過感知、思維分析和判斷,作出決策,進(jìn)而產(chǎn)生行為,因此人的不安全行為的產(chǎn)生是由外界環(huán)境與人的內(nèi)在思維共同作用的結(jié)果,船舶交通事故中船員不安全行為的產(chǎn)生也是如此。船員不安全行為的關(guān)聯(lián)因素是導(dǎo)致船員做出不安全行為的原因或前提條件,如環(huán)境、設(shè)備和管理因素等。結(jié)合船舶交通事故案例,這里提出22個船員不安全行為的關(guān)聯(lián)因素,主要表現(xiàn)在環(huán)境(E)、設(shè)備(H)和管理(G)等3個方面,具體見表2。
表2 船員不安全行為的關(guān)聯(lián)因素
船員不安全行為的關(guān)聯(lián)因素之間存在著不確定性,由此形成以不確定為主要特征的關(guān)聯(lián)規(guī)則問題。例如:通航密度會對船員不安全行為中的情境感知產(chǎn)生影響,船舶設(shè)備的有效性決定船員行為輸出處理的效果,操作管理和程序會影響船員的安全行為決策,這些因素均可能導(dǎo)致船員的不安全行為。因此,要在對船員不安全行為的研究中,發(fā)現(xiàn)事故因素間的不確定關(guān)聯(lián)特征。
樣本數(shù)據(jù)涵蓋了1995—2016年22年間港口水域(含航道、錨地、泊位等限制性通航水域)890起船舶交通事故,主要涉及碰撞、觸損、浪損、擱淺、失控等事故類型,包括不同后果等級事故,其中產(chǎn)生嚴(yán)重后果的占2.4%,產(chǎn)生較大后果的占8.9%,產(chǎn)生一般后果的占18.8%,產(chǎn)生較小后果的占63.3%,產(chǎn)生輕微后果的占6.6%。
事故數(shù)據(jù)的描述包括事故的物理特征描述和邏輯特征描述。物理特征主要包括時間、地點、事故種類和級別、涉事船舶、人員和環(huán)境等;邏輯特征主要表現(xiàn)在事故原因分析上。
一般地,事故原因涉及管理缺陷、環(huán)境的不安全條件、船舶的不安全狀態(tài)和船員的不安全行為等多個維度,要全面確定這些因素在事故演化中的影響。船員不安全行為不僅與船員不安全行為基本組成相關(guān),也涉及航行會遇船舶、拖船、他船等各相關(guān)方人員,還涉及與不安全行為相關(guān)聯(lián)的環(huán)境、設(shè)備和管理因素,數(shù)據(jù)結(jié)構(gòu)見圖1。這個數(shù)據(jù)庫中的案例細(xì)節(jié)信息對分析船員的行為表現(xiàn)是非常必要的。在事故反演過程中需要對不安全行為的基本組成和關(guān)聯(lián)因素等信息有詳細(xì)的描述。
圖1 事故數(shù)據(jù)庫的構(gòu)成要素
關(guān)聯(lián)規(guī)則常應(yīng)用于數(shù)據(jù)庫挖掘,核心是通過挖掘從龐大的數(shù)據(jù)中找到相關(guān)的因素,形成→的蘊涵式描述。支持度、置信度和提升度是關(guān)聯(lián)規(guī)則的3個重要參數(shù)。支持度是數(shù)據(jù)庫中同時出現(xiàn)項集和的次數(shù)與總項集數(shù)之比,確定其在總項集中出現(xiàn)的概率。置信度是表示項集同時出現(xiàn)的概率占某一項集出現(xiàn)概率的比值。頻繁項集是在數(shù)據(jù)集中經(jīng)常一起出現(xiàn)的變量,可以為可能的決策提供支持。提升度表示包含項集的事務(wù)中同時包含項集的比例與包含項集的事務(wù)的比例的比值。
在數(shù)據(jù)挖掘中,可借助頻繁項集的計算,獲得關(guān)聯(lián)規(guī)則的支持度、置信度和提升度等定量結(jié)果,從而進(jìn)行關(guān)聯(lián)規(guī)則的識別。關(guān)聯(lián)分析算法很多,其中Apriori算法得到了普遍應(yīng)用。2000年由韓家煒等提出的FP-growth算法是最近在機器學(xué)習(xí)領(lǐng)域被廣泛接受的數(shù)據(jù)挖掘算法。該關(guān)聯(lián)分析算法將頻繁項的數(shù)據(jù)整理成頻繁樹(frequent pattern tree, FP-tree)模式,充分利用Apriori算法的優(yōu)點,保留數(shù)據(jù)相關(guān)項集的關(guān)聯(lián)信息,進(jìn)一步對數(shù)據(jù)頻繁項集進(jìn)行挖掘分析。在這一過程中,數(shù)據(jù)庫需要被掃描兩次,降低了運算效率;在挖掘FP-tree時,也需要反復(fù)遍歷FP-tree。為提升計算效率,本文引入哈希表記錄項頭表信息,根據(jù)項名進(jìn)行數(shù)據(jù)學(xué)習(xí),得到支持度計數(shù)等信息。通過構(gòu)造FP-growth算法,將數(shù)據(jù)存儲于FP-tree中,后續(xù)數(shù)據(jù)分析在FP-tree中進(jìn)行,不再訪問數(shù)據(jù)庫,實現(xiàn)高效的頻繁項集挖掘。改進(jìn)的FP-growth算法流程見圖2,主要分為4個步驟:
圖2 改進(jìn)的FP-growth 算法流程
(1)設(shè)定約束條件。通過對數(shù)據(jù)庫中元素的頻數(shù)進(jìn)行統(tǒng)計,設(shè)置最小支持度,刪除不滿足最小支持度的元素,用篩選出的數(shù)據(jù)構(gòu)建項目結(jié)點鏈表。
(2)構(gòu)建多維表(NFP_tab)。掃描數(shù)據(jù)庫,得到所有的頻繁項(單項集)的集合和支持度計數(shù),按照每個數(shù)據(jù)庫中項的出現(xiàn)順序建立哈希表(HasList),獲取相互兩項的支持度計數(shù)的二維表后建立NFP_tab(保存相互多項的支持度計數(shù));對建立的HasList按照支持度計數(shù)遞減的方法重新排序生成新的項頭表(HeadList);根據(jù)HeadList構(gòu)建NFP_tab,通過HeadList和HasList更新NFP_tab。
(3)構(gòu)建FP-tree。生成的NFP_tab結(jié)合HeadList,生成相應(yīng)的頻繁項集和條件FP-tree。
(4)挖掘頻繁項集。掃描NFP_tab,將滿足最小支持度的頻繁項根據(jù)出現(xiàn)的次數(shù),按照順序更新FP-tree,在完成FP-tree的基礎(chǔ)上挖掘頻繁項集并輸出。
通過對事故報告的分析,梳理船員不安全行為的基本組成和關(guān)聯(lián)因素,并進(jìn)行賦值。本文邀請來自引航機構(gòu)、航運企業(yè)和航海院校等從事安全管理的8名專家針對890起案例進(jìn)行討論和專業(yè)判斷。通過案例反演分析,確定事故情況,分析不安全行為及其關(guān)聯(lián)因素表現(xiàn)。若某事故發(fā)生與該因素有關(guān),則將其賦值為1,否則將其賦值為0,最終得到事故案例數(shù)據(jù)庫。
結(jié)合船員不安全行為基本組成和關(guān)聯(lián)因素劃分模式,對人行為層面的界面因素進(jìn)一步拓展,獲取不同因素的結(jié)果表現(xiàn),具體見圖3。
a)信息交互
人的不安全行為是導(dǎo)致事故發(fā)生的最直接的因素,各因素影響都很大。根據(jù)計算所得的各個因素的支持度,選取不同的支持度進(jìn)行試錯,最終設(shè)置最小支持度為15%,輸出結(jié)果如圖4所示:在人的不安全行為中,識別到15個因素的支持度較高,這15個因素也是核心影響因素。
圖4 船員不安全行為及其關(guān)聯(lián)因素的支持度
由圖4可知:(1)船員在情境感知方面的不安全行為對船舶安全的影響顯著,其中I(瞭望疏忽)是對船舶安全影響較大的因素,需要重點關(guān)注。(2)船員在處理輸出方面的不安全行為K(應(yīng)急處理不當(dāng))和K(應(yīng)急處理不力)具有較高的支持度,說明船舶操作人員的應(yīng)急處理能力對船舶安全非常重要;K(船位控制不當(dāng))、K(船速控制失誤)和K(拖船控制失誤)也具有較高的支持度,說明船舶操作人員需認(rèn)真控制船位,處理好與拖船間的相互作用關(guān)系。(3)船員在行為決策方面的不安全行為J(安全航速過失)、J(危險判斷失誤)、J(避讓行動過失)的支持度較高。在航行過程中,若沒有保持正規(guī)的瞭望和安全航速,且危險判斷失誤,同時沒有采取正確的避讓措施,則最終會導(dǎo)致事故的發(fā)生。(4)E(風(fēng))、E(流)和E(通航密度)的影響也較為顯著,支持度均在15%以上,說明自然環(huán)境和通航環(huán)境在一定程度上明顯影響船舶操作人員的行為。
根據(jù)數(shù)據(jù)分析,不安全行為關(guān)聯(lián)因素的影響比不安全行為本身的影響低。為獲取關(guān)聯(lián)規(guī)則,將最小支持度設(shè)置為15%,其計算結(jié)果見圖5。
由圖5可知:(1)支持度超過15%的關(guān)聯(lián)規(guī)則共10條,其中支持度超過20%的關(guān)聯(lián)規(guī)則為J→J。J(危險判斷失誤)與J(安全航速過失)相互影響明顯,支持度高達(dá)21.80%。(2)在多因素關(guān)聯(lián)規(guī)則中J→J→I比較顯著,支持度超過15%,再次證明大部分船舶碰撞事故的直接原因為船員的不安全行為,即危險判斷失誤、安全航速過失、瞭望疏忽,這與用傳統(tǒng)方法分析得到的碰撞事故原因相一致。
圖5 船舶不安全行為及其關(guān)聯(lián)因素的關(guān)聯(lián)規(guī)則
Apriori算法被用于從890起船舶交通事故數(shù)據(jù)中挖掘關(guān)聯(lián)規(guī)則,支持度和置信度閾值均被設(shè)置為15%。為獲得高質(zhì)量的關(guān)聯(lián)規(guī)則,提升支持度、置信度和提升度的閾值。針對大多數(shù)非嚴(yán)重事故,將提升度閾值由1.30提高到1.45,將置信度閾值設(shè)置在70%與85%之間,但得到的關(guān)聯(lián)規(guī)則總體變化不大,主要的影響因素會體現(xiàn)在這些關(guān)聯(lián)規(guī)則中。在船舶航行過程中,基于這些關(guān)聯(lián)規(guī)則,實時監(jiān)控來船的動態(tài),及時保持通信和合作,及時采取正確的措施,并關(guān)注自然環(huán)境和交通環(huán)境的影響,將會減少船舶操作人員的不安全行為。
為加強對不確定關(guān)聯(lián)因素的研究,進(jìn)一步探究不安全行為及其關(guān)聯(lián)因素的相關(guān)性,構(gòu)建主要因素致因鏈。設(shè)置最小支持度為15%,將不安全行為及其關(guān)聯(lián)因素按照支持度大小進(jìn)行梳理分析,得出圖6。
由圖6可以發(fā)現(xiàn):(1)關(guān)聯(lián)因素對船員不安全行為的影響存在結(jié)構(gòu)不確定性,目前數(shù)據(jù)顯示至少有3條路徑。船員不安全行為導(dǎo)致事故發(fā)生的路徑有多條,究其本質(zhì),是由于因素間不確定的關(guān)聯(lián)結(jié)構(gòu)造成的。(2)有些因素之間有著很大的關(guān)聯(lián)度,這些因素包括環(huán)境、信息交互方面的不安全行為、瞭望失誤、避讓行動過失、船舶設(shè)備操作失誤以及違章等。船員不安全行為的作用路徑不同,在有些不安全行為的影響下事故必然會發(fā)生。(3)將支持度較高的影響因素進(jìn)行關(guān)聯(lián)發(fā)現(xiàn),航行過程中事故發(fā)生的路徑模式為沒有保持正規(guī)的瞭望→沒有及時發(fā)現(xiàn)航行作業(yè)過程中的問題→沒有針對緊急情況采取正確的措施→沒有避免違規(guī)現(xiàn)象→事故發(fā)生。(4)基于15%以上支持度的所得到的事故路徑主要體現(xiàn)在船員不安全行為上,若將支持度調(diào)小,環(huán)境因素將被覆蓋,因此確立環(huán)境甚至管理因素能影響船員不安全行為。
圖6 事故影響因素間的致因結(jié)構(gòu)與路徑(線條上的數(shù)字表示關(guān)聯(lián)度)
船舶交通事故的形成原因往往是非常復(fù)雜的,發(fā)生過程也充滿著不確定性,由此事故致因結(jié)構(gòu)也是不確定的。隨著事故樣本的增加,事故致因結(jié)構(gòu)會表現(xiàn)出一定的確定性。本文研究的890起事故中,事故類型主要為碰撞(占51.5%)和觸損(占34.1%),事故發(fā)生與船舶位置控制有關(guān)的不安全行為強相關(guān),在船員不安全行為的基本組成中存在相對穩(wěn)定的關(guān)聯(lián)規(guī)則,見圖7。
圖7 船員不安全行為的基本組成中的關(guān)聯(lián)規(guī)則(線條上的數(shù)字表示關(guān)聯(lián)度)
圖7展現(xiàn)了引航過程中碰撞風(fēng)險形成的主要表現(xiàn)形式。由圖7可知:J(安全航速過失)、J(危險判斷失誤)和F(與他船通信與合作過失)在所有不安全行為中支持度相對較高,處于網(wǎng)絡(luò)關(guān)鍵節(jié)點。當(dāng)然,圖4中還有別的因素的支持度也超過30%,也是事故發(fā)生的主要原因。雖然頻率高的因素不止這些,但通過關(guān)聯(lián)規(guī)則分析可以明確事故發(fā)生的主要原因。
本文描述了船員的不安全行為及其關(guān)聯(lián)因素,對船員不安全行為及其關(guān)聯(lián)因素進(jìn)行關(guān)聯(lián)規(guī)則分析,闡述船員的不安全行為及其關(guān)聯(lián)因素的置信度和關(guān)聯(lián)度,利用機器學(xué)習(xí)算法進(jìn)行事故路徑分析,確立事故發(fā)展路徑。由于FP-growth 算法使用項頭表記錄所有的頻繁項集,在挖掘FP-tree時需要反復(fù)遍歷FP-tree,導(dǎo)致算法效率低,故引入了二維表結(jié)合哈希表技術(shù)進(jìn)行了改進(jìn);優(yōu)化后的算法具有較強的適用性,且獲得了效率提升。船員的不安全行為導(dǎo)致事故發(fā)生的路徑有多條,歸根結(jié)底是由因素間的不確定關(guān)聯(lián)結(jié)構(gòu)所導(dǎo)致的。下一步的研究方向是進(jìn)一步研究合理可信的船員不安全行為發(fā)展路徑,提升基于事故物理特征與邏輯特征的致因路徑耦合程度。