• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于隨機森林的船舶避臺失敗原因分析

      2021-10-08 04:34:45王元棟盛進路劉琴
      上海海事大學學報 2021年3期
      關(guān)鍵詞:隨機森林決策樹

      王元棟 盛進路 劉琴

      摘要:為提高船舶避臺成功率,采用隨機森林對船舶避臺失敗的原因進行分析,并與決策樹進行對比。結(jié)果表明:隨機森林和決策樹對船舶避臺失敗事故的平均診斷率分別為84.23%和75.56%;隨機森林對一般事故和重大事故具有更高的診斷率,分別達到90.0%和96.1%。事故原因分析表明:造成船舶避臺失敗的首要原因是船員責任感不強;船員責任感不強、決策出現(xiàn)差池和船舶日常管理混亂極易導(dǎo)致船舶避臺失敗事故。本文研究可為船舶實施合理避臺措施提供一定的參考。

      關(guān)鍵詞:? 船舶避臺失敗事故; 決策樹; 隨機森林

      中圖分類號:? U698.6

      文獻標志碼:? A

      Meeting of the Waterborne Transport Division, World Transport Convention 2021 (WTC 2021)

      Analysis on failure reasons of ship avoiding typhoon

      based on random forest

      WANG Yuandonga, SHENG Jinlub, LIU Qinb

      (a.School of Shipping and Naval Architecture; b.College of Traffic & Transportation,

      Chongqing Jiaotong University, Chongqing 400074, China)

      Abstract: In order to improve the success rate of ship avoiding typhoon, the random forest is adopted to analyze the failure reasons of ship avoiding typhoon, and is

      compared with? the decision tree. The results show that: the average diagnostic rates of the random forest and the decision tree for the failure accidents of ship avoiding typhoon are 84.23% and 75.56%, respectively; the random forest is of higher diagnostic rate for general accidents and serious accidents, and the diagnostic rates reach 90.0% and 96.1%, respectively. The analysis on accident reasons shows that: the primary reason for the failure of ship avoiding typhoon is the lack of crews responsibility; the lack of crews responsibility, the incorrect decision-making, and the chaotic daily management for ships can easily lead to the failure accidents of ship avoiding typhoon.It can provide reference for the implementation of reasonable measures for ship avoiding typhoon.

      Key words: typhoon avoidance failure accident of ship; decision tree; random forest

      收稿日期: 2021-03-28

      修回日期: 2021-06-29

      作者簡介:

      王元棟(1992—),男,青海海東人,碩士研究生,研究方向為海事安全與環(huán)境工程,(E-mail)1774980941@qq.com;

      盛進路(1976—),男,山東煙臺人,教授,博士,研究方向為港航企業(yè)運行與管理,(E-mail)forwardlulu@163.com

      0 引 言

      據(jù)德國安聯(lián)保險集團發(fā)布的《2020年安全與航運報告》,2019年100總噸以上船舶近五分之一的全損事故是由惡劣天氣和海況(如臺風、寒潮、濃霧)造成的,其中由臺風造成的約占75%。往往由臺風造成的事故損失巨大,救援極為困難,影響范圍廣,在威脅船舶安全航行的同時,還帶來極大的生命財產(chǎn)損失,甚至對海洋生態(tài)環(huán)境造成嚴重污染。因此,為給船舶安全航行提供有力的保障,研究船舶避臺失敗的原因極為重要。

      船舶事故分析主要采用事故樹、故障樹、貝葉斯網(wǎng)絡(luò)等方法。楊威[1]應(yīng)用事故樹對典型船舶避臺失敗事故原因進行了分析,缺乏一般性。吳郁等[2]以長江干線江蘇段945起碰撞事故為研究對象,采用隨機森林對缺失數(shù)據(jù)進行插補,與Logistic回歸、Probit回歸、樸素貝葉斯等方法進行對比得出,所采用的隨機森林誤分率最低。WAN等[3]在人因分析與分類系統(tǒng)(human factors analysis and classification system,HFACS)模型基礎(chǔ)上,根據(jù)事故統(tǒng)計分析結(jié)果和專家判斷結(jié)果,利用故障樹對碰撞事故基本風險因素進行定性分析,并制訂風險控制措施。李奕良[4]基于貝葉斯網(wǎng)絡(luò)對干散貨船自沉事故進行致因分析,挖掘事故致因鏈,并有針對性地提出相關(guān)風險控制措施。賀立敏等[5]應(yīng)用隨機森林對船舶柴油機故障數(shù)據(jù)進行降維處理后,再采用支持向量機進行分類,并未完全發(fā)揮隨機森林的優(yōu)點。方匡南等[6]對隨機森林從原理、性質(zhì)、應(yīng)用等方面做了全面的分析。

      事故樹起源于決策樹,是按事故發(fā)展的時間順序由初始事件開始推論可能的后果,而決策樹恰好相反。決策樹按一定的程序步驟可以向貝葉斯網(wǎng)絡(luò)轉(zhuǎn)化,換言之,貝葉斯網(wǎng)絡(luò)具有決策樹和事故樹的功能。貝葉斯網(wǎng)絡(luò)表達形式簡單,其繁雜程度隨著問題復(fù)雜程度呈線性增長,而事故樹的繁雜程度隨問題復(fù)雜程度呈指數(shù)形式增長。貝葉斯網(wǎng)絡(luò)是一個優(yōu)缺點并重的算法模型,在獨立分布的前提下,貝葉斯網(wǎng)絡(luò)優(yōu)于其他算法且需要的樣本量少。隨機森林是一種集成算法模型,集成學習的目的是通過結(jié)合多個基礎(chǔ)學習器的分析結(jié)果,改善單個基礎(chǔ)學習器的魯棒性和泛化性能,其最大的優(yōu)點在于訓練時不太可能出現(xiàn)過擬合現(xiàn)象。

      通過上述事故分析模型關(guān)系與特征的分析,本文采用隨機森林與決策樹對比的方法,對船舶避臺失敗原因進行分析。首先根據(jù)事故報告按事故致因、事故等級形成二進制數(shù)據(jù)庫,其次對數(shù)據(jù)進行預(yù)處理,剔除個別事故的罕見致因,最終形成450×11的矩陣,最后應(yīng)用隨機森林和決策樹進行結(jié)果分析,尋出船舶避臺失敗的關(guān)鍵致因。

      1 隨機森林算法

      1.1 隨機森林算法思路

      隨機森林將多個決策樹進行有效組合,組建成一個學習系統(tǒng),其中每個決策樹是這個系統(tǒng)的組成單元,隨機森林的學習能力在系統(tǒng)中所占的權(quán)重根據(jù)訓練可能會有所不同,但其泛化性能優(yōu)于其中任何一棵決策樹[7-8]。

      集成算法有兩個流派,Bagging流派和Booting流派,兩者最為明顯的區(qū)別是前者各學習器之間有依賴關(guān)系,而后者沒有[9]。通常將Bagging的集成思想與決策樹的結(jié)合稱為隨機森林,其基本思路見圖1。

      1.2 隨機森林算法流程

      相對于事故樹單分類器,隨機森林算法具有更好的診斷性能,但由于該算法本身的隨機性,診斷結(jié)果存在波動性[10]。針對這個問題,

      首先對采集的數(shù)據(jù)進行預(yù)處理和降維處理,以減少訓練時間;再根據(jù)事故等級劃分和變量確定,形成完備的二進制數(shù)據(jù)庫;然后計算數(shù)據(jù)庫中事故等級的一階原點矩,確保一階原點矩周圍事故診斷率達到90%以上,并進行交叉驗證確定最佳決策樹和最少葉子節(jié)點數(shù);最后通過隨機森林模型得出最終決策樹。本文隨機森林算法流程見圖2。

      2 基于隨機森林的船舶避臺失敗原因分析

      數(shù)據(jù)挖掘分析中最為重要的是數(shù)據(jù)源的科學性、合理性和準確性。本文數(shù)據(jù)來源于中國海事局船舶避臺失敗事故報告(www.msa.gov.cn/)。

      2.1 事故等級劃分

      依據(jù)《中華人民共和國統(tǒng)計法》、《中華人民共和國海上交通安全法》和《中華人民共和國內(nèi)河交通安全管理條例》,將水上交通事故按照人員傷亡和直接經(jīng)濟損失情況,分為5個等級:小事故、一般事故、大事故、重大事故和特大事故。對事故等級進行量化處理,

      上述5個等級量化值依次為1、2、3、4、5。本文數(shù)據(jù)來自450份船舶避臺失敗事故報告,其中有小事故6起、一般事故146起、大事故229起、重大事故45起和特大事故24起。

      2.2 事故原因確定

      對事故報告進行系統(tǒng)全面的分析,發(fā)現(xiàn)船舶避臺失敗的原因有11項,見表1。在統(tǒng)計時,若該項為某起船舶避臺失敗事故的原因,則記為1,否則記為0。

      事故原因統(tǒng)計概率見圖3。從圖3可知,臺風風速及影響范圍不規(guī)律變化(x11)占比78%,準備工作不足(x6)占比74%,決策失誤(x5)占比66%。

      3 分析過程

      (1)讀取數(shù)據(jù)。應(yīng)用MATLAB自帶函數(shù)xlsread讀取二進制數(shù)據(jù)庫,然后應(yīng)用unifrnd產(chǎn)生450×1的均勻矩陣,并用round函數(shù)對矩陣進行整數(shù)化處理,最后應(yīng)用randperm產(chǎn)生一個均勻隨機的數(shù)字序列,為后續(xù)抽樣做準備。

      (2)計算事故等級原點矩。對事故等級進行統(tǒng)計概率分析,結(jié)果見表2。由原點矩可知,總體樣本事故等級的期望為2.85,因此樣本的總體事故等級在一般事故與大事故之間。

      (3)留一法抽樣。為保證每組數(shù)據(jù)既能作訓練集也能作測試集,采用留一法抽樣:先把總樣本(共450起事故)均勻分成10組,然后利用Bootstrap重采樣,任選一組為測試集,剩下的9組為訓練集,接著再選1組為測試集(選過的不再選擇),剩下的9組為訓練集,以此類推。這樣不僅能保證每組數(shù)據(jù)既作為訓練集又作為測試集,而且便于決策樹交叉驗證。

      (4)創(chuàng)建隨機森林分類器進行仿真測試。應(yīng)用R語言中的隨機森林工具包Class RF _ train和Class RF _ predict創(chuàng)建隨機森林分類器進行仿真測試。

      (5)分析過程。初始決策樹為500棵,葉子節(jié)點數(shù)為9。為每個非葉子節(jié)點選擇事故原因前,從11個事故原因中隨機抽取9個作為當前節(jié)點的分裂屬性,并以這9個屬性中最好的分裂方式對該節(jié)點進行分裂,在整個森林生長過程中,每棵樹都完整生長不進行剪枝;然后采用投票的方法,將訓練集決策樹輸出最多的類別作為測試集所屬類別;對測試集中的每個決策樹進行訓練,得到對應(yīng)的類別;最后采用投票的方法,將訓練集決策樹輸出最多的類別作為測試集樣本所屬類別。

      (6)最佳決策樹數(shù)量與最少葉子節(jié)點數(shù)確定。在保證一般事故和大事故的診斷率不小于90%的條件下,通過葉子節(jié)點含有的最小樣本數(shù)與交叉驗證誤差的關(guān)系(見圖4)和隨機森林中決策樹數(shù)量與診斷率的關(guān)系(見圖5),確定最少葉子節(jié)點數(shù)為14和最佳決策樹數(shù)量為150棵左右。

      4 結(jié)果對比分析

      4.1 隨機森林分析

      采用隨機森林對船舶避臺失敗原因進行分析,結(jié)果見表3。

      由于受樣本數(shù)量限制,小事故、重大事故和特大事故的診斷率呈現(xiàn)特殊情況:由于小事故樣本數(shù)為6,選取的測試集中未包含小事故,因此診斷失效。

      由于事故等級是根據(jù)人員傷亡和直接經(jīng)濟損失兩個指標劃分的,一些事故的人員傷亡指標隸屬于大事故但直接經(jīng)濟損失指標隸屬于重大事故,因此最終將其確定為重大事故。

      最終決策樹見圖6。由圖6可知:最終決策樹葉子節(jié)點數(shù)為14,其中一般事故、大事故、重大事故、特大事故對應(yīng)的葉子節(jié)點數(shù)分別為4、8、1、1。

      船舶避臺失敗的原因從主要到次要分為5個層級,一層級中有x4(船員責任感不強),二層級中有x3、x5(船員職業(yè)技能低、決策失誤),三層級中有x1、x2、x11(海務(wù)監(jiān)管不力、船舶日常管理混亂、臺風風速及影響范圍不規(guī)律變化),四層級中有x2、x5、x8(船舶日常管理混亂、決策失誤、船舶船齡長),五層級中有x3、x7(船員職業(yè)技能低、船體結(jié)構(gòu)差)。

      x4—x3—x11—x5—2是最終決策樹的左邊枝,x4—x5—x1—x2—5是最終決策樹的右邊枝,而x4、x5、x1、x2造成的事故后果比x4、x3、x11、x5的更嚴重;最短枝有x4—x3—x11—3、x4—x3—x1—3、x4—x5—x2—2和x4—x5—x2—3:因此,若同時存在這5類問題x1、x2、x3、x4、x5(海務(wù)監(jiān)管不力、船舶日常管理混亂、船員職業(yè)技能低、船員責任感不強、決策失誤),則極易引發(fā)船舶避臺失敗事故。

      4.2 決策樹分析

      根據(jù)決策樹對船舶避臺失敗原因進行分析,結(jié)果見圖7。從圖7可知:修剪后的決策樹含有35個葉子節(jié)點,其中小事故、一般事故、大事故、重大事故、特大事故對應(yīng)的葉子節(jié)點數(shù)分別為1、12、15、3、4。

      船舶避臺失敗的原因從主要到次要分為10個層級,一層級中有x4(船員責任感不強),二層級中有x3、x1(船員職業(yè)技能低、海務(wù)監(jiān)管不力),三級層中有x1、x2、x9、x11(海務(wù)監(jiān)管不力、船舶日常管理混亂、船舶技術(shù)狀況差、臺風風速及影響范圍不規(guī)律變化),四層級中有x2、x3、x5、x6、x7、x8(船舶日常管理混亂、船員職業(yè)技能低、決策失誤、準備工作不足、船體結(jié)構(gòu)差、船舶船齡長),五層級中有x3、x5、x6、x7、x8、x9(船舶日常管理混亂、決策失誤、準備工作不足、船體結(jié)構(gòu)差、船舶船齡長、船舶技術(shù)狀況差),六層級中有x5、x6、x10(決策失誤、準備工作不足、臺風路徑不規(guī)律),七層級中有x10(臺風路徑不規(guī)律),八層級中有x1、x2(船員職業(yè)技能低、船舶日常管理混亂),九層級中有x9(船舶技術(shù)狀況差),十層級中有x2(船舶日常管理混亂)。

      x4—x3—x11—x5—2是最終決策樹的左邊枝(事故致因鏈),x4—x1—x2—x5—4(5)是最終決策樹的右邊枝,而x4、x1、x2、x5造成的事故后果比x4、x3、x11、x5的更嚴重;最長事故致因鏈為x4—x3—x11—x7—x6—x5—x10—x1—x9—x2—3(2)。

      4.3 對比分析

      隨機森林與決策樹對船舶避臺失敗事故的診斷結(jié)果對比見表4。從表4可知,隨機森林的診斷率明顯比決策樹的高,而且得到的最終決策樹的層級和葉子節(jié)點更簡潔。

      綜合表4,并對比圖6、7得出以下結(jié)論:(1)在訓練樣本與測試樣本數(shù)量相同的情況下,相比于決策樹,隨機森林的平均診斷率更高,收斂性更強。(2)從隨機森林和決策樹得出的最終決策樹可以看出,隨機森林的最終決策樹更加簡明,各層級之間事故致因交叉少,更符合邏輯;而決策樹得出的最終決策樹的事故致因鏈較長,各層級之間事故致因交織在一起,邏輯結(jié)構(gòu)不夠簡明。(3)船舶在防抗臺風過程中,避臺失敗事故的主要致因是人的因素。由隨機森林和決策樹得出的最終決策樹顯示,船員責任感不強是所有事故的首要致因;從最短事故鏈看,海務(wù)監(jiān)管不力、船舶日常管理混亂、船員職業(yè)技能低、船員責任感不強和決策失誤,極易引發(fā)船舶避臺失敗事故。

      5 結(jié) 論

      本文提出一種基于隨機森林的船舶避臺失敗原因分析方法,與決策樹相對比,隨機森林具有快速學習且不需要剪枝的優(yōu)勢。在確保診斷率的情況下,隨機森林對一般事故和大事故有良好的診斷效果。當決策樹的葉子節(jié)點為14時交叉驗證誤差最小,當決策樹為150棵左右時既能保證較高的診斷率又能提高診斷效率。最終決策樹顯示,海務(wù)監(jiān)管不力、船舶日常管理混亂、船員職業(yè)技能低、船員責任感不強、決策失誤、準備工作不足是脆弱性致因,船員責任感不強是船舶避臺失敗的導(dǎo)火索,其他5項(船體結(jié)構(gòu)差、船舶船齡長、船舶技術(shù)狀況差、臺風路徑不規(guī)律、臺風風速及影響范圍不規(guī)律變化)為從屬致因。

      參考文獻:

      [1]楊威. 基于事故樹的船舶避臺失敗原因分析[D]. 大連: 大連海事大學, 2017.

      [2]吳郁, 張金奮, 范存龍, 等. 基于隨機森林的船舶碰撞事故缺失數(shù)據(jù)插補[J]. 武漢理工大學學報(交通科學與工程版), 2019, 43(6): 1120-1124. DOI: 10.3963/j.issn.2095-3844.2019.06.026.

      [3]WAN Yaoyi, XIA Haibo. Application of HFACS model in marine traffic accident field[J]. International Core Journal of Engineering, 2021, 7(3): 135-140. DOI: 10.6919/ICJE.202103_7(3).0019.

      [4]李奕良. 基于貝葉斯網(wǎng)絡(luò)的干散貨船舶自沉事故致因分析[D]. 大連: 大連海事大學, 2020.

      [5]賀立敏, 王峴昕, 韓冰. 基于隨機森林和支持向量機的船舶柴油機故障診斷[J]. 中國航海, 2017, 40(2): 29-33.

      [6]方匡南, 吳見彬, 朱建平, 等. 隨機森林方法研究綜述[J]. 統(tǒng)計與信息論壇, 2011, 26(3): 32-38.

      [7]MUTANGA O, ADAM E, CHO M A. High density biomass estimation for wetland vegetation using WorldView-2 imagery and random forest regression algorithm[J]. International Journal of Applied Earth Observation and Geoinformation, 2012, 18: 399-406. DOI: 10.1016/j.jag.2012.03.012.

      [8]謝宏, 楊環(huán). 一種隨機森林與深度學習結(jié)合的室內(nèi)定位方法[J]. 上海海事大學學報, 2020, 41(3): 117-121. DOI: 10.13340/j.jsmu.2020.03.019.

      [9]牟小輝, 袁裕鵬, 嚴新平, 等. 基于隨機森林算法的內(nèi)河船舶油耗預(yù)測模型[J]. 交通信息與安全, 2017, 35(4): 100-105.

      [10]CHEN Jiangguo, LI Kenli, TANG Zhou, et al. A parallel random forest algorithm for big data in a spark cloud computing environment[J]. IEEE Transactions on Parallel and Distributed Systems, 2016, 28(4): 919-933. DOI: 10.1109/TPDS.2016.2603511.

      (編輯 趙勉)

      猜你喜歡
      隨機森林決策樹
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      基于改進決策樹的故障診斷方法研究
      隨機森林在棉蚜蟲害等級預(yù)測中的應(yīng)用
      基于二次隨機森林的不平衡數(shù)據(jù)分類算法
      軟件(2016年7期)2017-02-07 15:54:01
      拱壩變形監(jiān)測預(yù)報的隨機森林模型及應(yīng)用
      基于隨機森林算法的飛機發(fā)動機故障診斷方法的研究
      基于決策樹的出租車乘客出行目的識別
      基于決策樹的復(fù)雜電網(wǎng)多諧波源監(jiān)管
      電測與儀表(2016年2期)2016-04-12 00:24:40
      基于隨機森林算法的B2B客戶分級系統(tǒng)的設(shè)計
      什邡市| 新龙县| 灵宝市| 山东省| 旌德县| 鸡泽县| 侯马市| 哈密市| 新竹市| 德化县| 泊头市| 西盟| 会昌县| 临沧市| 泰宁县| 邵阳县| 利津县| 德清县| 偃师市| 武隆县| 柞水县| 仁化县| 靖州| 莲花县| 湖南省| 长垣县| 尉犁县| 兴仁县| 长子县| 南漳县| 栖霞市| 四平市| 滁州市| 蛟河市| 正蓝旗| 东乡县| 麻栗坡县| 屯留县| 石渠县| 六枝特区| 灯塔市|