• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于改進的Apriori算法的鐵路事故風險源關聯(lián)分析方法

      2023-10-26 08:30:01王寧昌錫銘楊欣吳建軍
      山東科學 2023年5期
      關鍵詞:Apriori算法關聯(lián)規(guī)則

      王寧 昌錫銘 楊欣 吳建軍

      摘要:為了預防鐵路事故的發(fā)生,需要對造成鐵路事故的風險源因素進行探索和分析,揭示鐵路事故的發(fā)生規(guī)律。提出利用改進的Apriori算法,對鐵路事故與風險源進行數(shù)據(jù)挖掘分析??紤]鐵路事故傷亡的嚴重程度,提出新的支持度、置信度指標計算方法,對鐵路事故因素進行加權量化。同時添加時間約束,探索不同時間的鐵路事故風險源關聯(lián)規(guī)則。利用英國鐵路事故數(shù)據(jù),挖掘鐵路事故與風險源之間的關聯(lián)規(guī)則,針對實際案例制定切實有效的預防措施。結果表明,利用改進的Apriori算法能夠得到更多的鐵路事故與風險源之間的關聯(lián)規(guī)則,對于預防鐵路事故的發(fā)生具有重要的作用。

      關鍵詞:風險源;鐵路事故;關聯(lián)規(guī)則;Apriori算法;數(shù)據(jù)挖掘分析

      中圖分類號:U298.5?? 文獻標志碼:A?? 文章編號:1002-4026(2023)05-0067-08

      Association analysis method for railway accident hazards based on the improved Apriori algorithm

      WANG Ning,CHANG Ximing*,YANG Xin,WU Jianjun

      (State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing 100044)

      Abstract∶The causes of railway accidents are difficult to determine as several hazards can lead to accidents. To prevent the occurrence of railway accidents, the hazards responsible for railway accidents should be analyzed, and the occurrence rules of previous railway accidents should be revealed. In this study,data mining analysis on railway accidents and hazards was conducted using the improved Apriori algorithm.Considering the severity of accident casualties, a new calculation method for support and confidence indicators was proposed to weigh and quantify railway accident factors.Furthermore, time constraints were added to explore association rules of hazards with corresponding railway accidents at different times. Using the actual UK railway accident data, the association rules between railway accidents and hazards were discovered, and effective preventive measures were formulated for actual cases. Results show that the improved Apriori algorithm can explore more association rules between railway accidents and hazards, which can play an important role in preventing railway accidents.

      Key words∶hazards;railway accidents;association rule;Apriori algorithm; data mining analysis

      隨著鐵路運營里程和鐵路運輸量的增加,與鐵路有關的事故屢屢發(fā)生。例如,2011 年7月23日,D301次列車與D3115次列車追尾事故,造成40人死亡、172人受傷;2020年3月30日,T179次列車撞上塌方體,導致空調發(fā)電車起火,部分車廂脫軌傾覆事故,導致128人傷亡;2021年6月4日,K596次列車與作業(yè)人員相撞,造成9人死亡[1]。鐵路運輸安全風險時刻在威脅著鐵路運輸?shù)慕】蛋l(fā)展和人員的生命安全,造成事故發(fā)生的風險源因素十分復雜。因此,有必要對鐵路事故中的風險源因素進行分析,挖掘風險源與事故之間隱含的關聯(lián)關系,以便認識鐵路事故發(fā)生的規(guī)律,進一步保障鐵路運輸安全。

      目前廣泛使用的關聯(lián)規(guī)則算法為Apriori關聯(lián)規(guī)則算法,是典型的數(shù)據(jù)挖掘算法。利用關聯(lián)規(guī)則算法對各領域的分析研究已相對成熟。在醫(yī)學數(shù)據(jù)挖掘領域,張萌等[2]使用Apriori算法對病人的就診資料進行了挖掘,得到了病人的病癥和疾病之間的關聯(lián)規(guī)則。降惠等[3]利用Apriori關聯(lián)規(guī)則算法探討了長治市手足口病與氣象因素的關聯(lián)關系。陳治等[4]利用Apriori關聯(lián)規(guī)則算法對宮頸癌樣本數(shù)據(jù)集進行了分析,得到了不同因素對宮頸癌的影響情況。劉媛等[5]利用了關聯(lián)規(guī)則和網(wǎng)絡藥理學方法對治療消化性潰瘍的用藥規(guī)律進行了探索,對其作用機制有了更深一步的了解和認識。在工業(yè)智能化生產(chǎn)領域,何林等[6]利用k均值聚類算法(k-means)和改進的Apriori關聯(lián)規(guī)則算法對工業(yè)大數(shù)據(jù)進行挖掘分析,得到了有利于企業(yè)生產(chǎn)調整智能化的關聯(lián)規(guī)則并最大化利用了資源。在海洋災害預警數(shù)據(jù)挖掘方面,程巖等[7]采用改進的Apriori模型形成了海洋預警決策的支持庫,預測風暴潮水發(fā)生的可能性并預警海洋災害。zaydln等[8]使用貝葉斯網(wǎng)絡和關聯(lián)規(guī)則挖掘方法分析了全長12 m及以上的土耳其漁船未報告的職業(yè)事故數(shù)據(jù)。Lan等[9]使用關聯(lián)規(guī)則技術確定了與全損海事事故的發(fā)生和嚴重程度相關的模式,了解了全損事故的特點,制定針對性的預防措施。

      在交通領域,劉文雅等[10]建立了考慮故障關聯(lián)的改進的Apriori算法,得到的關聯(lián)規(guī)則有助于地鐵故障的影響分析。許未等[11]應用傳統(tǒng)的Apriori算法,構建了鐵路事故致因網(wǎng)絡,探索了鐵路事故致因因素的內在聯(lián)系,這些研究在使用Apriori算法進行數(shù)據(jù)挖掘的過程中未將事故后果的嚴重程度進行考慮。因此在鐵路事故預防領域相對應的研究仍存在不足之處。與鐵路事故發(fā)生有關的風險源數(shù)據(jù)往往是大量的,利用改進的Apriori算法挖掘風險源因素與事故因素之間的關聯(lián)關系,可以獲得事故中的有用信息。本文提出了考慮事故危害加權的關聯(lián)規(guī)則指標進行鐵路事故風險源和事故的關聯(lián)性分析,并在時間上進行約束,以期挖掘更多隱含鐵路事故的關聯(lián)規(guī)則,為鐵路安全管理提供更加智能化與精細化的管理建議,預防鐵路事故的發(fā)生。

      1 事故風險源關聯(lián)分析方法

      1.1 傳統(tǒng)的關聯(lián)規(guī)則

      當前各學者對于結構化的數(shù)據(jù)多有研究,提出卷積神經(jīng)網(wǎng)絡的二分類結構化非平衡數(shù)據(jù)分類算法、敏感屬性識別與分級算法等[12-13],探討結構化數(shù)據(jù)的有效信息。但是對于非結構化數(shù)據(jù),如鐵路事故數(shù)據(jù)報告的研究并未深入。而Apriori算法作為經(jīng)典的頻繁項集挖掘算法,可以針對非結構化數(shù)據(jù)進行挖掘,從數(shù)量龐大的非結構化鐵路事故數(shù)據(jù)中挖掘出頻繁出現(xiàn)的風險源與事故的集合,并將挖掘到的隱含鐵路事故的信息進行直觀呈現(xiàn)。根據(jù)挖掘到的規(guī)則,可以關注到不同風險源與事故之間的關聯(lián)關系,針對風險源關聯(lián)規(guī)則進行防控,從而對鐵路系統(tǒng)進行有效的安全管理。

      在鐵路事故數(shù)據(jù)集合中,將鐵路事故的類型與造成鐵路事故發(fā)生的事故風險源記作一個事務集合H,H={H1,H2,H3,…,Hn},H中包含n個項,即所有風險源與鐵路事故的數(shù)量總和。M、N均表示為非空項集,M?H,N?H。如果M中包含k個項,則M為k項集。記不同事務之間的關聯(lián)規(guī)則為M?N,即表示項集M和項集N間的關聯(lián)關系,此時M∩N=??。

      在關聯(lián)規(guī)則挖掘中,常用支持度、置信度兩個指標來對關聯(lián)規(guī)則進行挖掘與衡量,分別對這兩個指標進行定義。

      (1)支持度指標

      關聯(lián)規(guī)則M?N的支持度表示的是M、N項集同時出現(xiàn)的概率,如式(1)所示:

      式中,number(M,N)代表項集M、N同時出現(xiàn)的事務數(shù)量;number(A)代表事務數(shù)據(jù)庫中所有事務的數(shù)量。

      (2)置信度指標

      關聯(lián)規(guī)則M?N的置信度表示的是一個項集M出現(xiàn)以后,另一個項集N出現(xiàn)的概率,如式(2)所示:

      式中,number(M)代表項集M出現(xiàn)的事務數(shù)量。

      1.2 基于改進Apriori算法的關聯(lián)規(guī)則

      傳統(tǒng)的關聯(lián)規(guī)則在進行數(shù)據(jù)挖掘時,將事務中的項均視為同等重要。然而在鐵路事故當中,不同的事故與風險源所造成的危害是不同的,利用傳統(tǒng)的關聯(lián)規(guī)則將風險源與事故數(shù)據(jù)一起進行數(shù)據(jù)挖掘是不嚴謹?shù)?。因此本研究提出了改進的支持度、置信度指標,采用加權的關聯(lián)規(guī)則對鐵路交通事故數(shù)據(jù)進行分析。對鐵路事故進行加權,鐵路事故加權指標的設定通過造成的鐵路事故后果來進行設定。鐵路事故后果通過事故造成的人員傷亡嚴重程度來衡量,傷亡嚴重程度通過表1所示的死亡和加權傷害來量化。

      改進的支持度指標Imp-Sup(M?N)見式(3):

      改進的支持度指標表示M、N項集同時出現(xiàn)的概率。當項集M或項集N中出現(xiàn)鐵路事故信息時對其進行加權計算,未出現(xiàn)鐵路事故信息時保持原指標結果。式中,ω(M)為M項集的加權,ω(M,N)為ω(M)與ω(N)中權值較大者,B表示鐵路事故數(shù)據(jù)。

      置信度指標Imp-Conf(M?N)見式(4):

      改進的置信度指標表示項集M出現(xiàn)之后,另一個項集N出現(xiàn)的概率。當項集M或項集N中出現(xiàn)鐵路事故信息時對其進行加權計算,未出現(xiàn)鐵路事故信息時保持原指標結果。

      傳統(tǒng)的Apriori算法是挖掘數(shù)據(jù)關聯(lián)規(guī)則的經(jīng)典算法,其思路是對數(shù)據(jù)進行逐一層次的迭代,不斷產(chǎn)生更高維度的頻繁項集和強關聯(lián)規(guī)則。本文在Apriori算法的基礎上添加時間約束,從時間角度對關聯(lián)規(guī)則進行劃分,并利用改進的提升度和置信度指標來篩選的強關聯(lián)規(guī)則,步驟如下:

      步驟1 設定最小支持度、最小置信度指標的值,所設定的指標是后續(xù)產(chǎn)生頻繁項集與強關聯(lián)規(guī)則的基礎。

      步驟2 對整個鐵路事故風險源數(shù)據(jù)的集合進行掃描。第一次掃描產(chǎn)生候選1項集,記W1。根據(jù)時間約束,將W1劃分為日間和夜間數(shù)據(jù)集分別為Wd1和Wn1,根據(jù)步驟1設定的最小支持度指標的值,由候選1項集Wd1和Wn1生成頻繁1項集Vd1和Vn1。

      步驟3 由候選1項集Wd1和Wn1直接生成候選2項集Wd2和Wn2,再根據(jù)步驟1設定的最小支持度指標的值,生成頻繁2項集Vd2和Vn2。

      步驟4 不斷重復步驟3,依次產(chǎn)生候選k項集和頻繁k項集,直至無法產(chǎn)生新的候選k+1項集Wdk+1和Wnk+1時,得到了所探索數(shù)據(jù)集的全部頻繁項集。

      步驟5 根據(jù)步驟1設定的最小支持度、置信度指標,得到不同時間下,數(shù)據(jù)集合中風險源與鐵路事故之間的強關聯(lián)規(guī)則。

      圖1為改進的關聯(lián)規(guī)則算法流程圖。

      2 鐵路事故數(shù)據(jù)挖掘

      本研究通過英國政府網(wǎng)站https://www.gov.uk/raib-reports獲取了2011—2020年共計10年的英國鐵路事故數(shù)據(jù)報告176份,從每份事故報告中提取發(fā)生的事故類型和風險源。在研究中所用到的事故數(shù)據(jù)并未包括地鐵事故和有軌電車事故。值得注意的是,在對事故類型進行統(tǒng)計時,存在一份事故報告中記錄發(fā)生多種類型事故的情況,如在編號為R072011的事故報告中,記錄表明先發(fā)生了失控事故再發(fā)生了脫軌事故,將這兩種類型的事故都進行了統(tǒng)計。收集到發(fā)生的事故類型分別為碰撞、脫軌、失控、墜落、超速、拖拽、觸電、未遂事故共計8種類型。各事故類型的分布情況如圖2所示。

      統(tǒng)計風險源為人員、設備、環(huán)境、管理4種類型,共計89種風險源。將風險源進行編號,89種風險源分別編號為H01~H89。其中H01~H34的風險源為人員類型風險源,H35~H55的風險源為設備類型風險源,H56~H70的風險源為環(huán)境類型風險源,H71~H89的風險源為管理類型風險源。由于篇幅限制,這里僅選取部分人員、設備、環(huán)境和管理類型風險源進行列舉如表2所示。詳細的各類風險源及描述詳見OSID科學數(shù)據(jù)與內容附表。

      鐵路事故的后果通過在事故中造成的人員傷亡的嚴重程度來衡量,傷亡嚴重程度通過表1所示的死亡和加權傷害(fatalities and weighted injuries, FWI)來量化。通過計算,得到每種事故的危害,以此確定鐵路事故的加權。表3為編號H90~H97的事故類型及危害后果量化值。

      3 案例分析

      根據(jù)上述實際鐵路事故數(shù)據(jù),采用改進的關聯(lián)規(guī)則算法挖掘風險源之間、風險源與鐵路事故之間的關聯(lián)關系。鐵路事故的發(fā)生頻率較低,所造成的事故損失是巨大的,設定不同的最小支持度和最小置信度的指標組合進行實驗,得到不同的關聯(lián)規(guī)則數(shù)量,如圖3所示。可以看出,改進后的關聯(lián)規(guī)則在相同的最小支持度和最小置信度指標組合下,所得到的強關聯(lián)規(guī)則數(shù)量更多,獲取的有利于鐵路事故防控的信息也更加充分。

      在本文中,設定不同的指標組合,其得到包含鐵路事故信息的關聯(lián)規(guī)則均占比增加,如圖4所示。其中,設定在日間的最小支持度為0.05,最小置信度為0.1,得到70條強關聯(lián)規(guī)則。相較于未進行加權計算的關聯(lián)規(guī)則,所獲得強關聯(lián)規(guī)則中包含鐵路事故的關聯(lián)規(guī)則占比由85.7%提升到了97.1%。設定在夜間的最小支持度為0.06,最小置信度為0.8,得到87條強關聯(lián)規(guī)則。相較于未進行加權計算的關聯(lián)規(guī)則,所獲得強關聯(lián)規(guī)則中包含鐵路事故的關聯(lián)規(guī)則占比由81.8%提升到了97.7%。在這兩個時間段獲取的包含更多鐵路事故信息的關聯(lián)規(guī)則占比均提高,得到的包含鐵路事故與風險源之間關聯(lián)關系的規(guī)則也更多,有利于進一步探索風險源與鐵路事故之間的關聯(lián)關系,有利于后續(xù)進行鐵路事故的預防和控制。

      在不同時間得到的部分強關聯(lián)規(guī)則如表4所示。針對此類結果,可以提出具體的預防措施如下:(1)在日間往往由于人員的誤判以及一些人員不遵守交通規(guī)則的行為導致碰撞事故的發(fā)生,需要進一步加強對行人、乘客、騎行者等人的規(guī)范和引導。(2)在夜間,失控事故的發(fā)生往往伴隨著碰撞事故的發(fā)生,因此在發(fā)生失控事故時,需要注意對事故進行及時干預,防止碰撞事故的進一步發(fā)生。(3)在夜間,車輛、機械設備等操作員的違規(guī)操作或操作錯誤往往會使車輛或者設備不安全運行,從而導致碰撞事故的發(fā)生。因此需要重點加強鐵路作業(yè)車輛、設備等人員的管理培訓,預防事故的發(fā)生。(4)夜間列車司機也容易產(chǎn)生過大的壓力或者作業(yè)疲勞分心,從而導致碰撞事故的發(fā)生,針對這一情況需要進一步合理安排司機作業(yè)時間,并在司機上崗前確認其身體狀況,從而保障鐵路列車的安全運行。

      4 結語

      本研究所提出的改進的Apriori算法根據(jù)不同的鐵路事故造成的危害不同,在進行支持度與置信度指標計算時,考慮了事故的權重,挖掘到了包含更多鐵路事故信息的關聯(lián)規(guī)則。同時添加時間約束,包含鐵路事故與風險源的強關聯(lián)規(guī)則數(shù)量在不同時間維度下均有所提高。最后針對典型強關聯(lián)規(guī)則提出具體的預防措施,有利于鐵路的安全管理。

      本文仍存在一些不足,需要在今后的工作中進一步研究和改進。可以考慮使用更加豐富且具有一致性的數(shù)據(jù),便于關聯(lián)規(guī)則的探索研究。也可以將風險源的重要性程度進行考慮,在進行支持度和置信度指標的計算過程中對風險源的重要性程度進行科學合理的加權量化分析,以便進一步探討探討風險源之間關聯(lián)關系,為鐵路安全管理提供更加切實有效的預防措施。

      參考文獻:

      [1]國家鐵路局.“6.4”蘭新線K596次旅客列車與作業(yè)人員相撞鐵路交通事故調查處理情況公告[EB/OL]. [2022-08-10]. http://www.nra.gov.cn/zzjg/jgj/lzgl/gglz/202107/t20210729_337941.shtml

      [2]張萌, 梁正, 祝思清. 基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘在醫(yī)療診斷中的應用[J]. 山東科學, 2008, 21(1): 80-82.

      [3]降惠, 尹振保, 武麗娟, 等. Apriori算法在手足口病與氣象因素關系分析中的應用[J]. 智能計算機與應用, 2021, 11(7): 124-128. DOI: 10.3969/j.issn.2095-2163.2021.07.023.

      [4]陳治, 吳娟娟. 基于關聯(lián)規(guī)則的醫(yī)療數(shù)據(jù)挖掘研究[J]. 統(tǒng)計與決策, 2020, 36(6): 174-177. DOI: 10.13546/j.cnki.tjyjc.2020.06.040.

      [5]劉媛, 孫輝, 許苑南, 等. 基于數(shù)據(jù)挖掘及網(wǎng)絡藥理學探討中藥治療消化性潰瘍的用藥規(guī)律及作用機制[J]. 山東科學, 2022, 35(5): 37-45. DOI: 10.3976/j.issn.1002-4026.2022.05.005.

      [6]何林, 劉宇紅, 張榮芬. 基于關聯(lián)規(guī)則對工業(yè)鈾測量數(shù)據(jù)挖掘分析研究[J]. 計算機技術與發(fā)展, 2022, 32(5): 147-152. DOI: 10.3969/j.issn.1673-629X.2022.05.025.

      [7]程巖, 任國興, 杜立彬. 基于Apriori模型的海洋災害預警數(shù)據(jù)挖掘技術[J]. 山東科學, 2009, 22(2): 57-60.

      [8]ZAYDIN E, FISKIN R, UGDD)]URLU , et al. A hybrid model for marine accident analysis based on Bayesian Network (BN) and Association Rule Mining (ARM) [J]. Ocean Engineering, 2022, 247:110705. DOI: 10.1016/j.oceaneng.2022.110705.

      [9]LAN H, MA X, MA L, et al. Pattern investigation of total loss maritime accidents based on association rule mining[J]. Reliability Engineering & SystemSafety, 2023, 229:108893. DOI: 10.1016/j.ress.2022.108893. [ZK)]

      [10][ZK(#]劉文雅, 徐永能. 基于改進Apriori算法的地鐵故障關聯(lián)規(guī)則挖掘[J]. 兵器裝備工程學報, 2021, 42(12):210-215. DOI: 10.11809/bqzbgcxb2021.12.033.

      [11]許未, 何世偉, 劉朝輝,等. 基于關聯(lián)規(guī)則的鐵路事故致因網(wǎng)絡構建與分析[J]. 鐵道運輸與經(jīng)濟, 2020, 42(11): 72-79. DOI: 10.16668/j.cnki.issn.1003-1421.2020.11.13.

      [12]徐紅, 矯桂娥, 張文俊, 等. 基于卷積神經(jīng)網(wǎng)絡的結構化非平衡數(shù)據(jù)分類算法[J]. 計算機工程, 2023, 49(2): 81-89. DOI: 10.19678/j.issn.1000-3428.0063871.

      [13]何文竹, 彭長根, 王毛妮, 等. 面向結構化數(shù)據(jù)集的敏感屬性識別與分級算法[J]. 計算機應用研究, 2020, 37(10): 3077-3082. DOI: 10.19734/j.issn.1001-3695.2019.05.0187.

      猜你喜歡
      Apriori算法關聯(lián)規(guī)則
      基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
      基于Apriori算法的高校學生成績數(shù)據(jù)關聯(lián)規(guī)則挖掘分析
      基于云平臺MapReduce的Apriori算法研究
      基于關聯(lián)規(guī)則和時間閾值算法的5G基站部署研究
      移動通信(2016年20期)2016-12-10 09:09:04
      關聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
      數(shù)據(jù)挖掘在高校課堂教學質量評價體系中的應用
      關聯(lián)規(guī)則挖掘Apriori算法的一種改進
      中國市場(2016年36期)2016-10-19 04:10:44
      基于關聯(lián)規(guī)則的計算機入侵檢測方法
      基于RFID的汽車零件銷售策略支持模型
      關聯(lián)規(guī)則在高校評教系統(tǒng)中的應用
      齐齐哈尔市| 兴文县| 论坛| 阳曲县| 贞丰县| 色达县| 海门市| 乾安县| 嘉定区| 峡江县| 阳江市| 霍邱县| 长葛市| 商城县| 如东县| 霍邱县| 兴城市| 砀山县| 延寿县| 新巴尔虎右旗| 奉节县| 翁源县| 祁阳县| 南康市| 盐城市| 昌吉市| 卢湾区| 石门县| 九江市| 射洪县| 阿城市| 广南县| 湖南省| 右玉县| 娄底市| 海林市| 师宗县| 德清县| 天全县| 西乌珠穆沁旗| 张家川|