• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數據技術在油氣行業(yè)事故事件致因分析中的應用

      2021-12-04 02:44:36閻紅巧樊志強郝壯遠
      安全與環(huán)境工程 2021年6期
      關鍵詞:分析模型屏障語義

      閻紅巧,樊志強,郝壯遠

      (中國石油集團安全環(huán)保技術研究院有限公司HSE信息中心,北京 102206)

      油氣行業(yè)具有易燃易爆炸、有毒有害、高溫高壓等生產特點,一旦發(fā)生事故,不僅會造成重大的經濟損失,而且會帶來嚴重的社會影響,因此防范安全事故的發(fā)生是石油及天然氣企業(yè)安全管理的重要目標和方向。然而,近年來油氣生產企業(yè)同類型安全事故重復發(fā)生,其重要原因是企業(yè)對歷史事故事件發(fā)生的原因認識不足。隨著信息化技術的發(fā)展,企業(yè)積累了大量的事故事件報告數據,但文本挖掘技術的不足限制了事故事件資源利用的程度。

      目前,我國對事故事件資源的利用水平仍然處于落后階段,主要表現在以下兩個方面:一是在某起重特大事故發(fā)生后對事故原因進行深刻剖析,以預防同類型事故再次發(fā)生;二是采用人工方式批量分析事故數據,統計各類事故發(fā)生的規(guī)律,為事故預防提供依據。上述兩者都是針對油氣生產企業(yè)事故發(fā)生原因和發(fā)生規(guī)律展開的分析與研究,但均存在一定的局限性:前者主要是針對某一起事故開展事故原因的分析,其數據量小,因而難以發(fā)現事故發(fā)生的共性原因;后者利用人工方式對事故原因開展分析,雖然其分析結果有一定的價值,但效率低。相比之下,挖掘方法將事故調查報告作為數據源,可從事故調查報告中獲取事故發(fā)生時的特征信息,有利于解釋事故發(fā)生的規(guī)律?;谖谋就诰蚍椒ǖ乃悸?,許多學者利用文本挖掘方法對事故原因進行了分析,如薛楠楠等通過對334份建筑施工安全事故報告進行分析,識別出8項建筑工人不安全行為和27項影響因素;李解等首次運用 R語言和文本挖掘方法,從151份地鐵施工事故報告中提取了6項關鍵因素和23項一般因素。但這些研究大多只是關注施工安全事故的原因,對油氣行業(yè)事故影響因素的研究相對較少。為此,本文以油氣生產企業(yè)事故事件數據為基礎,通過建立領域專業(yè)詞庫和停用詞庫對事故事件數據進行分詞,建立了詞向量并基于FastText算法形成了與油氣生產企業(yè)事故事件信息相匹配的HSE文本語義分析模型,并利用其自動提取大量事故調查報告中失效屏障類型、屏障失效原因,進而揭示導致事故屏障失效的管理因素,為尋找油氣生產企業(yè)安全管理缺陷與事故預控提供依據。

      1 數據來源

      本研究收集了某油氣生產企業(yè)2000—2018年事故數據,數據類型為非結構化文本數據,包括事故經過描述、事故原因描述等,并考察數據的完整性和可用性。原始事故數據示例如表1所示。

      表1 原始事故數據示例Table 1 Example of raw accident data

      2 研究方法

      基于自然語言處理技術,利用事故數據建立訓練樣本,構建了HSE文本語義分析模型,并利用該模型從1萬余條事故數據中自動提取失效屏障類型、屏障失效原因和導致屏障失效的管理因素,進而進行了統計分析,其流程主要包括數據預處理、建立機器學習樣本、建立HSE文本語義分析模型、模型應用、結果可視化分析和建議與措施6個環(huán)節(jié),見圖1。

      圖1 事故事件歸因分析流程Fig.1 Cause analysis process of accidents and incidents

      2.1 數據預處理

      本文數據預處理主要包括數據清洗、數據集成和數據缺失標記三項任務。本文主要分析事故事件發(fā)生的原因,由于原始事故文本數據中一些不相關的信息并不會為分析模型的構建提供重要信息,反而會在模型訓練期間制造噪音,因此需要通過數據清洗將其從訓練集中去除;此外,原始事故文本數據中還存在缺少“事故經過描述”或者“事故原因描述”字段的事故,因此需要通過數據集成以完善事故事件報告信息;最后,針對數據集成之后依然缺失信息的事故事件數據,則標記為數據來源不明,后續(xù)不參與建模。

      2.2 建立機器學習樣本

      本文在屏障理論的基礎上建立了機器學習樣本。屏障是指在事故早期階段可以阻止危害因素進一步向事故演變的措施,它可以限制危害因素產生的傷害和后果。每一個屏障,如果其完好,都應該能夠完全阻止事件的進一步發(fā)展。

      2.2.1 數據標注

      在屏障理論的基礎上,通過注解、打標簽的方式建立機器學習訓練樣本。建立訓練樣本是本文的關鍵,這項任務需要具備石油領域專業(yè)知識和安全專業(yè)素養(yǎng)的人員完成,需逐一識別出事故中失效的屏障類型,并依次分析屏障失效原因和導致屏障失效的管理因素。值得說明的是,失效屏障類型、屏障失效原因和導致屏障失效的管理因素具有對應關系。針對每一份事故調查報告,標記其失效的屏障類型、每類屏障的失效原因和導致屏障失效的管理因素,形成機器學習訓練樣本。訓練樣本建立的流程見圖2,訓練樣本示例見表2。

      圖2 機器學習樣本建立流程Fig.2 Process of constructing training samples for machine learning

      表2 機器學習訓練樣本示例Table 2 Examples of training samples for machine learning

      2.2.2 事故事件歸因

      形成事故事件歸因分類列表是建立機器學習樣本的基礎?;诮C器學習樣本的需要,事故事件歸因列表包括三部分,分別為屏障類型列表、屏障失效原因列表和導致屏障失效的管理因素列表。

      (1) 屏障類型列表。本文參照國際油氣協會(International Association of Oil & Gas Producers,簡稱IOGP)的做法,將屏障劃分為技術屏障和人員屏障。其中,從安全功能角度將技術屏障分為8類,見表3;基于人員在人機系統中的典型活動將人員屏障分為5類,見表4。

      表3 技術屏障類型Table 3 Technical barrier types

      表4 人員屏障類型Table 4 Human barrier types

      (2) 屏障失效原因列表。本文將屏障失效原因列表分為技術屏障失效原因列表和人員屏障失效原因列表。其中,技術屏障失效的原因分為7類,見表5;人員屏障失效的原因分為7類,見表6。

      表5 技術屏障失效的原因Table 5 Reasons for technical barrier failure

      表6 人員屏障失效的原因Table 6 Reasons for human barrier failure

      (3) 導致屏障失效的管理因素列表?;趪HHSE管理體系和油氣行業(yè)特點,將導致屏障失效的管理因素分為13類,見表7。

      表7 導致屏障失效的管理因素Table 7 Management factors leading to barrier failure

      2.3 建立HSE文本語義分析模型

      HSE文本語義分析模型的構建過程即為訓練HSE文本分類器的過程。本文采用監(jiān)督式的FastText模型訓練HSE文本分類器。FastText模型架構如圖3所示,其包含輸入層、隱含層和輸出層。其中,隱含層是模型固有結構,在此不做具體說明;輸出層為分類器;輸入層是文本向量,其處理方式決定了HSE文本語義分類模型的分類效果。

      圖3 FastText模型架構圖Fig.3 Architecture diagram of FastText Model

      FastText模型架構圖中

      x

      表示文本中第

      i

      個詞的特征向量,文本向量為詞向量的平均值,因此分詞效果對于文本向量的正確表達至關重要。本文通過爬蟲技術、行業(yè)標準和新詞發(fā)現等功能建立了包含19 999個領域的專業(yè)詞庫,并將基于領域專業(yè)詞庫形成的文本向量作為模型輸入層。在訓練分類模型之前將數據分割為訓練集和驗證集,其比例分別為70%和30%,驗證集用來評估分類器的性能。構建HSE文本語義分析模型的步驟,見圖4。

      圖4 HSE文本語義分析模型的構建步驟Fig.4 Construction steps of HSE text semantic analysis model

      值得說明的是,由于本文訓練數量有限,因此在建立機器學習樣本時采用的是關鍵詞標注方式,這樣機器可以高效、精準地學習事故事件歸因知識,從而大大提高模型構建的效率。通過兩次模型調優(yōu)和迭代,本文最終訓練得到的分類器模型的準確率為85%、召回率為82%,模型基本可以滿足事故事件歸因信息的提取需求。

      2.4 結果可視化分析

      本文利用構建的HSE文本語義分析模型自動提取海量事故事件報告中失效屏障類型、屏障失效原因和導致屏障失效的管理因素,并通過統計其分布規(guī)律,將結果以圖像的形式直觀地展示出來,達到所見即所得的效果。

      2.5 建議與措施

      基于事故事件歸因分析結果,結合企業(yè)風險特點及其事故事件相關管理辦法,從防范事故事件發(fā)生的角度,提出了相應的防控建議與措施。

      3 實例應用與分析

      本文首先采用某油氣生產企業(yè)300個事故報告數據作為訓練樣本,構建了事故事件歸因分類器,并利用此分類器從1萬余條事故事件數據中自動提取失效屏障類型、屏障失效原因和導致屏障失效的管理因素,最后通過可視化的方式展示失效屏障類型的分布規(guī)律,并將其與屏障失效原因和導致屏障失效的管理因素進行關聯,尋找HSE管理的缺陷和短板,為持續(xù)改進HSE管理提供建議。

      3.1 失效屏障類型分析

      幾乎每起事故事件都是技術屏障和人員屏障失效疊加所導致的,圖5和圖6分別展示了不同技術屏障類型和人員屏障類型對事故事件影響的比例。

      由圖5和圖6可知:技術屏障類型中結構完整性屏障失效導致的事故事件數量最多,其導致了22%的事故事件;人員屏障類型中人員操作屏障失效導致的事故事件數量最多,其導致了59%的事故事件。

      圖5 不同技術屏障類型失效對事故事件的影響比例Fig.5 Influence ratio of different types of technical barrier failure on accidents and incidents

      圖6 不同人員屏障類型失效對事故事件的影響比例Fig.6 Influence ratio of different types of human barriers failure on accidents and incidents

      3.2 屏障失效原因分析

      本文利用熱力圖展示了事故中13類失效屏障類型與屏障失效原因之間的關聯關系,見圖7。其中,橫軸為失效屏障類型,縱軸為屏障失效原因;顏色的深淺代表了占比大小,顏色越深表明兩者之間的關聯關系越密切。

      由圖7可知:裝置/設備設計缺陷和裝置/設備運行控制缺陷分別造成了40%和19%的結構完整性屏障失效,它們是結構完整性屏障失效的關鍵原因;安全意識缺乏/疏忽/失誤和安全知識/技能不足分別造成了60%和13%的人員操作屏障失效,它們是人員操作屏障失效的關鍵原因。

      圖7 事故中失效屏障類型與屏障失效原因之間的關聯關系Fig.7 Correlation relationship between failure barrier types and barrier failure causes of accidents and incidents

      3.3 導致屏障失效的管理因素分析

      事故中失效屏障類型與導致屏障失效的管理因素之間的關聯關系,見圖8。

      圖8 事故中失效屏障類型與導致屏障失效的管理因素之間的關聯關系Fig.8 Correlation relationship between failure barrier types of accidents and incidents and management factors causing barrier failure

      由圖8可知:設備管理因素和風險防控與隱患排查治理因素分別造成了27%和11%的結構完整性屏障失效,它們是結構完整性屏障失效的關鍵管理因素;風險防控與隱患排查治理因素和教育培訓因素分別造成了31%和14%的人員操作屏障失效,它們是人員操作屏障失效的關鍵因素。

      4 結論與建議

      本文采用國際石油及天然氣行業(yè)主流的事故致因理論——屏障理論分析了事故事件調查報告數據,建立了適用于石油石化行業(yè)的HSE文本語義分析模型,并從1萬余條事故事件數據中自動提取與分析了事故事件中失效屏障類型、屏障失效原因和導致屏障失效的管理因素,得到如下結論與建議:

      (1) 59%的事故事件與人員操作屏障失效有關,22%的事故事件與結構完整性屏障失效相關;安全意識缺乏/疏忽/失誤和安全知識/技能不足是導致人員操作屏障失效的關鍵原因,裝置/設備設計缺陷和裝置/設備運行控制缺陷是導致結構完整性屏障失效的關鍵原因。

      (2) 員工教育培訓不到位和風險管控與隱患排查管理不到位分別是導致人員操作屏障失效和結構完整性屏障失效的共性管理因素,建議從事故預防的角度,采用虛擬現實技術、借助模擬操作機來切實提高員工的安全技能水平,并設計科學的員工培訓效果考核指標,減少員工違章、誤操作不安全行為,同時提高員工的風險辨識能力,加強風險隱患排查治理工作,切實減少事故的發(fā)生。

      (3) 采用本文構建的HSE文本語義分析模型,只需1 min即可實現對1萬余條事故事件報告信息的提取,而人工提取每份事故事件報告信息至少需要30 min,分析效率提高了約30萬倍,為事故事件資源價值的利用奠定了技術基礎。

      (4) 語義分析模型領域專業(yè)詞庫和事故事件樣本的全面性、均衡性、數量對模型性能指標的影響較大,未來計劃完善領域專業(yè)詞庫、補充事故事件樣本數據數量和質量,持續(xù)迭代優(yōu)化模型,以提高HSE文本語義分析模型的準確率和召回率。

      猜你喜歡
      分析模型屏障語義
      基于BERT-VGG16的多模態(tài)情感分析模型
      咬緊百日攻堅 筑牢安全屏障
      屏障修護TOP10
      一道屏障
      藝術評鑒(2020年5期)2020-04-30 06:47:57
      語言與語義
      維護網絡安全 筑牢網絡強省屏障
      人大建設(2018年10期)2018-12-07 01:13:46
      層次分析模型在結核疾病預防控制系統中的應用
      “上”與“下”語義的不對稱性及其認知闡釋
      現代語文(2016年21期)2016-05-25 13:13:44
      全啟發(fā)式語言分析模型
      認知范疇模糊與語義模糊
      九寨沟县| 隆回县| 康平县| 玉田县| 腾冲县| 十堰市| 石家庄市| 革吉县| 甘洛县| 左权县| 海阳市| 东兴市| 桃江县| 廊坊市| 临江市| 眉山市| 灵山县| 玛纳斯县| 昌平区| 克拉玛依市| 馆陶县| 六枝特区| 寿阳县| 滦平县| 海盐县| 全南县| 哈密市| 白银市| 台东市| 吕梁市| 延长县| 天全县| 桃源县| 镇安县| 五常市| 鄂托克前旗| 海晏县| 瓮安县| 钦州市| 六安市| 大埔县|