林 穿,徐啟峰,黃奕釩
(福州大學(xué) 電氣工程與自動化學(xué)院,福建 福州 350108)
電力安全事故(下文簡稱:電力事故)始終是電網(wǎng)運(yùn)行中需要關(guān)注的重點(diǎn)。在電力生產(chǎn)中,作業(yè)人員必須遵守《電業(yè)安全工作規(guī)程》等章程,但是多年來電力事故屢禁不止。據(jù)國家能源局統(tǒng)計(jì),2017年至2020年間,全國年均發(fā)生電力人身傷亡事故約42起,反映出國內(nèi)電力安全生產(chǎn)中的不足,例如:安全法規(guī)執(zhí)行不到位、預(yù)防措施不到位、預(yù)警不及時等。針對電力事故問題,《電力安全事故應(yīng)急處置和調(diào)查處理?xiàng)l例》(國務(wù)院令第599號)中明確規(guī)定事故調(diào)查處理措施:必須理清事故發(fā)生的過程、原因與事故性質(zhì),并規(guī)定事故相關(guān)單位和有關(guān)人員應(yīng)當(dāng)吸取事故教訓(xùn),防止事故再次發(fā)生。
在電力生產(chǎn)過程,眾多影響因素相互誘發(fā)、轉(zhuǎn)換、耦合,最終可能演化為電力事故。文獻(xiàn)[1]基于關(guān)聯(lián)規(guī)則挖掘電力事故的關(guān)鍵誘因,通過實(shí)例驗(yàn)證了該方法對電力生產(chǎn)安全決策控制的有效性;文獻(xiàn)[2]借鑒“海因里希法則”從隱患因素角度出發(fā),構(gòu)建安全事故比例模型用于確定未來隱患數(shù)量并進(jìn)行隱患消除;文獻(xiàn)[3]利用多級模糊評判對評價指標(biāo)量化賦權(quán),基于貝葉斯網(wǎng)絡(luò)訓(xùn)練發(fā)電企業(yè)的安全生產(chǎn)風(fēng)險預(yù)警模型,分析主要風(fēng)險因素、有針對地提出控制措施。上述方法雖然能夠預(yù)測電力事故的多種影響因素,指導(dǎo)企業(yè)做出防范,但忽略了事故發(fā)展中多種因素之間的關(guān)聯(lián)關(guān)系,未能清晰地刻畫事故發(fā)展的邏輯演化關(guān)系。
事理圖譜[4]的概念,開啟了人工智能2.0時代嶄新的研究領(lǐng)域。事理圖譜從認(rèn)知智能角度出發(fā),重點(diǎn)剖析事件之間的順承關(guān)系、因果關(guān)系和上下位等事理邏輯。相比單純靜態(tài)的實(shí)體知識圖譜,事理圖譜能夠刻畫事件的動態(tài)性,具有更強(qiáng)大的應(yīng)用價值。文獻(xiàn)[5]提出構(gòu)建事理圖譜框架,揭示突發(fā)事件新聞的演化模式和規(guī)律;文獻(xiàn)[6]針對網(wǎng)絡(luò)輿情事件摘要構(gòu)建可視化事理圖譜,從4個不同維度解讀輿情事件的演化路徑;文獻(xiàn)[7]采用深度神經(jīng)網(wǎng)絡(luò)抽取航空安全事故因果關(guān)系創(chuàng)建事理圖譜,深入分析事故發(fā)生過程;文獻(xiàn)[8]構(gòu)建政策影響事理圖譜,梳理政策對利益相關(guān)者及市場的影響,發(fā)現(xiàn)關(guān)鍵節(jié)點(diǎn)并予以控制。但事理圖譜的核心技術(shù)及應(yīng)用模式尚處于探索階段[9],在電力安全領(lǐng)域的應(yīng)用尚未取得顯著進(jìn)展。
基于此,本文以國家能源局公布的全國電力安全生產(chǎn)情況為研究對象,通過對文本數(shù)據(jù)的知識抽取、知識融合以及知識加工,采用圖數(shù)據(jù)庫Neo4j構(gòu)建電力事故事理圖譜。最后,基于事理圖譜從歷史事故演化路徑[10]以及新事故推演路徑驗(yàn)證該方法的有效性。
電力事故事理圖譜構(gòu)建包含5個階段,如圖1所示,分別為:數(shù)據(jù)獲取與預(yù)處理、抽取事件鏈與事件槽關(guān)系、泛化事件槽、構(gòu)建事理圖譜和新事件推演預(yù)測。
圖1 研究框架Fig.1 Research framework
階段1:通過python編程,獲取電力事故數(shù)據(jù),調(diào)用哈爾濱工業(yè)大學(xué)自然語言處理平臺LTP工具[11]的Pyltp模塊對文本進(jìn)行分句分詞、去除停用詞、詞性標(biāo)注和句法分析等預(yù)處理。
階段2:電力事故文本為半結(jié)構(gòu)化數(shù)據(jù),1條事故文本包含1條事故事件鏈,事件鏈由若干事件槽組成。通過設(shè)計(jì)標(biāo)識詞抽取文本中每個事故的事件鏈,依據(jù)句型結(jié)構(gòu)劃分事件槽,并編寫規(guī)則模板判斷事件槽的關(guān)聯(lián)關(guān)系。
階段3:利用Word2vec訓(xùn)練事件槽的詞向量并采用相似度計(jì)算泛化事件槽。
階段4:運(yùn)用熱力圖矩陣記錄泛化為同一類事件槽的次數(shù)權(quán)重(下文簡稱:權(quán)重),利用Neo4j圖數(shù)據(jù)庫構(gòu)建以事件槽為節(jié)點(diǎn)、事件槽的關(guān)聯(lián)關(guān)系為邊、權(quán)重為邊屬性的電力事故事理圖譜。
階段5:對于新事件,采用階段2和階段3的方式進(jìn)行事件槽泛化歸類,再利用已經(jīng)構(gòu)建的事故事理圖譜推演預(yù)測后續(xù)可能發(fā)生的事件。
電力事故文本的每1條事故描述均為半結(jié)構(gòu)化數(shù)據(jù)文本,描述了[事故概率]、[作業(yè)種類]、[事故原因]、[事故類型]和[事故結(jié)果]。其中,[作業(yè)種類]、[事故原因]、[事故類型]以及[事故結(jié)果]的句子構(gòu)成1條事件鏈,是需要保留的有效信息,而[事故概況]需要剔除。根據(jù)文本特點(diǎn),設(shè)計(jì)事件標(biāo)識詞,事件標(biāo)識詞如表1所示,用于識別事件鏈。
表1 事件標(biāo)識詞Table 1 Event identifier words
半結(jié)構(gòu)化文本事件鏈中含有明確的因果關(guān)系和順承關(guān)系,通過標(biāo)識詞的句法模式設(shè)計(jì)規(guī)則模板[12-13]的方式抽取因果事件槽對和順承事件槽對。
1.3.1 因果關(guān)系事件槽對抽取
假設(shè)電力事故事件鏈表示為E={w1,w2…,wm},是由m個詞語w組成的集合,詞性標(biāo)注后的集合為E={w1/pog1,w2/pog2,…,wm/pogm}。根據(jù)“造成、導(dǎo)致、由于”等因果關(guān)系標(biāo)識詞,設(shè)計(jì)以
表2 因果關(guān)系抽取規(guī)則模板Table 2 Rule template of causal relation extraction
1.3.2 順承關(guān)系事件槽對抽取
假設(shè)電力事故事件鏈表示為E={e1,e2…,en},是由n個事件槽e組成的集合。根據(jù)“在…時、在…期間”等順承關(guān)系標(biāo)識詞設(shè)計(jì)了以
表3 順承關(guān)系抽取規(guī)則模板Table 3 Rule template of continuation relation extraction
1.4.1 概念圖譜
通過規(guī)則模板抽取的事件槽可能屬于同一類表達(dá)含義,進(jìn)行事件槽的泛化能夠更高層次地表示出事件槽之間的關(guān)系且能簡化圖譜。實(shí)體圖譜泛化形成的概念事理圖譜的過程如圖2所示(下文所述事理圖譜均為概念事理圖譜)。例如:事件槽e31和e32經(jīng)過泛化后形成概念圖譜中的同一類事件槽e3。事件槽之間的關(guān)系用箭頭表示,箭頭邊上的數(shù)字表示泛化為同一類的事件槽權(quán)重。
圖2 概念圖譜Fig.2 Concept graph
1.4.2 相似度算法
聚類分析法常用于事件的泛化,但電力事故作業(yè)種類多、事故原因復(fù)雜,運(yùn)用聚類法時聚類簇將隨之增多,聚類簇選取困難。因此,本文改進(jìn)文獻(xiàn)[14]的句子相似度算法用于泛化電力事故事件槽。
1)詞語相似度
每個事件槽分詞后可表示為e={w1,w2,…,wi},每個分詞w通過Word2Vec可轉(zhuǎn)化為對應(yīng)的詞向量vec,通過余弦相似度計(jì)算可求得2個詞語的相似度,如式(1)所示:
(1)
式中:sim(wi,wj)為2詞語相似度;i和j為序號;vecik為詞向量veci的第k個分量值;vecjk為詞向量vecj的第k個分量值;x為詞向量分量個數(shù)。
2)事件槽相似度
文獻(xiàn)[14]的方法考慮了所有詞語,而事實(shí)上事件的每個分詞并非全部具有價值信息,必然造成信息冗余。本文在詞語相似度的基礎(chǔ)上重新定義事件槽相似度,如式(2)所示:
(2)
以國家能源局公布的2014至2020年間的307起人身傷亡事故的電力事故文本數(shù)據(jù)為研究對象。
根據(jù)事件標(biāo)識詞和規(guī)則模板提取事件鏈和事件槽,形成422條因果事件槽對和686條順承事件槽對。
泛化流程示意如圖3所示。
圖3 泛化流程示意Fig.3 Schematic diagram of generalization process
步驟1:在運(yùn)用事件槽相似度算法前,對事件槽中描述公司名、地點(diǎn)、數(shù)字和時間等干擾詞語進(jìn)行停用,提高泛化精度。
步驟2:隨機(jī)選取一事件槽,運(yùn)用式(2)計(jì)算該事件槽與其他事件槽相似度,相似度大于0.70的泛化為同一類。
步驟3:從剩余事件槽中隨機(jī)再選一事件槽,重復(fù)步驟2,完成所有事件槽的泛化。
電力事故事理圖譜的構(gòu)建采用Neo4j圖數(shù)據(jù)庫顯示[15],事件槽泛化后,共計(jì)371個節(jié)點(diǎn),553條邊,局部電力事故事理圖譜如圖4所示。
圖4 電力事故事理圖譜(局部)Fig.4 Event evolutionary graph of power accidents(partial)
基于Neo4j構(gòu)建的事理圖譜,通過Cypher語言能夠可視化查詢歷史事故發(fā)生的演化路徑。例如:在Neo4j瀏覽器界面輸入Cypher語句“MATCH p=( )←(n:‘作業(yè)種類’{name:‘線路改造’})→( )→( )→( ) RETURN p”,將顯示[線路改造]作業(yè)的事故演化路徑,如圖5所示。
由圖5可知,[線路改造]作業(yè)順承20種事故原因,其造成的事故類型有[墜落]、[觸電事故]和[燒傷]3種,可能導(dǎo)致[死亡]和[死亡重傷]2種事故結(jié)果。采用熱力圖矩陣記錄關(guān)系邊的權(quán)重,局部示意如圖6所示。
圖5 線路改造作業(yè)事故演化路徑Fig.5 Evolutionary paths of accidents in line reconstruction operation
由權(quán)重大小可以直觀把握事故的關(guān)鍵風(fēng)險節(jié)點(diǎn)。例如:由圖6可知,[線路改造]可能發(fā)生[誤入帶電間隔]、[相距不足放電]等事件槽,其中[電桿抱桿傾倒]權(quán)重10最高,可認(rèn)定為關(guān)鍵風(fēng)險點(diǎn)。事故鏈[線路改造]→[電桿抱桿傾倒]→[墜落]→[死亡]應(yīng)得到電力企業(yè)的重視,在作業(yè)前著重確認(rèn)并加固電桿抱桿的穩(wěn)定性,杜絕[墜落]事故的發(fā)生。
圖6 “作業(yè)種類—事故原因”熱力圖矩陣示意Fig.6 Schematic diagram of thermodynamic diagram matrix of “operation type” and “accident cause”
以2021年1月份公布的1起新的電力事故為例,說明基于事理圖譜的電力事故預(yù)控方案。新事故描述為:“2021年1月16日,某發(fā)電有限公司發(fā)生一起人身傷亡事故,1人死亡。該公司勞務(wù)分包單位1名作業(yè)人員,在清掃備用石膏排放輸送皮帶機(jī)上散落的石膏過程中,倒臥在備用石膏排放輸送皮帶機(jī)尾部機(jī)架上,經(jīng)搶救無效死亡?!?/p>
該事故事件鏈為[清掃備用石膏排放輸送皮帶機(jī)上散落的石膏過程](記為E1)→[倒臥在備用石膏排放輸送皮帶機(jī)尾部機(jī)架上]→[無效死亡]。新事故路徑推演和預(yù)控流程如圖7所示。
圖7 新事故推演與預(yù)控流程Fig.7 Deduction and pre-control process of new accident
將作業(yè)種類事件槽E1與所建事理圖譜中的事件槽進(jìn)行相似度計(jì)算,將匹配到[真空脫水機(jī)旁進(jìn)行下槽石膏清理]事件槽(記為E2),2者相似度為0.88。通過Cypher語言查詢E2,將顯示后續(xù)事件鏈[暈倒在人行通道上]→[死亡],該事故發(fā)生于2019年7月17日,與新事故高度相似。石膏的清理工作一般處于粉塵污染較大的環(huán)境中,作業(yè)人員容易發(fā)生暈倒、倒臥的情況,最終將引發(fā)事故發(fā)生。
基于事理圖譜的電力事故預(yù)測對提前采取防范措施、降低事故發(fā)生率有重要作用。在本例中,假設(shè)當(dāng)作業(yè)人員接到E1任務(wù)時,事先通過歷史事理圖譜的事故映射推演,獲悉面臨的暈倒風(fēng)險,作業(yè)人員與企業(yè)就能夠采取必要的預(yù)控措施,有效地抑制事故的發(fā)生。
1)以國家能源局公布的電力事故文本為研究數(shù)據(jù),應(yīng)用事件標(biāo)識詞和規(guī)則模板提取事故事件鏈、事件槽以及事件槽間的順承與因果關(guān)系,通過相似度算法泛化事件槽構(gòu)建電力事故事理圖譜。
2)通過事故事理圖譜事件槽的熱力圖矩陣權(quán)重可以捕捉到事件鏈中的關(guān)鍵風(fēng)險節(jié)點(diǎn)。
3)通過事理圖譜可以推演歷史事故的發(fā)展路徑、動態(tài)分析事故的發(fā)展過程。
4)在完成新的電力作業(yè)之前,可以通過事理圖譜推演出歷史相似事故的演化路徑,為電力作業(yè)提供風(fēng)險警示,主動制定必要的防控措施。