王明達(dá),吳志生,朱光輝,李云飛,張 榜
(1.中國(guó)石油大學(xué)(華東) 機(jī)電工程學(xué)院,山東 青島 266580;2.國(guó)家石油天然氣管網(wǎng)集團(tuán)有限公司 山東省分公司,山東 濟(jì)南 250002)
近年來,天然氣在我國(guó)工業(yè)生產(chǎn)和民用生活中大規(guī)模普及[1]。燃?xì)廨啓C(jī)作為天然氣集輸站場(chǎng)的核心動(dòng)力設(shè)備,其運(yùn)行狀態(tài)直接影響著整個(gè)長(zhǎng)輸管道的安全[2-3]。然而,燃?xì)廨啓C(jī)一旦發(fā)生故障,極易引起系統(tǒng)停機(jī)并導(dǎo)致重大安全事故的發(fā)生。燃?xì)廨啓C(jī)經(jīng)過多年的運(yùn)行維護(hù)和故障檢修,已積累大量的故障文本數(shù)據(jù),但這些故障文本數(shù)據(jù)具有分布廣泛、數(shù)據(jù)量龐大、格式規(guī)范化不統(tǒng)一等特點(diǎn),且文本中存在描述不規(guī)范等問題,加重故障知識(shí)的復(fù)雜性,導(dǎo)致維修人員難以利用現(xiàn)有的文本知識(shí)數(shù)據(jù)進(jìn)行故障診斷[4-5]。因此,本文引入知識(shí)圖譜技術(shù),將燃?xì)廨啓C(jī)故障文本知識(shí)結(jié)構(gòu)化,以實(shí)現(xiàn)對(duì)燃?xì)廨啓C(jī)故障的快速分析與診斷。
目前國(guó)內(nèi)外許多領(lǐng)域已開展故障知識(shí)圖譜構(gòu)建研究工作。Liu等[6]通過構(gòu)建鐵路操作故障因果知識(shí)圖譜,揭示故障的潛在規(guī)則,并據(jù)此提出預(yù)防措施;Tang等[7]構(gòu)建多源異構(gòu)電力設(shè)備知識(shí)圖譜,提高電力設(shè)備的管理效率,為故障診斷的應(yīng)用奠定知識(shí)基礎(chǔ);Qu等[8]構(gòu)建電力無線專網(wǎng)使用終端故障信息知識(shí)圖譜,實(shí)現(xiàn)故障診斷與決策制定;盛林等[9]利用知識(shí)圖譜將旋轉(zhuǎn)機(jī)械領(lǐng)域內(nèi)零散的知識(shí)、案例和專家經(jīng)驗(yàn)關(guān)聯(lián),并將其用于故障原因推理,輔助解決旋轉(zhuǎn)機(jī)械故障問題。上述研究利用知識(shí)圖譜技術(shù)解決數(shù)據(jù)之間信息孤立問題,并利用圖數(shù)據(jù)庫(kù)將非結(jié)構(gòu)化數(shù)據(jù)規(guī)范儲(chǔ)存,提升領(lǐng)域內(nèi)故障知識(shí)的利用率。然而上述研究大多僅對(duì)實(shí)體進(jìn)行識(shí)別,且針對(duì)燃?xì)廨啓C(jī)故障領(lǐng)域,目前尚鮮有相關(guān)的知識(shí)圖譜構(gòu)建研究。
因此,本文以燃?xì)廨啓C(jī)多維故障文本數(shù)據(jù)為例,梳理燃?xì)廨啓C(jī)故障文本知識(shí)體系,構(gòu)建基于深度學(xué)習(xí)的燃?xì)廨啓C(jī)故障知識(shí)圖譜,進(jìn)行燃?xì)廨啓C(jī)故障實(shí)體及實(shí)體關(guān)系抽取,實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化存儲(chǔ)與管理,通過Neo4j圖數(shù)據(jù)庫(kù)進(jìn)行可視化分析,并將其運(yùn)用于輔助故障診斷,以期為故障維修人員提供知識(shí)支持。
知識(shí)圖譜是1種基于圖模型描述知識(shí)與客觀事物間的關(guān)聯(lián)關(guān)系的技術(shù)手段,由節(jié)點(diǎn)和邊組成[10]。知識(shí)圖譜的構(gòu)建需要結(jié)合具體的領(lǐng)域場(chǎng)景、語義模型與業(yè)務(wù)模型,其構(gòu)建方式分為自頂向下和自底向上2種[11]。燃?xì)廨啓C(jī)故障知識(shí)圖譜構(gòu)建采用自頂向下和自底向上相結(jié)合的方式,如圖1所示。
圖1 故障知識(shí)圖譜構(gòu)建流程Fig.1 Process of fault knowledge graph construction
燃?xì)廨啓C(jī)故障知識(shí)圖譜的構(gòu)建分為2層,即模式層構(gòu)建和數(shù)據(jù)層構(gòu)建。首先,根據(jù)數(shù)據(jù)源的種類不同將其分為設(shè)備結(jié)構(gòu)知識(shí)、故障分析知識(shí)與設(shè)備維護(hù)知識(shí)3類,并根據(jù)領(lǐng)域數(shù)據(jù)的特點(diǎn)建立故障知識(shí)的本體表達(dá)模型,此工作即知識(shí)圖譜模式層的構(gòu)建。然后,在設(shè)備資料等外部知識(shí)的指導(dǎo)下完成對(duì)抽取的半自動(dòng)化標(biāo)注以減輕人力和時(shí)間的消耗,并利用自然語言處理從故障文本中進(jìn)行實(shí)體與關(guān)系的抽取,完成知識(shí)抽取即數(shù)據(jù)層的構(gòu)建工作。最后,將實(shí)體與關(guān)系按照本體層的模式存入Neo4j圖數(shù)據(jù)庫(kù),可視化并完成知識(shí)圖譜的相關(guān)應(yīng)用。
燃?xì)廨啓C(jī)故障領(lǐng)域知識(shí)包括設(shè)備結(jié)構(gòu)知識(shí)、設(shè)備維護(hù)知識(shí)、故障分析知識(shí)3類,具體選用要素如表1所示。設(shè)備結(jié)構(gòu)知識(shí)包括設(shè)計(jì)原理圖、使用說明書等資料,從中提取的結(jié)構(gòu)知識(shí)可為燃?xì)廨啓C(jī)的故障診斷與日常維護(hù)工作提供支持;設(shè)備維護(hù)知識(shí)包括設(shè)備工作狀態(tài)、故障診斷知識(shí)、維修經(jīng)驗(yàn)等,從中提取的維護(hù)知識(shí)可為現(xiàn)場(chǎng)的設(shè)備維護(hù)與故障診斷工作提供輔助決策;故障分析知識(shí)包括專家經(jīng)驗(yàn)知識(shí)、FMEA、故障案例、FTA等,從中提取的分析知識(shí)能夠?yàn)楝F(xiàn)場(chǎng)設(shè)備維修人員提供知識(shí)支持。
表1 燃?xì)廨啓C(jī)故障多源數(shù)據(jù)Table 1 Multi-source data of gas turbine fault
故障知識(shí)本體概念類別劃分主要是針對(duì)故障部件及其屬性類別的劃分和定義,根據(jù)故障分析(FMECA)數(shù)據(jù),故障知識(shí)本體O由1個(gè)或多個(gè)零部件故障F構(gòu)成,其結(jié)構(gòu)信息可描述為式(1):
O∈{∑Fc∪∑Ftr∪∑Ftl∪∑Fs}
(1)
式中:Fc為復(fù)雜型零部件故障;Ftr為反向樹形零部件故障;Ftl為正向樹形零部件故障;Fs為單串鏈形零部件故障。
1個(gè)完整的部件故障信息F由5個(gè)要素組成,其結(jié)構(gòu)描述如式(2)所示:
F∈{E,T,R,I,L}
(2)
式中:E為故障設(shè)備;T為故障模式;R為故障原因;I為故障影響;L為風(fēng)險(xiǎn)等級(jí)。
故障知識(shí)本體是指與燃?xì)廨啓C(jī)故障知識(shí)有關(guān)的概念與屬性的規(guī)范化定義[12]。知識(shí)圖譜的模式層通常使用本體庫(kù)進(jìn)行管理,本體中的概念與關(guān)系決定知識(shí)圖譜中的概念節(jié)點(diǎn)和關(guān)聯(lián)關(guān)系,是構(gòu)建知識(shí)圖譜的重要依據(jù),相當(dāng)于知識(shí)庫(kù)中的模具。
常用的本體構(gòu)建方法有TOVE法、骨架法和七步法等[13]。本文結(jié)合骨架法與七步法2種本體構(gòu)建流程,構(gòu)建多維故障知識(shí)本體表達(dá)模型,其構(gòu)建的具體過程包括:1)確定燃?xì)廨啓C(jī)故障領(lǐng)域的研究范圍、本體需求;2)檢查是否存在燃?xì)廨啓C(jī)故障本體,并考慮是否可以重用。如可重用,則可在已有本體模型基礎(chǔ)上進(jìn)行擴(kuò)展補(bǔ)充,反之則需要重新構(gòu)建本體模型;3)對(duì)領(lǐng)域知識(shí)進(jìn)行分類,并使用統(tǒng)一的術(shù)語描述概念;4)定義概念間的層次關(guān)系,明確其層次結(jié)構(gòu);5)定義類的屬性和約束關(guān)系,包括對(duì)象屬性與數(shù)據(jù)屬性;6)對(duì)構(gòu)建的燃?xì)廨啓C(jī)故障領(lǐng)域本體模型質(zhì)量進(jìn)行評(píng)估,包括本體的語義沖突和領(lǐng)域知識(shí)相符2方面,此過程依賴于專家(人工)檢查以保證本體中知識(shí)表示的準(zhǔn)確性;7)實(shí)例填充以完成知識(shí)管理系統(tǒng)的底層構(gòu)建。經(jīng)過此過程,最終構(gòu)建1個(gè)具有實(shí)用性、通用性的燃?xì)廨啓C(jī)故障知識(shí)本體模型,具體如圖2所示。
知識(shí)抽取技術(shù)包括命名實(shí)體識(shí)別與關(guān)系抽取,目的是從文本中提取關(guān)鍵信息的技術(shù),在知識(shí)圖譜構(gòu)建過程中指抽取文本中的目標(biāo)實(shí)體、屬性與關(guān)系等信息[14]。
1.5.1 命名實(shí)體識(shí)別
燃?xì)廨啓C(jī)故障文本中包含大量有用的知識(shí)信息,而實(shí)體識(shí)別的目的就是將文本中有價(jià)值的實(shí)體信息識(shí)別并標(biāo)注[15]。按照上文定義的實(shí)體概念類型進(jìn)行識(shí)別和標(biāo)注,本文采用基于混合神經(jīng)網(wǎng)絡(luò)的BERT-BiLSTM-CRF命名實(shí)體識(shí)別模型,其模型架構(gòu)如圖3所示。圖3中Ei指輸入的字;Ti為模型輸出結(jié)果;Trm(Transformer)為編碼模塊;ht為L(zhǎng)STM單元的輸出結(jié)果;pt為隱;Y={Y1,Y2,…,Yt}為標(biāo)簽序列。
圖3 BERT-BiLSTM-CRF命名實(shí)體識(shí)別模型Fig.3 BERT-BiLSTM-CRF named entity recognition model
BERT-BiLSTM-CRF模型包括4部分:1)預(yù)處理文本數(shù)據(jù),包括文本清洗、去停用詞等步驟;2)引入BERT模型作為故障文本的字符向量化表示,表示結(jié)果用于BiLSTM層的輸入;3)采用BiLSTM模型獲取上下文的特征向量,輸出命名實(shí)體識(shí)別的結(jié)果,并作為CRF層的輸入;4)使用CRF模型輸出預(yù)測(cè)實(shí)體類別結(jié)果。其中,對(duì)一部分的故障文本數(shù)據(jù)的文本預(yù)處理流程具體如下:1)文本清洗:即分詞,采用Jieba分詞工具,并結(jié)合自構(gòu)建的燃?xì)廨啓C(jī)設(shè)備故障專業(yè)詞庫(kù),確保分詞結(jié)果的準(zhǔn)確性;2)去停用詞:即去除文本中的空格、標(biāo)點(diǎn)符號(hào)等干擾數(shù)據(jù),以及去除無實(shí)際意義的字符,如“的”、“在”、“了”等,從而提升模型訓(xùn)練的效率;3)實(shí)體標(biāo)注:本文采用BMEO序列標(biāo)注法,部分標(biāo)注標(biāo)簽類型如表2所示。以故障設(shè)備(fault equipment,EQU)為例,“B”為“Begin”,表示實(shí)體的第1個(gè)字符;“M”為“Middle”,表示實(shí)體字符中部的字符;“E”為“End”,表示實(shí)體字符的最后1個(gè)字;“EQU”表示該實(shí)體的名稱縮寫標(biāo)簽。
表2 實(shí)體標(biāo)注示例(部分)Table 2 Example of entity annotation (part)
1.5.2 關(guān)系抽取
完成實(shí)體抽取后,需要建立實(shí)體間的關(guān)系和實(shí)體屬性間的關(guān)系,從故障文本中抽取得到關(guān)系的過程即為關(guān)系抽取[16]?;谏疃葘W(xué)習(xí)的關(guān)系抽取方法在提高關(guān)系分類效率與準(zhǔn)確度方面具有很大的優(yōu)勢(shì),因此本文在前者命名實(shí)體識(shí)別模型的基礎(chǔ)上,引入Attention模型替代CRF模型來實(shí)現(xiàn)關(guān)系抽取。
與實(shí)體識(shí)別模型類似,用于關(guān)系抽取的數(shù)據(jù)源于已經(jīng)完成實(shí)體識(shí)別的數(shù)據(jù)。根據(jù)知識(shí)圖譜“<實(shí)體-關(guān)系-實(shí)體>”和“<實(shí)體-屬性-屬性值>”的表述方式,將故障訓(xùn)練語料按照“頭實(shí)體-關(guān)系-尾實(shí)體”的形式整理,基于關(guān)系抽取的故障文本預(yù)處理規(guī)程,具體如表3所示。
從文本中抽取得到的知識(shí)一般含有大量的模糊和冗余的信息,且存在較多的語義相似,如“壓縮機(jī)”,雖在不同文本中表述相同,但是具體屬性、規(guī)格等信息不同,實(shí)質(zhì)表示2種不同實(shí)體。
本文采用計(jì)算概念名稱相似度、屬性相似度和綜合相似度相結(jié)合的方式計(jì)算燃?xì)廨啓C(jī)故障文本中實(shí)體的相似度,通過設(shè)定閾值判斷實(shí)體是否具有相同含義,實(shí)現(xiàn)知識(shí)融合,其對(duì)應(yīng)的計(jì)算步驟如下。
1)步驟1:計(jì)算概念名稱相似度。
本文采用ISub字符串映射算法判斷全局本體概念與局部本體概念的名稱相似度如式(3)所示。對(duì)于給定的全局本體概念cG和局部本體概念cL,首先對(duì)其進(jìn)行序列化與去冗余處理,然后進(jìn)行相似度計(jì)算。
(3)
(4)
式中:bG表示全局本體中概念字符串;bL表示局部本體中概念字符串;comm(bG,bL)表示概念字符相同的部分;diff(bG,bL)表示概念字符不同的部分;winkler表示修正系數(shù)。
2)步驟2:計(jì)算實(shí)體的屬性相似度。
(5)
式中:SA為屬性相似度;wi是屬性權(quán)重。
3)步驟3:計(jì)算實(shí)體綜合相似度。
在名稱相似度算法與屬性相似度算法的基礎(chǔ)上,提出綜合相似度(SF(cL,cG))算法,具體計(jì)算如式(6)所示,以提升實(shí)體融合的準(zhǔn)確性。
(6)
式中:WN為名稱相似度權(quán)值;WA為屬性相似度權(quán)值。
查找目標(biāo)實(shí)體的概念,計(jì)算概念名稱相似度、概念綜合相似度與屬性相似度,對(duì)知識(shí)抽取得到的實(shí)體信息與屬性信息進(jìn)行融合,并設(shè)定閾值,若2個(gè)實(shí)體的綜合相似度大于設(shè)定閾值,則進(jìn)行融合,否則將這2個(gè)實(shí)體分別儲(chǔ)存。
本文使用圖數(shù)據(jù)庫(kù)Neo4j實(shí)現(xiàn)對(duì)燃?xì)廨啓C(jī)故障文本數(shù)據(jù)的存儲(chǔ)工作。相較于傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù),Neo4j圖數(shù)據(jù)庫(kù)能夠高效地實(shí)現(xiàn)節(jié)點(diǎn)與關(guān)系查詢,且基于Cypher語言的查詢與管理機(jī)制,能夠較為容易實(shí)現(xiàn)Web端的開發(fā)與應(yīng)用[17]。
本文采用的燃?xì)廨啓C(jī)故障文本數(shù)據(jù)集由600份故障記錄文本和960條故障分析文本組成。將數(shù)據(jù)語料按照4∶1∶1的比例劃分為訓(xùn)練集、測(cè)試集和驗(yàn)證集,即隨機(jī)選取400份故障文本與560條故障分析記錄用于訓(xùn)練BERT-BiLSTM-CRF命名實(shí)體識(shí)別模型與BERT-BiLSTM-Attention關(guān)系抽取模型。
抽取結(jié)果準(zhǔn)確性的評(píng)價(jià)方法采用深度學(xué)習(xí)領(lǐng)域常用的正樣本與負(fù)樣本評(píng)價(jià)方法,評(píng)價(jià)指標(biāo)包括精確度(precision)、召回率(recall)和綜合評(píng)價(jià)指標(biāo)F1值,計(jì)算公式如式(7)所示:
(7)
式中:TP表示模型預(yù)測(cè)正確且標(biāo)注正確的樣本數(shù)量;FP表示模型預(yù)測(cè)錯(cuò)誤但標(biāo)注正確的樣本數(shù)量;FN表示模型預(yù)測(cè)錯(cuò)誤且標(biāo)注錯(cuò)誤的樣本數(shù)量。
為驗(yàn)證基于深度學(xué)習(xí)的BERT-BiLSTM-CRF命名實(shí)體識(shí)別模型對(duì)燃?xì)廨啓C(jī)故障文本中實(shí)體識(shí)別的有效性,本文選取BiLSTM-CRF模型,BERT-CRF模型和Word2Vec-BiLSTM-CRF模型進(jìn)行對(duì)比分析。實(shí)驗(yàn)過程中,均使用相同的訓(xùn)練數(shù)據(jù)、測(cè)試數(shù)據(jù)和相同的實(shí)驗(yàn)環(huán)境,不同模型的實(shí)驗(yàn)結(jié)果如圖4所示。
圖4 各模型耗損收斂對(duì)比Fig.4 Comparison of depletion convergence of each model
由圖4可知,4種模型迭代次數(shù)在30~50次時(shí)趨于穩(wěn)定,且本文構(gòu)建的BERT-BiLSTM-CRF模型較之于BiLSTM-CRF等對(duì)比模型訓(xùn)練LOSS值更低,性能更高,其模型的精確度、召回率和F1值的平均值分別達(dá)到93.84%,95.07%,94.44%,實(shí)體抽取對(duì)比如表4所示。
與BiLSTM-CRF模型相比,BERT-BiLSTM-CRF的F1值提高7.98個(gè)百分點(diǎn),這是因?yàn)锽ERT模型能夠獲取動(dòng)態(tài)字符,在一定程度上增強(qiáng)BiLSTM模型獲取上下文的能力,因而能夠最大程度提取文本中的復(fù)雜特征。而與Word2Vec方式相比,BERT-BiLSTM-CRF模型的F1值提高0.89個(gè)百分點(diǎn),這可能與實(shí)驗(yàn)過程中引入燃?xì)廨啓C(jī)故障詞庫(kù)的原因有關(guān)。同時(shí),基于BERT模型的字符嵌入是1種動(dòng)態(tài)嵌入方式,相較于Word2Vec的靜態(tài)嵌入方法,能夠有效解決一詞多義的問題。
BERT模型是1種預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型,不同于Word2Vec需要依靠大量訓(xùn)練才能生成準(zhǔn)確的詞向量,在文本數(shù)量有限的情況下,該模型就能取得較好的訓(xùn)練效果。BERT-CRF模型的精確度達(dá)到81.22%,而增加雙向長(zhǎng)短期記憶網(wǎng)絡(luò)的BERT-BiLSTM-CRF模型,進(jìn)一步提取上下文序列特征,其精確度等指標(biāo)均有10個(gè)百分點(diǎn)左右的提升。因此,本文提出的命名實(shí)體識(shí)別模型較對(duì)比模型的實(shí)驗(yàn)效果好。
同時(shí),為驗(yàn)證本文提出的BERT-BiLSTM-Attention關(guān)系抽取模型的準(zhǔn)確性,進(jìn)行1組對(duì)比實(shí)驗(yàn)。BERT模型在已公開的數(shù)據(jù)集知識(shí)抽取實(shí)驗(yàn)中已取得顯著效果,但在燃?xì)廨啓C(jī)故障數(shù)據(jù)關(guān)系抽取工作中還未開展應(yīng)用,故本文選擇BiLSTM-Attetion模型、BiLSTM-CRF模型與研究模型進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表5所示。
表5 關(guān)系抽取模型對(duì)比實(shí)驗(yàn)分析Table 5 Comparative experimental analysis of relation extraction models 單位:%
由表5可知,相較于BiLSTM-CRF,BiLSTM-Attention,BERT-BiLSTM-Attention模型能夠更好地捕捉文本中的長(zhǎng)距離依賴關(guān)系,因此在處理長(zhǎng)文本任務(wù)時(shí)可能具有更高的準(zhǔn)確性。BERT-BiLSTM-Attention模型較BiLSTM-CRF模型、BiLSTM-Attention模型取得更好的結(jié)果,其F1值分別提高8.49個(gè)百分點(diǎn)和5.73個(gè)百分點(diǎn)。
BERT-BiLSTM-Attention關(guān)系抽取具體結(jié)果如表6所示。由表6可知,本文提出的BERT-BiLSTM-Attention模型能較好地對(duì)故障文本中的實(shí)體關(guān)系進(jìn)行抽取,尤其對(duì)“從屬”、“原因”、“位于”類型的關(guān)系抽取效果較好,這可能與引入燃?xì)廨啓C(jī)故障專業(yè)詞匯信息有關(guān)。
表6 BERT-BiLSTM-Attention模型關(guān)系抽取結(jié)果Table 6 BERT-BiLSTM-Attention model relation extraction results
按照知識(shí)融合算法流程,參考關(guān)鍵字檢索方法,實(shí)驗(yàn)中將融合結(jié)果分為3類。A類:實(shí)體融合正確,即相同含義的實(shí)體全部融合;B類,實(shí)體融合錯(cuò)誤,即融合2個(gè)不同含義的實(shí)體;C類:實(shí)體未融合,即相同含義的實(shí)體未被融合。以“故障處理措施”和“故障設(shè)備”2類實(shí)體進(jìn)行融合為例,經(jīng)過多次實(shí)驗(yàn)表明,相似度計(jì)算閾值w=0.6時(shí)效果最好,實(shí)驗(yàn)結(jié)果如表7所示。
表7 關(guān)鍵字融合與相似度融合結(jié)果對(duì)比Table 7 Comparison of keyword fusion and similarity fusion results
將燃?xì)廨啓C(jī)故障文本中抽取得到的實(shí)體與關(guān)系,分別作為Neo4j圖數(shù)據(jù)中的節(jié)點(diǎn)與連接節(jié)點(diǎn)的邊,以完成燃?xì)廨啓C(jī)故障知識(shí)圖譜的構(gòu)建工作。
燃?xì)廨啓C(jī)故障知識(shí)圖譜由設(shè)備結(jié)構(gòu)知識(shí)、設(shè)備維護(hù)數(shù)據(jù)和故障分析數(shù)據(jù)3類數(shù)據(jù)文本組成,能夠提供故障處理經(jīng)驗(yàn)、設(shè)備可靠性等多方面的知識(shí),因而能夠應(yīng)對(duì)大型復(fù)雜機(jī)械設(shè)備的故障診斷任務(wù)。以PGT25+SAC/PCL800系列燃驅(qū)壓縮機(jī)組輔助組成系統(tǒng)中“壓氣機(jī)異常振動(dòng)”故障為例獲取有關(guān)故障信息的多維數(shù)據(jù),得到該故障的圖譜如圖5所示。圖5中包含導(dǎo)致壓氣機(jī)異常振動(dòng)的可能原因、發(fā)生概率以及對(duì)應(yīng)的故障處理措施。
通過圖5可逐個(gè)分析故障原因,如通過檢查X20-3號(hào)端子的輸出電壓大小來判斷是否為傳感器損壞導(dǎo)致的異常震動(dòng),同樣的方式可以判斷信號(hào)回路是否故障。但有些故障原因無法提供故障數(shù)據(jù),如閥門的故障率。因此,有必要參考設(shè)備的故障率輔助故障診斷,尤其是當(dāng)僅靠傳感器數(shù)據(jù)不能確定部分設(shè)備故障原因時(shí),可參考?xì)v史故障率。
綜上,本文構(gòu)建的燃?xì)廨啓C(jī)故障知識(shí)圖譜能夠?yàn)楝F(xiàn)場(chǎng)工作人員的故障處理工作提供多維的綜合數(shù)據(jù)支持,輔助現(xiàn)場(chǎng)工作人員對(duì)設(shè)備進(jìn)行綜合故障分析,在一定程度上使人員擺脫對(duì)知識(shí)、經(jīng)驗(yàn)的依賴,降低知識(shí)獲取的門檻。同時(shí),減少故障發(fā)生對(duì)設(shè)備的停機(jī)時(shí)間的影響。
1)以燃?xì)廨啓C(jī)多維故障文本數(shù)據(jù)為對(duì)象,分析并構(gòu)建燃?xì)廨啓C(jī)故障知識(shí)本體,研究多維故障文本數(shù)據(jù)知識(shí)圖譜構(gòu)建方法。
2)提出的燃?xì)廨啓C(jī)領(lǐng)域知識(shí)實(shí)體與關(guān)系抽取方法,能夠?qū)Ψ墙Y(jié)構(gòu)故障文本自動(dòng)化知識(shí)抽取,同時(shí)解決傳統(tǒng)故障知識(shí)庫(kù)構(gòu)建中人工依賴度強(qiáng)、代價(jià)高且規(guī)模有限的問題,提高領(lǐng)域內(nèi)故障知識(shí)的利用率和共享率。
3)采用Neo4j數(shù)據(jù)庫(kù)將燃?xì)廨啓C(jī)故障知識(shí)圖譜進(jìn)行可視化分析,可以進(jìn)行快速的數(shù)據(jù)查詢與分析,大大提高人工檢索的效率。
4)本文所構(gòu)建的故障知識(shí)圖譜還存在一些不足,如FMECA數(shù)據(jù)和故障文本僅依靠集輸站場(chǎng)提供,導(dǎo)致知識(shí)的全面性有所下降。在后續(xù)的研究中,還將進(jìn)一步擴(kuò)展數(shù)據(jù)來源并動(dòng)態(tài)更新知識(shí)圖譜,并研究知識(shí)圖譜在燃驅(qū)壓縮機(jī)組故障診斷領(lǐng)域的應(yīng)用。
中國(guó)安全生產(chǎn)科學(xué)技術(shù)2023年11期