李玲 ,趙嵩正
1.航空工業(yè)第一飛機(jī)設(shè)計研究院,陜西 西安 710089
2.西北工業(yè)大學(xué),陜西 西安 710072
隨著科學(xué)技術(shù)的不斷發(fā)展,現(xiàn)代航空設(shè)備結(jié)構(gòu)越來越復(fù)雜,自動化和智能化程度也不斷提升,可靠性要求也越來越高,一旦發(fā)生故障,將可能造成人身傷亡和巨大的經(jīng)濟(jì)損失。因此,航空設(shè)備故障診斷系統(tǒng)的作用愈發(fā)重要。故障診斷系統(tǒng)又稱為專家診斷系統(tǒng),是一種智能化應(yīng)用系統(tǒng),基于知識庫模擬人類思維方式來解決問題[1]。
故障診斷系統(tǒng)于20世紀(jì)90年代在國外興起,近年來,受到了國內(nèi)學(xué)者的廣泛關(guān)注。王磊研究故障診斷的知識表示,采用拓?fù)渲R表示,運用Petri進(jìn)行知識推理,也證實了該方法在實際應(yīng)用中可以提高診斷效率和精確度[2];宗群提出了基于故障樹的電梯故障診斷方法,建立了診斷系統(tǒng)模型和診斷知識庫,開發(fā)了基于故障樹的電梯故障診斷系統(tǒng)[3];李紅衛(wèi)提出多種智能故障診斷技術(shù),并對各種診斷技術(shù)進(jìn)行分析和改進(jìn),并對各種診斷技術(shù)給出綜合評價[4]。雖然國內(nèi)對診斷系統(tǒng)已經(jīng)有了廣泛的研究,但是在航空設(shè)備故障管理領(lǐng)域的研究尚處于初級階段,仍存在著一些不足,主要表現(xiàn)為:首先,在現(xiàn)行航空設(shè)備故障管理模式中,較多以整臺設(shè)備為管理對象,沒有精確到部位,無法實現(xiàn)航空設(shè)備保養(yǎng)、維修、故障處理的精細(xì)化管理。其次,在航空設(shè)備故障診斷系統(tǒng)中,故障診斷知識獲取困難,亟待解決。最后,現(xiàn)有的航空設(shè)備故障診斷系統(tǒng)主要針對故障診斷,而缺乏基于故障診斷信息的故障預(yù)測、預(yù)防以及故障數(shù)據(jù)挖掘的研究,沒有提出一個專門面向設(shè)備故障全生命周期的故障診斷模型。針對現(xiàn)有研究的不足,本文引入了設(shè)備物料清單(Bill Of Material,BOM),構(gòu)建了一個基于BOM的故障診斷系統(tǒng)模型,旨在能夠?qū)崿F(xiàn)航空設(shè)備故障的全生命周期管理。
構(gòu)建的基于BOM的故障診斷系統(tǒng)模型,如圖1所示。
基于BOM的故障診斷系統(tǒng)主要由知識庫、知識維護(hù)系統(tǒng)、推理機(jī)、數(shù)據(jù)挖掘系統(tǒng),以及人機(jī)系統(tǒng)界面組成,其中,知識庫、推理機(jī)和數(shù)據(jù)挖掘系統(tǒng)是診斷系統(tǒng)的核心組成部分。知識庫主要用于儲存和管理領(lǐng)域?qū)<业慕?jīng)驗與知識,知識庫建立的完善性、可靠性決定了整個診斷系統(tǒng)的性能。推理機(jī)采用一定的編碼程序,以知識庫為推理依據(jù),由輸入的故障信息進(jìn)行推理,最終獲得故障解決措施。數(shù)據(jù)挖掘主要用于分析知識庫的故障記錄,挖掘潛在價值。
圖1 故障診斷系統(tǒng)模型Fig.1 The fault diagnosis model
基于BOM的故障診斷系統(tǒng)的基本工作流程為:(1)基于故障樹分析來獲取知識,并將數(shù)據(jù)存入知識庫中;(2)用戶通過人機(jī)界面接口向診斷系統(tǒng)輸入故障數(shù)據(jù),推理機(jī)根據(jù)正向推理機(jī)制,激活相應(yīng)的規(guī)則,進(jìn)而給出診斷結(jié)果,并提供故障解決措施;(3)基于診斷過程和診斷結(jié)果對知識庫進(jìn)行定期更新和完善;(4)基于知識庫開展知識挖掘和分析。
因此,可以看出,基于BOM的故障診斷系統(tǒng)涉及到三個核心過程,即知識獲取、知識推理和知識挖掘。知識獲取主要是對相關(guān)領(lǐng)域?qū)<抑R的獲取和故障實例的收集;知識推理是根據(jù)用戶提供的信息或根據(jù)推理策略對知識庫中的知識進(jìn)行選擇;知識挖掘是對知識庫中的故障信息進(jìn)行分析,從而發(fā)現(xiàn)潛在的有用信息。
目前,故障診斷技術(shù)大致可以分為三類[5]:基于信號處理的故障診斷方法、基于解析模型方法,以及基于知識診斷方法。隨著人工智能技術(shù)等前沿學(xué)科的發(fā)展與突破,基于知識的診斷方法成為研究熱點。目前,基于知識診斷的方法大多采用故障樹分析法(Failure Tree Analysis,F(xiàn)TA)獲取故障知識。FTA是一種自上而下逐層分析展開的圖形表示方法,其將引起系統(tǒng)故障的所有因素從面到點逐級細(xì)化,以故障模式影響與后果分析為基礎(chǔ),以系統(tǒng)的某個狀態(tài)為著眼點,尋找導(dǎo)致系統(tǒng)故障或者子系統(tǒng)失效的所有可能原因[6]。然而,目前故障樹的建立一般都是依據(jù)專家經(jīng)驗,分析頂事件發(fā)生的原因,逐層分析,找出每層事件,直到找出底事件為止[7]。運用專家經(jīng)驗構(gòu)建故障樹,要求專家對設(shè)備非常熟悉,然而專家難以提供完整的故障信息,故障知識獲取較為困難,因此,具有一定的局限性。為了解決知識獲取困難的問題,本文基于BOM構(gòu)建故障樹,從而完整地提供了整個航空設(shè)備的故障信息。一般來說,故障樹分析可以分為三個步驟:故障樹建立、故障樹定性分析和故障樹定量分析。
BOM是一種描述產(chǎn)品組成的結(jié)構(gòu),是指產(chǎn)品結(jié)構(gòu)的技術(shù)性描述文件,描述了產(chǎn)品各個部件、組件、零件之間的結(jié)構(gòu)關(guān)系和數(shù)量關(guān)系[8]。產(chǎn)品的結(jié)構(gòu)、功能特性、加工工藝在設(shè)計階段已經(jīng)確定,按照設(shè)計給出的加工工藝一步一步地進(jìn)行生產(chǎn),進(jìn)而形成產(chǎn)品的層次結(jié)構(gòu)。這一層一層的結(jié)構(gòu)決定了故障傳達(dá)的路徑,為找出故障樹的因果關(guān)系提供了基礎(chǔ)。在進(jìn)行故障診斷時,不僅需要了解設(shè)備的組成結(jié)構(gòu),由哪些組件組成,更重要的是獲取每個元件具有的故障模式以及故障之間的傳遞規(guī)則和邏輯關(guān)系,應(yīng)采取的故障處理措施。因此,本文將設(shè)備結(jié)構(gòu)和每個元件具有的故障信息結(jié)合起來,提出了基于設(shè)備BOM構(gòu)建故障樹的思想,如圖2所示。
圖2表示了如何在設(shè)備BOM的基礎(chǔ)上構(gòu)建故障樹,BOM和故障樹在層次結(jié)構(gòu)關(guān)系上一一對應(yīng),基于BOM組織故障知識,將故障知識準(zhǔn)確地映射到相應(yīng)的部位上。圖2中左側(cè)為設(shè)備BOM,根據(jù)設(shè)備的維修要求和故障特點,以設(shè)備BOM為基礎(chǔ),對診斷對象進(jìn)行結(jié)構(gòu)分解,直到不能再分解為止,對于不可拆卸的零件則不需要展開。故障樹中對于每個節(jié)點分別附有節(jié)點基本信息和節(jié)點故障信息。其中,節(jié)點基本信息具體包括節(jié)點名稱、型號、參數(shù)、功能等;故障信息具體包括該節(jié)點的故障模式、故障診斷規(guī)則以及相應(yīng)的故障解決措施,而診斷規(guī)則的建立是知識庫的關(guān)鍵部分,診斷規(guī)則體現(xiàn)了故障的傳遞規(guī)則以及對其父節(jié)點的影響程度。
故障樹定性分析是確定割集和最小割集,割集是一些底事件的集合,它可以導(dǎo)致頂事件的發(fā)生[9]。求割集一般有下行法和上行法兩種方法,本文采用上行法。上行法是沿著故障樹,采用從下向上的方式,由最底層的底事件開始,向上逐層進(jìn)行集合運算。如果遇到邏輯或門事件,則表示為事件的并運算。如果遇到邏輯與門事件,則表示為事件和交運算。按照這種方法,自下而上層層匯總,最終用布爾(Boole)函數(shù)的形式表示頂事件與底事件之間的關(guān)系。
以圖2為例,采用上行法來對故障樹進(jìn)行定性分析,可以得到:
圖2 基于BOM構(gòu)建故障樹Fig.2 Build a fault tree based on BOM
G1=X1∪G4∪X2
G2=G5∪X3
G3=X4∪X5∪X6
G4=X7∪X8
G5=X9∪X10∪X11
T1=X1∪X2∪X3∪X4∪X5∪X6∪X7∪X8∪X9∪X10∪X11
即 X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,X11 構(gòu)成故障樹的最小割集。
故障樹定量分析的目的是求出系統(tǒng)的性能指標(biāo)和頂事件發(fā)生的概率[10]。根據(jù)底事件發(fā)生故障的頻率計算出底事件的故障發(fā)生概率,然后由底事件發(fā)生的概率求出最小割集發(fā)生的概率和頂事件發(fā)生的概率,得出各個最小割集的重要度,考慮到部件排查耗時因素,本文最終采用故障判明效時比來確定優(yōu)先級,并作為故障排查順序,進(jìn)而提高故障診斷效率。以圖2為例,具體分析如下:
(1)頂事件發(fā)生的概率
假設(shè)各個底事件故障發(fā)生的概率為:X1=0.1,X2=0.2,X3=0.3,X4=0.2,X5=0.3,X6=0.1,X7=0.25,X8=0.1,X9=0.2,X10=0.1,X11=0.4,則計算的T1發(fā)生的概率為:
(2)最小割集的重要度
最小割集重要度的計算即是最小割集發(fā)生的概率與頂事件發(fā)生概率的比值。最小割集的重要度見表1。
表1 最小割集的重要度Table1 The important degree of minimum cut set
(3)估算各個零部件平均故障檢測時間
零部件平均故障檢測時間是指該零部件發(fā)生故障時,從檢測開始到排除故障所用的平均時間[11]。在實際應(yīng)用中,一般是根據(jù)專家經(jīng)驗給出。
假設(shè)各個底事件平均故障檢測時間為:T1=0.2h,T2=0.1h,T3=0.3h,T4=0.15h,T5=0.3h,T6=0.2h,T7=0.1h,T8=0.1h,T9=0.3h,T10=0.3h,T11=0.1h。
(4)求各底事件對應(yīng)的故障判明效時比
當(dāng)系統(tǒng)發(fā)生故障時,借助故障樹進(jìn)行診斷,首先根據(jù)底事件的概率計算出重要度,可以初步確定故障原因。按照重要度從大到小的順序逐個排查,但是如果排在前幾位的故障零部件平均檢查耗時較長,那么平均單位檢測時間確定故障概率則偏低,效率較低。因此,為了全面合理地進(jìn)行故障排除,在考慮重要度時引入各個零部件平均檢查時間,即提出了故障判明效時比,判明效時比為零部件重要度與零部件對應(yīng)的平均故障檢測時間的比值,見表2。因此,排查故障的順序應(yīng)該按照故障判明效時比,由大到小按順序進(jìn)行排查,這樣會很大程度地提高定位故障原因的效率。
表2 最小割集的判明效時比Table2 The ascertain effect of the minimum cut set
根據(jù)故障判明效時比從大到小的順序得出故障診斷的優(yōu)先級,故障判明效時比值越大,則對應(yīng)的優(yōu)先級越高,則優(yōu)先進(jìn)行故障診斷。這樣可以高效地定位引起頂事件發(fā)生的故障原因,縮小故障診斷的時間。
系統(tǒng)知識庫是以故障樹的形式將設(shè)備維修過程中維修專家的大量故障解決措施和診斷經(jīng)驗直觀形象地表達(dá)出來,然后進(jìn)行整理和精簡,提取重要信息,采用計算機(jī)可以識別的語言存儲在計算機(jī)中,形成診斷知識庫。有結(jié)構(gòu)化的知識庫為支撐,會大大提高信息系統(tǒng)的診斷效率。在實際應(yīng)用中,首先需要收集資料。通過收集文件資料、書本知識或者與相關(guān)領(lǐng)域的專家溝通交流獲取其診斷經(jīng)驗,并將這些知識進(jìn)行整理,以故障樹的形式表示出來,然后對故障樹進(jìn)行定性分析,得到最小割集,并得出相應(yīng)的診斷序列,并對這些數(shù)據(jù)進(jìn)行簡化,最終將優(yōu)化的數(shù)據(jù)存入數(shù)據(jù)庫,完整的、標(biāo)準(zhǔn)的數(shù)據(jù)是故障管理信息系統(tǒng)進(jìn)行診斷的基礎(chǔ)。知識庫中包括物料表、產(chǎn)品結(jié)構(gòu)表、故障信息表、規(guī)則表、條件表、直接框架表、間接框架表及判斷條件表,見表3~表10。
表3 物料表Table3 The material table
表4 產(chǎn)品結(jié)構(gòu)表Table4 The product structure table
表5 故障信息表Table5 The fault information table
表6 規(guī)則表Table6 The rule table
表7 條件表Table7 The condition table
表8 直接框架表Table8 The direct framework table
表9 間接框架表Table9 The indirect framework table
表10 判斷條件表Table10 The judge conditions table
故障診斷系統(tǒng)的知識庫主要由故障樹定性定量分析的結(jié)果構(gòu)成,作為所有故障推理的依據(jù)。用戶在系統(tǒng)界面按照要求輸入故障信息,系統(tǒng)會根據(jù)一定的程序在知識庫中實現(xiàn)故障診斷、故障推理,以故障樹正向推理為主,實例推理為輔的推理策略,最終給出故障原因以及故障解決措施。
在故障診斷系統(tǒng)中,采用規(guī)則加框架的推理過程,具體實現(xiàn)算法如下:輸入:故障現(xiàn)象Fault;輸出:故障解決措施。步驟1:輸入故障信息,與故障信息表匹配,記錄相應(yīng)的故障編號,記為Fault;步驟2:在框架表中查詢出Fault對應(yīng)的框架號Frame;步驟3:在判斷條件表中查詢出該框架對應(yīng)的規(guī)則號Rule;步驟4:按照Rule的優(yōu)先級來查詢對應(yīng)的條件事實號Condition;步驟5:條件事實號對應(yīng)一個框架號,如果是直接框架則可以得到故障原因以及解決措施。如果是間接框架,則繼續(xù)進(jìn)行步驟2。
推理過程如圖3所示。
圖3 故障診斷推理過程Fig.3 The inference procedure of fault diagnosis
故障診斷系統(tǒng)中的知識挖掘主要是針對大量的故障記錄,采用統(tǒng)計分析方法挖掘故障記錄間蘊藏的潛在信息,找出故障的瓶頸制約因素,并實現(xiàn)對未來可能故障的預(yù)測。BOM作為航空設(shè)備管理的核心數(shù)據(jù),對基于BOM故障樹的知識庫進(jìn)行數(shù)據(jù)挖掘,可以滿足不同部門的需要。其中,對于采購部門,往往需要了解航空設(shè)備的外購件清單,而基于航空設(shè)備BOM統(tǒng)計外購件能夠準(zhǔn)確地發(fā)現(xiàn)當(dāng)前部件的需求情況,從而為采購部門安排采購計劃提供依據(jù);對于設(shè)計部門,需要確定航空設(shè)備由哪些部件構(gòu)成,以及構(gòu)件直接的結(jié)構(gòu)關(guān)系,基于BOM故障樹的知識庫統(tǒng)計部件故障發(fā)生的頻率,發(fā)現(xiàn)薄弱部件,為設(shè)計部門對航空設(shè)備的結(jié)構(gòu)設(shè)計及設(shè)備性能升級提供依據(jù);對于維修部門,通常比較關(guān)注備品、備件清單,通過對故障記錄按照BOM進(jìn)行分類統(tǒng)計,篩選出易損、易耗件明細(xì)表,發(fā)現(xiàn)故障規(guī)律和故障瓶頸制約因素,為備件管理以及維修大綱的制定提供決策支持[12],同時,對故障記錄的知識挖掘結(jié)果,采用圖表的方式清晰地顯示,能夠進(jìn)一步充實和完善設(shè)備故障診斷規(guī)則表,同時為保養(yǎng)維護(hù)計劃的制訂提供依據(jù)。因此,BOM是企業(yè)信息化建設(shè)的核心數(shù)據(jù),基于BOM進(jìn)行數(shù)據(jù)挖掘具有深遠(yuǎn)的意義[12]。
本文建立了基于設(shè)備BOM的故障診斷系統(tǒng)模型,重點研究了診斷系統(tǒng)中的知識獲取、知識推理、知識挖掘三部分內(nèi)容。基于BOM構(gòu)建故障樹,故障樹每個節(jié)點包含節(jié)點基本信息和故障信息,通過對故障樹進(jìn)行定性、定量分析,將結(jié)果存入知識庫中,并基于知識庫進(jìn)行故障診斷推理,最終得出故障原因及解決措施?;贐OM進(jìn)行故障診斷,可以使故障管理更加精細(xì)化和科學(xué)化。通過對故障信息進(jìn)行統(tǒng)計分析航空設(shè)備的故障模式、原因等規(guī)律,可以作為航空設(shè)備資產(chǎn)管理、航空設(shè)備維修管理、新設(shè)備選型設(shè)計的航空設(shè)備性能的升級提供依據(jù),可以為進(jìn)一步完善預(yù)防維修大綱以及備品備件的采購提供決策支持。