皮安云,于 鵬,王文雙,張光軼
(1.91868部隊(duì),海南三亞572106;2.海軍裝備部軍械保障部,北京100036;3.海軍航空工程學(xué)院科研部,山東煙臺264001)
粗糙集在故障診斷中可以有效消除冗余和不精確的故障信息,且不需要任何先驗(yàn)信息。目前,在粗糙集中較經(jīng)典的約簡算法有:屬性重要度算法、差別矩陣算法、差別函數(shù)算法和條件熵算法等[1-4]。其中,條件熵算法可以克服單純差別矩陣算法對屬性重要性約簡過于簡單且忽視條件屬性實(shí)際意義的缺點(diǎn),同時(shí)又能彌補(bǔ)分類質(zhì)量視角下,屬性重要性忽視條件屬性間內(nèi)在聯(lián)系的不足。本文將條件熵算法應(yīng)用到彈載數(shù)傳電臺設(shè)備的故障診斷中,結(jié)果表明故障診斷不僅準(zhǔn)確有效,而且簡單快速。
在粗糙集理論中,四元組S=(U,A,V,f)是一個(gè)知識表達(dá)系統(tǒng)(信息系統(tǒng))。其中,U為論域;A為屬性集;是屬性α的值域;f:U×A→V是一個(gè)信息函數(shù),它為每個(gè)對象的每個(gè)屬性賦予一個(gè)信息值,即?α∈A,x∈U,f(x,α)∈Vα。
若A=C?D,C?D=?,C為條件屬性值,D為決策屬性值,則知識表達(dá)系統(tǒng)S稱為決策表[5-6]。
在決策表中,需要考慮的是哪個(gè)條件屬性對決策更重要,這就需要考慮條件屬性與決策屬性之間的互信息或者條件熵[7-8]。這里,假設(shè)決策屬性D在論域U上的劃分為D:D={D1,D2,…,Dm},則定義條件屬性C相對于決策屬性D的一個(gè)條件信息熵為:
式(1)中:P(Ci) 為條件屬性Ci的概率;P(Dj|Ci) 和P(Ci|Dj)分別為條件概率。
由條件熵的定義可知,若條件屬性Ci完全屬于決策屬性Dj,則P(Dj|Ci)=1,log2P(Dj|Ci)=0 。若所有l(wèi)og2P(Dj|Ci)=0,則H(D|C)=0,即為一致性決策系統(tǒng)[9]。可見,條件信息熵衡量了決策系統(tǒng)的整體不確定性。
由定義可知,如果決策表?xiàng)l件屬性集的分類進(jìn)行合并,將可能導(dǎo)致條件熵上升,只有在發(fā)生合并的兩個(gè)分類對于決策類的隸屬度(概率)相等的情況下,才不導(dǎo)致條件熵的變化[10-12]。
條件信息熵的約簡算法步驟歸納為:
Input:決策表S=(U,A,V,f),A=C?D;
Output:決策表的一個(gè)最小約簡REDC(D)。
①計(jì)算決策表S中決策屬性集D相對條件屬性C的條件信息熵H(D|C);②計(jì)算條件屬性C相對決策屬性D的核CORED(C),令A(yù)tt=C-CORED(C);③令RED=CORED(C),對αi∈Att,計(jì)算H(D|RED ?{αi});④選擇使H(D|RED ?{αi})最小的屬性αj,若同時(shí)有多個(gè)屬性達(dá)到最小值,則從中選一個(gè)在差別矩陣中出現(xiàn)最多的屬性。令A(yù)tt=Att-{αj},RED=RED ?{αj},計(jì)算H(D|RED),若H(D|RED)=H(D|C)則終止,否則轉(zhuǎn)③。
在最壞情況下,每次所考慮的屬性數(shù)依次為n,n-1,…,1(n為決策表的條件屬性數(shù))。故總次數(shù)為n+(n-l)+…+l=n(n+l)/2。如果忽略對象數(shù)對計(jì)算時(shí)間的影響,那么,在最壞情況下,該算法能夠在o(n2)時(shí)間復(fù)雜性內(nèi)找到滿意約簡。與經(jīng)典基于差別矩陣的約簡算法的復(fù)雜度為o(Ln2)(L為CORED(C)中元素個(gè)數(shù))[13]的時(shí)間復(fù)雜性相比,該算法較優(yōu)。
本文以某彈載數(shù)傳電臺設(shè)備為診斷對象,故障診斷定位到模塊級。整個(gè)電臺由坐標(biāo)模塊1、頻綜模塊2、接收機(jī)模塊3、微機(jī)模塊4、解調(diào)模塊5、同步模塊6、功放模塊7、激勵(lì)模塊8 和接口模塊構(gòu)成。每種故障現(xiàn)象的發(fā)生都是由于某個(gè)甚至某幾個(gè)模塊出現(xiàn)故障而導(dǎo)致,模塊出現(xiàn)故障其征兆表現(xiàn)為相關(guān)性能指標(biāo)超出標(biāo)稱值范圍,即所謂的測試超差。
針對設(shè)備的特征,選取了最典型4種異常情況:數(shù)傳電臺不受控制,常規(guī)收發(fā)都異常,抗干擾收發(fā)都異常和坐標(biāo)數(shù)據(jù)異常。將9個(gè)模塊可能發(fā)生的故障定義為“1”,正常定義為“0”,并從該設(shè)備故障數(shù)據(jù)庫中選擇故障樣本,對這些樣本數(shù)據(jù)預(yù)處理:①進(jìn)行條件屬性的簡化。即從原始決策表中消去在所選的故障中沒有變化的列,本例中即消去3 種故障類型中都會故障的“接口模塊”;②消去重復(fù)行。因?yàn)橹貜?fù)行表示重復(fù)的故障樣本,即同樣的決策,所以可以消去,從而得到原始決策表,見表1。表1 中:0 代表正常,1 代表數(shù)傳電臺不受控制,2 代表常規(guī)收發(fā)都異常,3 代表抗干擾收發(fā)都異常,4代表坐標(biāo)數(shù)據(jù)異常。
表1 預(yù)處理后的原始決策表Tab.1 Primitive decision table of using simplification method
Step1:計(jì)算原始決策表中的決策屬性集D相對條件屬性C的條件熵H(D|C)=0,可見本例為一致性決策系統(tǒng)。
Step2:計(jì)算得原始決策表的差別函數(shù)為:
另外,可得原始決策表的相對核為COREC(D)={2,3,4,6},令A(yù)tt=C-CORED(C)={1,5,7,8}。
Step3:令RED=CORED(C)={2,3,4,6} ,對每個(gè)屬性{1,5,7,8}分別計(jì)算H(D|RED ?{αi})。
由于H(d|{2,3,4,6}?{1})=H(d|{2,3,4,6}?{7})=0 都達(dá)到最小,則在差別矩陣中統(tǒng)計(jì)出現(xiàn)次數(shù),出現(xiàn)了18個(gè)“1”,7 個(gè)“7”,則選取出“1”,Att=Att-{1}={5,7,8},RED=RED ?{1}={1,2,3,4,6}。再跳到Step3 計(jì)算新一輪 的H(D|RED ?{αi}) ,條件熵都為0,則終止得REDC(D)={1,2,3,4,6}。
根據(jù)約簡算法得新決策表如表2 所示,并將新決策表添加到診斷系統(tǒng)的規(guī)則表,如表3所示。
表2 新決策表Tab.2 New decision tables
表3 診斷結(jié)果Tab.3 Diagnosis result
經(jīng)驗(yàn)證,基于改進(jìn)的差別函數(shù)的屬性約簡算法與經(jīng)典差別函數(shù)約簡出的結(jié)果一致。但是從上例中不難看出,利用條件熵算法考慮到了條件屬性與決策屬性之間的關(guān)系,使得決策更加準(zhǔn)確可靠。
本文將條件熵算法應(yīng)用于某型彈載數(shù)傳電臺設(shè)備的故障診斷中,驗(yàn)證表明結(jié)果與實(shí)際診斷相一致,具有一定的可靠性。同時(shí),由于條件熵算法考慮了條件屬性與決策屬性之間的關(guān)系,彌補(bǔ)了差別函數(shù)和差別矩陣算法的不足,具有一定的應(yīng)用價(jià)值。
[1] 苗奪謙,李道國.粗糙集理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2008:19-23,186-190.
MIAO DUOQIAN,LI DAOGUO. Rough sets theory and applications[M]. Beijing:Tsinghua University Press,2008:19-23,186-190.(in Chinese)
[2] PAWLAK Z. Rough setsp[J]. International Journal of Information and Computer Science,1982,11:341-356.
[3] 李嵐.基于信息熵的屬性約簡及其應(yīng)用[D].大連:大連海事大學(xué),2008:119-123.
LI LAN. Attribute reduction methods and applications based on information entropy theory[D]. Dalian:Dalian Maritime University,2008:119-123.(in Chinese)
[4] KRYSZKIEWICZ M. Rules in incomplete information system[J].Information Sciences 1999,133:271-292.
[5] 植小三.基于粗糙集理論的數(shù)據(jù)挖掘模型及屬性約簡算法研究[D].重慶:重慶大學(xué),2004:110-115.
ZHI XIAOSAN. The study on model of data mining and attribute reduction algorithm based on the rough set theory[D]. Chongqing:Chongqing University,2004:110-115.(in Chinese)
[6] 趙士亮. 粗糙集理論中若干問題的研究及應(yīng)用[D]. 福州:福州大學(xué),2003:93-99.
ZHAO SHILIANG. Study of several problems in rough set theory and its applications[D]. Fuzhou:Fuzhou University,2003:93-99.(in Chinese)
[7] 王國胤,姚一豫,于洪.粗糙集理論與應(yīng)用研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2009,7(36):1229-1231.
WANG GUOYING,YAO YIYU,YU HONG. A survey on rough set theory and applications[J]. Chinese Journal of Computers,2009,7(36):1229-1231.
[8] 林毅.基于粗集理論的關(guān)聯(lián)規(guī)則挖掘的研究[D].柳州:廣西大學(xué),2004:77-84.
LIN YI.Association rule mining research based on rough set theory[D].Liuzhou:Guangxi University,2004:77-84.(in Chinese)
[9] 徐久成,孫林,馬媛媛.基于新的條件熵的決策表約簡方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,5(29):2313-2315.
XU JIUCHENG,SUN LIN,MA YUANYUAN. Reduction method of decision table based on new conditional entropy[J]. Computer Engineering and Design,2008,5(29):2313-2315.(in Chinese)
[10] 張文修,吳偉志.粗糙集理論介紹和研究綜述[J].模糊系統(tǒng)與數(shù)學(xué),2000,12(4):1-4.
ZHANG WENXIU,WU WEIZHI.An introduction and a survey for the studies of rough set theory[J]. Fuzzy Systems and Mathematics,2000,12(4):1-4.(in Chinese)
[11] STEFANOWSKI J,TSOUKIAS A. On the Extension of Rough Sets under Incomplete Information[J]. International Journal of Intelligent System,2000,16(1):29-38.
[12] FENTON B,MARTIN ME GINNITY,LIAM MAGUIRE. Fault diagnosis of electronic systems using artificial intelligence[J]. IEEE Instrumentation & Measurement Magazine,2002,(3):16-20.
[13]張光軼,蘇艷琴,宋振宇.兩種差別矩陣約簡算法在故障診斷中的應(yīng)用分析[J]. 中國電子科學(xué)研究院學(xué)報(bào),2011,6(3):315-316.
ZHANG GUANGYI,SU YANQIN,SONG ZHENYU.Analysis of fault diagnosis based on the two discernibility matrix reduction algorithms[J]. Journal of China Academy of Electronics and Information Technology,2011,6(3):315-316.(in Chinese)