侯國安 肖東彩 田舟祺
(銀川能源學(xué)院 銀川 750015)
汽輪發(fā)電機(jī)組隨著工業(yè)發(fā)展結(jié)構(gòu)日益復(fù)雜,發(fā)生故障概率也相應(yīng)增加,并且事故往往產(chǎn)生災(zāi)難性破壞,因此,有效的實(shí)施設(shè)備狀態(tài)檢測(cè)及故障診斷,已成為當(dāng)今社會(huì)研究的熱點(diǎn)之一[1]。
決策樹[2]能夠從大量數(shù)據(jù)中分析出替在規(guī)律,獲得分類規(guī)則。粗糙集可以彌補(bǔ)決策樹選擇所需屬性集困難的缺點(diǎn)。
汽輪機(jī)通過旋轉(zhuǎn)運(yùn)行,在長時(shí)間的運(yùn)行過程中必然會(huì)引起一系列故障,并且這些故障往往是非線性的,主要有轉(zhuǎn)子不對(duì)中、質(zhì)量不平衡、動(dòng)靜碰磨等。不同的故障所表現(xiàn)出來的頻域不一樣,通過不同的頻域,就能判別不同的故障[3]。
粗糙集理論可以對(duì)不完整資料進(jìn)行分析推理。粗糙集是在給定的數(shù)據(jù)集合內(nèi)建構(gòu)等價(jià)集合,在等價(jià)集合中,數(shù)據(jù)樣本具有不可分辨性。
在粗糙集理論中,需要應(yīng)用基于核或基于差別矩陣的方法對(duì)不相關(guān)或冗余的數(shù)據(jù)進(jìn)行約簡(jiǎn)。
在知識(shí)庫中,核是屬性約簡(jiǎn)的公共部分,在所有屬性約簡(jiǎn)中是必不可少的,因此,大多數(shù)屬性約簡(jiǎn)是先求核,再從其余屬性中,測(cè)試出能加入核屬性集合內(nèi)的屬性。
對(duì)于區(qū)分矩陣,兩個(gè)樣例相同,區(qū)分矩陣元素為空集;不同,就是兩個(gè)樣例的并集。
基于區(qū)分矩陣的決策表便于進(jìn)行相對(duì)D核的約簡(jiǎn)。
對(duì)汽輪機(jī)進(jìn)行故障診斷時(shí),首先應(yīng)用監(jiān)測(cè)設(shè)備采集正常與故障狀態(tài)時(shí)的運(yùn)行參數(shù),由此獲取什么樣的參數(shù)對(duì)應(yīng)什么樣的故障類別,構(gòu)建汽輪機(jī)故障診斷數(shù)據(jù)庫。
頻域分析法是設(shè)備故障診斷經(jīng)常采用的方法[13],不同的故障對(duì)應(yīng)不同的特征頻率。
汽輪機(jī)經(jīng)常出現(xiàn)的故障有轉(zhuǎn)子彎曲、不對(duì)中、部件碰磨、質(zhì)量不平衡、軸承座振動(dòng),我們將其頻譜在(0.01~0.39)f、(0.4~0.49)f、0.5f、(0.51~0.99)f、f、2f、(3~5)f、>5f頻段上進(jìn)行劃分。
1表示質(zhì)量不平衡;2表示不對(duì)中;3表示部件碰磨;4表示軸承座振動(dòng);5表示轉(zhuǎn)子彎曲。
由于表中屬性是連續(xù)值,本文采用等寬區(qū)間法進(jìn)行離散化:1:[0~0.20];2:[0.20~0.40];3:[0.40~0.60];4:{0.60~0.80];5:[0.80~1.00]。
表2中a,b,c,d,e,f,g,h為樣本的條件屬性,I為決策屬性。
表2 離散化表
從表3可以看出,差別矩陣中只有第4行,第3列為單元素c,故c為核屬性,也可表示為RED={c}。
表3 離散化后故障樣本表的差別距陣
下面是不含c的條件集合:
將所有列進(jìn)行合取范式化簡(jiǎn):∫M(S)=(a∨h)∧(a∨f)=a∨(h∧f)。
所以條件屬性的約簡(jiǎn)結(jié)果是{a,c}或者{c,h,f}。
如果選擇{a,c}作為約簡(jiǎn)后的條件屬性,進(jìn)行決策樹構(gòu)造。對(duì)故障樣本應(yīng)用C4.5算法計(jì)算[15]。故障樣本的屬性值有8個(gè),分別對(duì)應(yīng)5種故障:cl(質(zhì)量不平衡)、c2(不對(duì)中)、c3(碰磨)、c4(軸承座振動(dòng))、c5(轉(zhuǎn)子彎曲)。
2)利用屬性A1(a)、A3(c)對(duì)樣本集合進(jìn)行劃分,所需要的信息熵為
3)信息增益為
4)計(jì)算A1(a)、A3(c)信息熵如下:
從上面可知,信息增益率“A1”最大,可作為根節(jié)點(diǎn),由表1~2可以看出,當(dāng)描述屬性A1取值為2、3、5時(shí)的樣本子集均分別對(duì)應(yīng)不對(duì)中、碰磨、軸承座振動(dòng)一個(gè)故障類別,因此,可以將這些個(gè)樣本子集標(biāo)注為葉結(jié)點(diǎn)。通過計(jì)算得到該故障樣本子集的決策樹如圖1。
表1 頻域下的故障樣本表
圖1 分類樹
對(duì)決策樹葉節(jié)點(diǎn)進(jìn)行讀樹,可得規(guī)則如表4所示。
表4 規(guī)則集
第一條規(guī)則“if a=5 then I=4”,表示如果汽輪機(jī)轉(zhuǎn)子特征頻率a大于0.8000小于1.000,則可能是軸承座松動(dòng)了。同理,第三條“if a=1&c=4 then I=5”,可解釋為如果汽輪機(jī)轉(zhuǎn)子特征頻率a小于0.2000且特征頻率c大于0.6000小于0.8000,則可能是轉(zhuǎn)子彎曲了。
每一條規(guī)則都對(duì)應(yīng)著一種汽輪機(jī)故障診斷分類。
經(jīng)過C4.5算法進(jìn)行計(jì)算,8個(gè)屬性減少為2個(gè)或3個(gè),得出了分類規(guī)則,也可以以此構(gòu)建數(shù)據(jù)庫。
以Matlab為開發(fā)平臺(tái),構(gòu)建汽輪機(jī)振動(dòng)故障診斷系統(tǒng)。使用GUIDE創(chuàng)建GUI對(duì)象,實(shí)現(xiàn)診斷系統(tǒng)人機(jī)交互界面。主界面如圖2所示。
圖2 汽輪機(jī)故障診斷系統(tǒng)主界面
“訓(xùn)練診斷模塊”是對(duì)故障診斷進(jìn)行訓(xùn)練學(xué)習(xí);“診斷”是對(duì)某振動(dòng)特征下的故障進(jìn)行診斷。
圖3是訓(xùn)練界面,可以導(dǎo)入excel表格的訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練。
圖3 訓(xùn)練界面
圖4是診斷界面,可以對(duì)設(shè)備數(shù)據(jù)進(jìn)行故障診斷。
圖4 診斷界面
用表5故障診斷測(cè)試樣本進(jìn)行測(cè)試。
表5 故障診斷測(cè)試樣本
診斷結(jié)果如表6所示。
由表6得出,診斷規(guī)則準(zhǔn)確率為86.7%。訓(xùn)練數(shù)據(jù)越多,準(zhǔn)確率越高。
表6 診斷結(jié)果
本文利用C4.5算法進(jìn)行了屬性約簡(jiǎn),減少了數(shù)據(jù)庫中數(shù)據(jù)的數(shù)量,提高了設(shè)備故障診斷的準(zhǔn)確性,避免了一些屬性在生成規(guī)則時(shí)被多次選擇的缺點(diǎn),說明C4.5算法在汽輪機(jī)非線性故障診斷方面是可行的。