柴保明等
摘 要:故障診斷在知識(shí)智能獲取的方法發(fā)展一直比較緩慢。而隨著數(shù)據(jù)挖掘技術(shù)的逐步發(fā)展起來(lái),它便成為知識(shí)獲取效率比較高的工具。文章對(duì)數(shù)據(jù)挖掘?qū)<蚁到y(tǒng)以及數(shù)據(jù)挖掘技術(shù)中常用的一些挖掘算法進(jìn)行了介紹,并把實(shí)驗(yàn)系統(tǒng)數(shù)據(jù)和數(shù)據(jù)挖掘?qū)<蚁到y(tǒng)相結(jié)合來(lái)闡明其原理。
關(guān)鍵詞:數(shù)據(jù)挖掘;價(jià)值知識(shí);專家系統(tǒng)
引言
伴隨著制造業(yè)的迅猛發(fā)展以及和電子產(chǎn)業(yè)結(jié)合的不斷深入,工業(yè)化大生產(chǎn)一步步朝著智能化的方向發(fā)展,自動(dòng)化也更加成熟。但它的系統(tǒng)設(shè)備結(jié)構(gòu)復(fù)雜性更大,功能也更強(qiáng)大,維修難度隨之也提高,所以系統(tǒng)故障產(chǎn)生的故障信息數(shù)據(jù)越來(lái)越巨大。這些數(shù)據(jù)量超出人工分析處理能力,因此對(duì)故障診斷方法的創(chuàng)新是作者一直不斷追求的。
1 數(shù)據(jù)挖掘技術(shù)
1.1 數(shù)據(jù)挖掘的目的與過(guò)程
數(shù)據(jù)挖掘主要有數(shù)據(jù)庫(kù)建立、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等。它的目的是從長(zhǎng)期存放在數(shù)據(jù)倉(cāng)庫(kù)中海量的數(shù)據(jù)信息的集合中去發(fā)現(xiàn)那些未知的隱藏的知識(shí)。
1.2 數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則Apriori算法
在數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則的第一個(gè)算法便是Apriori算法,它使用基于支持度的剪枝技術(shù)以及系統(tǒng)控制候選項(xiàng)集指數(shù)增長(zhǎng)是非常具有前瞻性的。它的頻繁項(xiàng)集產(chǎn)生算法的程序代碼過(guò)程為:
1.3 基于Apriori算法的故障診斷的改進(jìn)
如果能把Apriori算法計(jì)算速度大幅提高,則整個(gè)算法的效率便會(huì)具有很大的上升空間。而運(yùn)算效率以及提高產(chǎn)生候選項(xiàng)集有兩個(gè)主要步驟:一個(gè)是連接,一個(gè)是剪枝操作。因此,算法的改進(jìn)方法如下:
1.3.1 數(shù)據(jù)庫(kù)優(yōu)化掃描
在每次計(jì)算過(guò)程中,如果k-1項(xiàng)集為非頻繁項(xiàng)集,則k項(xiàng)集為非頻繁項(xiàng)集。因此,將此k-1項(xiàng)集從數(shù)據(jù)庫(kù)中刪去,隨著k值的增加,刪除的事務(wù)隨之增多,這樣通過(guò)減少掃描數(shù)據(jù)庫(kù)的次數(shù)來(lái)提高算法的運(yùn)行速度。
1.3.2 連接與剪枝優(yōu)化
2 數(shù)據(jù)挖掘的故障診斷專家系統(tǒng)
專家系統(tǒng)是在某個(gè)領(lǐng)域中,包含大量專家水平的知識(shí)與經(jīng)驗(yàn),它是一種計(jì)算機(jī)組成系統(tǒng)程序來(lái)模擬人類專家,運(yùn)用人類專家的知識(shí)和解決問(wèn)題的方法進(jìn)行推理,然后通過(guò)智能方式解決某個(gè)領(lǐng)域內(nèi)一些復(fù)雜問(wèn)題。
為了能更方便有效地發(fā)掘一些有用的價(jià)值信息和知識(shí),把數(shù)據(jù)挖掘技術(shù)和專家系統(tǒng)結(jié)合起來(lái),為解決傳統(tǒng)專家系統(tǒng)在知識(shí)獲取及推理等方面的難題,通過(guò)數(shù)據(jù)挖掘這些技術(shù)能力來(lái)攻克。而數(shù)據(jù)挖掘的專家系統(tǒng)框圖如圖2所示。
其中左側(cè)部分是系統(tǒng)的知識(shí)獲取。數(shù)據(jù)挖掘?qū)<蚁到y(tǒng)的知識(shí)源包括很多,其一是專家在現(xiàn)實(shí)中解決問(wèn)題的一些實(shí)例;其二是對(duì)診斷設(shè)備發(fā)生故障保存的一些歷史數(shù)據(jù);其三是故障實(shí)驗(yàn)的仿真數(shù)據(jù)等。它的運(yùn)行過(guò)程如下:
首先,建立一個(gè)齒輪箱故障試驗(yàn)仿真結(jié)果數(shù)據(jù)庫(kù)。采集過(guò)程如圖3所示。接著從采完的數(shù)據(jù)中排除一些不用的信息,從中精選出一些數(shù)據(jù)得到數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)是組構(gòu)成關(guān)于該設(shè)備發(fā)生故障的樣本,再將數(shù)據(jù)從樣本空間映射到數(shù)據(jù)空間。
建立好樣本庫(kù)后,然后把數(shù)據(jù)中的不變特征采用通過(guò)預(yù)處理方法提取出來(lái),這樣可以將其從數(shù)據(jù)空間轉(zhuǎn)變?yōu)樘卣骺臻g,然后再確定系統(tǒng)中所需的挖掘算法等,最后可以進(jìn)行數(shù)據(jù)挖掘。
在右半部分為故障診斷,在運(yùn)行過(guò)程中,輸入數(shù)據(jù)首先經(jīng)過(guò)數(shù)據(jù)預(yù)處理后,會(huì)經(jīng)過(guò)系統(tǒng)處理轉(zhuǎn)變成特征模式,接著進(jìn)人到全局?jǐn)?shù)據(jù)庫(kù),再結(jié)合知識(shí)庫(kù)中的知識(shí)來(lái)進(jìn)行運(yùn)算推理。
在選擇好數(shù)據(jù)挖掘的算法后,對(duì)故障樣本庫(kù)進(jìn)行多次挖掘,從而完成故障知識(shí)的獲取。表1、2、3為提取的部分齒輪箱故障振動(dòng)仿真數(shù)據(jù)庫(kù)部分獲取。
這個(gè)系統(tǒng)在整個(gè)推理過(guò)程中,診斷程序?yàn)橹饕^(guò)程,還有控制知識(shí)信息負(fù)責(zé)一項(xiàng),這樣可以增加診斷的智能性。在診斷完成后,系統(tǒng)模塊列出推理的一系列過(guò)程。
3 結(jié)束語(yǔ)
文章結(jié)合數(shù)據(jù)挖掘技術(shù),對(duì)其中的經(jīng)典算法進(jìn)行研究改進(jìn),并在分析故障診斷專家系統(tǒng)在問(wèn)題的基礎(chǔ)上,對(duì)專家系統(tǒng)和數(shù)據(jù)挖掘進(jìn)行比較,得出一個(gè)專家系統(tǒng)和數(shù)據(jù)挖掘結(jié)合的診斷系統(tǒng),提高故障診斷的準(zhǔn)確性。
參考文獻(xiàn)
[1]周麗麗.面向設(shè)備故障診斷的數(shù)據(jù)挖掘技術(shù)方法的研究[J].自動(dòng)化技術(shù)與應(yīng)用,2015,2.
[2]朱向明.數(shù)據(jù)挖掘故障診斷專家系統(tǒng)[J].火力與指揮控制,2011,9.
[3]黃文虎.設(shè)備故障診斷原理、技術(shù)及應(yīng)用廠[M].北京:科學(xué)出版社,1996.
作者簡(jiǎn)介:柴保明(1964,3-),男,河北邯鄲人,博士,教授,現(xiàn)任河北工程大學(xué)機(jī)電學(xué)院,副院長(zhǎng)。
通訊作者:張韶(1988,1-),男,河北邯鄲人,碩士,現(xiàn)就讀于河北工程大學(xué),專業(yè)為機(jī)械電子工程。