• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于改進(jìn)核Fisher的故障診斷方法

      2017-10-14 07:03:57馬立玲徐發(fā)富王軍政
      化工學(xué)報(bào) 2017年3期
      關(guān)鍵詞:投影故障診斷距離

      馬立玲,徐發(fā)富,王軍政

      ?

      一種基于改進(jìn)核Fisher的故障診斷方法

      馬立玲,徐發(fā)富,王軍政

      (北京理工大學(xué)自動(dòng)化學(xué)院,北京 100081)

      針對(duì)化工過(guò)程故障數(shù)據(jù)呈非線(xiàn)性分布,數(shù)據(jù)類(lèi)別復(fù)雜,難以進(jìn)行故障診斷的問(wèn)題,提出一種改進(jìn)核Fisher的故障診斷方法。對(duì)于原始樣本數(shù)據(jù)投影后,樣本出現(xiàn)因類(lèi)間距離存在很大差異性而導(dǎo)致部分類(lèi)別樣本存在混疊的現(xiàn)象,以及不同類(lèi)別的邊界數(shù)據(jù)歸類(lèi)模糊問(wèn)題,給出了統(tǒng)一的解決辦法。該方法首先采用改進(jìn)類(lèi)間距的方法來(lái)改變樣本投影空間的分布,使得樣本具有較好的投影效果,然后通過(guò)定義閾值參數(shù)來(lái)篩選出邊界數(shù)據(jù),對(duì)于邊界數(shù)據(jù),采用改進(jìn)的近鄰(-NN)算法來(lái)分類(lèi),對(duì)于非邊界數(shù)據(jù),采用馬氏距離來(lái)分類(lèi)。最后在TE過(guò)程中進(jìn)行了仿真驗(yàn)證,結(jié)果表明方法在兼顧了故障診斷時(shí)間的同時(shí),有效提高了故障診斷精度。

      核Fisher;故障診斷;改進(jìn)-NN算法;實(shí)驗(yàn)驗(yàn)證;優(yōu)化

      引 言

      在實(shí)際的化工過(guò)程中產(chǎn)生了大量的數(shù)據(jù),化工過(guò)程的故障診斷問(wèn)題是如何利用這些故障數(shù)據(jù),對(duì)其進(jìn)行分類(lèi)。這種基于數(shù)據(jù)驅(qū)動(dòng)的統(tǒng)計(jì)方法在化工過(guò)程中得到了廣泛運(yùn)用[1]。目前基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法主要有:統(tǒng)計(jì)分析方法、信號(hào)處理方法、基于定量的人工智能方法[2-3]。統(tǒng)計(jì)方法主要包括:主元分析、最小二乘、獨(dú)立元分析、Fisher判別分析、貝葉斯理論等方法;基于信號(hào)處理的方法主要有:小波變換、希爾伯特變換等;基于定量的人工智能方法主要有:模糊數(shù)學(xué)、支持向量機(jī)等[4-6]。然而這些方法有其局限性,對(duì)于復(fù)雜的化工過(guò)程,單純的這些方法已經(jīng)不能滿(mǎn)足需要。而將核方法[7]引入Fisher判別分析中,很大程度上解決了原始數(shù)據(jù)呈非線(xiàn)性分布問(wèn)題,適用于復(fù)雜的化工過(guò)程。在過(guò)去的十多年中,核Fisher方法得到了廣泛的運(yùn)用[8-17]。

      近年來(lái),運(yùn)用Fisher判別分析進(jìn)行故障診斷取得了許多成果。文獻(xiàn)[18]提出了基于改進(jìn)的生物地理學(xué)優(yōu)化算法的加權(quán)核Fisher判別分析法,對(duì)非線(xiàn)性大規(guī)模的工業(yè)過(guò)程進(jìn)行及時(shí)、準(zhǔn)確的故障診斷;文獻(xiàn)[19]提出了在類(lèi)標(biāo)簽指導(dǎo)下最小化同類(lèi)流形的離散度并最大化異類(lèi)流形的離散度來(lái)實(shí)現(xiàn)類(lèi)判別;文獻(xiàn)[20]提出了基于核Fisher的正常工況與故障包絡(luò)面模型,給出了基于該模型的在線(xiàn)故障診斷流程,該方法能夠及早診斷出故障的發(fā)生;文獻(xiàn)[21]提出了基于核Fisher判別分析的非線(xiàn)性統(tǒng)計(jì)過(guò)程監(jiān)控方法,能有效捕獲過(guò)程變量之間的非線(xiàn)性關(guān)系;文獻(xiàn)[22]所提方法充分利用了蘊(yùn)含于無(wú)標(biāo)記故障樣本中的故障信息。這些方法一定程度上提升了故障診斷的正確率,但是故障診斷的快速性、準(zhǔn)確性還有待進(jìn)一步提升。

      運(yùn)用核Fisher分析法進(jìn)行故障診斷時(shí),還是存在一些問(wèn)題:①對(duì)于故障樣本在投影空間的投影數(shù)據(jù),存在邊界數(shù)據(jù)由于遠(yuǎn)離類(lèi)中心且處于不同類(lèi)的分界處,導(dǎo)致歸類(lèi)模糊誤判的問(wèn)題;②在投影空間,有的樣本類(lèi)間距離存在很大差異性,導(dǎo)致類(lèi)間距小的類(lèi)別間出現(xiàn)投影數(shù)據(jù)混疊,互相掩蓋的現(xiàn)象。針對(duì)以上問(wèn)題,提出了統(tǒng)一的解決辦法,基于改進(jìn)的核Fisher方法,有效改善了核Fisher的投影效果,并很好減少了故障樣本的分類(lèi)錯(cuò)誤率,這一方法在TE平臺(tái)上得到了驗(yàn)證。

      1 核Fisher判別分析

      Fisher判別分析是模式分類(lèi)領(lǐng)域研究發(fā)展的一種數(shù)據(jù)降維及分類(lèi)方法。它的核心思想是投影,依據(jù)樣本的不同特征,將測(cè)試數(shù)據(jù)投影到某個(gè)方向,使得測(cè)試數(shù)據(jù)的投影的類(lèi)間離散度最大化并同時(shí)最小化類(lèi)內(nèi)離散度。雖然傳統(tǒng)的Fisher判別在故障診斷方面有了廣泛的運(yùn)用,但是當(dāng)變量之間的非線(xiàn)性化很?chē)?yán)重時(shí),很難找到一個(gè)合適的方向使得測(cè)試數(shù)據(jù)的投影能最大程度地分離。針對(duì)非線(xiàn)性分類(lèi),將核函數(shù)方法引入Fisher判別中取得了很好的效果,Mika等[23]最早提出了核Fisher判別分析。下面對(duì)核Fisher判別進(jìn)行簡(jiǎn)述。

      假設(shè)在維空間的所有樣本點(diǎn)有類(lèi),即1,2, …,G,樣本總數(shù)為。第(=1, 2, …,)個(gè)類(lèi)G包含N個(gè)樣本記做1,2,…,。

      樣本∈R通過(guò)非線(xiàn)性高維映射后對(duì)應(yīng)的模式()∈。在高維特征空間中,訓(xùn)練樣本的類(lèi)內(nèi)離散度W和類(lèi)間的離散度B分別為

      (2)

      式中,表示特征空間中第類(lèi)采樣均值:,而表示所有樣本點(diǎn)在特征空間中的均值:。在特征空間中,F(xiàn)isher判別準(zhǔn)則為

      式中,為任一非零列向量。Fisher判別就是通過(guò)最優(yōu)化式(3),找到最佳投影矢量。由于特征空間維數(shù)太高,不能直接求取,因而引入核函數(shù)

      (4)

      式(4)表示任意2個(gè)在高維空間中的向量?jī)?nèi)積可以用核函數(shù)表示。則式(3)中最優(yōu)解可以表示為:,其中=(1,2, …,)T為一列向量。于是在高維特征空間中Fisher準(zhǔn)則變?yōu)?/p>

      式中,B和W的求法如下

      因此式(5)的問(wèn)題轉(zhuǎn)化為求W?1B的最大特征值以及對(duì)應(yīng)的特征向量。在實(shí)際應(yīng)用中,往往不能保證W是非奇異的,因此,采用W+來(lái)替換W,其中是一個(gè)極小的正數(shù),通常取=10?7,為單位矩陣。

      在核函數(shù)Fisher判別方法中,核函數(shù)的選取至關(guān)重要。核函數(shù)有很多種,最為常見(jiàn)的有線(xiàn)性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基函數(shù)和Sigmoid核函數(shù)等,但是如何構(gòu)造一類(lèi)最優(yōu)核還沒(méi)有一個(gè)好的方法,缺乏深入的理論研究。在文獻(xiàn)[24]中,通過(guò)實(shí)驗(yàn)研究發(fā)現(xiàn),在默認(rèn)參數(shù)的情況下,RBF核函數(shù)(高斯核函數(shù))具有較好的分類(lèi)能力。在本研究中,采用RBF核函數(shù)

      式中,參數(shù)為正常數(shù),的選取是一個(gè)優(yōu)化問(wèn)題,目前常采用的參數(shù)選擇方法有:交叉驗(yàn)證法[25]、Bayesian法[26]、梯度下降法[27]等。本研究采用交叉驗(yàn)證法選取參數(shù)。

      2 基于改進(jìn)核Fisher的故障診斷

      2.1 類(lèi)間距的改進(jìn)

      在很多研究情況下,類(lèi)間距離存在很大差異,通常計(jì)算類(lèi)間離散矩陣B如式(2)所示,計(jì)量類(lèi)間差異的權(quán)重僅僅是依據(jù)不同類(lèi)別樣本數(shù)在總體樣本中所占比例計(jì)算,但是在實(shí)際情況中,會(huì)出現(xiàn)有部分類(lèi)距離其他類(lèi)別很遠(yuǎn),但是有些類(lèi)別的間距很小,容易出現(xiàn)類(lèi)間差異較小的類(lèi)信息被差異較大的類(lèi)信息覆蓋的情況,導(dǎo)致故障分類(lèi)效果不佳。

      為解決上述問(wèn)題,在原先的核Fisher判別中,保證類(lèi)內(nèi)離散度不變,重新定義映射后類(lèi)間離散度,與Dai等[28]一樣,采用Euclidean距離的函數(shù)來(lái)對(duì)類(lèi)間距進(jìn)行加權(quán)。重新定義的類(lèi)間離散度如下

      式中,為第類(lèi)和第類(lèi)的平均值;d為第類(lèi)和第類(lèi)的類(lèi)間距離,如式(8),權(quán)重函數(shù)(d)為關(guān)于d的一個(gè)函數(shù)。

      (8)

      式中,k1,i2=〈(x1),(x2)〉,k1,j2=〈(x1),(x2)〉,k1,j1=〈(x1),(x1)〉。

      文獻(xiàn)[28]中,權(quán)重函數(shù)定義為(d)=d?q(∈,≤3),即權(quán)重與類(lèi)間距離呈反比。一般取3~10。

      2.2 故障分類(lèi)的改進(jìn)

      將任意一個(gè)原始故障數(shù)據(jù)樣本=[1,2, …,x]T經(jīng)過(guò)核Fisher判別投影后得到投影向量=[1,2, …,y]T(≤),同樣第類(lèi)組均值x經(jīng)過(guò)投影后得到投影向量=[,, …,]T。傳統(tǒng)的判別方法通過(guò)計(jì)算兩個(gè)投影向量之間的歐式距離來(lái)判斷故障類(lèi)別,即:若

      歐式距離雖然簡(jiǎn)單易用,但缺點(diǎn)明顯,將樣本的不同屬性間的差別等同看待,這一點(diǎn)有時(shí)不能滿(mǎn)足實(shí)際需要。而馬氏距離不受量綱影響,可以排除不同變量間的相關(guān)性干擾,能計(jì)算樣本與不同總體間的相似性,因而更適合用來(lái)判斷故障類(lèi)別。

      2.2.1 馬氏距離 分別計(jì)算待判樣本到每一個(gè)類(lèi)別的馬氏距離,則該樣本點(diǎn)屬于馬氏距離值最小的那一類(lèi)。

      具體判別規(guī)則如下:

      雖然通過(guò)馬氏距離能夠有效且快速地對(duì)大多數(shù)故障樣本進(jìn)行準(zhǔn)確分類(lèi),但是對(duì)于不同類(lèi)別邊界上的數(shù)據(jù)歸類(lèi)仍然存在較大的錯(cuò)誤率,歸類(lèi)模糊。因此考慮使用-NN算法來(lái)對(duì)樣本進(jìn)行歸類(lèi)。

      -NN算法根據(jù)與待判樣本最鄰近的個(gè)樣本來(lái)決定歸類(lèi),具有很好的分類(lèi)能力。但是-NN算法本身也存在一些不足:①-NN算法需要存儲(chǔ)全部訓(xùn)練樣本,具有繁復(fù)的距離計(jì)算量;②-NN算法沒(méi)有考慮距離遠(yuǎn)近,當(dāng)樣本不平衡時(shí),可能導(dǎo)致待判樣本直接歸入大數(shù)量類(lèi)的類(lèi)別,從而導(dǎo)致誤判。針對(duì)以上兩點(diǎn),提出了相應(yīng)的改進(jìn)措施:①僅僅針對(duì)占少量的邊界樣本采用-NN算法,其余大多數(shù)樣本仍然采用馬氏距離來(lái)判別;②采用加權(quán)的方法來(lái)改進(jìn)-NN算法,將距離因素考慮在內(nèi),提升判斷的準(zhǔn)確率。

      2.2.2 改進(jìn)-NN 具體做法如下:

      (1)找出邊界點(diǎn)。求出待判樣本距離每個(gè)類(lèi)別的歐式距離dis1, dis2, …, dis,按照距離由小到大排序?yàn)閐is'1, dis'2, …, dis',邊界判別標(biāo)準(zhǔn)如下

      式中閾值參數(shù)是一個(gè)(0,1)間的小數(shù)。當(dāng)滿(mǎn)足式(9)時(shí),認(rèn)為待判樣本屬于邊界點(diǎn)。

      (2)針對(duì)確定為邊界點(diǎn)的待判樣本點(diǎn),求出距離待判點(diǎn)最近的個(gè)樣本點(diǎn)1,2, …,z到待判點(diǎn)的距離dis1, dis2, …, dis。設(shè)函數(shù)(dis)=1/dis,表示和待判樣本點(diǎn)距離小的鄰近點(diǎn)權(quán)值大,這與加權(quán)的初衷相吻合。記這個(gè)樣本點(diǎn)屬于個(gè)類(lèi)別G1,G2, …,G,該待判樣本屬于樣本點(diǎn)加權(quán)和最大的類(lèi)。判別準(zhǔn)則如下:若

      2.3 故障診斷算法的具體步驟

      經(jīng)過(guò)對(duì)傳統(tǒng)的核Fisher方法的改進(jìn),能夠很大程度地提高故障診斷正確率,具體的算法步驟如下:

      (1)采集原始故障數(shù)據(jù),對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,并將處理后的數(shù)據(jù)分為兩部分:訓(xùn)練集和測(cè)試集。

      (2)將訓(xùn)練集輸入改進(jìn)類(lèi)間距的核Fisher方法中,用交叉驗(yàn)證法優(yōu)化選取RBF核函數(shù)的參數(shù)。

      (3)輸入測(cè)試集,根據(jù)式(9)判斷測(cè)試數(shù)據(jù)是否為邊界點(diǎn)。

      (4)如果測(cè)試數(shù)據(jù)不是邊界點(diǎn),則采用馬氏距離來(lái)判斷該數(shù)據(jù)的故障類(lèi)別。

      (5)如果測(cè)試數(shù)據(jù)是邊界點(diǎn),則用改進(jìn)后的-NN算法來(lái)判別該數(shù)據(jù)的類(lèi)別屬性。

      3 故障診斷的實(shí)驗(yàn)及分析

      本研究依托于田納西-伊斯曼過(guò)程來(lái)驗(yàn)證算法的正確性。TE過(guò)程是伊斯曼化工公司創(chuàng)建的一個(gè)真實(shí)工業(yè)過(guò)程仿真,該過(guò)程作為各種統(tǒng)計(jì)數(shù)據(jù)分析算法的數(shù)據(jù)源,得到了廣泛的認(rèn)可與運(yùn)用。TE過(guò)程包括5個(gè)主要過(guò)程單元:反應(yīng)器、冷凝器、壓縮機(jī)、分離器、汽提塔。該過(guò)程包含12個(gè)控制變量,41個(gè)觀測(cè)變量,20個(gè)類(lèi)型的典型故障,文獻(xiàn)[29]對(duì)其有詳細(xì)描述。

      3.1 實(shí)驗(yàn)1:數(shù)據(jù)歸類(lèi)模糊的故障診斷實(shí)驗(yàn)

      在文獻(xiàn)[30]中提到,有3種典型的故障類(lèi)別(故障4、故障9、故障11),其原始觀測(cè)數(shù)據(jù)空間重疊嚴(yán)重,各類(lèi)別之間具有很強(qiáng)的非線(xiàn)性,如圖1所示。

      同時(shí),在文獻(xiàn)[30]中經(jīng)過(guò)實(shí)驗(yàn)證明,特征9和51與輸出故障類(lèi)型間具有很高的互信息值,對(duì)區(qū)分故障類(lèi)別能提供很多的有用信息,而且選用特征{51,9},所建的故障診斷模型簡(jiǎn)單,因此本研究選擇特征{51,9}來(lái)對(duì)故障4、9、11進(jìn)行區(qū)分。

      對(duì)于故障4、9、11每一種類(lèi)型,各自選用兩組數(shù)據(jù):訓(xùn)練集和測(cè)試集,各自包含400個(gè)樣本。即訓(xùn)練集共400×3個(gè)樣本,測(cè)試集共400×3個(gè)樣本,且每個(gè)樣本包含2個(gè)特征,特征51和9。

      采用傳統(tǒng)的核Fisher對(duì)訓(xùn)練集進(jìn)行投影,投影效果如圖2所示(為方便觀看,每類(lèi)故障僅畫(huà)了100個(gè)樣本的投影情況)。

      由圖2可以看出,3類(lèi)故障數(shù)據(jù)的投影間距較均勻,沒(méi)有出現(xiàn)混疊現(xiàn)象,主要是投影邊界點(diǎn)處點(diǎn)存在歸類(lèi)困難問(wèn)題。

      針對(duì)上述采集到的故障數(shù)據(jù),輸入訓(xùn)練集共1200個(gè)樣本,測(cè)試集共1200個(gè)樣本,采用標(biāo)準(zhǔn)的核Fisher對(duì)樣本進(jìn)行投影,采用馬氏距離對(duì)所有樣本進(jìn)行故障分類(lèi),表1顯示的是隨著核參數(shù)的變數(shù),訓(xùn)練集和測(cè)試集的故障診斷準(zhǔn)確率的變化。

      表1 不同核參數(shù)δ的故障診斷結(jié)果

      通過(guò)表1可以看出,隨著核參數(shù)的增大,從0.01到100,測(cè)試樣本的故障診斷正確率并不是隨的變化呈遞增或遞減的關(guān)系,很難找出最優(yōu)的。目前對(duì)于核參數(shù)的選取并沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),在常用的參數(shù)選擇標(biāo)準(zhǔn)中,本研究采用的交叉驗(yàn)證法能得到的一個(gè)較優(yōu)值。

      對(duì)故障數(shù)據(jù)采用標(biāo)準(zhǔn)的核Fisher對(duì)樣本進(jìn)行投影,用馬氏距離結(jié)合改進(jìn)-NN的方法來(lái)進(jìn)行故障診斷。經(jīng)過(guò)交叉驗(yàn)證法選取核參數(shù)的平方取0.08。表2顯示的是隨著邊界判斷閾值的變化,訓(xùn)練集和測(cè)試集的故障診斷準(zhǔn)確率的變化。

      表2 不同閾值ε的故障診斷結(jié)果

      通過(guò)表2可以知道,當(dāng)閾值0.1≤≤0.6時(shí),隨著的增大,訓(xùn)練樣本的準(zhǔn)確率由93%提高到95.83%,測(cè)試樣本的準(zhǔn)確率由91.67%提高到92.83%,準(zhǔn)確率均有明顯增大。但是當(dāng)超過(guò)0.6以后,測(cè)試樣本的準(zhǔn)確率不再上升,始終保持著92.83%的準(zhǔn)確率,說(shuō)明對(duì)于>0.6的投影數(shù)據(jù),用改進(jìn)的-NN方法并不能有效提高故障診斷正確率,反而會(huì)增加診斷時(shí)間,如圖3所示。

      從圖3可以看出,隨著閾值的增大,越來(lái)越多的測(cè)試樣本投影后采用改進(jìn)的-NN算法來(lái)歸類(lèi),花費(fèi)的時(shí)間越來(lái)越長(zhǎng),=0.6時(shí),僅需要0.21 s,而當(dāng)=140時(shí),即幾乎所有的測(cè)試樣本投影后都用改進(jìn)的-NN算法歸類(lèi)時(shí),需要將近3 s。最重要的是,當(dāng)≥0.6后,測(cè)試精度基本都是92.83%,不再增大。通過(guò)以上分析可知,當(dāng)取0.6時(shí),在保證分類(lèi)精度達(dá)到最大的同時(shí),保證測(cè)試時(shí)間最短。

      將訓(xùn)練集和測(cè)試集通過(guò)核Fisher投影后,將投影樣本分別用傳統(tǒng)的歐式距離(method 1)、傳統(tǒng)的-NN算法(method 2)、馬氏距離結(jié)合改進(jìn)的-NN算法(method 3)進(jìn)行分類(lèi),得到的訓(xùn)練精度和測(cè)試精度見(jiàn)表3。

      表3 不同方法的故障診斷結(jié)果

      通過(guò)表3可以看出,用馬氏距離結(jié)合改進(jìn)的-NN算法能顯著提高核Fisher投影后的分類(lèi)效果,優(yōu)于傳統(tǒng)的分類(lèi)效果,無(wú)論是訓(xùn)練樣本,還是測(cè)試樣本,都提高了故障診斷正確率。

      前面都是采用核Fisher方法對(duì)樣本進(jìn)行投影,下面采用改進(jìn)類(lèi)間距的核Fisher方法對(duì)樣本進(jìn)行投影,得到取不同值時(shí)的投影圖像如圖4所示,并用馬氏距離結(jié)合改進(jìn)的-NN算法進(jìn)行故障分類(lèi),得到訓(xùn)練樣本和分類(lèi)樣本的診斷精度見(jiàn)表4。

      從表4可以看出,隨著的增大,訓(xùn)練精度和測(cè)試精度都幾乎不變。另外,改進(jìn)類(lèi)間距的核Fisher方法跟僅用核Fisher投影得到的診斷精度也相差不多。換言之,改進(jìn)類(lèi)間距幾乎不影響實(shí)驗(yàn)1數(shù)據(jù)的投影結(jié)果,從圖4(a)?(b)也可以看出這一點(diǎn)。而上述結(jié)論的得出也符合理論分析,因?yàn)橥ㄟ^(guò)圖2可以知道,實(shí)驗(yàn)1的3類(lèi)故障數(shù)據(jù)本身經(jīng)過(guò)核Fisher投影后,3類(lèi)投影數(shù)據(jù)間距相差不多,不存在某些類(lèi)信息被某類(lèi)信息覆蓋的情況,因此改進(jìn)類(lèi)間距對(duì)實(shí)驗(yàn)1數(shù)據(jù)幾乎沒(méi)有影響。

      表4 不同q值的故障診斷結(jié)果

      為了驗(yàn)證本研究所提方法的有效性,分別采用極限學(xué)習(xí)機(jī)(ELM)、支持向量機(jī)(SVM)、相關(guān)向量機(jī)(RVM)、本研究提出的基于改進(jìn)的核Fisher方法(MKF)分別對(duì)數(shù)據(jù)集進(jìn)行離線(xiàn)建模及故障診斷。其中,ELM模型選擇Sigmoid函數(shù)為激活函數(shù);SVM模型選擇RBF函數(shù)作為核函數(shù);RVM模型也選用高斯核函數(shù);本研究提出的方法MKF,其中核參數(shù)的平方取0.12,邊界閾值取0.6,權(quán)重函數(shù)參數(shù)取3。

      不同模型的測(cè)試樣本的故障診斷精度及診斷時(shí)間見(jiàn)表5。

      表5 4種模型的故障診斷結(jié)果

      通過(guò)表5可以看出,ELM模型測(cè)試時(shí)間最短,但是其測(cè)試精度是幾種模型中最低的。本研究所提出的方法MKF在保證較短的測(cè)試時(shí)間的情況下,測(cè)試精度是最高的,體現(xiàn)了其優(yōu)越性。

      3.2 實(shí)驗(yàn)2:數(shù)據(jù)混疊的故障診斷實(shí)驗(yàn)

      TE過(guò)程故障診斷,共有21種故障類(lèi)型,這21個(gè)故障都是預(yù)先設(shè)定的,其中前7類(lèi)故障類(lèi)型均為階躍的,選取其中的第3、4、5、7類(lèi)故障作為研究對(duì)象,見(jiàn)表6。

      表6 故障樣本集描述

      每一種故障類(lèi)型,取兩組數(shù)據(jù),即訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),每組數(shù)據(jù)各100個(gè)樣本,每個(gè)樣本由所有52個(gè)特征變量組成。訓(xùn)練集和測(cè)試集各包含400個(gè)樣本。

      對(duì)訓(xùn)練集樣本采用核Fisher投影,得到的在第一、二特征軸上的投影圖如圖5所示,核參數(shù)取200。同樣的對(duì)訓(xùn)練集樣本采用改進(jìn)類(lèi)間距的核Fisher投影,得到的投影圖如圖6所示,核參數(shù)取100,權(quán)重函數(shù)參數(shù)取3。

      通過(guò)圖5可以看出,通過(guò)核Fisher投影,得到的故障3和5的投影信息互相掩蓋,難以凸顯二者的類(lèi)間差異,不利于后續(xù)的分類(lèi)。而在圖6中,通過(guò)采用改進(jìn)類(lèi)間距的核Fisher投影,可以將故障3、5區(qū)分開(kāi)來(lái),增大兩者間的類(lèi)間距。

      采用改進(jìn)類(lèi)間距的核Fisher投影(不同的值)、核Fisher投影,用馬氏距離結(jié)合改進(jìn)-NN算法對(duì)樣本進(jìn)行分類(lèi),得到的故障診斷結(jié)果見(jiàn)表7。

      表7 不同方法的故障診斷結(jié)果

      由表7可以看出,改進(jìn)類(lèi)間距的核Fisher投影分類(lèi)方法明顯比核Fisher投影分類(lèi)方法要好,前者的訓(xùn)練樣本和測(cè)試樣本的診斷精度可以高達(dá)100%和99%,后者的診斷精度分別為95.25%和92.25%。

      通過(guò)對(duì)比上述兩個(gè)實(shí)驗(yàn)可以發(fā)現(xiàn),本研究提出的方法因?yàn)橐肓烁倪M(jìn)的類(lèi)間離散度計(jì)算方法,對(duì)于故障樣本3、4、5、7,投影后類(lèi)間距離呈現(xiàn)很大差異性的樣本,很好地改進(jìn)了樣本在投影空間的分布,更有利于故障的分類(lèi),而對(duì)于故障樣本4、9、11,投影后類(lèi)間距離差異性不大的樣本,沒(méi)有任何負(fù)作用。因而改進(jìn)類(lèi)間距的核Fisher方法對(duì)于類(lèi)間距離存在很大差異性的實(shí)驗(yàn)樣本具有良好的分類(lèi)效果。

      4 結(jié) 論

      化工過(guò)程產(chǎn)生了大量的故障數(shù)據(jù),這些故障數(shù)據(jù)呈現(xiàn)非線(xiàn)性特性,用傳統(tǒng)的核Fisher方法進(jìn)行投影后,部分故障樣本的映射空間仍然會(huì)出現(xiàn)混疊現(xiàn)象以及類(lèi)別邊界上數(shù)據(jù)歸類(lèi)模糊問(wèn)題,使分類(lèi)效果不是很理想,本研究有針對(duì)性地提出了改進(jìn)方法,改進(jìn)后的核Fisher方法具有通用性,不僅適用于映射樣本空間不同類(lèi)別數(shù)據(jù)出現(xiàn)混雜的情況,而且適用于映射樣本空間出現(xiàn)邊界樣本較多的情況。

      改進(jìn)的方法在TE平臺(tái)上得到了驗(yàn)證。本研究提出的方法一方面因?yàn)橐肓烁倪M(jìn)的類(lèi)間離散度計(jì)算方法,使得樣本數(shù)據(jù)在投影空間的區(qū)分度更加明顯,更利于后續(xù)的故障分類(lèi)。另一方面本方法改進(jìn)了投影后故障樣本的具體分類(lèi)方法,通過(guò)引入邊界閾值參數(shù),有效分離出了邊界樣本點(diǎn),通過(guò)改進(jìn)-NN算法,大大提高了邊界樣本點(diǎn)的分類(lèi)準(zhǔn)確率,通過(guò)馬氏距離與改進(jìn)-NN算法的配合,不僅有效兼顧了測(cè)試樣本的分類(lèi)時(shí)間,而且保證較高的分類(lèi)準(zhǔn)確率。在本研究提及的方法中,核參數(shù)的選擇方法有待做進(jìn)一步的深入研究。

      References

      [1] LENNOX B, HIDEN H G, MONTAGUE G A,. Application of multivariate statistical process control to batch operations[J]. Computers and Chemical Engineering, 2000, 24(2/3/4/5/6/7): 291-296.

      [2] 文成林, 呂菲亞, 包哲靜, 等. 基于數(shù)據(jù)驅(qū)動(dòng)的微小故障診斷方法綜述[J]. 自動(dòng)化學(xué)報(bào), 2016, 42(9): 1285-1299. WEN C L, Lü F Y, BAO Z J,. A review of data driven-based incipient fault diagnosis[J]. Acta Automatica Sinica, 2016, 42(9): 1285-1299.

      [3] 李晗, 蕭德云. 基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法綜述[J]. 控制與決策, 2011, 26(1): 1-9, 16. LI H, XIAO D Y. Survey on data driven fault diagnosis methods[J]. Control and Decision, 2011, 26(1): 1-9, 16.

      [4] 于春梅, 楊勝波, 陳馨, 等. 多元統(tǒng)計(jì)方法在故障診斷中的應(yīng)用綜述[J]. 計(jì)算機(jī)工程與應(yīng)用, 2007, 43(8): 205-208. YU C M, YANG S B, CHEN X,. Survey of multivariate statistical methods for fault diagnosis[J]. Computer Engineering and Applications, 2007, 43(8): 205-208.

      [5] 張可, 周東華, 柴毅, 等. 復(fù)合故障診斷技術(shù)綜述[J].控制理論與應(yīng)用, 2015, 32(9): 1143-1157. ZHANG K, ZHOU D H, CHAI Y,. Review of multiple fault diagnosis methods[J]. Control Theory & Applications, 2015, 32(9): 1143-1157.

      [6] 蘇中鮮. 基于數(shù)據(jù)驅(qū)動(dòng)的工業(yè)過(guò)程故障診斷方法綜述[J]. 軟件導(dǎo)刊, 2016, 15(3): 149-150. SU Z X. Review of fault diagnosis based on data-driven in industry process[J]. Software Guide, 2016, 15(3): 149-150.

      [7] SCHOLKOPF B, MIKA S, BURGES C J C,. Input space versus feature space in kernel-based methods[J]. IEEE Transactions on Neural Networks, 1999, 10(5): 1000-1016.

      [8] HU W P, HU H F. Heterogeneous face recognition based on modality-independent kernel Fisher discriminant analysis joint sparse auto-encoder[J]. Electronics Letters, 2016, 52(21): 1753-1755.

      [9] FRANCK D. A one-class kernel fisher criterion for outlier detection[J]. IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(5): 982-994.

      [10] BO L F, WANG L, JIAO L C. Feature scaling for kernel fisher discriminant analysis using leave-one-out cross validation[J]. Neural Computation, 2006, 18(4): 961-978.

      [11] VAN GESTEL T, SUYKENS J A K, LANCKRIET G,. Bayesian framework for least-squares support vector machine classifiers, Gaussian processes, and kernel Fisher discriminant analysis[J]. Neural Computation, 2002, 14(5): 1115-1147.

      [12] VOLKER R. Kernel Fisher discriminants for outlier detection[J]. Neural Computation, 2006, 18(4): 942-960.

      [13] JIANKE Z, STEVEN C H H, MICHAEL R L. Face annotation using transductive kernel Fisher discriminant[J]. IEEE Transactions on Multimedia, 2008, 10(1): 86-96.

      [14] LIU Q S, LU H Q, MA S D. Improving kernel Fisher discriminant analysis for face recognition[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2004, 14(1): 42-49.

      [15] SANG W L, ZEUNGNAM B. Representation of a Fisher criterion function in a kernel feature space[J]. IEEE Transactions on Neural Networks, 2010, 21(2): 333-339.

      [16] WON K J, SAUNDERS C, PRüGEL-BENNETT A. Evolving Fisher kernels for biological sequence classification[J]. Evolutionary Computation, 2013, 21(1): 83-105.

      [17] 祝志博, 宋執(zhí)環(huán). 故障分離——一種基于FDA-SVDD的模式分類(lèi)算法[J]. 化工學(xué)報(bào), 2009, 60(8): 2010-2016. ZHU Z B, SONG Z H. Fault isolation: an FDA-SVDD based pattern classification algorithm[J]. CIESC Journal, 2009, 60(8): 2010-2016.

      [18] SHI H T, LIU J C, WU Y H,. Fault diagnosis of nonlinear and large-scale processes using novel modified kernel Fisher discriminant analysis approach[J]. International Journal of Systems Science, 2016, 47(5): 1095-1109.

      [19] 李鋒, 王家序, 湯寶平, 等.有監(jiān)督不相關(guān)局部Fisher判別分析故障診斷[J]. 振動(dòng)工程學(xué)報(bào), 2015, 8(4): 657-665. LI F, WANG J X, TANG B P,. Fault diagnosis method based on supervised uncorrelated local Fisher discriminant analysis[J]. Journal of Vibration Engineering, 2015, 8(4): 657-665.

      [20] 王晶, 劉莉, 曹柳林, 等. 基于核Fisher包絡(luò)分析的間歇過(guò)程故障診斷[J]. 化工學(xué)報(bào), 2014, 65(4): 1317-1326. WANG J, LIU L, CAO L L,Fault diagnosis based on kernel Fisher envelope surface for batch processes[J]. CIESC Journal, 2014, 65(4): 1317-1326.

      [21] 趙旭, 閻威武, 邵惠鶴, 等. 基于核Fisher判別分析方法的非線(xiàn)性統(tǒng)計(jì)過(guò)程監(jiān)控與故障診斷[J]. 化工學(xué)報(bào), 2007, 58(4): 951-956. ZHAO X, YAN W W, SHAO H H,. Nonlinear statistical process monitoring and fault diagnosis based on kernel Fisher discriminant analysis[J]. Journal of Chemical Industry and Engineering(China), 2007, 58(4): 951-956.

      [22] 蘇祖強(qiáng), 湯寶平, 劉自然, 等. 基于正交半監(jiān)督局部Fisher判別分析的故障診斷[J]. 機(jī)械工程學(xué)報(bào), 2014, 50(18): 7-13. SU Z Q, TANG B P, LIU Z R,. Fault diagnosis method based on orthogonal semi-supervised local Fisher discriminant analysis[J]. Journal of Mechanical Engineering, 2014, 50(18): 7-13.

      [23] MIKA S, RATSCH G, WESTON J,. Fisher discriminant analysis with kernels[C]// Proceeding of the IEEE International Workshop on Neural Networks for Signal Processing, 1999: 41-48.

      [24] 彭陳松. 基于核函數(shù)Fisher判別的數(shù)據(jù)分類(lèi)算法研究[D]. 杭州: 浙江理工大學(xué), 2011. PENG C S. Data classification algorithm based on kernel Fisher discriminant[D]. Hangzhou: Zhejiang Sci-Tech University, 2011.

      [25] 王煒, 郭小明, 王淑艷, 等. 關(guān)于核函數(shù)選取的方法[J]. 遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2008, 31(1): 1-4. WANG W, GUO X M, WANG S Y,On the method of kernel-function selection in support vector machine[J]. Journal of Liaoning Normal University (Natural Science Edition), 2008, 31(1): 1-4.

      [26] 武優(yōu)西, 郭磊, 柴欣, 等. 基于優(yōu)化算法的核函數(shù)參數(shù)選擇的研究[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2010, 27(1): 137-140. WU Y X, GUO L, CHAI X,. On parameter selection of kernel function based on optimisation algorithm[J]. Computer Applications and Software, 2010, 27(1): 137-140.

      [27] 張翔, 肖小玲, 徐光祐, 等. 一種確定高斯核模型參數(shù)的新方法[J]. 計(jì)算機(jī)工程, 2007, 33(12): 52-53, 56. ZHANG X, XIAO X L, XU G Y,A new method for determining the parameter of Gaussian kernel[J]. Computer Engineering, 2007, 33(12): 52-53, 56.

      [28] DAI G, YEUNG D Y, QIAN Y T. Face recognition using a kernel fractional-step discriminant analysis algorithm[J]. Pattern Recognition, 2007, 40(1): 229-243.

      [29] DOWNS J J, VOGEL E F. A plant-wide industrial process control problem[J]. Computers and Chemical Engineering, 1993, 17(3): 245-255.

      [30] 呂寧, 于曉洋. 基于二階互信息特征選取的TE過(guò)程故障診斷[J]. 化工學(xué)報(bào), 2009, 60(9): 2252-2258. Lü N, YU X Y. Fault diagnosis in TE process based on feature selectionsecond order mutual information[J]. CIESC Journal, 2009, 60(9): 2252-2258.

      A fault diagnosis method based on improved kernel Fisher

      MA Liling, XU Fafu, WANG Junzheng

      (College of Automation, Beijing Institute of Technology, Beijing 100081, China)

      A fault diagnosis method of kernel Fisher projection was proposed to solve issues of nonlinear data, complex classes, and difficult fault-diagnosing in chemical processes. The proposed method provided a uniform solution for partial sample mix-up induced by a large difference in category distances and nebulous classification of different category’s boundary data after projection of the original data sample. First, an improved category distance was used to change sample distribution in the projection space so that the sample had a good projection. Then, boundary data was screened out by a defined threshold parameter and classified by improved-Nearest Neighbor (-NN) algorithm, which none-boundary data was classified by Mahalanobis distance. Simulation in a TE process showed that training accuracy was increased by 2.25% and testing accuracy was increased by 2.41% in the first experiment, whereas training accuracy was increased by 4.75% and testing accuracy was increased by 6.75% in the second experiment. Therefore, the method improved both fault diagnosis time and accuracy.

      kernel Fisher; fault diagnosis; improved-NN algorithm; experimental verification; optimizing

      10.11949/j.issn.0438-1157.20161000

      TP 277

      A

      0438—1157(2017)03—1041—08

      國(guó)家自然科學(xué)基金項(xiàng)目(61503027)。

      2016-07-14收到初稿,2016-11-23收到修改稿。

      聯(lián)系人:徐發(fā)富。第一作者:馬立玲(1974—),女,博士,副教授。

      2016-07-14.

      XU Fafu, bitrenqq@sina.com

      supported by the National Natural Science Foundation of China (61503027).

      猜你喜歡
      投影故障診斷距離
      解變分不等式的一種二次投影算法
      基于最大相關(guān)熵的簇稀疏仿射投影算法
      找投影
      找投影
      算距離
      每次失敗都會(huì)距離成功更近一步
      山東青年(2016年3期)2016-02-28 14:25:55
      因果圖定性分析法及其在故障診斷中的應(yīng)用
      愛(ài)的距離
      母子健康(2015年1期)2015-02-28 11:21:33
      基于LCD和排列熵的滾動(dòng)軸承故障診斷
      距離有多遠(yuǎn)
      桃园县| 靖江市| 来宾市| 永善县| 漳州市| 巴林右旗| 清镇市| 朝阳市| 行唐县| 双柏县| 茶陵县| 莱阳市| 青龙| 许昌市| 柳江县| 崇阳县| 黄石市| 枞阳县| 托克托县| 大竹县| 怀安县| 泰安市| 延寿县| 大英县| 达尔| 旬邑县| 手游| 仙游县| 乐山市| 卓尼县| 晋城| 常山县| 玉山县| 射洪县| 句容市| 杭锦旗| 扬州市| 安庆市| 长海县| 禹州市| 肃宁县|