• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)深度的過程工業(yè)故障檢測方法

      2020-01-06 02:18:00車建國
      計算機(jī)工程與應(yīng)用 2020年1期
      關(guān)鍵詞:馬氏閾值深度

      車建國,趙 賽

      南開大學(xué) 商學(xué)院,天津300071

      1 引言

      過程工業(yè)也稱流程工業(yè),是指加工制造流程性物質(zhì)產(chǎn)品的制造業(yè),化工、煉油、冶金、輕工、建材、制藥等行業(yè)均屬于過程工業(yè)。隨著現(xiàn)代過程工業(yè)的發(fā)展,產(chǎn)品多以大批量的形式生產(chǎn)制造,由于其生產(chǎn)過程往往具有投入成本高、事故后果嚴(yán)重等特點,一旦某個過程發(fā)生了故障,有可能會引起整個生產(chǎn)的故障發(fā)生或者導(dǎo)致生產(chǎn)停止,嚴(yán)重的甚至可能危及生命安全、造成巨大損失。因此對過程工業(yè)的生產(chǎn)過程進(jìn)行監(jiān)控有著十分重要的意義,可以有效地減少無效投入、避免事故發(fā)生等。

      過程工業(yè)的質(zhì)量監(jiān)控中最重要的就是故障檢測,即根據(jù)系統(tǒng)的過程參數(shù)變量來提取能反映系統(tǒng)異常變化或故障特征的信息,進(jìn)而判斷當(dāng)前運行的系統(tǒng)是否處于受控狀態(tài),若檢測到故障發(fā)生則應(yīng)當(dāng)立即報警,以便管理人員采取相應(yīng)的措施。目前常用的故障檢測方法可以大致分為基于統(tǒng)計模型的方法、基于距離的方法、線性變換及非線性變換的方法。主元分析(PCA)作為一種多元統(tǒng)計分析方法,由于其易用性被廣泛地用于多元過程工業(yè)的故障檢測[1-2],它利用多元投影的方法將多變量樣本空間分解成由主元空間張成的較低維的投影子空間和一個相應(yīng)的殘差子空間,分別在這兩個子空間進(jìn)行投影,并計算相應(yīng)的統(tǒng)計量進(jìn)行過程監(jiān)控。但主元分析只適用于處理多元數(shù)據(jù)的線性關(guān)系,對于非線性關(guān)系不能很好地進(jìn)行特征提取,于是有學(xué)者提出核主元分析(KPCA),通過將輸入數(shù)據(jù)映射到高維空間中來解決過程數(shù)據(jù)間的非線性關(guān)系[3-4]。此外,還有學(xué)者將小波去噪與核主元分析方法結(jié)合應(yīng)用于故障檢測[5],但基于傳統(tǒng)多元統(tǒng)計的方法大都要求輸入數(shù)據(jù)的總體滿足一定的分布形態(tài),而現(xiàn)實中對過程工業(yè)變量的分布大多是未知的,這樣使得檢測結(jié)果的穩(wěn)健性無法得到保證。近年來,許多機(jī)器學(xué)習(xí)的分類算法如人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)[4,6]取得了積極的進(jìn)展,這對于故障診斷領(lǐng)域的理論發(fā)展和實際應(yīng)用具有良好的推動作用,但這些方法只強調(diào)輸出結(jié)果(故障與否),忽略了過程工業(yè)樣本點本身的位置、尺度等特征,難以解釋各樣本數(shù)據(jù)之間的關(guān)系如偏離正常運行狀態(tài)的程度。

      數(shù)據(jù)深度(統(tǒng)計深度)是用“深度”來度量某樣本點相對總體的位置,越靠近中心的樣本點深度值越大(越“深”),越偏離中心的樣本點深度值越?。ㄔ健皽\”)。作為近年來蓬勃發(fā)展的一種統(tǒng)計方法,數(shù)據(jù)深度本身用于解決多元數(shù)據(jù)的排序問題,其規(guī)范定義由左義君等給出,并介紹了統(tǒng)計深度函數(shù)應(yīng)該具有的四個性質(zhì)[7]。數(shù)據(jù)深度函數(shù)在統(tǒng)計推斷時具有良好的仿射不變性和穩(wěn)健性估計,當(dāng)數(shù)據(jù)污染時仍然能得到很好的位置估計[8]??紤]深度值從中心向外單調(diào)遞減的特性,有學(xué)者提出了根據(jù)深度值判斷數(shù)據(jù)是否異常的檢測模型,并通過實例證明了該檢測方法的有效性[9]。由于數(shù)據(jù)深度具有良好的非參數(shù)穩(wěn)健性,近年來越來越多地被應(yīng)用于位置推斷、回歸分析、多元非參控制圖和多元數(shù)據(jù)的判別與分類問題[10-12]。

      考慮到相對于正常運行狀態(tài)下的樣本集,待測樣本的深度值越小越有可能是故障樣本,結(jié)合數(shù)據(jù)深度的非參數(shù)特性,構(gòu)造深度值的秩統(tǒng)計量漸近分布,提出基于數(shù)據(jù)深度的故障檢測方法,將數(shù)據(jù)深度技術(shù)應(yīng)用于復(fù)雜過程工業(yè)的質(zhì)量監(jiān)控。通過對TE過程故障檢測結(jié)果的分析,驗證了該方法的有效性,為實際過程工業(yè)的故障檢測提供了一定的決策參考。

      2 基于數(shù)據(jù)深度的故障檢測

      目前學(xué)者提出的深度函數(shù)有很多,如馬氏深度、空間深度、半空間深度、單純形深度、投影深度等,而在這些深度函數(shù)中,空間深度和馬氏深度由于計算復(fù)雜度較低且其復(fù)雜度不隨數(shù)據(jù)維數(shù)的增大而增大,被廣泛應(yīng)用于監(jiān)測和分類問題[12-14]。

      馬氏深度(Mahalanobis Depth,MD):

      其中x ∈Rn為待測樣本,F(xiàn) 為總體的累積分布函數(shù),μ,Σ 分別為總體的均值向量和協(xié)方差矩陣,在實際計算時可用樣本的均值向量、協(xié)方差矩陣來代替。

      空間深度(Spatial Depth,SD):

      其中x,y ∈Rn,F(xiàn) 為總體的累積分布函數(shù),x ∈Rn為待測樣本點,為歐幾里得范數(shù)。當(dāng)總體分布F 未知時,樣本形式的空間深度如下:

      其中X={ x1,x2,…,xl} 為l 個n 維樣本,x ∈Rn為待測樣本。

      可以看出,不管馬氏深度還是空間深度,某一樣本點的深度值總是在[ ]0,1 之間,樣本點從中心向外移動的過程中其深度值遞減。對于馬氏深度,在總體的均值向量μ 處取最大深度1;對于空間深度,在滿足的點x(x ∈Rn)處取最大值1,點x 稱為空間中位向量(由一維中位數(shù)推廣而來)。當(dāng)總體不滿足對稱分布時,中位向量要比均值向量更能代表總體中心的位置,具有更穩(wěn)健的位置估計。

      從空間深度的定義中可以看出,深度值的大小取決于從待測樣本點x 到X 中每個樣本點的累積方向向量的模,這在一定程度上只考慮了偏離的方向,而忽略了偏離的距離度量,尤其對于高維數(shù)據(jù),可能無法代表真實數(shù)據(jù)的分布偏離特征,文獻(xiàn)[9]以半月形數(shù)據(jù)和環(huán)形數(shù)據(jù)為例驗證了這一情況。為了綜合考慮待測樣本點x 與總體X 中各樣本點的距離差異(相似度差異),引入核方法,如最常用的高斯徑向基核函數(shù)k(x,y)=考慮到:

      使用高斯核函數(shù)k(?)代替內(nèi)積,得到核化的樣本形式的空間深度(Kernelized Spatial Depth,KSD):

      前文提到,由于數(shù)據(jù)深度反映了樣本點與中心的偏離程度,待測樣本的深度值越小說明其離中心越遠(yuǎn),因此深度值越小的待測樣本越有可能是故障樣本,而且數(shù)據(jù)深度本身具有很好的非參數(shù)特性,因此可以利用非參數(shù)秩統(tǒng)計量的有關(guān)性質(zhì)來判斷樣本點是否異常。

      假設(shè)y1,y2,…,yn為n 個來自總體X 的驗證集樣本,將這n 個驗證集樣本代入式1(式4),分別得到其相對于訓(xùn)練集X 的馬氏深度值(核空間深度值)Di。將D1,D2,…,Dn這n 個驗證集樣本的深度值從小到大進(jìn)行排序即當(dāng)時定義Ri=r,即得到各樣本點對應(yīng)的秩。

      記R=(R1,R2,…,Rn),很容易得到R 的所有取值有n!種可能,即

      故秩統(tǒng)計量R=(R1,R2,…,Rn)服從離散均勻分布,且R=(R1,R2,…,Rn)的邊緣分布也是均勻分布。特別地,一維均勻分布有:

      二維均勻分布有:

      從而可以得到:

      根據(jù)線性秩統(tǒng)計量的漸近正態(tài)性[15],當(dāng)樣本量足夠大時,構(gòu)造

      給定顯著性水平α 后,可以用該近似公式得到拒絕域的臨界值Rα,對應(yīng)可得到深度值的閾值MDα和KSDα。確定相應(yīng)的閾值后,若待測樣本的深度值小于該閾值,則將該樣本對應(yīng)的狀態(tài)視為故障狀態(tài),否則為正常狀態(tài)。

      使用核空間深度(馬氏深度)進(jìn)行過程工業(yè)故障檢測的步驟如下:

      (1)獲得正常運行過程下的訓(xùn)練集數(shù)據(jù)X (X ∈Rl×n),對X 進(jìn)行列標(biāo)準(zhǔn)化處理,即1,2,…,n,E(Xi)和std(Xi)分別為列變量Xi的均值和標(biāo)準(zhǔn)差。

      (2)根據(jù)訓(xùn)練集數(shù)據(jù)建立深度函數(shù)模型(對于核空間深度需要確定核參數(shù)σ)。

      (3)獲得正常運行過程下的驗證集數(shù)據(jù)Y(Y ∈Rl'×n),代入(2)中模型計算深度值,根據(jù)式(7)來確定相應(yīng)深度函數(shù)的閾值。

      (4)對待測樣本按(1)中求得的E(Xi)和std(Xi)進(jìn)行標(biāo)準(zhǔn)化處理。

      (5)對經(jīng)過標(biāo)準(zhǔn)化處理的待測樣本,根據(jù)(2)中模型計算其深度值,與對應(yīng)的閾值相比較,若小于閾值則視為故障狀態(tài),否則視為正常狀態(tài)。

      這樣就建立了基于數(shù)據(jù)深度的故障檢測模型,根據(jù)此模型可以用來檢測新的待測過程樣本是否正常,即判斷生產(chǎn)過程是否處于受控狀態(tài),以便管理人員采取相應(yīng)的措施。接下來以TE 過程為例,來驗證該檢測方法的有效性。

      3 TE過程介紹

      TE 過程(Tenessee-Eastman Process)是由美國伊士曼化學(xué)公司控制小組的Downs 和Vogel 提出并創(chuàng)建的,目的是為評價過程控制和監(jiān)控方法提供一個現(xiàn)實的工業(yè)過程。TE 過程具有一般過程工業(yè)的典型特征,其變量眾多、強耦合、非線性且具有不確定性,因而成為國際公認(rèn)的監(jiān)測和控制領(lǐng)域最常用的檢測算法性能的過程之一,也一直被認(rèn)為是一個富有挑戰(zhàn)性的問題,很多學(xué)者使用TE過程來檢驗算法的有效性[16]。

      TE 過程主要包括5 個單元:反應(yīng)器、冷凝器、壓縮器、分離器和汽提塔,生產(chǎn)過程包含8種成分,生產(chǎn)過程包含41個測量變量(XMEAS(1)~XMEAS(22)為測量,采樣間隔為3 min,XMEAS(23)~XMEAS(41)為生產(chǎn)過程成分組分,所有過程測量均包含高斯噪聲)和12個控制變量(XMV(1)~XMV(12)),共52 個觀測變量(除攪拌器速度)。

      仿真包括21個預(yù)設(shè)的故障類型,故障0表示正常工況,故障1~16及故障21已知,其中故障1~7與過程變量的階躍變化有關(guān),如冷水入口溫度或者進(jìn)料成分的變化;故障8~12 與一些過程變量的可變性增大有關(guān),故障13 是反應(yīng)動力學(xué)中的緩慢漂移,故障14、15 和21 與粘滯閥有關(guān),故障16~20未知。

      正常狀況的訓(xùn)練集數(shù)據(jù)是在25 h 仿真運行下采集的,共500 個;正常狀況的測試集數(shù)據(jù)是在48 h 仿真運行下采集的,共960個。故障類型的訓(xùn)練集數(shù)據(jù)也是在25 h仿真運行下采集,但故障從1 h引入,觀測數(shù)據(jù)是在引入故障后才開始采集的,即只有480 個觀測值;故障類型的測試集數(shù)據(jù)也是在48 h 仿真運行下采集的,共960 個,但故障在第8 h 引入,即前160 個觀測值是正常工況的樣本數(shù)據(jù)。

      4 結(jié)果對比分析

      對于每種故障類別,先根據(jù)500個正常訓(xùn)練集樣本建立模型,使用600個正常驗證集樣本來確定閾值t,然后進(jìn)行測試集樣本的故障檢測,即分別計算對應(yīng)故障類別的16 個小時運行狀態(tài)下的測試集樣本的深度值,其中故障從8 h引入,即第1~160個樣本為正常運行狀態(tài),第161~320個樣本為故障狀態(tài),得到各自的馬氏深度值MD、核空間深度值KSD。在計算核空間深度時使用高斯徑向基核函數(shù),其中經(jīng)多次實驗取σ=25。取顯著性水平α=0.05,根據(jù)500個訓(xùn)練集樣本和600 個驗證集樣本,分別得到核空間深度閾值tKSD=0.192 0,馬氏深度閾值tMD=0.011 1。以故障1為例,圖1和圖2分別為320個故障1測試集樣本的核空間深度值與馬氏深度值。

      可以看出,對于故障1,核空間深度將156個故障樣本檢測出來,檢測效率97.5%,僅將1個正常樣本誤判為故障,誤報警率0.63%;馬氏深度將159個故障樣本檢測出來,檢測效率99.38%,同時將4 個正常樣本誤判為故障,誤報警率2.5%。

      圖1 故障1測試集樣本的核空間深度值

      圖2 故障1測試集樣本的馬氏深度值

      為了進(jìn)行對比,使用主元分析也進(jìn)行故障檢測,步驟如下:

      (1)獲得正常運行過程下訓(xùn)練集數(shù)據(jù)X(X ∈Rl×n),對X 進(jìn)行列標(biāo)準(zhǔn)化處理,即E(Xi)和std(Xi)分別為列變量Xi的均值和標(biāo)準(zhǔn)差。

      (2)對標(biāo)準(zhǔn)化后的矩陣Z 進(jìn)行主成分分析,根據(jù)累計方差貢獻(xiàn)度≥80%提取前a 個主成分,對應(yīng)的主成分方差為λ1,λ2,…,λa,相應(yīng)的標(biāo)準(zhǔn)正交特征向量為P1,P2,…,Pa,P=(P1,P2,…,Pa),Σ=diag(λ1,λ2,…,λa)。

      (3)對于待測樣本根據(jù)(1)中E(Xi)和std(Xi)進(jìn)行標(biāo)準(zhǔn)化處理。

      (4)對于(3)標(biāo)準(zhǔn)化處理后的樣本數(shù)據(jù),計算其Hotelling T2統(tǒng)計量:

      (5)控制限閾值為:

      比較(4)計算的統(tǒng)計量是否超過閾值,若超過,則該樣本對應(yīng)的工況為故障狀態(tài),否則為正常狀態(tài)。

      本例中共500 個訓(xùn)練集樣本,原始變量為52 個,提取24個主成分,累積方差貢獻(xiàn)度80.51%,取顯著性水平α=0.05,對應(yīng)的控制限閾值為38.83。

      由于T2統(tǒng)計量只反映前a 個奇異值對應(yīng)的得分,而不能反映最小的n-a 個奇異值對應(yīng)的部分,因而引入SPE 統(tǒng)計量(Q 統(tǒng)計量)。步驟同上,SPE 統(tǒng)計量:

      本例中n=52,a=24,取α=0.05,可得SPE統(tǒng)計量的閾值為16.496。圖3、4分別為故障1的320個測試集樣本基于主元分析的Hotelling T2統(tǒng)計量值與SPE統(tǒng)計量值。

      其中,I 為單位矩陣,

      圖3 故障1測試集樣本的Hotelling T2 統(tǒng)計量

      圖4 故障1測試集樣本的SPE統(tǒng)計量

      對于故障1,Hotelling T2統(tǒng)計量將156個故障樣本識別出來,檢測效率97.5%,同時將6個正常樣本誤判為故障,誤報警率3.75%;SPE統(tǒng)計量將160個故障樣本識別出來,檢測效率100%,但同時將54 個正常樣本誤判為故障,誤報警率高達(dá)33.75%。

      故障1 是A/C 組分比例擾動,由于反應(yīng)物A 和C 的比例發(fā)生變化,與物質(zhì)平衡有關(guān)的變量(例如液位、壓力、成分)的分配關(guān)系也會跟著變化,導(dǎo)致超過半數(shù)的監(jiān)控變量明顯偏離了它們的正常運行特性[17],所以很容易被檢測出來,除了SPE 統(tǒng)計量有較高的誤報警率外,其他三種檢測方法的效果都較為理想。

      下面以故障4為例進(jìn)行分析,如圖5~8。

      圖5 故障4測試集樣本的核空間深度值

      圖6 故障4測試集樣本的馬氏深度值

      圖7 故障4測試集樣本的Hotelling T2 統(tǒng)計量

      圖8 故障4測試集樣本的SPE統(tǒng)計量

      故障4是反應(yīng)器冷卻水入口變化的一個階躍變化,當(dāng)故障發(fā)生時,反應(yīng)器中的溫度會突然升高,但其他變量仍保持穩(wěn)定,與正常運行狀況下相比,每個變量的均值和標(biāo)準(zhǔn)差變化小于2%,這使得對此故障的檢測比故障1困難得多。

      結(jié)果顯示,使用核空間深度可以將128個故障樣本檢測出來,檢測效率80%,同時僅有1 個正常樣本被誤判為故障,誤報警率0.63%;馬氏深度將160個故障樣本全部檢測出來,檢測效率100%,同時將8個正常樣本誤判為故障,誤報警率5%。對于故障4 這種較為復(fù)雜的非線性故障類型,本文基于核空間深度和馬氏深度的故障檢測方法要比分塊的主元分析方法(BPCA)、一般的核主元分析方法(KPCA)、基于分塊的核主元分析方法(BKPCA)等效果更好[17-18];而使用Hotelling T2統(tǒng)計量僅能將76 個故障樣本識別出來,檢測效率47.5%;使用SPE 統(tǒng)計量雖然能達(dá)到100%的檢測效率,但同時將50個正常樣本誤判為故障,誤報警率高達(dá)31.25%,可以看出,主元分析對于這種復(fù)雜的強非線性變化所引起的故障是無效的,而基于核空間深度與馬氏深度的故障檢測方法卻能有著良好的檢測效果。

      對于其他具有代表性的各故障類型,四種檢測方法的檢測效率、誤報警率對比如表1、表2。

      表2 基于主元分析的各故障檢測結(jié)果%

      通過表1、表2 可以看出,對于絕大多數(shù)故障類型,基于數(shù)據(jù)深度的故障檢測方法都取得了良好的檢測效果,并且要優(yōu)于主元分析的Hotelling T2統(tǒng)計量與SPE統(tǒng)計量檢測方法。馬氏深度本身相對于Hotelling T2統(tǒng)計量與SPE統(tǒng)計量并無優(yōu)勢,但數(shù)據(jù)深度作為一種描述多元數(shù)據(jù)空間分布相對位置的方法,具有明顯的非參數(shù)穩(wěn)健特性,使得基于馬氏深度的故障檢測效果也相對較為滿意。核空間深度綜合了空間深度的魯棒性和基于核函數(shù)的偏離距離(相似度)的度量,在絕大多數(shù)情況下都能取得良好的故障檢測效果。

      文獻(xiàn)[9]也提供了一種基于數(shù)據(jù)深度的異常檢測方法,利用McDiarmid 不等式可以得到相應(yīng)深度值的閾值,應(yīng)用于本例中計算得到核空間深度值閾值為0.200 9、馬氏深度值閾值為0.011 5。根據(jù)文獻(xiàn)[9]方法計算的各故障類型檢測效果如表3。

      表3 文獻(xiàn)[9]方法的各檢測結(jié)果 %

      通過與本文所提出的方法的故障檢測結(jié)果對比可以看出,權(quán)衡誤報警率和檢測效率這兩個指標(biāo),本文通過構(gòu)造秩統(tǒng)計量的漸進(jìn)分布方法雖然簡單,但能取得更穩(wěn)健的故障檢測效果,尤其對于馬氏深度,在保證檢測效率的同時可以降低誤報警率,在對過程工業(yè)樣本數(shù)據(jù)無任何信息優(yōu)勢的情況下可以達(dá)到相對穩(wěn)健的效果。

      5 結(jié)束語

      本文使用核空間深度、馬氏深度這兩種數(shù)據(jù)深度并結(jié)合非參數(shù)秩統(tǒng)計量,提出基于數(shù)據(jù)深度的過程工業(yè)故障檢測方法,通過對TE 過程進(jìn)行故障檢測的建模及與其他方法的對比分析,發(fā)現(xiàn)基于數(shù)據(jù)深度的故障檢測結(jié)果要比基于主元分析的Hotelling T2統(tǒng)計量與SPE統(tǒng)計量檢測效果好,尤其是基于核空間深度的故障檢測方法,在多數(shù)情況下具有較高的檢測效率和較低的誤報警率,能取得滿意的故障檢測效果,可應(yīng)用于實際過程工業(yè)的質(zhì)量監(jiān)控,當(dāng)故障發(fā)生時能快速地識別出來,方便管理人員采取相應(yīng)的應(yīng)對措施,降低生產(chǎn)風(fēng)險。

      猜你喜歡
      馬氏閾值深度
      一類時間變換的強馬氏過程
      有環(huán)的可逆馬氏鏈的統(tǒng)計確認(rèn)
      深度理解一元一次方程
      關(guān)于樹指標(biāo)非齊次馬氏鏈的廣義熵遍歷定理
      小波閾值去噪在深小孔鉆削聲發(fā)射信號處理中的應(yīng)用
      深度觀察
      深度觀察
      基于自適應(yīng)閾值和連通域的隧道裂縫提取
      深度觀察
      一致可數(shù)可加馬氏鏈不變測度的存在性
      炉霍县| 辉县市| 佳木斯市| 湟源县| 海南省| 安塞县| 汝南县| 公安县| 岳阳县| 泗水县| 望城县| 邓州市| 砀山县| 南木林县| 岳西县| 中卫市| 富裕县| 麻江县| 孙吴县| 习水县| 山阴县| 浦江县| 合山市| 铁力市| 峨眉山市| 临安市| 淮滨县| 拜城县| 德惠市| 寿宁县| 叙永县| 黔江区| 白河县| 曲麻莱县| 柏乡县| 锡林浩特市| 通城县| 疏勒县| 弥勒县| 元江| 白沙|