• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于自適應動態(tài)時間規(guī)整(DTW)的GA- FCM多階段間歇過程故障診斷

      2019-10-16 09:00:28梁秀霞陳嬌嬌
      關鍵詞:誤報率間歇聚類

      梁秀霞 陳嬌嬌 嚴 婷 周 穎 張 燕

      (河北工業(yè)大學 人工智能與數(shù)據(jù)科學學院, 天津 300130)

      引 言

      間歇生產是重要的工業(yè)生產過程,由于具有體積小、價值高的優(yōu)點,廣泛應用于發(fā)酵工程、半導體制造等批量生產中[1-3]。近年來,間歇過程在工業(yè)化、集成化生產中所占的比例逐年升高,因此其安全性與可靠性也備受關注。

      間歇過程的生產特點使得生產過程中會出現(xiàn)數(shù)據(jù)不等長問題,Nomikos等[4]為解決該問題提出最短長度法,即將所有批次數(shù)據(jù)長度統(tǒng)一為眾多批次中數(shù)據(jù)長度最短的那批數(shù)據(jù)的長度,該方法雖然簡單,但是會造成數(shù)據(jù)的丟失,使數(shù)據(jù)之間的相關性降低;Cho等[5]實時計算待測生產過程中已知的測量數(shù)據(jù)與歷史過程數(shù)據(jù)相對應的那一部分距離,選擇距離最小的值所對應的批次,將該批次的過程數(shù)據(jù)用于數(shù)據(jù)填充,但是該方法計算量過于復雜且單純地把距離作為選取標準也不能代表實際生產過程中的一些潛在關系和特點。

      間歇過程還存在一個固有特性—多階段特性,即隨著生產過程的進行,控制目標和主導變量會隨之發(fā)生改變[6-8]。目前,多向核主元分析(MKPCA)方法在間歇過程中的應用較為常見[9],但傳統(tǒng)的MKPCA方法一般會使用整個批處理數(shù)據(jù)來構建模型,而忽略掉生產過程中的局部特征。針對多階段特性,梁小凡等[10]提出基于模糊C-均值算法的分時段過程監(jiān)控算法實現(xiàn)間歇過程的階段劃分,但是模糊C均值算法對初始聚類中心比較敏感,初始聚類中心選取不當會使階段劃分不準確,進而影響過程監(jiān)測的準確性。張成等[11]提出了一種模糊有序聚類算法,將模糊策略引入階段劃分中,但其只針對單獨的批次數(shù)據(jù)進行聚類,最后才整合數(shù)據(jù),準確度不高。

      針對上述間歇過程研究方法的不足,本文提出自適應動態(tài)時間規(guī)整(DTW)算法以解決數(shù)據(jù)不等長問題,實現(xiàn)了N個批次數(shù)據(jù)時間長度一致的目標。針對間歇過程多階段特性,采用遺傳算法與模糊C-均值聚類(FCM)算法相結合的方法(GA- FCM)對間歇過程進行階段劃分,之后用MKPCA對每個子階段分別建立模型并完成故障檢測。

      1 多向核主元分析故障診斷模型

      間歇生產的過程數(shù)據(jù)可以表示為三維矩陣X(I×J×K),I代表采樣批次,J代表過程變量,K代表采樣時刻。在建模時需要先將三維數(shù)據(jù)展開成二維數(shù)據(jù),展開方式主要有批次展開和變量展開[12-14],數(shù)據(jù)展開后MKPCA的建模過程與核主元分析(KPCA)相同。

      KPCA的基本思想是首先通過非線性映射將輸入空間映射到特征空間,然后提取該特征空間中的主要分量。設輸入樣本集Xh={x1,x2,…,xN},其中xk∈Rm,N為樣本數(shù)。通過非線性映射φ將輸入數(shù)據(jù)從輸入空間投影到KPCA空間,記為φ(xk)。定義核矩陣K=[Kβγ],其中

      Kβγ=k(xβ,xγ)=〈φ(xβ),φ(xγ)〉

      (1)

      引入核函數(shù)可以避免同時執(zhí)行非線性映射和計算特征空間中兩個向量內積的問題。對于任意測試向量x的主要分量t可按式(2)計算

      (2)

      式中,k=1,2,…,p,p為保留主元數(shù),α為歸一化后的核矩陣的特征向量。T2和SPE統(tǒng)計量及控制限可參考文獻[15]來計算。

      2 自適應DTW算法

      針對間歇生產過程中數(shù)據(jù)的不等長問題,采用一種時間長度自適應DTW算法,使采集的批次時間長度保持一致。本文采用歐氏距離計算兩軌跡A、B之間的點- 點距離,從而可以獲得a×b組局部距離。若設a×b中第λ個局部距離為d(μ(λ),η(λ)),則

      d(μ(λ),η(λ))={A[μ(λ),:]-B[η(λ),:]}W{A[μ(λ),:]-B[η(λ),:]}T

      (3)

      式中,μ(λ)、η(λ)表示樣本的時標,W是權矩陣,W=E,E是單位矩陣,A[μ(λ),:]表示A中第μ(λ)個行向量;B[η(λ),:]表示B中第η(λ)個行向量。在進行DTW算法同步化時求取的是兩軌跡之間的最短距離,在最短距離的基礎上實現(xiàn)數(shù)據(jù)的處理。

      用自適應DTW算法解決數(shù)據(jù)不等長問題時,計算采集的N批實驗數(shù)據(jù)平均時間長度L,選取N批里時間長度最接近L的批次Nq作為參考軌跡。當LNlLNq(l≠q)時進行非對稱式同步化,得到同步化后的N個批次數(shù)據(jù);將N個批次數(shù)據(jù)進行平均化得到參考軌跡Rref,平均化方式如式(4)

      (4)

      得到參考軌跡后,將N批原始數(shù)據(jù)分別與Rref進行對稱式DTW算法或非對稱式DTW算法同步化,得到時間長度一致的N個批次數(shù)據(jù)。

      將得到的N個批次的數(shù)據(jù)先按批次展開,然后進行標準化處理,將標準化后的數(shù)據(jù)再重新排列回X(I×J×K)的形式,然后再按變量展開,展開后沿時間軸方向將數(shù)據(jù)切割為K個時間片矩陣Tk(I×J),計算每個時間片矩陣Ti與其他時間片矩陣Tj的相似度,并將相似度矩陣S(S∈RK×K)作為聚類算法的輸入進行聚類分析。相似性度量的計算公式為

      (5)

      3 GA- FCM聚類算法的階段劃分

      3.1 FCM算法

      FCM算法是一種用0~1間的隸屬度來確定每個樣本點屬于各個組的程度的模糊聚類方法[16]。隸屬度在歸一化條件下滿足

      (6)

      FCM算法是一種最小化價值函數(shù)的迭代優(yōu)化算法,價值函數(shù)定義為

      (7)

      式中,ugh∈(0,1),cg為組g的聚類中心,w為模糊系數(shù),dgh=‖cg-sh‖為第g個聚類中心與第h個數(shù)據(jù)點間的歐氏距離。使式(7)達到最小的必要條件為

      (8)

      (9)

      FCM算法的缺點是對初始值較為敏感,初始值如果選取不合適會使聚類效果變差,因此本文使用遺傳算法對初始聚類中心進行參數(shù)尋優(yōu),改善FCM的聚類效果。

      3.2 GA- FCM算法

      遺傳算法是一種強大的隨機算法,它通過選擇目標函數(shù)將其與最優(yōu)性概念聯(lián)系起來,進而求得最優(yōu)解。遺傳算法是從代表問題可能解的一個種群開始的,并通過一些遺傳操作(如選擇、交叉和變異)有概率地修改種群,以尋求問題接近最優(yōu)的解決方案。

      3.2.1種群初始化

      Smin是相似性矩陣S每一維的最小值向量,Smax是相似性矩陣S每一維的最大值向量。首先通過隨機的方式在[Smin,Smax]區(qū)間內產生一代包含H個體的初始種群M1,該種群的計算方式為

      M1=

      (10)

      式中,M1為第一代群體,是一個H行1列的向量組,每一行是一個1×2 400的向量,代表一個個體,由2 400個染色體構成,每個染色體是一個十進制編碼的參數(shù)優(yōu)化值,rand(0,1)則是0,1之間的隨機數(shù)。

      3.2.2選擇

      選擇操作采用輪盤賭法,個體選擇概率為

      (11)

      圖1 編碼過程Fig.1 Coding process

      3.2.3適應度計算

      首先對當代種群的個體進行解碼,將二進制數(shù)轉換為十進制,再將各個個體的聚類中心從一維矩陣轉換為二維矩陣,如圖2所示。

      圖2 矩陣的轉換Fig.2 Matrix conversion

      適應度計算公式為

      (12)

      式中,D1為類內距離,表示同一模式點集內各樣本間的均方距離,計算式為

      (13)

      D2為類間距離,表示模式類之間的距離,計算式為

      (14)

      式中,Cr表示第r類樣本集的聚類中心,Ce表示第e類樣本集的聚類中心。

      選取迭代過程中適應度最小的聚類中心作為遺傳算法的解輸出,將輸出的聚類中心作為FCM算法的初始值代入式(7)~(9),進行FCM的聚類過程,實現(xiàn)階段劃分。

      改進FCM算法流程圖如圖3所示。

      圖3 改進FCM算法流程圖Fig.3 Flow chart of GA- FCM algorithm

      4 仿真結果

      本文采用的間歇過程是青霉素生產的模擬補料分批發(fā)酵過程,此生產過程具有非線性和多階段的特征。根據(jù)工藝菌體生長周期,青霉素發(fā)酵過程一般可以分為菌體生長、青霉素合成、菌體自溶3個階段。PenSim2.0是青霉素生產的模擬軟件,為檢測青霉素的生產提供了標準平臺,本文實驗數(shù)據(jù)均通過此軟件獲得。

      4.1 聚類有效性

      聚類有效性可用類內距離與類間距離之比來衡量,即

      (15)

      D1數(shù)值越小,聚類效果越好;D2數(shù)值越大,聚類效果越佳。將兩個指標結合起來,則F值越小代表聚類效果越好。

      圖5 正常批次仿真圖Fig.5 Results of normal batch simulation

      經式(15)計算可得,本文所提算法F值為1.6,F(xiàn)CM算法F值為2.3,可見本文所提算法聚類更為準確。

      4.2 故障檢測結果

      本文選擇了青霉素發(fā)酵過程中的17個變量進行研究,包括充氣率、攪拌器功率、底物流加速率、底物流溫度、底物濃度、溶解氧濃度、生物質濃度、青霉素濃度、培養(yǎng)體積、二氧化碳濃度、pH、生物反應器溫度、產生的熱量、酸流率、堿流率、冷水流量、熱水流量,模擬了20個發(fā)酵時間從390 h到410 h不等、采樣間隔為0.5 h的正常參考批次,其中這些批次的平均時間長度為400.2 h。選擇發(fā)酵時間為400 h的這一批數(shù)據(jù)為Nq。最終采集的20個批次數(shù)據(jù)的時間長度經過自適應DTW算法后均調整到400 h,實現(xiàn)了數(shù)據(jù)的等長。

      分別通過MKPCA算法、FCM- MKPCA算法和本文所提GA- FCM- MKPCA算法對間歇過程進行故障檢測。

      圖4為本文所提算法的聚類結果。由圖4可知,本文算法將間歇過程劃分為3個階段:1~188是第一階段;189~357是第二階段;358~800是第三階段。此階段劃分滿足青霉素實際生產過程的特點。階段劃分完成后,對3個階段分別建立MKPCA模型,進行故障檢測。

      圖4 GA- FCM算法階段劃分Fig.4 Stage division result of GA- FCM algorithm

      MKPCA算法、FCM- MKPCA算法和本文所提GA- FCM- MKPCA算法對正常批次的檢測結果如圖5所示。

      由圖5可知,MKPCA算法T2誤報率為12.35%,F(xiàn)CM- MKPCA算法T2誤報率為1.95%,而本文所提方法將T2誤報率降到了0.9%;MKPCA算法SPE誤報率為17.15%,F(xiàn)CM- MKPCA算法SPE誤報率為0.88%,本文所提算法SPE誤報率為0.13%。可見利用本文所提方法劃分階段后再建立模型會降低誤報率。

      本文還采集了兩種故障數(shù)據(jù)進行檢測:故障1 對充氣率引入故障信號,在200 h施加+3%階躍信號,該信號持續(xù)至第300 h,診斷結果如圖6所示;故障2在200 h時對充氣率施加+0.2%斜坡信號,該信號持續(xù)至第300 h,診斷結果如圖7所示。

      圖6 故障1檢測圖Fig.6 Diagnosis diagram of fault 1

      圖7 故障2檢測圖Fig.7 Diagnosis diagram of fault 2

      從圖6可知,F(xiàn)CM- MKPCA算法T2漏報率為2.25%,MKPCA方法和本文所提方法漏報率為0,MKPCA算法T2誤報率為10.38%,F(xiàn)CM- MKPCA算法T2誤報率為3.63%,本文所提方法T2誤報率為0.88%;3種方法的SPE漏報率均為0,而對于SPE誤報率,MKPCA算法為16.75%,F(xiàn)CM- MKPCA算法為1%,本文所提算法降到了0.1%。由此可知,本文所提方法誤報率大大降低,故障診斷精度明顯提高。

      從圖7可知,對于T2漏報率,MKPCA算法為5.00%,F(xiàn)CM- MKPCA算法為10.13%,本文所提算法為5.25%,對于T2誤報率,MKPCA算法為10.25%,F(xiàn)CM- MKPCA算法為3.5%,本文所提算法為0.75%;3種方法得出的SPE漏報率基本一致,而對于SPE誤報率,MKPCA算法為16.63%,F(xiàn)CM- MKPCA算法為1.01%,本文所提算法為0。綜上可知,本文所提方法的故障診斷準確度更高。

      從圖5~7可知,50~100采樣點發(fā)生的誤報比較多,這是因為在此階段菌體進入發(fā)酵期,菌體濃度、溶解氧濃度、pH、堿補給等變量在此時段內發(fā)生波峰式明顯變化,并沒有趨于穩(wěn)定值,雖然數(shù)據(jù)經過了MKPCA歸一化處理,但仍然會有生物過程的波動特性,所以此時段誤報最多。將青霉素發(fā)酵過程用本文方法分階段后,把這一過程劃分到第一階段,并單獨建立MKPCA的模型,據(jù)此獲得此階段下合理的T2、SPE的受控限,相比于整個批次獲得的T2、SPE的受控限,利用第一階段獲得的受控限進行該階段的故障檢測,大大降低了誤報率。

      通過以上仿真實驗的結果可知,無論是對階躍故障還是對斜坡故障,本文所提方法的故障診斷精度都要比傳統(tǒng)不分階段的方法以及FCM分階段的方法高。

      5 結論

      (1)針對間歇過程數(shù)據(jù)不等長問題,提出了一種自適應DTW算法。自適應DTW算法發(fā)揮了對稱式DTW算法與非對稱式DTW算法在算法上的互通性與互補性,將不等長數(shù)據(jù)變?yōu)榈乳L數(shù)據(jù),實現(xiàn)了多個批次數(shù)據(jù)軌跡的時間長度同步化。

      (2)針對FCM算法在階段劃分中存在的對初始聚類中心敏感的問題,提出遺傳算法與FCM算法相結合來完成聚類過程。遺傳算法采用的是整體搜索策略,它從實際問題中抽離出來,采用全局搜索方式,通過選擇、交叉、變異等操作完成搜索過程,具有強大的全局搜索能力。遺傳算法可以有效、快速地解決FCM算法對初始聚類中心敏感且易于陷入局部收斂的問題。

      (3)仿真實驗的結果表明,GA- FCM算法比單一FCM算法有更高的聚類有效性,階段劃分更為準確,故障診斷精度也明顯提高。

      猜你喜歡
      誤報率間歇聚類
      基于GRU-LSTM算法的物聯(lián)網(wǎng)數(shù)據(jù)入侵檢測分析
      基于SSA-SVM的網(wǎng)絡入侵檢測研究
      間歇供暖在散熱器供暖房間的應用
      煤氣與熱力(2022年4期)2022-05-23 12:44:46
      家用燃氣報警器誤報原因及降低誤報率的方法
      煤氣與熱力(2021年6期)2021-07-28 07:21:40
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      管群間歇散熱的土壤溫度響應與恢復特性
      基于改進的遺傳算法的模糊聚類算法
      神經網(wǎng)絡技術在網(wǎng)絡入侵檢測模型及系統(tǒng)中的應用
      一種層次初始的聚類個數(shù)自適應的聚類方法研究
      間歇精餾分離喹啉和異喹啉的模擬
      九龙坡区| 巴彦淖尔市| 房产| 柞水县| 望城县| 霍山县| 玛沁县| 拜城县| 普格县| 淅川县| 大同县| 云南省| 上思县| 苍南县| 靖远县| 新闻| 自贡市| 垣曲县| 泾川县| 玉树县| 鄂托克前旗| 靖边县| 商城县| 阿拉善右旗| 友谊县| 元朗区| 铁岭县| 涟源市| 宁远县| 芮城县| 桃江县| 商都县| 洛川县| 白山市| 大安市| 天祝| 宣威市| 和林格尔县| 鹤庆县| 凤山县| 铁岭县|