羅磊,程非凡,邱彤,趙勁松
?
改進CCM算法檢測外部擾動下系統(tǒng)變量間的時滯和因果關(guān)系
羅磊,程非凡,邱彤,趙勁松
(清華大學化學工程系,北京 100084)
在化工過程中,可以通過分析變量間的相互作用和時滯關(guān)系,推理故障的傳播路徑和網(wǎng)絡,指出故障的根原因。這對提高過程安全性,增強經(jīng)濟效益具有重要意義,是研究的熱點和難點。常見的互相關(guān)函數(shù)和傳遞熵等方法,由于只適用于線性或弱非線性系統(tǒng),或計算量較大,往往無法準確地獲得變量間的時滯信息和作用強度,在實際應用中存在不足。近年來,在生態(tài)領(lǐng)域研究中提出的交叉收斂映射(CCM)算法,被認為是一種適用于非線性耦合過程因果分析的方法,可適用于耦合變量間時滯關(guān)系的檢測。但對于帶有外部擾動的化工過程,CCM無法根據(jù)隨時受到擾動的過程數(shù)據(jù)構(gòu)造出穩(wěn)定的嵌入流形,導致了時滯和因果分析失敗。而基于CCM進行改進的擾動過濾交叉映射(DFCM)方法,通過分析外部擾動對系統(tǒng)的影響,預先篩選擾動數(shù)據(jù),再將過濾后的數(shù)據(jù)代入交叉映射的計算中。算例表明,這種處理能有效地避免擾動下嵌入流形不穩(wěn)定的問題,適用于處于擾動下的化工過程,并得到良好的時滯和因果關(guān)系分析效果。
CCM;因果分析;時滯檢測;算法;過程系統(tǒng);安全
一直以來針對大型復雜系統(tǒng)的因果關(guān)系識別和時滯檢測都較為困難,尤其是當系統(tǒng)具有非線性特征時。目前已有人從不同角度出發(fā)提出了若干方法用于解決過程系統(tǒng)中變量間的因果關(guān)系識別和時滯分析。最簡單的是互相關(guān)函數(shù)法(CCF)[1],這一方法通過計算在不同的時滯假設(shè)點上的互相關(guān)函數(shù)值,選取其絕對值的最大值對應的時滯作為時滯檢測的結(jié)果。盡管該方法計算簡單,也適用于某些實際過程,但它對非線性系統(tǒng)適應性較差。另一種被廣泛使用的格蘭杰因果檢驗,則往往因為無法滿足待檢測變量間相互獨立的條件,不能適用于耦合系統(tǒng)的分析。Schreiber等[2-10]基于信息熵的概念提出了傳遞熵(transfer entropy)的方法,這一方法也被廣泛地應用于化工、大氣科學、神經(jīng)科學等領(lǐng)域。但由于其基于概率計算的理論,對概率密度函數(shù)分布的計算必須足夠精確以確保結(jié)果的準確性,這就帶來了較大的計算量。另外,有時傳遞熵并不能準確地計算出變量間的時滯關(guān)系,所以無法獲得類似于符號有向圖(signed directed graph)[11-17]的結(jié)果以清晰地總結(jié)和分析結(jié)論??傊?,上述的方法或者基于概率理論,計算量較大;或者只能適用于線性或者是弱非線性系統(tǒng),難以應用于對非線性系統(tǒng)的分析。
近年來提出的交叉收斂映射算法(convergent cross mapping,CCM)[18],利用非線性耦合系統(tǒng)中變量間微分同胚映射的特點,將原有的因果關(guān)系識別轉(zhuǎn)化為對嵌入流形相互預測效果的對比。Ye等[19]的工作表明CCM算法適用于某些自振系統(tǒng)中變量因果關(guān)系的檢測和時滯分析。但是,化工過程中處于常見的外部擾動時,Ye等的方法也許不再適用。本文對CCM算法進行改進,提出DFCM方法,解決了該問題。
CCM算法由Sugihara等[18]在2012年提出,相比于互相關(guān)函數(shù)和傳遞熵,它能更清楚地把握耦合系統(tǒng)中變量間的相互作用,得到更準確的結(jié)果。根據(jù)Takens嵌入定理,在一動態(tài)系統(tǒng)中,相互關(guān)聯(lián)兩變量其對應的影子流形M和M都與原系統(tǒng)的流形微分同胚。這里的影子流形M和M都是通過對原始數(shù)據(jù)和進行時序嵌入重構(gòu)得到,其元素分別用x和y表示。這樣,流形M和M之間便形成了連續(xù)單射的聯(lián)系。對于M上選定的點x,1,x,2,…, x,k,在M上也一定能找到對應的y,1,y,2,…, y,k,若所有的x(=1,…,)均收斂于特定的x,0,那么相應地,y(=1,…,)也會收斂于x,0在M上所對應的y,0。對于M上每個點x,CCM都尋找其相鄰點及其在流形M上的對應點,并對y,i進行預測,記作?,i。這樣變量對的預測能力ρ→y即是預測值{?,i}和真實值{y,i}之間的相關(guān)系數(shù)。隨著樣本總數(shù)的增加,預測值序列{?,i}逐漸收斂,ρ→y也將會收斂到一定值,這樣便可使用變量預測,反之亦然。然而,如果變量和之間不存在耦合關(guān)系,由于信息傳遞的不對稱將會導致作為結(jié)果的某一變量對另一作為原因的變量預測效果的下降。圖1解釋了這一原理。
對于維動態(tài)系統(tǒng)
d/d=(,) (1)
其中和分別對應變量和參數(shù)向量,=[1,2,…,x]T,=[1,2,…,u]T。對于中的兩變量和,其對應的影子流形構(gòu)造如下
是嵌入維數(shù),是延遲時間,這樣根據(jù)前面所述,便有
若在M上找到一系列最接近M,0的點{M,}={M,1,M,2,…,M,+1},那么M,0的值便可由{M,}進行估計
如果樣本數(shù)足夠大以保證{M,}足夠接近M,0,那么最終M預測M的能力ρ→y將會收斂到0和1之間。
Ye等[19]將CCM的應用拓展到對變量間時滯關(guān)系的確定中。根據(jù)他的想法,如果變量對的作用存在時滯Δ,即()=((?Δ)),那么使用CCM將對進行估計最強的作用應出現(xiàn)在時滯為+Δ的位置,這里正號表示落后于。圖2對Ye等的思想進行了簡要的解釋。
經(jīng)過計算發(fā)現(xiàn),Ye等的方法在對自振系統(tǒng)進行計算時能取得良好的效果,但是,如果系統(tǒng)變量振蕩來源于外部輸入的擾動,Ye等的方法并沒有考慮到這部分變化對CCM計算結(jié)果的影響,計算結(jié)果并不理想。圖3列出了將Ye等的方法應用于3個不同的非線性時滯系統(tǒng)的計算結(jié)果,例1是一自振系統(tǒng),例2和例3中都加入了參數(shù)的擾動,正是該擾動導致本應穩(wěn)定的系統(tǒng)出現(xiàn)了波動。從最后的結(jié)果可以看出,Ye等的方法能準確地計算出例1中變量之間的時滯,但卻在例2和例3中無法得到準確的結(jié)果。
blue line—maps; red line—maps
圖3中具體算例如下。
例1
x+1=x(3.78?3.78x?0.07y3)
y+1=y(3.77?3.77y?0.08x5)
例2
x+1=0.3x+(1+0.3u?y?25)x/5
y+1=0.9y+0.02(x?10?5.5)
u= rand(0,1),=1, 2, 3, …
例3
x+1=x+D[0.4(1+0.1u)?0.2x+0.3y?80]
y+1=y+D[0.2x?50?0.3y?0.4(1+0.1u)y]
u= rand(0,1),=1, 2, 3, …
盡管CCM最初被應用于生態(tài)學領(lǐng)域,但其中微分同胚的特點也常見于化工過程數(shù)據(jù)的重構(gòu)流形中,因此CCM算法的思想也適用于化工過程,但算例2和例3中參數(shù)的頻繁改變使得M和M不再穩(wěn)定,這導致CCM算法無法識別到正確的時滯并對變量間的相互作用作出計算。以一個二元系統(tǒng)為例,如圖4所示,如果參數(shù)被設(shè)定為不同值,該系統(tǒng)變量和將會收斂到不同的穩(wěn)態(tài)值。同時,由于穩(wěn)態(tài)點的不斷變化,相軌跡也會出現(xiàn)相互交叉,這將會導致原CCM方法計算準確度的下降。
例如圖4中紅色和藍色軌跡的交點對應于圖5中曲線的突變,這說明,即使在原流形或者M中發(fā)現(xiàn)兩相鄰點,由于相軌跡的交叉等原因也并不能保證它們在M中也滿足相鄰條件。還有一種可能是它們對應于不同的參數(shù),只是恰好在圖中相鄰而已。這樣,CCM尋找到的相鄰點在其之后的計算中是沒有意義的。
根據(jù)以上對CCM算法的分析,對其進行改進,希望它能對處于外部擾動下的系統(tǒng)進行計算,從而提出擾動過濾交叉映射(disturbance filtrated cross-mapping,DFCM)法。該方法基于以下幾點假設(shè):
(1)系統(tǒng)對于每個有且僅有一個穩(wěn)態(tài),的擾動不會導致多穩(wěn)態(tài)現(xiàn)象的發(fā)生;
(2)穩(wěn)態(tài)點的變化是連續(xù)的;
(3)如果參數(shù)和0接近,那么對應的從相同初值出發(fā)的相軌跡也會收斂到0所對應的相軌跡上。
圖6對該過程進行了闡述。圖中從左至右參數(shù)的變化逐漸增大,不同下對應的影子流形與原流形的差別也逐漸增大。這樣,通過限定擾動的變化便可獲得穩(wěn)定的流形。
blue—original manifold; red—new manifold
圖7是DFCM計算的大致流程。在DFCM中,首先選定合適的嵌入維數(shù)和時間延遲,將過程數(shù)據(jù)根據(jù)進行過濾篩選,然后再將篩選后的數(shù)據(jù)代入交叉收斂映射的計算。
3.1 DFCM對例2和例3的計算
圖8顯示了將DFCM用于之前的例2和例3后的計算結(jié)果,對于例2,DFCM的計算表明最強的作用出現(xiàn)在變量比領(lǐng)先Δ=12的位置,這一結(jié)果與圖中給出的兩變量的輸出結(jié)果相符合,注意為了方便比較,兩輸出的橫坐標已按照DFCM的結(jié)果進行了相應平移。對于例3,DFCM不僅在比領(lǐng)先Δ1=50和Δ2=-80發(fā)現(xiàn)了時滯點,還發(fā)現(xiàn)兩變量的最強作用出現(xiàn)的位置是在Δ=0的位置,這與實際的輸出相符合(圖中兩變量呈反相關(guān))。
blue line—maps; red line—maps
3.2 DFCM對四罐耦合系統(tǒng)的計算
圖9是一個四罐耦合模型[20],模型輸入為泵的輸入電壓v,其對應的流量為kv,γ表示流量分流比。為了維持整個系統(tǒng)的穩(wěn)定,分別在罐1和罐3加入了液位控制器。
在該模型中假設(shè)液體從上游裝置流往下游需要經(jīng)過一段不可忽略的時間,用藍色數(shù)字表示。從圖9中很容易看出罐3和罐4應該比其他兩個罐更容易受到2的擾動的影響,它們應該處于擾動傳播路徑的上游位置。模型的輸出由圖10所示。
從圖11的計算結(jié)果可以看出,3始終領(lǐng)先于其他變量,說明它最接近擾動的根源。之后便是4、1和2。這一計算結(jié)果與實際輸出和從流程結(jié)構(gòu)出發(fā)的分析相符。
blue line—maps; red line—maps
CCM算法是一種新提出的可適用于線性和非線性系統(tǒng)因果分析和時滯檢測算法,但本文發(fā)現(xiàn)其對某些受到外部擾動的系統(tǒng)并不能取得好的計算效果,原因是在外部擾動存在的情況下無法構(gòu)造原方法中的穩(wěn)定的流形。針對這一問題本文對原方法進行改進,提出了擾動過濾交叉映射(DFCM)方法。算例證明,該方法適用于處于外部擾動下的化工過程中耦合變量之間時滯關(guān)系的檢測。未來將會進一步完善相關(guān)工作,期待這一方法能在化工和其他領(lǐng)域的因果分析和時滯檢測中有進一步的應用。
[1] BAUER M, THORNHILL N F. A practical method for identifying the propagation path of plant-wide disturbances [J]. J. Process Control, 2008, 18: 707-719.
[2] BAUER M, COX J W, CAVENESS M H,. Finding the direction of disturbance propagation in a chemical process using transfer entropy [J]. IEEE Trans. Control Syst. Technol., 2007, 15: 12-21.
[3] VICENTE R, WIBRAL M, LINDNER M,. Transfer entropy — a model-free measure of effective connectivity for the neurosciences [J]. J. Comput. Neurosci., 2011, 30: 45-67.
[4] 謝中凱, 劉國華, 吳志根. 基于傳遞熵的梁結(jié)構(gòu)損傷動力識別[J]. 浙江大學學報(工學版), 2012, 46(10): 1880-1886. XIE Z K, LIU G H, WU Z G. Dynamic damage identification for beam structures based on transfer entropy [J]. J. Zhejiang Univ. (Engineering Sci.), 2012, 46(10): 1880-1886.
[5] KUEHNERT C, BEYERER J. Data-driven methods for the detection of causal structures in process technology [J]. Machines, 2014, 2: 255-274.
[6] SHU Y, ZHAO J. Data-driven causal inference based on a modified transfer entropy [J]. Comput. Chem. Eng., 2013, 57: 173-180.
[7] 張志森, 龔志強, 支蓉. 利用傳遞熵對Lorenz系統(tǒng)和Walker環(huán)流信息傳輸方向的分析[J]. 物理學報, 2013, 62(12): 548-557.ZHANG Z S, GONG Z Q, ZHI R. Analysis of the direction of information transfer of Lorenz system and Walker circulation with transfer entropy [J]. Acta Physica Sinica, 2013, 62(12): 548-557.
[8] 賀丁, 趙勁松. 基于Hopfield網(wǎng)絡的時滯分析故障診斷策略[J]. 化工學報, 2013, 64(2): 633-640. HE D, ZHAO J S. Fault strategy of time delay analysis based on Hopfield network [J]. CIESC Journal, 2013, 64(2): 633-640.
[9] 賀丁, 舒逸聃, 趙勁松. 基于改進的時滯分析算法的化工過程故障定位[J]. 化工學報, 2012, 63(10): 3165-3172. HE D, SHU Y D, ZHAO J S. An improved time-delay algorithm for chemical processes fault identification [J]. CIESC Journal, 2012, 63(10): 3165-3172.
[10] DUAN P, YANG F, SHAH L S,. Transfer zero-entropy and its application for capturing cause and effect relationship between variables [J]. IEEE Transactions on Control Systems Technology, 2015, 23(3): 855-867.
[11] YANG F, XIAO D. Signed directed graph modeling of industrial processes and their validation by data-based methods[C]//2010 Conference on Control and Fault Tolerant Systems. Nice, France: IEEE, 2010: 387-392.
[12] 王杭州, 陳丙珍, 何小榮, 等. 基于開源組件的SDG推理平臺[J]. 化工學報, 2010, 61(7): 1829-1836.WANG H Z, CHEN B Z, HE X R,. Open source signed digraph inference framework [J]. CIESC Journal, 2010, 61(7): 1829-1836.
[13] 盧秉南, 張貝克, 馬昕, 等. 基于SDG模型的控制系統(tǒng)故障診斷方法[J]. 化工學報, 2009, 60(9): 2243-2251. LU B N, ZHANG B K, MA X,. Fault diagnosis of control system based on signed directed graph model [J]. CIESC Journal, 2009, 60(9): 2243-2251.
[14] YANG F, XIAO D Y. Progress in root cause and fault propagation analysis and large-scale industrial processes [J]. Journal of Control Science and Engineering, 2012: 478373.
[15] DUAN P, CHEN T W, SHAH L S,. Methods for root cause diagnosis of plant-wide oscillations [J]. AIChE Journal, 2014, 60(6): 2019-2034.
[16] HE B, CHEN T, YANG X H. Root cause analysis in multivariate statistical process monitoring: integrating reconstruction-based multivariate contribution analysis with fuzzy-signed directed graphs [J]. ComputersChemical Engineering, 2014, 64(7): 167-177.
[17] WAN Y M, YANG F, Lü N,Statistical root cause analysis of novel faults based on digraph models [J]. Chemical Engineering Research and Design, 2013, 91: 87-99.
[18] SUGIHARA G, MAY R, YE H,. Detecting causality in complex ecosystems [J]. Science, 2012, 338: 496-500.
[19] YE H, DEYLE E R, GILATTANZ L J,. Distinguishing time-delayed causal interactions using convergent cross mapping [J]. Sci. Rep., 2015, 5:14750.
[20] SADATI N, RAHMANI M, SAIF M,. Two-level robust optimal control of large scale nolinear systems [J]. IEEE Systems Journal, 2015, 9: 242-251.
An improved convergent cross mapping algorithm for causality identification and time delay analysis between systemic variables under external disturbance
LUO Lei, CHENG Feifan, QIU Tong, ZHAO Jinsong
(Department of Chemical Engineering, Tsinghua University, Beijing 100084, China)
In chemical processes, fault propagation pathways and root cause identification could be discovered though analysis of interactions and time delay relationships among different process variables. Because of its importance in improving process safety and operation profit, fault discovery has been a popular and challenging research topic. Common methods such as correlation and entropy transfer functions, which usually cannot get accurate time delay and interaction strength between variables by limited applicability for linear and weak nonlinear systems or high computation demand, have experienced many disadvantages in actual application. Recently, a new convergent cross mapping (CCM) algorithm in ecology has been considered suitable for causality analysis and time delay identification for nonlinear coupling process variables. However, CCM fails to find application in externally disturbed chemical processes because it cannot establish stable embedded flow from process data. An improved CCM, disturbance filtered cross mapping method (DFCM), overcame many challenges of creating stable embedded flow by analyzing external disturbance, filtering disturbed process data, and applying filtrated data to CCM calculation. Case studies showed good results of time delays and causality analysis, thus DFCM could be applied to chemical processes under external disturbance.
CCM; causality analysis; time-delay detection; algorithm; process system; safety
date: 2016-09-18.
Prof. QIU Tong, qiutong@tsinghua.edu.cn
10.11949/j.issn.0438-1157.20161300
TP 277
A
0438—1157(2016)12—5122—09
國家自然科學基金項目(U1462206)。
supported by the National Natural Science Foundation of China (U1462206).
2016-09-18收到初稿,2016-09-25收到修改稿。
聯(lián)系人:邱彤。第一作者:羅磊(1992—),男,碩士研究生。