變運營環(huán)境下基于混合主成分分析的結(jié)構(gòu)損傷識別方法

2022-07-14 04:14:46黃海賓臧敬剛

重慶交通大學(xué)學(xué)報(自然科學(xué)版) 2022年7期

黃海賓，臧敬剛

(1. 河北工業(yè)大學(xué) 土木與交通學(xué)院，天津 300401； 2. 河北工業(yè)大學(xué) 河北省土木工程技術(shù)研究中心，天津 300401)

0 引言

近年來，基于振動的損傷識別方法在結(jié)構(gòu)健康監(jiān)測領(lǐng)域得到了廣泛研究[1-2]。該類方法的基本依據(jù)是：損傷會引起結(jié)構(gòu)動力特性(如頻率、振型等模態(tài)參數(shù))的變化，故可將動力特性作為結(jié)構(gòu)的損傷特征，并通過動力特性變化判斷其損傷狀態(tài)[3-5]。然而，服役期內(nèi)的運營環(huán)境(如溫度、濕度、風速等因素)變化同樣會引起結(jié)構(gòu)動力特性的變化，這可能會掩蓋損傷造成的動力特性變化，導(dǎo)致?lián)p傷識別效果不理想[6-11]。因此，在結(jié)構(gòu)損傷識別中，剔除運營環(huán)境變化對損傷特征的影響至關(guān)重要。

從損傷特征中剔除運營環(huán)境變化的影響主要有兩類方法[12]：①顯式方法，建立環(huán)境變量與損傷特征之間的關(guān)系模型，進而量化運營環(huán)境變化的影響并予以剔除；②隱式方法，將環(huán)境變量視作隱藏變量嵌入到損傷特征中，進而估計運營環(huán)境變化的影響并予以剔除。隱式方法因無需測量環(huán)境變量卻能考慮運營環(huán)境變化的影響，進而凸顯出了實用價值，其中以主成分分析(principal-component analysis, PCA)應(yīng)用最廣。A. M. YAN等[6]將固有頻率作為損傷特征，使用PCA成功剔除了環(huán)境效應(yīng)對其損傷識別過程的影響；G. COMANDUCCI等[7]將PCA應(yīng)用于某懸索橋，有效剔除了風速對固有頻率的影響；F. UBERTINI等[8]提出將PCA與多元線性回歸相結(jié)合，建立統(tǒng)計模型以剔除運營環(huán)境變化的影響，并采用某鐘樓的固有頻率數(shù)據(jù)進行了有效性驗證；A. I. OZDAGLI等[9]使用振型和固有頻率作為損傷特征，結(jié)合PCA剔除了溫度變化的影響，提升了對某三層框架的損傷識別能力。

盡管基于PCA的損傷識別方法應(yīng)用眾多，但其適用范圍僅局限于數(shù)據(jù)近似滿足高斯分布且線性相關(guān)。目前，針對PCA在非線性問題中的局限性，學(xué)界已提出相關(guān)改進方法，A. M. YAN等[10]將PCA擴展為局部PCA，對非線性相關(guān)性進行分段線性化，剔除了運營環(huán)境變化對固有頻率的非線性影響；E. REYNDERS等[11]針對變運營環(huán)境的非線性影響，提出了改進的核PCA方法，并采用某預(yù)應(yīng)力混凝土橋的固有頻率數(shù)據(jù)對其效果進行了驗證。此外，非高斯分布在損傷特征數(shù)據(jù)中也普遍存在，趙人達等[13]和薛剛等[14]分別研究了不同太陽輻射強度下的混凝土箱梁溫度場分布特性，結(jié)果表明箱梁底板、腹板和頂板的溫度均呈非高斯分布，這會進一步造成損傷特征數(shù)據(jù)的非高斯分布。在結(jié)構(gòu)損傷識別中，綜合考慮數(shù)據(jù)的非高斯分布和非線性相關(guān)十分關(guān)鍵。

為有效處理運營環(huán)境變化下?lián)p傷特征數(shù)據(jù)的非高斯分布和非線性相關(guān)等問題，筆者提出一種基于混合PCA的結(jié)構(gòu)損傷識別方法。利用高斯混合模型(gaussian mixture model, GMM)對存在非高斯分布和非線性相關(guān)的多維損傷特征數(shù)據(jù)進行建模，將其聯(lián)合概率密度函數(shù)表示為多個局部高斯分量的線性組合，使得每個局部高斯分量內(nèi)的數(shù)據(jù)之間滿足線性相關(guān)性；然后，對所有局部高斯分量分別建立相應(yīng)的PCA模型；再計算所有PCA模型殘差部分的馬氏平方距離和歐氏平方距離，將樣本屬于各高斯分量的后驗概率作為權(quán)系數(shù)，對兩類距離分別進行加權(quán)標準化以求得結(jié)構(gòu)的綜合損傷指標。最終，通過質(zhì)量彈簧系統(tǒng)仿真和木桁架橋試驗對其有效性進行驗證。

1 傳統(tǒng)PCA損傷識別

作為一種常用的多維數(shù)據(jù)分析方法，PCA可對由多個互相關(guān)特征變量構(gòu)成的原始數(shù)據(jù)集進行線性變換以提取主成分，在保留絕大部分原始信息的前提下，降低變換后數(shù)據(jù)集的特征維度。原始數(shù)據(jù)集中各特征變量間的相關(guān)性越強，PCA的降維效果越顯著。

令X=[x1,x2,…,xN]表示損傷特征矩陣，任意樣本向量x均包含m個特征變量，共有N個樣本。采用結(jié)構(gòu)的多階頻率作為損傷特征，且各階頻率間存在相關(guān)性，故可通過PCA對特征數(shù)據(jù)集進行建模。PCA建模是利用如下特征值分解實現(xiàn)[15-16]：

∑=E[(x-μ)(x-μ)T]=QΛQT

(1)

式中：μ為數(shù)據(jù)集的均值向量；∑為數(shù)據(jù)集的協(xié)方差矩陣；Λ=diag(λ1,λ2,…,λm)為所有降序排列特征值構(gòu)成的對角矩陣；Q=[q1,q2,…,qm]為與特征值對應(yīng)的特征向量構(gòu)成的標準正交矩陣；E(·)為期望算子。

PCA模型中特征值λi越大，則表明第i個主成分所包含的原始數(shù)據(jù)信息越多。當特征變量間存在強相關(guān)性時，僅需前面少數(shù)幾個主成分即可近似重構(gòu)原始數(shù)據(jù)。通常情況下，主成分個數(shù)d的選取原則如下：

(2)

式中：r為百分率，一般取95%，即主成分貢獻率宜至少達到95%。當已知影響損傷特征的主導(dǎo)環(huán)境因素的個數(shù)時，可將d取為主導(dǎo)環(huán)境因素的個數(shù)。

(3)

(4)

(5)

(6)

當數(shù)據(jù)服從或近似服從高斯分布時，令α表示顯著性水平，指標DMah的閾值TMah由下式確定[17]：

(7)

(8)

2 混合PCA損傷識別

2.1 損傷特征的聯(lián)合概率密度擬合

GMM利用多個高斯分量的線性組合對多維數(shù)據(jù)的概率密度函數(shù)進行擬合[18]。理論上講，如果高斯分量的數(shù)目足夠多，GMM能夠準確擬合任意分布數(shù)據(jù)的概率密度函數(shù)。

經(jīng)GMM擬合，多維損傷特征數(shù)據(jù)的概率密度函數(shù)具有如下形式：

(9)

(10)

(11)

進一步，可將GMM的最優(yōu)參數(shù)估計問題轉(zhuǎn)化為如下優(yōu)化問題：

(12)

采用期望最大(expectation-maximization, EM)算法[19]求解該問題，首先設(shè)定GMM的初始參數(shù)為Θ(0)，然后分E步驟和M步驟進行迭代計算。E步驟依據(jù)當前參數(shù)Θ(i)，計算第j個樣本向量xj屬于第k個高斯分量的后驗概率：

(13)

M步驟迭代更新參數(shù)Θ(i+1)：

(14)

(15)

(16)

重復(fù)E步驟和M步驟，直至收斂，即可得到GMM的最優(yōu)參數(shù)。

在GMM擬合中，確定最佳的高斯分量數(shù)目是關(guān)鍵所在，采用可綜合權(quán)衡模型擬合度與復(fù)雜度的貝葉斯信息準則對高斯分量的數(shù)目進行選擇。

2.2 混合PCA建模與損傷指標計算

多維損傷特征數(shù)據(jù)經(jīng)GMM擬合后，可獲得所有高斯分量的均值向量和協(xié)方差矩陣，且任一高斯分量中的損傷特征之間存在線性相關(guān)性。由式(1)可知：PCA建模的實質(zhì)是對協(xié)方差矩陣的特征值分解，故可依次對第k個高斯分量的協(xié)方差矩陣∑k分別進行特征值分解，從而得到K個PCA模型及其對應(yīng)的用于計算損傷指標的殘差子空間。

由于每個高斯分量對應(yīng)的殘差子空間不同，以其計算而得的損傷指標及閾值也會存在差異，故分別對馬氏平方距離和歐氏平方距離進行加權(quán)標準化，作為混合PCA框架下的損傷指標。對于任意樣本向量x而言，首先計算第k個高斯分量對應(yīng)的損傷指標，即馬氏平方距離DMah,k和歐氏平方距離DEuc,k；其次，通過相應(yīng)的閾值TMah,k和TEuc,k分別對損傷指標進行標準化處理，即將損傷指標除以其閾值；最后，對所有標準化后的損傷指標進行加權(quán)求和，其權(quán)系數(shù)為該樣本來自GMM各高斯分量的后驗概率p(k|x)。具體表達式為：

(17)

(18)

由于進行了加權(quán)標準化處理，兩個綜合損傷指標的閾值均為1。當損傷指標大于1時，判斷結(jié)構(gòu)處于損傷狀態(tài)；反之，則判斷結(jié)構(gòu)處于無損狀態(tài)。

2.3 損傷識別步驟

基于混合PCA的損傷識別方法，其實施過程分為離線建模和在線監(jiān)測兩個階段。

2.3.1 離線建模

離線建模階段，利用無損結(jié)構(gòu)的損傷特征數(shù)據(jù)集進行混合PCA建模，步驟如下：

1)采用貝葉斯信息準則確定GMM的最佳高斯分量數(shù)目；

2)通過GMM對損傷特征數(shù)據(jù)的概率密度函數(shù)進行擬合；

3)分別對GMM中各高斯分量建立PCA模型并獲得其對應(yīng)的殘差子空間；

4)計算GMM中各高斯分量所對應(yīng)的馬氏平方距離和歐氏平方距離的閾值。

2.3.2 在線監(jiān)測

在線監(jiān)測階段，計算混合PCA框架下當前樣本的損傷指標以判斷結(jié)構(gòu)損傷狀態(tài)，步驟如下：

1)計算當前樣本對應(yīng)于GMM中各高斯分量的馬氏平方距離和歐氏平方距離；

2)計算當前樣本來自于GMM中各高斯分量的后驗概率；

3)計算當前樣本的加權(quán)標準馬氏平方距離和加權(quán)標準歐氏平方距離作為損傷指標；

4)判斷損傷狀態(tài)，當損傷指標大于1時，判斷結(jié)構(gòu)處于損傷狀態(tài)，反之則判斷結(jié)構(gòu)處于無損狀態(tài)。

3 數(shù)值仿真

利用四自由度質(zhì)量彈簧系統(tǒng)生成仿真數(shù)據(jù)，用以驗證所提方法在變運營環(huán)境下的損傷識別能力。

質(zhì)量彈簧系統(tǒng)共由4個質(zhì)量塊和5根彈簧組成，如圖1。質(zhì)量塊的質(zhì)量為：m1=m2=m3=m4=2 kg；彈簧的剛度與溫度呈分段線性關(guān)系：

圖1 質(zhì)量彈簧系統(tǒng)

(19)

(20)

式中：ki,i=1,2,…,5為彈簧剛度；T為溫度。

在0 ℃兩側(cè)，所有彈簧的剛度隨溫度的線性變化規(guī)律不同；第3根彈簧的剛度隨溫度的線性變化規(guī)律與其它彈簧的變化規(guī)律均不一致，這可用于模擬非線性效應(yīng)。

以某橋梁監(jiān)測系統(tǒng)采集的為期1年的空氣溫度數(shù)據(jù)(采樣頻率1 Hz，1 h內(nèi)會得到多個樣本，對這些樣本取平均值，得到8 760個平均樣本)為基準，等比例伸縮至[-20 ℃, 40 ℃]區(qū)間，作為數(shù)值仿真的溫度輸入值。通過無放回隨機取樣，首先取出5 400個溫度樣本輸入質(zhì)量彈簧系統(tǒng)，計算全部4階固有頻率即fn1、fn2、fn3和fn4，疊加一定程度的高斯噪聲后，作為訓(xùn)練數(shù)據(jù)集；然后，分7次依次各取出480個溫度樣本輸入質(zhì)量彈簧系統(tǒng)，且每次均對第2根彈簧的剛度進行一定程度折減，在模擬運營環(huán)境變化和損傷同時存在情況下，計算全部4階固有頻率并疊加與訓(xùn)練數(shù)據(jù)集程度相同的高斯噪聲后，作為測試數(shù)據(jù)集(共計7種工況)，如表1。

表1 測試數(shù)據(jù)集工況

該系統(tǒng)損傷前后的固有頻率變化如圖2。經(jīng)對比分析可知：運營環(huán)境變化引起的固有頻率變化會大部分甚至完全掩蓋損傷引起的固有頻率變化，故僅通過頻率變化難以識別運營環(huán)境變化下的結(jié)構(gòu)損傷。

圖2 質(zhì)量彈簧系統(tǒng)的固有頻率變化

由貝葉斯信息準則確定最佳高斯分量數(shù)目為4，利用GMM對訓(xùn)練數(shù)據(jù)集的概率密度函數(shù)進行擬合(以fn1和fn2為例)。由圖2可知：無損狀態(tài)下fn1和fn2的變化幅度較大。圖3(a)和圖3(b)分別為fn1和fn2的頻率直方圖與GMM擬合概率密度函數(shù)間的對比，可知GMM能有效擬合非高斯分布數(shù)據(jù)的概率密度函數(shù)；圖3(c)為fn1和fn2間的散點圖，其表現(xiàn)出非線性相關(guān)性；圖3(d)為GMM擬合的二維概率密度函數(shù)等高線圖，可知GMM亦能有效處理數(shù)據(jù)中的非線性問題。

圖3 頻率fn1、fn2及 fn1與fn2間的GMM擬合效果

圖4 混合PCA的損傷識別結(jié)果

表2 PCA與混合PCA的損傷識別率

由表2可知：對工況Cn0，混合PCA的兩種損傷指標對應(yīng)的虛警率(對正常結(jié)構(gòu)識別出損傷)較傳統(tǒng)PCA均略低；對工況Cn1，混合PCA的識別效果優(yōu)于傳統(tǒng)PCA，但此時的微小損傷引起的固有頻率變化不明顯，漏警率(對損傷結(jié)構(gòu)未識別出損傷)較高；對工況Cn2，混合PCA的損傷識別能力較傳統(tǒng)PCA有了顯著提升；對工況Cn3～Cn6，混合PCA的損傷識別率均接近或超過90%，且均大于傳統(tǒng)PCA的損傷識別率，足見筆者方法的優(yōu)越性。

4 試驗驗證

采用由芬蘭的Kullaa課題組所完成的木桁架橋試驗[20]進一步驗證混合PCA的損傷識別效果。

橋總質(zhì)量為36 kg，采用橡膠支座支撐，如圖5。對結(jié)構(gòu)施加隨機白噪聲激勵，并在不同位置安裝15個加速度計，以測量結(jié)構(gòu)的加速度響應(yīng)，采樣頻率為256 Hz，每次測量時長為32 s。測量期間，實驗室內(nèi)的溫度和濕度不斷發(fā)生變化。

圖5 木桁架橋的試驗布置

利用隨機子空間方法對每次測量的振動數(shù)據(jù)進行模態(tài)參數(shù)識別，并采用較為可靠的第6、7、8、10、12和13階固有頻率(為后續(xù)方便，將它們依次記為ft1、ft2、ft3、ft4、ft5和ft6)作為損傷特征。在無損狀態(tài)下，共獲得1 871個有效的固有頻率樣本，通過無放回隨機取樣，選取1 671個樣本作為訓(xùn)練數(shù)據(jù)集，剩余200個樣本作為測試數(shù)據(jù)集的一部分；在距中跨左側(cè)600 mm處的結(jié)構(gòu)頂部附加不同質(zhì)量，以模擬不同的損傷程度，共獲得105個有效的固有頻率樣本，作為測試數(shù)據(jù)集的另一部分。因此，測試數(shù)據(jù)集中共包含6種工況，如表3。

表3 測試數(shù)據(jù)集工況

木桁架橋在環(huán)境影響下的固有頻率變化如圖6，圖中虛線前為無損狀態(tài)，虛線后為損傷狀態(tài)。經(jīng)對比計算可知：由環(huán)境變化引起的固有頻率變化完全掩蓋了損傷引起的固有頻率變化，故僅通過頻率變化無法識別運營環(huán)境變化下的結(jié)構(gòu)損傷。

由貝葉斯信息準則確定最佳高斯分量數(shù)目為8，利用GMM對訓(xùn)練數(shù)據(jù)集的概率密度函數(shù)進行擬合。以ft2和ft6為例，由圖6可知兩頻率在無損狀態(tài)下的變化幅度較大；圖7(a)和圖7(b)分別為ft2和ft6的頻率直方圖與GMM擬合概率密度函數(shù)間的對比，可知GMM能有效擬合非高斯分布數(shù)據(jù)的概率密度函數(shù)；圖7(c)為ft2和ft6間的散點圖，其表現(xiàn)出非線性相關(guān)性；圖7(d)為GMM擬合的二維概率密度函數(shù)等高線圖，可知GMM能有效處理數(shù)據(jù)中的非線性問題。

圖6 木桁架橋的固有頻率變化

圖7 頻率ft2、ft6及ft2與ft6間的GMM擬合效果

圖8 混合PCA的損傷識別結(jié)果

表4 PCA與混合PCA的損傷識別率

由表4可知：傳統(tǒng)PCA中的歐氏平方距離并沒有識別出結(jié)構(gòu)損傷；傳統(tǒng)PCA中的馬氏平方距離雖有一定的識別效果，但并沒有識別出工況Ct3的損傷；混合PCA中的加權(quán)標準歐氏平方距離的識別效果較傳統(tǒng)PCA有了一定改善，但其對工況Ct3的識別效果仍不理想；混合PCA中的加權(quán)標準馬氏平方距離對工況Ct2識別率達到了60.87%，對工況Ct3～Ct5識別率則均達到了100%，識別結(jié)果最好。綜上，由于可有效處理非高斯分布和非線性相關(guān)等問題，混合PCA在損傷識別能力方面較傳統(tǒng)PCA有顯著提升。

7 結(jié) 論

筆者提出了變運營環(huán)境下基于混合PCA的結(jié)構(gòu)損傷識別方法，并通過質(zhì)量彈簧系統(tǒng)仿真和木桁架橋試驗進行了有效性驗證。得出如下結(jié)論：

1) 運營環(huán)境變化會引起結(jié)構(gòu)損傷特征的非高斯分布和非線性相關(guān)等問題，致使傳統(tǒng)PCA的損傷識別效果較差。

2) 在合理的高斯分量數(shù)目下，GMM能準確擬合多維損傷特征數(shù)據(jù)的聯(lián)合概率密度函數(shù)，解決非高斯分布和非線性相關(guān)等問題。

3) 混合PCA的損傷識別能力較傳統(tǒng)PCA而言有顯著提升，其中以加權(quán)標準馬氏平方距離的損傷識別能力最為優(yōu)異。