蘇 亮, 宋明亮, 董石麟
(浙江大學 建筑工程學院,杭州 310058)
準確獲取結構的模態(tài)參數(shù)是結構健康監(jiān)測(Structural Health Monitoring, SHM)理論及應用的基礎[1]。眾所周知,為獲得與結構相關的所有信息,在模態(tài)參數(shù)識別之前,需預設較高的模態(tài)階次。然而,較高的模態(tài)階次將無法避免地引進虛假模態(tài)。
正確區(qū)分物理模態(tài)與虛假模態(tài)是模態(tài)分析領域存在已久的研究課題[2]。過去20年,在頻域和時域模態(tài)識別理論中,專家學者提出了很多剔除虛假模態(tài)的方法,然而經(jīng)典方法都傾向于選擇合適的系統(tǒng)階次,并不能區(qū)分物理模態(tài)和虛假模態(tài)[3]。另一方面,在現(xiàn)代模態(tài)分析商業(yè)軟件中使用的模態(tài)參數(shù)識別算法大多衍生自多項式模型,盡管這些算法存在應用上的微小差別,它們卻都可以使用穩(wěn)定圖法區(qū)分物理與虛假模態(tài)[4],這使得穩(wěn)定圖法成為該領域使用最廣泛的分析方法[5]。
使用穩(wěn)定圖法區(qū)分真實模態(tài)和虛假模態(tài)的容易程度和精確度依賴于傳感器監(jiān)測的數(shù)據(jù)質量、模態(tài)識別理論的穩(wěn)健性以及分析人員的經(jīng)驗[6]。因而這一過程不僅需要耗費大量的時間精力,且具有一定的主觀性,降低了識別的精度。此外,對于大型復雜結構,自由度數(shù)目龐大,且在運營模態(tài)分析時,要求能夠對穩(wěn)定圖進行實時在線分析,以上原因使得人工分析穩(wěn)定圖在運營模態(tài)分析中很難實現(xiàn)。因此,如何對運營中的大型復雜結構產生的龐大數(shù)量的穩(wěn)定圖進行實時自動分析,并有效剔除穩(wěn)定圖上的虛假模態(tài)成為健康監(jiān)測領域需解決的關鍵問題之一。
自動分析穩(wěn)定圖的研究主要分為兩類:第一類主要通過設定不同的穩(wěn)定性指標來獲得更為清晰的穩(wěn)定圖,促進穩(wěn)定圖的自動分析[7-9];第二類研究則主要使用模糊聚類等智能算法結合穩(wěn)定指標來自動搜索真實模態(tài)[10-13]。如孫鑫暉等[14]提出了一些自動獲取穩(wěn)定圖上真實極點的方法,并對其進行了改進。這些方法或者需要人為主觀地設定聚類中心數(shù)目,或者需要對提出的穩(wěn)定指標(或特征)設定閾值,使得這些算法無法真正做到完全自動化。
另一方面,利用穩(wěn)定圖區(qū)分真假模態(tài)的過程可看成是圖像分析的過程,即將穩(wěn)定圖上的點分為代表真實模態(tài)和虛假模態(tài)兩類,因而可以借助計算機視覺理論進行穩(wěn)定圖自動分析。自2006年誕生以來,深度學習[15]在圖像識別、語音識別、自然語言處理、計算機視覺等諸多領域取得了巨大成功[16]。深度學習與傳統(tǒng)模式識別方法最大的不同在于它能從大數(shù)據(jù)中自動學習特征,無需人為提取圖像中的特征或設定特征閾值。而卷積神經(jīng)網(wǎng)絡作為深度學習中使用最廣泛的算法,適用于解決數(shù)據(jù)量大的圖像分析問題,其自動學習到的特征比手工特征或局部特征的分類準確率更高[17]。
基于上述原因,本文提出一種基于卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)的穩(wěn)定圖自動分析方法。將穩(wěn)定圖劃分成若干個較小的圖像塊作為CNN的輸入,并根據(jù)專家識別結果給定每個輸入的標簽,利用訓練好的網(wǎng)絡得到穩(wěn)定圖的真假模態(tài)的分類結果。用3自由度和7自由度彈簧質量模型的數(shù)值算例以及加拿大HCT大樓和瑞士Z24橋振動監(jiān)測數(shù)據(jù)對提出的算法進行了驗證。實驗結果表明,所提方法能夠自動學習真實模態(tài)的特征,在無需人工提取特征參數(shù),也無需設定任何閾值的情況下,可快速自動地獲取結構興趣頻帶內的真實模態(tài)參數(shù),算法具有較好的收斂性和穩(wěn)健性。此外,本文搭建的CNN網(wǎng)絡亦可應用于其他一般結構的穩(wěn)定圖自動識別。
穩(wěn)定圖作為一種有效剔除虛假模態(tài)的工具,一般包含3類信息:頻率f,阻尼比ξ和模態(tài)振型φ,這些參數(shù)均由假設的不同的系統(tǒng)階次計算所得。通常,如果所有的3個模態(tài)參數(shù)均滿足如下條件,則認為該點是穩(wěn)定點
(1)
(2)
MAC表示了2個振型向量之間的空間相關性。眾所周知,隨著系統(tǒng)階次n的變化,代表真實模態(tài)的極點和代表虛假模態(tài)的極點會同時出現(xiàn)在穩(wěn)定圖上,真實極點通常是穩(wěn)定的,虛假極點則可能不穩(wěn)定。穩(wěn)定圖正是根據(jù)這一原則,將虛假極點從穩(wěn)定圖中剔除。圖1顯示了一個數(shù)值算例的穩(wěn)定圖,從圖1可知,當沒有噪聲干擾時,隨著假定模態(tài)階次的改變,代表系統(tǒng)真實模態(tài)的極點在固有頻率(圖1中豎線)處會排成一列,而虛假模態(tài)則不會一直存在,表明用穩(wěn)定圖法確定真實模態(tài)具有一定的可行性。然而,在實際工程中,由于噪聲的干擾以及結構本身的復雜性,穩(wěn)定圖變得相當復雜,人工從穩(wěn)定圖上判斷真實模態(tài)需要耗費大量時間精力,且容易產生錯誤。
☆-頻率、阻尼、振型都穩(wěn)定的點;○-頻率、阻尼穩(wěn)定點;-僅有頻率穩(wěn)定的點圖1 某數(shù)值算例穩(wěn)定圖Fig.1 Stabilization diagram of one numerical example
深度學習模擬人腦的網(wǎng)絡結構,通過對接收到的信息層層篩選,最終得到對輸入信息的認知。它是機器學習的一個重要分支,也是機器學習領域最近的研究熱點。CNN[18]是一種用于處理二維輸入數(shù)據(jù)的多層人工神經(jīng)網(wǎng)絡,其作為深度學習使用最廣泛的模型,有著良好的容錯能力、并行處理能力和自學能力。CNN中的每一層都是由多個二維平面組成,每個平面則由若干獨立的神經(jīng)元組成,相鄰兩層的神經(jīng)元互相連接。此外,CNN采用了權值共享有效降低模型的學習復雜度,使之具有更少的網(wǎng)絡連接數(shù)和權值參數(shù),從而更適應于計算量龐大的圖像特征學習與分類。這些優(yōu)良性能使得CNN能夠較好地應用于語言識別、圖像識別和自然語言處理等機器學習問題中。
一個典型的CNN模型結構,如圖2所示。它主要由輸入層、卷積層、下采樣層(池化層)、全連接層和輸出層組成。
圖2 卷積神經(jīng)網(wǎng)絡的結構示意圖Fig.2 Schematic diagram of convolutional neural network structure
輸入層通常為經(jīng)預處理后的二維圖像X。定義Hi為CNN第i層的特征圖。對于卷積層,Hi的計算方式為
Hi=f(Hi-1?Wi+bi)
(3)
式中:Wi為第層卷積核的權值向量;運算符號“?”為卷積核與第i-1層圖像或特征圖像進行卷積操作;bi為第i層的偏置向量;f(x)為激勵函數(shù)。
下采樣層依據(jù)一定的采樣規(guī)則[19]對特征圖進行下采樣,其主要功能是將不同位置的特征進行聚合,從而對特征圖進行降維,而在一定程度上保持特征尺度的不變。
經(jīng)過多個卷積層和下采樣層的交替?zhèn)鬟f,使用全連接層針對提取到的特征進行分類,得到基于輸入的概率分布Yi其中l(wèi)i表示第i個訓練樣本標簽的類別。
Y(i)=P(L=li|H0;(W,b))
(4)
CNN的訓練方法是使損失函數(shù)L=(W,b)最小化。輸入H0經(jīng)過前饋運算后通過損失函數(shù)計算出與期望值之間的差異,成為“殘差”。常用均方誤差(Mean Squared Error,MSE)作為損失函數(shù)
(5)
在反向傳播階段,CNN常用的優(yōu)化方法是梯度下降法,殘差通過梯度下降進行反向傳播,逐層更新CNN的各個層的訓練參數(shù)(W和b),從而得到訓練好的CNN。
CNN訓練完成后,便可對測試樣本進行預測,即將輸入數(shù)據(jù)通過訓練好的網(wǎng)絡進行前饋運算,在各個層次上輸出特征圖,最后利用全連接網(wǎng)絡輸出基于輸入數(shù)據(jù)得條件概率分布,從而達到對樣本分類的目的。
由于CNN的適用條件是對大量圖像進行分析,而單一的穩(wěn)定圖無法應用CNN。因此,本文提出構建如圖3所示的僅代表真實模態(tài)或虛假模態(tài)的單一模態(tài)穩(wěn)定圖(Single Mode Stabilization Diagram, SMSD),作為CNN的輸入樣本,即一張700×900像素的二維圖像。具體做法是,以一定的頻率寬度bf將穩(wěn)定圖劃分為若干個長矩形條,其中bf由頻率識別精度確定。每一個矩形條包含若干個極點,這些極點被歸為一類,代表一個真實模態(tài)或者虛假模態(tài),如圖3所示。隨著模態(tài)階次的增加,極點整齊地排為一列,因此圖3代表了一個真實模態(tài)。相反,在圖4中,隨著模態(tài)階次的變化,在同一頻率處僅有少量的極點排為一列,因此圖4代表了虛假模態(tài)。通過對照專家識別的結果,即可給出每個SMSD的輸出標簽,分別用yphysical和yspurious表示真實模態(tài)和虛假模態(tài)。
yphysical=[1 0]T,yspurious=[0 1]T
(6)
圖3 真實模態(tài)的單一模態(tài)穩(wěn)定圖Fig.3 Single mode stabilization diagram of physical mode
圖4 虛假模態(tài)的單一模態(tài)穩(wěn)定圖Fig.4 Single mode stabilization diagram of spurious mode
因為在相同的參數(shù)下,圖像分辨率越大,通過卷積和采樣得到的特征數(shù)目就越多,而訓練時間和測試時間就越長。為了提升運算速率,并降低無效信息對圖像特征學習的干擾,本文在輸入樣本原有信息的前提下,將原有的SMSD的像素從700×900降低到了200×150,如圖5所示。
圖5 縮小像素后的單一模態(tài)穩(wěn)定圖Fig.5 Single mode stabilization diagram after zooming out
另一方面,CNN需要成千上萬的輸入樣本進行訓練,因此需要對樣本數(shù)進行擴充。在濾除空白部分以后,結合興趣頻帶的范圍以及識別頻率的精度要求,設定合適的頻帶寬度bf,如0.02 Hz。隨后,將如圖1所示的穩(wěn)定圖上的穩(wěn)定點歸類到每個頻帶內,歸類的原則是:每一類內頻率相差的最大值不大于頻帶寬度值,即可得到若干個包含不同數(shù)量穩(wěn)定點的矩形條,從而獲得一定數(shù)量的SMSD。由于CNN對于圖像位置變換和輪廓變化具有較高的敏感性,采用變換標簽法和平移法擴充樣本數(shù)量,如將“△”改為“☆”和“○”等。同時采用變換結構環(huán)境激勵的方法,最終得到接近1萬
個訓練樣本。在樣本擴充過程中,采用正負例均衡化方法人工增加樣本的數(shù)據(jù)量,避免因樣本分布不均導致過擬合現(xiàn)象而降低分類準確率。將擴充得到的訓練樣本打亂,取80%作為訓練集,20%作為測試集,訓練集和測試集在圖像內容上是絕對隔離的。
網(wǎng)絡模型的構建需結合訓練樣本的數(shù)據(jù)量以及樣本數(shù)據(jù)的特點,以此確定網(wǎng)絡深度、網(wǎng)絡每一層的功能以及網(wǎng)絡中的超參數(shù),如學習率η等。研究表明[20],CNN應用于圖像分類時有以下規(guī)律:①如果訓練數(shù)據(jù)集越大越復雜,網(wǎng)絡的深度就越深;②后面的卷積層所取特征數(shù)目通常比前面的卷積層多;③輸入圖像的分辨率越大,所取的特征數(shù)目越多,下采樣層的抽樣矩陣也越大;④CNN的下采樣層數(shù)通常不超過3層。
結合以上規(guī)律,考慮到SMSD樣本本身較簡單,且樣本訓練數(shù)據(jù)量僅需數(shù)千的級別就可訓練得到有效的CNN模型。因此,針對輸入大小為200×150的灰度圖SMSD(彩色維度為1)分類問題設計一個6C-2S-12C-5S的CNN模型,如圖6所示,其中C表示卷積層,S表示下采樣層;數(shù)字表示相應層所取特征映射個數(shù);其中第一個卷積層的卷積核大小設定為5×5,第二個卷積層的卷積核大小設定為4×4。
圖6 卷積神經(jīng)網(wǎng)絡模型結構圖Fig.6 Schematic diagram of convolutional neural network structure
以圖6為例,說明本文設計的CNN特征提取的過程。首先輸入像素為200×150 的SMSD 圖像通過第一個卷積層(C1)在特征空間重構,獲得6個特征圖像,每個特征圖像大小為196×146,根據(jù)C1層卷積核大小為5×5,其計算方式為
(200-5+1)×(150-5+1)=196×146
(7)
經(jīng)過下采樣層S1的池化作用后,大小為(196/2)×(146/2)=98×73的特征圖像。同理,經(jīng)過卷積層C2后,特征圖像大小變?yōu)?5×70;經(jīng)過下采樣層S2后,特征圖像大小變?yōu)?9×14,因此,全連接層得到的特征向量長度為19×14×12=3 192。
反向傳播階段,設定學習參數(shù),采用梯度下降法對CNN進行訓練,得到訓練好的CNN。經(jīng)過激活函數(shù)計算得到預測的標簽值,從而進行真假模態(tài)的分類。
激勵函數(shù)是CNN的核心部分之一,常用的兩種函數(shù)有Sigmoid(x)函數(shù)和雙曲正切tanhx函數(shù),如圖7所示。在進行計算對比之后發(fā)現(xiàn),對于SMSD的識別,Sigmoid(x)函數(shù)收斂性優(yōu)于tanhx函數(shù),因此本文采用Sigmoid(x)函數(shù)作為激勵函數(shù)。
(8)
(9)
此外,在網(wǎng)絡模型初始設置中,如權重設定過高,則Sigmoid會飽和,導致死神經(jīng)元(Dead Neurons),如果權重太小,梯度值也會很小。因此,需要在中間區(qū)域選擇權值。根據(jù)已有關于初始權值的研究[21],可將該層卷積核每個元素初始化為式(10)之間的隨機數(shù),如式(10)所示
(10)
式中:Fin為該層輸入維度;Fout為該層輸出維度。
圖7 不同激活函數(shù)的函數(shù)圖像Fig.7 Graphs for different activation functions
為驗證本文所設計的CNN自動分析SMSD剔除虛假模態(tài)的有效性和對于不同結構穩(wěn)定圖自動分析的通用性,編制了隨機子空間法模態(tài)識別的Matlab程序,分別計算出3自由度數(shù)值模型、7自由度數(shù)值模型、HCT大樓、Z24橋4個結構的穩(wěn)定圖,并通過預處理得到相應的SMSD訓練樣本和測試樣本,隨后輸入構建好的CNN模型進行訓練和測試。每個算例的介紹及穩(wěn)定圖的獲取過程,如圖8所示。
圖8 卷積神經(jīng)網(wǎng)絡自動分析穩(wěn)定圖流程圖Fig.8 Flow chart of automatically analyzing stabilizationdiagram with convolutional neural network
3自由度彈簧質量模型[22]由Matlab軟件建立,其中系統(tǒng)的質量矩陣、剛度矩陣分別為
(11)
由此,可計算得到固有頻率為:2.82 Hz,7.49 Hz,10.93 Hz。
在每個質量點上施加白噪聲激勵,設定采樣頻率為100 Hz,將采集得到的加速度數(shù)據(jù)代入隨機子空間法程序,即可計算得到穩(wěn)定圖,如圖9所示。
圖9 3自由度模型穩(wěn)定圖Fig.9 Stabilization diagram of 3 DOF model
同樣采用Matlab軟件建立一個7自由度彈簧質量模型[23],其系統(tǒng)的質量矩陣、剛度矩陣分別為
[M]=I(7, 7)
(12)
(13)
設阻尼比為
[C]=0.2[M]+0.000 3[K]
(14)
通過特征值分解,可得理論模態(tài)的固有頻率為:13.39 Hz,22.85 Hz,28.17 Hz,28.87 Hz,40.15 Hz,41.39 Hz,46.90 Hz。
同理,設定采樣頻率為1 000 Hz,由隨機子空間法計算得到的穩(wěn)定圖,如圖10所示。
以加拿大一所運營中的鋼筋混凝土結構大樓(Heritage Court Tower, HCT)為研究對象,采用英國哥
圖10 7自由度系統(tǒng)穩(wěn)定圖Fig.10 Stabilization diagram of 7 DOF model
倫比亞大學Felber研究團隊采集的環(huán)境激勵振動加速度數(shù)據(jù)計算得到該結構的穩(wěn)定圖。所采用的測試數(shù)據(jù)共有為4個分布,其中第1分布包含6個通道,其他分布各有8個通道,每個通道包含13 108個加速度數(shù)據(jù),采樣頻率為40 Hz。隨機子空間法計算得到穩(wěn)定圖如圖11所示。
圖11 HCT大樓穩(wěn)定圖Fig.11 Stabilization diagram of heritage court tower
瑞士Z24[24]橋位于瑞士伯恩州,是一座單箱雙室形式的預應力混凝土箱梁橋。其主跨30 m,兩邊跨均為14 m。本文使用的Z24橋加速響應數(shù)據(jù)來源于丹麥SVS公司。監(jiān)測一共分為9個分布,每個分布有33個通道,其中28個通道位于橋面,3個位于橋面的參考點通道,2個為橋墩測試通道共5個固定通道作為參考點,每個通道數(shù)據(jù)長度均為21 839,采樣頻率為33.33 Hz。由隨機子空間法計算得到的穩(wěn)定圖如圖12所示。
將上述4個算例計算得到的穩(wěn)定圖經(jīng)過前文所述的預處理方法進行處理,得到9 500個SMSD,并以8 000個樣本(其中4 000個為真實模態(tài),4 000個為虛假模態(tài))作為訓練集,1 500個樣本(其中690個為真實模態(tài),810個為虛假模態(tài))作為測試集。每個樣本的期望標簽由數(shù)值計算的理論值和專家人工識別的真實模態(tài)確定。采用本文構建的“6C-2S-12C-5S”卷積網(wǎng)絡模型進行訓練,學習率設定為0.1,迭代次數(shù)設為50。經(jīng)過訓練,得到的損失函數(shù)隨訓練次數(shù)變化曲線,如圖13所示。由圖13可知,本文設計的CNN能夠在無需人為設定特征參數(shù)的情況下,自動識別穩(wěn)定圖上真假模態(tài)的特點。經(jīng)過50次迭代以后,損失函數(shù)即由45.75下降到了0.32,平均每訓練一次,可下降1.98%。
圖12 Z24大橋穩(wěn)定圖Fig.12 Stabilization diagram of Z24 Bridge
圖13 損失函數(shù)隨訓練次數(shù)變化圖Fig.13 Training lose-epoch curve
將測試集中包含的1 500個樣本代入訓練好的CNN進行測試。測試發(fā)現(xiàn)錯誤率僅為0.267%,僅錯誤4個,說明本文所提出的算法能夠很好的區(qū)分穩(wěn)定圖上的真假模態(tài)。此外,識別錯誤的樣本號分別為:137,270,386,1 405,其中某一識別錯誤的SMSD,如圖14所示。
圖14 識別錯誤的單一模態(tài)穩(wěn)定圖Fig.14 Wrong examples of single mode stabilization diagrams
與專家識別結果對比發(fā)現(xiàn),實際上這4個SMSD都是同一個SMSD變換而來,且都是將虛假模態(tài)識別成了真實模態(tài)。這是因為虛假模態(tài)常常出現(xiàn)在高階部分[25],雖然這一模態(tài)有部分極點也排成了一列,但是在階次為0~24內,并沒有極點存在,因而造成了一種類似真實模態(tài)的“假象”。為避免這樣的錯誤,保持網(wǎng)絡模型其他參數(shù)不變,將訓練次數(shù)提升到100次,損失函數(shù)由45.75降低到了0.11,測試準確率即達到了100%。
最后,將預測為真實模態(tài)的單一模態(tài)穩(wěn)定圖列出,并取其平均值作為該階真實模態(tài)的識別結果。4個算例的識別結果,如表1~表4所示。由識別結果發(fā)現(xiàn)CNN可用于自動識別真實模態(tài)和虛假模態(tài)。
表1 3自由度CNN自動識別與理論值的結果比較
表2 7自由度CNN自動識別與理論值的結果比較
表3 HCT CNN自動識別與專家識別結果比較
表4 Z24CNN自動識別與專家識別結果比較
本文結合穩(wěn)定圖理論和卷積神經(jīng)網(wǎng)絡理論,提出了一種自動剔除穩(wěn)定圖中虛假模態(tài)的新方法。采用數(shù)值模型算例和真實結構實測數(shù)據(jù)將提出算法自動識別模態(tài)參數(shù)的結果與專家人工識別結果進行了對比,驗證了算法的可靠性。在試驗過程中,得出了以下結論:
(1)樣本量充足的前提下,提出的基于CNN的穩(wěn)定圖自動識別方法能夠有效自動地區(qū)分穩(wěn)定圖上的真實模態(tài)與虛假模態(tài);
(2)搭建的CNN可用于識別不同結構的穩(wěn)定圖,具有一定的通用性,可推廣應用于模態(tài)分析軟件中;
(3)在搭建CNN過程中,試驗發(fā)現(xiàn)針對SMSD的自動分類,Sigmoid激活函數(shù)具有較好的收斂性;通過計算發(fā)現(xiàn)當學習率取值為0.1,訓練次數(shù)取值為100時,具有較好的識別效率和精度。