董 泳,劉肖峰,李云波,賈玉豪
(1.南京市水利規(guī)劃設(shè)計(jì)院股份有限公司,江蘇 南京 210022;2.河海大學(xué)水利水電學(xué)院,江蘇 南京 210024;3.上??睖y(cè)設(shè)計(jì)研究院有限公司,上海 200335)
大壩作為一種重要的基礎(chǔ)設(shè)施,在社會(huì)、經(jīng)濟(jì)發(fā)展過程中發(fā)揮著重要作用,一旦發(fā)生事故,將對(duì)下游人民的生命財(cái)產(chǎn)造成巨大損失[1]。因此,對(duì)大壩行為趨勢(shì)的分析和預(yù)估是至關(guān)重要的。變形作為大壩結(jié)構(gòu)性態(tài)最直觀的指標(biāo),選取高效的分析模型對(duì)其進(jìn)行建模、分析,是大壩安全評(píng)價(jià)系統(tǒng)的重要課題之一[2]。
傳統(tǒng)的大壩變形分析方法主要分為3大類——確定性模型、統(tǒng)計(jì)模型以及混合模型。這3種模型的缺點(diǎn)主要是建模難、精度不能滿足要求等。為此一些學(xué)者將機(jī)器學(xué)習(xí)(ML)相關(guān)算法引入大壩變形分析領(lǐng)域,如人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、極限學(xué)習(xí)機(jī)等方法[3-5]。以往ML方法主要針對(duì)影響大壩變形的環(huán)境因素(如水壓、溫度和時(shí)效等)進(jìn)行多變量建模,從而構(gòu)建變形預(yù)測(cè)模型。然而實(shí)際工程中,大壩變形監(jiān)測(cè)數(shù)據(jù)的波動(dòng)性往往較強(qiáng),模型的輸入變量不能很好地捕捉變形的變化趨勢(shì),造成了模型預(yù)測(cè)精度不足。如何降低原始變形數(shù)據(jù)的波動(dòng)性,是從本質(zhì)上提高變形預(yù)測(cè)精度的關(guān)鍵。因此本文引入了Huang等[6]提出的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD),旨在將原始變形序列分為若干穩(wěn)定的分量,進(jìn)而深入挖掘大壩變形的內(nèi)在規(guī)律。與VMD、小波變換等傳統(tǒng)信號(hào)分解方法相比,EMD具有不受分解層數(shù)以及小波基選擇影響的優(yōu)勢(shì),已經(jīng)在大壩安全監(jiān)控系統(tǒng)的構(gòu)建中得到了廣泛的應(yīng)用[7-9]。然而,由于大壩變形的復(fù)雜非線性,經(jīng)過EMD分解得到的高頻分量依舊給模型的預(yù)測(cè)帶來一定難度。
為了解決高頻分量非線性強(qiáng)、預(yù)測(cè)精度低等問題,本文提出基于EEMD[10]對(duì)其進(jìn)行再次分解,從而降低高頻分量的非線性,最大程度上降低高頻分量對(duì)整體變形預(yù)測(cè)精度的影響。經(jīng)過2次分解得到的一系列變形分量代表變形不同尺度下的變化規(guī)律。對(duì)于某個(gè)分量,其可能受某一環(huán)境影響因子的影響或多因素耦合影響。為了解決模型輸入變量難以確定的問題,本文提出了使用LSTM[11]對(duì)各分量進(jìn)行建模,考慮各個(gè)時(shí)間序列的時(shí)序相關(guān)性。通過查閱文獻(xiàn)可知,LSTM的預(yù)測(cè)性能優(yōu)于傳統(tǒng)ML方法。LSTM獨(dú)特的“門”結(jié)構(gòu)能夠針對(duì)時(shí)間序列的非線性進(jìn)行建模分析,通過滑窗的滑動(dòng)實(shí)現(xiàn)預(yù)測(cè)結(jié)果的輸出。對(duì)各分量分別構(gòu)建LSTM模型,將得到的預(yù)測(cè)結(jié)果進(jìn)行疊加,得到最終的變形預(yù)測(cè)結(jié)果。
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是一種對(duì)非線性非平穩(wěn)信號(hào)進(jìn)行平滑處理的方法。通過EMD分解可以將復(fù)雜的原始信號(hào)分解為一系列光滑的分量d。為了使得到的時(shí)間序列的分解結(jié)果有意義,d有2個(gè)約束條件:①數(shù)據(jù)序列的極值點(diǎn)個(gè)數(shù)與過零點(diǎn)個(gè)數(shù)之差≤1;②上、下包絡(luò)線在任意時(shí)刻的均值為0。EMD的主要表達(dá)式為
(1)
式中,di(t)和r(t)分別為第i個(gè)分量以及殘差序列;x(t)表示為原始序列,本文中表示大壩原始變形序列。
變形時(shí)間序列經(jīng)EMD分解,將得到一組具有不同頻率的分量。其中變形信息的不確定性主要包含在高頻分量中,且變形規(guī)律難以捕捉,這將造成高頻分量的預(yù)測(cè)結(jié)果誤差較大。本文針對(duì)高頻分量提出了二次分解法,旨在分離出高頻分量中的有效變形信息,削弱波動(dòng)性對(duì)預(yù)測(cè)模型輸出結(jié)果的負(fù)面影響,以提高變形預(yù)測(cè)精度??紤]到高頻分量的復(fù)雜非線性,為了更有效提取高頻分量中的變形信息,本文提出使用EEMD算法對(duì)其進(jìn)行再次分解。
EEMD方法將白噪聲加入原始信號(hào)[12],然后使用EMD方法對(duì)這些新獲得的序列進(jìn)行處理,解決了EMD存在的模態(tài)混淆缺陷。EEMD原理為
(1)步驟1。將白噪聲加入原始序列x(t),生成新的時(shí)間序列y(t)。
(2)步驟2。利用EMD方法對(duì)新生成的時(shí)間序列進(jìn)行分解,得到新的di(t)和r(t);。
(2)
(3)
LSTM神經(jīng)網(wǎng)絡(luò)是一種特殊的遞歸神經(jīng)網(wǎng)絡(luò),具有學(xué)習(xí)長(zhǎng)期依賴關(guān)系的能力。與簡(jiǎn)單的RNN不同,LSTM神經(jīng)網(wǎng)絡(luò)有內(nèi)置的機(jī)制(輸入門it、遺忘門ft和輸出門ot)來控制信息在整個(gè)過程中是如何被記憶或者丟棄的,克服了RNN固有的梯度消失問題。LSTM神經(jīng)網(wǎng)絡(luò)的體系結(jié)構(gòu)如圖1所示,并由下列公式進(jìn)行定義。
(4)
(5)
(6)
(7)
ht=ottanh(ct)
(8)
(9)
本文通過EMD分解原始變形序列得到一組包含不同頻率的分量(d1,d2,…,dN,r);對(duì)于其中的高頻分量di,通過EEMD算法進(jìn)行分解得到一組趨于穩(wěn)定的分量(D1,D2,…,DP,R);所有分量集合包含了原始變形序列的全部變形信息,選取LSTM作為各分量的時(shí)序預(yù)測(cè)模型,建模并預(yù)測(cè)得到各分量的預(yù)測(cè)結(jié)果后,將所有預(yù)測(cè)結(jié)果疊加得到最終的輸出,從而構(gòu)建了基于EMD-EEMD-LSTM的大壩變形預(yù)測(cè)模型,具體流程如圖2所示。
以某碾壓混凝土拱壩為例,具體說明EMD-EEMD-LSTM模型在大壩變形預(yù)測(cè)中的優(yōu)越性。拱壩壩軸線與河道斜交,左右兩岸地形不對(duì)稱。建基面高程130.0 m,壩頂高程234.6 m,最大壩高104.6 m。壩體共分為12個(gè)壩段,大壩變形由布置于壩中的垂線系統(tǒng)監(jiān)測(cè)得到。本文選取第4壩段ZC2測(cè)點(diǎn)2015年1月1日~2017年8月31日期間的徑向變形數(shù)據(jù)作為分析對(duì)象,變形觀測(cè)數(shù)據(jù)每日讀取一次。在數(shù)據(jù)分析之前,對(duì)其中包含的異常值和缺失值進(jìn)行預(yù)處理。將缺失值進(jìn)行剔除,并采用線性差值法處理異常值,最終可得966個(gè)變形讀數(shù),變形曲線見圖3。同時(shí)將時(shí)段劃分為訓(xùn)練組、驗(yàn)證組和預(yù)測(cè)組,其中2015年1月1日~2017年7月2日時(shí)段內(nèi)的數(shù)據(jù)為訓(xùn)練組,2017年7月3日~2017年8月1日時(shí)段內(nèi)的數(shù)據(jù)為驗(yàn)證組,2017年8月2日~2017年8月31日時(shí)段內(nèi)的數(shù)據(jù)為預(yù)測(cè)組。訓(xùn)練組用以訓(xùn)練LSTM模型,驗(yàn)證組用以檢驗(yàn)訓(xùn)練模型的有效性,預(yù)測(cè)組用以預(yù)測(cè)評(píng)估未來時(shí)段內(nèi)的大壩變形發(fā)展趨勢(shì)。
利用EMD算法對(duì)原始變形序列進(jìn)行分解,分解結(jié)果見圖4。由圖4可知,EMD能夠?qū)⒃夹蛄蟹纸鉃椴煌l率的變形信號(hào)組合。其中d3、d4為中頻信號(hào),d5、d6以及r為低頻信號(hào),上述信號(hào)通過LSTM建模預(yù)測(cè),將得到預(yù)期的預(yù)測(cè)結(jié)果。而d1、d2兩個(gè)高頻變形信號(hào)表現(xiàn)出明顯的波動(dòng)性,這將給變形預(yù)測(cè)帶來一定的難度,為此本文對(duì)信號(hào)d1+d2進(jìn)行再次分解,以深入挖掘高頻信號(hào)中蘊(yùn)含的變形信息,基于EEMD的高頻分解結(jié)果見圖5。
由圖5可知,經(jīng)過EEMD分解,高頻分量可以被分為11個(gè)分量。通過中低頻分量可以看出,第1次分解得到的高頻分量中依舊包含有用的變形信息,雖然該部分變形信息占比較低,然而忽略此部分將使得預(yù)測(cè)結(jié)果缺乏可靠性,且對(duì)預(yù)測(cè)結(jié)果的精度造成一定的負(fù)面影響。針對(duì)EEMD分解得到的11個(gè)變量,由于此部分變形幅度不大,因此采用組合建模方法,即將它們分為高、中、低頻3組進(jìn)行組合預(yù)測(cè)。其中,D1、D2為高頻組合,D3、D4、D5為中頻組合,剩余分量為低頻組合。
針對(duì)分量d3~d6、r以及二次分解后的3種頻率組合分別建立LSTM模型,為對(duì)比基于EEMD的高頻分解的有效性,考察EEMD分解前后預(yù)測(cè)結(jié)果的精度差異,同時(shí)選取了單一多變量BP模型以及LSTM模型作為對(duì)比模型,各個(gè)模型的預(yù)測(cè)結(jié)果見圖6。
由圖6可知,各模型預(yù)測(cè)結(jié)果變化曲線差異較大。其中,BP模型對(duì)應(yīng)的變化曲線與實(shí)測(cè)值的誤差最大,說明單一的多變量模型并不能很好地捕捉變形的非線性;LSTM模型的預(yù)測(cè)結(jié)果更接近真實(shí)值,然而仍舊無法精確捕捉變形的波動(dòng)性。相比之下,通過信號(hào)分解技術(shù)分解后的變形預(yù)測(cè)結(jié)果明顯優(yōu)于單一模型。
圖7為各模型預(yù)測(cè)結(jié)果殘差圖。由圖7可知,BP模型的預(yù)測(cè)殘差變化幅度明顯高于其中模型,LSTM次之;而EMD-LSTM和EMD-EEMD-LSTM模型對(duì)應(yīng)的殘差與x軸形成的誤差面積明顯小于單一模型。為了進(jìn)一步對(duì)比高頻分量分解前后預(yù)測(cè)結(jié)果的精確度,說明挖掘高頻分量的必要性,選取RMSE、MAE以及預(yù)測(cè)結(jié)果箱線圖作為模型預(yù)測(cè)性能評(píng)價(jià)指標(biāo),對(duì)不同模型的預(yù)測(cè)結(jié)果進(jìn)行量化評(píng)價(jià),各模型的評(píng)價(jià)指標(biāo)如圖8所示。
由圖8可知,分析各模型的預(yù)測(cè)性能,其中BP和LSTM模型的評(píng)價(jià)指標(biāo)明顯低于經(jīng)過2個(gè)結(jié)合信號(hào)分解的模型。對(duì)于EMD-LSTM和EMD-EEMD-LSTM模型,可知后者的RMSE和MAE取值均低于前者,驗(yàn)證了討論高頻分量中有效變形信息的重要性。由箱線圖(圖8a)可以看出,EMD-EEMD-LSTM對(duì)應(yīng)的箱線圖與實(shí)測(cè)值代表的箱線圖各項(xiàng)指標(biāo)最為接近,說明對(duì)于大壩這種重要的基礎(chǔ)設(shè)施來說,變形高頻分量中的變形信息不可忽視。
本文構(gòu)建了一種基于EMD-EEMD-LSTM模型的大壩變形預(yù)測(cè)分析方法,該方法具有較高的大壩變形預(yù)測(cè)精度。其中,EMD模型能夠有效降低原始序列的波動(dòng)性;基于EEMD對(duì)高頻分量進(jìn)行再次分解,能夠進(jìn)一步降低非線性對(duì)變形預(yù)測(cè)結(jié)果的負(fù)面影響,深入挖掘變形高頻分量中蘊(yùn)含的變形信息,提升預(yù)測(cè)性能;選取LSTM作為各分量變形預(yù)測(cè)器,對(duì)每個(gè)分量進(jìn)行建模,考慮變形時(shí)序依賴性,提高了模型的預(yù)測(cè)精度。