任秋兵,沈 揚,李明超,孔 銳,李明昊
(1.水利工程仿真與安全國家重點實驗室,天津大學(xué),天津 300354;2.中國長江三峽集團(tuán)有限公司,北京 100038;3.中國電建集團(tuán) 西北勘測設(shè)計研究院有限公司,陜西 西安 710065)
為達(dá)到防洪、發(fā)電、灌溉、供水等目的,需要修建不同類型的水工建筑物以控制和調(diào)配水流,如擋水建筑物(大壩、堤防等)、輸水建筑物(渠道、渡槽等)、整治建筑物等[1]。結(jié)構(gòu)安全是建筑物發(fā)揮調(diào)控功能的前提,而安全管理為建筑物正常運行提供保障,尤以長期安全監(jiān)控為甚。將各種儀器布設(shè)于水工建筑物關(guān)鍵部位,通過監(jiān)測變形、滲流等效應(yīng)量,從不同維度綜合反映其工作性態(tài)[2]。根據(jù)原型觀測資料,利用統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)等方法,構(gòu)建多效應(yīng)量數(shù)學(xué)監(jiān)控模型,能夠及時掌握和預(yù)測建筑物結(jié)構(gòu)性能的重要變化,從而為評價建筑物安全狀況、發(fā)現(xiàn)建筑物異常跡象提供科學(xué)依據(jù)[3]。
依據(jù)構(gòu)建方法的不同,常規(guī)水工建筑物安全監(jiān)控模型大致分為統(tǒng)計模型、確定性模型和混合模型。以統(tǒng)計模型為代表的三大常規(guī)模型應(yīng)用頗廣,時至今日仍然發(fā)揮著重要作用,其推導(dǎo)過程和適用范圍詳見文獻(xiàn)[4];然而,常規(guī)建模方法難以適應(yīng)繁多因子與效應(yīng)量間的復(fù)雜非線性關(guān)系,且易受不確定性因素干擾,故無法確保所建模型的準(zhǔn)確性和穩(wěn)健性[5]。20世紀(jì)末,人工智能技術(shù)攻關(guān)和行業(yè)應(yīng)用發(fā)展勢頭迅猛。徐洪鐘等[6]和蘇懷智等[7]率先將人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)、支持向量機(jī)(Support Vector Machine,SVM)等建模方法成功應(yīng)用于水工建筑物安全性態(tài)分析;之后,利用機(jī)器學(xué)習(xí)算法對不同效應(yīng)量進(jìn)行建模預(yù)測一直是水工建筑物安全監(jiān)控領(lǐng)域的研究熱點[8-11]。Wang等[12]、Wei等[13]和李明超等[14-15]進(jìn)一步發(fā)展并創(chuàng)新提出了組合模型、時空模型等一系列先進(jìn)方法,并取得了豐富成果。據(jù)此,吳中如等[5]歸納總結(jié)出安全監(jiān)控模型的總體發(fā)展趨勢如下:三大常規(guī)模型逐漸向組合化、時空化和智能化發(fā)展,以此提高模型的準(zhǔn)確性、魯棒性和外延性。
隨著安全監(jiān)控理論和計算機(jī)技術(shù)的不斷進(jìn)步,智能化是水工建筑物安全監(jiān)控發(fā)展的必然趨勢,其主要體現(xiàn)在監(jiān)測手段、數(shù)據(jù)管理和數(shù)值方法三個方面。目前,水利信息化建設(shè)偏重于監(jiān)測儀器和信息集成系統(tǒng)的升級改造,而對數(shù)據(jù)分析方法的研究和創(chuàng)新關(guān)注較少[2,16-19]。這就引發(fā)數(shù)學(xué)監(jiān)控模型的信息挖掘能力與數(shù)量日益龐大、形式日漸復(fù)雜的原型觀測資料不相適應(yīng)的問題,直接影響到模型的預(yù)測表現(xiàn)。盡管ANN、SVM 等淺層學(xué)習(xí)算法相較于統(tǒng)計模型在非線性信息提取方面有較大提升[20],但在某些場景下仍舊難以滿足監(jiān)控需求。深層非線性網(wǎng)絡(luò)模型[21]為解決上述問題提供了可行性。深度學(xué)習(xí)[22]是ANN發(fā)展的突破,亦是機(jī)器學(xué)習(xí)領(lǐng)域的拓展,其利用復(fù)雜結(jié)構(gòu)或多重非線性變換處理層對數(shù)據(jù)進(jìn)行高度抽象,因而在隱含信息挖掘方面優(yōu)勢明顯。以長短期記憶網(wǎng)絡(luò)[23](Long Short-Term Memory,LSTM)為例,其能夠充分挖掘時序數(shù)據(jù)中的時間依賴性以增加信息維度,從而實現(xiàn)對滑坡位移[24]、地下水埋深[25]等監(jiān)測量的高精度預(yù)測。而在水工建筑物安全監(jiān)控領(lǐng)域,有關(guān)LSTM等深度學(xué)習(xí)算法的應(yīng)用探索還鮮有報道,僅有少量研究[26-29]將其用于大壩變形預(yù)報,目前尚未擴(kuò)展到其他水工建筑物,亦未針對監(jiān)測數(shù)據(jù)自身特性進(jìn)行優(yōu)化處理。
為此,本文在LSTM算法的基礎(chǔ)上構(gòu)建水工建筑物安全監(jiān)控深度分析模型,并對算法進(jìn)行優(yōu)化,以提高所建模型的預(yù)測可靠性和工程適用性,其主要包括以下三個方面的內(nèi)容:(1)界定水工建筑物安全監(jiān)控大數(shù)據(jù)的概念,并闡明直接應(yīng)用深度學(xué)習(xí)算法構(gòu)建安全監(jiān)控模型的局限性;(2)有針對性地提出適用于不同類型水工建筑物的安全監(jiān)控深度模型構(gòu)建及優(yōu)化方法;(3)通過多類型水工建筑物的多效應(yīng)量實測數(shù)據(jù)驗證所提模型方法的有效性。
2.1 安全監(jiān)控大數(shù)據(jù)特性水工建筑物安全監(jiān)控大數(shù)據(jù)并不完全符合信息技術(shù)行業(yè)大數(shù)據(jù)的“5V”特征[30](即Volume、Variety、Velocity、Value和Veracity),具有其獨特性,主要體現(xiàn)在以下五個方面。
(1)在容量方面,單一項目監(jiān)測數(shù)據(jù)量不大,仍屬于小規(guī)模數(shù)據(jù)集;繁多項目長期監(jiān)測記錄構(gòu)成的數(shù)據(jù)庫體量巨大,但遠(yuǎn)達(dá)不到PB級。
(2)在種類方面,數(shù)據(jù)多源自各種監(jiān)測儀器,如三峽大壩安全監(jiān)測系統(tǒng)布置的儀器種類有六十多種,數(shù)量達(dá)到一萬余支;數(shù)據(jù)格式呈現(xiàn)“大部分結(jié)構(gòu)化,小部分半/非結(jié)構(gòu)化”的特點,且結(jié)構(gòu)化數(shù)據(jù)演變形式復(fù)雜多樣,總體上以周期性演變?yōu)橹?,但也不乏突變、噪聲等情況。
(3)在獲取速度方面,各種監(jiān)測儀器本身采集頻率較高,但受限于系統(tǒng)設(shè)置,一般以天為單位進(jìn)行統(tǒng)一采樣;且運行初期采樣速度較快,后期逐步放緩,以至于數(shù)據(jù)存儲時間間隔不固定。
(4)在價值方面,多數(shù)項目監(jiān)測數(shù)據(jù)價值密度較高,即有價值的數(shù)據(jù)所占比例較大。
(5)在真實性方面,除非監(jiān)測儀器發(fā)生故障或失效,否則數(shù)據(jù)質(zhì)量往往較高,但也伴隨著局部離群值等。
2.2 LSTM原理概述水工建筑物在施工和運行過程中所產(chǎn)生的監(jiān)測數(shù)據(jù)大多為結(jié)構(gòu)化時序數(shù)據(jù)。傳統(tǒng)ANN每相鄰兩層節(jié)點全互連,同層節(jié)點卻相互獨立,故難以學(xué)習(xí)時序數(shù)據(jù)的內(nèi)在延續(xù)性。循環(huán)神經(jīng)網(wǎng)絡(luò)[31](Recurrent Neural Networks,RNN)將時序概念引入網(wǎng)絡(luò)結(jié)構(gòu)中,表現(xiàn)為隱層間節(jié)點相連,且隱層輸入同時包含輸入層輸出與上一時刻隱層輸出,使其在時序數(shù)據(jù)分析方面適應(yīng)性較佳。但RNN 經(jīng)過多次迭代容易出現(xiàn)梯度爆炸或梯度消失的問題,導(dǎo)致網(wǎng)絡(luò)不穩(wěn)定甚至無法收斂[32]。為此,LSTM[23]應(yīng)運而生,其不僅克服了梯度問題,還提高了預(yù)測間隔或延遲較長的時序數(shù)據(jù)的能力,遂成為當(dāng)前處理時序數(shù)據(jù)最流行的深度學(xué)習(xí)算法之一。
LSTM在RNN的基礎(chǔ)上增加了特殊單元(即記憶模塊),其學(xué)習(xí)當(dāng)前信息的同時,還會提取長時間跨度數(shù)據(jù)之間的關(guān)聯(lián)性,以此減緩信息丟失速度,實現(xiàn)持久記憶。如圖1所示,記憶模塊由遺忘門()、輸入門()和輸出門()構(gòu)成,用于決定數(shù)據(jù)更新或丟棄。具體來說,遺忘門控制上一時刻內(nèi)部狀態(tài)()需遺忘的信息量,輸入門控制當(dāng)前時刻候選狀態(tài)()需保存的信息量,而輸出門則控制當(dāng)前時刻內(nèi)部狀態(tài)()需輸出給外部狀態(tài)()
(1)利用上一時刻外部狀態(tài)()和當(dāng)前時刻輸入(),計算出、和:
(2)結(jié)合和更新記憶單元狀態(tài)():
(3)通過將信息傳遞給:
式中:σ(?)、tanh(?)分別為Sigmoid函數(shù)和雙曲正切函數(shù);w、b分別為權(quán)重矩陣和偏置向量;⊙表示兩向量的標(biāo)量積。
圖1 LSTM單元內(nèi)部結(jié)構(gòu)[25]
2.3 深度學(xué)習(xí)算法適用性分析對于水工建筑物安全監(jiān)控大數(shù)據(jù),深度學(xué)習(xí)(如LSTM)與淺層學(xué)習(xí)相比,主要“深”在能夠更為全面地獲取數(shù)據(jù)潛在規(guī)律,從而為提升模型預(yù)測性能奠定信息基礎(chǔ)。因此,LSTM算法在水工建筑物安全監(jiān)控通用模型構(gòu)建框架中,不僅能承擔(dān)模型層的預(yù)測功能,而且能減少特征層中手工提取有效信息的工作量。再者,LSTM模型結(jié)構(gòu)便于調(diào)整,可依據(jù)數(shù)據(jù)形式的復(fù)雜程度而定[33]。不過,根據(jù)監(jiān)測數(shù)據(jù)特性,直接應(yīng)用LSTM算法構(gòu)建安全監(jiān)控模型仍有以下幾點不足:(1)監(jiān)測數(shù)據(jù)中存在含噪失真、非等間距以及局部空值野值等現(xiàn)象,需加強(qiáng)數(shù)據(jù)前端處理;(2)監(jiān)測數(shù)據(jù)處理講究及時有效,模型難以實現(xiàn)全數(shù)據(jù)處理,需限定記憶區(qū)間以減少模型訓(xùn)練時長;(3)模型表現(xiàn)易受監(jiān)測數(shù)據(jù)多重共線性等的影響;(4)模型超參數(shù)較多,而單一項目監(jiān)測數(shù)據(jù)量并不大,容易發(fā)生過擬合;加之,監(jiān)測項目眾多,數(shù)據(jù)形式多樣,對模型泛化能力提出了更高要求;(5)監(jiān)測數(shù)據(jù)外延對模型多步預(yù)測精度和特殊場景應(yīng)對能力亦較為重視。因此,有必要優(yōu)化深度模型架構(gòu)以適應(yīng)安全監(jiān)控大數(shù)據(jù)分析的需求。的信息量。其對應(yīng)計算過程如下:
針對上述不足,以LSTM深度學(xué)習(xí)算法為基礎(chǔ),從數(shù)據(jù)前端處理、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和外延預(yù)測方法三個方面著手改進(jìn),提出一種適用于不同類型水工建筑物的安全監(jiān)控深度分析模型。
3.1 數(shù)據(jù)前端處理為了提高安全監(jiān)控模型的外延能力,需提前對原型觀測資料進(jìn)行清洗、降噪和變換等必要的處理?,F(xiàn)給定包含T個數(shù)據(jù)的任一效應(yīng)量監(jiān)測序列yj(t),t=1,2,…,T;j=1,2,…,J,其中缺失值和異常值分別用表示,那么前端處理具體操作步驟如下:(1)步驟1。數(shù)據(jù)清洗。利用筆者先前所提“插值填補(bǔ)”和“異常檢測”算法分別對監(jiān)測數(shù)據(jù)中局部缺失值異常值進(jìn)行實時處理(詳見文獻(xiàn)[10]),得到修正序列不同于傳統(tǒng)數(shù)據(jù)清洗方法[34],“插值填補(bǔ)”算法能通過分布式建模充分利用缺失區(qū)域雙側(cè)已知監(jiān)測數(shù)據(jù)估計未知空值yjnu(t),而“異常檢測”算法則能通過魯棒分解對異常值起到明顯放大作用,使其便于識別。
(2)步驟2。降噪平滑。一般認(rèn)為,實際監(jiān)測數(shù)據(jù)往往含有不同程度的噪聲。在處理含噪數(shù)據(jù)時,為了最大限度還原真實信號,同時避免相移,先將輸入序列按順序濾波,再將濾波結(jié)果逆轉(zhuǎn)并反向通過濾波器,最后將所得結(jié)果逆轉(zhuǎn)后輸出,即為降噪平滑序列其數(shù)學(xué)描述[35]為:
式中:hj(t)為所用數(shù)字濾波器沖激響應(yīng)序列;分別為第一、二次濾波結(jié)果;分別為第一、二次濾波結(jié)果的逆轉(zhuǎn)序列。
需要說明的是,上述步驟均是針對效應(yīng)量yj(t)而言,若是對影響因子xi(t),t=1,2,…,T;i=1,2,…,I進(jìn)行前端處理,將yj(t)替換為xi(t)即可。此外,倘若優(yōu)化深度模型選擇對效應(yīng)量yj(t)進(jìn)行一元時序預(yù)測,就在上述步驟的基礎(chǔ)上,補(bǔ)充運用分段三次Hermite 插值函數(shù)[36]完成數(shù)據(jù)均勻化。為表述方便起見,下文將經(jīng)過前端處理的效應(yīng)量(或因子仍稱為yj(t)(或xi(t))。
3.2 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)全部數(shù)據(jù)(包括效應(yīng)量yj(t)及其影響因子xi,j(t))經(jīng)過預(yù)處理后,按照一定比例劃分為訓(xùn)練集Tr、驗證集Va和測試集Te,隨后采取以下措施對深層網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行優(yōu)化改進(jìn)。
(1)并聯(lián)搭建深層網(wǎng)絡(luò)LSTM1和LSTM(2統(tǒng)稱LSTM1,2),其中LSTM1用于一元時序預(yù)測,直接根據(jù)歷史監(jiān)測數(shù)據(jù)對效應(yīng)量yj(t)未來變化趨勢進(jìn)行外延分析;LSTM2則用于多元回歸預(yù)測,即通過效應(yīng)量yj(t)及其影響因子xi,j(t)間的因果關(guān)系構(gòu)建數(shù)學(xué)模型,進(jìn)而求解待估計參數(shù)。
(2)超參數(shù)調(diào)試對深層網(wǎng)絡(luò)的預(yù)測效果影響較大。以LSTM2為例,通過試算和隨機(jī)搜索算法,對隱層數(shù)nh、各隱層節(jié)點數(shù)nn、學(xué)習(xí)率lr和優(yōu)化迭代次數(shù)ni等超參數(shù)進(jìn)行迭代優(yōu)化,選取最優(yōu)超參數(shù)組合相較于LSTM2,LSTM1需將時序問題轉(zhuǎn)化為監(jiān)督學(xué)習(xí)問題,故增加時間窗口長度wt這一超參數(shù)。
(3)多數(shù)效應(yīng)量監(jiān)測序列存在長期相關(guān)性(即記憶性),通常越接近待預(yù)測值的數(shù)據(jù)對外延精度的影響越大,且過多的歷史冗余數(shù)據(jù)會增加模型的復(fù)雜度[37]。在預(yù)設(shè)范圍內(nèi),通過限定步長l改變Tr跨度,循環(huán)訓(xùn)練得到不同的網(wǎng)絡(luò)根據(jù)Va多次評估選取精度較高的網(wǎng)絡(luò)結(jié)構(gòu)其對應(yīng)的有效記憶區(qū)間Tr +Va(區(qū)間長度設(shè)為d)即可滿足預(yù)測Te的要求。
(4)為避免LSTM1,2因Tr數(shù)據(jù)量較少而出現(xiàn)過擬合等問題,一方面,控制網(wǎng)絡(luò)深度和訓(xùn)練周期,根據(jù)訓(xùn)練損失和Va性能評估確定何時提早停止;另一方面,采用L2正則化、Dropout、批標(biāo)準(zhǔn)化等方法對模型參數(shù)進(jìn)行約束,提高模型的泛化能力[38]。此外,添加正則項也有助于解決共線性問題。
(5)針對不同應(yīng)用場景,將多步預(yù)測精度和逐步誤差累積作為競選指標(biāo),自動擇優(yōu)選用或進(jìn)行外延預(yù)測,并利用全連接層進(jìn)行維度變換(一維輸出),以此實現(xiàn)最優(yōu)化數(shù)學(xué)建模。
3.3 外延預(yù)測方法直接多步預(yù)測(Direct Multi-step Prediction,DMP)能夠一次返回多個時刻的預(yù)測值是目前安全監(jiān)控模型中最常用的外延方法。DMP的學(xué)習(xí)、估計過程分別見下式:
式中:f1(?)為預(yù)測模型,文中指代LSTM2;ε為學(xué)習(xí)誤差;H為外延步數(shù)。
與DMP 不同,滾動單步預(yù)測(Rolling One-step Prediction,ROP)是將上一時刻預(yù)測值yj(t) 作為下一時刻預(yù)測值yj(t+1) 的輸入,利用動態(tài)更新間接實現(xiàn)多步預(yù)測,直至達(dá)到待預(yù)測步數(shù)H為止。ROP的學(xué)習(xí)、估計過程分別見下式:
式中:f2(?)為預(yù)測模型,文中指代LSTM1;d為有效記憶區(qū)間長度。
對于一個穩(wěn)定的預(yù)測模型,無需高頻次學(xué)習(xí)更新,通過設(shè)定更新時間tu即可完成周期性的模型迭代。
綜合上述三個方面的改進(jìn),以LSTM算法為基礎(chǔ)的水工建筑物安全監(jiān)控優(yōu)化深度模型得以構(gòu)建,稱為優(yōu)化LSTM模型(Optimized LSTM,OLSTM)。
圖2 某混凝土壩IP4_01_X方向變形監(jiān)測數(shù)據(jù)
圖3 某調(diào)水工程多效應(yīng)量監(jiān)測儀器讀數(shù)記錄
基于上述模型方法,選取多組不同效應(yīng)量實測數(shù)據(jù)作為典型應(yīng)用場景,對OLSTM進(jìn)行有效性和準(zhǔn)確性驗證,旨在通過此實例說明OLSTM在多類型水工建筑物安全監(jiān)控方面的優(yōu)勢。為此,以某混凝土壩IP4_01_X方向變形監(jiān)測數(shù)據(jù)(數(shù)據(jù)示于圖2,豎線以右為預(yù)測期)與某調(diào)水工程關(guān)鍵部位鋼筋計、測縫計、應(yīng)變計和滲壓計讀數(shù)記錄(數(shù)據(jù)示于圖3,豎線以右為預(yù)測期)為例,設(shè)定3種實際應(yīng)用場景,引入逐步回歸統(tǒng)計模型(SRSM)和SVM、反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)等淺層模型與OLSTM深度模型進(jìn)行性能對比。仿真實驗中需要注意以下幾點:(1)確保各模型輸入數(shù)據(jù)前端處理步驟(詳見3.1節(jié))的一致性,濾波結(jié)果示于圖2和圖3;(2)將淺層模型性能調(diào)至最優(yōu),SVM超參數(shù)(懲罰因子、高斯核函數(shù)參數(shù))和BPNN 超參數(shù)(連接權(quán)重、閾值)均由隨機(jī)搜索算法優(yōu)化;(3)OLSTM 采用自適應(yīng)矩估計算法更新內(nèi)部參數(shù),損失函數(shù)、隱層激活函數(shù)分別設(shè)為均方誤差(MSE)和tanh 函數(shù);(4)由于SVM、BPNN 和OLSTM 預(yù)測存在隨機(jī)性,遂將各模型10 次運行結(jié)果取均值作為最終輸出;(5)選用MSE、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)作為量化評估各模型預(yù)測性能的統(tǒng)計指標(biāo)。需要說明的是,本文限于篇幅僅在圖2和圖3中繪制出效應(yīng)量監(jiān)測序列。
4.1 場景一:數(shù)據(jù)量大,形式簡單由圖2可知,該測點變形呈明顯的周期性變化,是工程中最常見也是最簡單的一種數(shù)據(jù)演變形式[39];監(jiān)測數(shù)據(jù)樣本量較大,數(shù)值變化幅度基本一致;存在幾處分布較為離散的異常突變(圖2紅色框選處)?,F(xiàn)采用SRSM、SVM、BPNN 和OLSTM 這4種模型對大壩變形進(jìn)行外延預(yù)測,各模型的DMP結(jié)果如圖4所示。從圖4可以看出:(1)所有模型均未準(zhǔn)確把握大壩變形的局部細(xì)微波動,僅預(yù)測出大致變化趨勢;(2)SVM預(yù)測結(jié)果區(qū)別于其余3種模型,與實測值差距較大,說明其性能易受數(shù)據(jù)波動的影響;(3)前150 步內(nèi),OLSTM 預(yù)測效果明顯優(yōu)于SRSM 和BPNN,這正是此3 種模型性能差別的主要所在,表現(xiàn)出深度模型在大量數(shù)據(jù)挖掘分析方面的潛力。表1 是上述4 種模型的性能評估結(jié)果,各模型預(yù)測效果按照統(tǒng)計指標(biāo)從優(yōu)到劣排序為:OLSTM>SRSM>BPNN>SVM。
圖4 IP4_01_X測點變形的多模型預(yù)測結(jié)果
表1 IP4_01_X測點變形多模型預(yù)測性能量化評估結(jié)果
4.2 場景二:數(shù)據(jù)量小,形式復(fù)雜正如圖3(a)—(c)所示,該調(diào)水工程鋼筋計、測縫計和應(yīng)變計的讀數(shù)記錄是符合本應(yīng)用場景的3個實例,其數(shù)據(jù)特征描述如下:與4.1節(jié)中大壩變形相比,3組數(shù)據(jù)樣本量相對較小,演變形式復(fù)雜多樣;鋼筋應(yīng)力數(shù)值變化幅度隨著時間推移逐漸變大,且在預(yù)測期伊始陡然上升;裂縫開合度數(shù)值在實測期始末變化速率較快,中間呈平穩(wěn)變化狀態(tài);應(yīng)變數(shù)據(jù)中存在諸多幅度不一的波動,周期性特征被掩蓋?,F(xiàn)將不同模型(SRSM、BPNN和OLSTM)用于外推估計上述儀器讀數(shù),各模型的ROP結(jié)果如圖5(a)—(c)所示。由圖可知:(1)3種模型的預(yù)測誤差均隨外推步長的增加而增大(即誤差累積效應(yīng)),尤以SRSM為甚,表明傳統(tǒng)統(tǒng)計模型難以適應(yīng)非平穩(wěn)數(shù)據(jù)處理;(2)BPNN和OLSTM短期預(yù)測效果相仿,OLSTM長期預(yù)測結(jié)果與實測值更為接近,說明深度模型可用以長期安全監(jiān)控;(3)3種模型中僅有OLSTM 捕捉到局部數(shù)據(jù)波動,但仍存在一定偏差。從“多步預(yù)測精度”角度而言,3種模型在不同效應(yīng)量預(yù)測中的性能量化評估結(jié)果(表2)亦能佐證上述觀點,各模型預(yù)測效果按照統(tǒng)計指標(biāo)從優(yōu)到劣排序為:OLSTM>BPNN>SRSM。
圖5 多效應(yīng)量多模型預(yù)測結(jié)果
表2 多效應(yīng)量多模型預(yù)測性能量化評估結(jié)果
4.3 場景三:因子缺失,形式復(fù)雜圖3(d)中滲壓計讀數(shù)表現(xiàn)為密集型振蕩模式,隨機(jī)噪聲較大;數(shù)據(jù)樣本量較小,且缺失預(yù)測因子,難以依靠外生變量修正原始數(shù)據(jù),準(zhǔn)確預(yù)測未來趨勢難度較大。在此場景下,無法使用傳統(tǒng)統(tǒng)計模型,只能將BPNN和OLSTM用于水位變化的外延預(yù)測,兩種模型的ROP結(jié)果如圖5(d)所示。從圖中可以看出:前10步內(nèi),OLSTM預(yù)測結(jié)果更加貼近實測值,且數(shù)值存在恰當(dāng)?shù)牟▌樱?0步之后,實測數(shù)據(jù)變化幅度增大,OLSTM保守選取中值作為預(yù)測結(jié)果,而BPNN一直維持固有速率呈下降趨勢??傮w而言,同等情況下深度模型能夠抓取更多信息來提高逐步預(yù)測精度。
針對復(fù)雜非線性安全監(jiān)控大數(shù)據(jù),從前端處理、網(wǎng)絡(luò)結(jié)構(gòu)和外延預(yù)測三個方面出發(fā),通過改進(jìn)加強(qiáng)LSTM深層網(wǎng)絡(luò),提出適用于不同類型水工建筑物的安全監(jiān)控優(yōu)化深度模型,為深度學(xué)習(xí)推廣應(yīng)用奠定了研究基礎(chǔ)?;谒岢龅哪P?,結(jié)合某混凝土壩和某調(diào)水工程多效應(yīng)量監(jiān)測數(shù)據(jù),設(shè)置3種典型應(yīng)用場景下的多模型性能對比仿真實驗,結(jié)果表明該模型在外推估計方面優(yōu)勢明顯,主要表現(xiàn)為:(1)相比于常規(guī)、淺層模型,深度模型適用于更多場景,且同一場景下其預(yù)測效果提升顯著;(2)通過數(shù)據(jù)清洗、降噪平滑等前處理方法提高了數(shù)學(xué)建模效率,并改善了模型計算復(fù)雜度;(3)借助競爭機(jī)制和超參數(shù)優(yōu)化,自動選取較優(yōu)預(yù)測方式,不僅提高了模型的泛化能力,還減少了人工干預(yù)成本;(4)采用限定區(qū)間、早停、正則化等策略,縮短了模型訓(xùn)練時長,同時緩解了過擬合和共線性問題;(5)DMP重在把握整體演變趨勢,ROP則能反映局部數(shù)據(jù)波動。
鑒于深度學(xué)習(xí)算法在水工建筑物安全監(jiān)控領(lǐng)域的應(yīng)用研究尚處于起步階段,本文未能詳盡討論其他應(yīng)用場景,現(xiàn)提出以下兩點展望供相關(guān)人員參考:(1)深度模型預(yù)測性能與數(shù)據(jù)量密切相關(guān),而部分地區(qū)水工建筑物歷史觀測資料完整性、可靠性均不足,如何利用有限數(shù)據(jù)開發(fā)高精度網(wǎng)絡(luò)是一個重要的研究課題;(2)目前多數(shù)從業(yè)人員只能通過加深或加寬網(wǎng)絡(luò)改善模型性能,而無法對網(wǎng)絡(luò)內(nèi)部進(jìn)行有效的數(shù)學(xué)解釋,因而亟待研究深層網(wǎng)絡(luò)的可判讀性和可理解性。