鄧乙丁 李艷玲 徐穎 陳天賜
摘要:監(jiān)測數(shù)據(jù)異常識別是大壩運行安全在線監(jiān)測的前提和基礎(chǔ)。單一識別方法難以實現(xiàn)高效準(zhǔn)確識別,而RREW模型對規(guī)律不佳與單臺階數(shù)據(jù)序列容易漏判且計算效率低。為此,提出了基于卷積神經(jīng)網(wǎng)絡(luò)的一維VGG數(shù)據(jù)異常識別模型,建立了由統(tǒng)計回歸、穩(wěn)健回歸、一維VGG識別模型等模型庫和Pauta準(zhǔn)則、MZ準(zhǔn)則等判別準(zhǔn)則庫共同構(gòu)成的大壩安全數(shù)據(jù)異常識別模型簇,并構(gòu)建了不同數(shù)據(jù)類型與異常識別模型及預(yù)警準(zhǔn)則的匹配機制。工程校驗表明:一維VGG模型對不同序列長度、不同臺階占比的數(shù)據(jù)序列均具有較好的識別效果,能有效彌補傳統(tǒng)回歸模型和穩(wěn)健回歸模型的不足,由前述3種模型及兩種準(zhǔn)則共同構(gòu)建的異常識別模型簇可實現(xiàn)海量數(shù)據(jù)異常的在線精準(zhǔn)、快速識別,為大壩安全在線監(jiān)測提供可靠的數(shù)據(jù)支持。
關(guān)鍵詞:大壩安全監(jiān)測; 數(shù)據(jù)異常識別; 一維卷積神經(jīng)網(wǎng)絡(luò); 模型簇; 自匹配準(zhǔn)則
中圖法分類號: TV698.1
文獻標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2024.04.030
0引 言
監(jiān)測數(shù)據(jù)異常識別是大壩運行安全在線監(jiān)測的前提和基礎(chǔ)。識別監(jiān)測數(shù)據(jù)異常的常用方法是預(yù)測殘差判別法,其基本思路是首先計算模型預(yù)測值與實測值之間的殘差,再匹配相應(yīng)預(yù)警準(zhǔn)則實現(xiàn)測值異常評判。近年來,國內(nèi)外學(xué)者在數(shù)據(jù)異常識別方法和準(zhǔn)則方面開展了大量研究。如Cheng[1],Zhou[2]等分別基于潛變量、偏最小二乘法改進最小二乘支持向量機模型并優(yōu)化置信區(qū)間,顯著降低了誤警率。Lin[3],Shi[4]等分別利用高斯回歸(GPR)和遺傳算法(GA)優(yōu)化徑向基函數(shù)網(wǎng)絡(luò)(REFN),克服魯棒性差引起的模型誤差。Belmokre[5],Cheng[6]等采用機器學(xué)習(xí)方法改進統(tǒng)計回歸模型,消除了傳統(tǒng)統(tǒng)計回歸模型多重共線性帶來的預(yù)測誤差。Cui等[7]通過引入樣本分位數(shù)對整體參數(shù)進行穩(wěn)健估計,結(jié)合樣本分位數(shù)方法的特殊統(tǒng)計量設(shè)置閾值來檢測異常值。Li等[8]提出了基于MZ準(zhǔn)則的穩(wěn)健回歸模型(以下簡稱RREW模型),有效解決了臺階型、震蕩型等數(shù)據(jù)序列采用傳統(tǒng)統(tǒng)計回歸時易出現(xiàn)的漏判問題。胡德秀[9]、楊承志[10]等分別將穩(wěn)健估計與極限學(xué)習(xí)機、支持向量機相結(jié)合,建立大壩變形監(jiān)控模型,提高了模型抗粗差能力。王麗榮等[11]構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)圖像識別模型,取得了較好的異常識別效果。陳冬英[12]、張碩[13]、黨英[14]等將一維神經(jīng)網(wǎng)絡(luò)分別用于近紅外光譜分類識別、鉆機實時數(shù)據(jù)分析推斷以及振動信號的特征提取,都取得了較好的應(yīng)用效果。
隨著大壩安全在線監(jiān)測的不斷發(fā)展[15],國家對安全監(jiān)測數(shù)據(jù)異常在線識別模型的適用性、高效性和準(zhǔn)確性提出了更高的要求,而不同識別方法對不同特征序列的適用性亦存在差異,基于單一方法的數(shù)據(jù)異常識別其可靠性和高效性難以保證。因此,本文針對傳統(tǒng)統(tǒng)計回歸模型和RREW模型在大壩安全在線監(jiān)控系統(tǒng)應(yīng)用中存在的異常值漏判問題,結(jié)合視覺幾何組(Visual Geometry Group,VGG)中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提出了基于一維卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)異常識別方法——一維VGG識別模型(以下簡稱“1D-VGG模型”),建立了大壩安全數(shù)據(jù)異常識別模型簇,并綜合考慮識別精度和效率,構(gòu)建了不同數(shù)據(jù)類型與異常識別模型及預(yù)警準(zhǔn)則的匹配機制,即基于MZ準(zhǔn)則的穩(wěn)健回歸模型匹配雙臺階型和震蕩型數(shù)據(jù)序列,基于Pauta準(zhǔn)則的統(tǒng)計回歸模型匹配模型擬合精度較高的正常型和離群型數(shù)據(jù)序列,而基于Pauta準(zhǔn)則的1D-VGG模型匹配單臺階型以及模型擬合精度較低的正常型和離群型數(shù)據(jù)序列,這種“數(shù)據(jù)類型-模型識別方法-預(yù)警準(zhǔn)則”的自匹配準(zhǔn)則實現(xiàn)了海量數(shù)據(jù)的在線精準(zhǔn)、快速識別。
1數(shù)據(jù)異常在線識別存在的問題分析
受測量誤差、環(huán)境量響應(yīng)等因素影響,大壩安全監(jiān)測數(shù)據(jù)序列類型眾多,既包括周期型、趨勢型等正常數(shù)據(jù)序列,也包括離群型、臺階型、震蕩型等異常數(shù)據(jù)序列?;赑auta準(zhǔn)則的傳統(tǒng)統(tǒng)計回歸模型對震蕩型、臺階型等數(shù)據(jù)序列異常識別存在誤判、漏判率較高的問題,為此Li等[8]提出了以穩(wěn)健回歸為基礎(chǔ)的模型(即RREW模型),通過引入穩(wěn)健M估計對測值進行權(quán)重分配以減小異常值對模型精度的影響,并提出以新增實測數(shù)據(jù)殘差e0序列的位置估計Tn為中心,引入尺度估計ST和預(yù)測置信區(qū)間半徑D構(gòu)造的Tn±(3ST+D)為殘差預(yù)警閾值上下限,以降低模型誤差對控制閾值影響的判別準(zhǔn)則和基于穩(wěn)健M估計的MZ預(yù)警準(zhǔn)則,此方法較好地解決了雙臺階、震蕩型等數(shù)據(jù)序列存在的異常值漏判問題。但將該方法應(yīng)用于大渡河流域大壩安全風(fēng)險在線監(jiān)控系統(tǒng)時,仍存在以下主要問題:
(1) 模型漏判現(xiàn)象依然存在,識別精度有待提升。
據(jù)分析統(tǒng)計,2019~2021年大渡河流域大壩安全風(fēng)險在線監(jiān)控系統(tǒng)采用RREW模型識別監(jiān)測數(shù)據(jù)異常,誤判漏判率由10%降低至2%,模型識別效果良好。進一步分析發(fā)現(xiàn),2%的誤判、漏判問題主要存在于正常型數(shù)據(jù)序列和單臺階型數(shù)據(jù)系列中。
RREW模型的本質(zhì)仍然是殘差預(yù)測法,數(shù)據(jù)異常識別精度受模型精度影響顯著。對規(guī)律性較差的正常型數(shù)據(jù)序列,其模型精度一般不高,特別是不規(guī)則數(shù)據(jù)段的擬合殘差較大,從而使標(biāo)準(zhǔn)差及預(yù)警閾值偏大,導(dǎo)致一些突變較小的測值漏判,如圖1所示。
★代表圖1(a)中監(jiān)測數(shù)據(jù)過程線中的異常值,因圖1(b)中LSR殘差過程線配色為黑色,圖1(b)中的★就表示LSR模型結(jié)合Pauta準(zhǔn)則預(yù)警識別到的異常值?!鞮SR模型結(jié)合Pauta準(zhǔn)則預(yù)警漏判的異常值(★)在LSR殘差過程線的對應(yīng)位置。
▼代表圖1(a)中的異常值(★)在圖1(b)的RREW殘差過程線的對應(yīng)位置。
RREW模型與傳統(tǒng)最小二乘回歸(LSR)模型相比,優(yōu)點在于通過對模型離群點賦予低權(quán)值可以降低離群點的干擾,但M估計抵抗離群測值的能力是有限的,一般可以抵抗25%的離群點,當(dāng)離群比例接近或超過穩(wěn)健估計量的崩潰界(50%)時同樣會失效[16]。當(dāng)單臺階型數(shù)據(jù)序列前后兩段的數(shù)據(jù)比例相當(dāng)時,其離群值的比例就接近50%,就會使得模型崩潰,精度極低,從而導(dǎo)致漏判,如圖2所示。為進一步提升數(shù)據(jù)異常識別精度,降低人工復(fù)核工作量,有必要進一步研究對模型精度較差的正常型數(shù)據(jù)序列和單臺階型數(shù)據(jù)序列都適用的數(shù)據(jù)異常識別方法。
(2) 模型計算效率較低,識別效率有待提升。
RREW模型的計算效率明顯低于傳統(tǒng)統(tǒng)計回歸模型,對海量數(shù)據(jù),其異常在線識別的效率問題就較突出。以大渡河流域龔嘴、銅街子、深溪溝和瀑布溝電站2019年所有測點數(shù)據(jù)為例,兩種方法的在線識別時間比較如圖3所示。
龔嘴水電站有535個測點,銅街子水電站有589個測點,深溪溝水電站有529個測點,采用傳統(tǒng)統(tǒng)計回歸模型在線識別時,僅需10~11 min,而RREW模型需要20~30 min;瀑布溝水電站有3 029個測點,采用傳統(tǒng)統(tǒng)計回歸模型在線識別時,僅需1 h,而RREW模型需要2~3 h。RREW模型耗時明顯長于傳統(tǒng)統(tǒng)計回歸模型,識別效率不能滿足在線監(jiān)控要求,因此有必要對其進行優(yōu)化。
2一維VGG數(shù)據(jù)異常識別模型構(gòu)建
2.1基本原理
卷積運算能從局部輸入圖塊中提取特征并模塊化,不僅在計算機視覺應(yīng)用中表現(xiàn)出色,對時間序列處理的效果也可媲美專門用于時序處理的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),且運算速度明顯提升[17]。卷積神經(jīng)網(wǎng)絡(luò)(CNN)的典型結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層及輸出層組成,其經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)主要有LeNet、AlexNet、VGGNet、GoogLeNet、ResNet和DenseNet等,其中VGG網(wǎng)絡(luò)通過反復(fù)堆疊較小的3×3卷積核代替更大尺度的卷積核,不僅增加了網(wǎng)絡(luò)中的非線性映射,同時全連接層所需訓(xùn)練的參數(shù)量不會爆炸增長,模型性能優(yōu)且穩(wěn)定[18],在實際應(yīng)用中較為廣泛[19]。大壩安全監(jiān)測數(shù)據(jù)序列是時間、測值的集合,可以看作一個時刻與此時刻實測值的組合,VGG網(wǎng)絡(luò)訓(xùn)練用的一張圖片對應(yīng)長、寬兩個維度的二維卷積模式,因此本文參照經(jīng)典的VGG網(wǎng)絡(luò)結(jié)構(gòu)建立1D-VGG模型提取數(shù)據(jù)特征,即把二維圖片降維為一維“線性圖片”,使一個時刻的數(shù)據(jù)對應(yīng)一個時間點的數(shù)據(jù),即對應(yīng)CNN的一個輸入數(shù)據(jù),這樣一組CNN的輸入數(shù)據(jù)就是順序時間點組的數(shù)據(jù)。
一維CNN的卷積運算將時間看作一個空間維度,原理與架構(gòu)與二維CNN網(wǎng)絡(luò)類似[20],與二維卷積的區(qū)別主要在卷積和池化操作上,原始離散數(shù)據(jù)序列f(n)與一維卷積核g(n)的一維卷積運算結(jié)果s(n)定義如下:
CNN用于圖像識別時會對二維圖像進行下采樣來提取局部特征以減小計算量,比如平均池化和最大池化。一維CNN也能通過類似的池化運算以減小數(shù)據(jù)大小,即從輸入的長序列中提取短序列,然后輸出短序列的最大值或平均值,卷積核是根據(jù)步長移動,而池化核的移動要求輸入部分在運算中不發(fā)生重疊,如圖4所示。
2.2模型構(gòu)建流程
對于任意一個測點i,已知其在過去n個時刻的歷時測值序列Yi=[vit1,vit2,…,vitn]T和歷史環(huán)境量因子(水位H、降雨P(guān)、溫度T等)矩陣Xn×k。以此n個時刻的{歷史環(huán)境量因子矩陣Xn×k,歷時測值序列Yi}作為訓(xùn)練樣本,其中將測點i的歷史環(huán)境量因子矩陣Xn×k作為訓(xùn)練輸入數(shù)據(jù),歷時測值序列Yi作為訓(xùn)練輸出的比對數(shù)據(jù),以構(gòu)建它們之間的非線性關(guān)系式,從而訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型,具體步驟如下:
(1) 對輸入Xn×k和訓(xùn)練值Yi作歸一化處理。由于不同監(jiān)測項目量綱差異較大,可能導(dǎo)致網(wǎng)絡(luò)收斂慢、訓(xùn)練時間長,為提高模型訓(xùn)練速度,首先采用式(3)對輸入與輸出樣本進行歸一化處理。
(2) 將歸一化后的數(shù)據(jù)作為卷積神經(jīng)網(wǎng)絡(luò)的輸入和輸出樣本,輸入樣本形狀設(shè)置為k×1,輸出節(jié)點數(shù)設(shè)為1。訓(xùn)練過程中采用均方誤差(MSE)作為損失函數(shù)衡量網(wǎng)絡(luò)計算的預(yù)測值y^i和實測值yi之間的誤差:
根據(jù)模型多次調(diào)參和訓(xùn)練結(jié)果來調(diào)整卷積層與池化層的層數(shù)及卷積核大小,最終選用8層一維卷積層來提取特征,每兩層一維卷積層后添加一層最大池化層,卷積層采用ReLU激活函數(shù),ReLU函數(shù)等價于max{x,0}。因訓(xùn)練輸入樣本的因子種類不多,采用大小為2的卷積核與池化核在訓(xùn)練過程中會使層內(nèi)數(shù)據(jù)越來越少,為保證模型精度,本文采用大小為1的核。該模型在卷積和池化運算后展平為一維數(shù)據(jù)格式進入全連接層,以集成從卷積層和池化層獲得的高度抽象特征,并對這些特征進行處理,最后輸出相關(guān)識別結(jié)果。
(3) 訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型。過程為:初始化權(quán)重和閾值→利用初始權(quán)值和歸一化后的樣本計算各層的輸出值→計算卷積神經(jīng)網(wǎng)絡(luò)的輸出層誤差→反向計算各層誤差并采用Adam優(yōu)化算法調(diào)整更新各層權(quán)值→判斷模型誤差是否滿足閾值要求,然后重復(fù)上述步驟或結(jié)束訓(xùn)練。當(dāng)訓(xùn)練樣本的損失函數(shù)小于特定閾值時,訓(xùn)練結(jié)束,最終的權(quán)值和偏置值保存在模型中用于預(yù)測。
訓(xùn)練過程包括前向傳播學(xué)習(xí)數(shù)據(jù)特征和后向傳播誤差更新網(wǎng)絡(luò)參數(shù)兩個階段,前面對于卷積神經(jīng)網(wǎng)絡(luò)基本架構(gòu)的描述遵循了前向傳播的過程順序,即輸入數(shù)據(jù)經(jīng)多層卷積和池化運算后,展平進入全連接層進行特征集成,最終形成輸出結(jié)果。在訓(xùn)練過程中,當(dāng)預(yù)測輸出值y^i與實測值yi不一致時,進行反向傳播計算預(yù)測輸出值與實測值間的誤差,即遍歷神經(jīng)網(wǎng)絡(luò)的反向路徑,并逐層將誤差回傳到各個節(jié)點,以逐層計算各層誤差。反向傳播過程中,根據(jù)Adam算法調(diào)整更新網(wǎng)絡(luò)中的權(quán)值和偏置值,該算法具有動量法和自適應(yīng)學(xué)習(xí)速率方法的雙重優(yōu)勢[21-22],算法如下:
(4) 采用上述訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)模型,建立測點i的歷時測值序列Yi與環(huán)境量因子Xn×k的非線性關(guān)系:
已知測點i在n+t時刻的環(huán)境量因子值,按式(3)進行歸一化處理后代入式(6)中,則可得式(7),將該式反歸一化處理后,即可得出測點i在n+t時刻的預(yù)測值y^i,n+t。
(5) 模型預(yù)警準(zhǔn)則。
通過實測值與預(yù)測值求得殘差以及殘差的標(biāo)準(zhǔn)差σ,當(dāng)殘差在[-3σ,3σ]外,則認為測值異常,即yi,n+t-y^i,n+t>3σ時認為該測值存在異常,觸發(fā)異常數(shù)據(jù)預(yù)警。
2.3應(yīng)用效果分析
2.3.1模型適用性分析
針對前述因模型精度不高、離群比例超過30%的單臺階型數(shù)據(jù)序列,采用RREW模型和1D-VGG模型進行數(shù)據(jù)異常識別,結(jié)果如圖5~6及表1所示。
從圖5~6和表1可以看出:1D-VGG模型能夠根據(jù)環(huán)境量因子與實測值間的抽象關(guān)系學(xué)習(xí)到數(shù)據(jù)序列的整體趨勢,且不受局部少量離群點影響,能高效率地學(xué)習(xí)到正常型序列不規(guī)則片段的特征,模型精度高;同時1D-VGG模型能較好地擬合出單臺階序列的前后兩個部分,達到較高的擬合精度,可有效解決RREW模型在離群比例超過穩(wěn)健估計量崩潰界時的模型失效問題。整體上,引入1D-VGG模型能較好地解決規(guī)律性較差正常型數(shù)據(jù)序列和單臺階型數(shù)據(jù)序列的異常識別漏判問題。
2.3.2模型穩(wěn)定性分析
基于Pauta準(zhǔn)則的1D-VGG模型對小幅異常突跳較為敏感,一旦模型預(yù)測精度不足,則會引起個別預(yù)測有偏差的正常值出現(xiàn)誤判的現(xiàn)象。因此,本文重點分析不同建模序列長度和單臺階數(shù)據(jù)序列的離群點比例對模型精度的影響。
(1) 不同的建模序列長度。
針對RREW模型預(yù)測精度相對不高的P60測點,分別利用其2016~2018年的不同長度數(shù)據(jù)序列構(gòu)建1D-VGG模型,其模型精度變化較小,應(yīng)用于數(shù)據(jù)異常識別均取得較好效果,如圖7所示,說明在不同序列長度下,1D-VGG模型穩(wěn)定性好。
(2) 不同離群點比例的單臺階型序列。
以單臺階數(shù)據(jù)序列UP13-1測點為模板,模擬構(gòu)建了2016~2019年間單臺階占比分別約為10%,20%,30%的序列,并以2016~2019年9月的數(shù)據(jù)來建模,識別2019年10~12月的監(jiān)測數(shù)據(jù),效果如圖8所示,可見在不同臺階占比下,采用1D-VGG模型均能取得較好的識別效果,穩(wěn)定性好。
2.3.3Pauta準(zhǔn)則的適用性分析
1D-VGG模型的預(yù)警準(zhǔn)則采用Pauta準(zhǔn)則,前提是實測值與模型預(yù)測值的殘差序列服從或近似符合正態(tài)分布[23]。為分析其適用性,剔除前述正常型測點P60、臺階占比40%的單臺階型測點CH2以及臺階占比分別為10%,30%的單臺階型測點異常值后,對預(yù)測段的殘差序列進行正態(tài)性檢驗,結(jié)果如圖9所示。由圖9可知,除個別殘差絕對值較大的散點略有偏離外,各測點在圖中的絕大部分散點都分布在參照線y=x附近,說明利用1D-VGG模型得到的殘差序列整體上近似服從正態(tài)分布,因此采用Pauta準(zhǔn)則作為1D-VGG模型的預(yù)警準(zhǔn)則是可行的。
3監(jiān)測數(shù)據(jù)異常識別模型匹配準(zhǔn)則構(gòu)建
大壩安全監(jiān)測數(shù)據(jù)異常識別一般應(yīng)包括粗差識別、異常識別和異常原因辨識3個環(huán)節(jié)。粗差識別主要針對儀器故障、測量錯誤等造成的誤差,一般多采用是否超儀器量程等進行清洗剔除;異常識別則主要通過適宜的模型實時識別監(jiān)測數(shù)據(jù)的異常變化;大壩安全監(jiān)測數(shù)據(jù)的異常變化可能是因為監(jiān)測環(huán)境擾動或其他因素引起的監(jiān)測誤差,也可能是庫水位、降雨、地震等運行環(huán)境變化引起的大壩結(jié)構(gòu)真實響應(yīng),或結(jié)構(gòu)性態(tài)惡化的異變表征;因此需要通過人工進一步辨識其異常原因,從而獲取可靠的異常數(shù)據(jù)。本文主要針對數(shù)據(jù)異常識別環(huán)節(jié),提出適宜的模型以提高其識別效率和精度。由于大壩監(jiān)測涉及儀器眾多,監(jiān)測環(huán)境復(fù)雜,監(jiān)測結(jié)果包括正常型、多點離群型、雙臺階型、單臺階型、震蕩型等多種數(shù)據(jù)類型,不同識別方法對不同特性序列的適用性存在差異,綜合考慮數(shù)據(jù)分布形態(tài)、系列有效長度等因素,分析傳統(tǒng)統(tǒng)計回歸模型、RREW模型和1D-VGG模型及Pauta準(zhǔn)則、MZ準(zhǔn)則的應(yīng)用效果和適用性如圖10與表2所示。
從表2中可以看出,基于單一方法的數(shù)據(jù)異常識別可靠性和高效性難以保證,不能滿足大壩安全監(jiān)測數(shù)據(jù)異常在線識別需求。因此,本文提出了多模型多準(zhǔn)則的數(shù)據(jù)異常識別方法,即構(gòu)建包括統(tǒng)計回歸、穩(wěn)健回歸、1D-VGG模型等模型庫,以及Pauta準(zhǔn)則、MZ準(zhǔn)則等判別準(zhǔn)則庫共同構(gòu)成的大壩安全數(shù)據(jù)異常識別模型簇,再根據(jù)測值數(shù)據(jù)類型選擇最合適的模型算法和評判準(zhǔn)則進行異常識別,從而實現(xiàn)大壩安全監(jiān)測數(shù)據(jù)異常在線精準(zhǔn)、高效識別。
統(tǒng)計回歸模型+Pauta準(zhǔn)則模型精度不高時,易漏判離群型數(shù)據(jù)異常值殘差序列應(yīng)服從正態(tài)分布,適用于擬合精度較高的正常型數(shù)據(jù)序列模型簡單、計算效率高RREW模型+MZ準(zhǔn)則離群點比例較高時,易出現(xiàn)模型崩潰的問題擬合精度較高的正常型序列、雙臺階型序列、震蕩型序列模型復(fù)雜,計算效率低1D-VGG模型+Pauta準(zhǔn)則模型參數(shù)選擇對模型精度影響大,控制限較嚴苛,易出現(xiàn)誤判現(xiàn)象模型擬合精度較低的正常型序列和單臺階型序列網(wǎng)絡(luò)結(jié)構(gòu)簡單,計算效率較高綜合考慮異常識別效果和計算效率,建立“數(shù)據(jù)類型-模型算法-預(yù)警準(zhǔn)則”匹配規(guī)則如下:對于精度較高正常型序列、單/多點離群型序列,采用基于最小二乘的統(tǒng)計回歸模型和Pauta準(zhǔn)則;對于模型擬合精度較低的正常型序列和單臺階型序列,匹配1D-VGG模型和Pauta準(zhǔn)則;對于雙臺階和震蕩型序列,則匹配RREW模型和MZ準(zhǔn)則。數(shù)據(jù)異常在線識別流程如圖11所示。
4結(jié) 論
(1) RREW模型引入M估計和置信區(qū)間半徑D,較好地解決了傳統(tǒng)統(tǒng)計回歸模型對雙臺階、震蕩型數(shù)據(jù)序
列的異常值漏判問題,但對規(guī)律性較差的正常型序列和離群點比例較高的單臺階數(shù)據(jù)序列,仍存在識別精度差、誤判漏判率高的問題,且模型計算效率相對較低。
(2) 構(gòu)建了1D-VGG識別模型,提出了模型構(gòu)建流程。工程校驗表明,該模型能自主學(xué)習(xí)環(huán)境量與實測效應(yīng)量間的隱含規(guī)律,有效解決RREW模型數(shù)據(jù)異常在線識別尚存在的誤判漏判問題,并對不同序列長度、不同臺階占比的數(shù)據(jù)序列均具有較好的識別效果,模型識別的精度、穩(wěn)定性和可靠性均較理想。
(3) 構(gòu)建了包括統(tǒng)計回歸、穩(wěn)健回歸、1D-VGG識別等模型和Pauta、MZ等準(zhǔn)則的模型庫和準(zhǔn)則庫,綜合考慮模型準(zhǔn)確性、適用性和高效性,提出了“數(shù)據(jù)類型-識別方法-預(yù)警準(zhǔn)則”自匹配準(zhǔn)則。
參考文獻:
[1]CHENG L,ZHENG D J.Two online dam safety monitoring models based on the process of extracting environmental effect[J].Advances in Engineering Software,2013,57(3):48-56.
[2]ZHOU L T,GU C S,LI B.Application of partial least-squares regression in earth-rock dam seepage monitoring model[C]∥Proceedings of The Second 2nd International Conference on Modelling and Simulation,2009:531-536.
[3]LIN C N,LI T C,CHEN S Y,et al.Gaussian process regression-based forecasting model of dam deformation[J].Neural Computing and Application,2019,31(12):8503-8518.
[4]SHI Z W,GU C S,ZHAO E F,et al.A novel seepage safety monitoring model of CFRD with slab cracks using monitoring data[J].Mathematical Problems in Engineering,2020(12):1-13.
[5]BELMOKRE A,MIHOUBI M K,SANTILLN D.Analysis of dam behavior by statistical models:application of the random forest approach[J].KSCE Journal of Civil Engineering,2019,23(11):4800-4811.
[6]CHENG X,LI Q,ZHOU Z,et al.Research on a seepage monitoring model of a high core rockfill dam based on machine learning[J].Sensors,2018,18(9):2749-2763.
[7]CUI L,CHENG L,JIANG X,et al.Robust estimation and outlier detection based on linear regression model[J].Journal of Intelligent & Fuzzy Systems,2019,37(4):4657-4664.
[8]LI X,LI Y L,LU X,et al.An online anomaly recognition and early warning model for dam safety monitoring data[J].Structural Health Monitoring,2019,19(3):796-809.
[9]胡德秀,屈旭東,楊杰,等.基于M-ELM的大壩變形安全監(jiān)控模型[J].水利水電科技進展,2019,39(3):75-80.
[10]楊承志,魏博文,徐鎮(zhèn)凱.基于SVM-MCD的大壩變形監(jiān)測數(shù)據(jù)異常值判定[J].人民長江,2022,53(3):207-213,219.
[11]王麗蓉,鄭東健.基于卷積神經(jīng)網(wǎng)絡(luò)的大壩安全監(jiān)測數(shù)據(jù)異常識別[J].長江科學(xué)院院報,2021,38(1):72-77.
[12]陳冬英,張昊,張子龍,等.基于改進1D-VD-CNN與近紅外光譜數(shù)據(jù)的金銀花產(chǎn)地溯源研究[J].光譜學(xué)與光譜分析,2023,43(5):1471-1477.
[13]張碩,田慕琴,霍鵬飛,等.基于一維卷積神經(jīng)網(wǎng)絡(luò)的定向鉆機故障診斷專家系統(tǒng)設(shè)計[J].煤炭技術(shù),2023,42(6):221-224.
[14]黨英,吉衛(wèi)喜,陸家輝,等.基于卷積神經(jīng)網(wǎng)絡(luò)的銑刀磨損狀態(tài)識別技術(shù)研究[J].現(xiàn)代制造工程,2021(5):116-124.
[15]陳振飛,杜德進.對《水電站大壩運行安全監(jiān)督管理規(guī)定》有關(guān)大壩安全信息化建設(shè)內(nèi)容的解讀[J].大壩與安全,2015,88(2):18-20.
[16]DAVID C H.探索性數(shù)據(jù)分析[M].陳忠璉,郭德媛,譯.北京:中國統(tǒng)計出版社,1998.
[17]MUNIR M,SIDDIQUI S A,DENGEL A,et al.DeepAnT:a deep learning approach for unsupervised anomaly detection in time series[J].IEEE Access,2019,7(1):1991-2005.
[18]張馳,郭媛,黎明.人工神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用綜述[J].計算機工程與應(yīng)用,2021,57(11):57-69.
[19]陳超,齊峰.卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計算機視覺領(lǐng)域中的應(yīng)用綜述[J].計算機科學(xué),2019,46(3):63-73.
[20]GIRSHICK R.Fast R-CNN[C]∥ Proceedings of the IEEE International Conference on Computer Vision (ICCV),Chile,2015:1440-1448.
[21]張慧.深度學(xué)習(xí)中優(yōu)化算法的研究與改進[D].北京:北京郵電大學(xué),2018.
[22]袁群勇.深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練優(yōu)化方法研究[D].廣州:華南理工大學(xué),2020.
[23]ZHANG F,LU X,LI Y L,et al.A self-matching model for online anomaly recognition of safety monitoring data in dams [J].Structure Health Monitoring,2023,22(1):746-773.
(編輯:胡旭東)