基于變權(quán)重大壩預(yù)測(cè)模型的組合告警方法研究

2024-01-05 07:25:44李文博,丁勇,李登華

人民長(zhǎng)江 2023年12期

李文博,丁勇,李登華

(1.南京理工大學(xué) 理學(xué)院,江蘇南京 210094; 2.南京水利科學(xué)研究院,江蘇南京 210029; 3.水利部水庫(kù)大壩安全重點(diǎn)實(shí)驗(yàn)室,江蘇南京 210029)

0 引言

中國(guó)是世界上擁有水庫(kù)最多的國(guó)家,目前所擁有的大壩超過(guò)10萬(wàn)座,但其中95%以上都是服役40 a以上的老壩,為國(guó)民經(jīng)濟(jì)帶來(lái)諸多保障的同時(shí)也帶來(lái)了諸多安全隱患,因此對(duì)大壩服役的健康狀態(tài)展開監(jiān)測(cè)顯得尤為重要。

如何通過(guò)對(duì)大壩監(jiān)測(cè)數(shù)據(jù)進(jìn)行分析處理來(lái)建立合理可靠的預(yù)測(cè)模型并實(shí)現(xiàn)準(zhǔn)確告警,是大壩安全監(jiān)測(cè)領(lǐng)域中亟待解決的技術(shù)難題[1-4]。隨著高新技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)算法也逐漸應(yīng)用到了大壩測(cè)點(diǎn)的預(yù)測(cè)模型中[5],如XgBoost[6]、支持向量機(jī)[7-8]、神經(jīng)網(wǎng)絡(luò)[9-11]等。但是,單一的預(yù)測(cè)模型往往不能滿足大壩多種類測(cè)點(diǎn)的精準(zhǔn)預(yù)測(cè)和準(zhǔn)確告警,因此對(duì)多個(gè)預(yù)測(cè)模型進(jìn)行組合是目前研究的主要方向。

多模型組合的研究,實(shí)質(zhì)上是合理對(duì)多個(gè)單一模型權(quán)重進(jìn)行分配的研究。趙明華等[12]采用最優(yōu)權(quán)系數(shù)法對(duì)支持向量機(jī)和多元線回歸模型進(jìn)行權(quán)重分配,得到了更高的預(yù)測(cè)精度;王博林等[13]以最小對(duì)數(shù)誤差平方和為目標(biāo)函數(shù)求解最優(yōu)加權(quán)系數(shù),對(duì)Logisti和Gompertz預(yù)測(cè)模型進(jìn)行組合;高彩云等[14]建立了次優(yōu)權(quán)值、最優(yōu)權(quán)值、灰色綜合關(guān)聯(lián)度權(quán)值、熵權(quán)值和神經(jīng)網(wǎng)絡(luò)5種變形模型并行組合預(yù)測(cè);袁維等[15]提出了一種數(shù)據(jù)“融合-預(yù)測(cè)-預(yù)警”的三步式預(yù)警方法。上述學(xué)者的研究重點(diǎn)在于如何得到更加精準(zhǔn)的預(yù)測(cè)結(jié)果從而降低誤告警頻次,但是缺少了對(duì)實(shí)際工程中預(yù)測(cè)效果對(duì)告警影響的研究,而告警效果的好壞往往更能體現(xiàn)模型在各個(gè)測(cè)點(diǎn)上的適用情況,即便是過(guò)去表現(xiàn)良好的模型,隨著大壩性態(tài)的變化,后續(xù)表現(xiàn)也會(huì)有所波動(dòng)。

針對(duì)上述問(wèn)題,本文提出基于變權(quán)重預(yù)測(cè)模型的組合告警算法,針對(duì)不同預(yù)測(cè)模型的預(yù)測(cè)值進(jìn)行殘差修正處理,并通過(guò)計(jì)算評(píng)價(jià)指標(biāo)和劃分組合告警區(qū)間來(lái)評(píng)價(jià)多個(gè)模型的預(yù)測(cè)精度和告警成功率,為測(cè)點(diǎn)在每個(gè)預(yù)測(cè)模型動(dòng)態(tài)賦予權(quán)重提供理論支撐,使得測(cè)點(diǎn)告警情況更符合實(shí)際情況。

1 預(yù)測(cè)模型的多指標(biāo)評(píng)價(jià)及優(yōu)選

1.1 預(yù)測(cè)模型的多指標(biāo)評(píng)價(jià)

當(dāng)對(duì)多個(gè)預(yù)測(cè)模型進(jìn)行組合時(shí),預(yù)測(cè)模型數(shù)量并不是越多越好。因此,在模型組合之前,應(yīng)該對(duì)單一模型進(jìn)行評(píng)估和優(yōu)選。其中,評(píng)價(jià)指標(biāo)體系的有效建立和評(píng)價(jià)指標(biāo)權(quán)重的合理分配是模型評(píng)價(jià)的關(guān)鍵。

本文在一些基礎(chǔ)評(píng)價(jià)指標(biāo)的基礎(chǔ)上,針對(duì)大壩測(cè)點(diǎn)的數(shù)據(jù)特征,建立一種新的大壩預(yù)測(cè)模型評(píng)價(jià)指標(biāo)體系。通過(guò)數(shù)值計(jì)算確定指標(biāo)的主觀權(quán)重和客觀權(quán)重,將兩者結(jié)合后對(duì)模型進(jìn)行綜合評(píng)價(jià),從而優(yōu)選出參與組合的模型。

1.1.1數(shù)據(jù)評(píng)價(jià)指標(biāo)

影響預(yù)測(cè)模型預(yù)測(cè)效果的因素有很多,考慮到大壩測(cè)點(diǎn)間具有時(shí)空屬性,指標(biāo)選取應(yīng)盡量遵循全面性、科學(xué)性和客觀性的原則。本文考慮了預(yù)測(cè)誤差的極值、均值、離散程度以及預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)程度等,使用常見評(píng)價(jià)指標(biāo)MAE、r、MAX,為避免分母為0,使用改進(jìn)的MAPE指標(biāo)nMAPE,并且提出一個(gè)適用于大壩測(cè)點(diǎn)數(shù)據(jù)的評(píng)價(jià)指標(biāo)——較大絕對(duì)誤差數(shù)量(LAEN),由此來(lái)構(gòu)建大壩的預(yù)測(cè)模型評(píng)價(jià)指標(biāo)體系。

(1) 歸一化平均絕對(duì)百分比誤差nMAPE。

A′(t)=A(t)/|A(t)|max

(1)

F′(t)=F(t)/|A(t)|max

(2)

(3)

(2) 較大絕對(duì)誤差數(shù)量LAEN比較的是各個(gè)預(yù)測(cè)模型預(yù)測(cè)出現(xiàn)較大絕對(duì)誤差的次數(shù)。本文規(guī)定所有預(yù)測(cè)模型在一定周期內(nèi)的預(yù)測(cè)值其絕對(duì)誤差的合集Z中,15%的絕對(duì)誤差定義為較大絕對(duì)誤差。較大絕對(duì)誤差出現(xiàn)頻次越少,說(shuō)明該模型出現(xiàn)較大誤差概率越小,預(yù)測(cè)越穩(wěn)定,效果越好。

(4)

(5)

式中:A(t)為實(shí)測(cè)值,F(t)為預(yù)測(cè)值,A′(t) 為歸一化后的實(shí)測(cè)值,F′(t)為歸一化后的預(yù)測(cè)值,|A(t)|max為實(shí)測(cè)值中絕對(duì)值的最大值,Z15為絕對(duì)誤差合集中降序15分位,B(t)為較大誤差個(gè)數(shù)。

1.1.2評(píng)價(jià)指標(biāo)權(quán)重的確定

使用評(píng)價(jià)指標(biāo)對(duì)各單個(gè)預(yù)測(cè)模型進(jìn)行評(píng)價(jià)時(shí),每個(gè)指標(biāo)對(duì)預(yù)測(cè)模型的區(qū)分程度和重要程度各有不同,因此分別采用主觀賦權(quán)法和客觀賦權(quán)法對(duì)每個(gè)評(píng)價(jià)指標(biāo)進(jìn)行權(quán)重分配。主觀賦權(quán)方法選用改進(jìn)的層次分析法(AHP)[16],客觀賦權(quán)法選用改進(jìn)的CRITIC法[17]。

各指標(biāo)的綜合權(quán)重的計(jì)算公式為

(6)

1.2 模型優(yōu)選

在對(duì)多種預(yù)測(cè)模型進(jìn)行優(yōu)選時(shí),由于不同指標(biāo)評(píng)價(jià)模型預(yù)測(cè)能力的表現(xiàn)方式不同,如r越接近于1說(shuō)明預(yù)測(cè)模型效果越好,MAE越接近于0說(shuō)明預(yù)測(cè)模型效果越好,因此在評(píng)價(jià)之前,應(yīng)對(duì)評(píng)價(jià)指標(biāo)進(jìn)行歸一化,首先建立原始數(shù)據(jù)矩陣:

(7)

式中:m,n分別為數(shù)據(jù)庫(kù)中樣本總數(shù)和變量總數(shù);xij為第i個(gè)樣本的第j個(gè)變量的原始值。

然后根據(jù)指標(biāo)特性進(jìn)行正向和反向歸一化:

(8)

(9)

(10)

2 變權(quán)重組合進(jìn)化模型

2.1 告警方法的確定

傳統(tǒng)的告警方法將單個(gè)預(yù)測(cè)模型的殘差作為告警對(duì)象[19],若殘差落在兩倍標(biāo)準(zhǔn)差區(qū)間以內(nèi),表明發(fā)生此事件的概率值為95.45%,認(rèn)為大壩測(cè)點(diǎn)性態(tài)正常;若殘差超出兩倍標(biāo)準(zhǔn)差區(qū)間,大壩測(cè)點(diǎn)為告警狀態(tài)。在多模型組合告警時(shí),提出一種為每個(gè)預(yù)測(cè)模型設(shè)置告警數(shù)值的告警方式,每個(gè)預(yù)測(cè)模型根據(jù)其狀態(tài)設(shè)置相應(yīng)告警數(shù)值num(本文設(shè)定告警num=1,不告警num=0)。參與組合的5個(gè)優(yōu)選模型的權(quán)重u與其告警數(shù)值num的乘積之和為該測(cè)點(diǎn)當(dāng)日最終告警數(shù)值T(0≤T≤1),具體表達(dá)式如下:

(11)

(12)

將最終告警數(shù)值平均劃分為5個(gè)區(qū)間,每個(gè)區(qū)間表示不同的告警等級(jí),最終告警數(shù)值與告警等級(jí)對(duì)應(yīng)結(jié)果如表1所列。

表1 告警等級(jí)Tab.1 Alarm level

2.2 預(yù)測(cè)模型的殘差修正

當(dāng)采用模型殘差作為告警對(duì)象時(shí),通常假設(shè)單模型殘差服從均值為0的正態(tài)分布,但實(shí)際上多個(gè)預(yù)測(cè)模型的殘差結(jié)果并不符合以0為均值的正態(tài)分布,對(duì)殘差進(jìn)行一定修正才能取得更好的預(yù)測(cè)效果。因此在使用該告警方法時(shí)應(yīng)先對(duì)殘差均值進(jìn)行修正。在一定周期內(nèi)的預(yù)測(cè)模型殘差修正方法為

(13)

(14)

式中:Δi為一個(gè)周期T內(nèi)修正前的殘差值,Δxi為一個(gè)周期T內(nèi)修正后的殘差值,Fxi為一個(gè)周期T內(nèi)修正后的預(yù)測(cè)值,Δt為一個(gè)周期T內(nèi)t時(shí)刻殘差值。修正過(guò)后,一個(gè)周期T內(nèi)的殘差集可認(rèn)為服從以0為中心的正態(tài)分布。

2.3 動(dòng)態(tài)數(shù)據(jù)評(píng)價(jià)指標(biāo)調(diào)整模型權(quán)重

大壩測(cè)點(diǎn)時(shí)間序列為非平穩(wěn)時(shí)間序列,兼具日變化、季節(jié)及長(zhǎng)期變化特征,考慮到鄰近的時(shí)間序列對(duì)下一時(shí)刻的未來(lái)數(shù)據(jù)影響更大,對(duì)建模數(shù)據(jù)進(jìn)行滑動(dòng)時(shí)間窗口操作。

由于數(shù)據(jù)評(píng)價(jià)指標(biāo)會(huì)影響到指標(biāo)權(quán)重和模型權(quán)重,因此結(jié)合滑動(dòng)時(shí)間窗口實(shí)時(shí)更新數(shù)據(jù)評(píng)價(jià)指標(biāo),對(duì)模型告警準(zhǔn)確率會(huì)有所提升。大壩測(cè)點(diǎn)數(shù)據(jù)大多以年為周期,因此動(dòng)態(tài)評(píng)價(jià)指標(biāo)時(shí)間窗口可選為告警當(dāng)天最近1 a時(shí)間區(qū)間。

2.4 告警反饋調(diào)整權(quán)重

通常情況下,多種預(yù)測(cè)模型組合得到的預(yù)測(cè)值都以預(yù)測(cè)的精度為目標(biāo),對(duì)預(yù)測(cè)結(jié)果在實(shí)際中告警應(yīng)用少有考慮。告警反饋是根據(jù)各個(gè)預(yù)測(cè)模型在測(cè)點(diǎn)上的歷史告警情況,動(dòng)態(tài)調(diào)整預(yù)測(cè)模型權(quán)重,提升測(cè)點(diǎn)的告警準(zhǔn)確率。當(dāng)以殘差作為告警對(duì)象時(shí),在較長(zhǎng)的時(shí)間周期內(nèi)會(huì)出現(xiàn)每個(gè)模型告警情況相似的情況,因此需要選取較短的時(shí)間區(qū)間作為告警期(本文選取告警區(qū)間為1個(gè)月),實(shí)時(shí)調(diào)整各模型權(quán)重,得到動(dòng)態(tài)模型權(quán)重u。

每個(gè)模型根據(jù)當(dāng)日之前一段周期內(nèi)的數(shù)據(jù)評(píng)價(jià)指標(biāo)得到動(dòng)態(tài)權(quán)重值,再乘以告警反饋系數(shù)記為Q,該告警反饋系數(shù)與告警成功率有關(guān)。多次試驗(yàn)表明,大多模型告警成功率都在80%以上,設(shè)定一個(gè)告警成功率最低限值min(本文取0.7),告警成功率低于最低限制則給相應(yīng)模型分配0權(quán)重,單個(gè)模型最高權(quán)重不高于0.5。

告警反饋系數(shù)Q計(jì)算公式如下:

p誤=d誤/d總

(15)

Q=max(1-min-p誤,0)

(16)

根據(jù)告警成功率得到的最終模型權(quán)重vj為

(17)

vj=uj×Q

(18)

式中:p誤為誤告警率,d誤為在一個(gè)周期內(nèi)告警次數(shù),d總為周期,uj為告警反饋前模型權(quán)重,vj為告警反饋調(diào)整后的最終權(quán)重,Q為告警反饋系數(shù)。

2.5 模型告警流程

結(jié)合上述內(nèi)容,基于變權(quán)重的大壩測(cè)點(diǎn)預(yù)測(cè)組合模型告警流程如圖1所示。

圖1 總體流程Fig.1 Overall flow

3 實(shí)例驗(yàn)證

3.1 項(xiàng)目測(cè)點(diǎn)及模型選取

本文各類大壩監(jiān)測(cè)實(shí)測(cè)數(shù)據(jù)來(lái)源于新疆察汗烏蘇水電站大壩,該大壩場(chǎng)景具有一定特殊性,年降水量少于180 mm,降水量因子影響可以忽略。由于具有發(fā)電功能,該壩庫(kù)水位長(zhǎng)期在1 620～1 650 m內(nèi)波動(dòng)(見圖2),處于高效率發(fā)電水位,且具有明顯趨勢(shì)性與周期性。該壩壩頂高程110 m(覆蓋層深46 m),布置了較為完善的監(jiān)測(cè)系統(tǒng)。本文選取壩左0+150.00斷面中兩條引張線(EX3、EX4)上的測(cè)點(diǎn),測(cè)點(diǎn)實(shí)測(cè)值曲線如圖3所示,具體實(shí)驗(yàn)步驟本文以測(cè)點(diǎn)EX3-7(測(cè)點(diǎn)1)和EX4-4(測(cè)點(diǎn)2)為例進(jìn)行說(shuō)明。

圖2 庫(kù)水位時(shí)間序列Fig.2 Time series of reservoir water level

圖3 測(cè)點(diǎn)位移時(shí)間序列Fig.3 Time series of measurement points displacereat

選用多種原理的預(yù)測(cè)模型應(yīng)用于大壩預(yù)測(cè),既包含需要影響因子的HST模型,也包含ARIMA等自回歸模型,其中HST模型還分為線性模型、非線性模型及集成算法模型等,多種模型適配不同測(cè)點(diǎn)。本文選用常見的10種單一預(yù)測(cè)模型,分別為多元線性回歸M1(Linear)、BP神經(jīng)網(wǎng)絡(luò)M2、支持向量機(jī)-高斯核M3(SVM-rbf)、差分自回歸移動(dòng)平均模型M4(ARIMA)、灰色理論M5、Lasso回歸算法M6、嶺回歸M7(Ridge)、LightGBM模型M8、Xgboost模型M9和梯度提升樹模型M10(GBDT)。

所用測(cè)點(diǎn)監(jiān)測(cè)數(shù)據(jù)取自2015年10月25日至2021年10月24日,將其劃分建模期、殘差期、告警期和告警反饋期。其中2015年10月25日至2018年10月24日為建模期,2018年10月25日至2019年10月24日為殘差期,得到1 a的預(yù)測(cè)結(jié)果,用于計(jì)算各模型的評(píng)價(jià)指標(biāo)進(jìn)而優(yōu)選模型,以及得出各模型殘差用于后面的告警。2019年10月25日至2019年11月24日得到這一個(gè)月以來(lái)各模型告警情況,2019年11月25日至2020年11月24日根據(jù)模型的告警情況,通過(guò)告警反饋調(diào)整算法權(quán)重。再結(jié)合滑動(dòng)窗口模型,保持上述窗口大小不變,按步長(zhǎng)為1向后平移近1 a,得到告警反饋期間內(nèi)2020年11月25日至2021年10月24日的測(cè)點(diǎn)告警情況。

3.2 測(cè)點(diǎn)殘差修正和模型優(yōu)選

3.2.1模型殘差修正

每個(gè)模型的殘差值不會(huì)完全等于0,部分模型可能存在較大出入,故原始?xì)埐畈荒苤苯幼鳛楦婢罁?jù)。在對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行數(shù)據(jù)指標(biāo)評(píng)價(jià)之前,先對(duì)殘差集內(nèi)的預(yù)測(cè)值進(jìn)行殘差修正,使其殘差大體上滿足以0為均值的正態(tài)分布。通過(guò)計(jì)算出各個(gè)模型在此周期內(nèi)的殘差均值來(lái)確定模型的殘差修正值。其中測(cè)點(diǎn)1的M1～M10各個(gè)模型的殘差修正值分別為:-0.009,-0.004,0.052,0.036,0.091,0.118,0.100,0.026,0.060,0.027;測(cè)點(diǎn)2的分別為:-0.008,-0.011,-0.106,0.084,-0.021,-0.342,-0.029,-0.047,-0.114,-0.053。通過(guò)式(13)和(14)可以得到修正好的殘差及預(yù)測(cè)值。以測(cè)點(diǎn)1為例展示并分析殘差,殘差期各模型的殘差過(guò)程線修正前后對(duì)比如圖4所示。

由圖4可知,M3,M5,M6,M7,M9模型殘差均值偏離0均值0.5以上,若直接使用殘差落入兩倍標(biāo)準(zhǔn)差外即進(jìn)行告警,則會(huì)出現(xiàn)大量告警現(xiàn)象。以M3模型為例,在殘差修正前,一半以上數(shù)據(jù)都處在兩倍標(biāo)準(zhǔn)差以外區(qū)間,而殘差修正后只有少數(shù)偏離較大的殘差處在兩倍標(biāo)準(zhǔn)差以外區(qū)間,如圖5所示。經(jīng)查閱預(yù)測(cè)期內(nèi)大壩的運(yùn)營(yíng)管理和巡查日志,發(fā)現(xiàn)大壩性態(tài)均處于正常狀態(tài),因此殘差期和告警期內(nèi)的告警都為誤告警,殘差修正后的結(jié)果大大降低了誤告警率,更加符合大壩壩體日常未告警性態(tài)。

圖5 M3模型殘差過(guò)程線Fig.5 Residual process line of M3 model

出現(xiàn)上述現(xiàn)象主要有以下原因:① 數(shù)據(jù)分布和模型擬合的問(wèn)題。部分線性回歸模型是一種非參數(shù)回歸方法,其中線性部分的系數(shù)是確定的,但非線性部分的形式并不是事先確定,而是從數(shù)據(jù)中學(xué)習(xí)。這種模型的主要缺點(diǎn)是比較久遠(yuǎn)的歷史數(shù)據(jù)趨勢(shì)可能會(huì)對(duì)新數(shù)據(jù)的預(yù)測(cè)產(chǎn)生錯(cuò)誤的影響。② 殘差周期選擇的問(wèn)題。選擇時(shí)會(huì)出現(xiàn)模型在一個(gè)更大的周期上滿足殘差均值為0的情況,如果選擇的周期太小,可能會(huì)導(dǎo)致殘差呈現(xiàn)一定隨機(jī)性。③ 影響因子的準(zhǔn)確性。大壩是一個(gè)復(fù)雜的結(jié)構(gòu)體,找到精準(zhǔn)的位移影響因子仍是一個(gè)值得研究的問(wèn)題。如果實(shí)測(cè)值的相關(guān)程度在該時(shí)段內(nèi)有波動(dòng),則可能會(huì)導(dǎo)致模型預(yù)測(cè)誤差過(guò)大。

針對(duì)殘差修正后仍會(huì)出現(xiàn)告警現(xiàn)象的情況,進(jìn)行進(jìn)一步分析,圖4顯示告警主要分布在3月、9月和11月,分析主要有以下兩點(diǎn)原因:① 環(huán)境量的劇烈變化。庫(kù)水位有明顯的上升和下降,主要原因是春季降雨、融雪和秋季降雨、河流水量的增加等,部分模型對(duì)環(huán)境因子變化的響應(yīng)不夠靈敏,以及位移達(dá)到新的極值出現(xiàn)的模型擬合問(wèn)題導(dǎo)致的誤告警。② 在11月份,位移基本保持平整,由于部分線性回歸模型曲線呈整體上升或下降趨勢(shì),相對(duì)較大的位移變化速率導(dǎo)致模型出現(xiàn)較大偏差。

3.2.2模型優(yōu)選

殘差修正后,可以得到各模型修正后的預(yù)測(cè)值,兩測(cè)點(diǎn)修正后的預(yù)測(cè)值在指標(biāo)體系下的評(píng)價(jià)值如表2和表3所列。

表2 測(cè)點(diǎn)1各種模型的指標(biāo)評(píng)價(jià)結(jié)果Tab.2 Evaluation results for each indicator of different models at measurement point No.1

表3 測(cè)點(diǎn)2各種模型的指標(biāo)評(píng)價(jià)結(jié)果Tab.3 Evaluation results for each indicator of different models at measurement point No.2

取經(jīng)驗(yàn)因子α=0.5,根據(jù)式(6)得到兩測(cè)點(diǎn)各指標(biāo)綜合權(quán)重測(cè)點(diǎn)1的wj={0.13,0.15,0.15,0.30,0.27},測(cè)點(diǎn)2的wj={0.12,0.14,0.16,0.30,0.28}。根據(jù)式(10)得到10個(gè)預(yù)測(cè)模型的綜合評(píng)價(jià)得分S,10個(gè)預(yù)測(cè)模型的多指標(biāo)綜合評(píng)價(jià)得分及排序如表4所列。

表4 告警狀態(tài)與對(duì)應(yīng)告警數(shù)值結(jié)果Tab.4 Alarm status and corvesponding alarm value

根據(jù)表3排序可以得到兩測(cè)點(diǎn)排名前5位的優(yōu)選模型分別為M3,M4,M7,M8,M10和M2,M3,M4,M8,M10。對(duì)優(yōu)選出的5個(gè)模型按上述步驟重新進(jìn)行權(quán)重分配,得到5個(gè)優(yōu)選模型的初始權(quán)重值為{0.34,0.13,0.04,0.29,0.20}和{0.07,0.34,0.23,0.24,0.12}。

3.3 方案對(duì)比

根據(jù)是否考慮殘差修正、動(dòng)態(tài)評(píng)價(jià)指標(biāo)調(diào)整權(quán)重和告警反饋調(diào)整權(quán)重,共提出5種對(duì)比分析方案,如表5所列。

表5 對(duì)比方案Tab.5 Comparison schemes

根據(jù)滑動(dòng)窗口模型,再結(jié)合式(15)～(18),可以得到2019年11月25日至2020年11月24日內(nèi)365個(gè)數(shù)據(jù)的告警數(shù)值分布情況。得到5種方案的告警數(shù)值區(qū)間分布及平均告警數(shù)值如圖6～7所示。

圖6 測(cè)點(diǎn)1的5種方案告警情況Fig.6 Alarms of five schemes for measurement point No.1

使用告警數(shù)值區(qū)間法進(jìn)行告警,是通過(guò)對(duì)各模型權(quán)重的調(diào)整,使得經(jīng)常誤告警的模型在綜合告警時(shí)擁有較低的權(quán)重,以減少誤告警模型對(duì)最終告警結(jié)果的影響,最終得到更符合實(shí)際情況的告警狀態(tài)。

根據(jù)圖6和圖7綜合分析可知:

圖7 測(cè)點(diǎn)2的5種方案告警情況Fig.7 Alarms of five schemes for measurement point No.2

(1) 方案1未進(jìn)行殘差修正前,模型出現(xiàn)大量嚴(yán)重告警狀態(tài),與大壩真實(shí)性態(tài)不符。對(duì)于方案2的殘差修正方法,方案2的告警率及告警等級(jí)明顯降低,測(cè)點(diǎn)1中輕度告警級(jí)別及以上從145個(gè)減到34個(gè),其中重度告警以上狀態(tài)減至為0,平均告警數(shù)值由0.200減至0.039,表明考慮殘差修正能夠有效降低誤告警頻次。

(2) 在殘差修正的基礎(chǔ)上,僅考慮新的評(píng)價(jià)指標(biāo)對(duì)模型賦予初始權(quán)重(方案3)或者告警反饋修改模型權(quán)重(方案4)兩個(gè)中的單一因素時(shí),與未考點(diǎn)這兩種因素的方案2相比,兩種方案基本正常個(gè)數(shù)明顯降低,其中考慮告警反饋方案的輕度告警和中度告警個(gè)數(shù)也有明顯降低,說(shuō)明考慮新的評(píng)價(jià)指標(biāo)對(duì)模型賦予初始權(quán)重或者告警反饋修改模型權(quán)重對(duì)測(cè)點(diǎn)告警情況的影響是有必要的。

(3) 同時(shí)考慮新的評(píng)價(jià)指標(biāo)對(duì)模型賦予初始權(quán)重或者告警反饋修改模型權(quán)重,與考慮單一因素相比,在輕度告警和重度告警個(gè)數(shù)上均有明顯降低,測(cè)點(diǎn)1的平均告警數(shù)值由0.037和0.027降至0.023,表明同時(shí)考慮兩種因素對(duì)告警情況的影響優(yōu)于考慮單一因素對(duì)告警情況的影響,說(shuō)明同時(shí)考慮兩種因素對(duì)預(yù)測(cè)是必要的。

(4) 對(duì)比不帶告警反饋的方案2和方案3,考慮到告警反饋的方案4和方案5在輕度告警和重度告警中的個(gè)數(shù)上都有明顯降低,基本正常占比略有上升,表明告警反饋系統(tǒng)能夠有效地將部分虛假告警降至基本正常。隨著考慮因素的增多,平均告警數(shù)值也呈整體下降趨勢(shì),測(cè)點(diǎn)整體異常率有明顯降低,證明了方案的有效性。

4 結(jié) 論

(1) 根據(jù)大壩數(shù)據(jù)特征建立了一套適用于大壩測(cè)點(diǎn)的數(shù)據(jù)評(píng)價(jià)指標(biāo)體系。除了常見的MAE等指標(biāo)外,提出較大絕對(duì)誤差數(shù)量(LAEN)評(píng)價(jià)指標(biāo),從多角度評(píng)價(jià)了大壩多個(gè)預(yù)測(cè)模型的表現(xiàn)情況,更加全面有效。

(2) 由于各種測(cè)點(diǎn)數(shù)據(jù)之間存在一定時(shí)空特性、各模型所適用數(shù)據(jù)的特征不同等原因,提出了通過(guò)殘差修正和動(dòng)態(tài)數(shù)據(jù)評(píng)價(jià)指標(biāo)實(shí)時(shí)更改模型權(quán)重的方法。當(dāng)單模型殘差不符合以0為均值的正態(tài)分布時(shí),進(jìn)行殘差修正使得告警更具有合理性和準(zhǔn)確性;將滑動(dòng)時(shí)間窗口模型與數(shù)據(jù)評(píng)價(jià)指標(biāo)結(jié)合,實(shí)時(shí)反饋模型權(quán)重,使得在測(cè)點(diǎn)中表現(xiàn)更優(yōu)的模型實(shí)時(shí)獲得更高權(quán)重,模型告警更具合理性和準(zhǔn)確性。

(3) 本文提出的告警反饋算法,不僅考慮到了模型的預(yù)測(cè)精度對(duì)告警結(jié)果的影響,而且考慮到了模型告警準(zhǔn)確率的影響,并根據(jù)模型告警成功率實(shí)時(shí)調(diào)整模型權(quán)重。經(jīng)試驗(yàn)證明,該告警反饋算法可以有效降低誤告警率和告警級(jí)別。