摘 要:為解決孤立森林算法檢測大壩異常數(shù)據(jù)時(shí)因不能識別數(shù)據(jù)間趨勢性和相關(guān)性而造成數(shù)據(jù)誤判的問題,提出基于平滑閾值與孤立森林的大壩監(jiān)測數(shù)據(jù)異常檢測算法。首先利用小波變換提取時(shí)序數(shù)據(jù)的趨勢項(xiàng),然后使用ARMA 模型對提取的趨勢項(xiàng)數(shù)據(jù)確定動態(tài)閾值區(qū)間,最后利用孤立森林算法檢測出散落在閾值區(qū)間外的異常值。以貴州省畢節(jié)市夾巖水利樞紐工程混凝土面板堆石壩為例,分別對大壩壩基、壩體、周邊縫及面板4 個(gè)部位監(jiān)測數(shù)據(jù)進(jìn)行檢測,驗(yàn)證算法效果。結(jié)果表明:與傳統(tǒng)孤立森林算法相比,基于平滑閾值與孤立森林的算法對壓力、觀測房沉降量、開合度、應(yīng)力的誤判率分別降低了12.2、13.4、7.1、8.0 個(gè)百分點(diǎn)。
關(guān)鍵詞:小波變換;ARMA 模型;孤立森林;異常檢測;大壩;畢節(jié)市夾巖水利樞紐工程
中圖分類號:TV698.1 文獻(xiàn)標(biāo)志碼:A doi:10.3969/ j.issn.1000-1379.2025.03.022
引用格式:張瑜,秦學(xué),彭浩.基于平滑閾值與孤立森林的大壩監(jiān)測數(shù)據(jù)異常檢測[J].人民黃河,2025,47(3):141-145.
隨著大壩建設(shè)規(guī)模的不斷擴(kuò)大,保障大壩安全成為重要挑戰(zhàn)[1] 。現(xiàn)今許多大壩因長時(shí)間運(yùn)行而存在老化和損壞情況,加之維護(hù)不足或缺乏定期檢查,導(dǎo)致大壩出現(xiàn)各種潛在問題。通過檢測大壩的異常數(shù)據(jù)可以及早發(fā)現(xiàn)問題并解決,以確保大壩的安全運(yùn)行。目前在大壩監(jiān)測數(shù)據(jù)異常檢測領(lǐng)域,已有多種檢測方法并取得良好效果[2-3] ,但仍存在合理選擇測值范圍、實(shí)驗(yàn)數(shù)據(jù)服從特定的概率分布[4] 以及進(jìn)行特定訓(xùn)練和擬合[5] 等適應(yīng)性問題。孤立森林算法在處理低維度、異常點(diǎn)相對較少的時(shí)序數(shù)據(jù)方面有很大優(yōu)勢,但無法捕捉數(shù)據(jù)的時(shí)序相關(guān)性。另外,孤立森林算法對于噪聲數(shù)據(jù)比較敏感,噪聲數(shù)據(jù)可能會被誤判為異常點(diǎn)[6] 。將ARMA 模型與孤立森林算法結(jié)合, 利用ARMA 模型生成動態(tài)閾值[7] ,根據(jù)歷史數(shù)據(jù)走勢和預(yù)測結(jié)果不斷調(diào)整閾值,可以更加靈活地適應(yīng)數(shù)據(jù)的變化。
本文提出一種基于平滑閾值與孤立森林的大壩監(jiān)測數(shù)據(jù)異常檢測方法,首先利用小波變換提取大壩監(jiān)測數(shù)據(jù)中的趨勢項(xiàng),達(dá)到平滑數(shù)據(jù)的效果;然后利用ARMA 模型計(jì)算出動態(tài)閾值區(qū)間,衡量數(shù)據(jù)的波動性;最后采用孤立森林算法對處于閾值區(qū)間外的數(shù)據(jù)點(diǎn)進(jìn)行異常檢測。