繆新穎,單玉鵬,紀建偉
(1. 大連海洋大學a.信息工程學院, b.食品科學與工程學院,遼寧大連116023;2. 沈陽農(nóng)業(yè)大學 信息與電氣工程學院,沈陽110161)
水庫大壩的安全直接關系到水庫的正常使用和下游農(nóng)田及農(nóng)村的安全[1]。在中國現(xiàn)存的大壩中,土石壩居多,而在影響土石壩安全的因素中,滲流占有很大的比例[2]。因此,及時分析滲流監(jiān)測數(shù)據(jù)和做出可靠的水庫大壩安全預測非常重要[3]。一些統(tǒng)計模型[4]被用于安全評價分析和預測,在一定程度上可以揭示水庫大壩效應變量與其影響因素之間的定量關系[5],然而數(shù)學模型通常是基于一些假設,如:觀測值之間相互獨立的,誤差滿足正態(tài)分布,誤差的數(shù)學期望值是0等[6-7]。此外,數(shù)學模型的輸入量選擇不當,模型的準確性將受到很大影響[7]。
神經(jīng)網(wǎng)絡作為一種非線性優(yōu)化工具[8-9],適應水庫大壩滲流及其影響因素之間的非線性關系,已被許多研究者采用[10-15]。然而,傳統(tǒng)的BP(back propagation)神經(jīng)網(wǎng)絡在收斂速度[16-18]和泛化能力[19-22]等方面存在缺陷,而且大多數(shù)神經(jīng)網(wǎng)絡結構是通過試湊法[23]確定的,耗時較長[24]。此外,神經(jīng)網(wǎng)絡影響因素確定的準確與否對預測結果至關重要[24]。Levenberg marquardt (LM)算法[25]采用Gauss-Newton 法搜索最優(yōu)值,下降速度快[26],通過自適應調(diào)整網(wǎng)絡權值,使每次迭代不再沿單一的負梯度方向進行,從而大大提高網(wǎng)絡的收斂速度和泛化能力[5,7]。遺傳算法(genetic algorithm, GA)[27]是受達爾文進化論的啟發(fā),利用編碼串種群表示參數(shù),基于一定的適應度函數(shù),由遺傳算子選擇個體,通過連續(xù)的迭代與進化不斷提高新種群個體的適應度,直到滿足預設條件停止進化,并將適應度最高的個體作為待優(yōu)化參數(shù)的最優(yōu)解[7]。與傳統(tǒng)的結構優(yōu)化算法和試湊法相比,GA 通常能夠快速地得到較好的優(yōu)化結果,因此被用來優(yōu)化神經(jīng)網(wǎng)絡[24,28-30]。
對于水庫大壩的安全監(jiān)測,影響水庫大壩滲流的因素不止一個[31]。這些水庫大壩影響因素的確定通常依賴于經(jīng)驗[7],項目組利用試驗方法來確定水庫大壩滲流的影響因素[24],證明了并非影響因素越多,預測效果越好,主要是因為影響因素之間存在著信息重疊,從而導致復雜性升高[24]。主成分分析(principal component analysis,PCA)是PEARSON[32]在1901年提出的,通過提取正交的主成分避免多重共線性,從而準確提高參數(shù)估計。此外,可以降低包含許多變量的數(shù)據(jù)集的維數(shù),從而盡可能減少變量以包含盡可能多的信息,這可以使模型更有效[33-35]。
本研究提出了一種預測水庫土石壩滲流的PCA-GA-LM 模型。采用PCA 確定影響因素,實現(xiàn)影響因素的去耦和降維,在此基礎上,結合GA-LM 建立了水庫土石壩滲流預測模型,并將算法與未用PCA算法的GA-LM 進行比較,以期為水庫土石壩滲流預測提供參考。
綜合學者們的研究結果,土石壩的滲流特性可以通過測壓管水位反映出來,并受到水庫水位、降雨、溫度、老化等多種因素的影響[7]。為了找到相對合適的滲流影響因素,項目組利用試驗法對表1中滲流的3種影響因素方案進行GA-LM 預測比較,發(fā)現(xiàn)模型1的方案雖然不是影響因素最多,但卻是預測精度相對最高[7],說明如何確定土石壩滲流的影響因素沒有必然的規(guī)律,究其原因是影響因素之間存在著耦合性,相互影響,因此有必要尋找一種更科學有效的方式來確定滲流的影響因素。表1 中,H是水庫水位,R是降雨量,T是溫度,θ是時效因子。H0,H5,H10,H20和H30分別表示觀測前0,5,10,20,30d 的平均庫水位;同理,R和T也包含了5 個平均降雨量和溫度;時效分量包括θ和lnθ,θ為從觀測起始日期算起的天數(shù)的1%。
表1 滲流影響因素試驗方案Table 1 Testing scheme of influence factors of the seepage
本研究數(shù)據(jù)取自遼寧撫順渾河上的大伙房水庫,主壩壩型為黏土心墻土壩,最大壩高49.2m,壩頂長度1366.7m,控制流域面積5437km2,涉及農(nóng)田灌溉面積8.6萬hm2,是保障沈撫大地灌溉的重要水利工程。以大伙房水庫某關鍵斷面“pie3140”測壓管觀測數(shù)據(jù)為研究對象,利用2018 年的365 組數(shù)據(jù)作為訓練樣本,選取2019 年15組數(shù)據(jù)作為測試樣本對滲流進行預測。在用GA-LM進化神經(jīng)網(wǎng)絡進行預測之前,先采用主成分分析法對影響因子進行解耦和降維。流程圖見圖1。
圖1 PCA-GA-LM土石壩滲流預測模型流程圖Figure 1 Flowchart of PCA-GA-LM prediction model of seepage of the earth-rockfill dam
1.2.1 水庫土石壩滲流影響因子的確定 考慮到水庫土石壩滲流影響因素之間的多重共線性和數(shù)量眾多,利用主成分分析方法確定影響因子,從而實現(xiàn)去耦和降維。具體步驟如下。
步驟1:為了不丟失影響因素信息,選取表1 中的模型3 影響因素方案作為主成分分析的輸入。由于17 個影響因素的維數(shù)大多不同,且數(shù)值變化很大,因此在測量影響因素的變化程度時,結果容易失真,偏向于大范圍的影響因素。為了消除不同均值和方差對變量比較的影響,利用式(1)對17個影響因素的數(shù)據(jù)進行歸一化。
式中:mean(X i)為平均值;σ(Xi)為標準差。
步驟2:利用式(2)求樣本的協(xié)方差矩陣。
步驟3:計算樣本協(xié)方差矩陣Cx的特征值λi及相應特征向量μi,其中i=1,2,…,p。
步驟4:特征值按降序排列,前m(m<p)個主元的累積貢獻率計算公式為:
此處將累積貢獻率大于95%的前m個新生成分量作為主元。
步驟5:將前m個主元所對應的特征向量選出來,利用式(4)構建變換矩陣T,并利用式(5)計算出前m個主成分。
1.2.2 預測水庫土石壩滲流 將體現(xiàn)滲流的水庫土石壩測壓管水位作為輸出,將1.2.1中所確定的主成分作為輸入,利用GA-LM模型預測水庫土石壩滲流。具體的GA-LM算法如下。
(1)初始種群和編碼。結構基因采用二進制編碼,表示隱層節(jié)點結構(“1”表示存在隱層節(jié)點,“0”則表示不存在);連接權值和閾值用權重基因表示,利用實數(shù)進行編碼。當有n個隱層節(jié)點、x個輸入、y個輸出時,染色體結構見圖2。
圖2 染色體結構Figure 2 Construction of chromosomes
本研究選取種群大小為100,初始n=36。
(2)在式(6)求取誤差平方和的基礎上,按照式(7)進行適應度評價。
式中:V為經(jīng)LM神經(jīng)網(wǎng)絡訓練得到的輸出值;T為V所對應的實際測量值;E為誤差平方和(SSE)。
式中:F為適應度函數(shù)。通過向F高的方向進化,使誤差逐步減小, 結構逐步趨于簡單[7]。
(3)確定終止進化條件。以進化代數(shù)是否滿足100代或均方誤差MSE是否小于0.001為準則終止進化。
(4)遺傳算子。選擇算子采用輪盤賭策略;交叉和變異算子均根據(jù)染色體編碼形式采用混合策略[6]。其中結構基因采用單點交叉和基本位變異算子;權重基因采用算術交叉和非均勻變異算子。初始交叉率和變異率分別為0.6和0.08。
(5)在LM算法中,權值的調(diào)整算法為:
式中:J(ω)為Jacobian 矩陣;β為大于零的調(diào)整因子,用于控制LM 算法迭代;I為單位矩陣。本研究β的初始值設為0.01。
按照1.2.1 算法,對365 組數(shù)據(jù)歸一化后的水庫土石壩滲流部分數(shù)據(jù)見表2。由表2 可知,經(jīng)過歸一化的數(shù)值變化明顯變小,可以消除不同均值和方差對變量比較的影響。
表2 歸一化土石壩滲流影響因素Table 2 Normalized influence factors of the earth-rockfill dam seepage
對應的水庫土石壩樣本的協(xié)方差矩陣見表3。由表3 可知,17 個影響因素之間有一定的相關性,存在著較高的耦合,需要去耦。
表3 土石壩樣本的協(xié)方差矩陣Table 3 Covariance matrix of the earth-rockfill dam samples
計算出來的降序特征值和貢獻率見表4。由表4可知,前8個主元的累計貢獻率大于95%,且特征值較大,因此選取主成分數(shù)為8,按照式(4)和式(5),對應的主成分表達式如式(9)。
表4 降序特征值和貢獻率Table 4 Eigenvalue in descending order and corresponding contribution rates
在此基礎上,利用1.2.2的GA-LM算法,得到的PCA-GA-LM 預測網(wǎng)絡結構如圖3,并據(jù)此完成測壓管水位的預測。為了驗證PCA-GA-LM 算法的預測效果,將采用PCA 方法的GA-LM 預測模型與表1中的3個GA-LM預測模型進行比較,比較結果見圖4??梢钥闯?在4種模型中,PCA-GA-LM 模型的測壓管水位預測值與測壓管水位實測值擬合效果最好,吻合程度最高。由具體誤差分析(表5)可知,PCA-GA-LM 模型的影響因子個數(shù)最少,平均誤差、標準偏差和平均相對誤差最小,預測準確率最高,能達到99.98%。采用試驗法所確定的3 個模型中,模型2和模型3的影響因子數(shù)與PCA方法所確定的影響因子數(shù)相差較大,準確率也相差較多;模型1的影響因子數(shù)接近于PCA 方法,預測準確率與PCA 方法最為接近,說明模型1確定的影響因子有效性恰好接近PCA 方法,但該方法受試驗法本身特點所限,確定過程帶有很大的隨機性。綜合4種模型誤差分析結果可知,本研究所提出的PCA-GA-LM 水庫土石壩滲流預測模型是可靠的。
圖3 PCA-GA-LM土石壩滲流預測網(wǎng)絡結構Figure 3 Structure of PCA-GA-LM network for predicting seepage of the earth-rockfill dam
圖4 基于PCA-GA-LM所預測的測壓管水位與表1模型的比較Figure 4 Comparison of the predicted piezometric levels between PCA-GA-LM model and models in table 1
表5 基于PCA-GA-LM的測壓管水位預測模型與表1模型的誤差分析比較Table 5 Comparison of the dam prediction performance of the piezometric levels under the condition of PCA and without PCA
對大壩重要效應量進行精準預測和確保大壩安全是使水庫正常發(fā)揮蓄水功能、保障農(nóng)業(yè)生產(chǎn)用水需求的重要舉措。由此,研究準確率高、可操作性強的大壩滲流預測方法,例如本研究設計的方法,取代隨機性的試驗法,在有效影響因子確定、網(wǎng)絡結構優(yōu)化和預測算法3方面均有可操行性強的算法,且實際應用預測準確率高于其他文獻方法,可以實現(xiàn)對大壩滲流的精準預測。
本研究在對土石壩滲流影響因素分析基礎上,將PCA 算法與GA-LM 算法相結合,提出了一種用于水庫大壩滲流預測的PCA-GA-LM 模型。作為一種有效的搜索方法,遺傳算法被用來優(yōu)化網(wǎng)絡結構。針對傳統(tǒng)BP 算法收斂速度慢、易陷入局部最優(yōu)的缺點,采用了LM 算法進行滲流預測。為了確定合適的影響因子,使模型更加有效,采用PCA 確定水庫土石壩壩體滲流的影響因素。從大伙房水庫土石壩的應用實例可以看出,采用該模型預測的水庫土石壩測壓管水位值和實測值吻合度較高。采用PCA 和試驗法情況下的水庫土石壩滲流預測誤差比較分析表明,采用PCA 的模型預測誤差最小,可以獲得更高的預測準確率。由此可見,本研究所建立的模型可以作為水庫土石壩滲流預測的一種有效工具。