宋培玉 ,楊浩東 ,王嘉華
(1. 中煤科工集團(tuán)南京設(shè)計(jì)研究院有限公司,江蘇 南京 210019;
2. 江蘇南水科技有限公司,江蘇 南京 210012;
3. 河海大學(xué)理學(xué)院,江蘇 南京 210098)
利用實(shí)測(cè)數(shù)據(jù)建立監(jiān)控模型是實(shí)現(xiàn)大壩工程安全預(yù)警的有效途徑[1],目前逐步回歸法、時(shí)間序列法、灰色系統(tǒng)理論等一系列傳統(tǒng)的統(tǒng)計(jì)模型已經(jīng)被應(yīng)用到大壩安全監(jiān)控中。朱劭宇等[2]利用馬爾科夫鏈適應(yīng)大波動(dòng)的特點(diǎn),將逐步回歸和馬爾科夫模型相結(jié)合并應(yīng)用于大壩變形監(jiān)測(cè)。針對(duì)多重共線性問(wèn)題,姚遠(yuǎn)等[3]建立了偏最小二乘回歸法的逐步回歸模型,但模型系數(shù)難以解釋。陳宏玉[4]在偏最小二乘法的基礎(chǔ)上引入了半?yún)?shù)模型,有效地分離出觀測(cè)數(shù)據(jù)中的系統(tǒng)誤差,但模型處理過(guò)程較復(fù)雜。為避免灰色模型在長(zhǎng)期預(yù)測(cè)的有效性受系統(tǒng)時(shí)間序列長(zhǎng)短及數(shù)據(jù)變化的影響,魏迎奇等[5]建立等維 GM(1,1)動(dòng)態(tài)預(yù)測(cè)模型對(duì)大壩變形進(jìn)行了預(yù)測(cè)。針對(duì)大壩安全監(jiān)控中數(shù)據(jù)的隨機(jī)擾動(dòng)誤差影響,蘇觀南等[6]利用卡爾曼濾波消除原始數(shù)據(jù)擾動(dòng)誤差,再對(duì)大壩變形進(jìn)行灰色預(yù)測(cè)。李萌等[7]利用灰色模型預(yù)測(cè)分形維數(shù),建立了改進(jìn)的大壩分形幾何監(jiān)控模型。針對(duì)大壩監(jiān)測(cè)中常出現(xiàn)的非等間距數(shù)據(jù),付浩雁等[8]通過(guò)引進(jìn)指數(shù)平滑法構(gòu)建了改進(jìn)的非等間距灰色預(yù)測(cè)模型。
這些統(tǒng)計(jì)模型計(jì)算簡(jiǎn)捷,已被廣泛應(yīng)用到大壩安全監(jiān)控的各個(gè)領(lǐng)域,但針對(duì)自變量因子與效應(yīng)量之間非線性和小樣本問(wèn)題都存在一定的不足,特別是模型的泛化能力更嚴(yán)重影響到模型的預(yù)警。
相關(guān)向量機(jī)(RVM)是由 Tipping[9]在稀疏貝葉斯理論的基礎(chǔ)上,將極大似然估計(jì)、先驗(yàn)概率和后驗(yàn)分布估計(jì)等理論結(jié)合形成的一種監(jiān)督型機(jī)器學(xué)習(xí)算法。與神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)相比,RVM 算法的相關(guān)向量數(shù)目較少,模型的復(fù)雜度較低,且其選取的核函數(shù)無(wú)需滿足 Mercer 條件的限制,另外該算法的模型可調(diào)節(jié)參數(shù)不多,在一定程度上減少了因參數(shù)設(shè)置不當(dāng)而影響模型泛化性能的風(fēng)險(xiǎn)[10]。
杜傳陽(yáng)等[11]建立了以 RVM 為理論基礎(chǔ)的時(shí)間序列模型并應(yīng)用于大壩安全監(jiān)控。唐琪等[12]在大壩變形預(yù)測(cè)時(shí)利用馬爾科夫鏈模型,對(duì) RVM 模型得到的殘差數(shù)據(jù)進(jìn)行修正。張海龍等[13]在某重力的位移監(jiān)測(cè)中使用了模糊均值聚類算法,對(duì)聚類后的樣本運(yùn)用 RVM 算法進(jìn)行了訓(xùn)練。王娟等[14]將核獨(dú)立分量分析與 RVM 相結(jié)合,對(duì)某拱壩的缺失監(jiān)測(cè)數(shù)據(jù)進(jìn)行了插值處理。相關(guān)研究結(jié)果均表明,相較傳統(tǒng)的統(tǒng)計(jì)模型,RVM 整體上在大壩安全監(jiān)測(cè)方面表現(xiàn)更為出色,但 RVM 模型研究對(duì)模型參數(shù)的選取仍嚴(yán)重依賴人為經(jīng)驗(yàn),為此利用粒子群算法(PSO)針對(duì) RVM 模型參數(shù)優(yōu)化問(wèn)題,對(duì) PSO-RVM 模型進(jìn)行改進(jìn),并在此基礎(chǔ)上進(jìn)行相關(guān)監(jiān)控研究。
從相關(guān)向量機(jī)的基本原理可以看出,相關(guān)向量機(jī)的性能與選取的徑向基核函數(shù)參數(shù)γ有很大關(guān)系,因此,研究尋找最佳核函數(shù)參數(shù)γ具有重要的實(shí)際意義。為解決該問(wèn)題,結(jié)合 PSO 算法和 RVM模型的特點(diǎn),采用 PSO 算法對(duì) RVM 模型的關(guān)鍵參數(shù)γ進(jìn)行尋優(yōu),建立起 PSO-RVM 模型,借助 PSO算法優(yōu)秀的全局搜索能力實(shí)現(xiàn)模型的優(yōu)化,旨在提高監(jiān)控模型的學(xué)習(xí)和泛化能力。
PSO 算法本身參數(shù)眾多,選擇合適的參數(shù)有利于提高算法的性能和效率。在實(shí)際應(yīng)用中,需要調(diào)節(jié)的參數(shù)主要有以下幾種:
1)適應(yīng)度函數(shù)F(·)。適應(yīng)度函數(shù)是用來(lái)對(duì)種群中各粒子的適應(yīng)性進(jìn)行度量的函數(shù)[15],適應(yīng)度函數(shù)越小,則對(duì)應(yīng)的粒子個(gè)體被選中作為最優(yōu)解的機(jī)會(huì)越大。結(jié)合模型評(píng)估需求,選擇常用的模型評(píng)價(jià)指標(biāo)均方根誤差作為適應(yīng)度函數(shù),公式如下:
式中:N表示種群規(guī)模;yi和分別表示模型因變量的實(shí)測(cè)值和預(yù)測(cè)值。
2)種群規(guī)模N。研究發(fā)現(xiàn),在 PSO 算法中,當(dāng)待優(yōu)化參數(shù)維數(shù)不大時(shí),種群規(guī)模即粒子個(gè)數(shù)一般取 10~30 個(gè)就能得到比較好的結(jié)果,種群規(guī)模越大,模型收斂速度越慢[16]85。本研究中,PSO 算法優(yōu)化 RVM 模型時(shí)維數(shù)是 1,考慮到大壩安全監(jiān)控模型在實(shí)際應(yīng)用中的及時(shí)預(yù)報(bào)需求,選擇種群規(guī)模N= 10 個(gè)。
3)慣性權(quán)重ω。慣性權(quán)重ω代表以前速度對(duì)當(dāng)前速度的影響。根據(jù)文獻(xiàn) [16] 的建議,將最大和最小慣性權(quán)重設(shè)置為ωmax= 0.9,ωmin= 0.4。
4)加速因子S1和S2。S1和S2分別用來(lái)調(diào)整粒子在飛行過(guò)程中自身學(xué)習(xí)和群體協(xié)作的能力比重,其取值大小直接影響粒子的運(yùn)動(dòng)軌跡。在類似的大壩安全監(jiān)控模型研究中發(fā)現(xiàn),S1=S2= 1.5 時(shí),模型具有較好的收斂效果[16]88。
5)最大迭代次數(shù)Niter,max。迭代次數(shù)越多,獲得參數(shù)最優(yōu)解的可能性越大,但同時(shí)模型整體的訓(xùn)練時(shí)間越長(zhǎng),且容易產(chǎn)生過(guò)擬合現(xiàn)象[17]。因此,本研究設(shè)置最大迭代次數(shù)Niter,max= 100 次,兼顧模型的預(yù)報(bào)精度和計(jì)算復(fù)雜度。
6)速度變化區(qū)間 [vmin,vmax]。為防止搜索發(fā)散,PSO 算法中通過(guò)設(shè)置區(qū)間對(duì)粒子的飛行速度進(jìn)行限制,將粒子超出邊界值的速度設(shè)定為邊界值,本研究設(shè)置vmin= -1,vmax= 1[16]89。
7)位置變化區(qū)間 [Xmin,Xmax]。為保證粒子在搜索空間內(nèi)的飛行位置可解釋,還需使用位置變化區(qū)間對(duì)粒子的位置進(jìn)行限制,將粒子在運(yùn)行中超出邊界值的位置設(shè)定為邊界值。理論上,RVM 核參數(shù)γ的取值范圍為(0,+ ∞),但缺乏最大位置Xmax的限制,同樣會(huì)產(chǎn)生搜索發(fā)散問(wèn)題,導(dǎo)致模型擬合時(shí)間過(guò)長(zhǎng)[18],參考大量研究發(fā)現(xiàn),合適的核參數(shù)γ一般不超過(guò) 20,因此本研究設(shè)置Xmin= 1,Xmax= 30。
本研究選擇徑向基函數(shù)作為 RVM 模型的核函數(shù),利用 PSO 算法對(duì)核函數(shù)參數(shù)γ進(jìn)行優(yōu)化,構(gòu)建起智能相關(guān)向量機(jī)模型——PSO-RVM 模型,用于大壩安全監(jiān)控。在 PSO 優(yōu)化 RVM 參數(shù)之前,需先將預(yù)處理后的數(shù)據(jù)按一定比例劃分為訓(xùn)練集和測(cè)試集兩部分,其中訓(xùn)練集用于模型構(gòu)建及參數(shù)尋優(yōu),測(cè)試集用于模型評(píng)價(jià)。訓(xùn)練集與測(cè)試集的劃分比例并沒(méi)有嚴(yán)格的要求和標(biāo)準(zhǔn),本研究取 90% 的數(shù)據(jù)作為訓(xùn)練集,余下 10% 的數(shù)據(jù)作為測(cè)試集。
PSO-RVM 模型結(jié)合了 PSO 算法,彌補(bǔ)了RVM 模型的不足,使得大壩安全監(jiān)控模型的學(xué)習(xí)和泛化性能得以提高,PSO-RVM 模型整體的算法步驟是 PSO 和 RVM 2 種模型算法步驟的結(jié)合, PSORVM 模型流程圖如圖 1 所示。
某工程混凝土面板堆石壩最大壩高為 111 m,壩頂長(zhǎng)度為 348.2 m,壩頂寬度為 10.0 m,上游綜合坡比為 1∶1.40,下游綜合坡比為 1∶1.55,壩頂高程為 805 m,同時(shí)壩頂設(shè)有高度為 5.2 m 的 L 型防浪墻與面板相接?;炷撩姘鍨椴坏群?,厚度t= 0.3 +0.003H(H為水深)。
為保證大壩的安全運(yùn)行,該工程配設(shè)了較為全面的安全監(jiān)測(cè)系統(tǒng),既包括上、下游水位,氣溫和降水量等常規(guī)監(jiān)測(cè)項(xiàng)目,也涵蓋大壩壩體的變形、沉降等監(jiān)測(cè)項(xiàng)目。本研究選用工程主壩 TB5 視準(zhǔn)線的監(jiān)測(cè)數(shù)據(jù),該視準(zhǔn)線于 2012-05-17 開始監(jiān)測(cè),每隔 7 d 完成 1 次觀測(cè)記錄。將 2015-03-10 作為監(jiān)測(cè)基準(zhǔn)日,選取該測(cè)點(diǎn)自 2015-03-17 至 2017-11-29共 90 個(gè)位移監(jiān)測(cè)數(shù)據(jù)作為訓(xùn)練集,選取該測(cè)點(diǎn)自2016-12-06 至 2017-02-07 共 10 個(gè)位移監(jiān)測(cè)數(shù)據(jù)作為預(yù)測(cè)集,通過(guò)建立 PSO-RVM 模型預(yù)測(cè)后 10 個(gè)監(jiān)測(cè)日,也就是預(yù)測(cè)集的位移數(shù)據(jù)。
圖1 PSO-RVM 模型流程圖
2.2.1 模型選擇
混凝土面板壩位移的統(tǒng)計(jì)模型如下:
式中:δ代表位移總量;δH,δT,δθ分別表示水壓、溫度和時(shí)效等分量。
1)水壓分量δH。庫(kù)水壓力作用在壩體上產(chǎn)生的內(nèi)力會(huì)使壩體變形而產(chǎn)生位移?;炷翂紊先我挥^測(cè)點(diǎn)的水壓分量δH與水深H,H2,H3呈線性關(guān)系,即
式中:Hu,Hu0分別為壩體位移監(jiān)測(cè)日和監(jiān)測(cè)基準(zhǔn)日的上游水頭;αi為水壓因子回歸系數(shù)。
2)溫度分量δT。溫度分量δT是由壩體混凝土和基巖溫度變化而引起的大壩位移,從力學(xué)觀點(diǎn)看,δT應(yīng)選擇壩體混凝土和基巖的溫度計(jì)測(cè)值作為因子,但由于壩體內(nèi)部實(shí)測(cè)的和基巖的溫度監(jiān)測(cè)數(shù)據(jù)的缺失,故采用多周期的諧波作為因子,即
式中:t為壩體位移監(jiān)測(cè)日到監(jiān)測(cè)基準(zhǔn)日的累計(jì)天數(shù);t0為建模數(shù)據(jù)對(duì)應(yīng)的監(jiān)測(cè)日到監(jiān)測(cè)基準(zhǔn)日的累計(jì)天數(shù);b1i,b2i為溫度因子回歸系數(shù)。
3)時(shí)效分量δθ。時(shí)效分量與大壩位移之間的關(guān)系復(fù)雜,它綜合反映了混凝土壩體和基巖的徐變,同時(shí)還包括壩體裂縫引起的不可逆位移?;炷翂蔚臅r(shí)效分量δθ包含時(shí)間Tθ的線性和對(duì)數(shù)函數(shù),即
式中:Tθ為壩體位移監(jiān)測(cè)日到監(jiān)測(cè)基準(zhǔn)日的累計(jì)天數(shù)除以 100,即Tθ=t/100;Tθ0為建模數(shù)據(jù)對(duì)應(yīng)的監(jiān)測(cè)日到監(jiān)測(cè)基準(zhǔn)日的累計(jì)天數(shù)除以 100,即Tθ0=t0/100;c1,c2為時(shí)效因子回歸系數(shù)[19]。
根據(jù)分析,本研究選擇的模型因子分別如下:水壓分量,Hu-Hu0,(Hu-Hu0)2,(Hu-Hu0)3;溫度分量,時(shí)效分量lnTθ- lnTθ0。為簡(jiǎn)化起見(jiàn),將這 9 個(gè)分量分別命名為X1~X9。
2.2.2 模型評(píng)價(jià)指標(biāo)
選取標(biāo)準(zhǔn)均方誤差和平均絕對(duì)百分比誤差 2 種統(tǒng)計(jì)指標(biāo)作為 PSO-RVM 模型的評(píng)價(jià)指標(biāo),以此檢驗(yàn)?zāi)P偷姆夯阅堋?/p>
2.2.3 數(shù)據(jù)預(yù)處理
為消除數(shù)據(jù)量綱的影響,需要對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化預(yù)處理,本研究采用零均值標(biāo)準(zhǔn)化。
對(duì)缺失值進(jìn)行插補(bǔ)處理,本研究采用線性插值方法,利用缺失值前后監(jiān)測(cè)日的監(jiān)測(cè)數(shù)據(jù)進(jìn)行計(jì)算插補(bǔ)。
2.3.1 模型參數(shù)的尋優(yōu)結(jié)果分析
本研究 RVM 模型核函數(shù)參數(shù)γ的取值為 3,而通過(guò)粒子群算法尋優(yōu)得到的核函數(shù)參數(shù)γ為 6.9137。
粒子群算法在尋優(yōu)過(guò)程中適應(yīng)度函數(shù)值的變化曲線如圖 2 所示,可以看出,當(dāng)優(yōu)化代數(shù)達(dá)到 20 代時(shí),適應(yīng)度函數(shù)值趨于穩(wěn)定,當(dāng)優(yōu)化代數(shù)達(dá)到 30 代時(shí),適應(yīng)度函數(shù)值恒定不變。此時(shí)粒子的個(gè)體最優(yōu)解Pbest和種群的全局最優(yōu)解Gbest已經(jīng)產(chǎn)生且不再更新,這也意味著粒子的速度和位置不再發(fā)生大的變化,種群逐漸收斂至一點(diǎn)。
2.3.2 模型的稀疏性能分析
RVM 和 PSO-RVM 模型訓(xùn)練樣本和相關(guān)向量關(guān)系展示如圖 3 和 4 所示,擬合時(shí)段相關(guān)向量個(gè)數(shù)與運(yùn)行時(shí)間如表 1 所示。
圖2 訓(xùn)練集適應(yīng)度函數(shù)值變化曲線
圖3 RVM 模型的相關(guān)向量個(gè)數(shù)
圖4 PSO-RVM 模型的相關(guān)向量個(gè)數(shù)
表1 RVM 和 PSO-RVM 模型擬合時(shí)段相關(guān)向量個(gè)數(shù)與運(yùn)行時(shí)間
其中,PSO-RVM 模型的相關(guān)向量數(shù)為 13 個(gè),即模型訓(xùn)練完成后僅保留 13 個(gè)樣本量,少于 RVM模型,同時(shí),由表 1 可以看出 PSO-RVM 模型的運(yùn)行時(shí)間要少于 RVM 模型,說(shuō)明 PSO-RVM 模型的稀疏性能更好??紤]到大壩安全監(jiān)控中實(shí)時(shí)預(yù)測(cè)的需要,監(jiān)控模型對(duì)于預(yù)測(cè)的及時(shí)性有著更高的要求,因此,PSO-RVM 模型更適用于大壩位移量的在線預(yù)測(cè),更能滿足大壩安全監(jiān)控模型實(shí)時(shí)預(yù)測(cè)的要求。
2.3.3 模型的學(xué)習(xí)性能分析
模型的學(xué)習(xí)性能主要通過(guò)模型在訓(xùn)練集上的預(yù)測(cè)均方根誤差體現(xiàn),RVM 和 PSO-RVM 2 種模型擬合時(shí)段的均方根誤差分別為 1.249,1.274,PSORVM 的均方根誤差稍大于 RVM,但兩者十分接近且數(shù)值理想。
RVM 和 PSO-RVM 模型在訓(xùn)練集上的擬合曲線如圖 5 所示。
圖5 RVM 和 PSO-RVM 模型的擬合曲線
從圖 5 可以看出,不管是 RVM 模型還是PSO-RVM 模型,其擬合曲線都緊密圍繞理論值上下波動(dòng),說(shuō)明兩者擬合效果良好,都具有不錯(cuò)的學(xué)習(xí)性能。
2.3.4 模型的泛化性能分析
與學(xué)習(xí)性能相比,大壩安全監(jiān)控模型更加看重其泛化性能即預(yù)測(cè)未知數(shù)據(jù)量的能力,從而發(fā)揮風(fēng)險(xiǎn)預(yù)報(bào)的作用。RVM 和 PSO-RVM 模型的預(yù)測(cè)結(jié)果分析如表 2 所示。
從表 2 可以看出,PSO-RVM 模型的預(yù)測(cè)值比RVM 模型的預(yù)測(cè)值更加接近實(shí)際值,且 PSO-RVM模型預(yù)測(cè)的相對(duì)誤差顯著小于 RVM 模型,說(shuō)明優(yōu)化后的 PSO-RVM 模型比未優(yōu)化的 RVM 模型預(yù)報(bào)精度更高。
RVM 和 PSO-RVM 模型的預(yù)測(cè)曲線如圖 6 所示。從圖中可以直觀看出,PSO-RVM 模型預(yù)測(cè)曲線比 RVM 模型的預(yù)測(cè)曲線更加接近理論值,同樣體現(xiàn)了優(yōu)化后的 PSO-RVM 模型具有更好的泛化性能。2 個(gè)模型評(píng)價(jià)指標(biāo)如表 3 所示。
由表 3 可以看出,PSO-RVM 模型在 2 種評(píng)價(jià)指標(biāo)上的表現(xiàn)均顯著優(yōu)于 RVM 模型,可知經(jīng)過(guò)粒子群算法優(yōu)化后的相關(guān)向量機(jī)模型預(yù)測(cè)精度更高,泛化性能更強(qiáng)。
表2 RVM 和 PSO-RVM 模型的預(yù)測(cè)值和相對(duì)誤差
圖6 RVM 和 PSO-RVM 模型的預(yù)測(cè)曲線
表3 RVM 和 PSO-RVM 模型的評(píng)價(jià)指標(biāo)對(duì)比表
通過(guò)對(duì)相關(guān)向量機(jī)模型的粒子群優(yōu)化和工程實(shí)踐檢驗(yàn),可得出如下結(jié)論:1)與常規(guī) RVM 模型相比,PSO-RVM 模型能顯著提高 RVM 模型的稀疏性和泛化性能;2)PSO-RVM 模型可以應(yīng)用于大壩安全實(shí)測(cè)數(shù)據(jù)的建模和分析。與現(xiàn)有的研究成果相比,本研究方法編程簡(jiǎn)單,原理清晰,但如何提高模型的通用性,從而針對(duì)不同核函數(shù)或多核函數(shù)提出優(yōu)化改進(jìn)是下一步研究重點(diǎn)。