王文川, 杜玉瑾,2, 和吉, 邱林
(1.華北水利水電大學(xué) 水資源學(xué)院,河南 鄭州 450046; 2.黃河水利委員會(huì) 西峰水文水資源勘測(cè)局,甘肅 慶陽(yáng) 745099)
準(zhǔn)確預(yù)測(cè)徑流對(duì)發(fā)電、防洪、供水、多能源調(diào)度、環(huán)境保護(hù)、配水系統(tǒng)優(yōu)化和改善生態(tài)環(huán)境等各種實(shí)際工程問(wèn)題至關(guān)重要[1-2]。眾所周知,徑流通常受降水、蒸發(fā)和太陽(yáng)輻射等多種因素影響,并表現(xiàn)出強(qiáng)烈的非線性、高不確定性和時(shí)空變化的綜合特征[3-5]。近年來(lái),嚴(yán)重的氣候變化和人類(lèi)活動(dòng)已對(duì)徑流一致性產(chǎn)生了不可忽視的影響,在迅速變化的環(huán)境中準(zhǔn)確地捕獲徑流的動(dòng)態(tài)過(guò)程變得越來(lái)越困難。為提高水文預(yù)報(bào)精度,不同學(xué)者提出了許多預(yù)測(cè)模型,這些模型大致分為過(guò)程驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)兩類(lèi)[6]。過(guò)程驅(qū)動(dòng)模型以水文學(xué)概念為基礎(chǔ),需要大量水文氣象資料,并考慮不同時(shí)空條件下水文規(guī)律的差異性,因此易存在泛化性差以及參數(shù)不確定性等問(wèn)題。數(shù)據(jù)驅(qū)動(dòng)模型基本不考慮系統(tǒng)水文過(guò)程的物理機(jī)制,是以最優(yōu)數(shù)學(xué)關(guān)系為目標(biāo),建立輸入和輸出之間關(guān)系的黑箱子方法,在時(shí)間序列分析與預(yù)測(cè)方面有獨(dú)特的優(yōu)勢(shì)。如陶思銘等[7]根據(jù)流域水文資料構(gòu)建了唐乃亥控制流域逐日徑流長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long Short-term Memory Network,LSTM)預(yù)報(bào)模型。趙益平等[8]構(gòu)建了R/S-BP耦合模型,并成功應(yīng)用于釜溪河流域年徑流預(yù)報(bào)中。本文主要探索BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)模型融合數(shù)據(jù)預(yù)處理技術(shù)在流域月徑流量預(yù)報(bào)中的適用性。
由于徑流過(guò)程具有隨機(jī)性、趨勢(shì)性等特征,故單一預(yù)測(cè)模型通常難以有效地?cái)M合整個(gè)水文過(guò)程,有研究表明,信號(hào)分解技術(shù)可以將具有高復(fù)雜性的序列分解為一系列相對(duì)穩(wěn)定的子序列[9],降低了徑流量序列的非平穩(wěn)性,進(jìn)而降低了模型預(yù)測(cè)難度。目前,典型的信號(hào)預(yù)處理方法有奇異譜分析法(Singular Spectrum Analysis,SSA)、經(jīng)驗(yàn)?zāi)B(tài)分解法(Empirical Mode Decomposition,EMD)、集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)、小波分解(Wavelet Decomposition,WD)等。不同學(xué)者也做了大量有益的探索,如李福興等[10]采用EMD提取徑流序列中具有物理含義的信號(hào),結(jié)合差分整合移動(dòng)自回歸模型(Autoregressive Integrated Moving Average mode,ARIMA)和廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network,GRNN)模型分別對(duì)不同時(shí)間尺度的分量進(jìn)行模擬。梁浩等[11]融合大氣環(huán)流異常因子信息,在優(yōu)選BP神經(jīng)網(wǎng)絡(luò)、多元線性回歸(Multiple Linear Regression,MLR)和支持向量機(jī)(Support Vector Machine,SVM)的基礎(chǔ)上,分別基于EMD、EEMD和WD構(gòu)建了多種混合模型。EEMD方法雖然解決了EMD所存在的問(wèn)題,但若添加的白噪聲幅值不適合,會(huì)造成計(jì)算量冗余以及模型搭建時(shí)間增加等問(wèn)題。自適應(yīng)噪聲的完全集合經(jīng)驗(yàn)?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)很好地克服了上述方法存在的問(wèn)題。該分解方法已應(yīng)用到序列分解上,并取得了很好的表現(xiàn),如韓宏志等[12]結(jié)合回聲狀態(tài)網(wǎng)絡(luò)(Echo State Network,ESN)、CEEMDAN與誤差修正,提出了一種基于ESN的混合風(fēng)速預(yù)測(cè)方法?;诖?本文將CEEMDAN用于分解月徑流時(shí)間序列,但CEEMDAN分解得到的高頻分量,如IMF1,會(huì)增加預(yù)測(cè)難度。單一分解方法可能難以全面捕捉信號(hào)的非線性特征,如何解決IMF1非線性強(qiáng)、復(fù)雜性高的問(wèn)題成為進(jìn)一步提升水文預(yù)報(bào)精度的關(guān)注焦點(diǎn)。針對(duì)以上問(wèn)題,頡清云等[13]提出了一種基于改進(jìn)集合經(jīng)驗(yàn)?zāi)B(tài)分解(Modified Ensemble Empirical Mode Decomposition,MEEMD)-局部均值分解(Local Mean Decomposition,LMD)-門(mén)控循環(huán)單元(Gated Recurrent Unit,GRU)的超短期組合風(fēng)速預(yù)測(cè)模型。趙征等[14]提出了一種基于完備經(jīng)驗(yàn)?zāi)B(tài)分解(Completely Ensemble Empirical Mode Decomposition,CEEMD)、變分模態(tài)分解(Variational Mode Decomposition,VMD)和最小二乘支持向量機(jī)(Least Square Support Vector Regression,LSSVR)的混合風(fēng)速預(yù)測(cè)模型。“二次分解”體現(xiàn)了對(duì)原始數(shù)據(jù)處理的“精細(xì)化”思想,降低了一次分解中復(fù)雜分量的預(yù)測(cè)難度。目前衡量數(shù)據(jù)復(fù)雜度的方法有近似熵、樣本熵等,與近似熵相比,樣本熵改進(jìn)了近似熵中因?qū)ψ陨頂?shù)據(jù)的比較而產(chǎn)生計(jì)算偏差和一致性較差的缺陷[15]。因此,本文采用樣本熵方法定量衡量CEEMDAN分解各子序列的復(fù)雜性。
基于“分解與集成”的思想[16],本文嘗試采用二次分解方法對(duì)非線性信號(hào)進(jìn)行預(yù)處理,提出將CEEMDAN-VMD二次分解方法與BP神經(jīng)網(wǎng)絡(luò)結(jié)合的月徑流量混合預(yù)測(cè)模型。首先,利用CEEMDAN分解原始徑流量序列,利用樣本熵評(píng)估各子序列的復(fù)雜性;然后采用VMD二次分解復(fù)雜度最高的分量,所有子序列作為BP預(yù)測(cè)模型的輸入;最后線性疊加所有分量預(yù)測(cè)結(jié)果,得到最終預(yù)測(cè)結(jié)果。
CEEMDAN是在EMD和EEMD基礎(chǔ)上的改進(jìn)算法,克服了EMD的模態(tài)混淆問(wèn)題和EEMD的噪聲殘留問(wèn)題,分解過(guò)程完整,重構(gòu)誤差幾乎為零[17]。
原始信號(hào)為x(t),假設(shè)Ek(·)和IMFk分別為EMD和CEEMDAN產(chǎn)生的第k階模態(tài)分量;Vj(t)為第j次實(shí)驗(yàn)加入的白噪聲序列。
1)CEEMDAN利用EMD對(duì)加入白噪聲的原始信號(hào)進(jìn)行n次分解,得到的第1個(gè)模態(tài)分量為:
(1)
2)由CEEMDAN得到的第1個(gè)且唯一的余量序列為r1(t),并向第2個(gè)余量中加入噪聲分量ε1E1[vm(t)],第2個(gè)模態(tài)分量為IMF2(t):
r1(t)=x(t)-IMF1(t),
(2)
(3)
3)重復(fù)第2步,可得第i個(gè)余量及第i+1階模態(tài)分量,直到余量信號(hào)無(wú)法進(jìn)行分解時(shí),CEEMDAN終止,分解得出k階模態(tài)分量。其中R(t)為最終的殘差:
ri(t)=ri-1(t)-IMFi(t),
(4)
(5)
(6)
樣本熵(Sample Entropy,SE)是一種衡量序列復(fù)雜度的工具,其計(jì)算過(guò)程簡(jiǎn)單,抗干擾能力強(qiáng),已在多學(xué)科中被廣泛使用。本文采用樣本熵衡量CEEMDAN分解得到的各子序列的復(fù)雜度。樣本熵的值越大,序列復(fù)雜度越高,反之越小。原始信號(hào)為X=(x(1),x(2),…,x(n)),計(jì)算步驟如下:
1)將時(shí)間序列重構(gòu)到m維:
(7)
2)向量X(i)和X(j)之間的距離記為d[X(i),X(j)]:
d[X(i),X(j)]=max(|X(i+l)-X(j+l)|)。
(8)
式中:l=1、2、…、m-1;1≤i≠j≤n-m+1。
(9)
(10)
5)增加維數(shù)到m+1,并重復(fù)步驟1—3,得:
(11)
6)序列樣的SE為:
(12)
VMD作為一種新的自適應(yīng)數(shù)據(jù)分解方法,充分利用變分模式和非遞歸方法生成一定數(shù)量的IMF分量和一個(gè)殘差(Res)。在VMD中,假定每個(gè)模型都具有一定中心頻率的帶寬。通過(guò)確定約束變分模型的最佳方案即原先設(shè)定合理的收斂個(gè)數(shù)k,可以獲得復(fù)雜度較低的分解結(jié)果。VMD的總體框架主要包括問(wèn)題的構(gòu)造與求解,其分解的模式比常規(guī)方法的分解模式更穩(wěn)定。假設(shè)原始信號(hào)為f(t),約束變分問(wèn)題如下:
(13)
式中:mi為分解后的i個(gè)模態(tài)分量;i為模態(tài)分量個(gè)數(shù)(i=1、2、…、n);pi為模態(tài)函數(shù)對(duì)應(yīng)中心頻率集合;δ為迪克拉函數(shù);?為卷積運(yùn)算;j2=-1。具體計(jì)算過(guò)程可見(jiàn)文獻(xiàn)[18]。
BP神經(jīng)網(wǎng)絡(luò)是一種誤差逆向傳播的多層前饋神經(jīng)網(wǎng)絡(luò),模擬神經(jīng)元信號(hào)傳遞過(guò)程,輸入層用于接收信號(hào)模擬感覺(jué)神經(jīng)元,然后傳遞到隱含層最終從輸出層輸出,具有結(jié)構(gòu)簡(jiǎn)單、計(jì)算量小、分布式協(xié)作、信息共享等特點(diǎn)。BP模型是水文預(yù)測(cè)領(lǐng)域應(yīng)用最廣泛的人工神經(jīng)網(wǎng)絡(luò)模型。本研究采用Levenberg-Marquardt(LM)方法、Sigmoid函數(shù)和Purelin公式分別作為BP模型的訓(xùn)練函數(shù)、傳遞函數(shù)和輸出函數(shù)。BP模型的數(shù)學(xué)公式可以表示為
(14)
f(x)=tansig(x)=(ex-e-x)/(ex+e-x)。
(15)
針對(duì)徑流時(shí)間序列的非平穩(wěn)性、隨機(jī)性,本文提出了CEEMDAN-VMD-BP徑流預(yù)測(cè)模型。模型具體流程圖如圖1所示。
圖1 徑流預(yù)測(cè)流程圖
首先將原始月徑流量序列應(yīng)用CEEMDAN方法分解得到9個(gè)IMF分量和1個(gè)Res分量,計(jì)算各分量的樣本熵;然后采用VMD對(duì)具有最大樣本熵值的分量進(jìn)行二次分解進(jìn)而削弱徑流序列的非平穩(wěn)性;再利用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)各分量進(jìn)行預(yù)測(cè);最后對(duì)各分量的預(yù)測(cè)值線性疊加得到模型最終預(yù)測(cè)結(jié)果。
洪家渡水電站位于貴州西北部烏江干流上,是烏江水電基地11個(gè)梯級(jí)電站中唯一對(duì)水量具有多年調(diào)節(jié)能力的“龍頭”電站。壩址以上控制流域面積9 900 km2,多年平均徑流量48.9億m3,在烏江水量基地梯級(jí)調(diào)度中占據(jù)重要戰(zhàn)略地位。本文選取洪家渡水電站1951年1月—2005月12月實(shí)測(cè)月徑流量資料為研究對(duì)象,數(shù)據(jù)來(lái)源于文獻(xiàn)[19],其中1951年1月—2000年12月的數(shù)據(jù)作為率定數(shù)據(jù),以2001年1月—2005年12月的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),如圖2所示。
圖2 洪家渡水電站實(shí)測(cè)月徑流時(shí)間序列
洛寧縣位于河南省洛陽(yáng)市,洛河是其境內(nèi)最大的河流,發(fā)源于陜西省商洛市洛南縣龍?zhí)度?由河南省鞏義市神堤山注入黃河。河道全長(zhǎng)447 km,流域面積18 881 km2。長(zhǎng)水水文站位于洛寧縣中部,始建于1951年,位于洛河干流中上游,年過(guò)境水量12.53億m3。多年平均降水量656.9 mm,降水季節(jié)性波動(dòng)很大,年平均蒸發(fā)量1 597.5 mm。本文以長(zhǎng)水水文站1956年1月—2016年12月實(shí)測(cè)月徑流量資料為研究對(duì)象,其中,1956年1月—2001年12月的數(shù)據(jù)作為率定數(shù)據(jù),2002年1月—2016年12月的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),如圖3所示。
圖3 長(zhǎng)水站實(shí)測(cè)月徑流時(shí)間序列
采用CEEMDAN對(duì)實(shí)測(cè)月徑流量數(shù)據(jù)進(jìn)行分解,然后計(jì)算各分量的樣本熵值。設(shè)置噪聲標(biāo)準(zhǔn)差為0.2,最大迭代次數(shù)為5 000,洪家渡水電站和長(zhǎng)水站CEEMDAN分解結(jié)果見(jiàn)圖4和圖5。從圖4和圖5中可看出,從IMF1至Res序列波動(dòng)性逐漸增強(qiáng),然后計(jì)算各分量樣本熵值,條件閾值取序列標(biāo)準(zhǔn)差0.2倍,m為2,計(jì)算結(jié)果見(jiàn)表1和表2。由表1和表2可知,IMF1樣本熵值最大,表明其序列復(fù)雜度最高,因此采用VMD二次分解IMF1進(jìn)而降低其復(fù)雜性。經(jīng)過(guò)反復(fù)測(cè)試,設(shè)置分解個(gè)數(shù)k=8,其余參數(shù)為默認(rèn)值,VMD分解得到的各分量形式與CEEMDAN結(jié)果類(lèi)似。將得到的各分量進(jìn)行歸一化處理,并作為BP神經(jīng)網(wǎng)絡(luò)模型的輸入進(jìn)行徑流時(shí)間序列的預(yù)測(cè)。
圖4 洪家渡水電站CEEMDAN分解結(jié)果
圖5 長(zhǎng)水站CEEMDAN分解結(jié)果
表1 洪家渡水電站CEEMDAN各分量的樣本熵值
表2 長(zhǎng)水站CEEMDAN分解得各分量的樣本熵值
本文采用標(biāo)準(zhǔn)的三層前饋神經(jīng)網(wǎng)絡(luò)對(duì)月徑流量進(jìn)行預(yù)測(cè),輸入和輸出層節(jié)點(diǎn)的數(shù)量分別等于輸入變量的數(shù)量和1。Levenberg-Marquardt(LM)方法、Sigmoid函數(shù)和Purelin函數(shù)分別用作訓(xùn)練函數(shù),傳遞函數(shù)和輸出函數(shù)。通過(guò)試錯(cuò)法確定隱藏節(jié)點(diǎn)的最佳數(shù)量確定為8,訓(xùn)練次數(shù)為500。
為了準(zhǔn)確衡量各模型的預(yù)測(cè)能力,本文選取均方根誤差(RMSE)、平均絕對(duì)百分比誤差(MAPE)、納什系數(shù)(NSE)和皮爾遜相關(guān)系數(shù)(R)來(lái)評(píng)定各種預(yù)報(bào)模型的預(yù)測(cè)精度。RMSE對(duì)測(cè)量數(shù)據(jù)中的特大或特小誤差反映非常敏感,所以能更好地反映預(yù)報(bào)數(shù)據(jù)的精密度。MAPE是用來(lái)衡量預(yù)測(cè)誤差的無(wú)偏統(tǒng)計(jì)量,由于離差被絕對(duì)值化,避免了正負(fù)相抵消的情況,因此能更好地反映預(yù)測(cè)誤差的實(shí)際情況。NSE用來(lái)衡量預(yù)測(cè)值和實(shí)際值之間的吻合程度,取值區(qū)間為(-∞,1),值越接近于1吻合程度越高。R作為水平預(yù)測(cè)共線性程度的標(biāo)準(zhǔn),對(duì)高極值敏感程度高。RMSE、MAPE、NSE和R的計(jì)算公式如下:
(16)
(17)
(18)
(19)
利用CEEMDAN-VMD-BP方法建立了洪家渡水電站和長(zhǎng)水水文站的月徑流量預(yù)報(bào)模型,得到兩站各60個(gè)月徑流量預(yù)測(cè)值。為驗(yàn)證提出模型的有效性,將提出模型的預(yù)測(cè)結(jié)果與BP神經(jīng)網(wǎng)絡(luò)模型以及CEEMDAN-BP模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比。基于比較的目的,所有模型采用相同的預(yù)報(bào)輸入、率定期和驗(yàn)證期。實(shí)測(cè)徑流量數(shù)據(jù)作為各模型的輸入,表3和表4列出了兩站CEEMDAN分解各分量的預(yù)測(cè)誤差,表5和表6為兩站模型預(yù)測(cè)誤差,模型驗(yàn)證期預(yù)測(cè)效果如圖6—9所示。
表3 洪家渡水電站各分量預(yù)測(cè)誤差
表4 長(zhǎng)水站各分量預(yù)測(cè)誤差
表5 洪家渡水電站模型預(yù)測(cè)誤差
表6 長(zhǎng)水站各模型預(yù)測(cè)誤差
圖6 洪家渡水電站驗(yàn)證期各模型預(yù)測(cè)結(jié)果對(duì)比
圖7 長(zhǎng)水站驗(yàn)證期各模型預(yù)測(cè)結(jié)果對(duì)比
圖8 洪家渡水電站驗(yàn)證期各模型預(yù)測(cè)結(jié)果對(duì)比箱線圖
圖9 長(zhǎng)水站驗(yàn)證期各模型預(yù)測(cè)結(jié)果對(duì)比箱線圖
由表3可以看出,對(duì)于洪家渡水電站,IMF1分量預(yù)測(cè)效果最差,率定期和驗(yàn)證期的R分別為0.614和0.534,剩余分量率定期和驗(yàn)證期R的平均值分別為0.991和0.983。表4為長(zhǎng)水站CEEMDAN分解各分量預(yù)測(cè)誤差,驗(yàn)證了長(zhǎng)水站分量IMF1預(yù)測(cè)難度最大,率定期和驗(yàn)證期R分別為0.609和0.245,剩余各分量率定期和驗(yàn)證期R平均值達(dá)到了0.992和0.977。以上分析可得IMF1至Res擬合效果逐漸提高,即驗(yàn)證了模型擬合效果隨著樣本熵的增大而降低,故可以嘗試通過(guò)提高IMF1的預(yù)測(cè)精度來(lái)提高整個(gè)模型的預(yù)測(cè)精度。
由表5和表6可知,一次分解模型預(yù)測(cè)效果優(yōu)于單一BP模型,CEEMDAN-VMD-BP模型的指標(biāo)、評(píng)價(jià)、取值相比于一次分解CEEMDAN-BP模型均取得了更好的表現(xiàn)。對(duì)于洪家渡水電站,CEENDAN-BP相較于BP模型,在率定期,使R和NSE提升了26.03%和60.38%,使RMSE和MAPE降低了43.47%和27.71%;在驗(yàn)證期,CEENDAN-BP相較于后者,使R和NSE提升了19.48%和44.83%,使RMSE和MAPE降低了39.02%和26.88%。CEENDAN-VMD-BP相較于CEEMDAN-BP模型,在率定期,使R和NSE提升了9.78%和16.47%,使RMSE和MAPE降低了71.33%和65.82%;在驗(yàn)證期,CEENDAN-BP相較于后者,使R和NSE提升了9.78%和17.86%,使RMSE和MAPE降低了70.75%和63.31%。對(duì)于長(zhǎng)水水文站,CEENDAN-BP相較于BP模型,在率定期期,使R和NSE提升了79.22%和656.12%,使RMSE和MAPE降低了46.39%和10.25%;在驗(yàn)證期,CEENDAN-BP相較于后者,使R和NSE提升了133.13%和453.49%,使RMSE和MAPE降低了31.15%和42.05%。CEENDAN-VMD-BP相較于CEEMDAN-BP模型,在率定期,使R和NSE提升了13.55%和28.42%,使RMSE和MAPE降低了70.43%和51.49%;在驗(yàn)證期,CEENDAN-BP相較于后者,使R和NSE提升了28.42%和101.29%,使RMSE和MAPE降低了65.28%和50.66%。以上分析驗(yàn)證了通過(guò)分解方法預(yù)處理徑流量數(shù)據(jù)可以獲得線性更好的數(shù)據(jù),進(jìn)而降低了模型的預(yù)測(cè)難度;同時(shí)驗(yàn)證了CEEMDAN-VMD分解模型的高效性及其與BP模型的協(xié)同效應(yīng)弱化了單個(gè)模型的不足。
圖6至圖9展示了兩站驗(yàn)證期3種模型的預(yù)測(cè)效果。從折線圖(圖6和7)可以看出:由于兩站原始徑流量序列復(fù)雜性較高,單一BP模型的預(yù)測(cè)值與實(shí)測(cè)值的離散程度較高,經(jīng)過(guò)一次分解和二次分解后模型預(yù)測(cè)值的趨勢(shì)線與實(shí)際值的波動(dòng)趨勢(shì)大體一致;BP模型和CEEMDAN-BP模型對(duì)極值點(diǎn)的預(yù)報(bào)值總體小于實(shí)測(cè)值且存在滯后效應(yīng),同時(shí)對(duì)于本文兩個(gè)研究對(duì)象,單獨(dú)BP模型的徑流量預(yù)報(bào)數(shù)值存在負(fù)值;一次分解預(yù)報(bào)模型在數(shù)值及時(shí)間定位方面提升了徑流量峰值預(yù)報(bào)能力,但對(duì)于徑流較小月份的預(yù)報(bào)精度還有待提高;相較于BP模型和CEEMDAN-BP模型,CEEMDAN-VMD-BP模型能更精準(zhǔn)地捕獲原始徑流量數(shù)據(jù)的變化特征,大幅度提升了模型預(yù)報(bào)能力,擬合效果最優(yōu)。從洪家渡水電站和長(zhǎng)水水文站的箱線圖(圖8和圖9)可以看出,相較于BP模型和CEEMDAN-BP模型,CEEMDAN-VMD-BP模型預(yù)測(cè)的最大值、最小值和中位數(shù)與實(shí)測(cè)值的最大值、最小值和中位數(shù)最接近;BP模型和CEEMDAN-BP模型預(yù)測(cè)的異常值遠(yuǎn)小于實(shí)測(cè)數(shù)據(jù)的異常值,而CEEMDAN-BP-VMD模型預(yù)測(cè)的異常值均很接近實(shí)測(cè)數(shù)據(jù)的異常值。從箱線圖中可以看出,CEEMDAN-VMD-BP模型預(yù)測(cè)汛期峰值流量更具優(yōu)越性,更全面地捕獲了徑流量時(shí)間序列的變化特征。
從上面的研究結(jié)果分析可知:CEEMDAN-BP模型與BP模型相比,在月徑流時(shí)間序列預(yù)報(bào)方面能夠取得更好的擬合效果;本文提出的基于“二次分解”思路的CEEMDAN-VMD-BP模型的預(yù)測(cè)精度優(yōu)于CEEMDAN-BP模型,說(shuō)明CEEMDAN-VMD組合分解方法更適用于分解月徑流量時(shí)間序列,二次分解的思路是可行的。本文提出的CEEMDAN-VMD-BP模型在徑流預(yù)報(bào)中產(chǎn)生的協(xié)同效應(yīng)克服了單一預(yù)報(bào)模型的不足,因此采用二次分解技術(shù)預(yù)處理月徑流數(shù)據(jù)作為預(yù)測(cè)模型的輸入,可以最大限度降低序列復(fù)雜性,有助于提高模型的預(yù)測(cè)性能。
中長(zhǎng)期徑流預(yù)報(bào)在水資源的運(yùn)行和管理中起著至關(guān)重要的作用,高精度的預(yù)測(cè)結(jié)果有助于合理規(guī)劃流域用水需求。為了提升徑流預(yù)測(cè)精度,本文提出了一種用于長(zhǎng)期徑流預(yù)測(cè)的混合模型,該模型結(jié)合了二次分解技術(shù)和BP神經(jīng)網(wǎng)絡(luò)模型(CEEMDAN-VMD-BP)。首先,利用自適應(yīng)噪聲的完全集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)技術(shù)分解實(shí)測(cè)月徑流量時(shí)間序列并計(jì)算所有子序列的樣本熵;其次,將具有最大樣本熵的子序列用變分模態(tài)分解(VMD)進(jìn)行二次分解,進(jìn)而充分削弱子序列的復(fù)雜性;然后,使用BP模型訓(xùn)練和預(yù)測(cè)數(shù)據(jù);最后,將提出的模型的預(yù)測(cè)結(jié)果與BP模型、CEEMDAN-BP模型的結(jié)果進(jìn)行了比較。主要結(jié)論如下:
1)引入樣本熵計(jì)算CEEMDAN分解所得子序列的復(fù)雜性,利用VMD技術(shù)進(jìn)一步降低徑流量序列的復(fù)雜度,并使用BP神經(jīng)網(wǎng)絡(luò)模型充分挖掘徑流量數(shù)據(jù)中的規(guī)律和特征,提高了月徑流量預(yù)測(cè)精度。
2)建立了3個(gè)模型對(duì)洪家渡水電站和長(zhǎng)水水文站月徑流量進(jìn)行了預(yù)測(cè)。通過(guò)對(duì)比發(fā)現(xiàn),提出的CEEMDAN-VMD-BP組合模型預(yù)測(cè)性能顯著高于傳統(tǒng)單一預(yù)測(cè)模型和一次分解組合模型,表明數(shù)據(jù)預(yù)處理技術(shù)大幅度降低了月徑流量序列的復(fù)雜度,能有效提高月徑流量的預(yù)報(bào)精度。
3)CEEMFAN和VMD作為兩種高效的信號(hào)處理方法,可以相互補(bǔ)充。通過(guò)樣本熵篩選后,將原始信號(hào)進(jìn)行再次分解,可以更準(zhǔn)確地捕獲徑流序列的趨勢(shì)、周期等本質(zhì)特征,降低了模型預(yù)測(cè)難度,彌補(bǔ)了一次分解的局限性。
本研究提出的組合預(yù)測(cè)方法結(jié)合了數(shù)據(jù)預(yù)處理技術(shù)、樣本熵、預(yù)測(cè)模型和誤差分析,建立了徑流預(yù)報(bào)模型,能取得更準(zhǔn)確的預(yù)測(cè)精度,是一種高效、實(shí)用的預(yù)測(cè)方法,可為流域水資源管理決策提供有價(jià)值的支撐。