邵月紅,林炳章,葉金印,劉永和
(1.南京信息工程大學(xué)應(yīng)用水文氣象研究院,江蘇南京210044;2.淮河流域氣象中心,安徽蚌埠233040;3.河南理工大學(xué)資源環(huán)境學(xué)院,河南焦作454000)
降雨徑流預(yù)報是水文學(xué)研究的重要內(nèi)容,在水資源管理中起著非常重要的作用。但由于降雨徑流的形成機(jī)理及影響因素很多,對其進(jìn)行模擬預(yù)測一直是一個比較困難的問題。流域水文模型能夠?qū)λ膭討B(tài)和流量過程做出較準(zhǔn)確的預(yù)報,但是水文模型的模擬需要精確了解流域內(nèi)部的水文結(jié)構(gòu)、較多的輸入變量和參數(shù)及時空地域等客觀條件。因此,尋求一種適宜的,簡單快速的模型是提高降雨徑流預(yù)報的有效途徑。隨著計算機(jī)的快速發(fā)展,人工神經(jīng)網(wǎng)絡(luò)模型(artificial neural network,ANN)以其獨(dú)特的非線性、非凸性、自適應(yīng)性和處理各種信息的能力在許多復(fù)雜的非線性領(lǐng)域中得到非常成功的應(yīng)用(Ju et al.,2007)。降雨徑流的過程是一個高度非線性、時變、空間分布不均勻、動態(tài)不確定的過程,因此ANN在水文學(xué)領(lǐng)域得到的廣泛而成功的應(yīng)用(Kin et al.,2001;Carcano et al.,2008)。
目前,ANN在水文中的應(yīng)用主要采用靜態(tài)的BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)進(jìn)行系統(tǒng)模擬和預(yù)測,但是這種結(jié)構(gòu)隨著系統(tǒng)階次的增加,使網(wǎng)絡(luò)學(xué)習(xí)的收斂速度減慢,造成網(wǎng)絡(luò)輸入結(jié)點(diǎn)過多、訓(xùn)練困難等弊病(Tang,2005;Yu et al.,2008)。將靜態(tài)的網(wǎng)絡(luò)用于動態(tài)的、高度非線性的水文模擬中使得預(yù)測精度較差。動態(tài)回歸神經(jīng)網(wǎng)絡(luò)提供了一種極具潛力的選擇,它能夠更生動、更直接地反映系統(tǒng)的動態(tài)特性,代表了神經(jīng)網(wǎng)絡(luò)建模、辨識與控制的發(fā)展方向。Elman神經(jīng)網(wǎng)絡(luò)(Elman neural network,ENN)是一種典型的動態(tài)回歸神經(jīng)網(wǎng)絡(luò),它在前饋網(wǎng)絡(luò)的基礎(chǔ)上,通過存儲內(nèi)部狀態(tài)使其具備映射動態(tài)特征的功能,從而使得系統(tǒng)具有適應(yīng)時變特性的能力(Srinivasn et al.,1994;Tommy and Chow,1998)。利用ENN可以對徑流進(jìn)行較好的模擬和預(yù)報。因此,本文以臨沂子流域作為研究對象,采用ENN對降雨—徑流過程進(jìn)行模擬和預(yù)報,并以陸面水文過程模型TOPX為比較,對其結(jié)果進(jìn)行評估。
研究區(qū)域?yàn)橐抒鸷恿饔蛏嫌蔚呐R沂子流域(117.35 ~118.74°E,34.98 ~36.30°N),流域面積10 152 km2,典型的暖溫帶大陸性季風(fēng)氣候,冬季寒冷多風(fēng),降水稀少,夏季炎熱多雨,春秋兩季氣候溫和。地形起伏較大,海拔跨度從57 m到1 125 m。據(jù)多年資料統(tǒng)計,流域內(nèi)多年平均氣溫11.8~13.3℃,蒸發(fā)量839 mm,降水量830 mm,年降水量主要集中在夏季,暴雨多而強(qiáng)度大,是山東省的暴雨中心之一,年際變化也較大,流域出口位于臨沂水文站(圖1)。本研究收集了臨沂流域2001—2008年的6個氣象站點(diǎn)的日降雨量和蒸散量及臨沂出口站的日徑流量數(shù)據(jù),通過ENN來模擬日徑流量。其中,2001—2005年的數(shù)據(jù)作為訓(xùn)練樣本,2006—2008年的數(shù)據(jù)作為檢驗(yàn)樣本來驗(yàn)證模型的模擬能力和可擴(kuò)展性能。
圖1 臨沂流域 DEM、數(shù)字河網(wǎng)及站點(diǎn)分布Fig.1 Distributions of digital elevation model,the river net and meteorological stations over the Linyi sub-catchment
ENN是Elman于1990年提出的一種局部遞歸的神經(jīng)網(wǎng)絡(luò)(Elman,1990),其基本思想是利用最小二乘法,采用梯度搜索技術(shù)實(shí)現(xiàn)網(wǎng)絡(luò)的實(shí)際輸出與期望輸出的均方差最小化(Shi et al.,2004)。主要結(jié)構(gòu)包括4層:輸入層、隱含層、承接層和輸出層。輸入層單元起信號傳輸作用,輸出層單元起線性加權(quán)作用,隱含層單元的傳遞函數(shù)可采用線性或非線性函數(shù),承接層用來記憶隱含層單元前一時刻的輸出值,可以認(rèn)為是一個一步延時算子。因此,ENN最大的優(yōu)點(diǎn)是其有“記憶”能力,隱含層的輸出通過承接層的延遲與存儲,自聯(lián)到隱含層的輸入,使其對歷史狀態(tài)的數(shù)據(jù)具有敏感性,內(nèi)部反饋網(wǎng)絡(luò)的加入增加了網(wǎng)絡(luò)本身處理動態(tài)信息的能力,從而達(dá)到了動態(tài)建模的目的,使系統(tǒng)能直接反映動態(tài)過程系統(tǒng)的特性(圖2)。
圖2中,I(t)=[Q(t-1),…,Q(t-3),P(t-1),…,P(t-5),E(t-1),…,E(t-5)]為輸入向量,O(t)=[Q(t)]為輸出向量,X(t)=[x1(t),x2(t),…,xL(t)]為隱含層的輸出向量,C(t)=[c1(t),c2(t),…,cL(t)]為承接層輸出向量,Wa、Wb、Wc分別為輸入層到隱含層、承接層到隱含層和隱含層到輸出層的權(quán)重矩陣。其學(xué)習(xí)過程如下:
圖2 降雨徑流模擬的Elman神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 The Elman neural network architecture of rainfall-runoff simulation
其中:Dt為目標(biāo)輸出;Ot為神經(jīng)網(wǎng)絡(luò)的實(shí)際輸出。
陸面過程水文模型TOPX是基于TOPMODEL的地形指數(shù)概念和新安江模型的水量平衡思想,構(gòu)建一個具有地形指數(shù)尺度轉(zhuǎn)換機(jī)制的、簡單高效的、能較好描述二維水文過程的水文模型(雍斌,2008)。模型基本理論基礎(chǔ)主要包括:產(chǎn)流原理、土壤水動態(tài)變化過程以及匯流原理。模型詳細(xì)的理論基礎(chǔ)、結(jié)構(gòu)及參數(shù)物理意義等介紹見雍斌(2008)、邵月紅(2010)。
TOPX采用的是改進(jìn)型的SIMTOP產(chǎn)流方案,其地表產(chǎn)流量Rs和地下產(chǎn)流量 Rsb的計算公式如下:
其中:Fmax為計算格網(wǎng)的最大飽和面積百分比;Rsb,max是計算格網(wǎng)平均土壤缺水深為0時的最大地
其中隱含層的傳遞函數(shù)f(·)為某種非線性函數(shù),本文采用“tansig”函數(shù)。輸出層的傳遞函數(shù)g(·)采用S型對數(shù)函數(shù)“l(fā)ogsig”函數(shù)。
ENN也采用BP算法進(jìn)行權(quán)值修正,使修改后的最終輸出接近希望輸出。學(xué)習(xí)指標(biāo)函數(shù)采用誤差平方和函數(shù)下徑流量;Qwat為凈降水;z▽為計算格網(wǎng)的土壤平均缺水深;f是土壤衰減系數(shù);Cs為一系數(shù),通過地形指數(shù)均值λm來獲得。改進(jìn)型SIMTOP產(chǎn)流方案,對地形信息的刻畫更準(zhǔn)確,推導(dǎo)上更嚴(yán)謹(jǐn),理論上更合理,所獲取的中間變量參數(shù)的時空分布更真實(shí)。在TOPX的地表和地下徑流參數(shù)化方案中有一個重要的動態(tài)變量,即計算網(wǎng)格的平均土壤缺水深,它與計算網(wǎng)格的土壤濕度動態(tài)變化是密切相關(guān)的。TOPX的土壤濕度動態(tài)變化描述部分借鑒了新安江三層土壤蒸散發(fā)計算模型(趙仁俊,1984)。通過土壤濕度和蒸散發(fā)的迭代計算,能獲得不同計算格網(wǎng)單元上的各層土壤含水量的時間序列動態(tài)變化過程?;谶@個動態(tài)土壤濕度,就容易推求TOPX產(chǎn)流方案中的動態(tài)平均土壤缺水深。TOPX模型的流域匯流分為三個部分:地面徑流在各個計算格網(wǎng)內(nèi)的坡面匯流、計算格網(wǎng)間的馬斯京根河道匯流、地下徑流匯流。坡面匯流采用經(jīng)驗(yàn)單位線法,地下徑流采用簡單實(shí)用的線性水庫退水方程來模擬,河道匯流采用馬斯京根演算法。
ENN建立的過程主要包括:數(shù)據(jù)的前處理、模型訓(xùn)練樣本的選擇、輸入模式的確定、選擇合適的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、參數(shù)估計和模型檢驗(yàn)等。
1)數(shù)據(jù)前處理。數(shù)據(jù)前處理是ENN建模的前期重要工作。主要包括:無效數(shù)據(jù)的剔除、缺失數(shù)據(jù)的補(bǔ)充、數(shù)據(jù)的歸一化處理和訓(xùn)練樣本大小的確定。由于降雨、蒸發(fā)和徑流數(shù)據(jù)的變幅相差極大,在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,這樣的輸入輸出不利于模型的收斂,同時考慮到預(yù)測階段洪峰可能超過歷史洪峰,采用下式對建模數(shù)據(jù)進(jìn)行歸一化處理,規(guī)范范圍為[0.1,0.9]。
其中:ˉxi為歸一化后的數(shù)據(jù);xi為實(shí)測值序列;xmax為實(shí)測最大值;xmin為實(shí)測最小值。利用(7)式分別將日降雨量、日蒸散量和日徑流量數(shù)據(jù)進(jìn)行歸一化處理,處理后的數(shù)據(jù)分成兩組,2001—2005年的一組數(shù)據(jù)作為訓(xùn)練樣本,2006—2008年的另一組數(shù)據(jù)作為檢驗(yàn)樣本。
2)輸入層模式的確定。輸入層模式的確定是決定ENN訓(xùn)練的精度及成功的關(guān)鍵因素。輸入分量過多,容易形成過適應(yīng);分量過少,難以捕捉復(fù)雜的非線性關(guān)系。由于徑流形成的時滯性,某天的徑流不僅受到當(dāng)天外部環(huán)境和內(nèi)部因素的影響,而且還要受到其前一天、前兩天,甚至前許多天等諸多因素的影響,在眾多因素中,徑流主要與前期凈降雨及流量有直接的關(guān)系。綜合考慮各方面的影響,本文的輸入模式分量為徑流前5 d的日降雨量和蒸散量、前3 d的徑流量,輸入層節(jié)點(diǎn)數(shù)為13個。
3)隱含層及其節(jié)點(diǎn)的確定。正確選擇隱含層節(jié)點(diǎn)數(shù)是網(wǎng)絡(luò)成功的關(guān)鍵。實(shí)踐證明,隱含層節(jié)點(diǎn)數(shù)太少時,易陷入局部最小,容錯性較差;節(jié)點(diǎn)太多時又會使得訓(xùn)練時間過長。本文的訓(xùn)練樣本較多為1 826個,輸入層節(jié)點(diǎn)數(shù)為13個,輸出層節(jié)點(diǎn)數(shù)為1個,以試錯法按照模型既收斂同時誤差又較小的原則來確定隱含層的最佳節(jié)點(diǎn)數(shù),最后選擇[13,32,1]網(wǎng)絡(luò)結(jié)構(gòu)來研究日徑流量的預(yù)報。
4)學(xué)習(xí)效率和訓(xùn)練次數(shù)的確定。通過試錯法,初始學(xué)習(xí)速率定為0.05,根據(jù)流域的面積和實(shí)際情況,計算目標(biāo)誤差采用1.5×10-4,利用上述訓(xùn)練樣本對ENN進(jìn)行訓(xùn)練,訓(xùn)練5 000次后,學(xué)習(xí)誤差達(dá)到1.1×10-4。
模型選擇半濕潤半干旱區(qū)的沂沭河流域的臨沂子流域作為本文的研究區(qū)。輸入數(shù)據(jù)包括:地形數(shù)據(jù)、降水?dāng)?shù)據(jù)、蒸發(fā)數(shù)據(jù)、土壤和植被覆蓋數(shù)據(jù),根據(jù)臨沂流域2001—2005年水文、氣象數(shù)據(jù),率定出模型運(yùn)行參數(shù)。率定參數(shù)主要有三類:一是產(chǎn)流計算參數(shù),包括衰減系數(shù)f(169 mm),最大地下徑流Gmax(55 mm),壤中流出流系數(shù)為0.01,蓄水容量曲線系數(shù)B(0.45);二是土壤水計算參數(shù),包括蒸發(fā)系數(shù)K(0.95),流域單元平均蓄水容量(160 mm),流域單元上層最大含水量(30 mm),流域單元中層最大含水量(90 mm),植被根系影響系數(shù)C(0.12);三是匯流計算參數(shù),包括地下徑流消退系數(shù)(0.988),單位線初值(0、12、26、20、11、5、3)。
在檢驗(yàn)?zāi)P湍M的徑流精度高低時,通常采用Nash and Sutcliffe(1970)提出的模型效率系數(shù)(確定性系數(shù))來對模擬的徑流量進(jìn)行分析和評價。為了更好的檢驗(yàn)ENN估測徑流的精度,同時采用TOPX進(jìn)行對比分析,本文通過確定性系數(shù)DC、相關(guān)系數(shù)R、平均相對誤差Wabs和平均相對均方根差RMSE4個統(tǒng)計指數(shù)來定量評估,其表達(dá)式見式(8)—(11)。其中,2001—2005年的日降雨—徑流量作為訓(xùn)練樣本,2006—2008年的日降雨—徑流量作為檢驗(yàn)樣本。
其中:n表示總樣本數(shù);i表示序數(shù);Robs(i)、Rest(i)、ˉRobs(i)和ˉRest(i)分別為實(shí)測徑流量(m3/s)、神經(jīng)網(wǎng)絡(luò)模擬的徑流量(m3/s)、實(shí)測平均徑流量(m3/s)和模擬的平均徑流量(m3/s)。
表1為ENN模擬的日徑流量精度綜合評價。DC和R反映了模型的模擬效率及模擬值與觀測值之間的相關(guān)性;Wabs和RMSE反映估測值相對于觀測值的偏離程度,它能夠客觀地反映測量結(jié)果的準(zhǔn)確性。由表1可知,四個統(tǒng)計指數(shù)都表明兩種模型都能對降雨—徑流進(jìn)行成功模擬,ENN的模擬精度要略高于TOPX,這表明ENN能夠從時空變率復(fù)雜的降雨—徑流序列中找出一定的演變規(guī)律,具有運(yùn)算效率快、簡單高效且精度較高等特點(diǎn),對流域的水文動態(tài)特性進(jìn)行成功模擬,為降雨徑流模擬提供了一種有效可靠的方法。TOPX的精度略低是由于該模型的產(chǎn)流機(jī)制為蓄滿產(chǎn)流,適用于濕潤區(qū)域,因此對本文的半濕潤半干旱研究區(qū)模擬精度稍差。在率定期的樣本差異較大,有干旱的2002年、降雨豐沛的2005年和降水均勻的2001、2003、2004年。差異較大的樣本混在一起同等對待使得率定期的模型效率低于樣本均勻的驗(yàn)證期。
表1 Elman動態(tài)神經(jīng)網(wǎng)絡(luò)模擬性能評估Table 1 Evaluation of simulation results from Elman neural network and TOPX model
圖3和圖4是訓(xùn)練樣本和檢驗(yàn)樣本日徑流量的模擬結(jié)果,其中的小圖分別為訓(xùn)練樣本和檢驗(yàn)樣本中最大徑流年豐水期的徑流過程線模擬。由圖可見,無論是訓(xùn)練樣本還是檢驗(yàn)樣本,ENN和TOPX模擬的日徑流量與觀測的徑流量(Qobs)在整個過程都吻合的非常好,整體趨勢一致性很強(qiáng),說明模型都能夠?qū)θ諒搅髁窟M(jìn)行很好的模擬,能很好地捕捉洪峰出現(xiàn)的時間,只是在洪峰流量上略有一些差異。從過程線還可知,ENN的模擬精度要稍高于TOPX。在2001—2005年的最大訓(xùn)練樣本中,不同年份的洪水特征差異較大,有降雨較少的枯水年(2002年),降雨豐沛的且集中的徑流年(2005年),還有降水相對均勻的徑流量在1 500 m3/s左右的2001、2003和2004年,總體來說,訓(xùn)練樣本較多,包括的洪水場次類型較多,模擬的徑流精度較高。當(dāng)訓(xùn)練好的樣本模型用于2006—2008年的檢驗(yàn)樣本時,模型的模擬效果較好。綜上可知:ENN模型能夠較準(zhǔn)確地反映流域復(fù)雜的非線性產(chǎn)匯流規(guī)律和動力過程,能夠有效地模擬該流域的水文與水力特征,是一種較好地模擬流域水文動態(tài)過程的神經(jīng)網(wǎng)絡(luò)模型,具有良好的發(fā)展前景。作為一種有效可靠的方法,用它來進(jìn)行降雨—徑流預(yù)報是可行的。
圖3 臨沂流域訓(xùn)練樣本日徑流量的模擬結(jié)果(2001—2005年)Fig.3 The simulated results for daily rainfall-runoff from configuration samples over the Linyi subcatchment(2001—2005)
對上述ENN和TOPX模型模擬的徑流量的結(jié)果進(jìn)行比較分析,得到以下結(jié)論:
1)DC、R、Wabs和 RMSE這 4 個統(tǒng)計指數(shù)結(jié)果表明,ENN能對降雨—徑流進(jìn)行成功模擬,可移植性強(qiáng),ENN的模擬精度要略高于TOPX;流域的徑流過程線表明,ENN模擬的日徑流量與觀測值在整個過程都吻合得非常好,能較好地捕捉洪峰流量和峰現(xiàn)時間,即模型對日徑流量模擬精度較高。
圖4 臨沂流域檢驗(yàn)樣本日徑流量的模擬結(jié)果(2006—2008年)Fig.4 The simulated results for daily rainfall-runoff from evaluation samples over the Linyi subcatchment(2006—2008)
2)ENN能夠從時空變率復(fù)雜的降雨—徑流序列中找出一定的演變規(guī)律,對流域的水文動態(tài)特性進(jìn)行成功模擬,為降雨徑流模擬提供了一種有效可靠的方法。本研究由于收集的資料有限,難免帶來一些誤差,為了更好地說明該方法的優(yōu)越性,還需要更長時間的資料、更多的區(qū)域和水文模型來驗(yàn)證,以及更深層次的研究和分析。
邵月紅.2010.多普勒雷達(dá)降水反演及其與改進(jìn)的區(qū)域氣候模式RIEMS的同化研究[D].南京:南京大學(xué).
雍斌.2008.陸面水文過程模型TOPX構(gòu)建及其與區(qū)域氣候模式RIEMS的耦合應(yīng)用[D].南京:南京大學(xué).
趙人?。?984.流域水文模型——新安江模型與陜北模型[M].北京:水利電力出版社.
Carcano E C,Bartolini P,Muselli M,et al.2008.Jordan recurrent neural network versus IHACRES in modeling daily stream flows[J].J Hydro,362(3/4):291-307.
Elman J L.1990.Finding structure in time[J].Cogn Sci,14(2):179-211.
Ju Q,Yu Z B,Hao Z C,et al.2007.Hydrologic simulations with artificial neural networks[C]//Burgess A.Third International Conference on Natural Computation.Los Alamitos:IEEE Computer Society Publications,2:22-27.
Kin C L,Ball J E,Sharma A.2001.An application of artificial neural networks for rainfall forecasting[J].Math Comput Model,33(6):683-693.
Nash J E,Sutcliffe J V.1970.River flow forecasting through conceptual model:A discussion of principles[J].J Hydro,10(3):282-290.
Shi X H,Liang Y C,Lee H P.2004.Improved Elman networks and applications for controlling ultrasonic motors[J].Appl Artif Intel,18(7):603-629.
Srinivasn B,Prasad U R,Rao N J.1994.Back propagation through adjoins for the identification of nonlinear dynamic systems using recurrent neural models[J].IEEE Transactions on Neural Networks,5(2):213-227.
Tang W M.2005.The study of the optimal structure of BP neural network[J].Systems Engineering Theory and Practice,25(10):95-100.
Tommy W S,Chow Y F.1998.A recurrent neural network based real time learning control strategy applying to nonlinear system with unknown dynamics[J].IEEE Transactions on Neural Networks,45(1):151-161.
Yu S W,Zhu K J,Diao F Q.2008.A dynamic all parameters adaptive BP neural networks model and its application on oil reservoir prediction[J].Appl Math Comput,195(1):66-75.