林果果
(重慶市水利電力建筑勘測設(shè)計(jì)研究院有限公司,重慶 400020)
我國是重要的農(nóng)業(yè)生產(chǎn)大國,每年絕對部分用水量均為農(nóng)業(yè)用水。由于近年來干旱現(xiàn)象嚴(yán)重,同時(shí)我國水資源較匱乏,人均水資源占有量不及世界平均水平的25%,用水量的缺乏和嚴(yán)重的干旱在一定程度上限制了我國農(nóng)業(yè)產(chǎn)值和經(jīng)濟(jì)的發(fā)展[1-6]。在有限的水資源前提下,發(fā)展節(jié)水農(nóng)業(yè)是緩解國內(nèi)農(nóng)業(yè)用水供需壓力的重要途徑[7]。為進(jìn)一步精確制定作物灌溉制度,獲得作物需水量數(shù)據(jù)十分關(guān)鍵。潛在蒸散量(ET0)是估算作物需水量的重要參數(shù)之一,其與作物系數(shù)的乘積即為作物需水量,且該方法已被證明精度較高[8-9]。FAO-56分冊規(guī)定的Penman-Monteith模型為計(jì)算的標(biāo)準(zhǔn)模型,但該模型考慮因素較多,計(jì)算過程復(fù)雜,限制了該模型的應(yīng)用[10-11]。因此,在合適的區(qū)域找尋合適的ET0簡化計(jì)算方法,對當(dāng)?shù)毓喔葲Q策的制定有著十分重要的意義。
目前,針對ET0簡化計(jì)算方法的研究主要集中在經(jīng)驗(yàn)?zāi)P秃蜋C(jī)器學(xué)習(xí)模型兩大類[12-13]。其中機(jī)器學(xué)習(xí)模型由于其模型操作方便,且精度較高,被廣泛應(yīng)用于ET0模擬中。毛亞萍和房世峰[14]在新疆區(qū)域基于SVM、RF、GBDT和ELM 4種機(jī)器學(xué)習(xí)模型構(gòu)建了當(dāng)?shù)谽T0預(yù)測模型,指出SVM和GBDT這兩種算法在日尺度和月尺度都有較好的適用性;張薇等[15]基于ELM模型和GRNN模型兩種機(jī)器學(xué)習(xí)模型計(jì)算了河北省不同站點(diǎn)的ET0,并與H-S模型計(jì)算精度進(jìn)行了對比,指出機(jī)器學(xué)習(xí)模型精度顯著高于經(jīng)驗(yàn)?zāi)P停稽S滟淳等[16]基于不同機(jī)器學(xué)習(xí)模型在川中丘陵區(qū)構(gòu)建了ET0預(yù)測模型,M5回歸樹模型計(jì)算精度最高。
單一的機(jī)器學(xué)習(xí)模型精度極易受到模型本身結(jié)構(gòu)的影響,造成極值及局部最優(yōu)解問題,限制模型精度[17]。為避免這一問題的出現(xiàn),本文基于思維計(jì)劃算法優(yōu)化極限學(xué)習(xí)機(jī)模型(MEA-ELM),以重慶地區(qū)為研究區(qū)域,分別計(jì)算3種不同激活函數(shù)下的區(qū)域ET0數(shù)據(jù),構(gòu)建重慶地區(qū)ET0最優(yōu)估算模型。
重慶(E105°17′-E110°11′,N28°10′-N32°13′)是我國重要的直轄市之一,其地處長江上游,物產(chǎn)豐富,是我國重要的農(nóng)業(yè)生產(chǎn)基地。本文選擇豐都、奉節(jié)、沙坪壩、萬州、酉陽共5個(gè)站點(diǎn)1980-2016年的逐日氣象數(shù)據(jù)及計(jì)算區(qū)域ET0。本文數(shù)據(jù)均來自國家氣象中心,氣象數(shù)據(jù)控制良好。
2.2.1ET0計(jì)算標(biāo)準(zhǔn)模型
FAO-56分冊規(guī)定的Penman-Monteith模型為計(jì)算ET0的標(biāo)準(zhǔn)模型,該模型由輻射項(xiàng)和空氣動(dòng)力學(xué)項(xiàng)兩部分組成,具體公式形式可見文獻(xiàn)[10,18]。
2.2.2 極限學(xué)習(xí)機(jī)模型(ELM)
極限學(xué)習(xí)機(jī)模型(ELM)主要由輸入層、隱含層和輸出層3部分組成,設(shè)隱含層神經(jīng)元的激活函數(shù)為g(ω,X,b),則ELM模型輸出層表達(dá)式為:
(1)
式中:βj為隱含層到輸出層的連接值;ωij為輸入層到隱含層的連接值;Xi為輸入層變量值;bj為第j個(gè)隱含層的閾值。
ELM模型激活函數(shù)可分為3種:Sine 函數(shù)(ELMS)、Radbas函數(shù)(ELMR)和Hardlim(ELMH)函數(shù),3種函數(shù)具體公式如下:
Sine函數(shù):
g(ωij,Xi,bj)=g(ωijXi+bj)=sin(ωijXi+bj)
Radbas函數(shù):
Hardlim函數(shù):
2.2.3 思維進(jìn)化算法優(yōu)化ELM模型構(gòu)建(MEA-ELM)
MEA算法主要包括7個(gè)步驟:網(wǎng)絡(luò)初始化、隱含層輸出計(jì)算、輸入層輸出計(jì)算、誤差計(jì)算、權(quán)值更新、閾值更新和判斷迭代結(jié)果。利用MEA 算法對ELM初始權(quán)值和閾值進(jìn)行優(yōu)化,可減少ELM迭代次數(shù),利用輸入、輸出節(jié)點(diǎn)數(shù)之和與隱含層節(jié)點(diǎn)數(shù)的乘積,形成每個(gè)樣本個(gè)體的得分函數(shù),基于MEA算法進(jìn)行迭代,找出最優(yōu)個(gè)體得分,最終得出ELM模型預(yù)測結(jié)果。具體步驟可見文獻(xiàn)[17]。
2.2.4 模型訓(xùn)練與驗(yàn)證
將形成的MEA-ELM算法對應(yīng)不同的ELM激活函數(shù),形成3種MEA-ELM算法,分別為MEA-ELMsin算法、MEA-ELMRad算法和MEA-ELMHard算法。基于站點(diǎn)1980-2016年的氣象資料,以最高溫度(Tmax)、最低溫度(Tmin)、日照時(shí)數(shù)(Tsun)、風(fēng)速(U2)和相對濕度(RH)的不同組合為輸入?yún)?shù),形成不同計(jì)算模型,具體形式可見表1。
表1 模型參數(shù)輸入表
2.2.5 模型精度指標(biāo)構(gòu)建
分別以均方根誤差(RMSE)、平均相對誤差(MRE)、納什系數(shù)(NSE)和決定系數(shù)(R2)為模型誤差評價(jià)體系[19-21],具體公式如下:
(2)
(3)
(4)
(5)
由于評估指標(biāo)過多,單個(gè)評估指標(biāo)很難比較不同的模型。 因此,引入GPI指數(shù)來全面評估模型仿真結(jié)果,公式如下:
(6)
式中:αj為常數(shù),MRE和RMSE取1,NSE和R2取-1;gj為不同指標(biāo)的縮放值的中位數(shù);yij為不同指標(biāo)的尺度值。
圖1為重慶地區(qū)不同站點(diǎn)1980-2016年ET0年際變化趨勢分析。由圖1中可以看出,不同站點(diǎn)多年ET0呈現(xiàn)增長趨勢。其中,酉陽站點(diǎn)變化幅度最高,不同站點(diǎn)ET0在1980-2003年呈下降趨勢;在2003-2016年呈升高趨勢,由于該時(shí)段ET0上升幅度較大,導(dǎo)致ET0多年平均呈現(xiàn)上升趨勢。豐都、奉節(jié)、沙坪壩、萬州、酉陽5個(gè)站點(diǎn)ET0多年平均變化傾向率分別為0.120、0.123、0.067、0.089和0.236(mm·d-1)/10a。
圖1 ET0年際變化趨勢及累積距平分析
圖2為重慶地區(qū)不同站點(diǎn)ET0年內(nèi)變化趨勢分析。由圖2可以看出,不同站點(diǎn)ET0年內(nèi)變化趨勢均呈開口向下的二次拋物線型式。春冬兩季ET0數(shù)值相對較小,主要集中在3-10月份的主要作物生長期,1-7月份,各站ET0基本呈線性增長的趨勢,在8-12月份呈顯著降低趨勢;各站點(diǎn)累積距平曲線變化趨勢基本一致,呈“減少-增加-減少”趨勢,3 個(gè)時(shí)段分別為 1-3月份、3-9月份和9-12月份。
圖2 ET0年內(nèi)變化趨勢及累積距平分析
圖3為不同站點(diǎn)不同時(shí)期ET0空間變化趨勢。由圖3中可以看出,不同時(shí)期ET0空間分布趨勢基本一致,均呈現(xiàn)由西向東逐漸升高的趨勢。在春季,奉節(jié)站點(diǎn)附近數(shù)值最高,酉陽站點(diǎn)附近次之,其值分別為3.31和2.73 mm/d;夏季變化趨勢基本一致,在奉節(jié)站點(diǎn)附近最高,達(dá)到4.39 mm/d;在秋冬兩季,ET0分別在奉節(jié)站點(diǎn)和酉陽站點(diǎn)達(dá)到最高值。全年和主要作物生長期變化趨勢基本一致,均表現(xiàn)為奉節(jié)站點(diǎn)附近最高,酉陽站附近次之。
圖3 ET0不同時(shí)間段空間變化趨勢分析
圖4為不同模型ET0模擬精度。由圖4可以看出,不同模型輸入不同參數(shù)時(shí)的精度有所差異。輸入氣象參數(shù)組合1時(shí)的模型精度普遍最高,其中sin激活函數(shù)下的模型精度最高,不同精度指標(biāo)NSE為0.999、RMSE為0.035 mm/d、MRE為1.13%、R2為0.999,MEA-ELMRad1精度次之,MEA-ELMHard1精度最低;輸入?yún)?shù)組合2時(shí),各模型精度有所降低,其中MEA-ELMsin2模型仍保持著較高的精度,不同精度指標(biāo)分別為NSE為0.990、RMSE為0.14 mm/d、MRE為3.0%、R2為0.990,其余2種模型精度較差;輸入?yún)?shù)組合3的模型精度要高于輸入?yún)?shù)組合4時(shí)的模型,而僅輸入溫度資料的組合5下的3種模型精度最低。這表明,日照時(shí)數(shù)的輸入可大幅度提高模型預(yù)測精度,其對ET0變化的影響程度高于風(fēng)速和相對濕度。
通過計(jì)算不同站點(diǎn)不同模型ET0精度指標(biāo)的GPI指數(shù),可綜合比較不同模型精度,結(jié)果見圖5。
圖4 不同模型ET0模擬精度對比
圖5 不同站點(diǎn)不同模型GPI指數(shù)對比
由圖5中可以看出,在不同站點(diǎn)不同模型的模擬精度基本一致,相同輸入組合下,3種激活函數(shù)對應(yīng)的MEA-ELM模型精度表現(xiàn)為sin函數(shù)>Radbas函數(shù)>Hardlim函數(shù);而在相同激活函數(shù)下,不同輸入組合的模型精度表現(xiàn)為組合1>組合2>組合3>組合4>組合5,這表明當(dāng)氣象數(shù)據(jù)有限時(shí),已知溫度和日照時(shí)數(shù)數(shù)據(jù),即可基于MEA-ELM模型精確模擬ET0。
為進(jìn)一步驗(yàn)證精度,本文計(jì)算了該模型的可移植性。隨機(jī)選擇其中1個(gè)站點(diǎn)的數(shù)據(jù)作為模擬站點(diǎn),其余4個(gè)站點(diǎn)自動(dòng)作為訓(xùn)練站點(diǎn),最終形成20組訓(xùn)練數(shù)據(jù),并計(jì)算了20組訓(xùn)練數(shù)據(jù)的精度指標(biāo),結(jié)果見表2。由表2可知,不同訓(xùn)練組合下的MEA-ELMsin2模型精度較高,其NSE和R2均在0.90以上,而RMSE均在0.35 mm/d以下,MRE均低于11%,這進(jìn)一步驗(yàn)證了該模型的精度,MEA-ELMsin2模型可作為重慶地區(qū)ET0計(jì)算的簡化標(biāo)準(zhǔn)模型使用。
表2 模型可移植性分析
本文基于思維進(jìn)化算法和3種激活函數(shù)的ELM模型,以5種氣象輸入組合為基礎(chǔ),構(gòu)建了15種MEA-ELM模型,用于重慶地區(qū)潛在蒸散量的預(yù)測中,得出以下結(jié)論:
1) 重慶地區(qū)不同站點(diǎn)多年ET0呈上升趨勢,在年內(nèi)呈現(xiàn)開口向下的二次拋物線型式。
2) 由不同站點(diǎn)ET0空間趨勢可知,重慶地區(qū)由西向東呈現(xiàn)了逐漸升高的趨勢。
3) MEA-ELM模型精度普遍較高,其中輸入組合2的MEA-ELMsin2模型精度較高,且考慮氣象參數(shù)個(gè)數(shù)較少,可作為區(qū)域ET0模擬的標(biāo)準(zhǔn)模型。
4) 本文未考慮其余模型精度,粒子群算法優(yōu)化的ELM模型在近年來普遍應(yīng)用于模型預(yù)測中,在今后的研究可綜合比較兩種模型精度。