劉婧然,劉 心,武海霞,鄧 皓,李灶鵬
(1.河北工程大學(xué)水利水電學(xué)院,河北 邯鄲056038;2.河北省智慧水利重點實驗室,河北 邯鄲056038)
近年來,隨著經(jīng)濟(jì)的發(fā)展、人口的增長,水資源短缺問題日益突出。2025年農(nóng)業(yè)用水量需增加19%,才能滿足基本糧食需要[1]。中國是農(nóng)業(yè)大國,農(nóng)業(yè)是最主要的用水部門[2-3]。2018年,農(nóng)業(yè)用水占用水總量的61%以上[4]。農(nóng)田灌溉用水量占農(nóng)業(yè)用水量的80%以上[5]。在干旱和半干旱地區(qū),灌溉用水尤其匱乏,因此,實現(xiàn)智能精準(zhǔn)灌溉,進(jìn)行作物需水量預(yù)測,節(jié)約農(nóng)業(yè)灌溉用水,對緩解水資源短缺問題尤為重要。
氣象條件,農(nóng)業(yè)技術(shù)措施等均會對作物需水量產(chǎn)生影響。作物需水量與其影響因素之間呈非線性關(guān)系,采用人工智能方法模擬非線性關(guān)系已得到廣泛應(yīng)用[6],因此很多學(xué)者用人工神經(jīng)網(wǎng)絡(luò)(ANN)對作物需水量進(jìn)行預(yù)測:李志新[7]等構(gòu)建了GA-Elman 神經(jīng)網(wǎng)絡(luò)參考作物需水量預(yù)測模型;孟瑋[8]等建立基于人工蜂群算法的徑向基網(wǎng)絡(luò)預(yù)測日參考作物需水量模型;鄧皓[9]等提出基于MIV-MEA-Elman 核桃果實膨大期作物需水量預(yù)測模型;Abrishami[10]等采用ANN 對小麥和玉米日實際需水量進(jìn)行估算。此外,支持向量機(jī)(SVM)也是人工智能領(lǐng)域中的重要算法模型之一,與ANN 相比,SVM 能夠很好地克服ANN 訓(xùn)練時間長,訓(xùn)練結(jié)果存在隨機(jī)性和過學(xué)習(xí)等不足[6]。彭世彰[11]等建立了有較強(qiáng)適應(yīng)性的基于支持向量回歸機(jī)的參考作物騰發(fā)量實時預(yù)報模型,該模型比BP 神經(jīng)網(wǎng)絡(luò)模型有更優(yōu)的泛化能力;郭淑海[12]等用最小二乘支持向量機(jī)對實際蒸散發(fā)量進(jìn)行了估算,估算精度較高;楊會娟[6]等在氣象資料短缺的干旱地區(qū),建立了預(yù)測精度較高的基于SVM 的月潛在蒸散發(fā)模型;Yunjun Yao[13]等人用貝葉斯模型平均法、一般回歸神經(jīng)網(wǎng)絡(luò)法以及SVM 法估計地面蒸散發(fā),發(fā)現(xiàn)SVM 優(yōu)于其他方法。
以上所述作物需水量(ET)預(yù)測模型的輸入變量大多僅選用了常規(guī)的氣象因素(氣溫、風(fēng)速等)。因為氣象因素是作物需水量的主要影響因素之一,但是除氣象因素之外,作物因素、種植模式也會對作物需水量產(chǎn)生影響[14]。對植物而言,作物冠層溫度(Tc)是反映作物水分狀況的一個良好指標(biāo),當(dāng)植物受到水分脅迫、土壤水分虧缺時,導(dǎo)致許多植物氣孔關(guān)閉,Tc升高[15-16],可見,Tc與作物需水量息息相關(guān)。但以往的作物需水量預(yù)測模型研究鮮見將Tc作為預(yù)測模型的輸入因素之一,同時,Tc的獲取克服了作物其它生理參數(shù)測量時取樣誤差較大和費時的缺點[17],因此本文探討了將Tc引入作物需水量預(yù)測模型的適用性。此外,針對節(jié)水灌溉的特定種植模式下青椒實際作物需水量(ET)的預(yù)測模型研究也較少。滴灌(Drip irrigation)是一種現(xiàn)代高效節(jié)水灌溉技術(shù),在國內(nèi)外已被廣泛應(yīng)用[18]。壟溝集雨覆蓋種植技術(shù)采用溝壟集雨、秸稈覆蓋技術(shù)改善土壤水熱狀況,減少土壤水分散失,提高作物產(chǎn)量和水分利用效率,該技術(shù)已成為全球農(nóng)田生態(tài)系統(tǒng)的一項重要的集水節(jié)灌技術(shù)[19-23]。本文將滴灌、秸稈覆蓋、壟溝集雨技術(shù)相結(jié)合(MFR-DI),用于青椒種植,并對青椒ET 的SVM預(yù)測模型進(jìn)行研究,實現(xiàn)多重節(jié)水。為避免模型訓(xùn)練過程中出現(xiàn)局部最優(yōu)解,采用具有較強(qiáng)全局優(yōu)化能力的遺傳算法(GA)優(yōu)化SVM 模型。同時,探討了在模型輸入因子中引入Tc時,預(yù)測模型的適用性,為實際作物需水量預(yù)測提供參考,對節(jié)約水資源有重要的現(xiàn)實意義。
試驗在河北省邯鄲市河北工程大學(xué)精準(zhǔn)灌溉試驗場進(jìn)行(36°35′20″N,114°29′23″E,海拔62.22 m)。試驗布置如圖1所示,試驗小區(qū)長為1.2 m,寬為1 m,植株行距50 cm,株距30 cm。集雨滴灌(MFR-DI)種植中,壟和溝的寬度分別約為40 cm和60 cm,壟的高度約15 cm,壟上鋪設(shè)塑料薄膜。青椒種植于溝內(nèi),同時將玉米秸稈粉碎成20 cm 左右碎段,均勻撒于集雨溝內(nèi),測孔距離滴頭5 cm。青椒生育期劃分為4個階段:苗期(約35 d)、開花坐果期(約30 d)、結(jié)果盛期(約45 d)、結(jié)果后期(約40 d)。研究區(qū)氣候為溫帶大陸性季風(fēng)氣候,年平均氣溫14°C,多年平均降水量548 mm,全年無霜期200 d,年日照時數(shù)2 557 h。精準(zhǔn)灌溉試驗場設(shè)有自動氣象站,記錄的主要氣象數(shù)據(jù)有:氣溫(°C)、日平均相對濕度(%)、日平均風(fēng)速(m/s)等。冠層溫度(Tc)采用紅外熱像儀測量,測量精度為0.07°C。在試驗小區(qū)內(nèi)選取長勢均勻的4棵植株,測量每棵植株東南西北各方向的頂部葉片,4個方向的頂部葉片溫度平均值為青椒植株的冠層溫度。將小區(qū)內(nèi)4棵植株的冠層溫度平均值作為本小區(qū)青椒的冠層溫度。Tc觀測時間為8∶00-18∶00,每小時測量一次。將每日測量的均值作為日平均冠層溫度。青椒作物需水量的計算根據(jù)水量平衡方程求出[14],試驗區(qū)無地下水補(bǔ)給。
試驗地土壤土質(zhì)均勻一致,均為壤土,0~40 cm 土層內(nèi)的平均容重1.54 g/cm3,田間持水量(占干土質(zhì)量)為27%,土壤pH值約為7.42。
1.2.1 支持向量機(jī)
支持向量機(jī)(SVM)是1995年由貝爾實驗室的Vapnik 和其研究團(tuán)隊在統(tǒng)計學(xué)習(xí)理論的基礎(chǔ)上提出來的一種機(jī)器學(xué)習(xí)算法[24]。支持向量機(jī)是建立在統(tǒng)計學(xué)理論的VC 維理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上的,通過非線性核函數(shù),將輸入樣本空間映射到高維線性特征空間,因此可以處理高度非線性的分類和回歸等問題[12]。該算法的基礎(chǔ)依據(jù)主要是ε-不敏感函數(shù)(ε-insensitive function)和核函數(shù)(kernel-function)算法。假定訓(xùn)練樣本集為(xi,yi),i=1,2,…,n,xi為輸入矢量,yi為對應(yīng)的輸出結(jié)果。φ(xi)為樣本數(shù)據(jù)轉(zhuǎn)換到高維空間的非線性映射,則在高維空間的線性回歸表達(dá)式為[25]:
式中:w為權(quán)值矢量;b為偏置值。
w和b有最優(yōu)解,可用下列函數(shù)得到[25]:
約束條件:
式中:C 為懲罰因子,即對SVM 出錯時的懲罰程度,此參數(shù)的設(shè)置有效防止了個別誤差影響支持向量機(jī)整體的優(yōu)化性能[25]。
根據(jù)非線性回歸問題在高維空間的解法,最終得到支持向量機(jī)的回歸函數(shù)(即ε-不敏感函數(shù))為:
ε-不敏感函數(shù)所得結(jié)果是該曲線和訓(xùn)練點的“ε管道”[11]。其中ai*和ai為拉格朗日系數(shù),xiT為樣本向量的轉(zhuǎn)置,i=1,2,…,n;x為支持向量。在所有樣本點中,只有分布在“管壁”上的那一部分樣本點才決定管道的位置,這部分訓(xùn)練樣本稱為“支持向量”,這一求解策略使過擬合受到限制,因此能夠顯著提高模型的預(yù)報能力[11]。
核函數(shù)是預(yù)報樣本點的向量x的函數(shù)Φ(x)與支持向量x′的函數(shù)Φ(x′)的內(nèi)積[11]。
本文使用RBF 核函數(shù),其表達(dá)式為exp (- g|x - xi|2),核函數(shù)參數(shù)g和懲罰因子C 是影響SVM 性能的主要參數(shù)[25],使用遺傳算法(GA)對SVM的主要參數(shù)進(jìn)行優(yōu)化。
1.2.2 遺傳算法
遺傳算法(GA)是一種模擬自然界生物進(jìn)化機(jī)制的隨機(jī)全局搜索和優(yōu)化方法,其本質(zhì)是一種高效、并行、全局搜索的方法,具有很強(qiáng)的解決問題能力和廣泛的適應(yīng)性[26]。該理論利用一組稱為群體的染色體進(jìn)行操作。該算法包括種群初始化、適應(yīng)度評價、選擇、交叉和變異五個過程。首先對所有可能的解進(jìn)行編碼產(chǎn)生初始種群,然后計算種群中每個個體的適應(yīng)度值,根據(jù)適應(yīng)度值選擇下一代個體,本文采用輪盤賭方法進(jìn)行選擇操作,之后對選出的個體進(jìn)行交叉、變異操作以產(chǎn)生新的個體,再對新個體繼續(xù)進(jìn)行選擇、交叉、變異操作[7,24,26],當(dāng)滿足終止條件時輸出、解碼最優(yōu)個體,得到SVM 最優(yōu)參數(shù)g和C的初始輸入值。通過反復(fù)試驗,設(shè)定參數(shù)見表1 所示:種群大小100,交叉概率為0.8,變異概率為0.01,迭代次數(shù)為100。
表1 遺傳算法參數(shù)設(shè)置Tab.1 Parameter setting of Genetic Algorithm
1.2.3 GA-SVM 預(yù)測模型構(gòu)建
合理選擇SVM 的參數(shù)C 和g,對于提高SVM 預(yù)測模型的性能至關(guān)重要,傳統(tǒng)SVM 預(yù)測模型隨機(jī)生成參數(shù)值,預(yù)測存在不穩(wěn)定因素。GA 具有較強(qiáng)的尋優(yōu)能力,本文選取GA 優(yōu)化SVM 的主要參數(shù),構(gòu)建GA-SVM 預(yù)測模型,構(gòu)建思路如圖2所示,具體步驟如下:
(1)首先進(jìn)行數(shù)據(jù)的采集與預(yù)處理。將得到的氣象數(shù)據(jù)、作物需水量等數(shù)據(jù)進(jìn)行歸一化處理,消除原始數(shù)據(jù)之間的量綱差異。
(2)種群初始化與編碼[26]。構(gòu)建一定數(shù)量的初始種群,并設(shè)置懲罰因子C 和核函數(shù)參數(shù)g的取值范圍,對這兩個參數(shù)進(jìn)行二進(jìn)制編碼。
(3)計算適應(yīng)度函數(shù)與解碼。計算個體適應(yīng)度函數(shù),如果滿足要求,解碼種群中的染色體,獲取C 及g 并進(jìn)行步驟(5) 的模型訓(xùn)練,如果適應(yīng)度函數(shù)不滿足要求則進(jìn)行步驟(4)。
(4)選擇、交叉、變異操作。根據(jù)適應(yīng)度值來決定選擇下一代的個體,采用“輪盤賭”選擇法進(jìn)行個體選擇。之后對選出的個體進(jìn)行交叉、變異操作來產(chǎn)生新個體,再次進(jìn)行適應(yīng)度計算,當(dāng)滿足遺傳算法的終止條件時輸出、解碼最優(yōu)參數(shù)組合,進(jìn)行步驟(5),否則再次進(jìn)行步驟(4),即選擇、交叉、變異操作產(chǎn)生新一代種群,開始新的遺傳。
(5)將最優(yōu)參數(shù)C及g輸入SVM預(yù)測模型中進(jìn)行訓(xùn)練。
(6)當(dāng)模型預(yù)測精度達(dá)到要求,則輸出預(yù)測結(jié)果,否則需重新調(diào)整參數(shù)C和g的初始化尋優(yōu)范圍。
MFR-DI種植方式下青椒作物實際需水量(ET)在作物生長發(fā)育期內(nèi)的變化規(guī)律如圖3 所示,從圖3 可以看出,2014-2017年,青椒從苗期到結(jié)果盛期ET 波動式逐漸增加,至結(jié)果盛期達(dá)到最大值,之后到結(jié)果后期階段ET 又波動式逐漸減少,但仍比苗期的ET大??傮w來看,青椒ET在生育期內(nèi)呈現(xiàn)出周期規(guī)律性變化。
MFR-DI 種植方式下青椒作物冠層溫度(Tc)與同時段測得的平均氣溫在作物生長發(fā)育期內(nèi)的變化規(guī)律如圖4所示,可以看出,2014-2017年,氣溫與Tc的變化規(guī)律均為苗期最低,隨后逐漸波動增加,至結(jié)果盛期達(dá)最高值,之后又逐漸波動降低。氣溫始終高于Tc。并且Tc與氣溫之間的差距(冠氣溫差的絕對值)在苗期最小,隨后逐漸增加,到結(jié)果盛期最大,之后又逐漸降低,但仍比苗期差距大。經(jīng)過相關(guān)回歸分析,同一時間段Tc與氣溫的相關(guān)系數(shù)R2約為0.95。Tc與同一天的平均氣溫的相關(guān)系數(shù)R2約為0.9,說明Tc與氣溫關(guān)系密切。而氣溫又是影響作物需水量的重要氣象因素之一。綜上所述,青椒作物冠層溫度與氣溫、作物需水量息息相關(guān),有必要將其作為預(yù)測ET的輸入向量之一。
在模型預(yù)測時為便于模型訓(xùn)練,消除原始數(shù)據(jù)之間的量綱差異以及極值對模型的影響,更好地反映各因素之間的相互關(guān)系,需要對樣本數(shù)據(jù)進(jìn)行歸一化預(yù)處理,將數(shù)據(jù)轉(zhuǎn)換到[0,1]之間。采用公式(5)進(jìn)行歸一化處理。
式中:xi(i=1,2,…,n)為第i 個樣本數(shù)據(jù);x′i為歸一化后的數(shù)值;xmax=max{xi},xmin=min{xi}。
不僅要對模型的輸入數(shù)據(jù)進(jìn)行處理,對輸出數(shù)據(jù)也應(yīng)進(jìn)行歸一化處理。對使用模型預(yù)測的輸出數(shù)據(jù),還應(yīng)進(jìn)行還原計算,還原計算是公式(5)的逆計算過程,以恢復(fù)其實際值。
使用均方根誤差(RMSE)、平均絕對誤差(MAE)和納什效率系數(shù)(Nash-Sutcliffe coefficient,NS)等來評價模型性能。
式中:Pi為預(yù)測值;Oi為計算值(觀測值);ETmean為計算值的均值;N 為觀測數(shù)。RMSE 和MAE 的單位都是mm/d,取值范圍從0到∞。NS是無量綱的,取值范圍從1到-∞。對模型進(jìn)行評價時,RMSE和MAE越小,NS越大,預(yù)測精度越高。
以2014-2016年的數(shù)據(jù)樣本進(jìn)行訓(xùn)練,以2017年的數(shù)據(jù)樣本進(jìn)行驗證。選擇了不同輸入組合建立了預(yù)測模型,如表2所示,其中T 為溫度,包括日最高氣溫(Tmax),日最低氣溫(Tmin)和日平均氣溫(Tmean);RH 為日平均相對濕度;Ph為日平均氣壓;u2為兩米處風(fēng)速;Rs為太陽輻射;Tc為青椒冠層溫度。因此,所有模型的輸入向量數(shù)為7,輸出結(jié)果為MFR-DI種植方式下青椒作物實際需水量。設(shè)置遺傳種群數(shù)量大小為100,迭代次數(shù)為100,交叉概率0.8,變異概率0.01,懲罰因子C的變化范圍為0~100,核函數(shù)參數(shù)g的變化范圍為0~20,經(jīng)過反復(fù)訓(xùn)練,搜索到SVM最優(yōu)參數(shù)C為0.162 8,g為1.528 8。根據(jù)遺傳算法尋優(yōu)得到的最優(yōu)參數(shù)C和g建立GA-SVM 預(yù)測模型并進(jìn)行2017年青椒作物需水量預(yù)測,預(yù)測結(jié)果如圖5和表3所示。
圖5可以看出,在預(yù)測模型輸入向量一致的情況下,GASVM 模型預(yù)測青椒作物需水量的精度比SVM 模型精度高,且預(yù)測性能穩(wěn)定。為檢驗?zāi)P皖A(yù)測值與計算值ET(即期望目標(biāo)值)之間的相關(guān)性,對二者進(jìn)行了回歸分析,GA-SVM1 模型預(yù)測值與計算值ET 相關(guān)系數(shù)R2為0.807 33,而SVM 模型的R2為0.728 63。表明GA-SVM 模型比SVM 模型的預(yù)測值與計算值之間具有更強(qiáng)的一致性。表3 為GA-SVM 與SVM 模型預(yù)測結(jié)果的統(tǒng)計性能分析表,可見SVM 與GA-SVM1 模型的RMSE分別為0.960 7、0.901 0 mm/d;MAE 分別為0.769 1、0.673 5 mm/d;NS分別為0.968 0、0.971 8,說明GA-SVM 模型的預(yù)測性能優(yōu)于SVM 模型。由以上分析可知,在輸入相同因素向量時,GA-SVM 比SVM 預(yù)測模型具有更高的精度性能。因此,本文僅選取GA-SVM 預(yù)測模型,討論了模型輸入因素引入冠層溫度時對模型的預(yù)測性能產(chǎn)生的影響。
表2 MFR-DI種植模式下基于SVM預(yù)測模型的輸入組合Tab.2 Summary of input combinations for SVM prediction model in MFR-DI
通過對作物需水量的影響因素(氣象因素,Tc)與作物需水量之間進(jìn)行相關(guān)回歸分析,發(fā)現(xiàn)Ph與作物需水量的相關(guān)關(guān)系比Tc與作物需水量的相關(guān)關(guān)系弱,因此將GA-SVM1 預(yù)測模型氣象因素中的Ph替換為Tc,以保證模型的輸入向量個數(shù)不變,如表2 所示(即將GA-SVM1 模型轉(zhuǎn)變?yōu)镚A-SVM2 模型)。GA-SVM2 模型預(yù)測2017年的作物需水量預(yù)測模型性能評價結(jié)果如圖6及表3所示。
表3 ET預(yù)測模型的性能對比Tab.3 Performance comparison of ET prediction models
由圖6可以看出,GA-SVM2模型預(yù)測值與計算值ET 相關(guān)系數(shù)R2為0.830 58,比GA-SVM1 的R2約提高了2.9%,比SVM約提高了14%。另外,從表3可見,GA-SVM2的RMSE,MAE和NS分別為:0.781 7,0.583 8和0.978 8??梢悦黠@看出引入冠層溫度的GA-SVM2 預(yù)測模型的預(yù)測結(jié)果比單獨輸入氣象因素的GA-SVM1 模型預(yù)測的結(jié)果更接近ET 計算值(期望目標(biāo)值),即GA-SVM2模型預(yù)測的準(zhǔn)確度比GA-SVM1和SVM模型預(yù)測的準(zhǔn)確度都高。因此,引入影響作物需水量的作物因素中的Tc對預(yù)測青椒ET模型起到了積極作用。
本文使用支持向量基作為非線性擬合方法,用于河北省南部地區(qū)MFR-DI種植模式下青椒作物需水量的預(yù)測,為實現(xiàn)多重、高效節(jié)水灌溉提供參考。利用農(nóng)田水量平衡原理計算得到ET數(shù)據(jù)(期望目標(biāo)值),以2014-2016年數(shù)據(jù)作為訓(xùn)練樣本,對2017年模型預(yù)測結(jié)果進(jìn)行了驗證。在輸入因子相同的情況下,GA-SVM 模型的預(yù)測結(jié)果優(yōu)于SVM 模型,由于GA算法的優(yōu)化,提高了SVM 預(yù)測模型的收斂速度,使預(yù)測模型的精確度更高,實用性更強(qiáng)。
另外,在預(yù)測模型的輸入向量中引入了影響作物需水量的作物因素(冠層溫度,Tc)。通過對該預(yù)測模型的性能評價可見,采用引入Tc的GA-SVM2 模型預(yù)測結(jié)果的準(zhǔn)確度最高,其RMSE,MAE,NS,R2分別為:0.781 7 mm/d,0.583 8 mm/d,0.978 8,0.8305 8。綜上所述,引入Tc的GA-SVM 方法為預(yù)測青椒作物需水量提供了新思路。
GA-SVM 預(yù)測模型參數(shù)是在一定自然條件及管理水平下試驗獲取,有一定的適用范圍,并且各物理量之間的關(guān)系不能通過預(yù)測模型反映出來,這是此類預(yù)測模型不可避免的局限性。