• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于GPR、CatBoost、XGBoost三種模型預(yù)測(cè)江西地區(qū)水面蒸發(fā)量

      2021-01-29 09:06:28陳志月吳立峰劉小強(qiáng)伍周睿董建華
      關(guān)鍵詞:學(xué)習(xí)機(jī)蒸發(fā)量水面

      陳志月,吳立峰,劉小強(qiáng),伍周睿,董建華

      (1.南昌工程學(xué)院 鄱陽湖流域水工程安全與資源高效利用國家地方聯(lián)合工程實(shí)驗(yàn)室,江西 南昌 330099;2.河海大學(xué) 水文水資源學(xué)院,江蘇 南京 210098;3.西北農(nóng)林科技大學(xué) 旱區(qū)農(nóng)業(yè)水土工程教育部 重點(diǎn)實(shí)驗(yàn)室,陜西 楊凌 712100;4.昆明理工大學(xué) 農(nóng)業(yè)與食品學(xué)院,云南 昆明 650500)

      1 研究背景

      水面蒸發(fā)量的確定在水資源計(jì)算中具有不可替代的作用,流域水資源評(píng)價(jià)、水庫水量計(jì)算和農(nóng)田灌溉制度制定等都必須參考水面蒸發(fā)量。在我國,通常采用E601蒸發(fā)皿(直徑60 cm)和 E20 蒸發(fā)皿(直徑20 cm)直接測(cè)量水面蒸發(fā)量。20世紀(jì)以來人類活動(dòng)導(dǎo)致全球變暖,氣候變化受到越來越多的關(guān)注,許多學(xué)者指出蒸發(fā)皿蒸發(fā)量的觀測(cè)值并沒有隨著大氣溫度的升高而增加,反而呈現(xiàn)下降的趨勢(shì)[1-3],并把這種現(xiàn)象稱為“蒸發(fā)悖論”[4]。研究證明“蒸發(fā)悖論”的原因在于只是簡單地建立氣溫與水面蒸發(fā)量的聯(lián)系,而實(shí)際上風(fēng)速、相對(duì)濕度、太陽輻射、水汽壓、日照時(shí)數(shù)等氣象因子均為影響水面蒸發(fā)量的主要因素[5-7]。為了全面認(rèn)識(shí)氣象因子與水面蒸發(fā)量的相關(guān)關(guān)系,并確定在一定氣候條件下影響水面蒸發(fā)量的主導(dǎo)因子,有些學(xué)者利用機(jī)器學(xué)習(xí)模型預(yù)測(cè)流域水面蒸發(fā)量,通過不斷地優(yōu)化輸入?yún)?shù)來提高模型預(yù)測(cè)精度。

      近年來,隨著人工智能算法的快速發(fā)展,越來越多的機(jī)器學(xué)習(xí)模型被提出并應(yīng)用于估算蒸散發(fā),如人工神經(jīng)網(wǎng)絡(luò)[8]、支持向量機(jī)[9]、多層感知器[10]、廣義回歸神經(jīng)網(wǎng)絡(luò)[11]、自適應(yīng)神經(jīng)模糊推理系統(tǒng)[12]和極限學(xué)習(xí)機(jī)[13]等,這些機(jī)器學(xué)習(xí)模型在處理自變量與因變量之間的非線性關(guān)系方面具有強(qiáng)大的功能。劉彩紅等[14]評(píng)價(jià)了BP神經(jīng)網(wǎng)絡(luò)在新疆平原地區(qū)預(yù)測(cè)水面蒸發(fā)量的表現(xiàn),認(rèn)為該模型的預(yù)測(cè)精度較高,比其他常用方法構(gòu)建簡單且誤差較小,且所需的材料易于獲得。丁薇[15]研究了PCA-RBF神經(jīng)網(wǎng)絡(luò)模型在太原地區(qū)預(yù)測(cè)水面蒸發(fā)量的適用性,結(jié)果表明CA-RBF神經(jīng)網(wǎng)絡(luò)模型的表現(xiàn)較好,預(yù)測(cè)精度達(dá)到了83%的合格率。有學(xué)者比較了6種基于軟計(jì)算方法的模型(多層感知器(MLP)、廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)、模糊遺傳(FG)、最小二乘支持向量機(jī)(LSSVM)、多元自適應(yīng)回歸樣條(MARS)、自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS-GP))和兩種回歸模型(多元線性回歸(MLR)和Stephens and Stewart模型(SS))預(yù)測(cè)水面月蒸發(fā)量的表現(xiàn),得出不同的氣候條件下模型的精度也不相同,大多數(shù)氣象站點(diǎn)的蒸發(fā)量模擬結(jié)果顯示MLP模型的性能優(yōu)于其他模型,預(yù)測(cè)結(jié)果準(zhǔn)確性排名為MLP>GRNN>LSSVM>FG>ANFIS-GP>MARS>MLR[16]。

      江西地區(qū)處于長江中下游,包含鄱陽湖流域,近年來旱澇災(zāi)害頻發(fā),屬于水資源矛盾比較突出的地區(qū)。閔騫等[3]對(duì)鄱陽湖流域近50年水面蒸發(fā)量的變化特征及其原因進(jìn)行了分析,得出該流域存在“蒸發(fā)悖論”的現(xiàn)象,且認(rèn)為水面蒸發(fā)量的變化是由于大范圍氣候變化脅迫的結(jié)果。由于水面蒸發(fā)量預(yù)測(cè)模型具有很強(qiáng)的地區(qū)適應(yīng)性,且目前關(guān)于江西地區(qū)的水面蒸發(fā)量預(yù)測(cè)模型的研究還缺乏報(bào)道[17],因此,為了進(jìn)一步分析溫度、風(fēng)速、相對(duì)濕度、太陽輻射、水汽壓等氣象因子對(duì)鄱陽湖流域水面蒸發(fā)量變化的綜合影響,以及資料缺乏時(shí)水面蒸發(fā)量的插補(bǔ)和模擬,本研究擬使用3種在蒸發(fā)量模擬中較少使用的機(jī)器學(xué)習(xí)方法(GPR、XGBoost和CatBoost),建立該地區(qū)的水面蒸發(fā)量模擬模型,找出該氣候條件下影響水面蒸發(fā)量的主導(dǎo)氣象因子,并確定最適宜的氣象因子組合。

      本次研究內(nèi)容包括:(1)評(píng)估GPR、XGBoost和CatBoost這3種機(jī)器學(xué)習(xí)模型在江西地區(qū)預(yù)測(cè)水面蒸發(fā)量的適應(yīng)性;(2)通過比較不同輸入?yún)?shù)的模型模擬效果,明確在江西地區(qū)氣候條件下影響水面蒸發(fā)量的主導(dǎo)氣象因子;(3)將3種機(jī)器學(xué)習(xí)模型GPR、XGBoost和CatBoost與3種經(jīng)驗(yàn)?zāi)P虶riffiths[18]、Stephens and Stewart(SS)[19]和Priestley-Taylor(PT)[20]相比較,以便選出氣象資料不足時(shí)最適宜的水面蒸發(fā)量估算模型,為水面蒸發(fā)量的高精度模擬提供一定的參考。

      2 數(shù)據(jù)來源與研究方法

      2.1 研究區(qū)域概況

      江西省位于我國東南部,東、西、南三面環(huán)山,北部為鄱陽湖沖擊平原區(qū),這種地形特點(diǎn)使得該地區(qū)地勢(shì)南高北低,且有利于河流匯集。江西省內(nèi)共有大小河流2 400多條,河網(wǎng)密集,五大河系(贛江、撫河、信江、饒河和修河)以鄱陽湖為匯聚中心組成了一個(gè)完整的水系。受到東亞季風(fēng)的顯著影響,該地區(qū)屬于亞熱帶濕潤氣候,水資源豐富,雨量充沛,多年平均降水量為1 341~1 943 mm,多年平均氣溫為16.3~19.5 ℃。

      2.2 數(shù)據(jù)來源

      本次研究選用了江西地區(qū)16個(gè)氣象站點(diǎn)(修水站、宜春站、吉安站、遂川站、贛縣站、鄱陽站、景德鎮(zhèn)站、南昌站、樟樹站、貴溪站、玉山站、上饒站、南城站、廣昌站、全南站和尋烏站)在2001-2015年期間的逐日氣象資料,包括最高/低氣溫(Tmax/Tmin)、全球太陽輻射(Rs)、地外太陽輻射(Ra)、相對(duì)濕度(HR)、風(fēng)速(Sw)和E601蒸發(fā)皿實(shí)測(cè)的水面蒸發(fā)量,數(shù)據(jù)來源于中國氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)(http://data.cma.cn/)地面觀測(cè)數(shù)據(jù)中的逐日氣象資料,若某日的1個(gè)氣象數(shù)據(jù)丟失或錯(cuò)誤時(shí),該日的所有氣象數(shù)據(jù)均被剔除。在篩選后的長系列連續(xù)氣象資料中,選取2001-2010年的數(shù)據(jù)用于模型的率定,2010-2015年的數(shù)據(jù)用于模型的驗(yàn)證。表1為2001-2015年江西地區(qū)16個(gè)氣象站的氣象數(shù)據(jù)日平均值。

      表1 2001-2015年江西地區(qū)16個(gè)氣象站的氣象數(shù)據(jù)日平均值

      2.3 經(jīng)驗(yàn)?zāi)P?/h3>

      Griffiths、Stephens and Stewart (SS)和Priestley-Taylor (PT) 3種經(jīng)驗(yàn)?zāi)P褪悄壳皬V泛使用的蒸散發(fā)估算模型[21-23],其輸入?yún)?shù)組合及模型方程見表2。由表2可以看出,3種經(jīng)驗(yàn)?zāi)P蛯?duì)應(yīng)不同的輸入組合時(shí),模型基于的方程式也各不相同,其中,a、b、c均為擬合系數(shù);Ta為平均氣溫;Rn為凈輻射;γ為濕度常數(shù);Δ為蒸汽氣壓曲線比降。

      表2 3種經(jīng)驗(yàn)?zāi)P偷妮斎雲(yún)?shù)組合及模型方程

      2.4 機(jī)器學(xué)習(xí)模型

      (1)GPR模型。高斯過程回歸(GPR)模型是利用高斯過程先驗(yàn)對(duì)數(shù)據(jù)進(jìn)行回歸分析的非參數(shù)模型。模型建立如下:

      y=f(x)+ε

      (1)

      因此得到了關(guān)于觀測(cè)值y的先驗(yàn)分布:

      (2)

      同時(shí)也得到了觀測(cè)值和預(yù)測(cè)值的聯(lián)合先驗(yàn)分布如下:

      (3)

      式中:K(X,X)為n階正定協(xié)方差矩陣;K(X,X*)為測(cè)試點(diǎn)與訓(xùn)練集輸入之間的n×1階協(xié)方差矩陣;K(X*,X*)為測(cè)試點(diǎn)自身的協(xié)方差;In為n維單位矩陣。

      算出預(yù)測(cè)值的后驗(yàn)算分布為:

      (4)

      (5)

      cov(f*)=K(x*,x*)-K(x*-X)[K(X,X)+

      (6)

      (2)CatBoost模型。CatBoost是Gradient Boosting(梯度提升)+Categorical Features(類別型特征),能夠很好地處理分類特征問題并能有效地減少過度擬合問題,它根據(jù)公式(7)將分類特征值轉(zhuǎn)化為數(shù)值結(jié)果。

      (7)

      式中:P為先驗(yàn)項(xiàng);b為先驗(yàn)項(xiàng)的權(quán)重。

      (3)XGBoost模型。極限梯度增強(qiáng)(XGBoost)模型是一種新的梯度增強(qiáng)學(xué)習(xí)機(jī)的實(shí)現(xiàn)方法,其學(xué)習(xí)過程解釋如下:

      (8)

      fk∈F

      (9)

      XGBoost算法迭代過程中步驟t的預(yù)測(cè)如下:

      (10)

      因此,得到XGBoost算法的目標(biāo)優(yōu)化函數(shù),如公式(11)所示:

      ft(xi))+Ω(ft)+constant

      (11)

      式中:l為損失函數(shù);n為觀測(cè)的數(shù)目;Ω為正則項(xiàng)。

      2.5 輸入?yún)?shù)

      本次研究以江西地區(qū)16個(gè)氣象站點(diǎn)2011-2015年逐日最高氣溫、最低氣溫、相對(duì)濕度、風(fēng)速、全球太陽輻射和地外太陽輻射作為輸入?yún)?shù),建立了10種不同輸入?yún)?shù)組合的GPR模型、CatBoost模型和XGBoost模型,如表3所示。

      表3 3種學(xué)習(xí)機(jī)模型的10種不同輸入?yún)?shù)組合

      2.6 統(tǒng)計(jì)指標(biāo)

      通過決定系數(shù)(R2)、均方根誤差(RMSE)、平均偏差(MBE)和平均絕對(duì)誤差(MAE)4種統(tǒng)計(jì)指標(biāo)來評(píng)估模型預(yù)測(cè)水面蒸發(fā)量的性能。

      (12)

      (13)

      (14)

      (15)

      3 結(jié)果與分析

      3.1 3種經(jīng)驗(yàn)?zāi)P皖A(yù)測(cè)水面蒸發(fā)量的精度評(píng)估

      江西地區(qū)主要以山地丘陵為主,贛州是這種地貌特征的典型城市,而且是江西省面積最大、人口最多的設(shè)區(qū)市。本文以贛縣為例,3種經(jīng)驗(yàn)?zāi)P驮谮M縣氣象站模擬江西地區(qū)水面蒸發(fā)量的精度指標(biāo)統(tǒng)計(jì)結(jié)果如表4所示。通過比較表4中各統(tǒng)計(jì)指標(biāo)的值可以看出,PT模型總體上優(yōu)于另外兩種經(jīng)驗(yàn)?zāi)P汀km然在率定期PT模型的R2比SS模型的略小,但PT模型的RMSE、MBE絕對(duì)值和MAE均比SS模型的小,總體上穩(wěn)定性更高。從表4中還可看出,除了Griffith模型在驗(yàn)證期存在稍微低估現(xiàn)象(MBE≤0),其他兩種經(jīng)驗(yàn)?zāi)P途吖懒私鞯貐^(qū)的水面蒸發(fā)量,即MBE均大于0,但PT模型的高估程度比SS模型低一些。

      表4 3種經(jīng)驗(yàn)?zāi)P皖A(yù)測(cè)水面蒸發(fā)量的精度指標(biāo)統(tǒng)計(jì)結(jié)果(贛縣站)

      圖1為3種經(jīng)驗(yàn)?zāi)P退嬲舭l(fā)量在贛縣站的預(yù)測(cè)值與實(shí)測(cè)值之間的散點(diǎn)分布圖,由圖1可看出,PT模型散點(diǎn)的分布更趨于1∶1的關(guān)系,表明其模擬效果更好。

      圖1 3種經(jīng)驗(yàn)?zāi)P皖A(yù)測(cè)水面蒸發(fā)量在率定期和驗(yàn)證期預(yù)測(cè)值與實(shí)測(cè)值的散點(diǎn)圖(贛縣站)

      本文還評(píng)估了3種經(jīng)驗(yàn)?zāi)P驮诮鞯貐^(qū)16個(gè)氣象測(cè)站水面蒸發(fā)量的整體預(yù)測(cè)表現(xiàn),結(jié)果見表5。由表5可得出,驗(yàn)證期PT模型的RMSE、MBE和MAE均小于SS模型的值,但R2值較SS 模型的明顯要小,說明該模型預(yù)測(cè)精度不佳。因此在贛縣站表現(xiàn)較好的PT模型在江西地區(qū)的16個(gè)測(cè)站上體現(xiàn)出不適性,難以推廣至整個(gè)江西地區(qū)。

      表5 3種經(jīng)驗(yàn)?zāi)P皖A(yù)測(cè)水面蒸發(fā)量的精度指標(biāo)統(tǒng)計(jì)結(jié)果(16個(gè)測(cè)站的平均值)

      3.2 3種機(jī)器學(xué)習(xí)模型預(yù)測(cè)水面蒸發(fā)量的精度評(píng)估

      為了篩選出最適宜于江西地區(qū)的水面蒸發(fā)量預(yù)測(cè)模型,選用3種學(xué)習(xí)機(jī)模型,即GPR、CatBoost和XGBoost。模型預(yù)測(cè)水面蒸發(fā)量的精度很大程度上取決于模型性質(zhì)和輸入?yún)?shù)。

      以贛縣站的氣象資料作為輸入?yún)?shù),GPR、CatBoost和XGBoost 3種學(xué)習(xí)機(jī)模型預(yù)測(cè)水面蒸發(fā)量的精度指標(biāo)統(tǒng)計(jì)結(jié)果見表6。比較表6中3種學(xué)習(xí)機(jī)模型不同輸入組合的各統(tǒng)計(jì)指標(biāo)均值可知,XGBoost模型的R2最大,RMSE、MBE的絕對(duì)值和MAE最小,其預(yù)測(cè)精度優(yōu)于GPR模型和CatBoost模型。另外,表6中3種學(xué)習(xí)機(jī)模型的MAE均接近于0,說明存在輕微的過擬合或欠擬合。當(dāng)輸入組合中有4個(gè)參數(shù)時(shí)(Tmax、Tmin、Rs或Ra、Sw或HR),率定期估算精度最高的為XGBoost模型(均值:R2=0.833,RMSE=0.705 mm/d,MBE=0,MAE=0.548 mm/d);而驗(yàn)證期估算精度最高的為GPR模型(均值:R2=0.715,RMSE=0.938 mm/d,MBE=0.042 mm/d,MAE=0.7 mm/d)。當(dāng)輸入組合中有3個(gè)參數(shù)時(shí)(Tmax、Tmin、Rs或Ra),率定期和驗(yàn)證期估算精度最高的均為XGBoost模型(均值:率定期,R2=0.833,RMSE=0.714 mm/d,MBE=0,MAE=0.554 mm/d;驗(yàn)證期,R2=0.692,RMSE=0.977 mm/d,MBE=0.05 mm/d,MAE=0.731 mm/d)。表明XGBoost模型水面蒸發(fā)量估測(cè)值的偏離程度均小于其他兩種模型。

      表6 10種不同輸入?yún)?shù)組合條件下3種學(xué)習(xí)機(jī)模型預(yù)測(cè)水面蒸發(fā)量的精度指標(biāo)統(tǒng)計(jì)結(jié)果(贛縣站)

      當(dāng)氣象數(shù)據(jù)資料極其缺乏,只有大氣溫度、全球太陽輻射、相對(duì)濕度或風(fēng)速時(shí),以單一氣象因子作為輸入?yún)?shù),對(duì)3種模型預(yù)測(cè)結(jié)果的均值進(jìn)行對(duì)比,從而評(píng)價(jià)3種模型的精度。結(jié)果顯示,XGBoost模型的精度仍然最高(率定期均值:R2=0.529,RMSE=1.158 mm/d,MBE=0,MAE=0.920 mm/d;驗(yàn)證期均值:R2=0.505,RMSE=1.212 mm/d,MBE=-0.006 mm/d,MAE=0.956 mm/d)??梢奨GBoost模型在氣象資料不足時(shí)預(yù)測(cè)水面蒸發(fā)量具有明顯的優(yōu)越性。當(dāng)氣象資料充分時(shí),CatBoost 10模型最優(yōu),其R2、RMSE、MBE、MAE值分別為0.729、0.924 mm/d、0.109 mm/d、0.678 mm/d。

      上述3種學(xué)習(xí)機(jī)模型模擬結(jié)果均顯示,當(dāng)輸入?yún)?shù)為完整的氣象數(shù)據(jù)時(shí),模型的模擬精度最高。如果在Tmax、Tmin、Ra的輸入組合中增加1個(gè)參數(shù)(Sw或HR),或者在Tmax、Tmin、Rs的輸入組合中增加1個(gè)參數(shù)(Sw或HR),3種學(xué)習(xí)機(jī)模型的預(yù)測(cè)精度均會(huì)提高。已有研究表明[22],輸入?yún)?shù)增加,則模型的預(yù)測(cè)精度也隨之提高,本次研究結(jié)果也與之相符。當(dāng)輸入組合中有3個(gè)參數(shù)時(shí),3種學(xué)習(xí)機(jī)模型的模擬結(jié)果均顯示輸入?yún)?shù)為Tmax、Tmin、Rs的模型優(yōu)于輸入?yún)?shù)為Tmax、Tmin、Ra的模型,說明全球太陽輻射參數(shù)對(duì)模型預(yù)測(cè)精度的影響要大于地外太陽輻射參數(shù)的影響。此外,輸入組合中只有大氣溫度(Tmax、Tmin)作為參數(shù)的模型精度高于只有全球太陽輻射或相對(duì)濕度作為參數(shù)的模型精度,其中相對(duì)濕度作為唯一輸入?yún)?shù)的模型精度最低。因此,10種不同輸入?yún)?shù)組合的學(xué)習(xí)機(jī)模型模擬結(jié)果均顯示,影響江西地區(qū)水面蒸發(fā)量的關(guān)鍵氣象因子為Tmax、Tmin、Rs。

      圖2為3種學(xué)習(xí)機(jī)模型在贛縣站模擬江西地區(qū)水面蒸發(fā)量的預(yù)測(cè)值與實(shí)測(cè)值之間的散點(diǎn)圖,不同顏色的點(diǎn)表示不同輸入組合的學(xué)習(xí)機(jī)模型。

      圖2 10種不同輸入?yún)?shù)組合條件下3種學(xué)習(xí)機(jī)模型在率定期和驗(yàn)證期的預(yù)測(cè)值與實(shí)測(cè)值散點(diǎn)圖(贛縣站)

      從圖2中可以明顯看出,無論是率定期還是驗(yàn)證期,GPR 10、CatBoost 10或XGBoost 10模型的散點(diǎn)圖最接近1∶1的關(guān)系,表明其擬合程度最高。

      為了驗(yàn)證上述結(jié)果的準(zhǔn)確性,對(duì)3種學(xué)習(xí)機(jī)模型在江西地區(qū)16個(gè)氣象站模擬水面蒸發(fā)量的統(tǒng)計(jì)結(jié)果進(jìn)行分析(見表7),結(jié)果與贛縣氣象測(cè)站的分析結(jié)果大體一致。比較表7中10種不同輸入?yún)?shù)模型的精度統(tǒng)計(jì)指標(biāo)均值可知,XGBoost模型的表現(xiàn)最佳,與GPR和CatBoost模型相比,其R2最大,RMSE、MBE絕對(duì)值和MAE最小,因此預(yù)測(cè)水面蒸發(fā)量的精度最高。當(dāng)氣象資料不充分只有3個(gè)參數(shù)時(shí)(Tmax、Tmin、Rs或Ra),甚至只有大氣溫度、全球太陽輻射、相對(duì)濕度或風(fēng)速單個(gè)氣象資料時(shí),結(jié)果仍然顯示XGBoost模型在率定期和驗(yàn)證期均優(yōu)于其他兩種學(xué)習(xí)機(jī)模型。但是,當(dāng)輸入組合中有4個(gè)參數(shù)時(shí),驗(yàn)證期CatBoost 10模型的模擬效果最優(yōu),其R2、RMSE、MBE、MAE值分別為0.744、0.842 mm/d、0.006 mm/d、0.633 mm/d,這表明當(dāng)氣象資料充分時(shí),CatBoost 10模型為江西地區(qū)水面蒸發(fā)量的最佳預(yù)測(cè)模型。

      表7 10種不同輸入?yún)?shù)組合條件下3種學(xué)習(xí)機(jī)模型預(yù)測(cè)水面蒸發(fā)量的精度指標(biāo)統(tǒng)計(jì)結(jié)果(16個(gè)測(cè)站的平均值)

      3.3 相同輸入?yún)?shù)組合的經(jīng)驗(yàn)?zāi)P团c學(xué)習(xí)機(jī)模型預(yù)測(cè)精度評(píng)估

      本文還對(duì)相同輸入?yún)?shù)組合的學(xué)習(xí)機(jī)模型和經(jīng)驗(yàn)?zāi)P皖A(yù)測(cè)江西地區(qū)水面蒸發(fā)量的性能進(jìn)行了比較。同樣以贛縣站氣象資料為例,結(jié)果見表8。由表8可看出,當(dāng)Tmax、Tmin、Ra、Sw作為輸入?yún)?shù)時(shí),GPR 6、CatBoost 6和XGBoost 6在率定期和驗(yàn)證期優(yōu)于Griffith模型,其中XGBoost 6模型的表現(xiàn)最佳;當(dāng)Tmax、Tmin、Rs作為輸入?yún)?shù)時(shí),GPR 8、CatBoost 8和XGBoost 8模型在率定期和驗(yàn)證期優(yōu)于SS和PT模型,同樣以XGBoost 8模型表現(xiàn)最佳。雖然XGBoost模型表現(xiàn)出輕微過擬合(MAE>0),但其R2最大且RMSE、MAE最小,因此,在相同輸入?yún)?shù)的情況下,優(yōu)先選用學(xué)習(xí)機(jī)模型作為江西地區(qū)水面蒸發(fā)量的估算方法。

      為了驗(yàn)證學(xué)習(xí)機(jī)模型的穩(wěn)定性,表9對(duì)相同輸入組合的學(xué)習(xí)機(jī)模型與經(jīng)驗(yàn)?zāi)P皖A(yù)測(cè)水面蒸發(fā)量的16個(gè)氣象站統(tǒng)計(jì)結(jié)果平均值進(jìn)行評(píng)估,得出的結(jié)果與表8的分析結(jié)果一致,即在輸入?yún)?shù)為Tmax、Tmin、Ra、Sw或Tmax、Tmin、Rs的條件下,學(xué)習(xí)機(jī)模型優(yōu)于經(jīng)驗(yàn)?zāi)P停渲蠿GBoost模型的預(yù)測(cè)精度最高,但其MBE>0,表現(xiàn)出過擬合的現(xiàn)象。

      表8 相同輸入?yún)?shù)組合的學(xué)習(xí)機(jī)模型和經(jīng)驗(yàn)?zāi)P偷念A(yù)測(cè)精度指標(biāo)統(tǒng)計(jì)結(jié)果(贛縣站)

      表9 相同輸入?yún)?shù)組合的學(xué)習(xí)機(jī)模型和經(jīng)驗(yàn)?zāi)P偷念A(yù)測(cè)精度指標(biāo)統(tǒng)計(jì)結(jié)果(16個(gè)測(cè)站的平均值)

      4 討 論

      本文提出的Griffiths、PT和SS 3種經(jīng)驗(yàn)?zāi)P途容^低,穩(wěn)定性不佳。在輸入相同參數(shù)的條件下,即輸入?yún)?shù)為Tmax、Tmin、Ra、Sw或Tmax、Tmin、Rs,3種經(jīng)驗(yàn)?zāi)P偷男阅芫陀谙鄳?yīng)的學(xué)習(xí)機(jī)模型。由于水面蒸發(fā)量受到多種氣象條件的影響,而經(jīng)驗(yàn)?zāi)P椭皇菃渭円揽繑?shù)據(jù)的擬合而得到的,缺乏機(jī)理性,因此難以反映水面蒸發(fā)量的動(dòng)態(tài)變化。

      本項(xiàng)研究表明GPR、XGBoost和CatBoost模型在江西地區(qū)的適應(yīng)性各不相同。氣象資料充足時(shí),驗(yàn)證期CatBoost 10模型在該區(qū)域表現(xiàn)最佳;而氣象資料不足時(shí),XGBoost模型通常表現(xiàn)較好。造成這種現(xiàn)象的原因是:CatBoost模型使用了貪婪算法,當(dāng)輸入數(shù)據(jù)不足以解釋全部蒸發(fā)量變化原因時(shí),模型會(huì)有一定程度的過度解釋,即過擬合問題;當(dāng)氣象因子充足時(shí),XGBoost模型相對(duì)CatBoost模型更保守的擬合策略造成了輕微的欠擬合問題,因此其精度不如CatBoost模型。而GPR模型對(duì)數(shù)據(jù)的分布要求更高,當(dāng)數(shù)據(jù)分布不符合高斯分布時(shí),模型的精度會(huì)受到影響。因此,不推薦GPR模型作為該地區(qū)的預(yù)測(cè)模型。

      在實(shí)際情況中,應(yīng)根據(jù)所得氣象資料情況來選用適宜的模型預(yù)測(cè)江西地區(qū)水面蒸發(fā)量,這對(duì)于偏遠(yuǎn)山區(qū)和蒸發(fā)皿觀測(cè)數(shù)據(jù)缺失的地區(qū)具有一定的實(shí)用意義。本文還分析了10種不同輸入?yún)?shù)組合的學(xué)習(xí)機(jī)模型模擬效果,得出影響江西地區(qū)水面蒸發(fā)量的關(guān)鍵氣象因子為Tmax、Tmin、Rs,即溫度和地表總輻射。比較長江流域其他地區(qū)的相關(guān)研究可以看出,水面蒸發(fā)量的影響因素各有不同,如洞庭湖流域的關(guān)鍵氣象因子是溫度和日照時(shí)間[23];四川盆地的主要?dú)庀笠蜃右来螢槿照諘r(shí)數(shù)、風(fēng)速、水汽壓和氣溫[7]。顯然,太陽輻射是地球能量的來源,其直接影響著溫度的變化,間接影響著風(fēng)速、相對(duì)濕度等因子的變化,在江西地區(qū),以太陽輻射的間接作用即改變地表溫度來影響蒸發(fā)為主要特征,而其他地區(qū)以直接影響為主要特征。

      5 結(jié) 論

      本文研究評(píng)價(jià)了3種學(xué)習(xí)機(jī)模型(GPR、XGBoost和CatBoost模型)和3種經(jīng)驗(yàn)?zāi)P?Griffiths、PT和SS模型)對(duì)江西地區(qū)水面蒸發(fā)量的模擬效果,得出結(jié)論如下:

      (1)氣象資料充分時(shí),驗(yàn)證期CatBoost 10模型表現(xiàn)最佳,即輸入組合為Tmax、Tmin、Rs、Sw時(shí),該模型的R2、RMSE、MBE、MAE值分別為0.744、0.842 mm/d、0.006 mm/d、0.633 mm/d,為江西地區(qū)適宜的水面蒸發(fā)量預(yù)測(cè)模型。

      (2)輸入?yún)?shù)同為Tmax、Tmin、Ra、Sw或Tmax、Tmin、Rs時(shí),3種學(xué)習(xí)機(jī)模型均優(yōu)于相應(yīng)的經(jīng)驗(yàn)?zāi)P?,其中XGBoost模型的預(yù)測(cè)精度最高。

      猜你喜歡
      學(xué)習(xí)機(jī)蒸發(fā)量水面
      水黽是怎樣浮在水面的
      極限學(xué)習(xí)機(jī)綜述
      基于極限學(xué)習(xí)機(jī)參數(shù)遷移的域適應(yīng)算法
      創(chuàng)造足以亂真的水面反光
      1958—2013年沽源縣蒸發(fā)量變化特征分析
      分層極限學(xué)習(xí)機(jī)在滾動(dòng)軸承故障診斷中的應(yīng)用
      1981—2010年菏澤市定陶區(qū)蒸發(fā)量變化特征分析
      新疆民豐縣地表水面蒸發(fā)量分析
      爭奪水面光伏
      能源(2016年3期)2016-12-01 05:11:02
      達(dá)孜縣夏秋季大小型蒸發(fā)量特征、影響因子與差異分析
      地球(2016年7期)2016-08-23 03:01:35
      永嘉县| 恭城| 大英县| 望都县| 沁阳市| 应用必备| 北海市| 滦平县| 宜兴市| 桓台县| 高淳县| 集贤县| 十堰市| 静安区| 山阳县| 保靖县| 崇信县| 通州区| 从江县| 墨脱县| 台中市| 霸州市| 乐安县| 丹江口市| 新野县| 盱眙县| 玉龙| 砚山县| 商丘市| 西峡县| 淮滨县| 德令哈市| 温泉县| 玛沁县| 宁化县| 铁岭市| 葵青区| 延庆县| 徐水县| 九龙城区| 天水市|