• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于機器學習的蒸散量插補方法

      2020-04-22 04:59:52何祺勝荊琛琳李金陽
      河海大學學報(自然科學版) 2020年2期
      關鍵詞:土壤水分農(nóng)田草地

      劉 堃,何祺勝,荊琛琳,李金陽,陳 麗

      (河海大學地球科學與工程學院,江蘇 南京 211100)

      蒸散量(ET)作為地表能量平衡和水文循環(huán)的重要組成部分[1],決定著地表生態(tài)系統(tǒng)的水熱傳輸,其準確的測定和估算,對于區(qū)域水資源評定、水分利用效率、干旱預測等均具有十分重要的價值。經(jīng)過20多年的發(fā)展,渦動相關儀已經(jīng)廣泛應用于地表和大氣的能量交換觀測[2-3]。渦動相關儀的觀測數(shù)據(jù)通常是以30 min為一個周期,采集1 d和1 a的通量數(shù)據(jù)[4]。然而,在觀測過程中,由于各種原因(降雨、儀器故障、人為誤操作等)部分觀測數(shù)據(jù)會缺失,研究表明一年中有17%~50%的觀測數(shù)據(jù)會缺失和被剔除[5]。因此,如何建立有效的數(shù)據(jù)插補方法來形成完整的通量數(shù)據(jù)集成為當前亟待解決的問題[4]。國內外學者針對渦動相關儀缺失的蒸散量提出了多種數(shù)據(jù)插補方法[6],主要有非線性回歸、動態(tài)線性回歸、查找表、晝夜平均、卡爾曼濾波、人工神經(jīng)網(wǎng)絡(ANN)方法等。

      目前,機器學習算法已經(jīng)廣泛應用于遙感研究。對于蒸散量的插補,國內外學者主要采用ANN方法進行插補[7-9],并取得了較好的精度。但是使用其他機器學習算法(例如決策樹、隨機森林等)進行插補的研究卻鮮有報道。此外,土壤濕度作為蒸散發(fā)的重要因子,對許多生態(tài)系統(tǒng)的蒸散發(fā)都有不同程度的影響[10],而有關土壤水分要素的參與對基于機器學習的蒸散量插補結果的影響研究很少。

      本文以典型干旱半干旱區(qū)濕地、農(nóng)田、草地、林地生態(tài)系統(tǒng)為研究對象,研究作為輸入變量的氣象因子與蒸散量觀測值之間的相關性,分析多元線性回歸(MLR)、決策樹(CART)、隨機森林(RF)、支持向量回歸(SVR)、BP人工神經(jīng)網(wǎng)絡(BPANN)、深度學習算法(DL)對缺失蒸散量的插補效果,以及土壤水分的參與對機器學習算法插補精度的影響,以期能為不同生態(tài)系統(tǒng)渦動相關儀觀測蒸散量的插補提供理論支持。

      1 數(shù)據(jù)和方法

      1.1 數(shù)據(jù)選擇

      黑河流域位于中國西北干旱半干旱地區(qū)(97.1°E~102.1°E,37.7°N~42.7°N),是中國第二大內陸河流域,屬于典型的溫帶大陸性干旱氣候,氣候干燥,降水稀少。黑河流域上游祁連山是高寒半干旱區(qū),中、下游分別為河西走廊和額濟納平原干旱區(qū),東西和南北差異特征顯著,生態(tài)環(huán)境比較脆弱。本文主要研究黑河流域濕地、草地、農(nóng)田、林地(檉柳、胡楊林、混合林)等生態(tài)系統(tǒng)。研究所用數(shù)據(jù)主要來自6個站點(表1),這6個站點均建有自動氣象站和渦動相關儀,具有蒸散量、顯熱通量、氣象因子等的長期連續(xù)觀測數(shù)據(jù)(來源于黑河生態(tài)水文遙感試驗(HiWATER)[11-12],可以從寒區(qū)旱區(qū)科學數(shù)據(jù)中心申請獲得(http://westdc.westgis.ac.cn))。每個站點渦動相關儀輸出的都是30 min蒸散量均值,自動氣象站輸出的為10 min氣象因子均值;由于儀器損壞、質量控制等原因,實際蒸散量輸出值都有不同程度的缺失,數(shù)據(jù)缺失狀況見表1。

      表1 站點基本信息

      采用每個站點30 min的有效氣象因子和蒸散量觀測值研究機器學習算法的插補效果,將氣象因子作為輸入變量,蒸散量觀測值作為響應變量。草地、農(nóng)田、林地生態(tài)系統(tǒng)用的氣象因子為凈輻射、溫度、土壤熱通量、相對濕度、風速、土壤體積含水率(表層2 cm深度)。對于濕地生態(tài)系統(tǒng),因為缺少實測土壤體積含水量,同時考慮到濕地常年積水,土壤體積含水量對蒸散發(fā)的影響低于其他氣象因子[13],因此選用凈輻射、溫度、土壤熱通量、相對濕度和風速作為氣象因子。

      1.2 數(shù)據(jù)預處理

      由于輸入變量各不相同,也不在同一個數(shù)量級上,為了消除各變量數(shù)量級差異對插補結果的影響,同時也為了加快人工神經(jīng)網(wǎng)絡和深度學習的訓練和收斂速度,需要對輸入變量做歸一化處理。歸一化公式如下:

      (1)

      式中:Y—— 輸入變量歸一化值;x—— 輸入變量;xmin、xmax—— 輸入變量的最小值和最大值。

      1.3 6種機器學習算法

      本文采用的機器學習算法包括MLR、CART、RF、SVR、BPANN、DL。

      a. 多元線性回歸。該算法是指2個或2個以上的自變量組成線性表達式對應一個因變量,通常用在自變量和因變量具有線性相關的條件下。

      b. 決策樹。決策樹是以平方誤差最小化準則來不斷地分裂節(jié)點,從而遞歸地構建二叉決策樹,并最終以葉子節(jié)點的均值作為預測值。經(jīng)反復試錯,該算法的參數(shù)中,樹的最大深度和節(jié)點樣本數(shù)分別設置為20和11,其他參數(shù)保持缺省值不變。

      c. 隨機森林。隨機森林通過集成學習的思想將多棵決策樹集成[14-15],再通過取所有樹預測均值得到RF的預測值 。其不易發(fā)生過擬合,并具有很好的魯棒性。經(jīng)反復試驗,該算法參數(shù)中,決策樹個數(shù)、每顆樹的最大深度和節(jié)點樣本數(shù)分別設置為100、30和1,其他參數(shù)保持缺省值不變。

      d. 支持向量回歸。支持向量回歸是一種建立在統(tǒng)計學習理論的機器學習方法,通過結構風險最小原理取得全局的最優(yōu)解[16-18]。SVR速度快,泛化能力強,能夠解決小樣本和高維輸入空間的問題。經(jīng)測試,SVR選用RBF作為核函數(shù),懲罰系數(shù)C設置為200,核函數(shù)參數(shù)G設置為25。

      e. BP人工神經(jīng)網(wǎng)絡。BP人工神經(jīng)網(wǎng)絡是一種學習過程為信號正向傳播和誤差反向傳播的前饋神經(jīng)網(wǎng)絡,是目前應用最廣泛的一種神經(jīng)網(wǎng)絡[19]。目前,國內外主要采用3層神經(jīng)網(wǎng)絡結構來插補蒸散量[7,9],且從理論上說,單隱層BP網(wǎng)絡已經(jīng)有足夠的映射或逼近能力。因此,本文采用3層網(wǎng)絡結構,分別由輸入層、隱藏層和輸出層組成。每層的激活函數(shù)均設為relu函數(shù),經(jīng)實際測試,把隱藏層單元個數(shù)設為200,此時插補結果最佳。

      f. 深度學習。深度學習是在傳統(tǒng)人工神經(jīng)網(wǎng)絡的基礎上添加更多的隱藏層,以此建立復雜的非線性網(wǎng)絡結構,從而在少量有限的樣本中挖掘出數(shù)據(jù)的本質特征,用較少的參數(shù)建立復雜的函數(shù)。本文采用增加BP人工神經(jīng)網(wǎng)絡隱藏層數(shù)量的深度學習算法,把隱藏層設為4層,每層70個神經(jīng)元,每層的激活函數(shù)設為relu函數(shù),并且為了防止過擬合,把參數(shù)L2(正則化項)的值設為0.01。

      上述算法中,除了深度學習是基于Python語言的keras模塊建立的模型,其他算法均是基于Python語言的skicit-learn模塊建立的模型。

      1.4 插補模型的建立與性能評價

      綜合考慮數(shù)據(jù)質量和氣象數(shù)據(jù)的缺失程度,分別選取草地(2016年全年),農(nóng)田、林地(均為2015年全年),濕地(2015-01-01至2015-09-25)生態(tài)系統(tǒng)中的10 min氣象數(shù)據(jù)和30 min蒸散量觀測值作為研究數(shù)據(jù)。因為氣象數(shù)據(jù)缺失很少,因此采用線性插值法補充完整[20],同時為了與30 min蒸散量相對應,把10 min氣象數(shù)據(jù)取均值處理為30 min氣象數(shù)據(jù)。選用各生態(tài)系統(tǒng)30 min蒸散量未缺失部分和對應的30 min氣象數(shù)據(jù)作為訓練和測試樣本數(shù)據(jù)的來源,其中訓練樣本用于插補模型的訓練,測試樣本作為人工制造的缺失值,通過訓練好的模型在測試樣本上的模擬值與測試樣本的觀測值(真值)進行比較,研究插補的效果。選用決定系數(shù)R2、均方根誤差RMSE、絕對平均誤差MAE評價測試樣本模擬值與觀測值之間的相關性與離散程度。

      2 結果與分析

      2.1 蒸散量與氣象因子的相關性分析

      為了確定所選氣象因子對于蒸散量插補的有效性,選取濕地、草地、農(nóng)田、林地的輸入氣象因子與對應的蒸散量觀測值進行相關性分析。結果(表2)表明,在置信度水平為0.05和0.01時,濕地、草地、農(nóng)田、林地的蒸散量均與所選氣象因子存在顯著相關關系。因此,可以選用凈輻射、溫度、土壤熱通量、相對濕度、風速、土壤體積含水率6個氣象因子來建立插補模型。

      2.2 蒸散量模型插補結果

      采用不同機器學習算法計算濕地、草地、農(nóng)田、林地在有無土壤體積含水率情況下蒸散量的插補值,其與觀測值之間的R2、RMSE和MAE見表3。

      表2 蒸散量與氣象因子間的相關性

      注:*是在0.05水平上雙側顯著相關;**是在0.01水平上雙側顯著相關。

      表3 6種機器學習模型蒸散量的插補結果

      注:有無土壤體積含水率指輸入變量是否含有相應的值。

      整體來看,各生態(tài)系統(tǒng)最好插補結果的決定系數(shù)都比較高(R2>0.83),其中草地和農(nóng)田模擬結果最好,其次是濕地、檉柳和混合林,胡楊林模擬結果最差。

      由表3可知,MLR在每種生態(tài)系統(tǒng)的插補均表現(xiàn)最差,這表明氣象因子與蒸散量之間是復雜的非線性關系,不適合用簡單的線性模型。其次,CART要好于線性回歸的插補結果,而相比MLR、CART,RF、SVR、BPANN、DL在每種生態(tài)系統(tǒng)的結果均更好。在濕地、草地、農(nóng)田、胡楊林生態(tài)系統(tǒng)中,RF、SVR 、BPANN、DL算法的結果差異并不是很顯著。檉柳、混合林生態(tài)系統(tǒng),SVR的結果要稍差于RF、BPANN、DL的結果,可能是因為檉柳、混合林的實測氣象數(shù)據(jù)和蒸散量包含一些噪聲,而SVR對數(shù)據(jù)噪聲比較敏感[21],導致噪聲帶來的錯誤被擴大,從而影響了插補結果。總之,對于干旱半干旱區(qū)的濕地、草地、農(nóng)田、林地生態(tài)系統(tǒng),RF、BPANN、DL、SVR均可以得到較理想的插補結果,但是SVR穩(wěn)定性稍差于其他3種方法。

      相比無土壤體積含水率情況,在土壤體積含水率參與的情況下,農(nóng)田、檉柳、胡楊林、混合林的R2、RMSE、MAE均有顯著提高,但草地相比卻并沒有顯著提高。在蒸發(fā)旺盛的生長季(3—10月),草地的土壤體積含水率大部分都在30%以上(圖1),相比其他生態(tài)系統(tǒng),其下墊面水分比較充足,這導致土壤水分對蒸散發(fā)的影響相對較弱;同時草地生態(tài)系統(tǒng)中土壤水分與蒸散發(fā)的相關性最弱(表2),這些因素表明,在半小時尺度下草地生態(tài)系統(tǒng)的土壤水分對蒸散發(fā)的影響程度相對較弱。因此,土壤水分的加入并未使草地的插補精度有明顯提高。

      圖1 林地、農(nóng)田、草地的日土壤體積含水率變化Fig.1 Change of daily soil moisture in farmland, woodland and grassland

      為了研究插補模型的泛化能力,選用草地(2015年)、農(nóng)田(2016年)、檉柳(2016年)、胡楊林(2014年)、濕地(2016年)生態(tài)系統(tǒng)的氣象數(shù)據(jù)和蒸散量觀測值(氣象因子和時間尺度與訓練模型保持一致)作為測試樣本,用已訓練好的插補模型計算測試樣本的模擬值,并與測試樣本的真值進行比較。從整體結果看,無論土壤水分是否參與,各生態(tài)系統(tǒng)在其他年份的插補精度均有一定程度的降低。其中草地插補精度降低的幅度最小(R2降低0.02~0.03),最好模擬精度為R2=0.9~0.91,RMSE=31.817~32.446 W/m2,MAE=17.232~18.627 W/m2,而濕地、農(nóng)田、檉柳、胡楊林、混合林插補精度降低的幅度較大(R2降低0.1~0.2)。

      2.3 插補效果分析

      為了檢驗機器學習算法對蒸散量的插補效果,以農(nóng)田為例,采用人工神經(jīng)網(wǎng)絡算法,分別選用有土壤體積含水率和無土壤體積含水率2種數(shù)據(jù)集,對2015年缺失蒸散量進行插補,得到一年連續(xù)的蒸散量,并以6月8日為例分析插補效果(圖2中虛線框代表原始觀測值缺失部分),同時將插補完整的蒸散量與凈輻射進行比較和分析,結果見圖2~3。

      圖2 蒸散量插補效果Fig.2 Gap-filling effect of latent heat flux

      圖3 插補完整蒸散量與凈輻射日變化對比Fig.3 Comparison of interpolation completed latent heat flux to net radiation

      由圖2可以看到有土壤水分參與的結果要優(yōu)于無土壤水分參與的結果,更貼近實測曲線的變化趨勢。凈輻射作為蒸散發(fā)的能量來源,是影響蒸散量變化的主要因子,從蒸散量與凈輻射的變化趨勢可對插補效果做定性分析。從圖3可以看到,兩者變化趨勢比較接近,有較好的相關關系。通過上述分析,表明插補結果比較合理可信。

      3 結 語

      MLR在各個生態(tài)系統(tǒng)的蒸散量插補精度均最差(R2=0.6~0.7),CART次之(R2=0.78~0.9),而RF、SVR、BPANN、DL的插補精度較高(R2=0.83~0.93);在檉柳、混合林生態(tài)系統(tǒng),相比RF、BPANN、DL,SVR的插補精度稍低,表明其穩(wěn)定性偏差。此外,土壤水分參與插補要比土壤水分不參與插補可以獲得更高的精度(R2提高了0.01~0.06)。以已建立的插補模型去插補其他年份的蒸散量,發(fā)現(xiàn)其精度有不同程度的下降。

      綜合考慮模型的插補精度和穩(wěn)定性, 對干旱半干旱區(qū)濕地、草地、農(nóng)田、林地生態(tài)系統(tǒng),隨機森林(RF)、BP人工神經(jīng)網(wǎng)絡(BPANN)、深度學習(DL)更適合用來插補,可以取得較好的結果,同時加入土壤水分可以在一定程度上提升機器學習模型插補的精度。

      本研究雖較全面地分析了MLR、CART、RF、SVR、BPANN、DL對干旱半干旱區(qū)生態(tài)系統(tǒng)缺失蒸散量的插補效果、但這些算法在濕潤區(qū)、干旱區(qū)等其他環(huán)境的生態(tài)系統(tǒng)是否適用,還需要進一步的研究和驗證。

      猜你喜歡
      土壤水分農(nóng)田草地
      達爾頓老伯的農(nóng)田
      草地上的事
      幼兒100(2020年31期)2020-11-18 03:42:00
      Laughing song
      草地
      小太陽畫報(2018年6期)2018-05-14 17:19:28
      草地上
      農(nóng)田創(chuàng)意秀
      西藏高原土壤水分遙感監(jiān)測方法研究
      農(nóng)田搞養(yǎng)殖需辦哪些證
      農(nóng)田制作所
      不同覆蓋措施對棗園土壤水分和溫度的影響
      白玉县| 阿瓦提县| 河曲县| 孟村| 甘德县| 宁明县| 普陀区| 湘潭县| 夏津县| 呼伦贝尔市| 永修县| 安岳县| 手机| 长阳| 江都市| 上蔡县| 北流市| 郸城县| 建湖县| 特克斯县| 本溪| 柯坪县| 米脂县| 米林县| 通榆县| 特克斯县| 汝南县| 凌海市| 溆浦县| 龙川县| 五大连池市| 旌德县| 镇坪县| 大同县| 花垣县| 卢氏县| 汨罗市| 景洪市| 临潭县| 许昌市| 桐城市|