• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于XGBoost-ANN的城市綠地凈碳交換模擬與特征響應(yīng)

      2019-06-04 01:26:20齊建東黃金澤
      關(guān)鍵詞:因子環(huán)境影響

      齊建東 黃金澤 賈 昕

      (1.北京林業(yè)大學(xué)信息學(xué)院, 北京 100083; 2.北京林業(yè)大學(xué)水土保持學(xué)院, 北京 100083)

      0 引言

      近年來,隨著城市化進(jìn)程的不斷推進(jìn),城市綠地面積也在不斷增加,截止2016年,北京城市綠地總面積約為3×104hm2,人均公園綠地面積為16.1 m2,城市綠地覆蓋率達(dá)48.4%[1]。人工林植被作為城市綠地的重要組成部分,對(duì)氣候具有重要的調(diào)控作用。定量分析城市綠地凈生態(tài)系統(tǒng)碳交換(Net ecosystem exchange,NEE)數(shù)據(jù)不僅能夠促進(jìn)人們對(duì)區(qū)域碳源、匯功能的理解,還可為研究不同生態(tài)系統(tǒng)對(duì)于全球氣候變化的反饋機(jī)制、預(yù)測(cè)區(qū)域氣候變化提供參考。

      NEE數(shù)據(jù)具有明顯的季節(jié)性特征,并且與溫度、光合有效輻射等各類氣象、環(huán)境因子存在復(fù)雜的非線性關(guān)系[2-3],因此,模型模擬難度較大,難以保證模擬效果。雖然通過試湊法或者經(jīng)驗(yàn)選擇法選擇環(huán)境因子往往能獲取較高的精度,但過于復(fù)雜的生態(tài)學(xué)意義不明晰,且不利于模型推廣。隨著機(jī)器學(xué)習(xí)技術(shù)的不斷進(jìn)步,以隨機(jī)森林、XGBoost和人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)為代表的機(jī)器學(xué)習(xí)算法能夠有效地克服上述缺陷,廣泛適用于生態(tài)學(xué)領(lǐng)域。在城市綠地凈碳交換模擬中,王宏瑩[4]使用BP-ANN對(duì)NEE進(jìn)行插補(bǔ),評(píng)價(jià)徐州南部城區(qū)碳源、匯情況,MENZER等[5]通過對(duì)比3種不同的ANN模型,探究風(fēng)速與風(fēng)向?qū)τ诔鞘猩鷳B(tài)系統(tǒng)中NEE的影響。雖然由于ANN強(qiáng)大的非線性映射能力而被廣泛使用,但是在輸入因子選擇等方面則需要研究人員憑經(jīng)驗(yàn)確定[3],因此具有不確定性。XGBoost模型是CHEN等[6]于2016年提出的模型,該算法不僅可以通過計(jì)算輸入因子的相對(duì)重要性對(duì)結(jié)果進(jìn)行解釋,而且通過內(nèi)置交叉驗(yàn)證等方法有效防止模型過擬合,使計(jì)算結(jié)果更為科學(xué)可靠,目前已經(jīng)被廣泛用于空氣質(zhì)量預(yù)報(bào)[7]等領(lǐng)域。充分利用XGBoost對(duì)結(jié)果的可解釋性,將其與ANN模型相結(jié)合,可以有效彌補(bǔ)ANN在因子選擇方面的缺陷。

      在城市生態(tài)系統(tǒng)中,地表接收的太陽輻射強(qiáng)度和空氣溫度和濕度、土壤含水率以及風(fēng)速等環(huán)境因素受到公園內(nèi)植物多樣性、人工林管理方式以及建筑布局等人類活動(dòng)的影響。這些城市特征性使生態(tài)系統(tǒng)對(duì)環(huán)境因子的響應(yīng)發(fā)生了巨大變化,已經(jīng)引起科學(xué)家廣泛關(guān)注。目前已經(jīng)有大量學(xué)者開始探究城市生態(tài)系統(tǒng)中影響NEE的主要因子,認(rèn)為NEE對(duì)環(huán)境因子的響應(yīng)主要與光合有效輻射、溫度、風(fēng)速、風(fēng)向有關(guān)[8-9],但是對(duì)于城市生態(tài)系統(tǒng)中NEE對(duì)環(huán)境因子的響應(yīng)尚缺乏深入探討。鑒于此,本文基于北京奧林匹克森林公園2013—2016年生長(zhǎng)季白天利用渦度相關(guān)法連續(xù)觀測(cè)的NEE數(shù)據(jù),采用XGBoost方法分析空氣溫度(Ta)、土壤溫度(Ts)、光合有效輻射(PAR)、風(fēng)速(WS)、相對(duì)濕度(RH)、飽和水汽壓差(VPD)、10 cm深度土壤含水率(VWC10)7個(gè)環(huán)境因子對(duì)NEE的影響程度,并對(duì)其進(jìn)行選擇和評(píng)價(jià),利用ANN神經(jīng)網(wǎng)絡(luò)模型解釋NEE對(duì)主要環(huán)境因素的響應(yīng)結(jié)果。

      1 材料與方法

      1.1 研究區(qū)概況

      研究區(qū)位于北京奧林匹克森林公園(40°01′N,116°23′E),海拔51 m,主要土壤類型為潮褐土,4年均溫變化范圍為11.69~13.01℃,1月與7月均溫變化范圍分別為-5.22~-1.01℃與25.45~27.82℃,極端低溫變化范圍-19.00~-12.01℃,極端高溫變化范圍為36.58~39.82℃。該地區(qū)氣候?qū)儆谂瘻貛О霛駶?rùn)大陸性季風(fēng)氣候,四季分明,4年均降水量變化范圍458.61~669.12 mm,無霜期208~225 d。降水季節(jié)分配不均,主要集中于6、7、8月(2013—2016年北京統(tǒng)計(jì)年鑒)。觀測(cè)地內(nèi)主要植被為人工營(yíng)造的喬冠草復(fù)層景觀林,喬木類代表物種包括油松(Pinustabulaeformis)、側(cè)柏(Platycladusorientalis)、國(guó)槐(Sophorajaponica)、白蠟(Fraxinuschinensis)、銀杏(Ginkgobiloba),灌木主要為山桃(Prunusdavidiana),叢生灌木主要為丁香(Syzygiumaromaticum)、地被植物主要為石竹(Dianthuschinensis)等[10]。

      1.2 數(shù)據(jù)獲取及預(yù)處理

      實(shí)驗(yàn)數(shù)據(jù)通過渦度通量觀測(cè)儀測(cè)量獲取。儀器主要包括三維超聲風(fēng)速儀(CSAT3型,Campbell Scientific Ltd.,美國(guó))、紅外氣體分析儀(EC155型, Campbell Scientific Ltd.,美國(guó))、凈輻射儀(CNR-4型, Kipp & Zonen Inc.,荷蘭)、光量子傳感器(PARLITE型, Kipp & Zonen Inc.,荷蘭)、空氣溫濕度傳感器(HMP45C型,Campbell Scientific Ltd.,美國(guó))、土壤溫度傳感器(Campbell-109型,Campbell Scientific Ltd.,美國(guó))及土壤含水率傳感器(CS616型,Campbell Scientific Ltd.,美國(guó)),分別用于測(cè)量風(fēng)速、CO2/H2O密度脈動(dòng)、輻射、空氣溫濕度以及土壤溫度等微氣象數(shù)據(jù)。數(shù)據(jù)采集器(CR3000型,Campbell Scientific Ltd., 美國(guó))以10 Hz頻率記錄渦度通量觀測(cè)儀的數(shù)據(jù),經(jīng)過野點(diǎn)剔除、二次坐標(biāo)軸旋轉(zhuǎn)、頻率響應(yīng)校正和WPL校正等操作后,在線計(jì)算30 min通量值[10]。

      采用2013—2016年30 min通量塔NEE與微氣象數(shù)據(jù),由于惡劣天氣、硬件設(shè)施故障以及人為因素的影響,數(shù)據(jù)存在異常值和缺失值。針對(duì)上述情況,參考中國(guó)通量網(wǎng)通量數(shù)據(jù)標(biāo)準(zhǔn)處理流程與凈生態(tài)系統(tǒng)交換量標(biāo)準(zhǔn)處理流程[4,11],將數(shù)據(jù)進(jìn)行如下操作:

      (1)利用3倍標(biāo)準(zhǔn)差法剔除野點(diǎn),檢查數(shù)據(jù)范圍。

      (2)存儲(chǔ)通量計(jì)算??紤]到奧林匹克森林公園植被類型空間分布均勻,植被較高,具有渦度相關(guān)系統(tǒng)高度下冠層內(nèi)存儲(chǔ)通量不為零的特點(diǎn)。NEE定義為

      PNEE=Fc+Fs

      (1)

      式中PNEE——凈生態(tài)系統(tǒng)碳交換量

      Fc——通量觀測(cè)塔在植被上部觀測(cè)值

      Fs——渦度通量觀測(cè)儀安裝高度下冠層內(nèi)存儲(chǔ)通量

      (3)使用分段平均值檢驗(yàn)法計(jì)算的摩擦風(fēng)速閾值為0.2 m/s,因此剔除夜間NEE數(shù)據(jù)中摩擦風(fēng)速小于0.2 m/s的碳通量數(shù)據(jù)。

      (4)考慮到不同量綱的數(shù)據(jù)序列會(huì)增加數(shù)據(jù)處理成本與模型擬合時(shí)間,對(duì)數(shù)據(jù)進(jìn)行歸一化處理。最后,選取4年中生長(zhǎng)季(6—9月)白天[14],即PAR大于10 μmol/(m2·s)的數(shù)據(jù)作為研究對(duì)象[12]。各年有效數(shù)據(jù)統(tǒng)計(jì)結(jié)果如表1所示。

      1.3 模擬方法

      1.3.1XGBoost模型與因子選擇

      XGBoost模型屬于集成學(xué)習(xí)模型,通過構(gòu)建并結(jié)合多個(gè)回歸樹模型來完成學(xué)習(xí)任務(wù)。首先通過自舉法(Bootstrap)生成N個(gè)訓(xùn)練集。其次,對(duì)于每個(gè)訓(xùn)練集均建立回歸樹模型并進(jìn)行訓(xùn)練。最后,計(jì)算所有回歸樹模擬結(jié)果,加權(quán)后作為輸入變量的預(yù)測(cè)值。具體流程如圖1所示。由于XGBoost模型在訓(xùn)練過程中根據(jù)每個(gè)輸入因子的信息增益選擇最好的特征進(jìn)行分裂,因此,通過計(jì)算所有回歸樹中第i個(gè)輸入因子xi出現(xiàn)的次數(shù),可得到該輸入因子在整個(gè)XGBoost模型中的重要性得分。計(jì)算公式為

      表1 各年生長(zhǎng)季白天NEE有效數(shù)據(jù)統(tǒng)計(jì)Tab.1 Summary of effective growing season daytime NEE data for each year 條

      (2)

      式中n——XGBoost中樹的編號(hào)

      Nt——XGBoost中樹的數(shù)量

      圖1 XGBoost 回歸原理圖Fig.1 XGBoost regression principle

      1.3.2ANN神經(jīng)網(wǎng)絡(luò)及其偏導(dǎo)數(shù)

      神經(jīng)網(wǎng)絡(luò)主要是通過自學(xué)習(xí)尋找目標(biāo)值與輸入變量之間的映射關(guān)系。一個(gè)神經(jīng)網(wǎng)絡(luò)主要由輸入層、輸出層以及中間的隱含層構(gòu)成(圖2)。輸入層負(fù)責(zé)接收輸入數(shù)據(jù),輸出層負(fù)責(zé)輸出整個(gè)神經(jīng)網(wǎng)絡(luò)的計(jì)算結(jié)果,隱含層則負(fù)責(zé)描述問題的層次關(guān)系。神經(jīng)網(wǎng)絡(luò)上每個(gè)節(jié)點(diǎn)稱之為神經(jīng)元,各層之間的神經(jīng)元通過一定的權(quán)重相互連接。其基本原理為:當(dāng)網(wǎng)絡(luò)輸出層的計(jì)算結(jié)果與期望結(jié)果偏差過大時(shí),通過優(yōu)化算法對(duì)每個(gè)神經(jīng)元的權(quán)重進(jìn)行更新。通常ANN神經(jīng)網(wǎng)絡(luò)使用反向傳播算法作為優(yōu)化算法,其本質(zhì)是計(jì)算目標(biāo)函數(shù)的梯度來尋求最優(yōu)值。在數(shù)學(xué)上,梯度值表示目標(biāo)函數(shù)在該點(diǎn)變化率最大的方向。在生態(tài)學(xué)中,則可以表示為NEE對(duì)于環(huán)境因子的響應(yīng)速率[13]。

      圖2 ANN分析原理圖Fig.2 Diagram of ANN analysis principle

      本文采取自動(dòng)調(diào)整學(xué)習(xí)率以及早停策略防止ANN過擬合或者欠擬合。

      1.3.3基于XGBoost與ANN神經(jīng)網(wǎng)絡(luò)的NEE分析模型

      基于上述算法,為了能夠更為準(zhǔn)確地分析影響城市生態(tài)系統(tǒng)NEE的主要影響因子與其響應(yīng)關(guān)系,本文將兩種算法結(jié)合進(jìn)行分析。其分析流程如圖3所示,首先對(duì)采集到的NEE數(shù)據(jù)進(jìn)行質(zhì)量控制和歸一化預(yù)處理;其次利用XGBoost模型篩選出NEE主要影響因子,并將其作為ANN模型的輸入因子;通過ANN模型對(duì)各輸入因子的偏導(dǎo)數(shù),探究NEE對(duì)各環(huán)境因子的響應(yīng)關(guān)系,實(shí)現(xiàn)城市生態(tài)系統(tǒng)NEE對(duì)主要環(huán)境因子的響應(yīng)分析。

      圖3 基于XGBoost和ANN的NEE分析技術(shù)路線Fig.3 CO2 flux analysis flow chart based on XGBoost and ANN

      1.4 性能評(píng)估

      為評(píng)估ANN模型的擬合效果,本研究中使用了目前最常用的評(píng)估標(biāo)準(zhǔn)[14]:決定系數(shù)R2、平均絕對(duì)誤差(Mean absolute error, MAE)、均方根誤差(Root mean square error, RMSE)和一致性系數(shù)(Index of agreement, IA)。

      研究所用程序設(shè)計(jì)語言為Python 3.6(64-bit),集成開發(fā)環(huán)境為Anaconda 3。程序設(shè)計(jì)中,XGBoost模型基于xgboost包實(shí)現(xiàn),ANN模型則由Keras 2.2.0和TensorFlow 1.6.0完成編寫。為保證結(jié)果可靠性,每組實(shí)驗(yàn)在相同條件下重復(fù)100次,實(shí)驗(yàn)結(jié)果取平均值。

      2 結(jié)果與分析

      2.1 模型參數(shù)優(yōu)化

      2.1.1XGBoost模型

      在XGBoost模型中,主要參數(shù)有3個(gè):每棵樹的最大深度、樹的數(shù)量、最小葉子節(jié)點(diǎn)權(quán)重之和。本文通過網(wǎng)格尋優(yōu)策略測(cè)試了3種參數(shù)的240種組合,最終確定當(dāng)樹的最大深度為8、樹的數(shù)量為1 500、最小葉子節(jié)點(diǎn)權(quán)重之和為200時(shí),XGBoost模型的目標(biāo)損失函數(shù)值最小,達(dá)到最優(yōu)。

      2.1.2ANN神經(jīng)網(wǎng)絡(luò)

      本文設(shè)定初始學(xué)習(xí)率為1.5,最小學(xué)習(xí)率為0.001;迭代次數(shù)經(jīng)早停策略優(yōu)化后平均次數(shù)為473次;批大小為16,所用隱含層神經(jīng)元數(shù)量為4,輸入層與隱含層共用bias單元,如圖2所示。另外,激活函數(shù)采用sigmoid函數(shù)。

      2.2 環(huán)境因子變化特征

      4年內(nèi)生長(zhǎng)季白天時(shí)間段內(nèi)環(huán)境變化的月平均日變化基本特征如圖4所示。本研究數(shù)據(jù)時(shí)間段,北京奧林匹克森林公園的PAR、Ta、Ts、VPD在12:00—14:00達(dá)到極值,PAR極大值出現(xiàn)在2013年7月16日,為1 533 μmol/(m2·s),月平均日變化極值出現(xiàn)在2014年6月,為1 045 μmol/(m2·s);氣溫的月平均日變化極小值為24.12℃,極大值為33.35℃;由于VPD主要受到水熱條件以及植物蒸騰作用的影響,生長(zhǎng)季期間飽和水汽壓差明顯波動(dòng),且變化劇烈。2014年的VPD顯著高于其他年份;土壤含水率反映了區(qū)域降水情況[15],2014年9月的降水使得VWC10指標(biāo)與其他3年呈明顯差異,VWC10與WS 4年內(nèi)月平均日變化范圍分別為16.54%~35.36%與0.93~1.56 m/s。

      2.3 環(huán)境因子重要性得分

      圖5為計(jì)算得到的環(huán)境因子對(duì)NEE影響的重要性得分??梢钥闯?,環(huán)境因子對(duì)NEE影響的重要性得分由大到小表現(xiàn)依次為PAR、VPD、Ta、RH、Ts、WS、VWC10。由此可知,PAR、VPD、Ta是影響奧林匹克森林公園植物生長(zhǎng)季NEE變化的重要因素。

      2.4 NEE模擬結(jié)果以及對(duì)主要環(huán)境因子的響應(yīng)過程

      表2為不同組合的輸入指標(biāo)在測(cè)試數(shù)據(jù)集上的評(píng)價(jià)結(jié)果。計(jì)算結(jié)果表明,隨著環(huán)境因子輸入數(shù)量的增加,R2總體逐漸增加,當(dāng)輸入因子為PAR、VPD、Ta、RH、Ts、WS、VWC10時(shí),訓(xùn)練集R2為0.712,MAE為3.129 μmol/(m2·s),RMSE為4.349 μmol/(m2·s),一致性指數(shù)為0.911,測(cè)試集決定系數(shù)R2為0.748,RMSE與MAE分別為4.253、2.971 μmol/(m2·s),IA為0.920,相較于其他組合為最優(yōu)結(jié)果。訓(xùn)練集模擬值與觀測(cè)值的擬合結(jié)果如圖6所示,測(cè)試集的擬合結(jié)果如圖7所示。

      觀察圖5與表2結(jié)果可知,當(dāng)輸入因子依次加入VPD以及Ta時(shí),模型測(cè)試集R2增加顯著(R2從0.587提升到0.741);若繼續(xù)增加環(huán)境因子數(shù)量,R2提升效果并不明顯。因此,本文選取PAR、VPD、Ta 3個(gè)環(huán)境因子進(jìn)行分析討論。

      2.4.1PAR對(duì)NEP的影響

      NEP(Net ecosystem productivity)為生態(tài)系統(tǒng)凈生產(chǎn)力。由圖5可知,在生長(zhǎng)季,PAR是影響白天凈生態(tài)系統(tǒng)交換量的決定性因素。圖8顯示了NEP隨PAR的變化情況以及對(duì)PAR的偏導(dǎo)數(shù),即表觀量子效率。從圖中可知,?PNEP/?PPAR>0(PNEP為生態(tài)系統(tǒng)凈生產(chǎn)力,PPAR為光合有效輻射),光合作用隨著PAR的增大而逐漸增強(qiáng),生態(tài)系統(tǒng)對(duì)于CO2的吸收量逐漸增大,碳匯能力增強(qiáng)。當(dāng)PAR大于1 200 μmol/(m2·s)時(shí),表觀量子效率逐漸趨于0并保持穩(wěn)定,說明此時(shí)光合有效輻射已經(jīng)不是部分植被進(jìn)行光合作用的主要因素。圖8中,最大表觀量子效率為0.087。

      表2 不同輸入因子模擬結(jié)果評(píng)估Tab.2 Evaluation indices of different combinations

      注:Y為輸入因子中包括該因子,N為未包括該因子。

      圖6 訓(xùn)練集觀測(cè)值與模擬值的關(guān)系Fig.6 Relationship between observed and simulation results in train dataset

      圖7 測(cè)試集觀測(cè)值與模擬值的關(guān)系Fig.7 Relationship between observed and simulation results in test dataset

      2.4.2飽和水汽壓差對(duì)NEP的影響

      VPD可由RH、Ta通過公式估算得出,該指標(biāo)能夠體現(xiàn)出溫度與相對(duì)濕度的特點(diǎn)[16],因此,其重要性得分要高于RH、Ta。當(dāng)VPD過高時(shí),會(huì)對(duì)植物葉片氣孔閉合產(chǎn)生壓力,影響植物的光合和蒸騰作用。由圖9可知,當(dāng)VPD較小時(shí),植被生長(zhǎng)環(huán)境適宜的情況下,?PNEP/?PVPD>0(PVPD為飽和水汽壓差),NEP與VPD正相關(guān),促進(jìn)生態(tài)系統(tǒng)碳匯,但促進(jìn)能力逐漸減弱。隨著VPD的增大,研究區(qū)域內(nèi)大部分植物光合作用受到抑制,但仍有一部分時(shí)刻的偏導(dǎo)數(shù)大于0,對(duì)NEP的變化起促進(jìn)作用,但總體趨近于0。這說明即使在較高VPD時(shí),由于研究區(qū)域內(nèi)植物種類多樣,其中包括側(cè)柏等耐高溫、抗旱性強(qiáng)植物,生態(tài)系統(tǒng)總體依然呈碳匯現(xiàn)象,但是隨著VPD的繼續(xù)增加,對(duì)植物葉片氣孔閉合產(chǎn)生壓力,影響植物的光合和蒸騰作用[8,22]。

      圖8 NEP對(duì)PAR的偏導(dǎo)數(shù)Fig.8 Numerical partial derivatives of daytime NEP response to PAR for each half-hourly data

      圖9 NEP對(duì)VPD的偏導(dǎo)數(shù)Fig.9 Numerical partial derivatives of daytime NEP response to VPD for each half-hourly data

      2.4.3空氣溫度對(duì)NEP的影響

      空氣溫度主要通過影響生態(tài)系統(tǒng)呼吸和光合作用來影響生態(tài)系統(tǒng)CO2的交換。在本文中,當(dāng)溫度大于15℃時(shí),大部分時(shí)刻空氣溫度與NEP呈正相關(guān),小部分呈負(fù)相關(guān)。在合適的溫度范圍內(nèi),隨著溫度的增加,逐漸轉(zhuǎn)變?yōu)檎嚓P(guān)(圖10,PTa為空氣溫度)。該現(xiàn)象說明溫度較低時(shí),生態(tài)系統(tǒng)光合作用弱于呼吸作用,隨著溫度的逐漸升高,光合作用速率逐漸加快,大于呼吸作用速率。這與陳文婧等[10]關(guān)于奧林匹克森林公園溫度與生態(tài)系統(tǒng)碳交換影響的研究結(jié)果類似。

      圖10 NEP對(duì)Ta的偏導(dǎo)數(shù)Fig.10 Numerical partial derivatives of daytime NEP response to Ta for each half-hourly data

      3 討論

      3.1 樣本大小及模型參數(shù)對(duì)模擬精度的影響

      與隨機(jī)森林類似,XGBoost模型的樣本容量較小時(shí),難以保證極高的模擬精度與泛化能力,因此機(jī)器學(xué)習(xí)模型需要有足夠的樣本數(shù)量保證結(jié)果的合理性。本文模型在訓(xùn)練、測(cè)試與獨(dú)立驗(yàn)證3個(gè)階段樣本數(shù)量分別為5 544、1 109、2 376,樣本容量較大。

      模型模擬的結(jié)果除了與樣本數(shù)量有關(guān)外,還受到模型參數(shù)的影響。在XGBoost模型中,樹的深度、數(shù)量設(shè)置過大會(huì)導(dǎo)致模型運(yùn)行時(shí)間過長(zhǎng),效率低下;若設(shè)置過小則無法有效地表達(dá)NEE的特征重要性,合理地設(shè)置最小權(quán)重之和可以避免模型學(xué)習(xí)到局部的特殊樣本[6]。本文采用的網(wǎng)格尋優(yōu)策略,是目前較常用的尋優(yōu)算法,與機(jī)器學(xué)習(xí)模型相結(jié)合,廣泛應(yīng)用于煤炭灰熔點(diǎn)預(yù)測(cè)[17],工礦復(fù)墾區(qū)土地利用分類等各個(gè)領(lǐng)域[18]。通過該算法優(yōu)化XGBoost模型參數(shù),可以較好地避免由于參數(shù)設(shè)置不恰當(dāng)所造成的誤差。

      在神經(jīng)網(wǎng)絡(luò)模型中,除網(wǎng)絡(luò)結(jié)構(gòu)外,學(xué)習(xí)率、迭代次數(shù)對(duì)模擬結(jié)果有巨大影響。學(xué)習(xí)率過大,導(dǎo)致模型無法收斂,學(xué)習(xí)率過小,會(huì)導(dǎo)致模型收斂速度過慢等。本文采取學(xué)習(xí)率衰減的方法,并設(shè)定最小學(xué)習(xí)率為0.001,訓(xùn)練過程中每隔50代學(xué)習(xí)率降低為原來的1/2,直至達(dá)到最小學(xué)習(xí)率,該方法不僅加快了網(wǎng)絡(luò)收斂速率,也較好地避免了振蕩現(xiàn)象,已經(jīng)被廣泛應(yīng)用于許多改進(jìn)的BP算法中[19];迭代次數(shù)對(duì)于結(jié)果的影響體現(xiàn)為:過多的迭代次數(shù)導(dǎo)致模型產(chǎn)生過擬合,過少的迭代次數(shù)則會(huì)使模型在未收斂時(shí)訓(xùn)練結(jié)束,導(dǎo)致欠擬合。本文通過觀察測(cè)試集損失函數(shù),采用早停策略[20],保證在該參數(shù)配置下獲取最優(yōu)的擬合結(jié)果。

      3.2 數(shù)據(jù)質(zhì)量對(duì)模擬結(jié)果的影響

      在數(shù)據(jù)收集過程中,由于大氣降水、大氣湍流、傳感器自身誤差等原因,造成數(shù)據(jù)出現(xiàn)缺失,極端噪聲等問題,此類問題會(huì)對(duì)模型的精度造成極大的影響。在本文中,主要評(píng)估了包括光合有效輻射、飽和水汽壓差在內(nèi)的7個(gè)環(huán)境因素,未考慮生物因素,如氣孔導(dǎo)度、水分利用效率等,因此無法更加有效模擬NEE的變化情況。另外,由于人類活動(dòng)對(duì)城市生態(tài)系統(tǒng)的影響要遠(yuǎn)大于對(duì)其他生態(tài)系統(tǒng)的影響,因此,在未來的NEE的研究中,應(yīng)當(dāng)充分考慮植被生理因素、生長(zhǎng)環(huán)境的氣象因素以及城市交通[21]等因素的特點(diǎn),選用更加精確的模型,以期提高NEE模擬精度。總體來說,XGBoost模型能準(zhǔn)確地選取影響生態(tài)環(huán)境NEE的主要因素,ANN模型能夠較好擬合NEE的大小以及變化趨勢(shì)。

      3.3 共線性變量對(duì)模型的影響

      由圖5可知,Ta、RH、Ts 3個(gè)環(huán)境因子重要性得分接近。為了進(jìn)一步探究3個(gè)因子的主導(dǎo)性,本文評(píng)估了3種組合的模擬效果(表2,CIV.3-1,CIV.3-2,CIV.3-3),模擬優(yōu)度從大到小依次為CIV.3-1(PAR、VPD、Ta)、CIV.3-3(PAR、VPD、Ts)、CIV.3-2(PAR、VPD、RH)。說明在輸入因子包括PAR和VPD的情況下,Ta最重要,其次為Ts,RH重要性最小。與圖5結(jié)果存在差異,出現(xiàn)這一問題的原因是,XGBoost模型是決策樹模型的組合,在模擬過程中輸入因子共線性不會(huì)影響其預(yù)測(cè)能力,但是對(duì)數(shù)據(jù)的解釋性影響巨大[22]。即當(dāng)Ta特征被使用時(shí),XGBoost模型對(duì)于Ts特征的權(quán)重將會(huì)減少,此時(shí)Ts相對(duì)于NEP來說,增加的有效信息少于RH,因此,在圖5顯示的重要性得分中,由大到小依次為Ta、RH、Ts。另外,CIV.4-1(PAR、VPD、Ta、RH)與CIV.4-2(PAR、VPD、Ta、Ts)組合的評(píng)估結(jié)果中,CIV.4-1的精度高于CIV.4-2,這一結(jié)果也佐證了上述結(jié)論。圖11(圖中PTs為土壤溫度的值)展示了當(dāng)輸入因子組合為CIV.3-3時(shí),NEP對(duì)Ts的偏導(dǎo)數(shù),觀察可知,其變化趨勢(shì)與空氣溫度對(duì)于NEP的影響相同,但數(shù)值更小,對(duì)NEP的響應(yīng)能力弱于Ta。綜上所述,就單因子而言,重要性由大到小依次為Ta、Ts、RH;但綜合考慮Ta后,RH對(duì)NEP影響大于Ts。

      圖11 NEP對(duì)Ts的偏導(dǎo)數(shù)Fig.11 Numerical partial derivatives of daytime NEP response to Ts for each half-hourly data

      3.4 環(huán)境因子對(duì)NEE的影響

      在本研究中,當(dāng)PAR增大時(shí),植物光合作用增強(qiáng),生態(tài)系統(tǒng)中植被固碳能力增強(qiáng),最大表觀量子效率為0.087,高于其他生態(tài)系統(tǒng)中的計(jì)算值,出現(xiàn)這一現(xiàn)象是因?yàn)槌鞘兄袣馊苣z濃度較高使得散射輻射的比例增大,而碳收支對(duì)散射輻射敏感度較高所導(dǎo)致的[20]。當(dāng)PAR大于1 200 μmol/(m2·s)后,其不再是影響光合作用的主要因素,如圖8所示。PAR除了在城市生態(tài)系統(tǒng)中是NEE的主要影響因素外,在其他生態(tài)系統(tǒng)也起主要調(diào)控作用,WEN等[23]通過遺傳神經(jīng)網(wǎng)絡(luò)篩選出PAR是湖南會(huì)同杉木人工林生態(tài)系統(tǒng)的決定性因子,在半干旱荒漠生態(tài)系統(tǒng)中,PAR對(duì)NEE的影響最為顯著[24],唐祥等[25]對(duì)北京八達(dá)嶺NEE的研究表明,PAR是影響該生態(tài)系統(tǒng)生長(zhǎng)季NEE變化的主導(dǎo)因子。除PAR外,VPD、Ta是影響生長(zhǎng)季碳吸收的重要控制因素,該結(jié)論與陳文婧[8]針對(duì)城市綠地神態(tài)系統(tǒng)碳水通量研究結(jié)論一致,MOFFAT[20]對(duì)影響Hainich森林的環(huán)境因素重要性進(jìn)行了等級(jí)劃分,其研究結(jié)果也證明,VPD與Ta是重要的非輻射性環(huán)境因子,KUNWOR等[12]通過改進(jìn)Michaelis-Menten關(guān)系式,在PAR與Ta的基礎(chǔ)上,引入新的環(huán)境變量VPD,不僅提高了數(shù)據(jù)模擬的精度,還在一定程度上保留了模擬數(shù)據(jù)與觀測(cè)數(shù)據(jù)的方差結(jié)構(gòu)。另外,溫度主要通過影響生態(tài)系統(tǒng)光合作用以及土壤微生物活性等方式,來影響生態(tài)系統(tǒng)NEE[26-27]。這也驗(yàn)證了PAR、VPD、Ta對(duì)于生態(tài)系統(tǒng)NEE模擬的重要性。綜上,準(zhǔn)確解釋環(huán)境因子對(duì)于NEE的影響,有利于更好地認(rèn)識(shí)植被對(duì)于區(qū)域氣候變化的響應(yīng)。

      4 結(jié)論

      (1)XGBoost-ANN模型能夠較好地捕捉北京奧林匹克森林公園生長(zhǎng)季NEE數(shù)據(jù)的變化特點(diǎn),在訓(xùn)練集上R2為0.712,MAE為3.129 μmol/(m2·s),RMSE為4.349 μmol/(m2·s),IA為0.911;測(cè)試集R2為0.748,RMSE與MAE分別為4.253、2.971 μmol/(m2·s),IA為0.920,說明其在模擬和分析森林NEE方面具有較好的適用性。

      (2)模型測(cè)試結(jié)果表明,在訓(xùn)練過程中,通過機(jī)器學(xué)習(xí)自動(dòng)化調(diào)參以及網(wǎng)格尋優(yōu)等操作,可以避免由于參數(shù)設(shè)置不合理帶來的誤差。

      (3)環(huán)境因子重要性得分表明,在考慮各因子間相互作用的情況下,影響生長(zhǎng)季白天NEE的主要環(huán)境特征重要性由大到小依次為PAR、VPD、Ta、RH、Ts、WS、VWC10。該地區(qū)NEE變化主要受PAR、VPD、Ta 3個(gè)主要因素調(diào)控。

      (4)各主要環(huán)境因子偏導(dǎo)數(shù)表明,北京奧林匹克森林公園生長(zhǎng)季白天的光合作用表觀量子效率最大值為0.087,并且當(dāng)PAR大于1 200 μmol/(m2·s)時(shí),PAR不再是影響NEP的主要因素;對(duì)VPD的偏導(dǎo)數(shù)說明,隨著VPD的增加,會(huì)對(duì)植物葉片氣孔閉合產(chǎn)生壓力,影響其光合和蒸騰作用;對(duì)溫度的偏導(dǎo)數(shù)說明,隨著溫度的增加,光合速率逐漸大于呼吸速率。

      猜你喜歡
      因子環(huán)境影響
      是什么影響了滑動(dòng)摩擦力的大小
      因子von Neumann代數(shù)上的非線性ξ-Jordan*-三重可導(dǎo)映射
      長(zhǎng)期鍛煉創(chuàng)造體內(nèi)抑癌環(huán)境
      一種用于自主學(xué)習(xí)的虛擬仿真環(huán)境
      一些關(guān)于無窮多個(gè)素因子的問題
      孕期遠(yuǎn)離容易致畸的環(huán)境
      影響因子
      影響因子
      環(huán)境
      擴(kuò)鏈劑聯(lián)用對(duì)PETG擴(kuò)鏈反應(yīng)與流變性能的影響
      贵德县| 嘉善县| 万载县| 卓尼县| 同德县| 清水河县| 孟连| 衡阳市| 监利县| 渭南市| 龙游县| 湟中县| 黎平县| 扬中市| 凭祥市| 沧州市| 原阳县| 精河县| 平罗县| 湖南省| 屯留县| 资兴市| 商洛市| 旺苍县| 灵山县| 横峰县| 五指山市| 特克斯县| 长治县| 逊克县| 牙克石市| 剑川县| 仙居县| 会泽县| 定边县| 岫岩| 平江县| 镇康县| 成武县| 屯昌县| 乌海市|