• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于CARS-BPNN的江西省土壤有機碳含量高光譜預測

      2022-10-31 02:25:08吳俊郭大千李果郭熙鐘亮朱青國佳欣葉英聰
      中國農(nóng)業(yè)科學 2022年19期
      關(guān)鍵詞:波段光譜分層

      吳俊,郭大千,李果,郭熙,2,鐘亮,朱青,國佳欣,葉英聰

      基于CARS-BPNN的江西省土壤有機碳含量高光譜預測

      吳俊1,郭大千3,李果2,4,郭熙1,2,鐘亮1,朱青1,國佳欣1,葉英聰1

      1江西農(nóng)業(yè)大學國土資源與環(huán)境學院/江西省鄱陽湖流域農(nóng)業(yè)資源與生態(tài)重點實驗室,南昌 330045;2中科生態(tài)修復(江西)創(chuàng)新研究院,南昌 330045;3江西省國土空間調(diào)查規(guī)劃研究院,南昌 330045;4江西省地質(zhì)局912大隊,南昌 330045

      【目的】探討光譜變量選擇及依據(jù)土壤類型進行分層校準兩種方法對高光譜預測土壤有機碳(SOC)精度的影響?!痉椒ā恳越魇檠芯繀^(qū),490個土壤樣本為研究對象,對研究區(qū)內(nèi)的所有樣本以及不同土壤類型樣本分別通過競爭性自適應重加權(quán)采樣(CARS)算法篩選特征波段,并采用偏最小二乘回歸(PLSR)、支持向量機(SVM)、隨機森林(RF)、反向傳播神經(jīng)網(wǎng)絡(BPNN)4種模型,對比不同土壤類型下SOC在全波段以及CARS算法篩選后特征波段的預測精度。進而,還對比了全局校準和分層校準下SOC在全波段以及CARS算法篩選后特征波段的預測精度?!窘Y(jié)果】(1)紅壤篩選的特征波段為484、683—714和2 219—2 227 nm,水稻土篩選的特征波段為484、689—702和2 146—2 156 nm。紅壤采用CARS-BPNN模型預測效果最佳(2=0.82),較全波段建模驗證集2提升0.07。水稻土采用CARS-RF模型預測效果最佳(2=0.83),較全波段建模驗證集2提升0.13。(2)在總體樣本上,分層校準相比全局校準精度有所提升。采用CARS-BPNN進行分層校準預測效果最佳(2=0.82),較全局校準驗證集2提升0.06?!窘Y(jié)論】采用CARS-BPNN進行分層校準能夠較好地預測江西省土壤有機碳含量,本研究可為其他類似地區(qū)預測土壤屬性提供科學依據(jù)。

      土壤有機碳;競爭適應重加權(quán)采樣;分層校準;隨機森林;反向傳播神經(jīng)網(wǎng)絡

      0 引言

      【研究意義】土壤有機碳(SOC)在全球變暖、碳循環(huán)和糧食安全中起著關(guān)鍵作用,SOC儲存的變化可能會影響生態(tài)系統(tǒng)服務的平衡[1]。因此,監(jiān)測土壤中的SOC含量成為一項關(guān)鍵而緊迫的任務[2]。然而,高強度采樣和傳統(tǒng)化學分析使得SOC的監(jiān)測成本高昂[3]。隨著近地遙感監(jiān)測技術(shù)的發(fā)展,可見光-近紅外光譜技術(shù)憑借其極高的光譜分辨率和其高效環(huán)保等特性而廣泛應用于SOC含量的估算,為SOC的定量研究提供了新途徑[4]?!厩叭搜芯窟M展】模型的選擇很大程度上影響SOC的預測精度[5]。目前,偏最小二乘回歸(PLSR)作為一種經(jīng)典的線性回歸模型,已被廣泛用于SOC的估算[6]。然而,由于SOC和光譜數(shù)據(jù)之間的關(guān)系本質(zhì)上很少是線性的,線性模型在提供SOC的最全面解決方案時可能會遇到困難[7]。一些研究表明,非線性模型更適合處理SOC和光譜數(shù)據(jù)之間復雜的非線性關(guān)系。如Xu等[8]對稻田完整土壤核心的土壤屬性進行預測,結(jié)果表明反向傳播神經(jīng)網(wǎng)絡(BPNN)和支持向量機(SVM)提供了比PLSR更好的性能。紀文君等[9]研究表明相較于常用的PLSR建模方法而言,非線性模型隨機森林(RF)也取得了較好的建模精度。除了采用非線性模型外,光譜變量選擇也是進一步優(yōu)化模型的常用方法[10]。變量選擇嘗試從光譜數(shù)據(jù)中識別和移除不相關(guān)、有噪聲或不可靠的變量[11]。一些研究表明,通過使用變量選擇方法去除光譜數(shù)據(jù)中不需要的變量,可以獲得更精確的校準模型[12]。其中,競爭性自適應重加權(quán)采樣(CARS)是目前光譜建模領(lǐng)域應用較為廣泛的光譜變量選擇技術(shù)[13]。如Liu等[14]嘗試CARS結(jié)合RF模型用于預測靖邊縣土壤有機質(zhì)含量,于雷等[15]采用CARS結(jié)合PLSR模型用于預測潮土的土壤水分含量,預測精度較全波段建模都取得了一定的提升。因此,可以考慮將多種非線性模型與CARS算法相結(jié)合進行SOC的光譜預測。研究區(qū)的尺度大小同樣會對SOC的預測精度造成影響。目前學者們主要集中在縣域尺度上進行土壤屬性的預測[16-18],取得了較高的建模精度,主要是縣域尺度環(huán)境變量相對較為統(tǒng)一,土壤屬性的空間異質(zhì)性小,但模型的普適性仍有待考證[19-20]。而在更大的研究尺度上,基于全局回歸的預測精度較低,主要原因是土壤性質(zhì)的空間異質(zhì)性增加,而建立分層校準是減少土壤空間變異性的有效方法[21]。如Liu等[22]使用來自中國土壤光譜庫(CSSL)的5種土壤類型的515個樣本進行分層校準改進了SOC的預測精度,唐海濤等[23]依據(jù)土壤類型對黑龍江海倫市土壤樣本進行分類,結(jié)果表明分層校準較全局校準預測精度有所提升。因此,可以考慮依據(jù)土壤類型分層校準預測大尺度地區(qū)的SOC含量?!颈狙芯壳腥朦c】國內(nèi)外研究者對SOC建模方法進行了大量研究并取得了顯著成果,但目前對于多種非線性模型結(jié)合CARS算法預測SOC的比較分析尚不多見。此外,采用分層校準策略預測大尺度的土壤有機碳含量的報道較少?!緮M解決的關(guān)鍵問題】本研究以江西省為研究區(qū),采用PLSR、SVM、RF和BPNN共4種模型結(jié)合CARS算法和分層校準策略預測江西省土壤有機碳含量,以期為其他類似地區(qū)的SOC預測提供科學依據(jù)。

      1 材料與方法

      1.1 研究區(qū)概況

      江西省位于中國東南部(24°29′14″—30°04′41″ N,113°34′36″—118°28′58″ E),土地總面積為16.69萬km2,截至2020年全省人口4 666萬,轄100個縣級行政區(qū)。全省年均溫約16.3—19.5℃,年降水量1 341—1 943 mm,屬亞熱帶溫暖濕潤季風氣候。境內(nèi)東、西、南三面環(huán)山地,中部丘陵和河谷平原交錯分布,北部則為鄱陽湖平原。土地利用類型主要以耕地、林地和園地為主。土壤類型主要包括紅壤和水稻土,分別占全省土壤總面積的70.7%和20.3%[20]。

      1.2 土壤樣品采集與光譜數(shù)據(jù)預處理

      課題組于2020年10—11月在研究區(qū)開展土壤樣品的采集。為保證樣本的代表性和空間獨立性,在綜合考慮地形、植被、土壤、土地利用類型的特征及道路可達性的基礎(chǔ)上,在每個縣級行政區(qū)采集4—6個土壤樣本,共采集512個土壤樣品(圖1)。對于每個土壤樣本,在1 m2范圍內(nèi)采集5個土壤亞樣本,并徹底混合,以得到一個有代表性的樣本。利用GPS記錄樣點經(jīng)緯度,采樣深度為0—20 cm。將植物材料、植物殘余、根系和石塊去除后,把土壤樣本保存在密封包裝。

      土樣于實驗室風干、研磨后,過2 mm篩。然后每個土樣被均勻分為兩部分,分別用于SOC和土壤高光譜的檢測。SOC含量采用重鉻酸鉀容量法測定,土壤高光譜采用美國ASD FieldSpec4地物光譜儀(350—2 500 nm)測定。每個樣本采集10條光譜數(shù)據(jù),取其算術(shù)平均值作為該樣本的光譜曲線。將信噪比低的邊緣波段350—400 nm和2 451—2 500 nm去除。最后,采用The Unscrambler X10.4對光譜數(shù)據(jù)進行Savitzky-Golay(SG)濾波5點平滑處理。

      圖1 研究區(qū)位置與采樣點分布

      1.3 CARS算法

      選擇使用高度共線波長的敏感波段將降低校準模型的穩(wěn)定性,因此,消除冗余帶和降低模型訓練樣本的復雜度可以提高預測模型的精度和速度,特別是對于高維數(shù)據(jù)的處理[24]。CARS是一種重要的基于頻譜的變量濾波算法,具體運行步驟為:(1)從N次蒙特卡羅(MC)采樣運行中依次選擇波長子集;(2)采用基于指數(shù)遞減函數(shù)(EDF)的強制波長選擇和基于自適應重加權(quán)采樣(ARS)的競爭波長選擇的兩步程序來選擇關(guān)鍵波長;(3)應用交叉驗證(CV)來選擇具有最低交叉驗證均方根誤差(RMSECV)的子集[25]。在本研究中,CARS在matlab2012a中運行,采樣次數(shù)設(shè)置為100次。

      1.4 模型構(gòu)建與精度評價

      采用經(jīng)驗法則剔除SOC含量在3倍標準差之外的樣本22個,最終得到490個土壤樣本用于建模,使用K-S算法按照光譜間的歐氏距離以3﹕1的比例分為訓練集和驗證集[26]。采用4種機器學習方法,包括偏最小二乘回歸(PLSR)、支持向量機(SVM)、隨機森林(RF)和反向傳播神經(jīng)網(wǎng)絡(BPNN),結(jié)合CARS算法分別預測研究區(qū)內(nèi)紅壤和水稻土SOC含量,具體流程如圖2所示。其中,PLSR、SVM、RF在python3.7運行,BPNN在matlab2012a運行。模型訓練過程中,4種模型均通過10折交叉驗證進行驗證并且采用網(wǎng)格搜索法進行參數(shù)尋優(yōu)[27]。

      PLSR集成了主成分分析、典型相關(guān)分析和多元線性回歸的優(yōu)點,目前應用較為廣泛[28]。本研究調(diào)節(jié)的主要參數(shù)為保留的主成分數(shù)量(n_components)。

      SVM是一種基于核的學習方法,它使用核函數(shù)將輸入變量映射到高維特征空間,并從特征空間中提取線性超平面作為決策函數(shù)來解決回歸問題[29]。本研究使用高斯徑向基函數(shù)(RBF)建立校準模型,調(diào)節(jié)的主要參數(shù)為懲罰系數(shù)(C)和正則化參數(shù)(γ)。

      RF是一種基于決策樹的集成算法,其基本思路為從訓練集中有放回的隨機選取若干樣本構(gòu)建多個相互獨立的決策樹,然后通過多數(shù)表決原則來決定最終的預測結(jié)果[6]。本研究調(diào)節(jié)的參數(shù)為決策樹數(shù)量(n_estimators)和決策樹最大深度(max_ depth)。

      BPNN的學習規(guī)則是采用最速下降法,通過反向傳播不斷調(diào)整網(wǎng)絡的權(quán)值和閾值,使網(wǎng)絡的平方誤差之和最小。本研究選用三層BPNN結(jié)構(gòu),輸入層節(jié)點數(shù)為光譜波段數(shù)量,采用試錯法與經(jīng)驗法相結(jié)合的方法確定隱藏層節(jié)點數(shù)為12,輸出層則為土壤有機碳含量,不同層之間的轉(zhuǎn)移函數(shù)采用Sigmoid函數(shù),目標誤差設(shè)為0.0001,最大迭代次數(shù)設(shè)為1 000,學習速率設(shè)為0.01[30]。

      采用決定系數(shù)(2)、均方根誤差()和相對分析誤差(RPD)評價模型預測效果。2和RPD越大、越小,說明模型預測效果越好[31],具體公式如下。

      式中,為樣本數(shù)量;yy分別為有機碳的實測和預測值;為有機碳實測值的平均值;SD是驗證集實測值標準偏差;為驗證集均方根誤差。

      圖2 技術(shù)流程圖

      2 結(jié)果

      2.1 不同土壤類型的有機碳含量的描述性統(tǒng)計

      從表1可以看出,SOC含量值域范圍為4.12—34.11 g·kg-1,平均值為16.75 g·kg-1。SOC的變異系數(shù)較高(>0.35),這表明SOC在研究區(qū)域內(nèi)具有空間變異性,并提供了廣泛的范圍,從而具有良好的預測性能[8]。經(jīng)單因素方差分析得知,不同類型土壤的有機碳含量均值差異顯著,表明SOC含量與土壤類型有關(guān)。水稻土的SOC含量較紅壤高,原因在于江西紅壤地區(qū)水稻土在一年中浸水的時間較長,有利于SOC的積累[20,32-33]。

      2.2 不同土壤類型光譜曲線特征

      如圖3所示,當0<SOC<20 g·kg-1,紅壤光譜曲線呈現(xiàn)出其特有的陡坎型,由于受到氧化鐵的影響,在800 nm處形成反射峰,900 nm處形成吸收谷,而水稻土則是平緩上升;在近紅外波段,紅壤和水稻土隨著波長的增加,其反射率不斷升高,增速不斷降低。而2 000 nm之后紅壤光譜曲線下降較為明顯,水稻土則相對平緩。而當SOC>20 g·kg-1,兩種土壤的光譜曲線差異較小。這表明當SOC較低時,不同土壤類型對光譜曲線差異影響較大。

      2.3 CARS算法篩選特征波段

      以CARS選擇紅壤的特征波段過程為例。圖4-a為CARS算法選擇變量數(shù)目變化圖,選擇變量的數(shù)量在前10次采樣迅速減少,之后緩慢減少,這主要是由于指數(shù)遞減函數(shù)的作用。圖4-b為交叉驗證均方根誤差的變化圖,呈現(xiàn)由高到低,再到高的變化,當采樣次數(shù)為58次時,值達到最小值4.43 g·kg-1,這表明在1—58次變量選擇運算過程中,剔除了與SOC無關(guān)的信息變量,而在58次之后開始上升,則可能剔除了與SOC有關(guān)的關(guān)鍵信息變量而導致值增大、模型效果變差。圖4-c為回歸系數(shù)路徑變化圖,最優(yōu)子集對應于最低,由帶星號的垂直線標記。

      表1 江西省土壤有機碳含量描述性統(tǒng)計特征

      Ⅰ:全集 Complete set;Ⅱ:訓練集 Training set;Ⅲ:驗證集 Validation set

      (a)紅壤Red soil,(b)水稻土Paddy soil

      最終,CARS選擇的紅壤、水稻土以及全局的特征波段如圖4-d、e、f所示。紅壤的特征波段為484、683—714和2 219—2 227 nm,波段數(shù)量為41,占整個光譜的2.0%;水稻土的特征波段為484、689—702和2 146—2 156 nm,波段數(shù)量為25,占整個光譜的1.2%;全局的特征波段范圍主要為491—494、695—707、1 197—1 200和1 588—1 591 nm,波段數(shù)量為25,占整個光譜的1.2%。這些結(jié)果表明CARS算法可以極大減少波段的輸入數(shù)量,減少數(shù)據(jù)冗余。

      2.4 土壤有機碳含量預測

      2.4.1 不同土壤類型的土壤有機碳含量預測 從表2可以看出,全波段建模情況下,紅壤的4種模型預測精度排序為SVM>BPNN>RF>PLSR。采用SVM模型預測效果最佳(2=0.76,=2.91 g·kg-1,RPD=2.05)。全波段建模情況下,水稻土的4種模型預測精度排序為BPNN>SVM>PLSR>RF。采用BPNN預測效果最佳(2=0.77,=3.32 g·kg-1,RPD=2.08)。

      a:波段變量個數(shù)的變化;b:交叉驗證均方根誤差的變化;c:變量回歸系數(shù)路徑;d:紅壤樣本特征波段;e:水稻土樣本特征波段;f:總體樣本特征波段

      經(jīng)過CARS選擇特征波段后,紅壤的4種模型預測精度排序為CARS-BPNN>CARS-PLSR>CARS- RF>CARS-SVM。采用CARS-BPNN模型預測效果最佳(2=0.82),較全波段情況下的BPNN模型提升0.06。水稻土的4種模型預測精度排序為CARS-RF>CARS-BPNN>CARS-PLSR>CARS-SVM。采用CARS-RF模型預測效果最佳(2=0.83),較全波段情況下的RF模型提升0.13。這些結(jié)果表明,基于CARS的4種模型較基于全波段的4種模型預測精度有不同程度的提升。

      圖5顯示了基于4種模型結(jié)合CARS或全波段的驗證數(shù)據(jù)集中實測與估計SOC含量的散點圖。與其他模型相比,CARS-BPNN模型和CARS-RF模型獲得的SOC含量的測量值和估計值通常更接近1﹕1線。這些結(jié)果表明,基于CARS的4種模型較基于全波段的4種模型預測精度有不同程度的提升。采用CARS選擇特征變量并用這些特征變量建立預測模型,不僅可以提高模型的效率,還可以提高模型的預測能力和魯棒性。

      2.4.2 綜合土壤類型的土壤有機碳含量預測 將紅壤和水稻土合并建模,得到總體樣本的全局校準結(jié)果;將2.4.1小節(jié)中紅壤和水稻土的預測結(jié)果匯總,得到總體樣本的分層校準結(jié)果。然后比較全局校準與分層校準的結(jié)果。從表3可以看出,全波段情況下分層校準預測精度較全局校準均有不同程度的提高。具體而言,PLSR、SVM、F和BPNN的2分別提升0.06、0.03、0.11和0.15,分別降低0.40、0.23、0.66和0.91 g·kg-1,RPD分別提升0.21、0.14、0.31和0.46。4種模型分層校準時的預測精度排序為BPNN>SVM>PLSR>RF,BPNN模型的預測效果最佳(R=0.76,=3.14 g·kg-1,RPD=2.07),能較好地估測SOC含量。

      圖5 驗證集不同模型下紅壤和水稻土有機碳含量實測值與估測值比較

      Fig. 5 Comparison between measured and estimated values of organic carbon content in red soil and paddy soil under different models of validation set

      表2 不同土壤類型的有機碳含量預測精度

      2:決定系數(shù);:均方根誤差;RPD:相對分析誤差。R:紅壤;P:水稻土

      2: Coefficient of determination;: Root mean square error; RPD: Residual predictive deviation. R: Red soil; P: Paddy soil

      CARS情況下分層校準預測精度較全局校準同樣有所提升。具體而言,PLSR、SVM、RF和BPNN的2分別提升0.04、0.04、0.10和0.06,分別降低0.32、0.26、0.69和0.43 g·kg-1,RPD分別提升0.23、0.16、0.47和0.32。4種模型分層校準時的預測精度排序為CARS-BPNN>CARS-RF>CARS-PLSR>CARS-SVM,CARS-BPNN模型預測效果最佳(2=0.82,=2.75 g·kg-1,RPD=2.36),能較好地估測SOC含量。

      圖6顯示了基于4種模型結(jié)合分層校準或全局校準的驗證數(shù)據(jù)集中實測與估計SOC含量的散點圖。與其他模型相比,結(jié)合分層校準的CARS-BPNN模型獲得的SOC含量實測值和估值更接近于1﹕1線。這些結(jié)果表明,與基于全局校準的4種模型相比,基于分層校準的4種模型的預測精度都有不同程度的提高。與2.4.1結(jié)果相似,每個預測模型評價的散點圖中,均表現(xiàn)一些極大或極小值預測偏差大,這表明了剔除異常樣本的重要性。

      3 討論

      3.1 CARS在土壤有機碳含量預測中的作用

      本研究發(fā)現(xiàn),紅壤的特征波段的范圍為484、683—714和2 219—2 227 nm,水稻土的特征波段的范圍為484、689—702和2 146—2 156 nm。在可見光波段,兩種土壤的特征波段較為相似,484 nm處主要受針鐵礦的影響,683—714 nm處主要受O-H官能團的影響,這證實了Kawamura等[34]和Ji等[35]的研究結(jié)果。在近紅外波段,兩種土壤的特征波段差異較為明顯,紅壤特征波段為2 219—2 227 nm,主要受C-H和Al-OH等官能團的影響,這與Shi等[36]和Vohland等[37]的結(jié)果較為一致;而水稻土特征波段為2 146—2 156 nm,主要受C-O官能團的影響,與Xu等[38]和Hong等[39]的結(jié)果相符??傮w樣本的特征波段與單一土壤類型的特征波段有所不同,這可能是由于紅壤和水稻土的土壤理化特性不同,需要選取兩者共同的敏感波段作為特征波段,故選取的波段有所差別[29,31]。

      圖6 驗證集不同模型下全局與分類建模的有機碳含量實測值與估測值比較

      Fig. 6 Comparison between measured and estimated values of organic carbon content in global and classification models under different validation set

      表3 基于全局與分類建模的土壤有機碳含量預測精度

      G:全局Global;C:分類Classification

      部分研究表明CARS算法能夠在一定程度提升SOC的預測精度,如Vohland等[25]采用CARS- PLSR對SOC預測(2=0.74),較全波段建模2提高0.14,Hong等[40]采用CARS-SVM對SOM預測(2=0.70),較全波段建模2提高0.15。這些與本文的研究結(jié)果較為一致。原因在于CARS通過自適應重加權(quán)采樣技術(shù)(ARS)選擇出回歸系數(shù)絕對值較大的波長,去掉權(quán)重小的波長,可有效選擇與SOC相關(guān)的最優(yōu)波長組合[14,21]。對比訓練集和驗證集預測精度可知,CARS可有效地減少模型的過擬合現(xiàn)象,從而提高模型的魯棒性[26]。此外,CARS-BPNN模型預測精度最高,而CARS-PLSR模型預測精度最低。這一結(jié)果的原因在于BPNN能夠很好地解決由于光譜儀工作狀態(tài)的變化和土壤樣品結(jié)構(gòu)性質(zhì)的變化而導致的土壤反射光譜和SOC含量之間的非線性問題[41]。而水稻土的4種模型預測精度中PLSR>RF,原因在于當樣本數(shù)量較少時,PLSR可能優(yōu)于一些非線性模型,這與Yang等[12]和Kawamura等[28]的研究一致。

      3.2 土壤分類建模在土壤有機碳含量預測中的作用

      在分層校準方面,Moura-Bueno等[42]依據(jù)土壤類型、土地利用、樣品層和光譜特征,采用分層校準預測SOC,結(jié)果顯示預測精度(2)較全局校準提升0.08;Araújo等[43]通過聚類的方法將巴西熱帶土壤樣本分為若干組預測土壤有機質(zhì),結(jié)果顯示預測精度(2)較全局校準提升0.06;Bao等[44]采用了不同的分層校準策略,包括土壤類型和光譜聚類,取得了良好的土壤有機質(zhì)預測效果(2=0.89,= 0.42 g·kg-1,RPD=2.97),這些研究與本文的結(jié)果較為相符。分層校準能夠改善模型預測能力的原因在于土壤光譜包含各種土壤屬性的綜合信息,土壤分類建??梢詫碗s的光譜數(shù)據(jù)集劃分為具有相似光譜特征的多個聚類,從而消除土壤礦物學等其他屬性對SOC預測的干擾[45]。

      3.3 不足與展望

      本文重點探討了CARS算法及土壤分類建模對土壤有機碳含量預測的影響。但值得注意的是,還存在其他可能改善土壤有機碳含量預測精度的方法,如改變樣本量的分配比例和按照土地利用類型分類建模等[16, 32],有待后續(xù)的對比研究。

      4 結(jié)論

      本研究以江西省為研究區(qū),采用偏最小二乘回歸(PLSR)、支持向量機(SVM)、隨機森林(RF)、反向傳播神經(jīng)網(wǎng)絡(BPNN)4種模型結(jié)合CARS算法分別預測了紅壤和水稻土的SOC含量,然后對比了分層校準和全局校準預測總體樣本的SOC含量的結(jié)果。結(jié)果表明,CARS程序及分層校準能夠在不同程度提升原始模型的預測精度。CARS-BPNN模型結(jié)合分層校準預測總體樣本的SOC含量效果最佳(2=0.82,=2.75 g·kg-1,RPD=2.36)。因此,采用CARS- BPNN模型結(jié)合依據(jù)土壤類型的分層校準能夠較好地預測江西省SOC含量。

      [1] ROSSEL R V, WALVOORT D J J, MCBRATNEY A B, JANIK L J, SKJEMSTAD J O. Visible, near infrared, mid infrared or combined diffuse reflectance spectroscopy for simultaneous assessment of various soil properties. Geoderma, 2006, 131(1/2): 59-75.

      [2] KUANG B, MOUAZEN A M. Calibration of visible and near infrared spectroscopy for soil analysis at the field scale on three European farms. European Journal of Soil Science, 2011, 62(4) : 629-636.

      [3] ROSSEL R V, BEHRENS T. Using data mining to model and interpret soil diffuse reflectance spectra. Geoderma, 2010, 158(1/2): 46-54.

      [4] 史舟, 王乾龍, 彭杰, 紀文君, 劉煥軍, 李曦. 中國主要土壤高光譜反射特性分類與有機質(zhì)光譜預測模型. 中國科學, 2014, 44(5): 978-988.

      SHI Z, WANG Q L, PENG J, JI W J, LIU H J, LI X. Development of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations. Science China, 2014, 44(5): 978-988. (in Chinese)

      [5] MOUAZEN A M, KUANG B, DE BAERDEMAEKER J, RAMON H. Comparison among principal component, partial least squares and back propagation neural network analyses for accuracy of measurement of selected soil properties with visible and near infrared spectroscopy. Geoderma, 2010, 158(1/2): 23-31.

      [6] DING J, YANG A, WANG J, SAGAN V, YU D. Machine-learning- based quantitative estimation of soil organic carbon content by VIS/NIR spectroscopy. PeerJ, 2018, 6: e5714.

      [7] CHENG H, WANG J, DU Y. Combining multivariate method and spectral variable selection for soil total nitrogen estimation by Vis–NIR spectroscopy. Archives of Agronomy and Soil Science, 2021, 67(12): 1665-1678.

      [8] XU S, ZHAO Y, WANG M, SHI X. Comparison of multivariate methods for estimating selected soil properties from intact soil cores of paddy fields by Vis–NIR spectroscopy. Geoderma, 2018, 310: 29-43.

      [9] 紀文君, 史舟, 周清, 周煉清. 幾種不同類型土壤的VIS-NIR 光譜特性及有機質(zhì)響應波段. 紅外與毫米波學報, 2012, 31(3): 277-282.

      JI W J, SHI Z, ZHOU Q, ZHOU L Q. VIS-NIR reflectance spectroscopy of the organic matter in several types of soils. Journal of Infrared and Millimeter Waves, 2012, 31(3): 277-282. (in Chinese)

      [10] VOHLAND M, LUDWIG M, HARBICH M, EMMERLING C, THIELE-BRUHN S. Using variable selection and wavelets to exploit the full potential of visible–near infrared spectra for predicting soil properties. Journal of Near Infrared Spectroscopy, 2016, 24(3): 255-269.

      [11] 朱亞星, 于雷, 洪永勝, 章濤, 朱強, 李思締, 郭力, 劉家勝. 土壤有機質(zhì)高光譜特征與波長變量優(yōu)選方法. 中國農(nóng)業(yè)科學, 2017, 50(22): 4325-4337.

      ZHU Y X, YU L, HONG Y S, ZHANG T, ZHU Q, LI S D, GUO L, LIU J S. Hyperspectral features and wavelength variables selection methods of soil organic matter. Scientia Agricultura Sinica, 2017, 50(22): 4325-4337. (in Chinese)

      [12] YANG M, XU D, CHEN S, LI H, SHI Z. Evaluation of machine learning approaches to predict soil organic matter and pH using Vis-NIR spectra. Sensors, 2019, 19(2): 263.

      [13] KAWAMURA K, TSUJIMOTO Y, NISHIGAKI T, ANDRIAMANANJARA A, RABENARIVO M, ASAI H, RAZAFIMBELO T. Laboratory visible and near-infrared spectroscopy with genetic algorithm-based partial least squares regression for assessing the soil phosphorus content of upland and lowland rice fields in Madagascar. Remote Sensing, 2019, 11(5): 506.

      [14] LIU J, DONG Z, XIA J, WANG H, MENG T, ZHANG R, XIE J. Estimation of soil organic matter content based on CARS algorithm coupled with random forest. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2021, 258: 119823.

      [15] 于雷, 洪永勝, 周勇, 朱強, 徐良, 李冀云, 聶艷. 高光譜估算土壤有機質(zhì)含量的波長變量篩選方法. 農(nóng)業(yè)工程學報, 2016, 32(13): 95-102.

      YU L, HONG Y S, ZHOU Y, ZHU Q, XU L, LI J Y, NIE Y. Wavelength variable selection methods for estimation of soil organic matter content using hyperspectral technique. Transactions of the Chinese Society of Agricultural Engineering, 2016, 32(13): 95-102. (in Chinese)

      [16] 國佳欣, 朱青, 趙小敏, 郭熙, 韓逸, 徐喆. 不同土地利用類型下土壤有機碳含量的高光譜反演. 應用生態(tài)學報, 2020, 31(3): 863-871.

      GUO J X, ZHU Q, ZHAO X M, GUO X, HAN Y, XU Z. Hyper- spectral inversion of soil organic carbon content under different land use types. Chinese Journal of Applied Ecology, 2020, 31(3): 863-871.

      [17] 鐘亮, 郭熙, 國佳欣, 徐喆, 朱青, 丁萌. 基于不同卷積神經(jīng)網(wǎng)絡模型的紅壤有機質(zhì)高光譜估算. 農(nóng)業(yè)工程學報, 2021, 37(1): 203-212.

      ZHONG L, GUO X, GUO J X, XU Z, ZHU Q, DING M. Hyperspectral estimation of organic matter in red soil using different convolutional neural network models. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(1): 203-212.

      [18] YANG M, MOUAZEN A, ZHAO X, GUO X. Assessment of a soil fertility index using visible and near-infrared spectroscopy in the rice paddy region of southern China. European Journal of Soil Science, 2020, 71(4): 615-626.

      [19] SHI Z, JI W, VISCARRA ROSSEL R A, CHEN S, ZHOU Y. Prediction of soil organic matter using a spatially constrained local partial least squares regression and the Chinese vis-NIR spectral library. European Journal of Soil Science, 2015, 66(4): 679-687.

      [20] 趙小敏, 楊梅花. 江西省紅壤地區(qū)主要土壤類型的高光譜特性研究. 土壤學報, 2018, 55(1): 31-42.

      ZHAO X M, YANG M H. Hyper-spectral characteristics of major types of soils in red soil region of Jiangxi province, China. Acta Pedologica Sinica, 2018, 55(1): 31-42. (in Chinese)

      [21] LIU S, SHEN H, CHEN S, ZHAO X, BISWAS A, JIA X, FANG J. Estimating forest soil organic carbon content using vis-NIR spectroscopy: Implications for large-scale soil carbon spectroscopic assessment. Geoderma, 2019, 348: 37-44.

      [22] LIU Y, SHI Z, ZHANG G, CHEN Y, LI S, HONG Y, LIU Y. Application of spectrally derived soil type as ancillary data to improve the estimation of soil organic carbon by using the Chinese soil vis-NIR spectral library. Remote Sensing, 2018, 10(11): 1747.

      [23] 唐海濤, 孟祥添, 蘇循新, 馬濤, 劉煥軍, 鮑依臨, 張美薇, 張新樂, 霍海志. 基于CARS 算法的不同類型土壤有機質(zhì)高光譜預測. 農(nóng)業(yè)工程學報, 2021, 37(2): 105-113.

      TANG H T, MENG X T, SU X X, MA T, LIU H J, BAO Y L, ZHANG M W, ZHANG X Y, HUO H Z. Hyperspectral prediction on soil organic matter of different types using CARS algorithm. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(2): 105-113. (in Chinese)

      [24] 李冠穩(wěn), 高小紅, 肖能文, 肖云飛. 基于sCARS-RF算法的高光譜估算土壤有機質(zhì)含量. 發(fā)光學報, 2019, 40(8): 1030-1039.

      LI G W, GAO X H, XIAO N W, XIAO Y F. Estimation soil organic matter contents with hyperspectra based on sCARS and RF algorithms. Chinese Journal of Luminescence, 2019, 40(8): 1030-1039. (in Chinese)

      [25] VOHLAND M, LUDWIN M, THIELE-BRUHN S, LUDWIG B. Determination of soil properties with visible to near-and mid-infrared spectroscopy: Effects of spectral variable selection. Geoderma, 2014, 223: 88-96.

      [26] HONG Y, CHEN S, LIU Y, ZHANG Y, YU L, CHEN Y, LIU Y. Combination of fractional order derivative and memory-based learning algorithm to improve the estimation accuracy of soil organic matter by visible and near-infrared spectroscopy. Catena, 2019, 174: 104-116.

      [27] VISCARRA ROSSEL R A, HICKS W S. Soil organic carbon and its fractions estimated by visible-near infrared transfer functions. European Journal of Soil Science, 2015, 66(3): 438-450.

      [28] KAWAMURA K, TSUJIMOTO Y, RABENARIVO M, ASAI H, ANDRIAMANANJARA A, RAKOTOSON T. Vis-NIR spectroscopy and PLS regression with waveband selection for estimating the total C and N of paddy soils in Madagascar. Remote Sensing, 2017, 9(10): 1081.

      [29] DOTTO A C, DALMOLIN R S D, TEN CATEN A, GRUNWALD S. A systematic study on the application of scatter-corrective and spectral-derivative preprocessing for multivariate prediction of soil organic carbon by Vis-NIR spectra. Geoderma, 2018, 314: 262-274.

      [30] KUANG B, TEKIN Y, MOUAZEN A M. Comparison between artificial neural network and partial least squares for on-line visible and near infrared spectroscopy measurement of soil organic carbon, pH and clay content. Soil and Tillage Research, 2015, 146: 243-252.

      [31] HONG Y, LIU Y, CHEN Y, LIU Y, YU L, LIU Y, CHENG H. Application of fractional-order derivative in the quantitative estimation of soil organic matter content through visible and near-infrared spectroscopy. Geoderma, 2019, 337: 758-769.

      [32] 紀文君, 李曦, 李成學, 周銀, 史舟. 基于全譜數(shù)據(jù)挖掘技術(shù)的土壤有機質(zhì)高光譜預測建模研究. 光譜學與光譜分析, 2012, 32(9): 2393-2398.

      JI W J, LI X, LI C X, ZHOU Y, SHI Z. Using different data mining algorithms to predict soil organic matter based on visible-near infrared spectroscopy. Spectroscopy and Spectral Analysis, 2012, 32(9): 2393-2398. (in Chinese)

      [33] 郭熙, 謝碧裕, 葉英聰, 謝文. 高光譜特征辨別潴育型麻沙泥田和潮沙泥田水稻土. 農(nóng)業(yè)工程學報, 2014, 30(21): 184-191.

      GUO X, XIE B Y, YE Y C, XIE W. Discrimination between hydromorphic alluvial sandy mud paddy and tide sandy mud paddy based on hyperspectral characteristics. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(21): 184-191. (in Chinese)

      [34] KAWAMURA K, NISHIGAKI T, TSUJIMOTO Y, ANDRIAMANANJARA A, RABENARIBO M, ASAI H, RAZAFIMBELO T. Exploring relevant wavelength regions for estimating soil total carbon contents of rice fields in Madagascar from Vis-NIR spectra with sequential application of backward interval PLS. Plant Production Science, 2021, 24(1): 1-14.

      [35] Ji W, Shi Z, Huang J, Li S. Correction: In situ measurement of some soil properties in paddy soil using visible and near-infrared spectroscopy. PloSone, 2016, 11(7): e0159785.

      [36] Shi T, Chen Y, Liu H, Wang J, Wu G. Soil organic carbon content estimation with laboratory-based visible–near-infrared reflectance spectroscopy: Feature selection. Applied Spectroscopy, 2014, 68(8): 831-837.

      [37] Vohland M, Besold J, Hill J, Fründ H C. Comparing different multivariate calibration methods for the determination of soil organic carbon pools with visible to near infrared spectroscopy. Geoderma, 2011, 166(1): 198-205.

      [38] Xu L, Hong Y, Wei Y, Guo L, Shi T, Liu Y, Chen Y. Estimation of organic carbon in anthropogenic soil by VIS-NIR spectroscopy: Effect of variable selection. Remote Sensing, 2020, 12(20): 3394.

      [39] Hong Y, Chen Y, Yu L, Liu Y, Liu Y, Zhang Y, Cheng H. Combining fractional order derivative and spectral variable selection for organic matter estimation of homogeneous soil samples by VIS-NIR spectroscopy. Remote Sensing, 2018, 10(3): 479.

      [40] Hong Y, Chen S, Chen Y, Linderman M, Mouazen A M, Liu Y, Liu Y. Comparing laboratory and airborne hyperspectral data for the estimation and mapping of topsoil organic carbon: Feature selection coupled with random forest. Soil and Tillage Research, 2020, 199: 104589.

      [41] England J R, Viscarra Rossel R A. Proximal sensing for soil carbon accounting. Soil, 2018, 4(2): 101-122.

      [42] Moura-Bueno J M, Dalmolin R S D, Ten Caten A, Dotto A C, Demattê J A. Stratification of a local VIS-NIR-SWIR spectral library by homogeneity criteria yields more accurate soil organic carbon predictions. Geoderma, 2019, 337: 565-581.

      [43] Araújo S R, Wetterlind J, Demattê J A M, Stenberg B. Improving the prediction performance of a large tropical vis-NIR spectroscopic soil library from Brazil by clustering into smaller subsets or use of data mining calibration techniques. European Journal of Soil Science, 2014, 65(5): 718-729.

      [44] Bao Y, Meng X, Ustin S, Wang X, Zhang X, Liu H, Tang H. Vis-SWIR spectral prediction model for soil organic matter with different grouping strategies. Catena, 2020, 195: 104703.

      [45] Gholizadeh A, Rossel R A V, Saberioon M, Bor?vka L, Kratina J, Pavl? L. National-scale spectroscopic assessment of soil organic carbon in forests of the Czech Republic. Geoderma, 2021, 385: 114832.

      Prediction of Soil Organic Carbon Content in Jiangxi Province by Vis-NIR Spectroscopy Based on the CARS-BPNN Model

      WU Jun1, GUO DaQian3, LI Guo2, 4, GUO Xi1, 2, ZHONG Liang1, ZHU Qing1, GUO JiaXin1, YE YingCong1

      1College of Land Resources and Environment, Jiangxi Agricultural University/Key Laboratory of Poyang Lake Watershed Agricultural Resources and Ecology of Jiangxi Province, Nanchang 330045;2Ecological Restoration and Innovation Research Institute of Jiangxi Province, Nanchang 330045;3The National Land and Space Survey and Planning Research Institute of Jiangxi Province, Nanchang 330045;4912 Brigade, Geological Bureau of Jiangxi Province, Nanchang 330045

      【Objective】 This study explored the roles of spectral variable selection and stratified calibration based on soil type in visible–near-infrared (Vis-NIR) spectroscopy for predicting soil organic carbon (SOC) content on a large spatial scale. 【Method】A total of 490 samples were collected in Jiangxi province (Southeast China) and used for modeling with partial least squares regression (PLSR), support vector machine (SVM), random forests (RF), and back-propagation neural network (BPNN). The competitive adaptive reweighted sampling (CARS) procedure was used to select the feature bands of different soil types and total samples (i.e., sum of red soils and paddy soils). The prediction accuracy of models incorporating full bands or feature bands was evaluated for the different soil types. Further, the prediction accuracy of these models based on their global and stratification calibration was compared for the total samples. 【Result】 (1) The feature bands of red soils were 484, 683-714, and 2 219-2 227 nm, while those of paddy soils were 484, 689-702, and 2 146-2 156 nm. The CARS-BPNN model showed the best prediction performance for red soils (validation set2= 0.82), being 0.07 higher than that of BPNN with full bands. The CARS-RF model also had the best prediction performance for paddy soils (validation set2= 0.83), being 0.13 higher than that of RF with full bands. (2) Based on the stratified calibration, the best prediction performance was obtained using the CARS-BPNN model (validation set2= 0.82), which was 0.06 higher than that of the model based on global calibration. 【Conclusion】 The CARS-BPNN model combined with stratified calibration based on soil type could accurately predict SOC content in the study area.

      soil organic carbon; competitive adaptive reweighted sampling; stratified calibration; random forest; back propagation neural network

      10.3864/j.issn.0578-1752.2022.19.005

      2021-12-07;

      2022-03-30

      國家自然科學基金(42071068)

      吳俊,E-mail:JuneWu6667@163.com。通信作者郭熙,E-mail:guoxi@jxau.edu.cn

      (責任編輯 楊鑫浩)

      猜你喜歡
      波段光譜分層
      春日暖陽
      基于三維Saab變換的高光譜圖像壓縮方法
      一種沉降環(huán)可準確就位的分層沉降儀
      雨林的分層
      有趣的分層
      M87的多波段輻射過程及其能譜擬合
      星載近紅外高光譜CO2遙感進展
      中國光學(2015年5期)2015-12-09 09:00:28
      日常維護對L 波段雷達的重要性
      西藏科技(2015年4期)2015-09-26 12:12:58
      苦味酸與牛血清蛋白相互作用的光譜研究
      鋱(Ⅲ)與PvdA作用的光譜研究
      吉林市| 九龙坡区| 石台县| 中阳县| 红安县| 北宁市| 云安县| 屏边| 谢通门县| 琼海市| 英吉沙县| 株洲市| 罗城| 咸阳市| 云安县| 巴彦淖尔市| 三门峡市| 林芝县| 东台市| 普格县| 黄冈市| 山丹县| 年辖:市辖区| 察雅县| 社旗县| 嘉荫县| 西畴县| 界首市| 拉孜县| 含山县| 郸城县| 临江市| 伊吾县| 沙雅县| 西宁市| 尖扎县| 桐城市| 刚察县| 甘肃省| 曲水县| 通河县|