汪甜甜,丁琪洵,梅帥,湯萌萌,江文娟,王強,馬友華
(安徽農(nóng)業(yè)大學資源與環(huán)境學院 農(nóng)田生態(tài)保育與污染防控安徽省重點實驗室,合肥 230036)
土壤具有支持和促進作物生長的潛力,是動植物賴以生存的物質(zhì)基礎(chǔ)。土壤質(zhì)地是土壤穩(wěn)定的物理和自然屬性之一,與土壤的通氣透水性和保水保肥性緊密相關(guān)[1]。土壤質(zhì)地顯著影響土壤細菌群落結(jié)構(gòu)和多樣性,從而影響土壤肥力[2],在耕地質(zhì)量及作物適宜性評價等領(lǐng)域是十分重要的判定指標[3]。通過對土壤質(zhì)地的空間分布進行預(yù)測和制圖,不僅能豐富和完善土壤數(shù)字化數(shù)據(jù)庫,還能為土壤屬性空間分布研究、水分循環(huán)模擬和農(nóng)業(yè)生產(chǎn)規(guī)劃等提供依據(jù)和數(shù)據(jù)支持[4]。
目前,田間采樣是獲取土壤質(zhì)地數(shù)據(jù)最精確的方法[5],但通過該方法獲取大尺度上的土壤質(zhì)地類型空間分布數(shù)據(jù)非常困難[6],需耗費大量人力和物力。遙感技術(shù)具有支持大面積快速獲取田間數(shù)據(jù)和信息的優(yōu)勢,已經(jīng)成為精準農(nóng)業(yè)中最重要的監(jiān)測手段之一,近年來已廣泛應(yīng)用在農(nóng)田土壤屬性空間預(yù)測研究中。
國內(nèi)外很多研究基于遙感技術(shù)對區(qū)域內(nèi)土壤質(zhì)地空間分布特征進行了預(yù)測,從方法學的角度來分析,這些預(yù)測方法和模型大致可分為兩大類:一是基于遙感圖像處理和計算機視覺的土壤質(zhì)地空間預(yù)測方法,包括傳統(tǒng)的圖像處理算法和方法,主要運用不同的特征,如光譜、紋理和顆粒粒徑或含量,通過統(tǒng)計或插值分析來預(yù)測質(zhì)地分布;二是基于機器學習和深度學習的土壤質(zhì)地分類方法,如卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN),實現(xiàn)了準確的預(yù)測結(jié)果[7]。然而,不同預(yù)測方法和模型的選擇需要考慮數(shù)據(jù)源、區(qū)域尺度、環(huán)境變量等因素,不同模型之間的精度并不相同。本文綜述了國內(nèi)外基于遙感技術(shù)的土壤質(zhì)地空間分布預(yù)測研究進展,從輔助數(shù)據(jù)、預(yù)測方法和模型、應(yīng)用條件和精度等方面出發(fā),通過分析應(yīng)用實例與預(yù)測效果,對比得到不同方法和模型的優(yōu)缺點及適用范圍,總結(jié)了不同尺度下遙感對土壤質(zhì)地及環(huán)境變量的監(jiān)測作用與精度驗證方法,以期為開展不同區(qū)域尺度下土壤質(zhì)地空間分布預(yù)測研究提供一定的參考與借鑒。
雷達在白天和黑夜均能探測遠距離的目標,且不受天氣影響,具有全天候、全天時的特點,并有一定的穿透能力,通過雷達開展土壤質(zhì)地的探測,可以充分降低傳統(tǒng)方法的成本和時間,高精度傳感器對土壤質(zhì)地的探測效果則更優(yōu)[8]。夏銀行等[9]的研究指出,在合理選擇探地雷達(Ground Penetrating Radar,GPR)頻率的情況下可以探測出土壤不同顆粒的大小,確定土壤質(zhì)地。Pittman等[10]結(jié)合激光雷達(LiDAR)提取冠層高度模型(CHM)和林隙率作為協(xié)變量,采用隨機森林(Random Forest,RF)和支持向量法(Support Vector Machine,SVM)模型進行土壤質(zhì)地分類,并與其他環(huán)境預(yù)測因子結(jié)合,提高了土壤質(zhì)地模型的精度。Bousbih等[11]將Sentinel-1、Sentinel-2 數(shù)據(jù)的衛(wèi)星濕度產(chǎn)品用作土壤質(zhì)地的指標,基于SVM 和RF 模型的黏土含量分類和映射算法,對突尼斯中部的半干旱區(qū)土壤質(zhì)地進行了估算和制圖。
雷達數(shù)據(jù)可以不受天氣條件和植被覆蓋等約束,高精度地獲取地面土壤質(zhì)地特征,但雷達信號峰值的確定有賴于合適算法的選擇,同時也會受到地表水分和土壤粗糙度的影響。目前基于雷達數(shù)據(jù)還難以直接探測細質(zhì)土壤的粒徑大小,需要借助一些環(huán)境變量作為輔助判斷指標,且探測范圍有限,但隨著高頻信號的獲取和雷達數(shù)據(jù)處理技術(shù)的發(fā)展,運用雷達技術(shù)準確探測土壤質(zhì)地空間分布將成為可能。
地形作為土壤五大成土因素之一,通過影響水熱分布與地表能量再分配來影響土壤物理性質(zhì),因此地形的起伏與土壤質(zhì)地的變化緊密相關(guān)[12]。不少學者通過攝影測量、機載激光掃描等遙感手段獲取數(shù)字高程模型(Digital Elevation Model,DEM)數(shù)據(jù),進行高程、坡度、地形濕度指數(shù)等地形要素數(shù)據(jù)的提取,進而作為輔助變量來預(yù)測土壤質(zhì)地的空間分布。Wu等[13]對西南地區(qū)土壤質(zhì)地的分類研究發(fā)現(xiàn),高程、低地地形分類指數(shù)和流道長度是影響研究區(qū)土壤質(zhì)地等級變化最重要的地形指標。Li 等[14]通過預(yù)測丘陵區(qū)土壤質(zhì)地空間分布,發(fā)現(xiàn)對于坡地,地形濕度指數(shù)對質(zhì)地分布影響最大,而對于梯地,海拔影響最大。研究表明,海拔與土壤顆粒(如黏粒、砂粒)含量可能存在正相關(guān)或者負相關(guān)[15-17],需要結(jié)合研究尺度與其他輔助變量的重要性來具體分析,如在高海拔地區(qū),不同成土母質(zhì)(巖石風化物、坡積物、河流沖積物、湖積物等)對土壤質(zhì)地的影響更顯著。對于尺度和地貌類型不同的研究區(qū)而言,不同地形因子對土壤質(zhì)地空間預(yù)測的貢獻度不盡相同,可以將其分為基礎(chǔ)地形指數(shù)、水文分析指數(shù)和復合地形形態(tài)指數(shù),進一步分析地形因子之間的多元共線性及其與土壤質(zhì)地的相關(guān)性,篩選出土壤質(zhì)地預(yù)測的最佳輔助變量。
土壤質(zhì)地是影響植被分布的主要環(huán)境驅(qū)動因素[18],利用遙感近紅外波段和紅波段計算歸一化差異植被指數(shù)(Normalized Difference Vegetation Index,NDVI),將其作為輔助變量能夠有效提高土壤質(zhì)地遙感預(yù)測精度[19]。Césarda 等[20]基于Landsat-5 數(shù)據(jù)對半干旱區(qū)進行了土壤質(zhì)地分類預(yù)測研究,結(jié)果表明B2、B5、B3/B7 和NDVI 數(shù)據(jù)可以解釋土壤質(zhì)地的大部分空間變異。Wu 等[21]利用NDVI、地形和成土母質(zhì)數(shù)據(jù)進行土壤質(zhì)地的識別研究,發(fā)現(xiàn)對于黏土和砂土,加入NDVI數(shù)據(jù)明顯提高了識別精度。植被指數(shù)還包括比值植被指數(shù)(Ratio Vegetation Index,RVI)、差值植被指數(shù)(Difference Environmental Vegetation Index,DVI)、增強型植被指數(shù)(Enhanced Vegetation Index,EVI)等,為了更好地描述土壤質(zhì)地與植被系統(tǒng),通常會通過土壤調(diào)節(jié)系數(shù)對上述植被指數(shù)進行修正,得到土壤調(diào)節(jié)植被指數(shù)(Soil-adjusted Vegetation Index,SAVI)[22]。此外,土壤水分變化可能對不同質(zhì)地土壤中有機質(zhì)積累產(chǎn)生不同的影響[23],進而反映在遙感光譜特征信息上,借助土壤傳遞函數(shù)及特定分析模型可以預(yù)測其變化關(guān)系[24]。因此,土壤水分也能夠間接反映土壤質(zhì)地的變化特征,利用光譜信息能夠準確獲取指標數(shù)據(jù),有利于加深土壤質(zhì)地空間預(yù)測研究。
光譜響應(yīng)法是指利用土壤顆粒含量和粒徑大小與遙感影像光譜反射率的關(guān)系建立模型或進一步分析來預(yù)測土壤質(zhì)地。土壤光譜反射率與土壤理化性質(zhì)(如土壤粒徑等)密切相關(guān)[25]。曾遠文等[26]通過對土壤粒徑的光譜響應(yīng)特性進行研究,發(fā)現(xiàn)在光譜特定波段范圍內(nèi),土壤粒徑大小和光譜反射率響應(yīng)參數(shù)呈負相關(guān)關(guān)系。曾慶猛等[27]采用3種光譜方法以及3個不同譜區(qū),發(fā)現(xiàn)光譜的斜率及截距等參數(shù)能夠準確反映出土壤質(zhì)地等土壤物理信息。
在地形平緩地區(qū),地形與植被等環(huán)境因素與土壤屬性的協(xié)同程度較低時,光譜響應(yīng)能發(fā)揮極大的優(yōu)勢。王德彩等[28]利用Vis-NIR 光譜代替實驗室方法,建立土壤砂粒、粉砂粒、黏粒含量的預(yù)測模型。劉峰等[29]利用多個波段和多個時相建立“光譜-時間響應(yīng)線”,通過光譜信息散度定量反映光譜差異,有效地揭示土壤質(zhì)地的分布差異。然而,光譜反射率同時也易受到土壤中其他物質(zhì)的影響。王德彩等[30]在研究土壤含水量對土壤質(zhì)地的影響時發(fā)現(xiàn),當土壤建模樣本與驗證樣本水分含量的差異逐漸增大時,土壤質(zhì)地分析精度明顯降低。史惠蘭等[31]分析了高寒草地土壤質(zhì)地差異與土壤養(yǎng)分的空間分異特征,通過光譜信息測定發(fā)現(xiàn)表層土壤中的黏粒含量與碳氮比之間具有顯著正相關(guān)關(guān)系。Blaschek 等[32]研究發(fā)現(xiàn),通過統(tǒng)計分析漫反射光譜的形狀和強度的差異,能夠間接反映土壤水分與黏土含量、黏土礦物和土壤有機碳含量的關(guān)系。
利用光譜響應(yīng)可以快速、可靠地識別土壤質(zhì)地,目前國內(nèi)外應(yīng)用近紅外(NIRS)和中紅外光譜(MIRS)分析土壤質(zhì)地的研究居多,但不能忽略影響光譜反射率的其他土壤因素,如土壤水分、土壤養(yǎng)分等,當土壤水分或有機質(zhì)含量較高時,如何應(yīng)用高光譜遙感反演土壤質(zhì)地還有待研究。
蟻群算法(Ant Colony Algorithm,ACA)用于選擇和優(yōu)化遙感光譜特征波長,近年來在土壤質(zhì)地方面應(yīng)用較為廣泛。ACA 最早于20 世紀90 年代由意大利學者Colorni等[33]提出,這是一種分布式并行群體智能算法,它能夠模擬蟻群覓食的行為,即螞蟻走過留下信息素,以此吸引更多螞蟻帶來更多信息素。根據(jù)這種正反饋路徑上信息素的變化,尋求最優(yōu)特征波長變量,最終達到優(yōu)化土壤光譜預(yù)測模型精度的目的。鄧浩然等[34]運用ACA選擇特征波長,結(jié)合BP神經(jīng)網(wǎng)絡(luò)模型大幅提高了土壤質(zhì)地高光譜預(yù)測精度。ACA 經(jīng)過優(yōu)化后,可以更好地用在土壤質(zhì)地的預(yù)測研究中。張小鳴等[35]采用變量有效性精英蟻群算法(EAS)選擇優(yōu)化后特征波長建立回歸模型,發(fā)現(xiàn)精度明顯優(yōu)于普通蟻群算法。Ding等[36]提出了一種基于限制性多態(tài)蟻群算法(RPACA)的波段選擇算法(RPACA-BS),分類精度高于基于蟻群算法的波段選擇算法(ACA-BS),能夠大幅降低高光譜圖像的維數(shù)。有研究發(fā)現(xiàn),數(shù)學變換結(jié)合微分技術(shù)有利于提高光譜敏感程度,能夠消除由土壤表面散射帶來的影響,因而對土壤顆粒含量的解釋效果相對較好[37];另外,基于拉曼光譜以及顯微圖像,采用多項式擬合與XGBoost 算法能夠更好地優(yōu)化光譜譜線,實現(xiàn)對土壤質(zhì)地的快速判定[38]。綜上,通過選擇和優(yōu)化光譜特征波長,可以獲取土壤質(zhì)地的最佳響應(yīng)波段范圍,進而獲得高精度的預(yù)測模型。
監(jiān)督分類法是遙感解譯的常用方法之一,該方法需要選擇具有典型性的訓練樣本,建立計算機系統(tǒng)能夠自動識別的像元模板。當樣本之間的差異較小時,監(jiān)督分類比非監(jiān)督分類的精度更高。
柏軍華[39]指出利用Landsat-5 的第5 波段進行土壤質(zhì)地分類效果最佳,根據(jù)波段反射率特征對大面積裸土土壤質(zhì)地進行遙感解譯,總體分類精度達到88.6%,Kappa 系數(shù)為0.82(Kappa 系數(shù)的計算基于混淆矩陣,結(jié)果區(qū)間通常在0~1 之間,0.81~1 表示模型預(yù)測結(jié)果和實際分類結(jié)果幾乎完全一致)。王瓊[40]利用Landsat-5 TM數(shù)據(jù)完成監(jiān)督分類后,將研究區(qū)的土壤按照黏粒含量分為砂土、砂壤土、壤土、黏土,使用重新選取的土壤質(zhì)地采樣點作為感興趣區(qū)(Region of Interest,ROI)進行驗證,得到Kappa 系數(shù)為0.86。艾力克木·卡德爾等[41]以Landsat 遙感影像為數(shù)據(jù)源,采用貝葉斯網(wǎng)絡(luò)算法進行監(jiān)督分類,通過具體分類結(jié)果獲取土壤屬性情況,取得了較好的效果。劉煒[42]利用多特征知識建立土地利用/覆被類型的目視解譯方法,識別出研究區(qū)砂壤等地類信息。遙感圖像紋理特征的融合能夠進一步提高分類精度,確定土壤類型與土壤質(zhì)地的分布情況[43]。
通過高分辨率遙感技術(shù)對土壤質(zhì)地空間分布進行預(yù)測,雖然結(jié)果分布圖的空間分辨率高、空間拓撲關(guān)系強,同時節(jié)省了人力物力,但其只適用于土壤大面積完全自然裸露的區(qū)域,對光譜特性較相似的質(zhì)地土壤解譯能力較弱且精度有限。因此,近年來監(jiān)督分類法在質(zhì)地空間分布預(yù)測上的應(yīng)用進展不大。
3.1.1 多元線性回歸
多元線性回歸(Multiple Linear Regression,MLR)是經(jīng)典統(tǒng)計學的一種方法,MLR 模型易于計算和解釋,將可量化的環(huán)境因素與土壤屬性之間的關(guān)系作為土壤屬性空間分布預(yù)測的基礎(chǔ)。張國平等[44]、鐘鑫等[45]、楊煜岑等[46]采用MLR 模型,結(jié)合地形指標及其他土壤因子構(gòu)成數(shù)據(jù)集,準確實現(xiàn)土壤質(zhì)地等土壤屬性的空間分布預(yù)測。梳理大量的研究成果發(fā)現(xiàn),眾多學者將MLR 模型應(yīng)用于小尺度下的土壤屬性空間預(yù)測,此外該模型要求土壤屬性數(shù)據(jù)符合正態(tài)分布特征,但在實際研究分析中常常難以滿足這一條件,因此應(yīng)用不夠廣泛。
3.1.2 多元逐步回歸
多元逐步回歸(Multiple Stepwise Regression,MSR)是在回歸分析的基礎(chǔ)上,逐一將自變量引入模型進行檢驗,每次均保留系數(shù)顯著水平最高的變量,剔除不顯著相關(guān)的變量,以此建立“最佳”的回歸模型。張娜等[47]利用MSR 建立遙感波段反射率與土壤粉砂粒及砂粒含量的反演模型,并利用估測數(shù)據(jù)快速確定了區(qū)域內(nèi)土壤質(zhì)地分布情況,發(fā)現(xiàn)其預(yù)測精度高于MLR 模型。孫孝林等[48]利用MSR 方法構(gòu)建了皖南宣城丘陵研究區(qū)地形指數(shù)與土壤質(zhì)地等土壤屬性間的預(yù)測模型,取得了較高精度。裴忠雪等[49]利用大量土壤樣本,運用MSR 模型證實了土壤孔隙度與土壤有機碳(Soil Organic Carbon,SOC)和全氮(Total Nitrogen,TN)具有緊密關(guān)系,可以通過輔助指標來間接反映土壤質(zhì)地。MSR模型的關(guān)鍵在于回歸變量的選取,該模型克服了MLR模型中自變量之間相互干擾、影響回歸效果等缺點,但其需要較大的樣本量(不宜少于200個)來提取變量之間的線性關(guān)系,否則存在參數(shù)估計的有偏性。而對于某些區(qū)域,土壤質(zhì)地等屬性與環(huán)境變量不一定呈現(xiàn)簡單的線性關(guān)系,因此MSR模型并不適用。
3.1.3 偏最小二乘回歸
偏最小二乘回歸(Partial Least Squares Regression,PLSR)是建立在自變量和因變量矩陣基礎(chǔ)上的雙線性模型。王德彩等[50]引入了正交信號校正(Orthogonal Signal Correction,OSC)光譜預(yù)處理算法建立PLSR 模型,提高了Vis-NIR 光譜土壤質(zhì)地預(yù)測精度。此外,王德彩等[30]還運用PLSR 建立了多組不同土壤水分狀態(tài)下土壤質(zhì)地光譜分析模型,通過模型交叉驗證,對比探究了含水量對土壤質(zhì)地光譜預(yù)測的影響。喬天等[51]研究發(fā)現(xiàn)遺傳算法結(jié)合PLSR(GA-PLSR)運用于土壤質(zhì)地高光譜估測,能夠有效地提高模型預(yù)測精度。曹振等[52]的研究表明基于Landsat-8 數(shù)據(jù),利用PLSR建立的模型對耕地土壤顏色的預(yù)測分類效果更優(yōu)。Alomar 等[53]通過研究證實,采用PLSR 線性多元技術(shù)可以提高Vis-NIR光譜儀對黏土和砂土的預(yù)測精度。大量研究表明,PLSR可以較好地解決各變量之間的多重共線性關(guān)系和樣本數(shù)少于變量數(shù)等問題,能夠保證提取變量與因變量之間的最大相關(guān)性,且易于與其他算法進行優(yōu)化結(jié)合,有效地壓縮了光譜數(shù)據(jù),可以避免連續(xù)光譜建模時出現(xiàn)的過度擬合問題。
統(tǒng)計學回歸模型在土壤質(zhì)地空間分布預(yù)測中考慮了各變量之間的關(guān)系,同時需要一定數(shù)量的土壤樣本來提取土壤質(zhì)地與一些相關(guān)輔助變量之間的線性關(guān)系。模型需要滿足嚴苛的適用條件,才能實現(xiàn)最佳線性無偏估計,因此在尺度較小、土壤樣本數(shù)較多的區(qū)域內(nèi)預(yù)測精度較高。通過統(tǒng)計學模型來研究土壤機械組成與高光譜影像反射率之間的關(guān)系,需要選擇合適的遙感數(shù)據(jù)源,盡量減少土壤中其他物質(zhì)對反射率的影響。
3.2.1 協(xié)同克里格
克里格法(Krigings)是地統(tǒng)計學中應(yīng)用最為廣泛和典型的插值方法,包含多種類型,其中普通克里格(Ordinary Kriging,OK)和泛克里格法(Universal Kriging,UK)均忽略了土壤屬性與環(huán)境要素之間的關(guān)系,而協(xié)同克里格(Co-Kriging,CK)則能避免此弊端,它能將土壤預(yù)測變量與環(huán)境輔助變量結(jié)合起來用于無偏最優(yōu)估計[54]。王德彩等[55]通過引入光譜信息作為輔助變量,在減少主變量(土壤砂粒、黏粒含量)樣本數(shù)量的情況下,運用CK 模型完成研究區(qū)土壤質(zhì)地分布預(yù)測制圖。雖然眾多研究表明,CK 模型能利用輔助變量的空間交互特征,引入環(huán)境變量會提高土壤質(zhì)地遙感預(yù)測精度,但當區(qū)域環(huán)境較為均一,或預(yù)測變量與輔助變量非高度相關(guān)時,CK 的預(yù)測效果不一定會優(yōu)于OK和UK。
3.2.2 回歸克里格
回歸克里格(Regression Kriging,RK)將土壤屬性與輔助變量之間的關(guān)系通過回歸方程擬合,利用克里格法對回歸殘差進行插值預(yù)測,結(jié)合了常規(guī)統(tǒng)計學與地統(tǒng)計學優(yōu)勢[56]。Taylor等[57]認為,當研究選取較多的輔助變量時,RK 的預(yù)測精度要高于CK。申哲等[58]基于對稱對數(shù)比轉(zhuǎn)換,選用高程、土壤類型、NDVI等輔助變量,利用SLR-RK 模型對寧夏海原縣表層土壤顆粒組成的空間分布特征進行預(yù)測,并驗證了其精度。連綱等[59]將研究區(qū)地形因子和土地利用情況作為輔助變量,采用MLR 和RK 模型預(yù)測黃土高原縣域土壤屬性空間分布,結(jié)果表明RK可有效降低預(yù)測殘差,預(yù)測精度要優(yōu)于MLR。當研究區(qū)多個輔助變量對土壤質(zhì)地等屬性特征影響較密切時,RK能夠更精確地擬合變量之間的關(guān)系,從而完成土壤質(zhì)地空間分布預(yù)測。
3.2.3 經(jīng)驗貝葉斯克里格
經(jīng)驗貝葉斯克里格(Experience Bayes Kriging,EBK)是一種通過建立局部模型對非均質(zhì)景觀區(qū)域或非平穩(wěn)數(shù)據(jù)進行空間預(yù)測的插值方法[60]。Samsonova等[60]研究俄羅斯布良斯克州土壤屬性空間變化情況,結(jié)果表明,EBK 由于考慮了空間非均質(zhì)性,對研究區(qū)土壤質(zhì)地等理化性質(zhì)的空間分布特征具有更好的預(yù)測效果。但目前將EBK 用于遙感預(yù)測土壤質(zhì)地的研究應(yīng)用較少,缺乏與其他地統(tǒng)計學方法的對比研究。申哲等[58]的研究表明,雖然EBK在一定程度上考慮了土壤顆粒組成的空間自相關(guān)性,但忽略了研究區(qū)內(nèi)環(huán)境因子的交互影響,比如地形破碎不連續(xù)、南北地區(qū)氣候差異大、水熱不均等,故而EBK 模型對該地區(qū)的土壤顆粒組成預(yù)測精度并不高。
當輔助變量(地形因子、植被指數(shù)等)較多時,RK的預(yù)測精度高于CK;當局部空間規(guī)律變化較大且環(huán)境因素影響較小時,EBK模型可能更為適用。地統(tǒng)計學方法易操作且結(jié)果較為可靠,但地學現(xiàn)象具有復雜性和獨特性,模型的適用度具有局限性。目前,地統(tǒng)計學模型在土壤屬性空間分布預(yù)測方面的應(yīng)用較多,但有時也需對土壤因子進行數(shù)據(jù)變換和檢驗以滿足空間插值的要求,而遙感數(shù)據(jù)能夠提供更加直接有效的環(huán)境變量。
3.3.1 支持向量機
支持向量機(Support Vector Machine,SVM)是基于統(tǒng)計學理論提出的一種模式識別方法,適用于小樣本的分類及回歸分析,且能夠避免傳統(tǒng)方法帶來的局部最優(yōu)缺陷。Bousbih 等[11]基于Sentinel-1、Sentinel-2數(shù)據(jù)和SVM 模型,提出了基于SVM 的黏土含量分類和映射算法,并采用三重交叉方法進行了驗證,SVM分類總體準確率為63%。石偉等[61]利用典型凍土區(qū)遙感、地形和氣候數(shù)據(jù)等不同環(huán)境變量進行組合,通過SVM模型建立土壤-景觀模型,很好地預(yù)測了該地區(qū)土壤類型分布。楊紹鍔等[62]將土壤質(zhì)地粒徑、有機質(zhì)等土壤屬性作為輸入?yún)?shù)項,構(gòu)建SVM模型,實現(xiàn)了土壤水力學參數(shù)的預(yù)測,預(yù)測效果優(yōu)于MSR模型。同時,采用線性SVM模型,利用Sentinel-2等多光譜遙感圖像的時間序列數(shù)據(jù)進行土壤質(zhì)地等固有物理屬性分類也具有可行性,且遠端結(jié)構(gòu)類別(黏土和砂壤土)的分類比中間類別(砂壤土和砂壤土)的分類更準確[63]。
SVM 模型的預(yù)測精度較高,能有效解決變量間的非線性問題,具有與統(tǒng)計學模型耦合的潛力。在土壤屬性空間分布預(yù)測的實際研究中,往往需要解決多分類問題,而SVM 模型基本只能對變量進行二分類,且涉及到矩陣計算,過程復雜,難以處理大批量的土壤訓練樣本,故該模型在土壤質(zhì)地空間預(yù)測方面還存在局限性。
3.3.2 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)通過模擬人腦神經(jīng)元網(wǎng)絡(luò)對信息進行處理,對連續(xù)型變量和類別變量均有很好的預(yù)測效果。王德彩等[64]利用Vis-NIR 光譜數(shù)據(jù),建立了土壤砂粒和黏粒的BP-ANN 模型,結(jié)果表明基于原始光譜主成分的BP-ANN 預(yù)測結(jié)果最好,精度優(yōu)于MSR 模型,能實現(xiàn)對土壤質(zhì)地的高效預(yù)測。孫艷俊等[65]利用改進的ANN 模型——徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Neural Network,RBFNN)建立了土壤顆粒組成與多個地形因子的映射模型,結(jié)果表明,RBFNN 能精確擬合土壤質(zhì)地與各環(huán)境變量之間的非線性關(guān)系,具有較高的預(yù)測精度。Taghizadeh-Mehrjardi 等[66]將地形、氣候、遙感和分類數(shù)據(jù)的環(huán)境協(xié)變量作為預(yù)測因子,構(gòu)建了一系列基于生物啟發(fā)的雜交ANN 模型,來預(yù)測土壤質(zhì)地組分空間分布,研究表明混合神經(jīng)網(wǎng)絡(luò)方法遠優(yōu)于BP-ANN,其中黑金蝶算法(Monarch Butterfly Optimization,MBO-ANN)模型對黏土、粉砂土和砂土的預(yù)測均方根誤差(Root Mean Square Error,RMSE)分別提高了20%、10%和24%。
ANN模型對土壤屬性空間分布具有較好的預(yù)測效果,尤其在大尺度區(qū)域內(nèi)表現(xiàn)良好,能夠有效地利用遙感光譜特征,且模型易于仿生雜交,具有與光譜數(shù)據(jù)結(jié)合進行算法優(yōu)化的潛力,但其屬于黑箱模型,不易于解釋,且計算過程繁瑣,還可能出現(xiàn)過度擬合現(xiàn)象。
3.3.3 隨機森林
傳統(tǒng)的樹模型往往存在精度不高、抗過擬合能力不強的問題。Breiman[67]基于Bagging 方法明確提出隨機森林(Random Forest,RF)算法的概念,并通過實驗證明了RF能有效地解決決策樹模型中出現(xiàn)的過擬合問題,提高模型的泛化能力。Lie? 等[12]利用RF 模型對土壤質(zhì)地進行了空間預(yù)測,得到了研究區(qū)具有砂土、粉土、黏土含量信息的土壤質(zhì)地圖。申哲等[58]基于RK、EBK、RF 3種預(yù)測模型對黃土區(qū)土壤顆粒組成空間分布進行研究,發(fā)現(xiàn)RF 預(yù)測精度最高。Benedet等[68]利用便攜式X 射線熒光光譜(pXRF),發(fā)現(xiàn)pXRF+RF 模型對砂粒、粉粒、黏粒含量的預(yù)測效果要優(yōu)于pXRF+SVM 模型,通過pXRF 和可見近紅外漫反射光譜(Vis-NIR DRS)數(shù)據(jù)可以分別或同時準確地預(yù)測土壤質(zhì)地。
近年來,RF 在土壤屬性空間分布預(yù)測方面的應(yīng)用研究逐漸深入,在環(huán)境因素影響較大、變量間無明顯線性關(guān)系的情況下,RF 的預(yù)測精度通常要高于統(tǒng)計學和地統(tǒng)計學模型,但同ANN 一樣,RF 計算過程較為復雜,且屬于黑箱模型,不易直觀了解土壤屬性與環(huán)境變量之間的定量關(guān)系。
3.3.4 深度學習
目前的深度學習(Deep Learning,DL)模型大多建立在神經(jīng)網(wǎng)絡(luò)之上,即可以通過反向傳播對多層參數(shù)化的可微非線性模塊進行訓練。自動特征提取或直接從給定數(shù)據(jù)中學習是深度學習與機器學習的區(qū)別。CNN 是深度學習模型中較為常見和高效的一種方法,具有超強的圖片特征提取能力。Azadnia 等[69]使用CNN 對20、40、60 cm 深度的土壤紋理圖像進行分類,設(shè)計了基于CNN 模型的土壤質(zhì)地預(yù)測軟件的圖形用戶界面,結(jié)果表明CNN 方法能夠快速準確地預(yù)測大規(guī)模農(nóng)場土壤質(zhì)地類型。Behrens 等[70]使用DL和RF 對土壤、地形數(shù)據(jù)建模,結(jié)果表明使用DL 建模產(chǎn)生了最準確的預(yù)測,平均比使用RF 建模精度提升4%~7%。Shanavas等[71]基于CNN和RF分類器高維光譜數(shù)據(jù)從圖像中提取沙土和黏土百分比、植被指數(shù)等特征進行類型預(yù)測,取得了良好的效果。利用CNN在圖像處理方面的獨特性和高效性,通過ResNet50等架構(gòu)訓練模型,能夠體現(xiàn)DL 在土壤團聚體分類方面的良好性能[72]。DL 模型不需要單獨提取特征,甚至能夠從智能手機中提取圖像,生成特征圖,此外DL能夠提高跨季節(jié)預(yù)測和多時間尺度預(yù)測的能力[73],其局限性在于需要大規(guī)模的數(shù)據(jù)集、大量的內(nèi)存、巨大的計算能力,比其他模型耗時更久。
雖然機器學習模型存在易過度擬合、不易解釋等不足,但該類方法能夠有效地解決土壤屬性與環(huán)境變量之間的非線性問題,且在大范圍區(qū)域內(nèi)表現(xiàn)良好,對于訓練樣本具有自學習功能,已經(jīng)逐漸成為土壤質(zhì)地空間分布預(yù)測的主流方法。隨著時間的推移,深度學習和機器學習模型在數(shù)據(jù)分析與建模方面的作用變得舉重若輕,因為其可以通過大量的數(shù)據(jù)獲得更好的結(jié)果。
土壤質(zhì)地通常受到母質(zhì)、氣候、植被、地形和人為活動影響,采用遙感技術(shù)對土壤質(zhì)地空間分布進行預(yù)測研究時,需要考慮不同研究尺度下遙感獲取表層土壤質(zhì)地和環(huán)境變量的效率與精度,以選擇更加適用的預(yù)測模型。在小尺度區(qū)域下,地形起伏不明顯,地形因子與土壤質(zhì)地之間的關(guān)系較為簡單,氣候、植被等環(huán)境條件相對一致,可直接利用線性回歸模型預(yù)測土壤質(zhì)地空間分布[74]。小尺度下應(yīng)盡可能地挖掘遙感高精度數(shù)據(jù),如利用無人機(Unmanned Aerial Vehicle,UAV)搭載高光譜傳感器獲取更高分辨率、更多波段的地物遙感信息。Gu等[75]從UAV 高光譜和熱圖像中導出NDVI 和地表溫度,使用梯形模型構(gòu)建質(zhì)地-溫度-植被干燥指數(shù)(TTVDI),準確獲取了土壤含水量。楊紅艷等[76]通過UAV 搭載高光譜成像系統(tǒng)增強光譜差異,融合光譜特征、植被特征、地形特征和紋理特征等變量,利用UAV 高光譜低空遙感為土壤質(zhì)地分類提供思路。利用UAV 影像高分辨率和衛(wèi)星豐富的光譜信息的優(yōu)勢,也能提升土壤質(zhì)地預(yù)測精度,如Zhu 等[77]研究發(fā)現(xiàn)UAV 紋理和Sentinel-2B 光譜數(shù)據(jù)的集成提高了土壤變量預(yù)測的準確性;此外利用UAV 高光譜可以對不同土壤質(zhì)地組的光譜重采樣,進而繪制特定區(qū)域內(nèi)土壤質(zhì)地分布圖[78]。而在大尺度區(qū)域,受自然條件影響,經(jīng)過風化、侵蝕、搬運和沉積等不同外力作用形成的成土母質(zhì)對土壤質(zhì)地影響較大,同時若地形錯綜復雜,氣候、植被也會出現(xiàn)明顯變化,土壤質(zhì)地與各環(huán)境變量之間往往表現(xiàn)出非線性特征,此時利用遙感衛(wèi)星進行大范圍監(jiān)測,并結(jié)合地統(tǒng)計學或機器學習模型預(yù)測土壤質(zhì)地效果會更好。
總體來說,遙感對土壤質(zhì)地和各環(huán)境變量的監(jiān)測作用不容小覷。一方面,可以直接利用高通量光譜儀或傳感器測定土壤不同顆粒光譜特征,建立訓練集與驗證集來預(yù)測土壤顆粒含量,如Thomas 等[79]指出在有機碳<5%、黏土含量<60%的典型農(nóng)業(yè)土壤中,激光衍射分析(LDA)和中紅外光譜(MIRS)分析可以廉價、快速、可靠地估測土壤質(zhì)地,并且MIRS 對黏土含量的預(yù)測比LDA 的預(yù)測效果要好得多;Benedet 等[68]利用便攜式X 射線熒光光譜法(pXRF)和可見近紅外漫反射光譜法(VisNIR DRS)分別或串聯(lián)使用,獲取土壤樣本光譜的特定吸收帶,結(jié)合機器學習模型預(yù)測土壤質(zhì)地,結(jié)果表明僅使用pXRF 數(shù)據(jù)的模型表現(xiàn)略優(yōu)于單獨使用Vis-NIR DRS 數(shù)據(jù)的模型。另一方面,可以借助遙感數(shù)據(jù)生成的環(huán)境協(xié)變量作為土壤形成因子,利用植被、地形和土壤濕度等相關(guān)指標間接反映土壤質(zhì)地的變化情況,建立土壤質(zhì)地預(yù)測模型。以往研究表明,莖葉類植物生長期對土壤質(zhì)地更敏感[21],植被指數(shù)與土壤黏粒含量顯著相關(guān),植被生物量與土壤砂粒含量顯著相關(guān)[22],土壤濕潤度與水分變化能側(cè)面反映土壤質(zhì)地[80],因此以上環(huán)境協(xié)變量被廣泛用于土壤質(zhì)地遙感預(yù)測研究。例如:基于平原區(qū)作物植被長勢信息預(yù)測土壤質(zhì)地的分布特征[81];加入植被生物量提高了0~10 cm 土壤黏粒、粉砂粒和砂粒含量的預(yù)測精度[22];通過傳感器測定土壤含水量,模擬土壤濕潤寬度和深度,間接擬合土壤質(zhì)地情況[80];結(jié)合激光雷達得到冠層高度和林隙分數(shù)作為擬合土壤質(zhì)地模型的重要變量[10];結(jié)合Sentinel-1 和Sentinel-2衛(wèi)星的SAR 和光學圖像提取土壤濕度和粗糙度等土壤參數(shù)[11];機載激光掃描或無人機遙感獲取高分辨率的地形數(shù)據(jù)[13];利用遙感影像提取多種植被指數(shù)與紋理特征等光學數(shù)據(jù)[22]。這些環(huán)境協(xié)變量的準確性對土壤質(zhì)地遙感預(yù)測的精度至關(guān)重要。
在土壤質(zhì)地遙感預(yù)測研究中,精度驗證是關(guān)鍵一環(huán)。地面監(jiān)測獲取的土壤質(zhì)地數(shù)據(jù),可分為訓練樣本與驗證樣本,通過對比模型的預(yù)測值和實測的原始值,比較不同建模方法的預(yù)測精度。通常用于模型精度評價的指標包括總體精度、Kappa 系數(shù)、決定系數(shù)(R2)、均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)。Wu 等[13]將土壤質(zhì)地樣本按9∶1 比例隨機分為訓練集與驗證集,用訓練集構(gòu)造分類器,用驗證集評價模型的性能,得到SVM 模型總體精度和Kappa 系數(shù)分別為0.94、0.79;也有學者認為當樣本數(shù)量少于500 時,按4∶1 的比例隨機選取訓練樣本和驗證樣本是合理可行的[58,82]。從以往的研究可以看出,要準確預(yù)測土壤質(zhì)地的空間分布,地面數(shù)據(jù)不可或缺,若直接利用土壤像元反射光譜的遙感方法獲取土壤質(zhì)地信息,應(yīng)盡量選擇植被稀疏的干旱和半干旱地區(qū),或時間序列多光譜圖像識別的裸露土壤地區(qū);若借助遙感數(shù)據(jù)獲取環(huán)境變量,在植被密集地區(qū),可借助遙感植被指數(shù)和其他輔助變量(如地形、母質(zhì))實現(xiàn)土壤質(zhì)地預(yù)測。Wu等[21]利用分類樹在一對一、一對多和多對多3 種方案下對遙感影像識別土壤質(zhì)地分類的有效性進行了評價,研究發(fā)現(xiàn)NDVI+地形和母質(zhì)模型表現(xiàn)最好,總體精度和Kappa系數(shù)分別為0.98、0.92,莖葉類植物生長期的NDVI 是判別流域土壤質(zhì)地類別的最佳時期。Zhou 等[19]利用多時相Sentinel-2 圖像,對植被覆蓋下的我國西南部的一處盆地進行土壤質(zhì)地分類識別,結(jié)果表明結(jié)合Sentinel-2 數(shù)據(jù)和地形、母質(zhì)的支持向量機分類精度最高,總體精度為0.84,Kappa 系數(shù)為0.76,海拔、母質(zhì)和歸一化差異水體指數(shù)(Normalized Difference Water Index,NDWI)是主要預(yù)測因子。眾多研究表明,增加代表植被特征的協(xié)變量可以提高土壤質(zhì)地預(yù)測精度,記錄豐富的作物生長信息的多時相光學影像有助于識別土壤質(zhì)地類別[83-84]。
利用遙感光譜特征及相關(guān)輔助數(shù)據(jù)對土壤質(zhì)地等屬性進行空間分布預(yù)測,較傳統(tǒng)田間調(diào)查方法節(jié)省大量成本。目前,在中小尺度區(qū)域土壤質(zhì)地遙感預(yù)測方面,統(tǒng)計學模型和地統(tǒng)計學模型取得了較高的精度,今后結(jié)合高光譜遙感通過尋找敏感波段可以建立更精確的預(yù)測模型;在大尺度研究下機器學習模型則更具優(yōu)勢,且能很好地對離散型土壤屬性進行預(yù)測,更好地訓練土壤樣本與輔助變量,但最佳預(yù)測模型的選擇仍需要考慮研究區(qū)的空間尺度、數(shù)據(jù)特性和環(huán)境變量等因素。
(1)與其他土壤屬性相比,土壤質(zhì)地時效性更長,未來的挑戰(zhàn)之一是在保證模型預(yù)測精度的情況下,減少地面實測數(shù)據(jù),利用遙感手段合成多類型光譜反射率,深入提取各種遙感光譜特征(如紅邊波段),基于遙感高光譜數(shù)據(jù)開發(fā)一種快速方法來評估土壤顆粒組成情況及其潛在變化,這值得進一步研究和探索。
(2)雷達數(shù)據(jù)、地形因子、植被指數(shù)、土壤濕度等輔助數(shù)據(jù)的精度、質(zhì)量會對模型的預(yù)測精度造成較大影響,目前相對廉價、易獲取的小尺度下的輔助數(shù)據(jù)往往存在分辨率較低的問題,因此開發(fā)合適的降尺度方法、獲取更高分辨率的遙感多時相光學影像與雷達等多源數(shù)據(jù),獲取遙感圖像多尺度紋理信息作為輔助變量進行土壤質(zhì)地數(shù)字制圖,將是未來土壤質(zhì)地空間預(yù)測研究的方向。
(3)機器學習模型相較其他模型表現(xiàn)出巨大的優(yōu)越性,基于深度學習和機器學習的土壤質(zhì)地分類方法減少了對空間模型和預(yù)處理方法的依賴。未來針對大規(guī)模遙感數(shù)據(jù)集,耦合統(tǒng)計學和機器學習模型機理,結(jié)合地理鄰近性和光譜相似性,深入挖掘深度學習算法,將土壤物理過程模型與數(shù)據(jù)驅(qū)動機器學習的多功能性相結(jié)合,開發(fā)多算法混合模型在土壤質(zhì)地遙感預(yù)測方面具有巨大的潛力。
農(nóng)業(yè)資源與環(huán)境學報2023年6期