王書韜,史明昌,陳春陽,陳靖濤
(北京林業(yè)大學水土保持學院,100083,北京)
土壤侵蝕易導致土壤退化,土質惡化和作物減產(chǎn),威脅生態(tài)環(huán)境和社會經(jīng)濟的可持續(xù)發(fā)展。高效、精準分析區(qū)域土壤侵蝕空間分布信息,把握生態(tài)環(huán)境的時空格局和演變規(guī)律,為生態(tài)修復和土地優(yōu)化利用決策提供支撐,對調節(jié)土壤侵蝕風險具有重要意義[1]。
土壤侵蝕的研究結果受尺度效應影響較明顯,該區(qū)域土壤侵蝕空間分布研究主要是在>100 km2的區(qū)域研究土壤侵蝕在空間上的分布格局和規(guī)律,研究仍處于探索階段[2]。深度學習可使用多隱藏層、多感知器的網(wǎng)絡結構,抽象、深層次獲取屬性和特征[3]。近年來,有學者應用傳統(tǒng)神經(jīng)網(wǎng)絡模型對土壤侵蝕空間分布進行有益探索,但該類模型缺乏對區(qū)位信息的考慮,對深層信息的表達有待提高[4]。
針對傳統(tǒng)神經(jīng)網(wǎng)絡的不足,筆者在區(qū)域尺度上,引用UNet++ 神經(jīng)網(wǎng)絡,利用多層卷積核,建立土壤侵蝕因子和強度之間的深層聯(lián)系,借助具有局部感知空間信息特點的感受野,表達區(qū)位信息,優(yōu)化土壤侵蝕空間模型。
湖北省位于長江中游地區(qū),地處第二、三階梯的過渡帶,地貌類型多樣;海拔西高東低,存在明顯空間差異;土壤和植被類型復雜,包括水稻土、潮土、黃棕壤等土類,木本植物達1 300余種。湖北省林冠層覆蓋度較大,但70%為針葉林,導致林下水土流失嚴重。
地理空間數(shù)據(jù)云發(fā)布的30 m分辨率Landsat 8 OLI遙感數(shù)據(jù); NASA發(fā)布的30 m分辨率ASRTER GDEM V2數(shù)據(jù);南京土壤所發(fā)布的1∶100萬土壤數(shù)據(jù);中科院資源與環(huán)境中心發(fā)布的1 km分辨率湖北省2015年土壤侵蝕空間分布數(shù)據(jù);湖北省及周邊108個氣象站點2015年逐月降水數(shù)據(jù)。
筆者選擇降雨侵蝕力、土壤可蝕性、地表覆蓋、植被覆蓋、坡度、地形起伏度因子作為土壤侵蝕空間分布信息的輸入因子,各因子計算方法[5-10]如表1所示。
根據(jù)神經(jīng)網(wǎng)絡特點,在Jupyter Notebook平臺對植被覆蓋因子和地表覆蓋類型進行處理,將非植被類型設為0,對地表覆蓋類型進行獨熱編碼,通過UNet++ 神經(jīng)網(wǎng)絡的自動擬合能力,獲取地表覆蓋因子,避免因子間的共線性問題。
將湖北省的降雨侵蝕力、土壤可蝕性、地表覆蓋、植被覆蓋、坡度和地形起伏度因子空間分布柵格數(shù)據(jù)進行疊加,獲取含各因子空間分布信息的數(shù)據(jù)集。將數(shù)據(jù)集按面積平均分成10個區(qū)域,在Jupyter Notebook平臺下,通過tf.random_clip模塊在各區(qū)域內隨機提取100個16×16像元窗口。將像元窗口按1∶1分為訓練集和驗證集,用于UNet++ 神經(jīng)網(wǎng)絡訓練。
BP神經(jīng)網(wǎng)絡以UNet++ 神經(jīng)網(wǎng)絡訓練集和驗證集窗口內的像元作為訓練集和驗證集。
表1 土壤侵蝕因子計算方法Tab.1 Calculation method of soil erosion factor
UNet++ 神經(jīng)網(wǎng)絡是Unet模型的改進算法[11](圖1)。模型計算土壤侵蝕空間分布過程為:訓練集輸入模型,對土壤侵蝕各因子進行卷積計算,完成區(qū)位和深層信息的表達,映射至卷積層;經(jīng)過池化操作,完成土壤侵蝕因子深層信息的簡化和裁剪,傳遞到池化層;經(jīng)過轉置卷積操作,進行土壤侵蝕因子的分析表達,上采樣為含土壤侵蝕空間分布擬合結果的像元窗口,作為模型輸出;將訓練集輸出結果與對土壤侵蝕空間分布數(shù)據(jù)對比,獲取訓練精度;借助優(yōu)化算法,對卷積核的權重進行調整,實現(xiàn)模型訓練;將驗證集像元窗口輸入模型,輸出結果與真實的土壤侵蝕分布數(shù)據(jù)對比,防止模型過擬合。訓練精度與驗證精度均達預期,表示模型訓練完成;將研究區(qū)土壤侵蝕因子輸入訓練完成的模型運算,獲得全區(qū)域的土壤侵蝕空間分布結果和總體精度。
UNet++ 神經(jīng)網(wǎng)絡構造設定為卷積層、池化層和轉置卷積層各4層,可以保持模型的復雜度和魯棒性。卷積操作中,前2層卷積核設置為5×5像元、后2層為3×3像元,通過改變感受野大小,實現(xiàn)不同尺度下土壤侵蝕因子深層信息的分析。池化層選擇池化單元為2的最大池化方法,對土壤侵蝕因子進行降維和去除冗余。轉置卷積層根據(jù)卷積層設置,對圖層信息進行分析和上采樣操作,保證模型輸入輸出的空間一致性。
土壤侵蝕的發(fā)生、發(fā)展具有連續(xù)和非負性,對比tan、RELU等函數(shù),激活函數(shù)(Activation Function)選擇sigmoid函數(shù),如式(1),更符合土壤侵蝕物理意義,便于求導,對數(shù)據(jù)有壓縮和土壤侵蝕因子標準化的功能,便于向前傳輸。
(1)
式中:S(x)為輸出;x為輸入。
丟失率用式(2)的交叉熵損失函數(shù)(Cross Entropy Loss)。該函數(shù)能保持較高梯度狀態(tài),改進sigmoid函數(shù)在訓練結果接近真實值時的梯度彌散現(xiàn)象[12]。
H(p,q)=-∑(p(x)lgq(x))。
(2)
式中:H(p,q)為交叉熵;p(x)為實際輸出概率;q(x)為期望輸出概率。
Kingma等[13]試驗證明,梯度下降方法選用Adam優(yōu)化器,在大型模型和數(shù)據(jù)集的情況下,能高效解決局部深度學習問題,適用于區(qū)域尺度土壤侵蝕空間分布研究。
利用BP神經(jīng)網(wǎng)絡前饋型人工神經(jīng)網(wǎng)絡的原理[14](圖1),計算過程為:將訓練集像元輸入模型中,映射至隱含層;通過矩陣運算,獲得土壤侵蝕強度作為模型輸出;將輸出結果與土壤侵蝕空間分布數(shù)據(jù)對比,獲取訓練精度;調整神經(jīng)元權重,進行模型訓練;借助驗證集觀察過擬合情況;訓練完成后,將土壤侵蝕各因子輸入模型,獲得研究區(qū)整體土壤侵蝕空間分布結果和總體精度。
圖1 BP和UNet++ 神經(jīng)網(wǎng)絡框架Fig.1 BP and UNet++ network structure
BP神經(jīng)網(wǎng)絡包含4個隱藏層,各層神經(jīng)元數(shù)分別設置為64、128、256、512個。其余超參數(shù)設置與UNet++ 保持一致。
如圖2所示,UNet++ 神經(jīng)網(wǎng)絡隨訓練次數(shù)增加,訓練精度和驗證精度不斷提高,直至訓練4萬5 000次后,訓練精度和驗證精度出現(xiàn)震蕩并逐漸平穩(wěn),說明模型難以進一步優(yōu)化土壤侵蝕擬合結果。最終用于土壤侵蝕空間分布研究的UNet++ 模型驗證精度為96.52%。
BP神經(jīng)網(wǎng)絡隨迭代次數(shù)增加,驗證精度先增大后減小,說明模型已出現(xiàn)過擬合現(xiàn)象,繼續(xù)訓練會導致模型對訓練集外的土壤侵蝕空間分布結果擬合精度下降。最終用于土壤侵蝕強度空間分布研究的BP神經(jīng)網(wǎng)絡驗證精度為94.91%。
圖2 模型訓練過程Fig.2 Training process of neural networks
采用BP神經(jīng)網(wǎng)絡和UNet++ 神經(jīng)網(wǎng)絡對研究區(qū)進行試驗,用式(3)總體精度(overall accuracy)作為指標對土壤侵蝕空間分布結果進行評價。表2評價結果顯示,UNet++ 神經(jīng)網(wǎng)絡總體精度為95.7%,BP神經(jīng)網(wǎng)絡總體精度91.4%,均超過90%,說明深度學習模型都能較好反映真實土壤侵蝕空間分布狀況;UNet++ 神經(jīng)網(wǎng)絡精度比BP神經(jīng)網(wǎng)絡高4.3%,在評價精度上表現(xiàn)更為優(yōu)越。
(3)
式中:OA為總體精度;n為像元數(shù);kk為坐標中(k,k)處位置;akk為(k,k)處像元。
表2 不同模型侵蝕結果總體精度對比Tab.2 Overall accuracy comparison of erosion resultsby different models %
獲取侵蝕空間分布(圖3),根據(jù)SL190—2007《土壤侵蝕分類分級標準》,統(tǒng)計結果中各級土壤侵蝕強度像元數(shù)、面積(表3),結果表明:1)2種模型計算所得土壤侵蝕空間分布結果在空間格局上與真實數(shù)據(jù)具有一致性;2)2種方法得到的土壤侵蝕空間分布結果均未出現(xiàn)明顯區(qū)塊化特征,未呈現(xiàn)與單一因子空間分布趨勢一致性過高的現(xiàn)象;3)BP神經(jīng)網(wǎng)絡結果中,中部微度侵蝕集中區(qū)域呈現(xiàn)大量點狀分布的極強度侵蝕像元“椒鹽”現(xiàn)象;UNet++ 神經(jīng)網(wǎng)絡結果中未出現(xiàn)明顯“椒鹽”現(xiàn)象;4)BP神經(jīng)網(wǎng)絡和UNet++ 神經(jīng)網(wǎng)絡結果中各級土壤侵蝕強度面積的構成與真實數(shù)據(jù)接近。
圖3 土壤侵蝕強度空間分布對比圖Fig.3 Comparison of spatial distribution of soil erosion
表3 侵蝕強度面積統(tǒng)計
圖4 不同模型的誤差空間分布圖Fig.4 Error space distribution among the different models
由表3可得:BP神經(jīng)網(wǎng)絡結果中,微度、輕度、中度、強度、極強度侵蝕面積誤差分別為-2.53%、0.33%、5.41%、8.10%、166.99%。極強度侵蝕面積僅占湖北省全區(qū)域的0.49%,訓練集樣本數(shù)量嚴重不足,導致識別能力差。如圖4所示,BP神經(jīng)網(wǎng)絡結果中,在西北部高山區(qū)和中部平原區(qū)錯分像元呈明顯的聚集型分布。對比高山區(qū)錯分像元分布坡度因子發(fā)現(xiàn),誤差大部分發(fā)生在坡度因子較高的地方,說明隨坡度因子增大,模型對其敏感度下降。平原區(qū)誤差聚集于地形起伏度<5 m的區(qū)域,是由于激活函數(shù)將地形起伏度因子中較小的值進一步壓縮導致該區(qū)域坡度因子未能正常反映侵蝕輕度的實際情況。
UNet++ 神經(jīng)網(wǎng)絡結果中,微度、輕度、中度、強度和極強度侵蝕面積誤差分別為-0.55%、12.51%、-5.58%、-19.61%和6.38%。輕度侵蝕誤差較大,錯分像元主要分布在微度、輕度和強度侵蝕交織處,區(qū)域內輕度侵蝕比例大,模型訓練該類像元窗口時,易將微度和中度侵蝕錯分為輕度侵蝕。強度侵蝕面積誤差較大主要是由于比例僅3.99%,樣本數(shù)量少。極強度侵蝕比例更小,卻與BP神經(jīng)網(wǎng)絡一樣出現(xiàn)誤差,是由于該類型侵蝕集中分布,且UNet++ 神經(jīng)網(wǎng)絡以像元窗口的形式輸入,對集中分布的侵蝕類型有較好的識別能力。
如圖4所示,Unet++ 結果未呈現(xiàn)明顯聚集型分布,錯分像元未聚集在土壤侵蝕強度較大或較小區(qū)域,說明該模型能較好擬合土壤侵蝕因子極端區(qū)域。用像元窗口對UNet++ 誤差進行區(qū)域分析,發(fā)現(xiàn)錯分像元集中在2類像元窗口中。一類像元窗口內有4個土壤侵蝕因子跨度>50%;另一類像元窗口為微度、輕度和中度侵蝕交織處。2類像元窗口誤差的產(chǎn)生原因都是由于樣本數(shù)量不足,導致模型難以針對該情況進行擬合。
選擇降雨侵蝕力、土壤可蝕性、地表覆蓋、植被覆蓋、坡度和地形起伏度因子作為輸入數(shù)據(jù),利用UNet++ 神經(jīng)網(wǎng)絡輸出結果,總體精度達95.7%,與真實數(shù)據(jù)在空間格局上具有一致性;誤差在各強度侵蝕、空間分布上都較為均勻,沒有明顯誤差聚集現(xiàn)象和“椒鹽”現(xiàn)象,該模型可以用于土壤侵蝕強度空間分布計算。
結合sigmoid函數(shù)和交叉熵損失函數(shù)能在符合土壤侵蝕物理意義的情況下,改進梯度彌散現(xiàn)象;使用Adam優(yōu)化算法能修正梯度,能有效避免模型過早進入局部最優(yōu)解范圍的同時,保證模型的訓練速度。
湖北省位于長江中游,是長江徑流里程最長的省份,地貌、土壤和植被狀況復雜,土壤侵蝕狀況對長江水質具有較大影響。利用其地形、植被、土壤多樣性的特點,模型訓練過程中能夠減少過擬合現(xiàn)象的發(fā)生,最終建立推廣性強的深度學習模型。
構建的UNet++ 神經(jīng)網(wǎng)絡,在輸入數(shù)據(jù)和模型參數(shù)上,是傳統(tǒng)BP神經(jīng)網(wǎng)絡的百倍以上;如圖2所示,UNet++ 神經(jīng)網(wǎng)絡的迭代次數(shù)也是BP神經(jīng)網(wǎng)絡的3倍左右;隨著輸入數(shù)據(jù)量的增加,精度會提高,但運算時間隨之幾何增長?,F(xiàn)階段根據(jù)不同生產(chǎn)需求,學者對土壤侵蝕分辨率選擇存在差異,劉寶元等選取10 m分辨率對中國水力侵蝕進行抽煙調查[15];BATJES等選取0.5°分辨率對全球的土壤侵蝕進行研究[16]。1 km分辨率土壤侵蝕等級空間分布信息足以支撐省級區(qū)域的資源調查評價、植被的土壤保持效應評估[15,17]; 選用1 km分辨率的土壤侵蝕因子作為輸入數(shù)據(jù),可以滿足生產(chǎn)需要,同時縮短模型運算時間。
本模型加入地形起伏度,表達徑流路徑對侵蝕的影響,更切實地反映區(qū)域侵蝕特征,模型建立的各因子與侵蝕強度間的聯(lián)系,更適合中國復雜的地形狀況。在地表覆蓋因子的分類上仍存在不足,未劃分永久灌概地及稻田,未考慮作物種類及作物輪作。