李迎雙,李恒凱*
1.江西理工大學土木與測繪工程學院,江西贛州 341000
土地荒漠化是發(fā)生在干旱、半干旱及半濕潤地區(qū)的土地退化過程,當今人類所面臨的重大環(huán)境與社會問題之一,嚴重威脅著我國生態(tài)安全與經濟社會發(fā)展[1]。稀土是我國寶貴的戰(zhàn)略資源,是很多高精尖產業(yè)必不可少的原料。我國離子型稀土資源占世界同類資源的90%,贛南離子型稀土資源就占到全國同類資源的2/3,極具稀缺性和不可替代性[2]。然而,礦產資源開發(fā)在促進當?shù)亟洕l(fā)展的同時,也因長期大規(guī)模的開發(fā)給當?shù)卦斐闪朔浅乐氐耐恋鼗哪瘑栴}。
稀土開采帶來的礦區(qū)地表荒漠化問題,是一個長期的歷史過程,與南方丘陵地區(qū)特殊的紅壤背景、離子稀土獨特的成礦方式以及在不同歷史階段的開采工藝有緊密聯(lián)系。目前,利用遙感影像對礦區(qū)荒漠化進行動態(tài)監(jiān)測已成為區(qū)域尺度荒漠化的有效監(jiān)測評價方式[3-4]。隨著遙感數(shù)據時空分辨率的提高、數(shù)據共享性的增加以及遙感信息處理技術的進一步發(fā)展,其在土地荒漠化監(jiān)測中的應用將更加客觀、科學和可靠。近年來,隨機森林算法因具有極好的準確率,處理多維數(shù)據能力強,訓練和預測速度快的特點,已在土地利用分類[5]、病蟲害監(jiān)測[6]、植被生物量計算[7]等方面得到應用,顯示出較強的應用潛力。Landsat 衛(wèi)星系列是迄今持續(xù)時間最長的地球監(jiān)測衛(wèi)星項目,豐富的數(shù)據為研究更大時空范圍的礦區(qū)地表荒漠化演變過程提供了重大的機遇?;诖?,本研究以隨機森林算法為基礎,提取了1986-2019 年間29 期嶺北稀土礦區(qū)土地荒漠化信息,并制作了土地荒漠化分類專題數(shù)據集,以期為稀土礦區(qū)荒漠化演變過程的認知和生態(tài)環(huán)境治理提供決策支持。
贛南地區(qū)位于江西省南部,地形分布以山地、丘陵為主,屬于南方丘陵地區(qū),易發(fā)生崩塌、滑坡、泥石流等自然地質災害。同時贛南地區(qū)的礦產資源十分豐富,享有“稀土王國”的美譽。南方離子型稀土礦區(qū)以定南縣嶺北地區(qū)為主,其位置如圖1 所示,其儲量達到整個離子型稀土產量的70%,采礦現(xiàn)象極為嚴重。近30 年來,由于人類對于贛南離子型稀土礦的開發(fā)利用,礦區(qū)生態(tài)環(huán)境日益惡化,贛南地區(qū)不同礦區(qū)的荒漠化程度也發(fā)生著明顯的變化。2001 年以前,以池浸、堆浸采選工藝為主要方式。該工藝在開采過程中需剝離表土和礦體,容易造成植被退化、水土流失,加上開采規(guī)模的不斷擴大,礦區(qū)、浸池周邊堆積的大量廢石和尾砂,會導致土地沙化和荒漠化地表;2002 年以后,開采方式主要以原地浸礦為主,該開采方式雖然在一定程度上減少了對生態(tài)環(huán)境的破壞,但并未從根本上改變開采方式。而且由于不可避免發(fā)生浸礦液體泄漏,并產生大量的尾渣、廢液,會導致更大范圍的生態(tài)破壞,植被茂密的山地變成裸露的地表,從而帶來水域污染、植被破壞、土地荒漠化等問題[8-9]。
圖1 研究區(qū)地理位置
本研究采用了1986-2019 年中的29 期Landsat 5 TM、Landsat 7 ETM+和Landsat 8 OLI 影像,空間分辨率均為30 m。數(shù)據來源于地理空間數(shù)據云和美國地質勘探局(USGS)官網,表1 為選取長時序變化監(jiān)測分析影像數(shù)據的詳細信息??紤]到南方地區(qū)常年多云多雨,因此影像采集時間均集中在10 月至次年1 月,時相基本接近,且由于研究區(qū)位于南方區(qū)域,無明顯四季變化,常年植被覆蓋,能夠確保同類地物光譜一致性。其中1992 年、1998 年、2007 年、2012 年、2015 年因云量和回訪周期等因素影響,無合適影像選擇。DEM 數(shù)據來自于2009 年美國航空航天管理局(NASA)和日本經貿及工業(yè)部(METI)共同發(fā)布的空間分辨率為30 m 的DEM,與多光譜圖像分辨率一致。嶺北礦區(qū)邊界是2010 年贛州市實測的拐點坐標生成的矢量邊界。
針對Landsat 系列數(shù)據,預處理過程包括:輻射定標、大氣校正、幾何校正和影像配準。其中大氣校正采用的FLAASH 模型;幾何校正則采用二次多項式進行校正;影像配準以2013 年的Landsat 8 OLI 影像作為參考,對其他的影像進行配準;最后利用2010 年贛州市實測的拐點坐標生成的嶺北礦區(qū)矢量邊界對Landsat 影像進行剪裁和掩膜,得到研究區(qū)的影像。
隨機森林算法由Leo Breiman 于2001 年提出,是一種基于Bagging 集成學習理論的分類器,通過訓練樣本和變量的子集建立一系列決策樹,每棵決策樹都是一個分類器,對于一個輸入樣本,N 棵樹會有N 個分類結果,而隨機森林算法集成了所有的分類投票結果,將投票次數(shù)最多的類別指定為最終的輸出[10]。這種方法不需要先驗知識,易于使用,在當前所有算法中,具有極好的準確率,并能容忍一定的噪聲和異常值,是一種高效靈活的機器學習算法。本研究基于Landsat 影像和地形特征,選取了光譜特征變量、紋理特征變量以及地形特征變量3 種類型的指標參與分類。實驗流程如圖2 所示。
1.4.1 特征選擇
光譜特征變量分別提取了Landsat 影像的Blue 波段、Red 波段、Green 波段、Nir 波段、Swir 波段,歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI),地表反照率(Albedo)。其中,NDVI 作為指示植被生產力的直接指標,已成為土地荒漠化遙感監(jiān)測研究中的重要依據[11],如式(1)所示?;哪潭戎鸩郊又剡^程中,地表植被減少,水量降低,裸露表面的粗糙度降低,Albedo 增加。因此,Albedo 可作為反映荒漠化程度的重要參數(shù)[12]。Albedo 的計算采用Liang S[13]建立的反演模型完成,如式(2)所示。
圖2 數(shù)據處理流程圖
式(1)和式(2)中:地表反照率為Albedo,ρBlue,ρRed,ρNIR,ρSWIR1,ρSWIR2分別為所選數(shù)據的Blue波段、Red 波段、Nir 波段、Swir1 波段、Swir2 波段的反射率,NDVI 為植被指數(shù)。
紋理特征變量是利用灰度共生矩陣在原始多光譜數(shù)據基礎上分別提取圖像的紋理特征,包括均值(MEA)、方差(VAR)、同質性(HOM)、對比度(CON)、非相似性(DIS)、熵(ENT)、二階矩(SM)、相關性(COR)共8 個參數(shù)[14],各項指標計算公式如下。通過灰度共生矩陣獲得紋理特征量后,采用主成分分析(PCA)獲取合適的紋理波段數(shù)據,選取信息量在占95%以上的成分作為紋理特征變量。
其中,用Pδ表示灰度共生矩陣,Pδ(i,j)表示矩陣元素,i,j分別為兩個像素的灰度,N為圖像的灰度級數(shù),δ為兩個像素間的位置關系,u為Pδ(i,j)均值,ui、uj表示均值,σi2、σj2表示方差。
高程特征變量是利用GDEM 影像提取的,并利用嶺北礦區(qū)邊界進行剪裁,得到研究區(qū)DEM。
1.4.2 建立荒漠化解譯標志
荒漠化程度不僅是直接反映土地荒漠化嚴重程度的指標,也是間接反映和衡量荒漠化土地恢復生產力和恢復生態(tài)系統(tǒng)功能難易程度的指標[15]。因此,本實驗針對嶺北地區(qū)地表荒漠化狀況,結合水利部組織制定的《南方丘陵山區(qū)水土流失綜合治理技術標準》(SL757-2014)[16]以及實地調研,利用Google 高分影像確立了不同荒漠化程度的解譯標志如表2 所示,并以此為土地荒漠化分級標準進行評價。
表2 稀土礦區(qū)土地荒漠化解譯標志
1.4.3 樣點選取與分類
本實驗借助ENVI 平臺完成,訓練過程如下:①隨機抽樣訓練決策樹:從谷歌影像上選取訓練樣本,如圖3 所示。采用bootstrap 方法隨機且有放回地從原始樣本中抽取N 個訓練樣本,每次大約抽取原始訓練樣本的2/3,生成樣本集,選擇好的樣本用來訓練決策樹,并作為決策樹根節(jié)點處的樣本。②隨機選取屬性做節(jié)點分裂屬性:在每棵樹生長過程中,決策樹的每個節(jié)點需要分裂,隨機從這M 個特征變量中選取出m 個,滿足條件m< 1986-2019 年贛南嶺北稀土礦區(qū)土地荒漠化數(shù)據集共計29 期數(shù)據,每期數(shù)據以相應的年份命名,總數(shù)據量為1.69 MB??臻g分辨率均為30 m,投影坐標為UTM 50N,坐標系為WGS1984。2018 年嶺北礦區(qū)土地荒漠化分級如圖4 所示。 本文采用高分辨率數(shù)據來評價荒漠化分級數(shù)據的質量,從定量角度出發(fā)對嶺北礦區(qū)土地荒漠化分級結果進行精度評價。以2018 年數(shù)據為例,在2018 年Google Earth 高分辨率影像上隨機選取樣點200 個進行精度驗證,每種荒漠化土地類型各占50 個。結合不同荒漠化程度的解譯標志和影像特征(圖3),并以此為真實的土地荒漠化標準進行評價,對嶺北礦區(qū)荒漠化土地分級情況進行評價驗證。建立誤差矩陣如下,并計算出分類總體精度和Kappa 系數(shù),來評價荒漠化信息提取的精確度??傮w精度表明了每一個隨機樣本的分類結果與真實地物類型一致的概率,Kappa 系數(shù)考慮了混淆矩陣的所有元素,能全面反映總體分類精度,公式如下。 式中:pc為總分類精度;m為分類類別數(shù);N為樣本總數(shù)。Pkk為第k 類的判對樣本數(shù)。 式中:K為Kappa 系數(shù);N為總樣本數(shù);ppi為某一類所在列總數(shù);pli為某一類所在行總數(shù)。 圖4 2018 年土地荒漠化分級圖 表3 分類精度誤差矩陣 按照表3 中的數(shù)據計算得,本實驗中基于隨機森林算法得到的稀土礦區(qū)土地荒漠化分級結果總體精度為93%,Kappa 系數(shù)為90.67%,滿足精度要求。 離子吸附型稀土由于特殊的開采方式及紅壤背景,帶來礦區(qū)大面積土地退化及荒漠化,因此準確了解礦區(qū)土地荒漠化發(fā)生發(fā)展的過程,對于礦區(qū)生態(tài)治理與恢復至關重要。本數(shù)據集以Landsat 影像為主要的數(shù)據來源,結合野外調查和Google 高分影像,隨機選取樣本點驗證,以嶺北礦區(qū)為研究區(qū),制備了1986-2019 年間29 期嶺北礦區(qū)土地荒漠化數(shù)據集。一方面在較大時空尺度上驗證了隨機森林算法在南方紅壤區(qū)提取礦區(qū)土地荒漠化信息的適用性,另一方面為定量監(jiān)測和分析礦區(qū)荒漠化動態(tài)變化特征和規(guī)律,以及不同稀土開采模式、管理手段以及復墾措施對礦區(qū)土地荒漠化的影響奠定了數(shù)據基礎。 1986-2019 年嶺北礦區(qū)土地荒漠化數(shù)據集保存格式為TIF,ArcGIS、QGIS、ENVI、ERDAS 等常用的GIS 與遙感軟件均支持本數(shù)據集的讀取和操作。 致 謝 感謝USGS 和地理空間數(shù)據云提供Landsat 系列數(shù)據。 數(shù)據作者分工職責 李迎雙(1995—),女,湖北省安陸市人,碩士研究生,研究方向為礦區(qū)環(huán)境遙感。主要承擔工作:數(shù)據預處理及土地荒漠化信息提取。 李恒凱(1980—),男,湖北省安陸市人,博士,副教授,主要研究方向為遙感建模與分析。主要承擔工作:總體方案設計,數(shù)據質量控制,數(shù)據論文修改。2 數(shù)據樣本描述
3 數(shù)據質量控制與評估
4 數(shù)據價值
5 數(shù)據使用方法和建議