• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      隨機森林算法在干旱區(qū)土地利用遙感分類中的應用研究

      2017-03-29 14:09:08韓燕王玲羅沖
      關鍵詞:波段土地利用重要性

      韓燕,王玲,羅沖

      (石河子大學理學院地理系,新疆 石河子 832003)

      隨機森林算法在干旱區(qū)土地利用遙感分類中的應用研究

      韓燕,王玲*,羅沖

      (石河子大學理學院地理系,新疆 石河子 832003)

      為了驗證隨機森林算法在干旱區(qū)土地利用遙感分類中的效果,本文采用隨機森林算法,結合Landsat8遙感影像以及DEM、NDVI等輔助數(shù)據(jù),解譯了干旱區(qū)典型流域瑪納斯河流域的土地利用圖。分析結果表明:(1)分析決策樹數(shù)量(k)和分類變量數(shù)量(m)對分類精度具有很大影響。通過優(yōu)化2個參數(shù)得到最優(yōu)隨機森林模型,當k取103、m取6時,模型分類精度可達95%;(2)通過土地利用分類精度的影響因子分析發(fā)現(xiàn),海拔高程和歸一化植被指數(shù)對土地利用分類的影響程度比坡向的影響更大。(3)通過分類結果對比分析發(fā)現(xiàn),應用隨機森林算法分類的精度比用最大似然法的分類精度高9%,利用變量重要性篩選出的遙感波段構建優(yōu)化隨機森林模型,能有效降低遙感數(shù)據(jù)源數(shù)據(jù)量,而Kappa系數(shù)保持在0.97不變。隨機森林算法可以在干旱區(qū)土地利用分類中廣泛應用。

      遙感,土地利用分類,隨機森林,干旱區(qū)

      土地利用遙感分類是目前進行土地利用變化成因、現(xiàn)狀、趨勢以及相關研究的主要技術手段[1]。利用遙感影像解譯出的土地利用資料克服了傳統(tǒng)的土地調查需要大量的人力和財力投入和不能勝任區(qū)域土地變更的實時快速更新等諸多問題[2,3]。遙感數(shù)據(jù)分類與其他學科的分類研究相比具有數(shù)據(jù)量大、變量多、地表環(huán)境復雜等特點。如何利用這些數(shù)據(jù)高精度提取地表專題信息一直是該領域的研究重點[4-6]。

      隨機森林算法被譽為目前分類精度最高、最為穩(wěn)定的分類算法,近十年來在多光譜、高光譜、雷達遙感數(shù)據(jù)遙感土地覆蓋利用分類中表現(xiàn)出優(yōu)越的性能[7-8]。

      Chan等[9]研究了隨機森林算法和提升算法在生境分類差異性問題,結果表明這2種集成學習算法在分類精度上差異不大(1%左右),均優(yōu)于人工神經網絡算法的分類結果;在分類時間和分類穩(wěn)定性方面,隨機森林算法則表現(xiàn)較為優(yōu)越。Vrgaliano等[10-11]在研究區(qū)范圍較大、生態(tài)環(huán)境異質性強的區(qū)域時,結果顯示隨機森林在處理數(shù)據(jù)維度高、類間異質性小、分類類別復雜遙感解譯方面表現(xiàn)優(yōu)良;雷震[12]在國內對隨機森林在遙感分類方面的研究缺乏的情況下,對其發(fā)展歷史和應用前景進行了探討,指出隨機森林作為新興的分類算法可提高遙感分類的精度;王書玉等[13]運用隨機森林算法對洪河濕地影像進行分類,分類總精度和Kappa系數(shù)分別為88.31%和0.82,較常用的MLC和CART算法分類的精度有顯著提高。

      國內對隨機機森林算法的分類研究廣泛分布于生態(tài)、醫(yī)學、經濟等領域內,并表現(xiàn)出良好的性能[14-15]。而在遙感分類領域內隨機森林算法對遙感影像土地利用分類的研究并未見完整的報道[16]。

      本研究針對隨機森林算法在土地利用遙感分類過程中的具體應用進行研究,分析算法參數(shù)對分類精度的影響和遙感光譜波段與光譜指數(shù)在土地利用分類中的重要程度,以保證分類精度的基礎上達到降維的效果,評價隨機森林在分類精度上效率,以期利用隨機森林算法為干旱區(qū)的土地利用分類提供依據(jù)。

      1 材料與方法

      1.1 研究區(qū)概況

      瑪納斯河流域地處天山北麓中段,準葛爾盆地南緣,是天山北坡最大的綠洲(E85°01′-86°32′,N43°27′-45°21′)。流域內地勢從北向南逐漸降低,地貌呈典型的山盆系統(tǒng)結構,依次為山地—山前傾斜平原—沙漠,區(qū)域年降水量110-200 mm,年潛在蒸發(fā)量1500-2000 mm,雨量稀少,蒸發(fā)量大,屬于典型的溫帶大陸性干旱半干旱氣候[17]。

      受海拔和水資源的影響,流域內林地、草地主要位于山地低山區(qū);大量來自山區(qū)的融水流入山前平原區(qū),適宜耕種,在此地區(qū)分布有耕地、水庫、城市等大量人造景觀;距離山區(qū)水源較遠的古沖積平原,土地利用則主要以沙漠為主[18]。

      圖1 瑪納斯河流域位置Fig.1 Location of Manasi River Basin

      1.2 方法

      1.2.1 樣本數(shù)據(jù)獲取

      利用中國科學院土地利用遙感監(jiān)測分類系統(tǒng)對研究區(qū)的土地利用類型進行劃分。從2000年土地利用圖中共導出不同土地類型2050個樣本數(shù)據(jù)點,所有樣本點經過Google Earth 2013年影像目視驗證(表1)。不同地類樣本數(shù)據(jù)按2∶1的比例隨機分為2部分,2/3的數(shù)據(jù)作為實驗數(shù)據(jù),1/3的數(shù)據(jù)作為驗證數(shù)據(jù),用于對比分析中分類精度的計算。

      表1 用于隨機森林算法的土地覆蓋利用類別與樣點數(shù)目Tab.1 Land-use type and number of sampling points for random forest algorithm

      1.2.2 遙感數(shù)據(jù)的獲取與預處理

      選擇研究區(qū)中作物生長旺盛的2013年8月19號的Landsat 8 OLI遙感影像(wrs2條帶號144028、144029、144030)為基準影像(來源USGS,http://glovis. usgs.gov/),獲取的影像經過輻射校正和基于MODTRAN4+模型的大氣校正,裁剪導出瑪納斯河流域影像數(shù)據(jù)。

      1.2.3 遙感指數(shù)選取

      歸一化植被指數(shù)(NDVI)作為反映植被信息最重要的指數(shù),被廣泛應用于遙感分類領域,尤其是干旱半干旱區(qū)因人類活動的影響,不同土地利用下的植被覆蓋程度差異很大,故將預處理后的OLI近紅外和紅外波段求得的NDVI數(shù)據(jù)作為預測變量加入到研究區(qū)的土地利用分類中。

      瑪納斯河流域是典型的山盆結構區(qū)域,地勢起伏大,土地利用大都因地制宜,地形數(shù)據(jù)的加入可以有效提高海拔和坡度等地形差異明顯的地類。地形數(shù)據(jù)包括30分辨率的SRTM-DEM數(shù)據(jù)和由其導出地形描述數(shù)據(jù)——坡度、坡向指數(shù)。至此,本研究使用 Landsat 8多光譜波段(7個波段:b1-b7)、NDVI、DEM、坡度(aspect)和坡向(slope)共計 11個波段(以下稱作變量)來反演研究區(qū)的土地利用狀況。本文對遙感影像的所有處理均在軟件ENVI5.1中完成。

      1.2.4 隨機森林算法

      其中,b(x)是第 b個隨機分類樹的預測值。

      隨機森林采用基尼指數(shù)(GINI Index)來選擇最佳分裂屬性,對于給定的訓練集,基尼指數(shù)算法如下:

      隨機森林的隨機性主要體現(xiàn)在兩方面[19-20]:

      (1)隨機選擇子樣本時,在面對輕微數(shù)據(jù)變動時其穩(wěn)定性較高,從而提高分類精度。

      (2)算法從屬性集中隨機選擇k個屬性,每個樹節(jié)點分裂時,從這隨機的k個屬性,選擇最優(yōu)的。這樣雖然降低每棵樹的強度,也使得樹之間的相關性降低,減少了泛化誤差。

      隨機森林算法自提出以來,已經很多的商業(yè)和開源軟件中包含了該算法,本文使用開源軟件R來實現(xiàn)隨機森林算法和影像分類,其中的Random Forest程序包可以方便的建立隨機森模型,raster程序包可以利用存在的RandomForest模型進行影像分類。

      1.2.5 隨機森林土地利用分類模型的構建方法

      隨機森林算法是以大量C&RT為基分類器的集合,其與其他樹形分類器最明顯的不同之處在于分類時每個節(jié)點處,使用給定數(shù)目的變量(本文取值范圍為1-11)進行分割;該參數(shù)在單個數(shù)的構建過程中不變,但是具體分類變量是隨機選取的。在構建隨機森林模型時分類樹數(shù)量(k)增多能夠有效降低泛化誤差和避免出現(xiàn)過擬合;變量數(shù)目(m)選擇則有局限性,一方面過多會在增強單棵決策樹能力但會增加決策樹之間的相關性,而過少單棵樹又會變得太弱。

      在構建分類模型的過程中,隨機森林利用建成單顆決策樹時剩余的袋外數(shù)據(jù)對該模型分類精度進行評價,即袋外誤差(OBB誤差)。Rodriguez-Galiano證明使用OBB誤差評價分類效果與使用測試數(shù)據(jù)評價等效,并且OBB誤差評估具有無偏性的特點;在處理小數(shù)據(jù)量分類時,不必考慮驗證數(shù)據(jù),更具有優(yōu)勢。

      考慮到本研究各個土地利用類型的樣本容量普遍偏小,本文使用OBB誤差作為評價不同分類節(jié)點變量數(shù)目和決策樹數(shù)目組合的隨機森林模型分類精度的影響的指標。

      1.2.6 土地利用分類模型的優(yōu)化

      隨機森林算法不僅能高精度的完成土地利用遙感分類,還能評價分類變量對總體和每一種土地利用類型分類的重要程度,一般的分類方法則不能完成關變量對分類結果的重要性計算。變量的重要性分析可以在變量過多的情況下對變量進行降維處理,如高光譜數(shù)據(jù)和多源數(shù)據(jù)的分類和信息提取研究中提取重要性較高的變量作為研究的數(shù)據(jù)來源。

      隨機森林可以通過2種指標來評價各個變量的重要性。(1)在隨機森林樹生成的過程中,計算OBB誤差和分類投票正確的次數(shù),然后對每個變量的OBB數(shù)據(jù)進行隨機轉換,計算此變量變換后的分類正確的次數(shù),用無變換數(shù)據(jù)的投票次數(shù)減去變換后投票正確的次數(shù),然后在除以隨機森林總樹數(shù),得到變量初始的重要性,除以標準差,就是變量的重要性,用Mean decrease accuracy(MDA)表示;(2)隨機森林算法在分類時使用Gini指數(shù)來作為分割方式,計算每個變量Gini指數(shù)在每個節(jié)點的異質性,累加所有樹的減少值來表示變量的重要性,用Mean decrease gini(MDG)表示。

      2 結果與分析

      2.1 隨機森林土地利用分類模型的構建

      圖2為決策樹數(shù)量逐漸增加,不同m值(最小值、最大值和默認值,也就是1、11、3)下的OBB誤差的變化趨勢。

      圖2 決策樹的數(shù)量(k)和分類節(jié)點變量的數(shù)量(m)對分類結果的影響Fig.2 Effect of the numbers of trees(k)and the number of variables(m)on OBB errors

      對比3種分類節(jié)點變量模型下分類樹數(shù)量(k)對分類精度的影響可以看出隨機森林算法只有在決策樹匯集成“森林”時,其分類精度才會提高,并且穩(wěn)定。具體如下:k較小時,分類誤差較大,隨著k值不斷變大,分類誤差呈波動式降低,當k值大約到達100時,3個分類器的分類精度趨于穩(wěn)定,其后的誤差平均值分別為9%、6%和7%,之后決策樹數(shù)量的增加不會對OBB誤差造成明顯影響,OBB誤差趨于穩(wěn)定。

      隨機森林模型中k值小時,分類效果不佳;k值大于一定值后,分類精度趨于穩(wěn)定,較為理想??紤]到隨著k值變大,分類器花費的計算時間也不斷增多,在保證高分類精度的同時,k值不應過大。

      圖2中還可以看出在相同k值下,不同分類節(jié)點變量數(shù)目(m)的分類器的分類精度表現(xiàn)出明顯的差異。m取最大值(11)和最小值(1)時,OBB誤差均不是最小。可見m值得變化不僅影響單棵樹的強度,而且改變了“森林”里樹與樹之間的相關性。平衡K、m對模型分類的影響是提高土地利用分類精度的關鍵所在。

      分析分類節(jié)點變量數(shù)目與OBB誤差在不同決策樹數(shù)目組合下的相關性,可見m與分類精度之間的相關性逐漸降低(表2)。k值較小時,分類節(jié)點變量數(shù)目和分類精度具有高度的負相關性,表明當決策樹數(shù)目較小時,分類節(jié)點變量個數(shù)的增加大大增強了單棵樹的分類能力,優(yōu)化了分類效果;隨著k的增加,m值與分類精度的相關性很弱,而不同的k值間的相關性則很高。k值增加到分類穩(wěn)定值(100)后,隨機森林對分類節(jié)點變量的數(shù)量并不敏感,分類精度趨于穩(wěn)定。

      表2 不同決策樹數(shù)目組合下的分類節(jié)點變量數(shù)目與OBB誤差相關性Tab.2 The correlation between numbers of trees(k) and random spilt variables(m)on OBB errors

      由表2可見,隨機森林模型的分類精度由分類樹數(shù)量和分類節(jié)點變量數(shù)量共同決定,因此最佳分類模型的確定是通過開展不同參數(shù)組合的分類精度實驗求得。計算得出OBB誤差最小值為0.04952,然而最小值所在的參數(shù)k小于100,并沒有形成穩(wěn)定的隨機森林模型,而第二小值0.05142與0.04952差異很小,故取該位置的參數(shù)組合(k=106,m=6)隨機森林模型經行探討。圖3是利用隨機森林算法反演得到的瑪納斯河流域土地利用分布。

      圖3 瑪納斯河流域隨機森林土地利用分類Fig.3 Random forest land use classification

      2.2 土地利用分類模型的優(yōu)化結果

      Mean decrease accuracy是當把一個變量變成隨機數(shù)時,隨機森林預測準確度的降低程度,該值越大表示該變量的重要性就越大。MeanDecreaseGini通過基尼指數(shù)計算每個變量對分類樹上每個節(jié)點的觀測值的異質性影響。該值越大表示該變量的重要性越大。

      利用2種變量重要性計算方法,根據(jù)前文生成的遙感分類模型分析 Landsat OLI多光譜波段、NDVI、和DEM、Slope、Aspect 3個地形數(shù)據(jù)對總體分類精度的影響(圖4)。

      圖4 不同遙感波段對土地利用總體分類的重要性Fig.4 The importance of different romote sensing bands on the landuse classification

      圖4a和圖4b分別表示基于Gini指數(shù)和OBB誤差減少下的分類變量對總體分類精度的重要性。對比2幅圖發(fā)現(xiàn)每個遙感波段在不同測定方法下的變量重要性排序是一致的,表明2種測量手段是等效的。

      分析單個波段的變量重要性可以看出:DEM、NDVI和b5(近紅外波段)對分類精度的影響最大,MDG指標分別為 141、70和48;MDA指數(shù)同樣很高,0.43、0.25和0.12。可見受干旱區(qū)流域獨特的地形結構和自然環(huán)境條件影響,地表海拔和植被生長狀況對于劃分土地利用類別具有很大的幫助。OLI b5-b7波段的變量重要性緊隨其后,重要性大小排序為b5>b7>b6;該波段的波譜范圍為近紅外波段至短波紅外波段,而可見光范圍深藍光波段至紅波段(b1-b4)對土地利用遙感分類的重要性很低,具體原因仍需后續(xù)研究。

      圖5 變量減少對基于OBB測定分類精度的影響Fig 5.Effect of variable reduction on classification accuracy based on OBB

      圖5表示在逐步去除變量重要性最小的變量后,總體分類精度的變化情況??梢?,當使用變量個數(shù)大于3個(總變量數(shù)的30%)時,總體分類精度在94%左右浮動變化,之后急速減少。當預測變量數(shù)為8個時,分類精度的最大值為94.67%,結合圖4b發(fā)現(xiàn),分類精度最大值是去除了變量重要性最小的3個變量。

      2.3 隨機森林與最大似然分類精度對比

      結合節(jié)1.2.5與1.2.6,利用變量選取后分類精度最高的8個分類變量構建隨機森林和最大似然分類模型。通過對比最大似然分類算法來判定分類精度的高低是否取決于分類算法的不同。本研究使用軟件ENVI默認的ML分類模塊完成最大似然算法的土地利用分類和精度評價部分(表3)。

      表3 分類精度總體評價Tab.3 Summary of classification accuracies by maximum likelihood and random forest classification

      表3顯示,利用最大似然算法和隨機森林算法獲取的全變量和DEM、NDVI等8個分類變量的分類精度的差異,Kappa系數(shù)使用驗證數(shù)據(jù)計算。表3可見,隨機森林算法的分類精度總是要高于最大似然分類,利用全部變量的分類結果的Kappa系數(shù)分別為0.97和0.88,隨機森林算法的分類精度顯著提高,較最大似然高出9%;考慮到分類精度均已高達85%以上,精度的每一點提升難度很大。當分類變量限于變量重要性最為重要的8個波段時,隨機森林的精度保持不變,最大似然分類的精度卻有所增加,Kappa系數(shù)從0.88變成0.91,提升了3%。最大似然分類精度的差異性大概在于它的參數(shù)特性,一些光譜和地形特征數(shù)據(jù),例如坡向,在該區(qū)域可能并不是正態(tài)分布。

      3 討論與結論

      本研究的主要目的是探析隨機森林算法在干旱區(qū)流域尺度上的土地利用分類效用。對于融合了歸一化植被指數(shù)、DEM、坡度、坡向和OLI遙感影像數(shù)據(jù),該算法出色的完成了瑪納斯河流域的土地利用分類。

      (1)隨機森林算法的分類精度主要受2個參數(shù)的影響:決策樹的數(shù)量(k)與分類變量的數(shù)量(m),分析表明,當k<100時,分類樹的數(shù)量與分類精度有著明顯的正相關性,之后分類精度趨于穩(wěn)定,分類變量輕微的影響分類精度。本研究中,地形數(shù)據(jù)中的坡向(aspect)和坡度(slope)數(shù)據(jù)在2種測量方式下的重要性均很低,尤其是坡向數(shù)據(jù),對分類精度無影響,因此在的土地利用分類中,可以剔除該變量,達到在分類精度不降低的情況下,減少數(shù)據(jù)量。

      (2)利用隨機森林算法可以根據(jù)Gini指數(shù)和OBB誤差對土地利用分類變量(波段)的重要性進行分析,分析表明海拔高程和歸一化植被指數(shù)對土地利用分類的影響程度較高,光譜波段內紅光波段至短紅外波段(b4-b7)的重要性要比可見光波段(b1-b4)高。

      (3)對比最大似然算法分類結果表明,隨機森林算法的分類效果和分類精度表現(xiàn)的均很優(yōu)秀,兩者總體kappa系數(shù)分別為0.97和0.88,相差了9個百分點。利用變量重要性篩選出的遙感波段構建優(yōu)化隨機森林模型,其分類精度保持不變,可以利用該方法對數(shù)據(jù)源降維處理。本研究顯示,利用驗證樣本計算得出的分類精度要比基于袋外數(shù)據(jù)的分類精度高,其原因可能是驗證樣本的獨立性不能完全確定。隨機森林算法比傳統(tǒng)的分類算法提供更高的分類精度,通過變量重要性篩選的遙感波段能夠有效的剔除多余波段,精簡數(shù)據(jù)源。

      本研究只選擇了歸一化植被指數(shù)、DEM、坡度和坡向作為輔助OLI遙感數(shù)據(jù)分類的增強數(shù)據(jù),因此在區(qū)分在此類光譜區(qū)分性小的類別時可能會有誤分和漏分。選擇更多的數(shù)據(jù)是否能提高分類效果,將是下一步工作的重點。本研究可為繪制流域尺度的土地利用分類提供了一個新的方法與參考。

      [1]彭建,王仰麟,張源,等.土地利用分類對景觀格局指數(shù)的影響[J].地理學報,2006,61(2):157-168. Peng J,Wang Y L,Zhang Y,et al.Research on the influence of land use classification on landscape metrics[J].Acta Geographica Sinica,2006,61(2):157-168.

      [2]冉有華,李文君,陳賢章.TM圖像土地利用分類精度驗證與評估——以定西縣為例 [J].遙感技術與應用,2003,18 (2):81-86. Ran Y H,Li W J,Chen X Z.Verification and assessment of land use classification by using TM image-taking dingxi County as an example[J].Remote Sensing Technology and Application,2003,18(2):81-86.

      [3]趙庚星,李玉環(huán),徐春達.遙感和GIS支持的土地利用動態(tài)監(jiān)測研究——以黃河三角洲墾利縣為例 [J].應用生態(tài)學報,2000,11(4):573-576. Zhao G X,Li Y H,Xu C D.Land use dynamic monitoring supported by remote sensing and GIS——a case study in Kenli County of Yellow River delta[J].Chinese Journal Ournal of Applied Ecology,2000,11(4):573-576.

      [4]黎夏,葉嘉安,廖其芳.利用案例推理(CBR)方法對雷達圖像進行土地利用分類[J].遙感學報,2004,8(3):246-253. Li X,Yeh Anthony Gar-On,Liao Q F.Case-based reasoning(CBR)for land use classification using radar images[J]. Journal of Remote Sensing,2004,8(3):246-253.

      [5]李恒凱,吳立新,李發(fā)帥.面向土地利用分類的HJ-1CCD影像最佳分形波段選擇[J].遙感學報,2013,17(6):1572-1586. Li H K,Wu L X,Li F S.Optimal fractal band selection on HJ-1 CCD image for land use classification[J].Journal of Remote Sensing,2013,17(6):1572-1586.

      [6]李小文,劉素紅.遙感原理與應用[M].北京:科學出版社,2008:104-105.

      [7]張雷,王琳琳,張旭東,等.隨機森林算法基本思想及其在生態(tài)學中的應用——以云南松分布模擬為例 [J].生態(tài)學報,2014,34(3):650-659. Zhang L,Wang L L,Zhang X D,et al.The basic principle of random forest and its applications in ecology:a case study ofPinus yunnanensis[J].Acta Ecologica Sinica,2014,34(3):650-659.

      [8]Rodriguez-Galiano V F,Chimire B,Roganet J,et al.An assessment of the effectiveness of a random forest classifier for landcover classification[J].ISPRS Journal of Photogrammetry and Remote Sensing,2012,67:93-104.

      [9]Chan J C W,Paelinckx D.Evaluation of random forest and adaboost tree-based ensemble classification and spectral band selection for ecotope mapping using airbornehyperspectral imagery[J].Remote Sensing of Environment,2008,112(06):2999-3011.

      [10]Rodriguez-Galiano V F,Abarca-Hernand Z F,Ghimire B, et al.Incorporating spatial variability measures in landcover classification using random forest[J].Procedia Environmental Sciences,2011,3:44-49.

      [11]Rodriguez-Galiano V F,Chica-Olmd M,Abarca-Hernandez F,et al.Random Forest classification of Mediterranean land coverusingmulti-seasonal imagery and multi-seasonal texture[J].Remote Sensing of Environment,2012,121:93-107.

      [12]雷震.隨機森林及其在遙感影像處理中應用研究[D].上海:上海交通大學,2012.

      [13]王書玉,張羽威,于振華.基于隨機森林的洪河濕地遙感影像分類研究[J].測繪與空間地理信息,2014,37(4):83-85, 93. Wang S Y,Zhang Y W,Yu Z H.Classification of Honghe Wetland remote sensing image based on random forests[J]. Geomatics& Spatial In for Mation Technology,2014,37 (4):83-85,93.

      [14]李欣海.隨機森林模型在分類與回歸分析中的應用[J].應用昆蟲學報,2013,50(4):1190-1197. Li X H.Using“random forest”for classification and regression[J].Chinese Journal of Applied Entomology,2013,50 (4):1190-1197.

      [15]韓玉,施海龍,曲波,等.隨機森林方法在醫(yī)學中的應用[J].中國預防醫(yī)學雜志,2014,15(1):79-81. Han Y,Shi H L,Qu B,et al.Random forests application in medicine[J].Chin Prev Med,2014,15(1):79-81.

      [16]李旭青,劉湘南,劉美玲,等.水稻冠層氮素含量光譜反演的隨機森林算法及區(qū)域應用[J].遙感學報,2014,18(4):923 -945. Li X Q,Liu X N,Liu M L,et al.Random forest algorithm and regional applications of spectral inversion model for estimating canopy nitrogen concentration in rice[J].Journal of Remote Sensing,2014,18(4):923-945.

      [17]封玲.瑪納斯河流域農業(yè)開發(fā)與生態(tài)環(huán)境變遷研究[M].北京市:中國農業(yè)出版社,2006:1-3.

      [18]程維明,周成虎,劉海江,等.瑪納斯河流域50年綠洲擴張及生態(tài)環(huán)境演變研究[J].中國科學(D輯:地球科學),2005,35(11):1074-1086. Chen W M,Zhou C H,Liu H J,et al.Manas river valley oasis expansion and ecological environment evolution research 50 years[J].Science in China(series D),2005,35(11): 1074-1086.

      [19]Liaw A,Wiener M,Classification and regression by random Forest[J].R News,2002,2(3),18-22.

      [20]Genuer,R.,et al.Variable selection using random forests[J]. Pattern Recognition Letters,2010,31(14):2225-2236.

      Application of random forest algorithm in the remote sensing classification of land use in arid region

      Han Yan,Wang Ling*,Luo Chong
      (College of Science of Shihezi University,Shihezi,Xinjiang 832003,China)

      The aim of this resesearch is to test the random forest algorithm in the remote sensing classification in arid area. The land use map of the Manasi River Basin,a typical watershed in arid area,had been interpreted using this method based on Landsat 8,DEM and NDVI data.The results show that:(1)both the number of decision trees(k)and the number of classification variables(m)have effect on the classification accuracy.When k,m are 103,6,respectively,the classification accuracy reaches 95%;(2)through the comparative analysis,DEM and NDVI have more influence on the classification accuracy than the slope;(3)Based on the results of classification,the random forest algorithm accuracy is higher than 9%with the maximum likelihood method..The random forest algorithm could reduce data redundancy and keep the accuracy with 0.97 of Kappa coefficient.The method could be applied in land use classification of remote sensing in the arid area.

      Remote sensing,land use classification,random forests algorithm,arid areas

      F323.211;TP301.6

      A

      10.13880/j.cnki.65-1174/n.2017.01.016

      1007-7383(2017)01-0095-07

      2016-10-17

      國家自然科學基金項目(41361073)

      韓燕(1981-),女,碩士研究生,專業(yè)方向為遙感影像信息提取和土壤鹽漬化成因,e-mail:66720287@qq.com。

      *通信作者:王玲(1974-),女,教授,從事遙感與地理信息系統(tǒng)應用方面研究,e-mail:rain_ling@163.com。

      猜你喜歡
      波段土地利用重要性
      春日暖陽
      “0”的重要性
      論七分飽之重要性
      幼兒教育中閱讀的重要性
      甘肅教育(2020年21期)2020-04-13 08:09:24
      土地利用生態(tài)系統(tǒng)服務研究進展及啟示
      M87的多波段輻射過程及其能譜擬合
      讀《邊疆的重要性》有感
      唐山文學(2016年11期)2016-03-20 15:26:04
      濱海縣土地利用挖潛方向在哪里
      日常維護對L 波段雷達的重要性
      西藏科技(2015年4期)2015-09-26 12:12:58
      L波段雷達磁控管的使用與維護
      河南科技(2014年18期)2014-02-27 14:14:53
      舒城县| 宿松县| 新郑市| 陆良县| 长汀县| 定远县| 太湖县| 罗江县| 塘沽区| 景宁| 龙泉市| 江永县| 哈密市| 略阳县| 古田县| 杭锦后旗| 永兴县| 泰安市| 改则县| 兴安盟| 通山县| 阜阳市| 兴义市| 商河县| 珲春市| 蕉岭县| 巢湖市| 桂东县| 大丰市| 鄂托克旗| 宁远县| 溆浦县| 庆云县| 五峰| 西丰县| 虹口区| 普陀区| 富川| 虎林市| 玛多县| 莱州市|