• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多特征PolSAR數(shù)據(jù)的干旱區(qū)土地利用/覆被分類

      2022-01-17 06:37:10卡地爾牙忙蘇爾依力亞斯江努爾麥麥提張永福梁田田
      地理空間信息 2021年12期
      關(guān)鍵詞:鹽漬決策樹極化

      卡地爾牙·忙蘇爾,依力亞斯江·努爾麥麥提,張永福*,梁田田

      (1. 新疆大學(xué)資源與環(huán)境科學(xué)學(xué)院,新疆 烏魯木齊 830046;2. 新疆大學(xué)綠洲生態(tài)教育部重點(diǎn)實(shí)驗(yàn)室,新疆 烏魯木齊 830046)

      土地利用/ 覆被遙感分類的精度和準(zhǔn)確性取決于景觀的復(fù)雜性、遙感數(shù)據(jù)類型、空間分辨率、大氣條件、采用的圖像處理技術(shù)和分類方法等因素的綜合效益[1]。因此,繪制土地利用/ 覆被圖分類方法的選擇與改善、精度提升等成為研究者們重點(diǎn)考慮的問題。針對土地覆被分類的數(shù)據(jù)選擇,傳統(tǒng)的單幅影像像素特征來進(jìn)行圖像分類在不同分辨率尺度的圖像分類上難以獲得較高精度的圖像分類結(jié)果[2]。數(shù)據(jù)融合是彌補(bǔ)傳感器導(dǎo)致遙感數(shù)據(jù)局限性的有效方法[3]。全極化合成孔徑雷達(dá)數(shù)據(jù)(PolSAR)包含目標(biāo)地物的物理、化學(xué)特性和幾何特性有關(guān)的有用信息,不同目標(biāo)極化模式對地表面的敏感度不同,有助于識別不同的土地類型[4],但不具備地物光譜特征,雷達(dá)成像過程中的壓縮、陰影、透視糾縮、疊掩、斑點(diǎn)噪聲等因素均影響圖像分類的準(zhǔn)確性[5]。被動(dòng)遙感范疇中的光學(xué)遙感數(shù)據(jù)不僅有高空間分辨率,而且可獲取地物光譜特征信息,因此,全極化雷達(dá)數(shù)據(jù)多種極化特征信息與光學(xué)遙感數(shù)據(jù)的融合有助于提高地物識別度和圖像分類精度[6-7]。諸多研究表明,機(jī)器學(xué)習(xí)算法針對復(fù)雜地物分類與弱后相散射目標(biāo)的分類效果與傳統(tǒng)圖像分類更佳[8-9]。

      為實(shí)現(xiàn)干旱區(qū)土地覆被信息的精確提取和多源遙感數(shù)據(jù)信息充分利用,本研究以新疆于田綠洲為靶區(qū),采用全極化PALSAR-2 數(shù)據(jù)與Landsat-8 光學(xué)影像和多種地物信息提取指數(shù)來構(gòu)建囊括后相散射特征、光譜特征以及多種地物信息提取指數(shù)的特征數(shù)據(jù)集,并采用隨機(jī)森林算法來完成基于多源數(shù)據(jù)集的土地覆被分類與特征變量貢獻(xiàn)率定量評估,同時(shí)與支持向量機(jī)和決策樹算法進(jìn)行圖像分類性能對比,討論了多源遙感數(shù)據(jù)融合方法在干旱區(qū)土地覆蓋分類和鹽漬地信息提取上的應(yīng)用潛力。

      1 數(shù)據(jù)與方法

      1.1 研究區(qū)

      研究以新疆于田綠洲為研究靶區(qū),該區(qū)地處81°08′59″E ~82°00′03″E,36°44′59″N ~37°12′04″N 之間,位于昆侖山中段北麓、塔里木盆地南緣克里雅河流域,北為塔克拉瑪干大沙漠與沙雅縣接壤,中部為沖積平原地帶,面積約3.95 萬km2,地勢南高北低,自南向北形成高山、戈壁、沙漠等地貌單元[10](圖1)。研究區(qū)屬暖溫帶內(nèi)陸干旱沙漠性氣候,晝夜溫差大,年平均氣溫為11.6 ℃,降水稀少,年平均降水量為47.7 mm,蒸發(fā)量為2 432.1mm,降水量遠(yuǎn)低于蒸發(fā)量[11]。因地形、人類活動(dòng)和地下水的變化等因素,鹽漬化土壤主要分布在于田綠洲與沙漠的交錯(cuò)帶和內(nèi)部人類活動(dòng)頻繁區(qū)域[12]。

      圖1 研究區(qū)Landsat OLI 圖像(左)與對應(yīng)的PALSAR-2 圖像(右)

      1.2 數(shù)據(jù)集

      本文選用2015-04-23 于田綠洲PALSAR-2 全極化雷達(dá)數(shù)據(jù),工作波段是頻率為1.2 GHz 的L 波段,對其進(jìn)行數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)導(dǎo)入、多視處理、噪聲濾波、DEM 數(shù)據(jù)的獲取、地理編碼和輻射定標(biāo)、重采樣等,得到最后的實(shí)驗(yàn)數(shù)據(jù)。同時(shí),采用2015-05-03 Landsat-8 OLI 數(shù)據(jù)提取了8 種不同地物光譜特征指數(shù),多光譜數(shù)據(jù)進(jìn)行主成分變換后的前3 種主成分變量(PCA-1、PCA-2、PCA-3)等特征信息。

      1.3 目標(biāo)極化分解理論

      利用目標(biāo)極化分解方法可更加全面地反映地物的物理、化學(xué)及幾何特性[13]。Huynen[14-17]等分別提出不同觀點(diǎn)和角度的分解方法。極化目標(biāo)分解是將散射矩陣和協(xié)方差矩陣分解為具有特定物理意義的若干散射機(jī)制的總和。每個(gè)散射機(jī)制代表典型的目標(biāo)和電磁波的作用過程,可直接反映觀測目標(biāo)的結(jié)構(gòu)和物理化學(xué)特征,從而有效地揭示物體的散射特性[18]。目前應(yīng)用的極化分解方法主要分為基于散射矩陣的相干目標(biāo)分解和基于二階統(tǒng)計(jì)模型的非相干目標(biāo)分解2 種[19]。本研究利用ENVI-5.3 軟件的SARscape5.2.1 模塊對預(yù)處理后的全極化PALSAR-2 數(shù)據(jù)進(jìn)行H/A/α極化分解、Pauli 分解、Krogager 極化分解等3 種極化分解,其特征變量信息見表1。

      1.4 分類方法

      隨機(jī)森林是結(jié)合決策樹分類模型和特征隨機(jī)選取思想的集成式機(jī)器學(xué)習(xí)算法[20]。該算法在選擇訓(xùn)練樣本和構(gòu)建基分類器的過程中都引入了隨機(jī)性。其生成N棵決策樹分類模型{h(x,θk),k∈N+},在以決策樹為基學(xué)習(xí)器構(gòu)建Bagging 集成的基礎(chǔ)上,進(jìn)一步在決策樹的訓(xùn)練過程中引入了隨機(jī)屬性選擇,對于任何第k棵樹,生成的隨機(jī)向量θk均為獨(dú)立同分布于先前生成的θ1,…,θk-1,每一棵決策樹之間無關(guān)聯(lián)性[9]。它使用訓(xùn)練集和參數(shù)集θk來生成多棵決策樹得到集成式分類器,其為自變量。通過Bagging 算法采樣出T個(gè)含m個(gè)訓(xùn)練樣本的采樣集,基于每個(gè)采樣集訓(xùn)練出一個(gè)基學(xué)習(xí)器,再將基學(xué)習(xí)器進(jìn)行結(jié)合,減少了樹之間的相關(guān)性和泛化誤差[21]。其判別函數(shù)定義為如下:

      式中,H(x)表示對樣本x的預(yù)測值;Dt表示基分類器ht實(shí)際使用的訓(xùn)練樣本集。

      隨機(jī)森林較好的解決了過擬合的問題,提高算法的泛化性,具有一定的控制泛化能力等優(yōu)點(diǎn),同時(shí)該算法還可以定量評價(jià)輸入變量對分類結(jié)果的貢獻(xiàn)率,被譽(yù)為“代表集成學(xué)習(xí)技術(shù)水平的方法”[22]。

      本次研究利用Python 包管理和環(huán)境管理軟件的Anaconda3 的應(yīng)用程序Jupyter Notebook 中進(jìn)行了隨機(jī)森林算法調(diào)參數(shù),對研究區(qū)5 個(gè)特征集組合的數(shù)據(jù)進(jìn)行解譯,特征分量貢獻(xiàn)率分析及分類精度評估。在同一訓(xùn)練集與驗(yàn)證集體系下,選擇機(jī)器學(xué)習(xí)算法中較常用的SVM 分類與決策樹分類對最佳特征組合進(jìn)行圖像分類,如表1 所示。

      表1 特征數(shù)據(jù)信息

      2 實(shí)驗(yàn)與結(jié)果

      2.1 實(shí)驗(yàn)方案

      本文將研究區(qū)PALSAR-2 與Landsat OLI 數(shù)據(jù)中獲取的25 個(gè)特征變量構(gòu)建5 種特征組合(表2)。根據(jù)2015 年5 月獲得的實(shí)地勘察數(shù)據(jù),利用ArcGIS10.4軟件的空間分析模塊進(jìn)行野外采樣點(diǎn)數(shù)據(jù)的隨機(jī)等分,分別得到了均勻分布的訓(xùn)練集與驗(yàn)證集,并將研究區(qū)地物粗分為植被、水體、沙地、輕度鹽漬地、中度鹽漬地和重度鹽漬地等6 種類型。

      表2 特征組合實(shí)驗(yàn)方案

      2.2 結(jié)果與分析

      針對以上提出的5 組實(shí)驗(yàn)方案均利用隨機(jī)森林算法(默認(rèn)500 棵樹),調(diào)整參數(shù)進(jìn)行圖像分類得到了研究區(qū)土地覆被分類成果(圖2),多種特征變量的融合有助于提高PALSAR-2 圖像的分類準(zhǔn)確率,有利于彌補(bǔ)雷達(dá)數(shù)據(jù)中的斑點(diǎn)噪聲和較低空間分辨率的影響。于田綠洲植被分布比較集中,中-輕度鹽漬地分布較廣,主要在綠洲外圍植被覆蓋度較低、植被受到破壞的荒漠與綠洲交錯(cuò)帶以及大部分耕作土壤等區(qū)域,在綠洲中部也有部分重度鹽漬地交錯(cuò)分布在中-輕度鹽漬地之中,因此不同程度的鹽漬地在農(nóng)田灌溉區(qū)以及農(nóng)田和裸露地之間的過渡帶上可能會(huì)出現(xiàn)混淆情況。

      圖2 特征組合RF 算法分類結(jié)果

      通過分類精度(表3)可見,不同數(shù)據(jù)集分類精度存在明顯的差異,全極化PALSAR-2 數(shù)據(jù)與目標(biāo)極化分解特征分量的融合有效的減少了相干斑點(diǎn)噪聲的干擾,使分類總精度從71.11%提高到88.87%,Kappa 系數(shù)從0.653 4 提高到0.866 3。通過水體、植被、鹽漬等典型地物指數(shù)以及Landsat OLI 數(shù)據(jù)的主成分分析前三波段等光學(xué)遙感特征變量與PALSAR-2 數(shù)據(jù)4 種極化的融合,對提高分類精度的影響較小,分類精度分別提升0.62%、1.34%,當(dāng)特征數(shù)據(jù)集包含目標(biāo)極化分解特征分量和光譜特征數(shù)據(jù)時(shí),分類精度從88.87%提高到93.24%,Kappa 系數(shù)分別為0.866 3,0.873 9,0.882 4和0.918 8。

      表3 特征組合分類精度

      為對照5 種特征組合實(shí)驗(yàn)在單個(gè)地物類型上的分類精度,采用了精確率(Precision),召回率(Recall)和F1 分?jǐn)?shù)(F1-score)等3 種評估指標(biāo)。精確率是針對預(yù)測結(jié)果而言,衡量所有預(yù)測為正的樣本中實(shí)際分類結(jié)果也為正樣本的概率。召回率是衡量在實(shí)際為正的樣本中被預(yù)測為正樣本的概率。F1 分?jǐn)?shù)表示精確率和召回率之間的調(diào)和平均值[23]。通過地物分類評估指標(biāo)(圖3)可見,不同特征分量的有序組合,使地物分類的精確率有明顯的變化,特征組合Ⅴ的精確率、召回率和F1 分?jǐn)?shù)均大于0.8,與特征組合Ⅰ相比具有較好的分類效果。

      圖3 地物分類精度統(tǒng)計(jì)

      特征變量的不同組合對分類精度產(chǎn)生不同影響,其每一個(gè)變量在數(shù)據(jù)集分類中的貢獻(xiàn)也隨著發(fā)生變化。通過分析特征變量對數(shù)據(jù)集分類的貢獻(xiàn)率(Importance),選擇適合研究區(qū)域的數(shù)據(jù)類型來構(gòu)建數(shù)據(jù)集對復(fù)雜的土地覆被分類可有效減少錯(cuò)分、混淆等情況。圖4 計(jì)算出了RF 分類中使用的不同特征變量的相對貢獻(xiàn),每一個(gè)特征對分類的貢獻(xiàn)是標(biāo)準(zhǔn)化精度差。從貢獻(xiàn)率變化可見,對于PolSAR-2 圖像,目標(biāo)極化分解方法中Pauli 分解的3 種特征分量K1、K2、K3和Krogager 分解的KD、KH 等極化特征分量的貢獻(xiàn)率最大,可歸因到雷達(dá)目標(biāo)極化分解方法具有一定的減少相干斑點(diǎn)噪聲的特點(diǎn)。其次,從Landsat OLI 數(shù)據(jù)提取的NDVI、RVI、NDWI、NDSI 以及SI-3、PCA-1等光譜數(shù)據(jù)對特征集的地物分類有一定的貢獻(xiàn)。雷達(dá)植被指數(shù)(radar vegetation index,RVI_R)、Entropy、Anisotropy 等特征變量在本研究貢獻(xiàn)率較低。

      圖4 特征變量貢獻(xiàn)率分布

      本研究選擇機(jī)器學(xué)習(xí)算法中較常用的SVM 分類與決策樹分類,同一分類體系下進(jìn)行對特征組合Ⅴ的圖像分類,進(jìn)一步檢驗(yàn)RF 算法對特征組合Ⅴ的分類效果(圖5)。分類結(jié)果表明,相比SVM 分類與DT 分類,隨機(jī)森林算法具有較好的分類精度(表4),分類精度分別為81.33%,88.25%和93.24%,Kappa 系數(shù)分別為0.775 7,0.858 8 和0.918 8。隨機(jī)森林算法在特征數(shù)據(jù)集的分類中有所優(yōu)勢,諸多學(xué)者也得到了同樣結(jié)果[24],但由于PALSAR-2 數(shù)據(jù)空間分辨率的局限性,地物光譜特征與后向散射特征具有部分相似性等因素均影響分類結(jié)果。以上3 種機(jī)器學(xué)習(xí)分類算法的分類精度(表4)情況,對后向散射機(jī)制(底墑表面散射)和光譜特征具有相似性的輕度鹽漬地、中度鹽漬地和重度鹽漬地之間的混淆、錯(cuò)分、混分情況在3 種分類方法中均存在,總體分類精度在SVM 分類、DT 分類和隨機(jī)森林分類中分別為81.33%、88.24%、93.24%,相比另2 種分類算法,隨機(jī)森林分類算法比較有優(yōu)勢,誤分率只有6.76%。綜合分析分類樣本體系下的3 種分類方法的結(jié)果來看,隨機(jī)森林分類對多源遙感特征數(shù)據(jù)集分類性能較好。

      圖5 特征組合Ⅴ的SVM、決策樹、隨機(jī)森林分類結(jié)果

      表4 SVM、決策樹、隨機(jī)森林分類精度對照

      3 結(jié) 語

      本文采用隨機(jī)森林圖像分類算法,對于田綠洲全極化PALSAR-2 數(shù)據(jù)、PALSAR 數(shù)據(jù)目標(biāo)極化分解、多種光學(xué)遙感地物信息提取指數(shù)等光譜特征數(shù)據(jù)構(gòu)建的特征數(shù)據(jù)集的組合進(jìn)行土地利用/覆被分類,并對每一組特征變量的圖像分類貢獻(xiàn)率定量評估。實(shí)驗(yàn)結(jié)果可見:

      1)多源遙感數(shù)據(jù)的有效融合有助于提高地物識別準(zhǔn)確率,該結(jié)果與李萌[25]等的研究結(jié)果一致。

      2)對于PALSAR-2 圖像,貢獻(xiàn)率最大的特征變量分別來自Pauli 分解的3種特征分量K1、K2、K3 和Krogager 分解的KD、KH。其次,從Landsat OLI 數(shù)據(jù)提取的NDVI、RVI、NDWI、NDSI 以及SI-3、PCA第一波段等光譜特征數(shù)據(jù)對特征數(shù)據(jù)集的地物分類有一定的貢獻(xiàn)。PALSAR-2 圖像的相干目標(biāo)分解和非相干目標(biāo)分解方法的耦合利用有助于提高不同散射機(jī)制的正確識別與分類。

      3)通過對照SVM 分類、決策樹分類和隨機(jī)森林分類算法的土地利用/覆被分類繪圖精度,隨機(jī)森林分類性能略優(yōu)于SVM 和決策樹分類。驗(yàn)證了隨機(jī)森林算法在地理大數(shù)據(jù)背景下獲取復(fù)雜土地覆被信息的可行性。

      猜你喜歡
      鹽漬決策樹極化
      燕麥對濱海鹽漬土的適應(yīng)性及納鹽改土效果
      鹽漬池深度對漬菜理化特性和微生物的影響
      認(rèn)知能力、技術(shù)進(jìn)步與就業(yè)極化
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      雙頻帶隔板極化器
      電子測試(2017年15期)2017-12-18 07:18:51
      基于決策樹的出租車乘客出行目的識別
      談鹽漬土地區(qū)建筑的地基處理設(shè)計(jì)
      基于PWM控制的新型極化電源設(shè)計(jì)與實(shí)現(xiàn)
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      高州市| 缙云县| 竹山县| 泾阳县| 重庆市| 通榆县| 肥西县| 塔城市| 偃师市| 濮阳市| 内江市| 日喀则市| 清水县| 准格尔旗| 临安市| 崇信县| 拜城县| 治多县| 洱源县| 三原县| 大姚县| 天等县| 南部县| 湄潭县| 浠水县| 肥东县| 红河县| 古丈县| 建瓯市| 新河县| 托里县| 开江县| 西峡县| 大兴区| 德格县| 鄱阳县| 灵寿县| 安康市| 嘉善县| 大竹县| 延川县|