姚金璽,王 浪,李建忠,張 焜,張 志※
(1. 中國(guó)地質(zhì)大學(xué)(武漢)地球物理與空間信息學(xué)院,武漢 430074;2. 青海省青藏高原北部地質(zhì)過(guò)程與礦產(chǎn)資源重點(diǎn)實(shí)驗(yàn)室,西寧 810300;3. 中國(guó)地質(zhì)調(diào)查局烏魯木齊自然資源綜合調(diào)查中心,烏魯木齊 830057;4. 中國(guó)地質(zhì)調(diào)查局應(yīng)用地質(zhì)研究中心,成都 610036)
中國(guó)農(nóng)業(yè)區(qū)的土地利用類型分布分散、農(nóng)業(yè)景觀破碎和作物種植結(jié)構(gòu)復(fù)雜等特點(diǎn),給土地利用類型的遙感解譯帶來(lái)了持續(xù)性挑戰(zhàn)。青海省諾木洪河一帶是全國(guó)第二大枸杞種植區(qū),作物種植面積快速調(diào)查對(duì)調(diào)控農(nóng)產(chǎn)品市場(chǎng)、輔助決策和保障農(nóng)業(yè)可持續(xù)發(fā)展具有重要意義。
種植區(qū)地物精準(zhǔn)、快速分類使用傳統(tǒng)方法費(fèi)時(shí)費(fèi)力,而遙感影像具有快速性和周期性的特點(diǎn),利用遙感技術(shù)進(jìn)行土地利用分類是一種重要的方法,且前人已經(jīng)開(kāi)展了大量研究。但單一傳感器難以全面、準(zhǔn)確地反映復(fù)雜的地表覆蓋類型。眾多地物分類是利用遙感影像不同地類的光學(xué)波段反射率或植被指數(shù)在空間域或時(shí)間域上的變化特征,其原理便決定至少需要研究區(qū)一景的清晰遙感影像。光學(xué)遙感數(shù)據(jù)受光譜分辨率、空間分辨率、時(shí)間分辨率及光譜波段的不同而產(chǎn)生“同物異譜”或“同譜異物”現(xiàn)象,會(huì)極大影響地物分類精度。Wu等利用植被指數(shù)MNDWI、NDBBI去除農(nóng)田中的水體、建設(shè)用地和裸地后,針對(duì)農(nóng)作物不同的生命周期使用NDVI差異性研究農(nóng)田利用變化,以此為廢棄農(nóng)田的開(kāi)采提供參考。而上述是針對(duì)不同的階段使用光譜指數(shù)差異進(jìn)行研究,若只是一景影像效果則會(huì)不盡人意。紋理特征不僅反映圖像的灰度統(tǒng)計(jì)信息,而且反映圖像的空間分布信息和結(jié)構(gòu)信息。Dihkan等構(gòu)建光譜特征與紋理特征進(jìn)行地物分類,其分類結(jié)果進(jìn)一步提高,得到了高精度的地物類型制圖。Zhang等針對(duì)光譜和紋理特征空間進(jìn)行進(jìn)一步的分析,利用均質(zhì)性指數(shù)和分裂性指數(shù)分析確定了最佳分類特征和分類器,為單一或復(fù)雜種植結(jié)構(gòu)區(qū)域的農(nóng)作物制圖參考。然而,光譜和紋理數(shù)據(jù)均會(huì)受到云雨等因素的影響,進(jìn)而導(dǎo)致影像質(zhì)量和地物分類精度降低。
合成孔徑雷達(dá)(Synthetic Aperture Radar, SAR)具有全天時(shí)、全天候的監(jiān)測(cè)優(yōu)點(diǎn)而逐漸在地物分類中占據(jù)重要作用。但SAR數(shù)據(jù)的信號(hào)會(huì)受到相干斑噪聲的干擾,影響對(duì)地面目標(biāo)的精確識(shí)別,Xu等使用多時(shí)相或多極化的SAR數(shù)據(jù)可以減少噪聲的干擾,利用微波數(shù)據(jù)結(jié)合光學(xué)數(shù)據(jù)的方式可以進(jìn)一步提高地物的分類精度。Li等使用涵蓋2017年旱季的Sentinel-1A(S1A)數(shù)據(jù)的時(shí)間序列,在馬朗和Lampung兩個(gè)地區(qū)進(jìn)行了蔬菜農(nóng)作物分類,以此證明了S1A雙極化SAR時(shí)間序列數(shù)據(jù)在印度尼西亞蔬菜農(nóng)作物分類中的應(yīng)用潛力。Swadhina等整合Sentinel-1合成孔徑雷達(dá)(SAR)數(shù)據(jù)和Sentinel-2光學(xué)數(shù)據(jù),構(gòu)建光譜指數(shù)與雷達(dá)紋理特征空間,并以10 m空間分辨率繪制了農(nóng)田專題圖。
前人研究的對(duì)象多為光譜、紋理和極化特征的單獨(dú)分析與部分特征的組合,利用多源數(shù)據(jù)、多特征共同組合分類的研究較少。故本文針對(duì)青海省諾木洪地區(qū),基于GEE云平臺(tái),利用Sentinel-1雷達(dá)數(shù)據(jù)和Sentinel-2多光譜數(shù)據(jù),構(gòu)建多特征空間并利用特征優(yōu)選算法、隨機(jī)森林算法對(duì)研究區(qū)地表覆蓋物進(jìn)行分類,綜合分析評(píng)價(jià)不同特征的重要程度、相關(guān)度以及不同特征組合對(duì)分類結(jié)果的影響。此外,本文進(jìn)一步綜合多源數(shù)據(jù)(Sentinel-1、Sentinel-2和GF-2)協(xié)同分類以分析不同數(shù)據(jù)源的紋理特征對(duì)分類結(jié)果產(chǎn)生的影響。
研究區(qū)位于青海省海西蒙古族藏族自治州都蘭縣諾木洪鄉(xiāng)(圖1),平均海拔2 775 m,屬高原干旱大陸性氣候,區(qū)內(nèi)年均溫1.2~4.3 ℃,降水量17.8~177.5 mm,集中在6-9月,表現(xiàn)出雨熱同季。
圖1 研究區(qū)示意圖Fig.1 Schematic diagram of the study area
研究區(qū)屬柴達(dá)木盆地南緣綠洲農(nóng)業(yè)區(qū),其光照資源豐富、光溫生產(chǎn)潛力大,光熱條件有利于農(nóng)作物生長(zhǎng),主要種植春小麥、枸杞等農(nóng)作物。研究區(qū)以荒漠、濕地與農(nóng)業(yè)用地為主,自然植被類型有梭梭、檉柳、白刺和蘆葦?shù)?。在山麓洪積扇、沖積扇區(qū)及河流沿岸等含水率高的地區(qū),植被長(zhǎng)勢(shì)良好。
Google Earth Engine(GEE)由谷歌、卡內(nèi)基梅隆大學(xué)和美國(guó)地質(zhì)調(diào)查局聯(lián)合開(kāi)發(fā),其中的公共數(shù)據(jù)包括了近40年的全球衛(wèi)星影像以及專題圖,每日更新影像量高達(dá)4000景;GEE平臺(tái)還提供超過(guò)800 種功能函數(shù),從簡(jiǎn)單的數(shù)學(xué)函數(shù)到機(jī)器學(xué)習(xí)、圖像處理等操作。近年來(lái),GEE平臺(tái)逐漸被專家學(xué)者用于地表覆蓋物分類中,這極大地改變了傳統(tǒng)的數(shù)據(jù)下載、存儲(chǔ)與處理方式,有效提高了研究效率與精度。
此次數(shù)據(jù)源包括Sentinel-1、Sentinel-2和GF-2數(shù)據(jù),Sentinel-1雷達(dá)數(shù)據(jù)在GEE平臺(tái)上經(jīng)過(guò)熱噪聲去除、輻射校準(zhǔn)和地形校正預(yù)處理。為了確保數(shù)據(jù)可靠性及降低噪聲影響,采用改進(jìn)的LEE濾波處理以去除噪聲,針對(duì)數(shù)據(jù)取均值操作以獲取Sentinel-1在2020年1月至12月的VV、VH波段后向散射系數(shù)。Sentinel-2數(shù)據(jù)所具有的紅邊波段對(duì)地表植被覆蓋信息提取具有較大的應(yīng)用潛力。在GEE平臺(tái)對(duì)Sentinel-2數(shù)據(jù)進(jìn)行了大氣校正、幾何校正以及利用“QA60”波段進(jìn)行去云操作以減輕云污染的預(yù)處理操作,選取植被生長(zhǎng)較好的2020年6-9月時(shí)間段內(nèi)符合需求的12景影像,以中值合成方法重構(gòu)最小云量合成影像。
國(guó)產(chǎn)高分二號(hào)衛(wèi)星(GF-2)包括一個(gè)全色波段和四個(gè)多光譜波段,分辨率優(yōu)于1 m,同時(shí)還具有高輻射精度、高定位精度和快速姿態(tài)機(jī)動(dòng)能力等特點(diǎn)。本次選取了兩景GF-2影像,對(duì)其進(jìn)行輻射定標(biāo)、大氣校正、正射校正、多光譜與使用Gram-Schmidt(G-S)方法進(jìn)行全色融合操作、裁剪以及影像配準(zhǔn)等預(yù)處理。時(shí)間是2020年7月25日,一方面此時(shí)遙感影像云量比較少,另一方面是僅此時(shí)間段植被發(fā)育較好,紋理信息豐富,便于多源數(shù)據(jù)協(xié)同分類研究。
在2020年8月8日至10日、2021年7月17至24日兩次開(kāi)展野外調(diào)查工作,對(duì)研究區(qū)內(nèi)的植被類型及分布進(jìn)行調(diào)查。根據(jù)繁茂程度、長(zhǎng)勢(shì)、實(shí)地了解的大致空間分布以及在不同遙感合成圖像上的表現(xiàn)將枸杞地分別定義為早、中、晚期。晚期枸杞地因枸杞樹(shù)多為低矮幼苗在影像中較多混雜地表土壤信息,在真彩色中往往顏色發(fā)白。中期枸杞地的枸杞樹(shù)長(zhǎng)勢(shì)要比晚期枸杞地好,枝葉相對(duì)繁茂,在真彩色影像中呈深灰色或褐色,而在假彩色合成圖像中部分呈現(xiàn)紅色。而早期枸杞地多為枝繁葉茂的盛產(chǎn)期果樹(shù),冠層覆蓋度大在真彩色影像中呈黑色且假彩色合成圖像中多呈現(xiàn)深紅色。早期枸杞地位于北部與濕地相接壤,中期枸杞地位于早期枸杞地的南部,枸杞種植區(qū)多有建筑物的出現(xiàn),季節(jié)性河床中植被發(fā)育較少,防護(hù)林分布于居民地及道路周邊。研究區(qū)主要地物類型野外照片如圖2。
圖2 野外調(diào)查實(shí)地照片F(xiàn)ig.2 Field survey field photos
研究流程如圖3所示,主要內(nèi)容包括:數(shù)據(jù)獲取與預(yù)處理、分類前的準(zhǔn)備工作(樣本采集與構(gòu)建特征空間)、分類特征重要性分析、協(xié)同分類精度與結(jié)果的分析與評(píng)價(jià),最終得到了諾木洪地區(qū)地物空間分布精細(xì)制圖,以分析評(píng)價(jià)多源、多特征的分類方法的可靠性與科學(xué)性。
圖3 技術(shù)路線圖Fig.3 Technical route map
依據(jù)實(shí)地調(diào)查數(shù)據(jù)可知,枸杞是區(qū)域內(nèi)主要植被,耕地種植和草地植被覆蓋度較低。故本文的分類系統(tǒng)主要包括8類:早期枸杞地、中期枸杞地、晚期枸杞地、防護(hù)林、裸地、建筑物、濕地和道路。樣本的獲取主要包括在GEE平臺(tái)上選取與線下實(shí)地調(diào)查劃定,根據(jù)地物的空間分布而進(jìn)行選取樣本點(diǎn)。本文共選擇訓(xùn)練樣本736個(gè),包括野外采樣點(diǎn)300個(gè),對(duì)比影像選點(diǎn)436個(gè),驗(yàn)證樣本736個(gè),包括野外采樣點(diǎn)326個(gè),對(duì)比影像選點(diǎn)410個(gè),保證了樣本均勻分布的同時(shí)也使分類效果達(dá)到最佳狀態(tài)。不同地物類別及各類選取點(diǎn)數(shù)如表1所示。
表1 樣本數(shù)據(jù)表Table 1 Sample data table
特征選擇在遙感分類的過(guò)程中尤為重要,科學(xué)的選擇和使用特征可以有效地提高遙感分類的精度。本文在構(gòu)建特征空間時(shí)選擇了波段與植被指數(shù)特征、紋理特征和極化特征。
2.2.1 波段與植被指數(shù)特征
基于預(yù)處理后的S2光學(xué)影像集合,提取原始13個(gè)波段、12個(gè)植被指數(shù),其中包括7個(gè)紅邊指數(shù),分別為:歸一化植被指數(shù) NDVI、歸一化水體指數(shù) NDWI、歸一化差異耕作指數(shù) NDTI、歸一化建筑指數(shù)NDBI、修正型歸一化水體指數(shù)MNDWI和對(duì)植被非常敏感的7個(gè)紅邊指數(shù),所用植被指數(shù)見(jiàn)表2。為保證空間分辨率的一致性,其中原始波段采用最鄰近插值法將Band5、Band6、Band7、Band8A、Band11、Band12由原來(lái)的20 m重采樣為10 m,將 Band1、Band9、Band10由原來(lái)的60 m重采樣為10 m。
2.2.2 紋理特征
由于光學(xué)影像存在“同物異譜,異物同譜”的現(xiàn)象,僅僅依靠光學(xué)特征會(huì)導(dǎo)致部分地物類型誤分。紋理信息是圖像在空間上以一定的形式變化而產(chǎn)生的信息,此次引入Haralick等提出的灰度共生矩陣(Gray Level Co-occurrence Matrix, GLCM)原理提取紋理信息。由于近紅外波段針對(duì)植被的反映更加敏感,本文使用GEE提供的glcm Texture(size, kernel, average)函數(shù),計(jì)算核大小為3×3的近紅外波段紋理特征。GEE平臺(tái)可計(jì)算18個(gè)紋理特征,為了減少數(shù)據(jù)冗余與及其運(yùn)算速率,故選用二階矩(asm)、對(duì)比度(con)、相關(guān)性(cor)、方差(var)、逆差距(idm)和熵(ent)6個(gè)紋理特征。
預(yù)處理之后的GF-2影像,通過(guò)野外實(shí)地調(diào)查和目視選擇控制點(diǎn)對(duì)影像數(shù)據(jù)進(jìn)行精確配準(zhǔn),并對(duì)GF影像進(jìn)行主成分分析,以第一主成分作為紋理提取與GEE平臺(tái)篩選、計(jì)算的相對(duì)應(yīng)的6個(gè)紋理特征圖像,并將其進(jìn)行重采樣至空間分辨率為10 m與Sentinel-1、Sentinel-2波段進(jìn)行疊加分析,與訓(xùn)練樣本一起輸入RF分類器進(jìn)行分類。
表2 文中使用的植被指數(shù)Table 2 Vegetation index used in the article
2.2.3 極化特征
本文選取了多時(shí)相的Sentinel-1雷達(dá)影像以討論多時(shí)相雷達(dá)遙感數(shù)據(jù)對(duì)于地物分類精度的影響。在GEE上獲取了研究區(qū)作物生長(zhǎng)期內(nèi)VV極化和VH極化2020年全年的時(shí)間序列影像,計(jì)算出各地物類型樣本點(diǎn)的后向散射系數(shù)均值,研究不同作物后向散射系數(shù)隨時(shí)間變化規(guī)律,并以此輔助選擇研究時(shí)間范圍。
為了分析多源數(shù)據(jù)和多特征組合對(duì)地物分類的影響,探討地物分類最佳試驗(yàn)方案,本文針對(duì)Sentinel-1、Sentinel-2和GF-2數(shù)據(jù),對(duì)波段和植被指數(shù)特征、紋理特征、極化特征進(jìn)行4種組合方案(表3),
表3 試驗(yàn)方案Table 3 Experimental scheme
在現(xiàn)實(shí)情況下,選用多種分類特征會(huì)導(dǎo)致數(shù)據(jù)冗余,通常需要選擇影響較大的特征以壓縮數(shù)據(jù),故本文采用隨機(jī)森林的方法進(jìn)行特征篩選。
為評(píng)價(jià)特征的貢獻(xiàn)大小,本文采用基尼系數(shù)(GINI Index)作為評(píng)價(jià)指標(biāo)。其GINI系數(shù)的計(jì)算公式為
式中表示類別個(gè)數(shù),p表示節(jié)點(diǎn)中類別所占的比例。特征X在節(jié)點(diǎn)時(shí)的重要性為:
式中GI是分枝前節(jié)點(diǎn)的GINI系數(shù),GI和GI是分枝后兩個(gè)新節(jié)點(diǎn)的GINI系數(shù)。特征X在第棵樹(shù)的重要性為
式中為特征X在決策樹(shù)中出現(xiàn)的節(jié)點(diǎn)集合。假設(shè)隨機(jī)森林中樹(shù)的數(shù)目為,則特征X的特征重要性評(píng)分為
隨機(jī)森林(RF)是由BREIMAN提出的基于決策樹(shù)的串聯(lián)集成機(jī)器的學(xué)習(xí)分類器,其原理是利用Bootstrap重采樣方法從訓(xùn)練樣本隨機(jī)有放回的抽取大約2/3的樣本并重復(fù)次,并為每個(gè)訓(xùn)練樣本分別生成決策樹(shù),留下約1/3的訓(xùn)練樣本作為Out-of-bag數(shù)據(jù)在內(nèi)部交叉檢驗(yàn),評(píng)估隨機(jī)森林的分類精度,并利用GINI系數(shù)確定決策樹(shù)中每個(gè)節(jié)點(diǎn)的分裂條件,最后完成隨機(jī)森林的構(gòu)建。基于此算法有較好的分類性能,故本文采用隨機(jī)森林分類器進(jìn)行研究區(qū)地物分類。
基于野外驗(yàn)證及遙感影像對(duì)比得到地物樣本點(diǎn),此次采用混淆矩陣法對(duì)分類結(jié)果精度進(jìn)行評(píng)價(jià),混淆矩陣也稱之為誤差矩陣,用行列的矩陣表示。主要包括生產(chǎn)者精度(Producer Accuracy, PA)、用戶精度(User accuracy, UA)、總體精度(Overall Accuracy, OA)和Kappa系數(shù)(Kappa Coefficient, KC),這些指標(biāo)從不同角度對(duì)分類結(jié)果進(jìn)行評(píng)價(jià)。
不同地物的光譜特征主要包括Sentinel-2多光譜數(shù)據(jù)的原始13個(gè)波段特征、12個(gè)植被指數(shù)(包括7個(gè)紅邊指數(shù))。根據(jù)劃分的8種典型地物樣本點(diǎn)計(jì)算其光譜特征均值,結(jié)果如圖4a所示。8種地物在原始波段中B11、B12和B4相較于其他波段的地物光譜區(qū)分度要好,而整體來(lái)看植被指數(shù)和紅邊指數(shù)的地物區(qū)分度要高。
對(duì)不同地物的原始波段、紅邊指數(shù)和植被指數(shù)(除紅邊指數(shù))求差值,經(jīng)統(tǒng)計(jì)得到3類的平均值、最小值和最大值分布圖(圖4b),植被指數(shù)在分類中發(fā)揮的作用要優(yōu)于使用原始波段進(jìn)行分類,尤其是CIre、IRECI、MTCI、NDVI、NDVIre1、NDVIre2和PSSRA植被指數(shù),它們的光譜地物區(qū)分度高,由此可知原始波段和植被指數(shù)特征的地物光譜區(qū)分度順序?yàn)椋杭t邊指數(shù)>植被指數(shù)(除紅邊指數(shù))> 原始波段。
圖4 地物光譜特征曲線與統(tǒng)計(jì)圖Fig.4 Characteristic curve and statistical graph of ground feature spectrum
為了消除紋理特征單位或數(shù)量級(jí)之間存在的差異,對(duì)計(jì)算的紋理特征值進(jìn)行了歸一化處理,圖5中對(duì)應(yīng)的Snetinel-2和GF-2提取的紋理特征顯示,Sentinel-2提取的紋理特征除了二階矩之外,其余的各類地物紋理特征區(qū)分度較為明顯,而GF-2中各地物的紋理特征僅協(xié)同性、對(duì)比度和二階矩有一定的區(qū)分效果之外,其余的紋理特征地物區(qū)分度并不好,分析原因是GF-2原始影像空間分辨率較高,提取的紋理特征會(huì)較大成都上突出地物的具體細(xì)節(jié)紋理特征,但地物的邊緣紋理特征區(qū)分度則會(huì)減弱。
圖5 不同地物紋理特征曲線Fig.5 Texture characteristic curves of different ground features
為更好的了解地物在全年的變化狀態(tài),本文在GEE平臺(tái)上獲取了研究區(qū)的各類地物一年內(nèi)的VV極化和VH極化時(shí)間序列數(shù)據(jù),計(jì)算各種地物在不同時(shí)期的后向散射均值,以此作為極化特征進(jìn)行對(duì)地物類型進(jìn)行分類。
由圖6不同地物極化特征變化曲線可知,多時(shí)相的Sentinel-1雷達(dá)數(shù)據(jù)可以明顯區(qū)分不同地物以獲取地物信息,能夠作為不同地物分類的重要依據(jù)。除此之外各地物在6-9月的時(shí)間段內(nèi)極化特征區(qū)分比較明顯,由此也為GF-2影像在時(shí)間上的篩選提供了可靠數(shù)據(jù)依據(jù)。
圖6 不同地物極化特征曲線Fig.6 Polarization characteristic curves of different features
本文通過(guò)提取波段特征、植被指數(shù)特征、紋理特征和極化特征構(gòu)成特征空間,共選擇33個(gè)特征參與地物分類。針對(duì)不同數(shù)據(jù)源和特征組合,基于隨機(jī)森林的特征重要性排序及其對(duì)總體精度、Kappa系數(shù)的影響如圖7所示。對(duì)于4種分類方案而言,其特征對(duì)總體精度和Kappa系數(shù)的影響均呈現(xiàn)出一個(gè)普遍的趨勢(shì):前期有一個(gè)比較迅速的上升期(黑色垂直虛線),中間逐漸變化趨勢(shì)平緩,然后有一個(gè)最優(yōu)的節(jié)點(diǎn)(黑色垂直實(shí)線,即在特征壓縮的情況下保持分類結(jié)果最精準(zhǔn)),最后再增加分類特征會(huì)導(dǎo)致分類結(jié)果精度下降的情況。由于本文研究重點(diǎn)是多源數(shù)據(jù)以及多特征的協(xié)同分類,因此,在根據(jù)特征重要性選擇特征時(shí),文中選擇最優(yōu)節(jié)點(diǎn)前的特征(優(yōu)選特征集)進(jìn)行地物分類。
特征優(yōu)選方案1選擇的特征包括:11個(gè)植被指數(shù)(7個(gè)紅邊指數(shù))和10個(gè)原始波段;方案2選擇的特征包括:7個(gè)植被指數(shù)(4個(gè)紅邊指數(shù))、7個(gè)原始波段和3個(gè)紋理特征;方案3選擇的特征包括:5個(gè)植被指數(shù)(2個(gè)紅邊指數(shù))、6個(gè)原始波段、3個(gè)紋理特征和1個(gè)極化特征;方案4選擇的特征包括:12個(gè)植被指數(shù)(7個(gè)紅邊指數(shù))、13個(gè)原始波段、4個(gè)紋理特征和2個(gè)極化特征。根據(jù)4種方案選擇的特征可知光譜特征,尤其是紅邊指數(shù)在地物分類中的作用較大,這也和上文中光譜特征分析相對(duì)應(yīng),紋理特征的選取也和紋理特征分析得出的結(jié)論相同,即地物的特征區(qū)分度大的特征在分類中占據(jù)重要地位。
圖7 不同特征優(yōu)選方案分類精度隨特征變化圖Fig.7 The classification accuracy of different feature selection schemes varies with features
表4和圖8顯示,整體上4種方案的分類結(jié)果均較好,這是由于結(jié)合了對(duì)植被分類影響比較重要的光譜指數(shù),尤其是加入了對(duì)植被較為敏感的紅邊指數(shù)。
表4 不同試驗(yàn)方案的分類精度Table 4 Classification accuracy of different experimental schemes
方案1利用原始波段和植被指數(shù)對(duì)研究區(qū)主要地物進(jìn)行分類的總體精度是95.91%,Kappa系數(shù)是0.951 1,即說(shuō)明Sentinel-2的光譜信息對(duì)于該研究區(qū)的地物分類有比較好的效果,但有個(gè)別地物的PA和UA處于90%附近,考慮有誤分的情況發(fā)生。
因此,方案2在方案1的基礎(chǔ)上添加地物紋理信息,其結(jié)果總體精度達(dá)到96.57%,Kappa系數(shù)是0.956 1,分類精度均有所提高。方案3基于方案2加入了多時(shí)相的極化特征,其分類結(jié)果精度更高,總體精度為97.62%,Kappa系數(shù)達(dá)到了0.971 6。綜上知,不同地物對(duì)原始波段與植被指數(shù)特征、紋理特征和極化特征有著不同的響應(yīng),利用分類結(jié)果圖和分類精度表綜合分析知:整體上利用原始波段以及植被指數(shù)(尤其是加入了紅邊植被指數(shù))地物分類的效果已經(jīng)較好,即各地類對(duì)光譜原始波段和植被指數(shù)特征的反應(yīng)比較強(qiáng)的。加入紋理特征后各個(gè)時(shí)期的枸杞地分類精度均有提高,分析原因是枸杞地的紋理信息發(fā)育較好,地塊邊界紋理相對(duì)清晰。防護(hù)林和建筑物由于其在遙感影像上以線狀或塊狀形式表現(xiàn),故加入紋理特征后精度也有所提高。但是裸地、濕地和道路光譜特征差異大但紋理相似,加入紋理特征后會(huì)誤分而導(dǎo)致精度下降。對(duì)于極化特征而言,各時(shí)期的枸杞地塊對(duì)其的敏感程度比較低,利用極化特征可以反應(yīng)地物的外觀結(jié)構(gòu)特征信息,防護(hù)林、裸地、濕地和建筑物由于具有一定的高度區(qū)分性,故加入極化特征后精度得到提高。
方案4在方案3的基礎(chǔ)上改變提取紋理特征的數(shù)據(jù)源,其分類結(jié)果相較于方案3精度有所降低,分類總體精度為96.67%,Kappa系數(shù)達(dá)到了0.960 2。根據(jù)PA和UA顯示尤其是早期枸杞地、中期枸杞地、濕地和道路的分類精度有所降低,分析原因是這幾類地物的邊緣紋理信息比較豐富,利用GF-2數(shù)據(jù)源提取的紋理信息會(huì)降低邊緣信息的提取,進(jìn)而導(dǎo)致分類精度降低。除此之外,后者紋理特征發(fā)生變化改變了原來(lái)的特征空間數(shù)據(jù)集,其也是分類精度降低的原因之一。
為了進(jìn)一步比較各個(gè)方案的地物分類差異性,獲取了分類結(jié)果的局部放大圖(圖9),從局部圖可以顯示出方案3分類精度優(yōu)于其他3種方案,其濕地的提取效果明顯要優(yōu)越很多,防護(hù)林的提取效果基本近似,建筑物的提取也有優(yōu)勢(shì),但是針對(duì)晚期枸杞地會(huì)有部分誤分為裸地,其結(jié)果顯示和精度驗(yàn)證表4也相互對(duì)應(yīng)。
圖8 不同方案分類整體圖Fig.8 Overall diagram of different scheme classification
圖9 不同方案分類局部圖Fig.9 Different scheme classification partial map
特征重要性對(duì)于地物的分類尤為關(guān)鍵,為了分析最佳分類方案中參與地物分類的特征之間的相關(guān)度,本文采用“距離”指標(biāo)進(jìn)行描述,即各個(gè)特征重要性評(píng)分之間的差別。通過(guò)距離的大小反映特征之間的緊密度,距離越小越緊密,反之越松散。通過(guò)圖10顯示波段和植被指數(shù)特征、紋理特征和極化特征的內(nèi)部特征關(guān)系緊密,而三組特征之間的大部分特征關(guān)系相對(duì)較弱。
依據(jù)最優(yōu)方案3的分類結(jié)果統(tǒng)計(jì)了研究區(qū)內(nèi)主要的8種地類的面積分布(圖11),早期枸杞地、中期枸杞地、晚期枸杞地、防護(hù)林、裸地、建筑物、濕地和道路面積分別為35.257、32.058、8.332、4.507、54.834、0.637、31.024和3.497 km2。研究區(qū)主要地類便是早期枸杞地、中期枸杞地、裸地和濕地,晚期枸杞地是最近1~2 a剛種植的,考慮死亡等因素,其分布范圍不大。
圖10 最優(yōu)方案特征相關(guān)性Fig.10 Feature correlation of optimal scheme
圖11 最優(yōu)方案地物面積Fig.11 Optimal scheme ground object area
利用多種遙感數(shù)據(jù)源和特征對(duì)地物類型進(jìn)行分類,取長(zhǎng)補(bǔ)短,充分利用各種數(shù)據(jù)的優(yōu)點(diǎn)是得到高分類精度的前提。故本文為分析多源遙感與多特征協(xié)同會(huì)如何影響分類結(jié)果而設(shè)計(jì)了不同方案,表4中方案3(數(shù)據(jù)源:S2和S1;特征:波段、植被指數(shù)、紋理和極化特征)與方案1(數(shù)據(jù)源:S2;特征:波段和植被指數(shù)特征)的生產(chǎn)者精度(PA)和用戶精度(UA)對(duì)比顯示:道路和建筑物由于光譜反射率較高,故在加入極化和紋理特征后,其PA和UA精度變化比較小,且野外驗(yàn)證發(fā)現(xiàn)晚期枸杞地種植的枸杞高度較低,紋理特征發(fā)育比較弱,故晚期枸杞地的PA和UA精度變化也不大。而由于其他幾種地物類型的紋理特征發(fā)育較好,長(zhǎng)時(shí)序的植被生長(zhǎng)期遙感影響特征不同,故在加入紋理特征和多時(shí)相極化特征之后分類精度有了較大的提升,早期枸杞地UA提升了0.78百分點(diǎn),PA提升了1.17百分點(diǎn),中期枸杞地UA和PA分別提升了4.82百分點(diǎn)和0.96百分點(diǎn),防護(hù)林、濕地和裸地的分類精度也相應(yīng)有所提升。
隨著遙感影像空間分辨率的提高,紋理特征被廣泛用于遙感分類由于不同地類空間尺度不同,紋理對(duì)不同地物分類的影響程度也有所差異。為了討論不同空間分辨率提取的紋理特征參與分類對(duì)分類精度的影響,本文提取紋理特征的數(shù)據(jù)源空間分辨率分別10和1 m,為保證空間分辨率一致以進(jìn)行特征組合分析,將1 m高分融合圖像提取的紋理特征進(jìn)行重采樣至10 m,但是其紋理特征效果仍優(yōu)于S2提取的紋理特征。將原紋理特征更換為高空間分辨率影像提取紋理特征不僅改變了紋理特征本身,而且還對(duì)特征空間數(shù)據(jù)集產(chǎn)生了一定的影響。由圖7及表4可以看出,由于特征空間數(shù)據(jù)集和紋理特征的改變導(dǎo)致邊緣紋理信息強(qiáng)的道路和建筑物精度有所降低,而濕地整體紋理特征不明顯,在高空間分辨率數(shù)據(jù)源下提取的紋理特征破碎度比較高,濕地地塊容易形成混合像元,導(dǎo)致其PA和UA均降低了2.87百分點(diǎn)和2.91百分點(diǎn)。早期枸杞地和中期枸杞地對(duì)于低空間分辨率提取的紋理特征,由于防護(hù)林和枸杞塊間隙作為邊緣紋理,而在高空間分辨率提取的紋理特征中便會(huì)缺失這些信息,導(dǎo)致精度的下降。晚期枸杞地發(fā)育比較弱,植株較小,防護(hù)林呈帶狀分布,相對(duì)較窄,二者在高空間分辨率提取的紋理特征會(huì)更明顯,故二者PA和UA分別提升了0.87、2.52個(gè)百分點(diǎn)和0.83、0.85個(gè)百分點(diǎn)。
加入不同空間分辨率影像提取的紋理特征對(duì)地物的分類精度影響不同,在低空間分辨率數(shù)據(jù)源提取紋理特征進(jìn)行分類下的各地類的分類精度大于高空間分辨率數(shù)據(jù)源下的。不同地物類型受紋理特征的影響程度不同,并與空間分辨率有著密切關(guān)系,因此紋理特征對(duì)多光譜遙感分類的影響并不是分辨率越高分類精度越高,在適宜的分辨率下進(jìn)行分類識(shí)別才能達(dá)到更好的效果。另外,同一種植被在不同的生長(zhǎng)期間數(shù)據(jù)對(duì)其有一定程度的差異,不同物候期植被的紋理特征不盡相同,與其他地類的區(qū)分度也有差異,紋理特征在不同物候期對(duì)植被分類的影響需進(jìn)一步研究。
1)基于隨機(jī)森林的特征重要性評(píng)估方法可以有效地提取出對(duì)地物分類影響比較大的特征,極大地壓縮了數(shù)據(jù)量,減少數(shù)據(jù)冗余,提高數(shù)據(jù)處理效率。針對(duì)最優(yōu)方案3,其特征由33個(gè)減少到15個(gè),并且也是在所有特征按重要性排序組合中分類精度最高的。此外,光譜特征、紋理特征和極化特征的內(nèi)部特征關(guān)系緊密,而3組特征之間的大部分特征關(guān)系相對(duì)較弱。
2)通過(guò)4種分類方案的對(duì)比分析,植被指數(shù)(尤其是紅邊指數(shù))在所有特征中對(duì)分類結(jié)果的影響比較大,紋理特征次之,極化特征的影響相對(duì)較小。結(jié)果符合研究區(qū)地物特征,其研究區(qū)主要地物的光譜特征差異比較明顯,而紋理特征由于部分植被分布比較散亂,進(jìn)而導(dǎo)致紋理信息不豐富,極化特征雖然可以有效地區(qū)分光譜特征相似的地類,但是對(duì)于光譜差異較大的地類,極化特征的作用并不明顯。
3)協(xié)同Sentinel-2與Sentinel-1數(shù)據(jù)源,在基于光譜特征分類的基礎(chǔ)上加入紋理特征和極化特征可以有效地提高地物的分類精度,其總體精度提高了1.71個(gè)百分點(diǎn)。協(xié)同三種數(shù)據(jù)源,利用全特征空間,使用Sentinel-2提取紋理特征的各地類分類精度優(yōu)于使用GF-2提取紋理特征參與分類的情況,不同空間分辨率圖像提取的紋理特征對(duì)特征優(yōu)選方案及分類結(jié)果有著不同影響,在適宜的分辨率下提取紋理特征參與分類才能達(dá)到更好的效果。