劉志濤 蘇根成
摘要:運(yùn)用監(jiān)督分類和決策樹兩種方法,以2014-8-25的Landsat8-OLI遙感影像為基礎(chǔ)數(shù)據(jù)源,提取新巴爾虎右旗的沼澤和草甸信息。方法一:在ENVI中進(jìn)行監(jiān)督分類,將研究區(qū)分為沼澤和草甸、草地、森林、農(nóng)用地、水體、居民地、沙地和其他等八類,采用最大似然法對(duì)研究區(qū)遙感影像進(jìn)行沼澤和草甸信息的提取工作。方法二:求取研究區(qū)的歸一化植被指數(shù)NDVI,將NDVI值和坡度值作為限制條件,進(jìn)行求取研究區(qū)域的沼澤和草甸信息。將兩種方法獲得的沼澤和草甸分類圖與驗(yàn)證樣本進(jìn)行混合矩陣分析,分別對(duì)兩種分類結(jié)果進(jìn)行精度評(píng)價(jià),比較監(jiān)督分類和決策樹分類在沼澤和草甸信息提取的精度。結(jié)果表明:Landsat8-OLI影像采用監(jiān)督分類的精度為89.40%,利用決策樹分類的精度達(dá)到了91.05%,精度較高。這兩種方法均能夠很好地進(jìn)行沼澤和草甸信息提取,同時(shí)驗(yàn)證了基于Landsat8遙感影像在濕地覆被分類的可行性。
關(guān)鍵詞:新巴爾虎右旗;沼澤;草甸;監(jiān)督分類;決策樹
1.引言
1.1研究背景
本文所研究的濕地,包括研究區(qū)內(nèi)的河流濕地、湖泊濕地、沼澤濕地以及草甸濕地等。近年來由于人類經(jīng)濟(jì)的不斷發(fā)展,在比較偏遠(yuǎn)的濕地也得到了開發(fā)利用,同時(shí)也遭到嚴(yán)重破壞,濕地污染,面積也不斷減少,功能日趨退化。因此,保護(hù)濕地已經(jīng)引起了人們的廣泛關(guān)注。濕地多處于偏遠(yuǎn)地區(qū),采用傳統(tǒng)的手段來監(jiān)測(cè),費(fèi)時(shí)、費(fèi)力、耗費(fèi)高,調(diào)查范圍小,對(duì)濕地有破壞性,而且其周期性較長,往往需要幾個(gè)月甚至幾年,時(shí)效性很差。及時(shí)、準(zhǔn)確地獲取濕地變化信息已成為濕地保護(hù)的重要手段之一。衛(wèi)星遙感技術(shù)具有觀測(cè)范圍廣、信息量大、獲取速度快、動(dòng)態(tài)性和實(shí)時(shí)性等優(yōu)點(diǎn),被廣泛應(yīng)用于濕地動(dòng)態(tài)監(jiān)測(cè)。
本文以內(nèi)蒙古自治區(qū)呼倫貝爾市新巴爾虎右旗為例,通過選取不同方法進(jìn)行沼澤和草甸信息提取,得到該濕地空間分布圖,為新巴爾虎右旗濕地保護(hù)提供參考信息,以期為OLI影像更廣泛和更有效地應(yīng)用于濕地信息提取提供參考依據(jù)。
1.2研究區(qū)概括
新巴爾虎右旗是內(nèi)蒙古自治區(qū)的19個(gè)邊境旗市和23個(gè)牧業(yè)旗之一,是自治區(qū)唯一一個(gè)與兩個(gè)毗鄰國家接壤的旗縣,即中俄蒙三國交界處。地理位置在中國東北邊陲(東經(jīng)111°31′~117°43′,北緯47°36′~49°50′),在舉世聞名的呼倫貝爾大草原西南部。東部以烏爾遜河為界與新巴爾虎左旗隔河相望,東北部與全國最大的陸路口岸城市滿洲里毗鄰??偯娣e25194km2,其中水域面積2217.4km2。新右旗境內(nèi)水資源豐富,有克魯倫河和烏爾遜河2條河流和呼倫湖、貝爾湖、烏蘭諾爾3個(gè)較大湖泊、濕地,屬于黑龍江流域額爾古納河水系,年徑流總量為8.072億立方米。
2.研究方法
2.1監(jiān)督分類方法
監(jiān)督分類(Supervised Classification)又稱訓(xùn)練分類法,是用已經(jīng)確認(rèn)類別的樣本像元來識(shí)別未知類別像元的過程。當(dāng)對(duì)研究區(qū)域比較了解的時(shí)候,或掌握了更多的先驗(yàn)知識(shí),為了使這些有用的輔助信息參與到遙感分類中,需要使用監(jiān)督分類方法。監(jiān)督分類主要是根據(jù)分類的復(fù)雜程度、精度要求等來選擇分類器。常用的分類器有最小距離、最大似然、平行六面體、馬氏距離、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等。本文主要選取最大似然法對(duì)研究區(qū)的不同影像數(shù)據(jù)進(jìn)行分類比較。
2.2最大似然法
最大似然判別法,也稱為bayes分類,它是建立在貝葉斯準(zhǔn)則的基礎(chǔ)上,偏重于集群分布的統(tǒng)計(jì)特性,分類原理是假定訓(xùn)練樣本數(shù)據(jù)在光譜空間的分布是服從高斯正態(tài)分布規(guī)律的,通過對(duì)感興趣區(qū)域的統(tǒng)計(jì)和計(jì)算求出樣本均值、方差和協(xié)方差等統(tǒng)計(jì)特征參數(shù),從而求出總體的先驗(yàn)概率密度函數(shù),然后通過計(jì)算給定像元屬于某訓(xùn)練樣本的概率,將像元?dú)w人概率最大的一類中,從而達(dá)到分類的效果。具體分為3步:首先確定各類的訓(xùn)練樣本;再根據(jù)訓(xùn)練樣本計(jì)算各類的統(tǒng)計(jì)特征值,建立分類判別函數(shù);最后逐點(diǎn)掃描影像各像元,將像元特征向量代人判別函數(shù),求出其屬于各類的概率,將待判斷像元?dú)w屬于最大判別函數(shù)值的一組。
2.3決策樹
決策樹分類算法的基本思想是:按照一定的規(guī)則把遙感數(shù)據(jù)集逐級(jí)往下細(xì)分以得到具有不同屬性的各個(gè)類別。分類決策樹由一個(gè)根節(jié)點(diǎn)(Root nodes)、一系列內(nèi)部節(jié)點(diǎn)(Internal nodes)(分支)和終極節(jié)點(diǎn)(Terminal nodes)(葉)組成,每個(gè)內(nèi)部節(jié)點(diǎn)只有一個(gè)父節(jié)點(diǎn)和兩個(gè)多個(gè)子節(jié)點(diǎn)。在每一個(gè)內(nèi)部節(jié)點(diǎn)(包括根節(jié)點(diǎn))處根據(jù)一系列規(guī)則將該節(jié)點(diǎn)處的數(shù)據(jù)集劃分為兩個(gè)子集,如此往復(fù)直至所有的數(shù)據(jù)被分為預(yù)期設(shè)定的各個(gè)子集為止。這里的規(guī)則可以是根據(jù)經(jīng)驗(yàn)和目視解譯人為設(shè)定,也可以按照一定的算法自動(dòng)獲取。決策樹能夠處理的數(shù)據(jù)集不僅包含光譜信息,還可以是紋理信息、空間特征和高程信息等多元數(shù)據(jù)。圖1為本次分類的決策樹的基本模型。
3.數(shù)據(jù)處理
3.1前期處理
從權(quán)威地理信息數(shù)據(jù)網(wǎng)站http:∥www.gscloud.cn/下載研究區(qū)的遙感影像,選取Landsat8-OLI的2014-8-25遙感影像為基礎(chǔ)數(shù)據(jù)進(jìn)行處理。數(shù)據(jù)必須利用專業(yè)軟件打開和處理,數(shù)據(jù)預(yù)處理步驟如下:①輻射校正。Landsat-8得到的數(shù)據(jù)為Levell T級(jí)別,該數(shù)據(jù)產(chǎn)品是使用地面控制點(diǎn)和數(shù)字高程模型數(shù)據(jù)進(jìn)行幾何精校正處理后得到的數(shù)據(jù)產(chǎn)品,因此,實(shí)驗(yàn)用的Landsat-8數(shù)據(jù)可以直接使用而不需要做幾何校正。本文主要對(duì)研究數(shù)據(jù)直接進(jìn)行輻射校正處理。輻射校正的目的是消除或修正輻射誤差而引起的影像畸變,主要包括輻射定標(biāo)和大氣校正。本文采用ENVI中的FLAASH工具進(jìn)行大氣校正,具有較高的輻射校正精度,更適合用于濕地植被信息的提取。大氣校正后自動(dòng)剔除卷云波段9,應(yīng)用于數(shù)據(jù)分類的是1~7共7個(gè)波段。②影像鑲嵌。由于單幅的Landsat-8影像無法完全覆蓋整個(gè)研究區(qū)域,所以對(duì)兩幅互為鄰接的Landsat-8影像進(jìn)行幾何鑲嵌、色調(diào)調(diào)整、去重疊等處理,拼接為統(tǒng)一的影像。③影像裁剪。根據(jù)已有的研究區(qū)矢量化邊界,結(jié)合新巴爾虎右旗行政區(qū)劃圖,進(jìn)行影像裁剪,裁剪后的結(jié)果影像作為研究區(qū)的基礎(chǔ)數(shù)據(jù),且影像質(zhì)量滿足研究需求。
3.2監(jiān)督分類提取沼澤和草甸
利用監(jiān)督分類方法,將研究區(qū)的覆被信息分為沼澤和草甸、草地、森林、農(nóng)用地、水體、居民地、沙地和其他等八類。利用經(jīng)驗(yàn)和已有資料選取有代表性訓(xùn)練區(qū),繪制成多邊形,對(duì)每一種選取的訓(xùn)練區(qū)都均勻地分布在整個(gè)研究區(qū)中,濕地感興趣區(qū)選擇為181個(gè),將提取好的訓(xùn)練區(qū)用最大似然法分類,得到初步分類效果圖,如圖2所示。由于遙感影像圖的分類過程是按照影像光譜特征進(jìn)行的聚類分析,都帶有一定的盲目性,分類得到結(jié)果圖成塊的地類圖會(huì)出現(xiàn)小塊的異類圖斑。本實(shí)驗(yàn)對(duì)分類圖進(jìn)行了聚類分析(Clump),過濾處理(sieve),得到的監(jiān)督分類影像圖(見圖3)。由于克魯倫河這一主要水系在監(jiān)督分類過程中沒有與沼澤草甸分離,為此計(jì)算了歸一化差異水體指數(shù)(NDWI),提取出水體信息,然后進(jìn)行了波段差值運(yùn)算,從監(jiān)督分類結(jié)果圖中去除了水體信息,得到新巴爾虎右旗的最終監(jiān)督分類結(jié)果圖,沼澤草甸與河流明確地分離開,而且沼澤草甸斑塊比較完整(如圖4)。
3.3決策樹方法提取沼澤草甸信息
決策樹分類算法的基本思想是:按照一定的規(guī)則通過構(gòu)建決策樹模型,把遙感數(shù)據(jù)集逐級(jí)往下細(xì)分以得到具有不同屬性的各個(gè)類別,在本文的決策樹模型是通過兩個(gè)分支提取的研究區(qū)的兩類沼澤草甸信息。
在決策樹模型中,ndvi為歸一化植被指數(shù);p(nir)為近紅外波段的反射率;slope為由DEM求得的坡度圖。
如圖1所示,該決策樹模型是以研究區(qū)的NDVI為基礎(chǔ),在反映新巴爾虎右旗土地覆蓋植被狀況優(yōu)勢(shì)明顯。在構(gòu)建模型時(shí),通過反復(fù)試錯(cuò)獲得沼澤草甸區(qū)域在決策樹各節(jié)點(diǎn)的分割閾值為0.3時(shí),能夠較精確的提取出大量沼澤草甸信息,同時(shí)也包含了研究區(qū)北部的森林地貌信息,此時(shí)利用沼澤草甸的坡度較小的特點(diǎn),以slope<0.8為條件能夠剔除其他干擾信息,而提取出大部分沼澤草甸信息;其次在呼倫湖南岸有大片鹽堿地的ndvi值較低,通過反復(fù)試錯(cuò)以nd-vi<0.15和p(nir)>1400為條件,可以做到精確區(qū)分。
4.分類結(jié)果評(píng)價(jià)
對(duì)于遙感圖像的分類結(jié)果,可以采用混淆矩陣和分類精度指標(biāo)進(jìn)行評(píng)價(jià),分類精度指標(biāo)主要有用戶精度、生產(chǎn)者精度、總體精度、錯(cuò)分誤差、漏分誤差和Kappa系數(shù)。本文主要采用總體分類精度(Overall Accuracy)和Kappa系數(shù)來進(jìn)行分類精度評(píng)估,驗(yàn)證樣本為通過已有資料選取的80個(gè)樣點(diǎn),分別建立混淆矩陣。
Landsat8-OLI影像采用監(jiān)督分類的精度為89.40%,Kappa系數(shù)為0.54;決策樹分類的精度達(dá)到了91.05%,Kappa系數(shù)為0.63。兩種方法均可用,后者能夠更好地進(jìn)行沼澤草甸信息提取分類,精度更高。表明基于Landsat8遙感影像在沼澤草甸覆被分類的可行性,從而能夠及時(shí)合理地保護(hù)濕地資源。
5.結(jié)果分析
監(jiān)督分類結(jié)果如圖5所示,經(jīng)過統(tǒng)計(jì),沼澤草甸面積約為916.46km2。決策樹模型得到的結(jié)果如圖6所示,沼澤草甸面積約為885.59km2。
由圖可知,新巴爾虎右旗的沼澤草甸植被比較豐富,主要分布在克魯倫河流域以及呼倫湖、貝爾湖周邊,在研究區(qū)的南北內(nèi)陸草原地區(qū)受星羅棋布的湖泊影響,也有一定小面積的濕地存在。
6.結(jié)論
本文利用landsat-8的影像應(yīng)用監(jiān)督分類和決策樹兩種方法提取了沼澤和草甸信息,并將分類結(jié)果與已有分類數(shù)據(jù)進(jìn)行混淆矩陣驗(yàn)證,結(jié)果表明決策樹的分類精度更高,比監(jiān)督分類結(jié)果高出1.65%??梢娫跐竦馗脖环诸愌芯恐杏幸欢ǖ姆诸惥葍?yōu)勢(shì)。
此外就遙感影像分類提取信息而言,在選擇不同時(shí)期的影像圖對(duì)提取的精度影響也很大。在北方地區(qū)提取沼澤草甸信息時(shí),選取八九月份的影像效果較佳,其他草本植物的葉綠素比濕生植物降解的早,此時(shí)的沼澤草甸信息在標(biāo)準(zhǔn)假彩色影像的顏色紋理更清晰,提取精度可能更高。