翟亮,張曉賀,桑會(huì)勇,王曉軍,賈毅
(中國(guó)測(cè)繪科學(xué)研究院 地理國(guó)情監(jiān)測(cè)研究中心,北京 100830)
為全面掌握我國(guó)地理國(guó)情現(xiàn)狀,滿足經(jīng)濟(jì)社會(huì)發(fā)展和生態(tài)文明建設(shè)的需要,國(guó)務(wù)院決定于2013年至2015年開(kāi)展第一次全國(guó)地理國(guó)情普查工作(國(guó)發(fā)[2013]9號(hào))。地表覆蓋遙感影像分類(lèi)是全國(guó)第一次地理國(guó)情普查的重要工作內(nèi)容之一,科學(xué)準(zhǔn)確地測(cè)定地表覆蓋的空間分布與動(dòng)態(tài)變化,對(duì)于全面獲取地理國(guó)情信息,掌握地表自然、生態(tài)和人類(lèi)活動(dòng)基本情況,以及研究地球系統(tǒng)的能量平衡、碳循環(huán)及其他生物地球化學(xué)循環(huán)、氣候變化等具有十分重要的意義[1-2]。遙感影像分類(lèi)技術(shù)是獲取地表覆蓋數(shù)據(jù)的主要方法之一。根據(jù)分類(lèi)對(duì)象的不同,目前常用的遙感影像分類(lèi)方法可以分為基于像元和面向?qū)ο髢煞N。其中,基于像元的分類(lèi)方法作為傳統(tǒng)的分類(lèi)方法被廣泛應(yīng)用于中低分辨率的遙感影像分類(lèi)中,常見(jiàn)的方法有最小距離法、平行六面法、最大似然法和ISODATA、K-Means、模糊聚類(lèi)方法、神經(jīng)網(wǎng)絡(luò)法、決策樹(shù)、支持向量機(jī)(SVM)等。隨著圖像空間分辨率的提高,同類(lèi)地物內(nèi)部光譜差異逐漸增大,基于像元的分類(lèi)技術(shù)已經(jīng)不能滿足當(dāng)前遙感圖像信息提取的要求,成為制約高分辨率遙感影像實(shí)際應(yīng)用的瓶頸,而面向?qū)ο蠓诸?lèi)方法的出現(xiàn)為高分辨率遙感影像信息提取提供了新的思路和方法。
目前決策樹(shù)算法已經(jīng)被廣泛應(yīng)用于遙感影像分類(lèi)中[3-6],GLC樹(shù)分類(lèi)器一種組合決策樹(shù)分類(lèi)器,該分類(lèi)器對(duì)C4.5算法進(jìn)行了改進(jìn),并集成了AdaBoost推進(jìn)技術(shù)。在全球地表覆蓋遙感分類(lèi)——大洋洲地表覆蓋分類(lèi)工作中,GLC樹(shù)被成功應(yīng)用于Landsat衛(wèi)星影像(2000年和2010年2期共796景)分類(lèi)中,并取得了良好的應(yīng)用效果,其分類(lèi)精度平均達(dá)到85%以上。本文將其應(yīng)用于 WorldView-2影像面向?qū)ο蠓诸?lèi)技術(shù)試驗(yàn)中,通過(guò)對(duì)不同地區(qū)的分類(lèi)實(shí)驗(yàn)證明:利用GLC樹(shù)進(jìn)行高分辨率遙感影像分類(lèi)不僅可以獲得較高的精度,而且適用于多種地物類(lèi)別的提取。
WorldView-2衛(wèi)星影像是第一次地理國(guó)情普查的主要遙感數(shù)據(jù)源。WorldView-2衛(wèi)星于2009年10月由美國(guó)Digital Global公司發(fā)射,可提供0.46m的全色影像和8個(gè)波段(包括海岸帶波段、藍(lán)色、綠色、紅色、黃色、紅邊波段及兩個(gè)近紅外波段)的2m多光譜影像,與其他影像相比,WorldView-2的空間分辨率更高,多光譜波段更豐富,為用戶(hù)提供進(jìn)行精確變化檢測(cè)和制圖的能力。不同的波段能從不同方面反映地物的特性,可用于地物的分類(lèi)和解譯。第一次地理國(guó)情普查項(xiàng)目中主要利用了藍(lán)、綠、紅、近紅外4個(gè)波段的數(shù)據(jù)開(kāi)展地表覆蓋分類(lèi)。
WorldView-2衛(wèi)星影像屬于高分辨率遙感影像,傳統(tǒng)的基于像元分類(lèi)方法會(huì)導(dǎo)致椒鹽效應(yīng),所以本文采用了面向?qū)ο蟮姆诸?lèi)思想,首先由對(duì)WorldView-2影像進(jìn)行影像分割生成同質(zhì)圖斑,選擇并提取可用于分類(lèi)的特征;然后選取樣本,利用GLC分類(lèi)器對(duì)生成的圖斑進(jìn)行分類(lèi)。在樣本采集之后,可以通過(guò)交叉驗(yàn)證的方式來(lái)檢測(cè)樣本的質(zhì)量。具體流程如圖1所示。
圖1 自動(dòng)分類(lèi)技術(shù)流程
影像分割是面向?qū)ο筮b感影像分類(lèi)的基礎(chǔ),分割結(jié)果的好壞直接影響最終分類(lèi)效果。常用的分割算法有基于邊緣的影像分割、標(biāo)記分水嶺影像分割、分型網(wǎng)絡(luò)演化影像分割等。其中,分形網(wǎng)絡(luò)演化算法被目前流行的面向?qū)ο蠼庾g軟件所采用,并取得較好的分割效果。該算法采用了異質(zhì)性標(biāo)準(zhǔn)尺度,其計(jì)算公式如下:
影像異質(zhì)性f是由4個(gè)變量計(jì)算而得:wcolor(光譜信息權(quán)重)、1-wcolor(形狀信息權(quán)重)、hcolor(光譜異質(zhì)性值)、hshape(形狀異質(zhì)性值)。wcolor取值為0~1之間,為用戶(hù)定義。
在利用分形網(wǎng)絡(luò)演化算法進(jìn)行影像分割時(shí),需要確定分割尺度參數(shù),即生成的影像對(duì)象最大允許的異質(zhì)性。通過(guò)修改尺度參數(shù),可以改變結(jié)果中的影像對(duì)象尺寸,高的尺度參數(shù)產(chǎn)生的影像對(duì)象大,低的尺度參數(shù)產(chǎn)生的影像對(duì)象小。在滿足必要的精細(xì)的條件下盡可能使用大尺度。
在面向?qū)ο筮b感影像分類(lèi)中,常用的特征可以分為光譜、形狀及紋理特征等。具體見(jiàn)下表。
表1 常用遙感影像特征
《地理國(guó)情普查內(nèi)容與指標(biāo)》中規(guī)定地理國(guó)情信息分為12個(gè)一級(jí)類(lèi),49個(gè)二級(jí)類(lèi),86個(gè)三級(jí)類(lèi)。一級(jí)類(lèi)有:耕地、園地、林地、草地、房屋建筑區(qū)(群)、道路、建筑物、人工堆掘地、裸露地表、水體、地理單元及界限、地形。在利用WorldView-2進(jìn)行地表覆蓋分類(lèi)時(shí)要注意靈活使用《地理國(guó)情普查內(nèi)容與指標(biāo)》中規(guī)定的地表覆蓋分類(lèi)體系。例如,同一景影像中可能同時(shí)存在已經(jīng)長(zhǎng)出莊稼的耕地和未長(zhǎng)莊稼的耕地,兩者的光譜信息會(huì)有較大差異,因此在采集樣本過(guò)程中可自定義類(lèi)別,如將耕地再分為耕地和休耕地或者先將園地、林地歸為一類(lèi)與其他地類(lèi)進(jìn)行粗分類(lèi),然后再逐級(jí)細(xì)分,這樣可以有效提高最終分類(lèi)精度。
此外,在利用GLC分類(lèi)器執(zhí)行影像分類(lèi)時(shí),樣本采集的過(guò)程中有以下幾點(diǎn)建議:
①樣本的質(zhì)量直接決定了分類(lèi)結(jié)果精度,盡量由影像判讀經(jīng)驗(yàn)豐富的技術(shù)人員選擇樣本;
②對(duì)于一景影像,樣本總數(shù)要保證一定的數(shù)量,其中每個(gè)類(lèi)別樣本數(shù)不少于5個(gè);
③某些地表覆蓋類(lèi)別的提取精度與采樣時(shí)其樣本個(gè)數(shù)成正比;
④不要在類(lèi)別不易判斷的地域采集樣本,樣本最好選在確定類(lèi)別地域的中間;
⑤選取的樣本不要過(guò)于集中在一個(gè)區(qū)域,最好是均勻分布。
在本文中,由于條件限制,訓(xùn)練樣本和檢驗(yàn)樣本均采用“隨機(jī)生成點(diǎn),目視判斷類(lèi)別”的方式獲取。
GLC樹(shù)分類(lèi)器是一種決策樹(shù)分類(lèi)器,采用了改進(jìn)后的AdaTree算法,在C4.5算法的基礎(chǔ)上修改其多叉樹(shù)結(jié)構(gòu)為二叉樹(shù),并加入了AdaBoost算法用于提高分類(lèi)精度。通過(guò)GLC分類(lèi)器完成對(duì)分割結(jié)果的自動(dòng)分類(lèi)需要經(jīng)過(guò)生成訓(xùn)練集、生成規(guī)則集、執(zhí)行分類(lèi)三個(gè)步驟。GLC樹(shù)分類(lèi)器具有如下主要特點(diǎn):
①提供了一種基于采樣樣本直接生成規(guī)則集的影像分類(lèi)解決方案;
②分類(lèi)規(guī)則可自動(dòng)生成,并可根據(jù)閾值設(shè)置進(jìn)行規(guī)則自動(dòng)調(diào)整,不僅提高了工作效率,而且避免了人工建立復(fù)雜規(guī)則集,保障了規(guī)則的客觀性和準(zhǔn)確性;
③可以面向像元或面向?qū)ο?,?duì)影像或影像分割結(jié)果進(jìn)行自動(dòng)分類(lèi)。
GLC樹(shù)分類(lèi)器生成的單條規(guī)則表現(xiàn)形式為:
其中,count表示判斷條件的個(gè)數(shù),cover表示該條規(guī)則覆蓋的樣本數(shù)目,correct表示預(yù)測(cè)正確的樣本個(gè)數(shù),pre表示該條規(guī)則的預(yù)測(cè)權(quán)重,class表示類(lèi)別代號(hào),att和cut分別表示判斷屬性和相應(yīng)閾值。
圖2 GLC樹(shù)分類(lèi)器自動(dòng)分類(lèi)流程
為了檢驗(yàn)本文方法的有效性,分別采用了陜西臨潼、杭州、東北三個(gè)地區(qū)的 WorldView-2影像作為實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了分類(lèi)實(shí)驗(yàn),為了驗(yàn)證本文采用的GLC樹(shù)分類(lèi)器的優(yōu)越性,實(shí)驗(yàn)同時(shí)采用了SVM算法作為分類(lèi)器利用同一樣本進(jìn)行了分類(lèi)。
(1)陜西臨潼
該地區(qū)為農(nóng)村,影像為7月份數(shù)據(jù),圖幅大小4096×4096,分辨率全色0.5m,多波段2m,主要以植被為主。根據(jù)地理國(guó)情普查要求和影像實(shí)際情況,設(shè)定解譯標(biāo)志為:人造覆蓋(包括房屋建筑區(qū)、道路、建筑物、人工堆掘地)、耕地、休耕地、水體、耕地、草地、裸地,分割尺度100。訓(xùn)練樣本368個(gè),檢驗(yàn)樣本201個(gè)。分類(lèi)結(jié)果與原始影像局部對(duì)比如圖3,精度評(píng)價(jià)結(jié)果如表4所示。
(2)杭州
圖3 陜西臨潼地區(qū)分類(lèi)結(jié)果
該地區(qū)影像為WorldView-2 7月份數(shù)據(jù),圖幅大小2454×2750,分辨率全色0.5m,多波段2m,主要為城區(qū)。根據(jù)地理國(guó)情普查要求和影像實(shí)際情況,設(shè)定解譯標(biāo)志為:樓房、道路、綠地(包括園地、林地、草地)、水體、裸地,分割尺度150。訓(xùn)練樣本406個(gè),檢驗(yàn)樣本206個(gè)。分類(lèi)結(jié)果與原始影像局部對(duì)比如圖4,精度評(píng)價(jià)結(jié)果如表4所示。
(3)東北某地區(qū)
該地區(qū)影像為 WorldView-2 7月份數(shù)據(jù),圖幅大小3836×3561,分辨率全色0.5m,多波段2m,為城鄉(xiāng)結(jié)合部。根據(jù)地理國(guó)情普查要求和影像實(shí)際情況,設(shè)定解譯標(biāo)志為:耕地、園\林地(包括園地和林地)、草地、房屋建筑、道路、裸地、水體,分割尺度200。訓(xùn)練樣本325個(gè),檢驗(yàn)樣本286個(gè)。分類(lèi)結(jié)果與原始影像局部對(duì)比如圖5,精度評(píng)價(jià)結(jié)果如表4所示。
圖4 杭州地區(qū)分類(lèi)結(jié)果
圖5 東北某地區(qū)分類(lèi)結(jié)果
表4 實(shí)驗(yàn)精度評(píng)價(jià)
上述3個(gè)實(shí)驗(yàn)區(qū)中,實(shí)驗(yàn)1影像中地物相對(duì)比較容易區(qū)分,地物類(lèi)別比較簡(jiǎn)單,實(shí)驗(yàn)2影像中地物類(lèi)別雖然比較簡(jiǎn)單,但是不易區(qū)分,尤其是高樓陰影的存在對(duì)道路和水體的提取都有一定的影像;實(shí)驗(yàn)3影像中地物類(lèi)別復(fù)雜度和區(qū)分難度適中。
通過(guò)上述對(duì)3個(gè)不同地區(qū)的分類(lèi)結(jié)果分析,可以發(fā)現(xiàn):在影像分割結(jié)果的基礎(chǔ)上,對(duì)于地物類(lèi)別容易區(qū)分的地區(qū),GLC樹(shù)和SVM都可以取得較高的分類(lèi)精度,但在地物類(lèi)別較難區(qū)分的地區(qū),尤其是城市,兩種分類(lèi)器的分類(lèi)精度有所降低。但是從整體結(jié)果上講,GLC樹(shù)分類(lèi)器提供了較高的分類(lèi)精度,在相同影像分割、特征和樣本的基礎(chǔ)上,與SVM分類(lèi)器相比,GLC具有更高的分類(lèi)精度。同時(shí),由于GLC樹(shù)分類(lèi)器中用到了AdaBoost提升算法來(lái)提高分類(lèi)精度,每次提升都需要利用隨機(jī)函數(shù)按照新的權(quán)重選取不同樣本,所以每次執(zhí)行GLC樹(shù)分類(lèi)結(jié)果都會(huì)有差異,但這種差異很小,不影響地理國(guó)情普查生產(chǎn)作業(yè)。目前,GLC樹(shù)分類(lèi)器已經(jīng)集成到地理國(guó)情普查生產(chǎn)作業(yè)平臺(tái)——地理國(guó)情要素提取與解譯系統(tǒng)(FeatureStation_GeoEx)。
本文通對(duì) WorldView-2影像數(shù)據(jù)和面向?qū)ο筮b感影像地表覆蓋分類(lèi)方法的研究,提出了地理國(guó)情普查中WorldView-2影像地表覆蓋自動(dòng)分類(lèi)技術(shù)流程,首先利用分形網(wǎng)絡(luò)演化算法獲得分割結(jié)果并進(jìn)行特征選擇與提取,然后選擇訓(xùn)練樣本采用GLC樹(shù)分類(lèi)器對(duì)分割結(jié)果進(jìn)行自動(dòng)分類(lèi)。實(shí)驗(yàn)分別選取了3幅不同地區(qū)、地物類(lèi)型不同的WorldView-2影像進(jìn)行分類(lèi),現(xiàn)有分類(lèi)結(jié)果證明,利用GLC樹(shù)分類(lèi)器進(jìn)行高分辨率遙感影像地表覆蓋分類(lèi)可以獲得較高的分類(lèi)精度,其平均Kappa系數(shù)達(dá)到85.61%。今后,為了提高工作效率,將圍繞利用GLC樹(shù)分類(lèi)器建立地表覆蓋分類(lèi)規(guī)則庫(kù)進(jìn)行研究。
[1]陳軍,陳晉,宮鵬,等.全球地表覆蓋高分辨率遙感制圖[J].地理信息世界,2011,2:12-14.
[2]李曉兵,陳云浩,喻鋒.基于遙感數(shù)據(jù)的全球及區(qū)域土地覆蓋制圖—現(xiàn)狀、戰(zhàn)略和趨勢(shì)[J].地球科學(xué)進(jìn)展,2004,19(1):71-80.
[3]JOY S M,REICH R M,REYNOLDS R T.A non-parametric supervised classification of vegetation types on the kaibab national forest using decision trees[J].International Journal of Remote Sensing,2003,24(9):1835-1852.
[4]FRANKLIN S E,STENHOUSE G B,HANSEN M J,et al.An integrated decision tree approach (IDTA)to mapping landcover using satellite remote sensing in support of grizzly bear habitat analysis in the alberta yellowhead ecosystem.[J].Canadian Journal of Remote Sensing,2001,27(6):579-592.
[5]SIMARD M,SAATCHI S S,DE GRANDI G.The use of decision tree and multiscale texture for classification of JERS-1 SAR data over tropical forest[J].IEEE Transactions on Geoscience and Remote Sensing,2000,38(5):2310-2321.
[6]溫興平,胡光道,楊曉峰.基于C5.0決策樹(shù)分類(lèi)算法的ETM+影像信息提?。跩].地理與地理信息科學(xué),2007,23(6):26-29.