徐世武,楊 雙,孫 飛,郭慶華
(1.中國地質(zhì)大學(xué)(武漢),湖北武漢 430074;2.中國科學(xué)院植物研究所,北京 100093)
面向?qū)ο蟮母叻直媛视跋駟沃捣诸惛靥崛》椒ㄑ芯?/p>
徐世武1,楊 雙1,孫 飛1,郭慶華2
(1.中國地質(zhì)大學(xué)(武漢),湖北武漢 430074;2.中國科學(xué)院植物研究所,北京 100093)
隨著城市化進(jìn)程的加快,耕地面積逐年減少,實(shí)時監(jiān)測耕地信息已成為國土管理部門關(guān)注的問題。利用傳統(tǒng)遙感分類器提取地面覆蓋信息要求定義所有感興趣的類別[1],分類系統(tǒng)需要滿足互斥性、完備性、層次性[2]。但在很多應(yīng)用中,用戶只關(guān)心某一特定地類[3],如耕地提取,如果只需標(biāo)記感興趣的地類(即目標(biāo)類),勢必減少真實(shí)地表數(shù)據(jù)采集、樣本選取耗費(fèi)的大量人力和時間。本文將從影像中提取某一類特定地類問題,定義為單值分類問題。
由于傳統(tǒng)的監(jiān)督分類器需要全類別樣本,故無法直接將其應(yīng)用于單值分類問題[4]。其次,缺少部分類別的不完全訓(xùn)練集是對地表景觀的不完全認(rèn)識,硬分類器采用的加權(quán)硬閾值難以模擬真實(shí)分布,神經(jīng)網(wǎng)絡(luò)作為一種“軟”處理,在數(shù)學(xué)上可微,更適合處理不完全訓(xùn)練集問題[2]。Li等[5]將Elkan和Noto提出的基于正樣本、未標(biāo)記樣本的學(xué)習(xí)算法(positive and unlabeled learning,PUL)[6]應(yīng)用于遙感分類問題,其分類精度優(yōu)于支持向量機(jī)法(BSVM)、一值支持向量機(jī)(OCSVM)和高斯域描述(GDD)3種單值分類算法。因此,本文采用這種新算法來解決單值分類問題,并采用神經(jīng)網(wǎng)絡(luò)分類器來實(shí)現(xiàn)。
隨著遙感數(shù)據(jù)分辨率的提高,地物類別內(nèi)部的光譜響應(yīng)變異增大,降低類別可分性,導(dǎo)致傳統(tǒng)基于像元的遙感影像分析方法無法滿足分類需求。已有大量研究表明,面向?qū)ο蟮挠跋穹治隹捎行У貙Ω叻直媛视跋襁M(jìn)行信息自動提取[7],其特點(diǎn)為處理對象為多尺度分割、封裝后的目標(biāo),即影像上形狀與光譜性質(zhì)具同質(zhì)性的單元[8],將像素進(jìn)行對象級封裝,在利用光譜信息的同時,考慮其空間特征,并結(jié)合對象的紋理與鄰域信息,進(jìn)而更接近人類的認(rèn)知過程[9]。
因此,本文在完全訓(xùn)練集和不完全訓(xùn)練集下,利用結(jié)合面向?qū)ο蠛突谡龢颖尽⑽礃?biāo)記樣本的單值(PUL)分類方法對多源高空間分辨率影像進(jìn)行耕地信息提取研究,選取7塊研究區(qū),對比基于像素的分類試驗(yàn),經(jīng)特征影像提取、抽樣、分類器學(xué)習(xí)、類別判別及精度評價得到試驗(yàn)結(jié)果。
1.數(shù)據(jù)獲取
本文選取了3種高分辨率影像數(shù)據(jù):廣西北海市鐵山港區(qū)(樣區(qū)1―3,0.2 m航空數(shù)據(jù))、武漢市洪山區(qū)光谷一帶區(qū)域(樣區(qū)4―5,2.44 m QuickBird影像數(shù)據(jù))、湖北省大冶市(樣區(qū)6―7,2.5 m SPOT影像數(shù)據(jù))。試驗(yàn)樣區(qū)大小為1000像素×1000像素,7組試驗(yàn)樣區(qū)包含了幾種典型的土地覆蓋類型,如有覆蓋的耕地類型、無覆蓋的耕地類型、道路、水體、居民地、林地、裸地等。
2.圖像分割和特征提取
本文采用ENVI定義的基于邊界的分割算法,采用多尺度切割方法,綜合考慮光譜特征、緊密度和光滑度等幾何特征,生成同質(zhì)的影像對象多邊形。影像分割后提取緊密度、多邊形圓特征、形狀要素、矩形形狀量度,波段平均灰度值、灰度值標(biāo)準(zhǔn)差、卷積核內(nèi)的平均灰度值、卷積核內(nèi)平均信息熵、飽和度及亮度作為耕地的判別特征。
3.基于面向?qū)ο蟮膯沃捣诸愒囼?yàn)
在特征提取的基礎(chǔ)上,按照各個類別隨機(jī)抽樣,訓(xùn)練集需要包括正樣本(目標(biāo)樣本)及背景樣本(未標(biāo)記樣本),使用完全訓(xùn)練集和不完全訓(xùn)練集進(jìn)行傳統(tǒng)神經(jīng)網(wǎng)絡(luò)和單值分類框架網(wǎng)絡(luò)訓(xùn)練,單值分類在網(wǎng)絡(luò)訓(xùn)練的同時估算常數(shù)c值。根據(jù)概率模型計算各個像素屬于各個類別的后驗(yàn)概率,依據(jù)最大概率原則決定每個像元的歸屬,同時設(shè)置閾值0.5控制后驗(yàn)概率的可靠性。最后,計算遙感分類的各個精度指標(biāo)并進(jìn)行精度評價。PUL模型詳細(xì)見Elkan相關(guān)論述[8](如圖1所示)。
4.基于像素的單值分類試驗(yàn)
本文中用于對比的基于像素分類試驗(yàn),除處理對象、特征提取不同之外,為增加可比性,其他步驟均與基于面向?qū)ο蠓诸愒囼?yàn)相同。該部分試驗(yàn)特征提取均基于影像二階概率紋理統(tǒng)計,選取的紋理因子包括均值、方差、協(xié)同性、對比度和二階矩,且均采用3×3開窗計算。
圖1 PUL單值分類框架
表1是不同分辨率的7組試驗(yàn)樣區(qū)抽樣大小為正樣本800的10次試驗(yàn)結(jié)果平均值。
表1 基于像素分類結(jié)果與面向?qū)ο蠓诸惤Y(jié)果對比表
從表1中2.44 m數(shù)據(jù)基于面向?qū)ο蟮慕Y(jié)果中可以明顯看出,在不完全訓(xùn)練集的情況下,對于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)分類,相比完全訓(xùn)練集的情況,總體精度有5%~7%的降低,Kappa系數(shù)有8%~11%的下降,而PUL方法的則只有0~1%的下降,對于部分?jǐn)?shù)據(jù)有1%左右的提高。這就說明,在缺少部分類型先驗(yàn)知識的情況下,對于傳統(tǒng)的方法有很大的影響,而PUL方法則有相對比較穩(wěn)定的表現(xiàn)。同時PUL方法在不完全訓(xùn)練集作用下比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)分類總體精度高2%~5%,平均高出3.5%;Kappa系數(shù)高4%~8%,平均高出6.3%,說明單值PUL分類與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)分類相比有較高的優(yōu)勢。
為了驗(yàn)證多源高分辨數(shù)據(jù)是否都有這個現(xiàn)象,對于0.2 m數(shù)據(jù)和2.5 m數(shù)據(jù)也進(jìn)行同樣的分析,結(jié)果發(fā)現(xiàn)2.5 m數(shù)據(jù)有相同的現(xiàn)象,而對于0.2 m更高分辨率數(shù)據(jù)卻發(fā)現(xiàn)在不完全訓(xùn)練集下傳統(tǒng)方法與PUL方法的精度相當(dāng),其差異不超過1%。通過以上分析,可初步得到在不完全訓(xùn)練集下2.44 m數(shù)據(jù)和2.5 m數(shù)據(jù)面向?qū)ο蟮膯沃捣诸愐獌?yōu)于傳統(tǒng)方法,并且在缺少部分類別時有相對比較穩(wěn)定的表現(xiàn),而對于更高分辨率的0.2 m航空影像數(shù)據(jù)卻沒有這個規(guī)律的結(jié)論。
另從表1中可以明顯看出,基于面向?qū)ο蠓ǖ姆诸惤Y(jié)果在對應(yīng)的數(shù)值上均要優(yōu)于基于像素的分類結(jié)果。在不完全訓(xùn)練集下,單值分類,對于0.2 m數(shù)據(jù),基于面向?qū)ο蟮目傮w分類精度比基于像素高2.3%~16.8%,平均高出10.4%,kappa系數(shù)高2.4%~23.5%,平均高出17.3%;對于2.44 m數(shù)據(jù),總體精度平均高17.5%,Kappa系數(shù)平均高出25.3%;對于2.5 m數(shù)據(jù),總體分類精度平均高出11.4%,kappa系數(shù)平均高出15.6%。
綜合以上分析,在不完全訓(xùn)練集模式下,可得到基于面向?qū)ο蟮膯沃捣诸愑休^大優(yōu)勢的結(jié)論。
將樣區(qū)1(0.2 m數(shù)據(jù))基于面向?qū)ο蠛突谙袼氐姆诸惤Y(jié)果進(jìn)行可視化,對比真實(shí)地物分布矢量圖(土地調(diào)查成果數(shù)據(jù)加以人工解譯修正),比較完全訓(xùn)練集和不完全訓(xùn)練集下的傳統(tǒng)方法與單值分類對于耕地的提取效率。如圖2―圖4所示(均為原始結(jié)果,未進(jìn)行分類后處理)。
圖2 樣區(qū)1
圖3 樣區(qū)1面向?qū)ο穹诸惤Y(jié)果
圖4 樣區(qū)1基于像素的分類結(jié)果
圖2―圖4中淺灰色部分代表道路,黑色部分代表有覆蓋耕地,深灰色部分代表無覆蓋耕地,特別的,白色部分代表類型不確定部分(其他類),可能為陰影區(qū)域或者地類分界處。從目視效果來看,對于典型地物基于像素和基于面向?qū)ο蟮膫鹘y(tǒng)方法和單值分類方法均可以正確判別。在基于面向?qū)ο蟮姆诸惤Y(jié)果中,完全訓(xùn)練集下,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)分類明顯存在很多錯分現(xiàn)象,在耕地中存在大量的白色區(qū)域,而單值分類則較少錯分;對于不完全訓(xùn)練集,傳統(tǒng)方法由于不充分地訓(xùn)練學(xué)習(xí),造成白色代表的不確定類別錯分為已知類,而單值分類結(jié)果則比較穩(wěn)定。在基于像素的分類結(jié)果中,完全訓(xùn)練集下,傳統(tǒng)分類中存在大量白色區(qū)域,明顯多于相同條件下的單值分類結(jié)果。而對于不完全訓(xùn)練集兩種方法結(jié)果中白色區(qū)域都非常的少,但與真實(shí)地表矢量圖的吻合度要低于基于面向?qū)ο蟮姆诸惤Y(jié)果。
本文結(jié)合面向?qū)ο蟮乃枷牒突谡龢颖?、未?biāo)記樣本遙感單值分類方法對多源高空間分辨率影像進(jìn)行分類,同時對比基于像素的分類試驗(yàn)。結(jié)果表明:
1)對不完全訓(xùn)練集問題,單值分類較傳統(tǒng)神經(jīng)網(wǎng)絡(luò)分類有更較穩(wěn)定的表現(xiàn)。
2)對多源高分辨數(shù)據(jù),在解決不完全樣本問題上,面向?qū)ο蟮姆诸惥榷家h(yuǎn)高于基于像素的分類精度。單值分類應(yīng)用面向?qū)ο蠓诸惪梢蕴岣叻诸惥取?/p>
3)基于面向?qū)ο蟮姆诸愋Ч麍D與真實(shí)地表矢量圖的吻合度明顯要優(yōu)于基于像素的分類效果圖。單值分類對于不完全樣本集問題具有更穩(wěn)定的表現(xiàn)。
[1]HODGSON M E,JENSEN J R,TULLIS J A,et al. Synergistic Use of LiDAR and Color Aerial Photography for Mapping Urban Parcel Imperviousness[J].Photogrammetry Engineering&RemoteSensing,2003,69(9):973-980.
[2]RICHARDS J A,JIA X.Remote Sensing Digital Image Analysis:An Introduction[M].Berlin:Springer,1999.
[3]FOODY G M,MATHUR A,SANCHEZ H C,et al. Training Set Size Requirements for the Classification of a Specific Class[J].Remote Sensing of Environment,2006,104(1):1-14.
[4]MUNOZ M J,BRUZZONE L,CAMPS V G.A Support Vector Domain Description Approach to Supervised Classification of Remote Sensing Images[J].IEEE Transactions on Geoscience and Remote Sensing,2007,45(8):2683-2692.
[5]LI W,GUO Q H,ELKAN C.A Positive and Unlabeled Learning Algorithm for One-class Classification of Remote-sensing Data[J].IEEE Transactions on Geoscience and Remote Sensing,2011,49(2):717-725.
[6]ELKAN C,NOTO K.Learning Classifiers from Only Positive and Unlabeled Data[C]∥Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Las Vegas,Nevada,USA:[s.n.],2008.
[7]OPITZ D,BLUNDELL S.Object Recognition and Image Segmentation:The Feature Analyst Approach[C]∥Object-Based Image Analysis.Berlin:Springer Berlin Heidelberg,2008:153-167.
[8]BENZ U.Definiens Imaging GmbH:Object-Oriented Classification and Feature Detection[J].IEEE Geoscience and Remote sensing Society Newsletter,2001(5):16-20.
[9]GAMOTTO J P.A New Approach to Combining Region Growing and Edge Detection[J].Pattern Recognition Letters,1993,14(11):869-875.
Method Research on Cultivated Land Extraction Based on Object One-Class Classification of High-spatial-resolution Images
XU Shiwu,YANG Shuang,SUN Fei,GUO Qinghua
遙感技術(shù)已廣泛應(yīng)用于土地覆蓋/土地利用分類中。在專題應(yīng)用中,用戶只對某一類地物感興趣,如耕地提取,即單類別分類問題。隨著影像分辨率的提高,基于像元的分類算法難以滿足高分辨率影像高精度信息提取的需求。本文采用結(jié)合面向?qū)ο蠓诸愃枷牒突谡龢颖?、未?biāo)記樣本遙感單值(PUL)分類方法從多源高分辨率影像中提取耕地信息,并與基于像素的分類試驗(yàn)進(jìn)行對比分析。結(jié)果表明,在缺少部分地類的不完全訓(xùn)練集下,基于面向?qū)ο蟮膯沃捣诸愝^傳統(tǒng)神經(jīng)網(wǎng)絡(luò)分類有更較穩(wěn)定的表現(xiàn),并且遠(yuǎn)優(yōu)于基于像素的分類結(jié)果。
面向?qū)ο?;單?PUL)分類;多源高分辨率影像;耕地;不完全訓(xùn)練集
P236
B
0494-0911(2014)10-0078-04
2013-08-20
國土空間規(guī)劃決策支持與管理平臺開發(fā)(2012BAB11B05);國土空間優(yōu)化配置關(guān)鍵技術(shù)研究與示范(2012BAB11B00)
徐世武(1973―),男,土家族,湖北長陽人,博士,副教授,主要從事國產(chǎn)GIS、遙感、國土資源管理的教學(xué)、科研與成果產(chǎn)業(yè)化工作。
楊 雙
徐世武,楊雙,孫飛,等.面向?qū)ο蟮母叻直媛视跋駟沃捣诸惛靥崛》椒ㄑ芯縖J].測繪通報,2014(10):78-81.
10.13474/j.cnki. 11-2246.2014.0334