劉 潤,張紹良,賈 蓉
(1. 中國礦業(yè)大學環(huán)境與測繪學院,江蘇 徐州 221116; 2. 江南大學,江蘇 無錫 214122)
城市建筑物是城市最基本的元素,利用遙感技術快速、高精度提取城市建筑物信息是城市動態(tài)監(jiān)測、數(shù)字城市和智慧城市建設的關鍵技術。
隨著高空間分辨率遙感技術的發(fā)展,傳統(tǒng)的基于像元的分類方法已經無法滿足高精度建筑物提取的要求。但是,高分辨率遙感影像建筑物信息的高精度提取的計算和分析過程必須依賴更多的綜合地物的結構、大小、形狀、分布等空間特征信息和語義信息[1-4]。國內外很多學者都曾基于建筑物明顯的幾何結構特征嘗試對建筑物信息進行提取,如利用直線和角點特征[5-7],線段的空間關系特征[6]等。但該類方法多使用影像底層特征信息,嚴重依賴單一或少量特征,且算法復雜。為了更好地實現(xiàn)光譜信息、紋理信息等更多特征信息的綜合應用,學者又嘗試了新的識別方法,如Baatz和Schape等利用多尺度區(qū)域分割結合決策樹分類的方法,通過綜合地物的光譜信息,紋理信息和上下文信息來檢測建筑物,實現(xiàn)了建筑物屋頂?shù)奶崛8];呂鳳華等提出了一種基于多層次特征的航空影像規(guī)則建筑物提取方法,即先利用大尺度特征,如方向梯度直方圖對建筑物進行粗識別,然后利用小尺度特征如光譜和紋理的特點對粗提取結果進行篩選,最后通過試驗提取表明該方法對規(guī)則建筑物的提取效果較好,一些復雜建筑物的提取也很理想[9];周紹光等利用角度紋理特征和光譜特征構造特征矢量,利用圖割法獲取建筑物候選點,經數(shù)學形態(tài)學處理得到建筑物斑塊,最后通過試驗證明了該方法的可行性[10]。綜合使用建筑物光譜、形狀及紋理等特征可以提高建筑物提取精度,但過多的特征信息往往也會造成特征冗余,且大量信息的計算分析往往也比較耗時且對計算機硬件要求較高。
鑒于此,本文以Pleiades衛(wèi)星影像建筑物信息提取為例,研究利用改進型Relief F算法進行特征篩選來減少冗余特征,實現(xiàn)最優(yōu)特征組合構建,從而提高建筑物信息提取效率和提取精度。
Kira和Rendell于1992年提出Relief算法,它是一種多參量過濾式特征篩選方法,通過統(tǒng)計樣本之間的距離來選取參與權重計算的鄰近樣本[11]。其在計算距離過程中,相關特征會影響樣本的相對距離進而影響鄰近樣本選擇,從而為特征權重計算提供理論依據(jù)[12]。特征降維通過對樣本進行迭代計算,篩選出權重最大的特征組成特征集合而實現(xiàn)。特征權重更新方法如下
wi=wi-xi-Mi(x) +xi-Hi(x)
(1)
H(x)和M(x)分別是與x的同類和非同類的最近鄰點。根據(jù)Relief算法將樣本特征按照分類能力大小進行排序,然后通過設置閾值篩選出最優(yōu)特征。然而Relief有其固有的弱項,由于高分遙感影像中存在干擾噪聲,單一選取最近最遠樣本計算特征權重不能保證精度,又由于樣本大小,計算難度限制了全樣本計算,因此選取合適的簡化算法來優(yōu)化Relief算法成為保持其穩(wěn)健性的最佳選擇。Relief F方法是一種較為常見的改進方法,相較于Relief算法,取值選擇為K個樣本,數(shù)目為較少的一類樣本數(shù)目的一半[13]。
Relief F作為一種具有較強區(qū)分度的方法,其由于缺失冗余處理過程,特征間具有高度相關性。故對原算法進行改進,增加冗余處理決策修改為Relief FT(relief fund threshold)。通過特征權重至限制特性之間的相關性處理,對特征進行進一步篩選,若經過閾值篩選后仍有多個特征存在,則保留特征權重值最大的特征。Relief FT的數(shù)學表達為
(2)
(3)
Relief FT算法的實現(xiàn)步驟為:
輸入:訓練樣本集合D,迭代次數(shù)r,最近鄰樣本個數(shù)d,閾值為m,特征選擇集合A。
輸出:預測的特征權值向量w0,初始化特征權值向量w0。
Fori=1 tor;
(1) 從D中隨機選擇實例Si。
(2) 計算d個同類最近鄰實例xj(j=1,2,…,k)。
(3) 從與Si不同類的實例中選出d個最近鄰實例Mj(C)(C≠class(Si))。
(4) fori=1 to all attributes(對每個特征,用式(2)更新權值,式中,c為類別;P(c)為c類目標樣本占樣本總數(shù)的比例)。
(5)wi (6) 運算結束。 樣本間距離difft,si,x計算采用馬氏距離法,分別從類間和類內考察特征區(qū)分樣本的能力。由上式可知,樣本特征是否有利于分類,可以通過比較樣本之間的距離diff來判斷,具體原則為:同類樣本距離越小,不同類樣本距離越大,則特征為最優(yōu)特征,即有利于分類。 本研究選用的數(shù)據(jù)為法國Astrium公司Pleiades衛(wèi)星所獲取的高分辨率遙感影像,Pleiades衛(wèi)星是SPOT星族的后續(xù)衛(wèi)星。由Pleiades-1和Pleiades-2兩顆衛(wèi)星組成[14]。本文實驗數(shù)據(jù)獲取時間為2012年10月5日,研究區(qū)位于某中學,如圖1所示。其中包含一個0.5 m分辨率的全色波段(圖1(a))和一個2 m分辨率的4波段的多光譜(圖1(b))。 在進行建筑物提取之前需要對原始影像進行預處理。旨在減少影像幾何畸變,輻射誤差,如幾何校正、輻射校正。為了提高多光譜影像空間分辨率和地物細節(jié)特征,進行了圖像融合和增強處理。在ENVI 4.8軟件的支持下,遙感影像預處理流程如圖2 所示。其中圖像融合方法采取主成分分析融合法,對比度增強采用分段線性變換。 圖1 原始遙感影像 特征空間構建首先需要對圖像進行分割,本文試驗對影像由下而上進行分割,為保證地物邊界異質性,在底層影像分割時采取小尺度分割方法。綜合已有研究成果[15-16],根據(jù)建筑物在影像上的表征特點,構建基礎特征空間。特征主要分為三大類:光譜特征、形狀特征和紋理特征。其中光譜特征包含亮度、最大均值差、方差等;形狀特征包含面積、周長、形狀復雜度等;紋理特征主要有標準差、熵等。建筑物基礎特征匯總見表1。 圖2 預處理流程 光譜特征形狀特征紋理特征波段(R/G/B/N)亮度、最大均值差、方差、比率、灰度最大值、灰度最小值面積、周長、寬度、長寬比、緊密度、對稱性、邊界平滑度、形狀復雜度對比度、同質性、差異性、標準差、能量、熵 將選擇出來的特征以圖像為基礎數(shù)據(jù),以Relief FT算法為依據(jù),在圖像分割的基礎上,隨機選取建筑物和非建筑物各10個樣本,在Matlab環(huán)境下進行操作。得到每個特征對應權重及各特征權重分布情況,如圖3和表2所示。 圖3 各特征權重分布 權重0~100100~200200~300300~400>400分布/個1613441 根據(jù)圖3和表2可知,特征權重介于0~600之間,其中最大權重值所對應的特征依次為相異性特征、面積特征和B波段亮度;權重最小值對應的特征依次為長寬比特征、G波段方差和寬度特征。根據(jù)權重最大篩選最優(yōu)特征原則說明,相異性特征、面積特征和B波段亮度均值能夠滿足建筑物提取要求。對于特征權重較小的長寬比、G波段方差和寬度則不能很好地用于建筑物提取。在特征篩選結束后,將得到的有效特征代入樣本中進行驗證,這里以特征最大和最小權重為例,如圖4所示。 其中,前10個樣本選自建筑物,后10個樣本選自非建筑物。通過分析圖4(a)各樣本相關系數(shù)后發(fā)現(xiàn),建筑物10號樣本相關系數(shù)大于0.7,其他均小于0.7,非建筑物15號樣本相關系數(shù)小于0.8,其他均大于0.8。因此可將閾值區(qū)間設置為0.7—0.8。圖4(b)中建筑物樣本和非建筑物樣本之間并無明顯的分布規(guī)律,因此在這類特征中難以通過設置閾值達到提取建筑物的目的,并且無關特征參與計算在加大工作量的同時也會影響最終提取結果。綜上所述,本文設置權重閾值為300,相關系數(shù)閾值為0.9作為篩選特征的條件,經過篩選,最終有5組特征滿足要求,分別為相異性特征、面積特征和B波段的亮度均值、方差和信息熵。 針對研究區(qū)影像,分別使用傳統(tǒng)基于像元的監(jiān)督分類、無特征篩選的決策規(guī)則分類和基于改進型Relief F特征篩選的決策規(guī)則分類3種方法對研究區(qū)建筑物進行檢測提取,其中監(jiān)督分類的分類算法使用支持向量機SVM。在初提取的基礎上,運用形態(tài)學算法對提取結果進行優(yōu)化處理,最后得到三者提取結果如圖5所示。 圖4 最大、最小權重特征驗證結果 圖5 建筑物提取結果 通過比較3種分類方法結果圖可以發(fā)現(xiàn),相比其他兩種分類方法,使用監(jiān)督分類得到的結果中有大量地面不透水鋪裝,如建筑物前廣場、籃球場等被錯分成了建筑物屋頂,這主要是由于該類不透水鋪裝材質與建筑物屋頂材質相似,導致遙感影像上兩類地物的光譜特征相似,因此難以將兩種地物區(qū)分開來;無特征篩選分類結果較監(jiān)督分類有所改善,但仍有不透水鋪裝被錯分成建筑物屋頂;基于Relief F特征篩選的分類方法取得效果較好,大大減少了不透水鋪裝被錯分成建筑物屋頂?shù)臄?shù)量。為進一步驗證這3種方法提取精度,通過人機交互式解譯方法選取32個建筑樣本點,抽取建筑面積5860 m2作為精度驗證參考數(shù)據(jù)。表3給出了最終精度驗證結果。 從表3可以看出,監(jiān)督分類方法精確度只有57.3%,其生產精度和用戶精度也只有60.43%和61.34%,這說明傳統(tǒng)基于像元的分類方法并不適合高分辨率影像建筑物提??;而另外兩種基于特征的建筑物提取方法各項精度都能達到80%以上,明顯優(yōu)于監(jiān)督分類,這是由于大量特征的應用可以模擬人工思維進行信息選擇,因此可以提高分類精度。由于過多的特征也會導致誤判,因此特征篩選可以使最終分類精度進一步得到提高。 表3 精度驗證結果 本文以Pleiades高分辨率遙感影像為數(shù)據(jù)源構建建筑物特征空間,使用Relief F特征篩選法進行最優(yōu)特征篩選,利用最優(yōu)特征組合進行建筑物提取,并與監(jiān)督分類法、無特征篩選建筑物提取法進行對比。 試驗證明,基于特征的建筑物提取方法要優(yōu)于監(jiān)督分類。而利用特征篩選過后的最優(yōu)特征組合進行建筑物提取為3種方法中最優(yōu),且提取精度能夠滿足相關研究需要。本研究使用Relief F特征篩選方法,并未與其他篩選方法作對比。若條件允許,也可進行特征篩選方法的對比研究。在數(shù)據(jù)源方面,也可借助其他輔助信息(如雷達數(shù)據(jù))進一步提高建筑物提取精度。 [1] CHRISTODOULIDIS A,HURTUT T,TAHAR H B,et al.A Multi-scale Tensor Voting Approach for Small Retinal Vessel Segmentation in High Resolution Fundus Images[J].Computerized Medical Imaging and Graphics,2016,52(9):28-43. [2] 胡榮明,黃小兵,黃遠程.增強形態(tài)學建筑物指數(shù)應用于高分辨率遙感影像中建筑物提取[J].測繪學報,2014,43(5):514-520. [3] 李朝奎,方文,董小姣.面向對象和規(guī)則的高分辨率影像分類研究[J].測繪通報,2015(9):9-13,35. [4] 張慶云,趙冬.高空間分辨率遙感影像建筑物提取方法綜述[J].測繪與空間地理信息,2015(4):74-78. [5] NEVATIA R,LIN C,HUERTAS A.A System for Building Detection from Aerial Images[C]∥Proceeding of Automatic Extraction of Man-made Object from Aerial and Space image(Ⅱ).Basel:Brikhauser,1997:77-86. [6] HUERTAS A,NEVATIA R.Detecting Buildings in Aerial Images[J].Computer Vision,Graphics and Image Processing,1988,41(2):131-152. [7] 唐亮,謝維信,黃建軍,等.直線Snakes及其在建筑物提取中的應用[J].西安電子科技大學學報,2005,32(1):60-65. [8] BAATZ M,SCHAPE A.Object-oriented and Multi-scale Image Analysis in Semantic Networks[C]∥Proceedings of the 2nd International Symposium on Operationalization of Remote Sensing.Enschede:ITC,1999. [9] 呂鳳華,舒寧,龔颵,等.利用多特征進行航空影像建筑物提取[J].武漢大學學報(信息科學版),2017,42(5):656-660. [10] 周紹光,孫金彥,凡莉,等.高分辨率遙感影像的建筑物輪廓信息提取方法[J].國土資源遙感,2015,27(3):52-58. [11] KIRA K,RENDELL L.The Feature Selection Problem:Traditional Methods and a New Algorithm[C]∥Proceedings of the Ninth National Conference on Artificial Intelligence.New Orleans:AAAI Press,1992:129-134. [12] 李曉嵐.基于Relief特征選擇算法的研究與應用[D].大連:大連理工大學,2013. [13] KONONENKO I.Estimating Attributes:Analysis and Extension of Relief[J].Machine Learning,1994,784(4):171-182. [14] CHENG F,THIEL K H.Delimiting the Building Heights in a City from the Shadow in a Panchromatic SPOT-image—Part 1.Test of Forty-two Buildings[J].International Journal of Remote Sensing,1995,16(3):409-415. [15] 付卓.高分辨率遙感衛(wèi)星影像中城市人工地物提取方法研究[D].北京:北京交通大學,2006. [16] 陶陽宇,梁林,徐迎慶,等.利用貝葉斯結構模型的復雜形狀建筑物提取[J].計算機輔助設計與圖形學學報,2010,22(4):647-653.2 結果與討論
2.1 影像簡介及預處理
2.2 初始化特征空間構建
2.3 特征篩選
2.4 建筑物信息提取
3 結 語