安相君,翟 瑋
(1.甘肅省公安消防總隊(duì),甘肅 蘭州 730070;2.甘肅省地震局,甘肅 蘭州730000)
利用單類分類方法提取全極化雷達(dá)影像中的建筑物*
安相君1,翟 瑋2
(1.甘肅省公安消防總隊(duì),甘肅 蘭州 730070;2.甘肅省地震局,甘肅 蘭州730000)
建筑物是人類賴以生存的基本場(chǎng)所,為人類的各種活動(dòng)提供容納空間,建筑物分布信息是當(dāng)代社會(huì)非常重要的信息資源。本文引入單類分類方法,對(duì)城市建筑物進(jìn)行識(shí)別提取。文章介紹了基于最小超球支持向量機(jī)的單類分類方法,并提取一景全極化SAR影像的多種極化特征,利用該方法進(jìn)行了建筑物提取實(shí)驗(yàn),結(jié)果表明單類分類方法能夠融合多種特征快速提取建筑物,且能保證一定的提取精度。
遙感;全極化SAR;建筑物;單類分類
城市現(xiàn)代化建設(shè)中最重要的內(nèi)容是建筑物的規(guī)劃與建設(shè),獲取建筑物分布信息在土地利用調(diào)查、城市地理信息數(shù)據(jù)庫(kù)更新、市政規(guī)劃、人口估計(jì)、經(jīng)濟(jì)建設(shè)評(píng)估等方面都有著非常重要的作用[1]。利用遙感技術(shù)識(shí)別建筑物具有全面、宏觀的優(yōu)勢(shì)[2]。雖然利用光學(xué)遙感影像提取建筑物比較直觀,但是在夜晚或天氣狀況不佳時(shí),難以獲得有效圖像,但是合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)具有全天時(shí)全天候的對(duì)地觀測(cè)能力[3],能夠保障數(shù)據(jù)的實(shí)時(shí)有效。目前有很多提取建筑物的方法是基于多數(shù)據(jù)進(jìn)行的,比如利用InSAR圖像對(duì)提供的高程信息[4],或融合光學(xué)影像和雷達(dá)影像[5]。相比基于多幅影像的方法,基于單幅SAR影像的方法無(wú)需配準(zhǔn)影像,對(duì)數(shù)據(jù)要求較低[6]。然而單極化SAR影像包含的信息量遠(yuǎn)遠(yuǎn)少于全極化SAR,且易受噪聲和局部強(qiáng)散射等因素的影響,利用全極化SAR數(shù)據(jù)提取建筑物更可靠、更精確[7]。因此本文在對(duì)數(shù)據(jù)要求不高的同時(shí),為了保證建筑物提取精度,選擇一景全極化SAR數(shù)據(jù)提取建筑物。
單類(One-Class)分類是指訓(xùn)練樣本中只有一類目標(biāo)數(shù)據(jù),經(jīng)過(guò)學(xué)習(xí)形成一個(gè)對(duì)該類別的數(shù)據(jù)描述,根據(jù)描述估計(jì)其邊界,做出正確分類。單類分類方法訓(xùn)練和決策速度快,適合處理高維、有噪和有限樣本的單類問(wèn)題[8]。由于本文只關(guān)注建筑物,只有建筑物一種類別,因此借鑒One-Class分類思想,利用基于支持向量機(jī)[9]的單類分類方法從全極化SAR影像中提取建筑物。只對(duì)建筑物進(jìn)行學(xué)習(xí)訓(xùn)練,估計(jì)出建筑物與非目標(biāo)樣本的邊界,從而排除非目標(biāo)樣本,提取出建筑物。支持向量機(jī)方法適合處理高維數(shù)據(jù)的分類問(wèn)題,這樣就可以在特征空間中加入很多維數(shù)據(jù)特征,結(jié)合多種特征對(duì)樣本進(jìn)行分類,同時(shí)保持較快的處理速度。本文選取了14個(gè)極化特征組成特征空間,對(duì)建筑物進(jìn)行提取。實(shí)驗(yàn)結(jié)果證明在提取建筑物時(shí),利用支持向量機(jī)的單類分類方法是有效可行的。
1.1 支持向量機(jī)
支持向量機(jī) (Support Vector Machine,SVM)是20世紀(jì)90年代中期由Vapnik[10]根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論提出的,可用于模式分類和回歸估計(jì)。由于支持向量機(jī)具有泛化能力強(qiáng)、全局優(yōu)化等優(yōu)點(diǎn),得到了廣泛的應(yīng)用。支持向量機(jī)是為了求解二類分類問(wèn)題而提出的,它能夠求解各種二類分類問(wèn)題。在SVM的訓(xùn)練集中需要正負(fù)兩類樣本。但是在很多情況下無(wú)法獲取到包含正負(fù)兩類樣本點(diǎn)的訓(xùn)練集,而只能獲取一類樣本,這時(shí)就只能利用這一類樣本進(jìn)行學(xué)習(xí),形成數(shù)據(jù)描述從而實(shí)現(xiàn)分類[11],這就是單類分類問(wèn)題,即One-Class分類。One-Class分類主要應(yīng)用于故障分析、異常檢測(cè)、離群點(diǎn)識(shí)別和疾病診斷等現(xiàn)實(shí)問(wèn)題中。在單類分類問(wèn)題中使用的支持向量機(jī)稱為單類支持向量機(jī)[12](One-Class SVM,OCSVM)。單類支持向量機(jī)主要有超球法和超平面法兩種,本文使用超球法單類支持向量機(jī)從全極化SAR數(shù)據(jù)中提取建筑物。
1.2 超球法
Tax等[9,13,14]提出了超球法的單類支持向量機(jī),其基本思想是將線性不可分的數(shù)據(jù)樣本映射到高維空間,在這個(gè)高維特征空間中找到一個(gè)能夠盡可能將目標(biāo)樣本點(diǎn)包圍在其內(nèi)部的最小超球體,并盡可能得將非目標(biāo)樣本點(diǎn)隔離在這個(gè)最小超球體外,從而達(dá)到劃分兩個(gè)類別的目的。
給定一個(gè)樣本集X:
圖1是超球法單類支持向量機(jī)模型示例,圖中R和c分別是高維特征空間中最小超球的半徑和圓心,求解R和c的問(wèn)題轉(zhuǎn)化為求解以下優(yōu)化問(wèn)題:
其中ξi為松弛因子,當(dāng)ξi>0時(shí),對(duì)應(yīng)隔離在超球體外部的非目標(biāo)類樣本點(diǎn)。這是一個(gè)凸優(yōu)化問(wèn)題,可以變換為求解對(duì)偶變量的優(yōu)化問(wèn)題。引入核函數(shù)與拉格朗日對(duì)偶變量α,將上述問(wèn)題轉(zhuǎn)化為對(duì)偶問(wèn)題,其對(duì)偶形式為最小化目標(biāo)函數(shù)[15]:
其中K=(Xi,xj)=Φ(xi)·Φ(xj)是核函數(shù)。
對(duì)應(yīng)ai>0的向量則為支持向量,超球體的半徑R為任一邊界支持向量到球心的距離,即半徑R由少量球面上的支持向量決定,它起到檢出目標(biāo)類別而隔離非目標(biāo)類別的閾值劃分作用。球心c和半徑R可以分別表示為:
求得超球體的R和c后,就可以得到判別函數(shù)[8]:
由判別函數(shù)可以判斷測(cè)試樣本是否屬于超球體內(nèi)部,是否是離群點(diǎn)。若判別函數(shù)為負(fù),測(cè)試樣本就在超球體外部,是離群點(diǎn),反之則為目標(biāo)樣本。如圖1所示。
圖1 超球體支持向量機(jī)模型示意圖
R和c分別代表最小超球的半徑和圓心,實(shí)心圓、空心圓和三角分別代表目標(biāo)樣本點(diǎn)、支持向量和非目標(biāo)樣本點(diǎn)。
2.1 實(shí)驗(yàn)數(shù)據(jù)
本文選用海地太子港的一景400×400大小的L波段UAVSAR航空極化SAR影像作為實(shí)驗(yàn)數(shù)據(jù),驗(yàn)證研究思想的有效性。PauliRGB彩色合成圖像如圖2(a)所示,紅色代表|HH-VV|、綠色代表|HV|、藍(lán)色代表|HH+VV|。距離向空間分辨率為1.67m,方位向?yàn)?.6m。用于評(píng)價(jià)提取結(jié)果的參考影像(見(jiàn)圖2(b))由Google Earth獲得,并與極化SAR數(shù)據(jù)進(jìn)行了配準(zhǔn)。
圖2 實(shí)驗(yàn)數(shù)據(jù)及實(shí)驗(yàn)結(jié)果
2.2 實(shí)驗(yàn)結(jié)果
本文提取Cloude-Pottier分解[16]得到的三種散射特征:散射熵H、散射角α和各向異性參數(shù)A,以及Yamaguchi四分量散射模型[17]分解得到的四種散射分量、功率均值lamda、同極化比、交叉極化比、圓極化相關(guān)系數(shù)、三種線性極化相關(guān)系數(shù)等14種極化特征,組成特征空間,參與超球法One-Class SVM分類。首先利用最小超球體One-ClassSVM方法對(duì)訓(xùn)練樣本的上述14種極化特征進(jìn)行訓(xùn)練,估計(jì)出最小超球面。然后對(duì)測(cè)試樣本進(jìn)行分類,建筑物提取結(jié)果如圖2(c)所示,白色區(qū)域代表提取出的建筑物,黑色是非建筑物。
為了評(píng)價(jià)建筑物提取精度,在參考影像中選擇了6701個(gè)建筑物參考樣本和5036個(gè)非建筑物參考樣本,在圖2(b)中分別以紅色和黃色標(biāo)注。從表1的評(píng)價(jià)結(jié)果中可以看出,總體提取精度為74.0%,建筑物被誤分為非建筑的誤分率為37.2%,非建筑被誤分為建筑的誤分率為11.1%。
研究區(qū)處于城市繁華區(qū),建筑物分布非常密集,地物布局比較復(fù)雜。將建筑誤分為非建筑的主要原因是平頂房屋沒(méi)有被正確提取,由于房屋密集,很多屋頂緊挨,連成大片平坦表面,被誤分為裸地。將非建筑分為建筑的情況主要存在于道路和建筑物之間的間隔地帶,大片平地較少,非建筑類多為細(xì)小目標(biāo)。
表1 建筑物提取精度評(píng)價(jià)表
鑒于研究目標(biāo)只有建筑物一種地物類別,本文借鑒故障檢測(cè)的思想,將單類分類方法引入建筑物提取的應(yīng)用中。由于單類分類只有一類訓(xùn)練樣本,樣本的選取和訓(xùn)練方便快捷。借助極化SAR影像豐富的信息量,本文使用一景極化SAR影像提取建筑物,利用最小超球體單類支持向量機(jī)方法進(jìn)行建筑物提取。實(shí)驗(yàn)中選用14種極化特征組成特征空間,對(duì)訓(xùn)練樣本進(jìn)行學(xué)習(xí)訓(xùn)練,并對(duì)測(cè)試樣本進(jìn)行分類。在分類過(guò)程中,誤分類的情況主要存在于平頂建筑被誤分為非建筑、道路等間隔地帶被混入建筑物,無(wú)法提取。實(shí)驗(yàn)結(jié)果表明,本文所采用的單類支持向量機(jī)方法能夠利用多種特征,既具有較快的訓(xùn)練和分類速度,又能保證一定的提取精度。因此利用One-Class分類方法提取建筑物是有效可行的,但仍需進(jìn)一步深入研究適合于建筑物提取的單類分類方法,改進(jìn)現(xiàn)有的單類分類方法。
[1] Zhai W,Shen H,Huang C,et al.Fusion of polarimetric and texture information for urban building extraction from fully polarimetricSARimagery[J].RemoteSensingLetters,2015,7(1):31-40.
[2] ZhaiW,ShenH,HuangC,etal.BuildingEarthquakeDamage Information Extraction from a Single Post-Earthquake PolSARImage[J].RemoteSensing,2016,8(3):171.
[3] 翟瑋,趙斐.基于極化SAR的城市建筑物提?。跩].甘肅科技,2016,32(2):46-48.
[4] GambaP,HoushmandB,SaccaniM.Detectionandextraction ofbuildingsfrominterferometricSARdata[J].IEEETransactions onGeoscienceandRemoteSensing.2000,38(1):611-618.
[5] TupinF,RouxM.Detectionofbuildingoutlinesbasedonthe fusion of SAR and optical Features[J].ISPRS Journal of PhotogrammetryandRemoteSensing.2003,58(1):71-82.
[6] 翟瑋.基于單時(shí)相全極化SAR影像的建筑物震害信息提?。跩].山西地震,2016,1:19-22.
[7] 翟瑋,裴萬(wàn)勝,趙斐,等.PolSAR影像紋理特征在倒塌建筑物提取中的應(yīng)用分析[J].國(guó)際地震動(dòng)態(tài),2015(9):127-127.
[8] 吳定海,張培林,任國(guó)全,等.基于支持向量的單類分類方法綜述[J].計(jì)算機(jī)工程,2011,37(5):187-189.
[9] TaxDMJ,DuinRPW.Supportvectordomaindescription[J]. Patternrecognitionletters,1999,20(11):1191-1199.
[10]Vapnik V N,Vapnik V.Statistical learning theory[M].New York:Wiley,1998.
[11]潘志松,陳斌,繆志敏,等.One-Class分類器研究[J].電子學(xué)報(bào),2009,37(11):2496-2503.
[12]尹傳環(huán),牟少敏,田盛豐,等.單類支持向量機(jī)的研究進(jìn)展[J].ComputerEngineeringandApplications,2012,48(12).
[13]TaxDMJ,DuinRPW.Datadomaindescriptionusingsupport vectors[C].//ESANN.1999,99:251-256.
[14]Tax D M J,Duin R P W.Support vector data description[J]. Machinelearning,2004,54(1):45-66.
[15]尹傳環(huán),牟少敏,田盛豐,等.單類支持向量機(jī)的研究進(jìn)展[J].ComputerEngineeringandApplications,2012,48(12).
[16]CloudeSR.Polarimetry:thecharacterisationofpolarisation effectsinEMscattering[D].UniversityofBirmingham,1987.
[17]YamaguchiY,MoriyamaT,IshidoM,etal.Four-component scattering model for polarimetric SAR image decomposition[J].IEEETransactions on Geoscience and Remote Sensing,2005,43(8):1699-1706.
P237
甘肅省地震局、中國(guó)地震局蘭州地震研究所地震科技發(fā)展基金項(xiàng)目(2015M02)。