金鵬飛 湯瑜瑜 危峻
摘 ?要: 針對(duì)寬波段成像光譜儀數(shù)據(jù)為中等空間分辨率、譜段多的特點(diǎn),提出一種結(jié)合雙子支持向量機(jī)(TSVM)和紋理特征的WIS遙感影像快速分類(lèi)方法。選用經(jīng)過(guò)幾何校正的二級(jí)數(shù)據(jù)產(chǎn)品,進(jìn)行大氣校正、反射率計(jì)算等預(yù)處理后,裁切出500×500大小的影像作為實(shí)驗(yàn)對(duì)象。選擇以相關(guān)性分析的方法獲取特征波段。為解決狹小水體混合像元難以區(qū)分的問(wèn)題,選擇計(jì)算NDWI指數(shù),然后提取其紋理特征。最后,基于TSVM和傳統(tǒng)SVM進(jìn)行分類(lèi)實(shí)驗(yàn),樣本訓(xùn)練及預(yù)測(cè)的時(shí)間分別為14.27 s,26.41 s,得到的總體分類(lèi)精度分別為87.861 3%,87.659 0%。結(jié)果表明,基于TSVM和紋理特征的分類(lèi)算法不僅訓(xùn)練速度快,而且具有良好的泛化能力。寬波段成像光譜儀數(shù)據(jù)在中等尺度的土地覆蓋分類(lèi)中具有極大的應(yīng)用價(jià)值。
關(guān)鍵詞: 遙感影像; 快速分類(lèi); TSVM; 寬波段成像光譜儀; 紋理特征提取; 結(jié)果分析
中圖分類(lèi)號(hào): TN911.73?34; TP751 ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)02?0001?04
WIS remote sensing image classification method based on TSVM and texture features
JIN Pengfei1,2, TANG Yuyu2, WEI Jun2
Abstract: As for the characteristics of medium spatial resolution and multi spectral coverage of broadband imaging spectrometer data, a WIS remote sensing image fast classification method in combination with the twin support vector machine (TSVM) and texture features is proposed. The secondary data products with geometric correction are selected to perform the pre?processing such as atmospheric correction and reflectance calculation, after which the image of the 500×500 size are cut out as the experimental objects. The feature band is obtained by means of the correlation analysis method. The NDWI index is calculated, and then the texture features are extracted to solve the indistinguishable problem of the mixed water pixels in the narrow water. The classification experimen based on TSVM and traditional SVM is carried out, the sample training and prediction time is 14.27 s, 26.41 s, respectively, and the overall classification accuracy is 87.861 3%, 87.659 0%. The results show that the classification algorithm based on TSVM and texture features not has fast training speed, but has good generalization ability. The broadband imaging spectrometer data has great application value in medium?scale land cover classification.
Keywords: remote?sensing image; fast classification; TSVM; broadband imaging spectrometer; feature extraction detection; results analysis
非平行支持向量機(jī)作為支持向量機(jī)的延伸,近些年受到廣泛關(guān)注。與傳統(tǒng)SVM算法最大的不同在于,非平行支持向量機(jī)針對(duì)每一類(lèi)別構(gòu)造相應(yīng)的支持超平面。讓每一個(gè)超平面更“接近”于相應(yīng)的類(lèi)別,而不限定超平面是否平行和間隔大小[1]。因此,對(duì)于某些數(shù)據(jù)而言,比如交叉型數(shù)據(jù),非平行支持向量機(jī)具有更好的分類(lèi)效果。同時(shí)在計(jì)算速度方面,非平行支持向量機(jī)具有絕對(duì)的優(yōu)勢(shì)。非平行支持向量機(jī)中影響程度較大的兩種類(lèi)型分別是廣義特征值支持向量機(jī)(Generalized Eigenvalue Proximal SVM,GEPSVM)和雙子支持向量機(jī)(Twin Support Vector Machine,TSVM)。GEPSVM是非平行支持向量機(jī)的首個(gè)模型,是Mangasarian等人在2006年提出的[2]。雙子支持向量機(jī)具有和GEPSVM較為相似的非平行特性,但在超平面和類(lèi)別的距離處理方面,有著不同的取舍。實(shí)驗(yàn)結(jié)果證明,TSVM具有較小的訓(xùn)練規(guī)模和良好的泛化能力[3]。
雖然非平行支持向量機(jī)具有更好的性能,已經(jīng)成為支持向量機(jī)研究的新熱點(diǎn),但其應(yīng)用研究卻相對(duì)較少。在國(guó)內(nèi)外,非支持向量機(jī)的研究較多的還是理論和模型構(gòu)建,以雙子支持向量機(jī)和廣義特征值支持向量機(jī)的變體以及結(jié)合其他優(yōu)化算法的研究為主[4]。盡管如此,在遙感方面也已經(jīng)有少部分的應(yīng)用[5?6]。胡根生等人利用最小二乘法的雙子支持向量機(jī)(LS?WTSVM)和灰度共生矩陣進(jìn)行云層的檢測(cè)分類(lèi),結(jié)果得出Kappa系數(shù)為0.897 2,優(yōu)于其他方法[7]。王立國(guó)等人將雙子支持向量機(jī)與K?means結(jié)合,通過(guò)非監(jiān)督分類(lèi)方法減小訓(xùn)練樣本規(guī)模,進(jìn)行高光譜遙感圖像的半監(jiān)督分類(lèi)實(shí)驗(yàn)[8]。在農(nóng)業(yè)遙感方面,還有結(jié)合HJ衛(wèi)星數(shù)據(jù)和LS?WTSVM進(jìn)行小麥蚜蟲(chóng)的監(jiān)測(cè),實(shí)驗(yàn)結(jié)果比傳統(tǒng)SVM高9%左右。
隨著遙感技術(shù)的發(fā)展以及應(yīng)用精度的日益提高,遙感影像分類(lèi)不在僅僅依靠光譜特征。紋理特征的利用極大提高了分類(lèi)精度。針對(duì)WIS影像中狹小水體混合像元現(xiàn)象嚴(yán)重的情況,選擇歸一化水體指數(shù)NDWI圖像作為紋理特征提取的原始圖像。這樣可以極大縮小計(jì)算量,在有效區(qū)分出水體的同時(shí),也增加了房屋、農(nóng)田等其他地物類(lèi)型的紋理特征。因此,該結(jié)合TSVM和紋理特征的分類(lèi)算法較適合WIS多光譜遙感影像的快速分類(lèi)。
1 ?雙子支持向量機(jī)的原理
分類(lèi)問(wèn)題中,傳統(tǒng)支持向量機(jī)最為重要的思想就是“最大間隔”原則,以一對(duì)平行超平面去劃分不同的類(lèi)別。其基本約束和目標(biāo)函數(shù)可表示為:
[minω,b12∥ω∥2s.t. ?yi(ωTxi+b)≥1, ?i=1,2,…,m] ? (1)
而雙子支持向量機(jī)目的在于尋找一對(duì)非平行的擬合超平面,如下:
[f1(x)=ωT1x+b1=0f2(x)=ωT2x+b2=0] ?(2)
希望每個(gè)超平面分別擬合一類(lèi)樣本點(diǎn)以尋找相同類(lèi)別之間的相似性,同時(shí)希望非本類(lèi)別樣本點(diǎn)遠(yuǎn)離本類(lèi)擬合超平面。雙子支持向量機(jī)不同于GEPSVM的特點(diǎn)在于,放寬對(duì)于負(fù)類(lèi)樣本的“遠(yuǎn)離原則”,限制條件為負(fù)類(lèi)樣本處于正類(lèi)超平面平行偏離一個(gè)單位的超平面[ωT1x+b1=-1]的一側(cè)即可。同樣,對(duì)于正類(lèi)樣本的要求與之相似。新的樣本點(diǎn)的預(yù)測(cè)分類(lèi)取決于其離哪個(gè)超平面更加接近。因此,TSVM算法可以簡(jiǎn)化為求解以下兩個(gè)優(yōu)化問(wèn)題:
[minω1,b1,ξ212ω1x1+e1b12+c1eT2ξ2s.t. ?-(ω1x2+e2b1)+ξ2≥e2,ξ2≥0] ? (3)
[minω2,b2,ξ112ω2x2+e2b22+c2eT1ξ1s.t. ?(ω2x1+e1b2)+ξ1≥e1,ξ1≥0] ? (4)
式中:[c1>0]和[c2>0]為調(diào)節(jié)參數(shù);[e1]和[e2]表示分量為1的列向量;[ξ1∈Rm1]和[ξ2∈Rm2]為松弛向量,其幾何意義十分明了,即用一對(duì)非平行超平面盡量去擬合相應(yīng)類(lèi)別。新的樣本點(diǎn)的預(yù)測(cè)函數(shù)為:
[Classi=argmini=1,2|ωTix+bi|∥ωi∥] ?(5)
根據(jù)理論計(jì)算,傳統(tǒng)SVM算法的復(fù)雜度為[m3],[m]為樣本規(guī)模。TSVM算法由于是處理兩個(gè)接近原來(lái)樣本規(guī)模一半的問(wèn)題,所以復(fù)雜度為[2×m23=m34]。因此,在相同核方法和優(yōu)化條件下,TSVM的處理速度接近SVM的4倍。
2 ?數(shù)據(jù)與方法
2.1 ?數(shù)據(jù)介紹
寬波段成像光譜儀是裝載在“天宮二號(hào)”空間站上的新一代對(duì)地光學(xué)觀測(cè)綜合遙感器,主要為滿(mǎn)足高性能海洋海岸帶的水色水溫監(jiān)測(cè)需求而研制,同時(shí)兼顧陸地和大氣探測(cè)。儀器包括14個(gè)在軌可編程的可見(jiàn)近紅外(譜段范圍為0.40~1.04 μm)光譜通道、2個(gè)短波紅外通道(譜段范圍為1.232~1.252 μm和1.630~1.654 μm)和2個(gè)熱紅外通道(譜段范圍為8.125~8.825 μm和8.925~9.275 μm),3個(gè)譜段星下點(diǎn)的空間分辨率分別為100 m,200 m和400 m。本文選用的實(shí)驗(yàn)數(shù)據(jù)為南京地區(qū)500×500的遙感影像,區(qū)域概況如圖1所示。由于數(shù)據(jù)屬于中等分辨率,混合像元較多,目視解譯選取訓(xùn)練樣本困難。最終確定實(shí)驗(yàn)區(qū)域有六類(lèi)地物類(lèi)型,分別是:水體、林地、綠地、裸土、一類(lèi)建筑、二類(lèi)建筑(高反射),每類(lèi)訓(xùn)練樣本為1 500個(gè)。
2.2 ?方法流程
本文僅利用可見(jiàn)光近紅外14個(gè)波段的數(shù)據(jù)進(jìn)行分類(lèi)實(shí)驗(yàn)。同時(shí),原始數(shù)據(jù)為經(jīng)過(guò)幾何校正的二級(jí)輻亮度數(shù)據(jù)產(chǎn)品,由于大氣校正精度對(duì)分類(lèi)實(shí)驗(yàn)的影響不大,采用暗像元法進(jìn)行大氣校正,然后根據(jù)頭文件中的太陽(yáng)高度角以及每個(gè)波段的太陽(yáng)輻照度,計(jì)算出地物反射率。根據(jù)計(jì)算出的NDWI(如式(6)所示,近紅外為波段4,綠色為波段10),結(jié)合灰度共生矩陣提取其紋理特征。其基本原理是計(jì)算灰度圖像各個(gè)灰度值之間在指定方向和距離上出現(xiàn)的次數(shù),從而生成灰度共生矩陣,然后利用灰度矩陣計(jì)算出不同的二階統(tǒng)計(jì)特征值,以此作為紋理測(cè)度。根據(jù)對(duì)比分析,以下四種紋理測(cè)度的區(qū)分度較好:協(xié)方差(Variance)、反差(Contrast)、熵(Entropy)、角二階矩(Angular Second Moment,ASM)。
[NDWI=Green-NIRGreen+NIR] ? (6)
雖然可見(jiàn)光近紅外范圍內(nèi)具有精細(xì)的光譜數(shù)據(jù),給地物參數(shù)反演帶來(lái)極大的便利,但對(duì)于地物分類(lèi)來(lái)說(shuō),也是極大的數(shù)據(jù)冗余。根據(jù)波段間相關(guān)性分析,選取相關(guān)性小的4個(gè)波段(Band1,Band8,Band10,Band13)來(lái)分類(lèi),既可以減少數(shù)據(jù)量,又可以得出相對(duì)較好的效果[9]。結(jié)合選取出的4個(gè)紋理特征圖像,一共8個(gè)特征組成新的圖像作為分類(lèi)輸入特征。
實(shí)驗(yàn)數(shù)據(jù)預(yù)處理、相關(guān)性分析以及紋理特征的提取是基于ENVI 5.3軟件上實(shí)現(xiàn)的。為比較兩種支持向量機(jī)的訓(xùn)練速度,傳統(tǒng)SVM與TSVM的分類(lèi)均是基于Matlab 2014實(shí)現(xiàn)的,其中傳統(tǒng)SVM使用了LibSVM庫(kù)[10]。為了控制變量,TSVM與傳統(tǒng)SVM分類(lèi)時(shí)均采用“一對(duì)一”的分類(lèi)模式。實(shí)驗(yàn)所用計(jì)算機(jī)的處理器為Intel i7?6700,3.40 GHz,內(nèi)存為32 GB,系統(tǒng)為Windows 10專(zhuān)業(yè)版。
圖2為分類(lèi)實(shí)驗(yàn)的具體流程圖。
3 ?結(jié)果分析
從圖3可以發(fā)現(xiàn),NDWI可以有效地提取出狹小水體,但不足的是受周?chē)裨蓴_,無(wú)法選取閾值。因此,在不干擾其他地物區(qū)分的基礎(chǔ)上,選取4種區(qū)分度比較大的紋理特征,得到水體目標(biāo)的空間信息。最終以相關(guān)性分析篩選出的第1,8,10,13波段加上4個(gè)紋理特征作為分類(lèi)的輸入圖像。與不加紋理特征的原始圖像的分類(lèi)對(duì)比如圖4所示。經(jīng)過(guò)對(duì)比,狹小水體的分類(lèi)效果大大提高,建筑、綠地、裸土范圍內(nèi)夾雜的狹小河流都得到區(qū)分;農(nóng)田、建筑等其他地物的分類(lèi)效果僅稍微有所變化,主要表現(xiàn)為城區(qū)部分綠地等混雜像元得以撇除。相對(duì)于圖4i),紋理特征豐富了圖4h)中的地物覆蓋類(lèi)型。
TSVM與SVM最大的不同在于,構(gòu)建兩個(gè)非平行的超平面,而不是一對(duì)最大間隔的平行超平面。這意味著,從一個(gè)較大的訓(xùn)練規(guī)模變成兩個(gè)較小的規(guī)模,理論上來(lái)說(shuō)速度變成4倍。但對(duì)于實(shí)際分類(lèi)來(lái)說(shuō),速度的提升遠(yuǎn)沒(méi)有4倍之多。在同樣“一對(duì)一”的分類(lèi)模式以及基于徑向基核函數(shù)的分類(lèi)情況下,每類(lèi)訓(xùn)練樣本選取個(gè)數(shù)為1 500個(gè),基于SVM的分類(lèi)時(shí)間為26.41 s ,基于TSVM的分類(lèi)時(shí)間為14.27 s。原因在于,SVM實(shí)驗(yàn)使用的是LibSVM庫(kù),代碼的優(yōu)化提升了速度。對(duì)于分類(lèi)精度,無(wú)論基于紋理特征還是原始圖像,TSVM與SVM的效果相差不多。結(jié)合紋理特征的TSVM分類(lèi)精度為87.861 3%,Kappa系數(shù)為0.854 3;結(jié)合紋理特征的傳統(tǒng)SVM的分類(lèi)精度為87.659 0%,Kappa系數(shù)為0.851 9;單純基于TSVM的分類(lèi)精度為81.088 6%,Kappa系數(shù)為0.773 2。混淆矩陣如表2所示。因此,結(jié)合紋理特征和TSVM的分類(lèi)算法不僅時(shí)間將近縮短[12],而且在分類(lèi)精度上提高了6.8%左右。最終,基于TSVM和紋理特征的總體分類(lèi)效果如圖5所示。
4 ?結(jié) ?論
針對(duì)“天宮二號(hào)”寬波段成像光譜儀遙感影像分類(lèi)中狹小水體難以區(qū)分的問(wèn)題,本文提出一種結(jié)合雙子支持向量機(jī)和紋理特征的快速分類(lèi)方法。通過(guò)相關(guān)性分析減少特征波段,加上TSVM算法大大提升樣本訓(xùn)練速度,從而提升總體分類(lèi)速度。結(jié)合NDWI圖像的紋理特征,很好地提升了分類(lèi)精度。對(duì)于空間分辨率較低的多光譜遙感影像的分類(lèi)具有較高的適用價(jià)值。不足的是,TSVM算法的遙感影像多分類(lèi)應(yīng)用還不夠成熟,需要更多的優(yōu)化算法,進(jìn)一步提升分類(lèi)速度和魯棒性。同時(shí)針對(duì)不同影像的不同特點(diǎn),結(jié)合其他地物參數(shù)的應(yīng)用是下一步研究的重點(diǎn)。
致謝:感謝載人航天工程提供“天宮二號(hào)”寬波段成像儀數(shù)據(jù)產(chǎn)品。
注:本文通訊作者為湯瑜瑜。
參考文獻(xiàn)
[1] 邵元海,楊凱莉,劉明增,等.從支持向量機(jī)到非平行支持向量機(jī)[J].運(yùn)籌學(xué)學(xué)報(bào),2018,22(2):55?65.
[2] MANGASARIAN O L, WILD E W. Multisurface proximal support vector machine classification via generalized eigenvalues [J]. IEEE transactions on pattern analysis and machine intelligence, 2006, 28(1): 69?74.
[3] LIU Z, ZHU L. A novel remote sensing image classification algorithm based on multi?feature optimization and TWSVM [C]// 9th International Conference on Digital Image Processing. Hongkong, China: SPIE, 2017: 12?17.
[4] ?KHEMCHANDANI R, CHANDRA S. Twin support vector mach?
ines for pattern classification [M]// NEOGY S K, BAPAT R B, DAS A K, et al. Mathematical programming and game theory for decision making. Singapore: World Scientific, 2007: 147?152.
[5] TASKIN G. A comprehensive analysis of twin support vector machines in remote sensing image classification [C]// 2015 23nd Signal Processing and Communications Applications Conference. Malatya: IEEE, 2015: 2427?2429.
[6] KUCUK C, TORUN Y, KAYA G T, et al. Remote sensing image classification by non?parallel SVMS [C]// 2014 IEEE Geoscience and Remote Sensing Symposium. Quebec: IEEE, 2014: 1269?1272.
[7] 胡根生,陳長(zhǎng)春,張學(xué)敏,等.LS?WTSVM的遙感多光譜影像云檢測(cè)[J].安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(1):53?60.
[8] 王立國(guó),杜心平.K均值聚類(lèi)和孿生支持向量機(jī)相結(jié)合的高光譜圖像半監(jiān)督分類(lèi)[J].應(yīng)用科技,2017(3):12?18.
[9] KAYA G T, TORUN Y, KUCUK C. Recursive feature selection based on non?parallel SVMs and its application to hyperspectral image classification [C]// 2014 IEEE International Geoscience and Remote Sensing Symposium. Quebec: IEEE, 2014: 3558?3561.
[10] CHANG C C, CHIH J. LIBSVM: A library for support vector machines [J]. ACM transactions on intelligent systems and technology, 2011, 2(3): 21?27.
作者簡(jiǎn)介:金鵬飛(1994—),男,博士研究生,研究方向?yàn)檫b感及成像光譜技術(shù)。
湯瑜瑜(1981—),女,副研究員,主要從事空間遙感及模擬技術(shù)方面的研究工作。