黃 磊,向澤君,3,楚 恒,2,3
(1. 重慶郵電大學(xué)光通信與網(wǎng)絡(luò)重點(diǎn)實(shí)驗(yàn)室,重慶 400065; 2. 西南大學(xué)地理科學(xué)學(xué)院,重慶 400715; 3. 重慶市勘測(cè)院,重慶 400020)
隨著遙感成像技術(shù)的發(fā)展,高分遙感影像空間分辨率逐年提高,已經(jīng)成為獲取地物信息的主要數(shù)據(jù)來(lái)源之一。高分影像分類作為遙感影像處理的重要任務(wù)之一,在地理國(guó)情普查與監(jiān)測(cè)、數(shù)字城市建設(shè)、城市規(guī)劃等領(lǐng)域具有廣闊的應(yīng)用前景。高分影像具有紋理信息豐富、形狀特征明顯、光譜混疊現(xiàn)象普遍存在的特點(diǎn)[1],單純利用光譜特征的分類方法難以滿足分類要求,多特征綜合提取利用并結(jié)合高性能分類器的分類方法已經(jīng)成為目前高分影像分類的主流趨勢(shì)。但由于影像特征維數(shù)過(guò)高,容易造成冗余現(xiàn)象,加大了分類難度。
為解決特征冗余問(wèn)題,文獻(xiàn)[2]提出采用傅里葉譜分解算法提取紋理特征,并將光譜特征與紋理特征的分類規(guī)則相結(jié)合,來(lái)提高影像分類精度。文獻(xiàn)[3]提出一種綜合不同層次特征的MRF觀測(cè)場(chǎng)模型,并針對(duì)高分影像的特點(diǎn)提出一種描述地物目標(biāo)結(jié)構(gòu)特性的特征,用于對(duì)MRF分類結(jié)果中易混淆類別進(jìn)行序貫分類。文獻(xiàn)[4]提出基于直方圖的APs(HAPs),用于支持向量機(jī)的遙感圖像分類,提出的HAP提供了關(guān)于標(biāo)準(zhǔn)AP場(chǎng)景空間信息的更完整和詳細(xì)的表征,能夠有效地表示紋理信息,HAP利用高維特征向量作為輸入給具有HI內(nèi)核的SVM分類器,可以有效避免直方圖特征的休斯現(xiàn)象。文獻(xiàn)[5]提出一種新的Fisher鑒別字典對(duì)學(xué)習(xí)(FDDPL)模型進(jìn)行圖像分類,將合成字典、編碼系數(shù)和分析字典的判別嵌入到提出的字典對(duì)學(xué)習(xí)中,通過(guò)分析編碼系數(shù),不同分析詞典之間的相關(guān)性及綜合詞典表示法,獲得了較好的分類結(jié)果。文獻(xiàn)[6]在核函數(shù)集成SVM分類框架下,提出一種多尺度光譜—空間—語(yǔ)義特征融合的高分影像分類方法,以有效解決特征冗余及同譜異物問(wèn)題,提高地物提取精度。文獻(xiàn)[7]提出基于多尺度多特征融合的高分影像分類方法,利用各地物特征的顯著性差異實(shí)現(xiàn)多尺度下多特征的加權(quán)融合,得出了較好的分類效果,但各最優(yōu)尺度下特征間相關(guān)性較高,冗余現(xiàn)象明顯。
本文在上述研究的基礎(chǔ)上,提出一種基于mRMR選擇與IFCM(improved fuzzy c-means)聚類的影像分類算法。首先采用對(duì)象置信度指標(biāo)(OC)進(jìn)行影像分割,然后利用mRMR算法對(duì)分割影像進(jìn)行特征選擇,以減少特征冗余,最后使用IFCM算法進(jìn)行特征距離計(jì)算,實(shí)現(xiàn)影像分類。
為改善影像分割過(guò)程中的過(guò)分割及欠分割問(wèn)題,本文采用文獻(xiàn)[8]的分割方法,通過(guò)構(gòu)建一個(gè)新的對(duì)象置信度(OC)索引度量任意區(qū)域與地理對(duì)象之間匹配程度的面向?qū)ο蠖喑叨确指钏惴āT撍惴ㄖ饕▋蓚€(gè)步驟:首先,通過(guò)對(duì)影像進(jìn)行過(guò)分割構(gòu)建初始種子區(qū)域集合及確定尺度參數(shù)集合;隨后,通過(guò)跟蹤OC的尺度間變化來(lái)引導(dǎo)多尺度區(qū)域合并過(guò)程,使區(qū)域合并結(jié)果逐漸逼近實(shí)際的地理對(duì)象。
為解決文獻(xiàn)[7]利用不同特征之間的鄰接關(guān)系,只考慮各特征之間相關(guān)性,造成特征冗余度大、計(jì)算復(fù)雜度高的問(wèn)題,本文在此引入mRMR特征選擇算法。
mRMR算法利用互信息衡量不同特征的相關(guān)性和冗余度,并根據(jù)信息差和信息熵這兩個(gè)代價(jià)函數(shù)來(lái)尋找特征子集,使得選出的特征與目標(biāo)類別之間具有最大相關(guān)性,且互相之間具有最小冗余度,可以很好地實(shí)現(xiàn)特征選擇[9]。mRMR的最大相關(guān)和最小冗余分別定義如下
(1)
式中,Sm為已選的特征集合;m為特征個(gè)數(shù);c為目標(biāo)類別;H(fic)為特征fi在目標(biāo)類別下的信息熵;H(fi)為特征fi的信息熵;I(fi;fj)為特征fi與fj之間的互信息。
因此,假定已確定特征集Sm,下一步從S-Sm中選擇第m+1個(gè)特征。公式如下
(2)
假設(shè)訓(xùn)練數(shù)據(jù)集為D,全部特征集為S,則mRMR算法的執(zhí)行過(guò)程為:
(1) 進(jìn)行初始化操作,S=f1,f2,…,fn,Sm=?。
(2) 對(duì)于任意兩個(gè)輸入S的特征fi和fj,計(jì)算I(fi;fj)和I(fi;c)。
(3) 根據(jù)式(2)選出特征fl,則Sm=Sm∪f(wàn)l,S=S/fl;然后,回到步驟(2)繼續(xù)執(zhí)行,直至選出最優(yōu)特征子集。
其中,像斑多特征提取見(jiàn)表1。
表1 像斑多特征提取
文獻(xiàn)[7]利用各地物顯著特征的不同,實(shí)現(xiàn)顯著特征差異性融合的圖像分類。具體步驟如下:
(1) 將矢量化的特征進(jìn)行人工魚(yú)群算法運(yùn)算[10],尋找顯著性特征,即為聚類中心,S={s1,s2,…,sn}。
(2) 計(jì)算各特征矢量到聚類中心S={s1,s2,…,sn}的距離D=d1,d2,…,dn,并求取距離的倒數(shù),歸一化表示為各矢量特征對(duì)應(yīng)的權(quán)重εi,達(dá)到特征差異性融合的目的。
(3) 對(duì)特征加權(quán)融合所生成的向量空間進(jìn)行模糊c均值聚類(FCM)。
(1) 參數(shù)初始化。設(shè)定聚類數(shù)目c,算法終止循環(huán)閾值δ,最大迭代次數(shù)n及初始聚類中心V=v1,v2,…,vn和模糊隸屬度矩陣U。
(2) 輸入待訓(xùn)練特征向量X=x1,x2,…,xn,及模糊c均值聚類算法目標(biāo)函數(shù)
(3)
(3) 使用當(dāng)前系數(shù)迭代更新隸屬度,獲得新的隸屬度再迭代更新各系數(shù)。在約束條件下,目標(biāo)函數(shù)可轉(zhuǎn)化為
(4)
(4) 使用目標(biāo)函數(shù)進(jìn)行迭代,直到滿足終止循環(huán)的閾值或達(dá)到最大迭代次數(shù),則停止聚類并輸出最終分類結(jié)果。
由于上述分類算法只考慮特征間的相關(guān)性,易導(dǎo)致算法對(duì)噪聲敏感,穩(wěn)定性差。本文在原始算法目標(biāo)函數(shù)計(jì)算的基礎(chǔ)上,考慮封裝在本地窗口中局部信息的同時(shí)引入空間吸引力模型,抑制噪聲的同時(shí)使算法更具穩(wěn)健性,提出如下目標(biāo)函數(shù)計(jì)算方法
(5)
(6)
式(6)代表特征xi與聚類中心的距離測(cè)度。s(i)表示xi所處區(qū)域內(nèi)部標(biāo)準(zhǔn)差,A(i)表示xi所在區(qū)域的面積,二者會(huì)隨聚類中心和隸屬度的更新進(jìn)行相應(yīng)的更新。s(i)越大,A(i)越小,其內(nèi)部同質(zhì)度大、合并其他對(duì)象的可能性就越低;Ia表示xi與聚類中心vk的相關(guān)性,Ia越大,對(duì)象點(diǎn)和聚類中心之間相關(guān)性越低,則聚類合并的可能性就越小。Ρ代表對(duì)象內(nèi)部同質(zhì)度所占權(quán)重,可通過(guò)權(quán)重值來(lái)調(diào)整對(duì)象內(nèi)部同質(zhì)度和對(duì)象間相關(guān)性的比重。
(7)
輸入:待分類影像數(shù)據(jù)Y,訓(xùn)練數(shù)據(jù)占比ε,對(duì)象置信度指標(biāo)OC,尺度參數(shù)ML,已選特征集Sm,聚類數(shù)目c,算法終止循環(huán)的閾值δ,最大迭代次數(shù)n。
輸出:聚類劃分Yi,i=1,2,…,k。
步驟1采用對(duì)象置信度OC指引的圖像分割方法分割圖像。
步驟2假設(shè)訓(xùn)練數(shù)據(jù)集為D,全部特征集為S,利用mRMR算法選出最優(yōu)特征子集,避免特征冗余。
步驟3人工魚(yú)群算法尋找顯著性特征S=s1,s2,…,sn,求取距離D=d1,d2,…,dn的倒數(shù)歸一化為權(quán)重εi,實(shí)現(xiàn)特征的差異性融合。
步驟5判斷是否滿足終止循環(huán)閾值或達(dá)到最大迭代次數(shù),不滿足則轉(zhuǎn)步驟4,滿足則輸出最終分類結(jié)果。
試驗(yàn)選取重慶市某地區(qū)WorldView-2影像為研究對(duì)象,影像大小為687×452像素,拍攝時(shí)間為2016年8月,主要含有R、G、B、NIR 4個(gè)波段和4個(gè)附加波段,空間分辨率為0.5 m。人工選取分割影像中的30%為訓(xùn)練樣本,其余70%為測(cè)試樣本。
在特征提取與選擇過(guò)程中,提取影像光譜特征(各波段光譜均值(8維)、波段比(8維)、標(biāo)準(zhǔn)差(8維)、亮度),紋理特征(標(biāo)準(zhǔn)差(8維)、平均值(8維)、差異度(8維)、對(duì)比度(8維)、信息熵(8維)、同質(zhì)性(8維)),形狀特征(面積、長(zhǎng)度、寬度、矩形度、長(zhǎng)寬比、形狀指數(shù)、緊致度)等共計(jì)80維特征,經(jīng)mRMR算法選擇出具有最大相關(guān)最小冗余的16維特征構(gòu)成特征向量并進(jìn)行歸一化處理。其中,參數(shù)c=4,m=2,ε=1×10-5,NR=8。
為驗(yàn)證所提方法的有效性,本文設(shè)計(jì)了不同的方法進(jìn)行對(duì)比,包括:文獻(xiàn)[2]分類方法、文獻(xiàn)[3]分類方法、文獻(xiàn)[4]分類方法、文獻(xiàn)[5]分類方法、文獻(xiàn)[6]分類方法、本文方法。各方法分類結(jié)果如圖1、表2所示。
本文從主觀評(píng)價(jià)和客觀評(píng)價(jià)兩方面對(duì)各種分類算法影像分類效果進(jìn)行了比較和分析。
(1) 主觀評(píng)價(jià)(圖1中均已用方框標(biāo)出):從目視效果上看,依照前4個(gè)文獻(xiàn)的分類方法均出現(xiàn)道路與裸地混淆現(xiàn)象。另外,圖1(b)中,大量植被和建筑物錯(cuò)分,少量陰影被錯(cuò)分為植被,少量水體被錯(cuò)分為陰影,少量植被被錯(cuò)分為道路;圖1(c)中的分類方法,水體被錯(cuò)分為陰影,陰影與植被等少量混淆,少量植被被錯(cuò)分為道路;圖1(d)中的分類方法,少量道路及陰影被錯(cuò)分為植被,少量建筑物被錯(cuò)分為道路;圖1(e)中,大量道路被錯(cuò)分為裸地與植被,少量陰影被錯(cuò)分為水體;圖1(f)分類結(jié)果中,少量建筑物及陰影被錯(cuò)分為植被。而本文方法大部分地物實(shí)現(xiàn)了準(zhǔn)確劃分,避免了地物混淆現(xiàn)象,總體分類精度較高。
圖1 不同方法試驗(yàn)結(jié)果(一)
本文方法人工解譯植被陰影水體裸地道路建筑物行總和生產(chǎn)者精度/(%)植被3045240331894.41陰影86170307985.92水體53460005485.19裸地6202294024294.24道路0006111312090.98建筑物0004418219096.81列總和3237155243122188——用戶精度/(%)95.5977.2285.2094.6392.5095.79——
(2) 客觀評(píng)價(jià):本文采用基于像素的評(píng)價(jià)方法進(jìn)行定量分析。
在原始影像中隨機(jī)選取1000個(gè)樣本點(diǎn),將樣本點(diǎn)映射到分類結(jié)果中,通過(guò)人工解譯構(gòu)造混淆矩陣,依據(jù)混淆矩陣計(jì)算生產(chǎn)者精度(PA)、用戶精度(UA)、Kappa系數(shù)等來(lái)比較分析。樣本分布如圖2所示。分別對(duì)上文所述分類方法中,地物分類的正確樣本數(shù)和錯(cuò)誤樣本數(shù)進(jìn)行統(tǒng)計(jì),取10次統(tǒng)計(jì)的平均數(shù)作為最終數(shù)據(jù),統(tǒng)計(jì)結(jié)果見(jiàn)表3。
利用混淆矩陣(表2)、OA和Kappa系數(shù)客觀評(píng)估不同方法的優(yōu)劣,計(jì)算結(jié)果見(jiàn)表4。本文算法總體分類精度達(dá)到93.29%,Kappa系數(shù)為0.914 3。相比文獻(xiàn)[5]和文獻(xiàn)[6],總體分類精度分別提高3.24%和2.05%,Kappa系數(shù)分別提高0.041 7和0.026 4。
圖2 樣本分布
地物類型樣本數(shù)量/個(gè)植被322陰影71水體54裸地243道路122建筑物188總計(jì)1000
從表4中數(shù)據(jù)得出:基于mRMR選擇與IFCM聚類算法分類效果要優(yōu)于其他算法的試驗(yàn)結(jié)果,其分類精度高于以往其他算法,分類結(jié)果中混淆地物較少,實(shí)現(xiàn)了大多數(shù)地物的準(zhǔn)確劃分。基于對(duì)象置信度OC指標(biāo)的分割,改善了傳統(tǒng)分割方法中的過(guò)分割與欠分割問(wèn)題;mRMR特征選擇算法可以很好地避免特征冗余帶來(lái)的存儲(chǔ)空間大、計(jì)算復(fù)雜度高的問(wèn)題;IFCM聚類算法比傳統(tǒng)FCM算法穩(wěn)健性更好,獲取的分類結(jié)果精度更高。
表4 試驗(yàn)一分類方法綜合評(píng)價(jià)結(jié)果
為了進(jìn)一步驗(yàn)證本文算法的合理性和正確性,另選用重慶某城鄉(xiāng)地物較簡(jiǎn)單區(qū)域的航天遙感影像作分類試驗(yàn),影像大小為696×760像素。試驗(yàn)結(jié)果如圖3所示。
圖3 不同方法試驗(yàn)結(jié)果(二)
由圖3目視效果上看,文獻(xiàn)[2]分類結(jié)果中出現(xiàn)少量植被與道路混淆現(xiàn)象,且有部分陰影被錯(cuò)分為植被;文獻(xiàn)[3]分類結(jié)果中出現(xiàn)植被與裸地混淆現(xiàn)象,及少量的植被被錯(cuò)分為建筑物,少量建筑物被錯(cuò)分為道路,這是由于道路和建筑物光譜相似所致;文獻(xiàn)[4]分類結(jié)果中少量植被被錯(cuò)分為裸地,少量建筑物被錯(cuò)分為道路;文獻(xiàn)[5]分類中只有少量道路被錯(cuò)分為植被和陰影;文獻(xiàn)[6]分類結(jié)果中出現(xiàn)少量道路與植被混淆現(xiàn)象,建筑物與道路錯(cuò)分現(xiàn)象;而本文算法大部分地物實(shí)現(xiàn)了準(zhǔn)確劃分,只有少量樣本(道路與建筑物)出現(xiàn)了錯(cuò)誤劃分,對(duì)比其他分類算法,在地物提取精度方面有大幅度提高。
本試驗(yàn)定量評(píng)價(jià)結(jié)果見(jiàn)表5,其總體精度和Kappa系數(shù)的計(jì)算方法同上。
從分類效果圖和表5的定量分析可得:本文方法比試驗(yàn)中文獻(xiàn)[4]、文獻(xiàn)[5]和文獻(xiàn)[6]分類方法的精度分別提高了5.16%、4.10%和1.42%,Kappa系數(shù)分別提高了0.064 4、0.048 1和0.026 4。
表5 試驗(yàn)二分類方法綜合評(píng)價(jià)結(jié)果
由以上兩組不同地區(qū)影像分類試驗(yàn)可知,本文算法分類精度最好,能實(shí)現(xiàn)大部分地物的準(zhǔn)確劃分。本文在對(duì)象置信度指標(biāo)(OC)的基礎(chǔ)上分割圖像并利用mRMR特征選擇方法減少冗余,降低計(jì)算復(fù)雜度;IFCM聚類算法增強(qiáng)了穩(wěn)健性,且對(duì)噪聲不敏感,易于在大規(guī)模問(wèn)題中應(yīng)用。
本文提出了一種基于mRMR選擇與IFCM聚類的遙感影像分類算法。首先基于OC指標(biāo)進(jìn)行影像分割試驗(yàn),在分割良好的基礎(chǔ)上采用mRMR算法進(jìn)行特征選擇以減少冗余,并利用IFCM算法進(jìn)行特征聚類以達(dá)到地物分類的目的。對(duì)比不同試驗(yàn)結(jié)果,本文方法分類精度最高,實(shí)現(xiàn)了地物的準(zhǔn)確劃分。