(山東科技大學(xué) 計(jì)算機(jī)科學(xué)工程學(xué)院,山東 青島 266590)
近幾年來(lái),由于遙感技術(shù)的快速發(fā)展,高光譜遙感影像的采集變得更加容易。隨著高光譜圖像光譜和空間分辨率的增加,影像所包含的地物信息越來(lái)越豐富,更加有利于地物的精細(xì)分類。為了提取有效的地物特征改善分類精度,多種特征提取方法已經(jīng)被應(yīng)用到高光譜圖像分類領(lǐng)域[1-3],例如主成分分析[4](principal components nalysis,PCA)、濾波方法以及形態(tài)學(xué)特征提取方法[5]等。形態(tài)學(xué)方法選用不同的結(jié)構(gòu)元素去提取圖像中對(duì)應(yīng)的結(jié)構(gòu)形式的信息[6],通過改變結(jié)構(gòu)元素的類型和比例來(lái)生成地物的不同特征圖像,特征圖像表達(dá)地物的不同信息。但該方法的結(jié)構(gòu)元素種類眾多,從中恰當(dāng)?shù)剡x擇一個(gè)或幾個(gè)符合高光譜圖像特征的結(jié)構(gòu)十分困難。
在高光譜圖像分類中,結(jié)合地物不同層次的特征可以更好地反映地物性質(zhì)、區(qū)分不同地物,改善分類精度[7-8]。對(duì)于多波段、高維度的高光譜圖像來(lái)說,每一種特征提取方法均可以提取一定的地物特征,但是單獨(dú)的一種特征圖像通常無(wú)法覆蓋地物的所有特征,集成的概念由此出現(xiàn)[9],將多種不同的特征圖像組合,取長(zhǎng)補(bǔ)短,進(jìn)一步提升高光譜圖像的分類精度[10]。
本研究利用幾種新的特征提取方法,包括高斯濾波[11](Gaussian filtering, GF)和滾動(dòng)引導(dǎo)濾波[12](rolling guidance filtering, RGF)。圖像是由不同尺度的對(duì)象所構(gòu)成,不同尺度的結(jié)構(gòu)傳遞著不同信息。大尺度結(jié)構(gòu)或邊緣一般包含更多信息,而較小尺度的結(jié)構(gòu)或邊緣包含較少信息并且可能包含噪聲數(shù)據(jù)。GF方法利用高斯核函數(shù)對(duì)圖像進(jìn)行卷積,對(duì)圖像進(jìn)行去噪。而RGF方法可以較好地保留圖像中重要的邊緣結(jié)構(gòu),防止信息丟失。
RGF方法具體的實(shí)現(xiàn)步驟如下:
1)圖像由GF進(jìn)行處理,圖像中的小尺度結(jié)構(gòu)將被完全去除,大尺度結(jié)構(gòu)被模糊。濾波器為:
(1)
2)大尺度結(jié)構(gòu)邊緣恢復(fù)。RGF方法通過迭代改變引導(dǎo)圖像,逐漸恢復(fù)模糊的邊緣結(jié)構(gòu)。公式為:
(2)
為了避免形態(tài)學(xué)中結(jié)構(gòu)元素種類不易選擇的問題,本研究提出一種基于多特征圖像集成的高光譜圖像分類方法。具體過程是:
1)生成多種特征圖像即構(gòu)建多個(gè)基本核。通過PCA降低原始高光譜圖像的維數(shù),然后利用GF和RGF進(jìn)行特征提取,其中GF方法產(chǎn)生的特征圖像去除同一類別中的小尺度結(jié)構(gòu),RGF方法通過控制迭代次數(shù)來(lái)生成不同的特征圖像。為選擇合適的特征圖像,選擇Indian Pines、University of Pavia數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。圖1為Indian Pines數(shù)據(jù)集特征提取的結(jié)果,RGF方法迭代3次時(shí),被模糊的大尺度邊緣基本恢復(fù)。圖2是Pavia大學(xué)數(shù)據(jù)集對(duì)應(yīng)的特征提取結(jié)果,同樣在迭代3次時(shí),形成了邊緣清晰、內(nèi)部均勻的特征圖像。
圖1 Indian Pines圖像不同的特征圖像
圖2 University of Pavia圖像不同的特征圖像
2)采用支持向量機(jī)(support vector machine, SVM)[13-15]分類方法得到每種特征圖像對(duì)應(yīng)的分類結(jié)果, 選擇最優(yōu)的分類結(jié)果作為最終組合的基本核之一,然后采用自適應(yīng)增強(qiáng)的方式[16]進(jìn)行學(xué)習(xí),獲得多個(gè)基本核。集成學(xué)習(xí)(ensemble learning, EL)方法可以將多個(gè)分類器結(jié)合,得到更加準(zhǔn)確、穩(wěn)定的結(jié)果。采用集成學(xué)習(xí)將多種特征圖像的分類結(jié)果結(jié)合,以進(jìn)一步提高分類精度。
圖3 使用不同特征圖像對(duì)精度的影響
由圖1和圖2可看到,當(dāng)?shù)?次時(shí),特征圖像的特征邊緣已變得清晰穩(wěn)定。圖3展示了兩個(gè)數(shù)據(jù)集下的分類精度,每個(gè)類別隨機(jī)選擇50個(gè)訓(xùn)練樣本,其余作為測(cè)試樣本。實(shí)驗(yàn)結(jié)果用總體精度(overall accuracy,OA)進(jìn)行評(píng)估。由圖3可以看出,當(dāng)使用迭代3次的濾波圖像時(shí),分類精度已達(dá)到最高值,在后續(xù)實(shí)驗(yàn)中,選擇原圖、GF、迭代3次的RGF作為基本特征圖像。
基于多特征圖像的集成學(xué)習(xí)(MFI-EL)分類方法思路如下:①將構(gòu)建的特征圖像利用SVM進(jìn)行分類,選擇最優(yōu)的分類結(jié)果作為最終集成的分類結(jié)果之一;然后采用自適應(yīng)增強(qiáng)方式不斷的訓(xùn)練獲得多個(gè)最優(yōu)結(jié)果。自適應(yīng)增強(qiáng)的方式就是在整個(gè)實(shí)驗(yàn)期間賦予每個(gè)訓(xùn)練樣本權(quán)重值(在實(shí)驗(yàn)開始時(shí),所有訓(xùn)練樣本的權(quán)重值相等),在第t次被錯(cuò)誤分類的訓(xùn)練樣本在第t+1次增加樣本的權(quán)重值,那么分類器將集中在這些訓(xùn)練樣本上,這些訓(xùn)練樣本將會(huì)被正確分類,最終得到較優(yōu)的分類結(jié)果。②將多個(gè)分類結(jié)果組合,根據(jù)分類結(jié)果的誤差率來(lái)確定其在最終結(jié)合核中的權(quán)重系數(shù)。
本研究得到的MFI-EL分類方法流程如圖4,具體過程為:
圖4 MFI-EL分類方法過程
氣則是構(gòu)成具體事物的材質(zhì),具體物皆氣造而成,但氣的造物必有理為其依據(jù)。理是一類事物的形式,氣是構(gòu)成事物的質(zhì)料。理氣無(wú)時(shí)間上的先后,但有邏輯上的先后,因?yàn)槔硎浅瑫r(shí)空的永恒存在者,氣是時(shí)空中的變化者。太極中有動(dòng)靜之理,氣因此理而有實(shí)際的動(dòng)靜。此氣中之理,就是此事物的性。不唯人有性,物亦有性,“天下無(wú)性外之物”(《朱子語(yǔ)類》卷四)。
然后,利用SVM對(duì)不同的特征圖像進(jìn)行分類得到對(duì)應(yīng)的分類結(jié)果Ik(k=1,2,…C),C表示特征圖像的個(gè)數(shù),并計(jì)算每個(gè)特征圖像下的分類錯(cuò)誤率errk,如式(3)。根據(jù)公式(4)挑選出錯(cuò)誤率最低的結(jié)果(用errt表示)作為最終集成的基本核,ft表示第t次獲得的基本核,并計(jì)算相應(yīng)的結(jié)合權(quán)重αt如式(5)。
(3)
k*=argmmerrk,k=1,2,…,c;(ft,errt)=(Ik*,errk*)
(4)
(5)
其中Wt是第t次時(shí)樣本權(quán)重向量。通過該過程,獲得了一個(gè)基本核。
其次,如式(6)更新樣本權(quán)重,將分類器集中在被錯(cuò)誤分類的樣本上,再次訓(xùn)練得到新的樣本子集下對(duì)應(yīng)的基本核。
(6)
其中,Zt是規(guī)范化參數(shù)。
最后,重復(fù)以上過程,獲得滿足條件的T個(gè)基本分類器結(jié)果,并將得到的多個(gè)分類結(jié)果根據(jù)權(quán)重系數(shù)αt進(jìn)行集成,如式(7)得到最終的分類結(jié)果:
(7)
首先,利用PCA對(duì)原始圖像降維,保留25個(gè)波段。其次,通過特征提取方法得到特征圖像。實(shí)驗(yàn)選用原始圖像、高斯圖像、迭代三次的RGF圖像。在所有的實(shí)驗(yàn)中,訓(xùn)練樣本集是在標(biāo)記樣本中每個(gè)類別隨機(jī)選擇50個(gè)訓(xùn)練樣本,剩余的作為測(cè)試樣本集。為了消除實(shí)驗(yàn)隨機(jī)性引起的偏差,進(jìn)行了10次重復(fù)實(shí)驗(yàn),每次實(shí)驗(yàn)的訓(xùn)練樣本集和測(cè)試樣本集均是隨機(jī)產(chǎn)生的,將10次結(jié)果的均值作為最后的分類精度。實(shí)驗(yàn)精度表格中“±”左側(cè)的數(shù)據(jù)代表10次重復(fù)實(shí)驗(yàn)分類結(jié)果的平均值,右側(cè)表示的是10次實(shí)驗(yàn)結(jié)果的標(biāo)準(zhǔn)差,且最高精度以粗體突出顯示。為了驗(yàn)證提出方法的有效性,與標(biāo)準(zhǔn)的SVM、表示多核學(xué)習(xí)(representation multiple kernel learning, RMKL)、樣本篩選多核學(xué)習(xí)(sample screening multiple kernel learning, S2MKL)方法進(jìn)行對(duì)比。最終的分類性能利用總體精度(OA)、平均精度(average accuracy, AA)和Kappa系數(shù)進(jìn)行評(píng)估,其中OA是正確分類像素的百分比,AA是每個(gè)類的正確分類像素的百分比的平均值,Kappa系數(shù)是綜合考慮用戶精度和制圖精度的一個(gè)質(zhì)量指數(shù)。
首先,利用Indian Pines數(shù)據(jù)集驗(yàn)證提出方法的分類性能。實(shí)驗(yàn)中將12個(gè)類別中具有很少標(biāo)記樣本的4個(gè)類別去掉,表1顯示剩下的八個(gè)類別通過不同方法獲得的分類結(jié)果及其相應(yīng)的OA、AA和kappa系數(shù)值。由表1可見,相比于標(biāo)準(zhǔn)的SVM方法,本方法的精度提升了17.63%,證明集成方法的作用。與RMKL和S2MKL方法相比,本方法的OA分別提升了約6.88%、1.6%。本方法在一些復(fù)雜類別如Grass_M,Grass_T和Wheat中表現(xiàn)突出,對(duì)應(yīng)的分類圖如圖5所示。訓(xùn)練樣本數(shù)量對(duì)分類性能的影響如圖6所示,每個(gè)類別的訓(xùn)練樣本數(shù)量從20到50,可見所提出方法的分類性能在不同數(shù)量訓(xùn)練樣本下均優(yōu)于其他方法,特別是在小樣本的情況下,所提出的算法顯示出良好的分類性能。
表1 Indian Pines圖像下不同方法的分類精度對(duì)比
圖5 Indian Pines圖像下的不同方法的分類圖
圖6 Indian Pines圖像下的不同數(shù)量訓(xùn)練樣本下的分類結(jié)果
為驗(yàn)證所提方法的泛化性能,在Salinas數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。分類結(jié)果如表2所示,可見本方法的分類精度高于SVM方法約8.67%,分別高于RMKL、S2MKL方法大約5.27%和2.43%。尤其在Grapes、Corn、Lettuce_4和Vinyard_U類別上分類性能提升顯著,分別高于S2MKL方法約3.32%、4.45%、4.86%和9.52%,體現(xiàn)了本特征提取方法的作用。不同方法的分類圖像如圖7所示,可以看到本方法在類別Corn 和Vinyard_U上的分類圖清晰規(guī)整。不同數(shù)量的訓(xùn)練樣本下訓(xùn)練得到模型的性能差異實(shí)驗(yàn)結(jié)果如圖8所示,進(jìn)一步表明所提方法的性能顯著優(yōu)于其他算法。
表2 Salinas圖像下不同方法分類精度對(duì)比
續(xù)表2
圖7 Salinas圖像不同方法的分類圖像
圖8 Salinas圖像下的不同數(shù)量訓(xùn)練樣本下的分類結(jié)果
為進(jìn)一步驗(yàn)證提出方法的普適性,選擇Pavia大學(xué)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。表3展示了分類精度結(jié)果,對(duì)應(yīng)的分類圖如圖9所示,可見,相比于其他幾種分類方法,本方法的分類精度有顯著提升:OA分別比RMKL和S2MKL方法高大約1.81%和0.38%。不同數(shù)量的訓(xùn)練樣本下的精度結(jié)果如圖10所示,證明了本研究提出方法的優(yōu)越性。
表3 University of Pavia圖像下不同方法分類精度對(duì)比
圖9 University of Pavia圖像不同方法的分類圖像
圖10 University of Pavia圖像下的不同數(shù)量訓(xùn)練樣本下的分類結(jié)果
提出一種基于多特征圖像的集成學(xué)習(xí)方法MFI-EL,使用PCA將高光譜圖像的主要信息集中在前幾個(gè)波段,然后使用GF和RGF來(lái)獲得特征圖像。為了保持原始光譜信息,將原始圖像也作為特征圖像。其次,通過自適應(yīng)增強(qiáng)的方法得到多個(gè)不同的基本核,并根據(jù)每個(gè)基本分類器的分類精度確定組合權(quán)重將其集成。實(shí)驗(yàn)執(zhí)行在三幅真實(shí)的高光譜圖像數(shù)據(jù)上,通過與其他三種方法進(jìn)行對(duì)比,驗(yàn)證了所提出方法能夠提高高光譜圖像的分類精度。