劉松濤,常 春,馬新星,王赫男
基于代數(shù)特征的多光譜圖像特征提取方法
劉松濤1,常 春1,馬新星2,王赫男1
(1.海軍大連艦艇學院信息作戰(zhàn)系,遼寧大連116018;2.海軍航空工程學院控制工程系,山東煙臺264001)
多光譜圖像特征提取的好壞直接關系著目標識別算法的復雜程度,也影響著最終目標識別的性能。研究了一維主成分分析(1DPCA)、二維主成分分析(2DPCA)、一維奇異值分解(1DSVD)和二維奇異值分解(2DSVD)等代數(shù)特征提取方法,并用這些方法構成圖像識別框架的特征提取部分,通過識別率的大小來驗證是否適合于多光譜圖像特征提取。實驗結果表明:①與可見光圖像目標識別相比,PCA和SVD特征更適合于紅外圖像目標識別;②訓練樣本分類時,PCA和SVD特征的識別性能改善不明顯;③訓練樣本少時,SVD重構圖像、2DSVD和1DPCA特征的識別性能較好。
多光譜圖像;特征提??;主成分分析;奇異值分解
多光譜(可見光、中波/長波紅外)圖像中可見光圖像分辨率高,目標邊緣明顯,對比度清晰,但是只能在白天、順光、能見度好的條件下獲取,戰(zhàn)場環(huán)境的應用概率低于20%。而中波/長波紅外圖像可全天候獲取,目標特征明顯,但是目標與背景對比度低,邊緣模糊,噪聲較大。因此,有必要研究合適的特征提取方法,可以準確地描述可見光和中波/長波紅外圖像目標的本質(zhì)特征,然后通過特征融合技術來提高多光譜圖像目標的識別能力。
常見的圖像特征包括:灰度特征、幾何特征、輪廓特征、代數(shù)特征和紋理特征等。在人臉識別領域,基于代數(shù)特征的人臉識別方法因其計算簡單、有效等特性引起了人們的廣泛注意,已成為人臉圖像特征提取和識別的主流方法之一。所謂代數(shù)特征,就是將圖像視為一個矩陣,利用各種代數(shù)變換或分解來提取圖像的代數(shù)特征,如特征值、特征向量等。常見的基于代數(shù)特征的圖像特征提取方法包括:主成分分析(Principal Component Analysis,PCA)[1]、獨立成分分析(Independent Component Analysis,ICA)[2]、奇異值分解(Singular Value Decomposition,SVD)[3]、線性判別分析(Linear Discriminant Analysis,LDA)[4]、非負矩陣分解(Non-negative Matrix Factorization)[5]等。本文主要關注基于主成分分析和奇異值分解的特征提取方法。PCA是基于信號的二階統(tǒng)計特性,借助一個正交變換矩陣,將分量相關的原隨機變量轉換成分量不相關的新變量,得到數(shù)據(jù)的低維子空間表示。文獻[1]最早應用PCA技術,提出了著名的特征臉方法,但傳統(tǒng)PCA有兩個明顯的缺點:(1)需要將二維圖像矩陣轉化為一維圖像向量,造成圖像向量的維數(shù)高,在大尺寸和小樣本的情況下,難以精確地求解協(xié)方差矩陣;(2)PCA只利用了圖像的全局信息,對人臉表情和光照條件的變化敏感。針對上述不足,Yang等提出了圖像PCA[6]和二維PCA(2DPCA)[7-8]。與PCA相比,2DPCA不僅能更精確地求解協(xié)方差矩陣,而且能大大提高特征提取的速度。但是2DPCA提取的特征向量維數(shù)還是較高,Kong等[9]提出了廣義二維主分量分析(G2DPCA)方法,可同時去除圖像各行和列像素間的相關性,大大降低了特征維數(shù)。普通2DPCA中,計算投影矩陣時需要所有的訓練樣本,如果額外增加了樣本,則需要全部重新計算,而實際問題的樣本有可能非常多,也有可能是逐漸獲取的,文獻[10]提出了增量學習的2DPCA,可以解決計算量大或者重復計算的問題。針對PCA僅利用了圖像的全局信息,嚴慧等[11]綜合全局信息和局部信息,將非負約束應用到2DPCA中,提高了人臉識別精度。
奇異值固有的穩(wěn)定性、比例不變性、旋轉不變性和降維壓縮的特征能有效地反映矩陣特征。Hong等[3]首先提出用奇異值分解來提取一組奇異值,作為人臉識別的分類特征,改善了分類性能。隨著奇異值分解的成功應用,出現(xiàn)了高階SVD[12]、多分辨率SVD[13]、二維SVD(2DSVD)[14]、分數(shù)(Fractional)SVD[15]和顯著(Dominant)SVD[16]等用于人臉識別,分數(shù)SVD主要考慮到大的奇異值對光照和表情變化敏感,應用分數(shù)函數(shù)來平滑奇異值,而顯著SVD將每個圖像的奇異值譜分為三個子空間,然后正則化重要基的系數(shù),既考慮了每個基的可分辨能力,又避免了分數(shù)SVD中參數(shù)的難以確定。
總之,SVD直接從圖像的灰度矩陣提取特征,PCA從訓練圖像集中提取特征,因此,PCA具備參考圖像的統(tǒng)計意義,而SVD更能表征參考圖像的確定性特征。本文主要是將PCA、2DPCA、SVD和2DSVD方法用于多光譜圖像特征提取,結合訓練樣本是否分類和奇異值是否重構圖像,形成了一系列特征提取方法,并基于多光譜圖像進行了分類實驗,通過識別率大小來尋找適合于多光譜圖像的特征提取方法。
考慮到1DPCA和1DSVD理論非常普及,本節(jié)僅重點闡述2DPCA和2DSVD理論。
2.1 二維主成分分析(2DPCA)
2DPCA方法直接對二維圖像矩陣應用主分量分析技術,而不需將圖像矩陣轉換為矢量[6-7,17]。該方法的顯著特點是計算簡便,計算代價小于傳統(tǒng)1DPCA。算法的基本思路為:
將圖像矩陣T對矢量u作投影,可得到矢量v,用公式表示為Tu=v,稱v為特征矢量。將所有圖像均對u作投影,可得出各自的特征矢量。規(guī)定最優(yōu)的投影軸u應使uTGtu取極大值,其中(Ti-ˉT)T(Ti-ˉT),ˉT為所有圖像矩陣的均值,C為圖像總數(shù)。而求uTGtu極大值的問題可轉化為求解Gt極大特征值所對應特征向量的問題。
顯然,將圖像直接投影到矢量,應有兩種運算形式,一種是矩陣右乘矢量的形式,稱為Ⅰ型2DPCA,而另一種是矩陣左乘矢量的形式,稱為Ⅱ型2DPCA。這兩種方案將原始圖像變換到不同的空間,導致Ⅰ型2DPCA只保留了圖像的同列像素之間的相關信息,Ⅱ型2DPCA只保留了圖像的同行像素之間的相關信息。因此,兩種方案對圖像具有不同的描述能力。為此,可考慮將Ⅰ型2DPCA和Ⅱ型2DPCA提取到的特征相結合,充分利用原圖像的相關信息。
2DPCA與1DPCA的原理本質(zhì)上一致,區(qū)別在于1DPCA需要先將圖像拉直成向量再處理,而2DPCA直接對二維圖像進行處理。在進行圖像特征提取時,1DPCA與2DPCA都需要處理一個協(xié)方差陣來獲取投影矩陣,但是對于一個m×n的圖像,1DPCA要處理的是一個m×n階協(xié)方差陣,而2DPCA要處理的是一個m(或n)階協(xié)方差陣。
2.2 二維奇異值分解(2DSVD)
2DSVD是1DSVD的延伸[14],基于原始圖像建立行-行協(xié)方差矩陣和列-列協(xié)方差矩陣,然后求取協(xié)方差矩陣的特征向量用于圖像特征提取。算法的基本思路為:
給定一個圖像樣本集{Ti}Ci=1,Ti∈Rm×n,定義平均的行-行協(xié)方差矩陣F和列-列協(xié)方差矩陣G如下:
ir量,Vs等于G的s個主要特征向量,Ur=(u1;…;Rr×s,Mi是樣本Ti的特征矩陣。
從上述概念可以知道,2DSVD相對于1DSVD來說,沒有直接用圖像矩陣進行奇異值分解,而是先求取圖像樣本集行和列兩個方向的協(xié)方差矩陣,然后對這兩個方向的協(xié)方差矩陣分別進行主成分分析,最后用降維后的行和列特征向量重構出低維特征矩陣??梢?,2DSVD充分利用了行列兩個方向的圖像信息,比1DSVD能更有效地提取原始圖像的特征。
鑒于本文用識別率來驗證特征提取方法的性能,本節(jié)簡單介紹圖像目標識別框架。主要包括圖像預處理、特征提取和決策分類三個過程,具體如圖1所示。
圖1 圖像目標識別框架
預處理的目的是通過規(guī)范化消除由于背景和光照明暗等變化給圖像帶來的影響。常見的預處理方法有均值化和灰度化[18]。均值化可以消除圖像曝光程度不同造成的灰度值差異,而針對彩色圖像的灰度化有利于多光譜圖像之間的統(tǒng)一。
特征提取的目的,是通過某種變換,把目標從圖像空間轉化到特征空間,得到所謂的“二次特征”,比原始圖像灰度更有利于分類識別。本文采用奇異值分解和主成分分析兩類方法進行一維和二維特征提取。
分類識別是圖像識別框架的最終部分。特征量選取后,需要進行分類器的設計。本文的重點在于特征提取,故采用簡單的最近鄰分類器進行分類[19]。
4.1 一維主成分分析算法
(1)構造特征子空間。輸入一組已知的目標圖像作為訓練樣本集,將圖像按行鏈接在一起構成N維向量xk=(xk1,…,xkN)T, k=1,…,C,構成原始圖像空間。訓練樣本集的均值向量為協(xié)方差矩陣為:
式中,A=(Φ1,Φ2,…ΦC)。通常N值很大,直接計算Sx的特征值和特征向量難度較大,當樣本個數(shù)C不多時,可以先計算C×C維矩陣ATA的特征值λk和特征向量Vk,然后根據(jù)奇異值分解定理,Uk=AVkλ-1/2
k就是Sx的特征向量。最后,選擇p(p<C)個較大特征值對應的特征向量構成特征子空間W=(U1,…,Up)。
(2)把訓練圖像和測試圖像投影到特征子空間:y=WT(x-u)。
(3)根據(jù)最近鄰分類器來確定測試圖像的類別。
4.2 二維主成分分析算法
4.2.1 Ⅰ型2DPCA和II型2DPCA算法
兩者區(qū)別只在于特征提取的方向不同,僅以I型2DPCA為例進行說明。算法步驟中僅第一步構造特征子空間和PCA算法不同,具體為:求取訓練集中所有樣本的均值,然后求出行-行協(xié)方差矩陣的特征值和特征向量,并根據(jù)前p個較大的特征值,取出對應的特征向量構成特征空間。
4.2.2 Ⅰ型和Ⅱ型聯(lián)合2DPCA算法
I型2DPCA的特征矢量第i個元素值即為圖像第i行中所有像素值以投影軸的各分量為權重的加權和。而II型方案中圖像在某一個投影軸上投影所得特征矢量的各元素值分別為原圖像各列中像素值的加權和。這說明兩種方案得出的數(shù)據(jù)是從不同角度對原圖像的描述,具有一定的互補性。因此,可將Ⅰ型方案和Ⅱ型方案得出的行特征與列特征合并。
4.3 一維奇異值分解算法
本文采用兩種方法將一維奇異值分解應用于圖像識別,一種是將圖像矩陣的奇異值降維后直接作為特征的基本SVD算法,另一種是將降維后的奇異值重構圖像作為特征的SVD重構圖像算法。
4.3.1 基本SVD算法
(1)構造特征子空間。輸入一組已知的目標圖像作為訓練樣本集對每一幅圖像的灰度矩陣進行奇異值分解,只取前p個較大的奇異值,構成特征矢量,得到一組p維矢量λi=(λi1,…,λip)T(i=1,…,C)構成目標的特征子空間。
(2)輸入測試圖像,取前p個較大的奇異值構成特征矢量λ=(λ1,…,λp)T。
(3)根據(jù)最近鄰分類器來確定測試圖像的類別。
4.3.2 SVD重構圖像算法
SVD重構圖像算法的步驟與基本SVD算法相同,其區(qū)別是,前者將降維后的奇異值重新構成圖像,將重構的圖像矩陣直接作為特征,而不是直接用奇異值作為分類的特征。重構方法為:T=UλVT,其中λ為降維后的p維奇異值,U和V分別是從原圖像中分解出的正交向量。
4.4 二維奇異值分解算法
二維SVD算法的步驟也和基本SVD算法相同,不同之處在于訓練樣本和測試樣本的特征構成,具體為:
(1)從訓練集中計算出Uk和Vs,同時每一個訓練圖像樣本得到一個特征矩陣。
(2)計算每一個測試圖像樣本的特征矩陣。
5.1 實驗圖像
實驗用兩組圖像進行。第一組是艦船目標紅外圖像,每類5幅,共15幅,如圖2所示。第二組是艦船目標可見光圖像,也是每類5幅,共15幅,如圖3所示。
圖2 艦船目標紅外圖像
圖3 艦船目標可見光圖像
需要說明的是,無論是艦船目標紅外圖像,還是艦船目標可見光圖像,原始的15幅模板圖像由于反應了不同目標的大小和姿態(tài),模板圖像大小并不一致。我們以每15幅圖像中最小的圖像寬和高為標準,對所有圖像都進行了縮放,并將彩色圖像轉化為灰度圖像。
5.2 結果分析
表1和表2反映了本文提到的各種特征提取算法分別對兩組圖像進行識別的結果,每組實驗分為兩類,一類是分類識別,一類是不分類識別,最后得出每種算法的識別率。分類識別的含義是對每一個圖像類都建立一個特征子空間,然后看未知圖像和已知圖像類中哪個子空間的距離最近。不分類識別的含義是所有訓練圖像建立一個特征子空間,沒有利用測試數(shù)據(jù)的類別信息。
表1 艦船目標紅外圖像識別結果
表2 艦船目標可見光圖像識別結果
比較實驗結果我們可以得到以下結論:
(1)整體上,紅外圖像的PCA和SVD特征識別效果優(yōu)于可見光圖像的PCA和SVD特征識別效果??赡苁怯捎诩t外圖像特征更加明顯,不同圖像之間更容易區(qū)別,可見光圖像轉化為灰度圖像后,色彩信息丟失,沒能充分體現(xiàn)出可見光圖像的優(yōu)點,所以識別效果稍差,但應該說,無論可見光圖像,還是紅外圖像,識別效果相差不大。如果考慮彩色圖像的PCA特征提取,可能識別效果會更好。
(2)無論是可見光圖像,還是紅外圖像,PCA和SVD特征按類識別時識別率并沒有明顯增加,有時識別率反而會減小。這可能是由于分類后樣本數(shù)太少導致的,理論上,識別率會有所增加,因為按類提取特征能夠大大減小不同類型圖像之間的相關度,能夠更明顯地反映各類圖像本身的特征。
(3)無論是可見光圖像,還是紅外圖像,2DPCA的識別效果都沒有明顯優(yōu)于1DPCA,甚至還會變差,這主要是由于樣本數(shù)太少導致的。沒有體現(xiàn)出2DPCA在計算效率和識別性能方面的優(yōu)勢。關于2DPCA,分別從圖像的行、列以及行列結合三個角度進行特征提取,但是行列結合的識別率沒有明顯優(yōu)于行、列中的一種,并且運算量較大,這是因為行列結合這種方法只是將行、列算法中求得的特征矩陣的歐式距離簡單相加,并沒有顯示出較好的區(qū)分度,所以識別率跟行、列兩種算法差別不大。這啟發(fā)我們?nèi)绻懈玫男辛薪Y合方法,應該是行列結合的識別性能要優(yōu)于單純行特征或列特征的識別性能。綜合樣本數(shù)情況考慮,認為1DPCA是比較有效的特征提取方法。
(4)2DSVD的識別率要明顯高于1DSVD,這是因為2DSVD利用了圖像重構的思想,而不僅僅是像1DSVD那樣只利用奇異值作為特征來提取。這個圖像重構思想直接用在1DSVD上,識別率提升更明顯,對紅外圖像識別率高達100%??梢?,圖像重構思想對識別率的提升作用非常明顯。故認為SVD圖像重構和2DSVD是比較有效的特征提取方法。
本文主要是將1DPCA、2DPCA、1DSVD和2DSVD方法用于多光譜圖像特征提取,結合訓練樣本是否分類和奇異值是否重構圖像,形成了一系列特征提取方法,通過實驗驗證后得出的主要結論有:(1)紅外圖像的PCA和SVD特征識別效果優(yōu)于可見光圖像的PCA和SVD特征識別效果;(2)無論是可見光圖像,還是紅外圖像,PCA和SVD特征按類識別時識別率改善不明顯;(3)SVD圖像重構、2DSVD和1DPCA適合于樣本少的情況,是比較有效的多光譜圖像特征提取方法。研究過程中還發(fā)現(xiàn)了一些其他問題,有待進一步研究,比如:(1)如何選擇樣本構成訓練樣本集,使提取出的特征向量能夠最充分地表征圖像的各種變化;(2)圖像代數(shù)特征中特征向量各分量在分類中的作用如何確定;(3)單獨使用代數(shù)特征,由于沒有完整的描述目標特性,導致分類效果并沒有完全正確,這也啟示我們可以繼續(xù)研究其他圖像特征,比如:輪廓特征、紋理特征等,最后將不同目標特征融合,優(yōu)勢互補,從而進一步提高分類識別率。
[1] Turk M,Pentland A.Eigenfaces for recognition[J].J. Cognitive Neurosci,1991,3(1):71-96.
[2] Lennon M,Mercier G,Mouchot1 M C.Independent component analysis as a tool for the dimensionality reduction and the representation of hyperspectral images[C]//Proceedings of IEEE International Conference on Geoscience and Remote Sensing,Sydney,Australian,2001:2893-2895.
[3] Hong ZQ.Algebraic feature extraction of image for recognition[J].Pattern Recognition,1991,24(3):211-219.
[4] LiM,Yuan B.2D-LDA:A novel statistical linear discriminant analysis for image matrix[J].Pattern Recognition Letters,2005,26(5):527-532.
[5] Li Le,Zhang Yujin.A survey on algorithms of non-negative matrix factorization[J].Acta Electronica Sinica,2008,36(4):737-743.(in Chinese)李樂,章毓晉.非負矩陣分解算法綜述[J].電子學報,2008,36(4):737-743.
[6] Yang J,Yang JY.From image vector tomatrix:a straightforward image projection technique-IMPCA vs.PCA[J]. Pattern Recognition,2002,35(9):1997-1999.
[7] Yang J,Zhang D,F(xiàn)rangi A F,et al.Two dimensional PCA:A new approach to appearance-based face representation and recognition[J].IEEE Trans.on Pattern A-nalysis and Machine Intelligence,2004,26(1):131-137.
[8] Xu Y,Zhang D,Yang J,etal.An approach for directly extracting features from matrix data and its application in face recognition[J].Neurocomputing,2008,71(10):1857-1865.
[9] Kong H,Wang L,Teoh E K.Generalized 2D principal component analysis for face image representation and recognition[J].Neural Networks,2005,18(5-6):585-594.
[10]Ren C X,Dai D Q.Incremental learning of bidirectionalprincipal components for face recognition[J].Pattern Recognition,2010,43(1):318-330.
[11]Yan Hui,Jin Zhong,Yang Jingyu.Non-megative two-dimensional principal component analysis and its application to face recognition[J].Pattern Recognition and Artificial Intelligence,2009,22(6):809-814.(in Chinese)嚴慧,金忠,楊靜宇.非負二維主成分分析及在人臉識別中的應用[J].模式識別與人工智能,2009,22(6):809-814.
[12]Wang H,Ahuja N.Facial expression decomposition[C]//Proceedings of ICCV,Beijing,China,2003:958-965.
[13]Lung SY.Multi-resolution form of SVD for text-independent speaker recognition[J].Pattern Recognition,2002,35(7):1637-1639.
[14]Weng X Q,Shen J Y.Classification of multivariate time series using two-dimensional singular value decomposition[J].Knowledge-Based Systems,2008,21(7):535-539.
[15]Liu J,Chen S,Tan X.Fractional order singular value decomposition representation for face recognition[J].Pattern Recognition,2008,41(1):378-395.
[16]Lu JW,Zhao Y W.Dominant singular value decomposition representation for face recognition[J].Signal Processing,2010,90(6):2087-2093.
[17]Xu Yong,Yang Jian,Zhao Yingnan,et al.An approach to image dimension reduction and its application to face omages[J].Journal of Electronics&Information Technology,2008,30(1):180-184.(in Chinese)徐勇,楊健,趙英男,等.一種縮減圖像維數(shù)的方法及其在人臉圖像上的應用[J].電子與信息學報,2008,30(1):180-184.
[18]Wang Yaonan.Computer image processing and recognition techniques[M].Beijing:Higher Education Press,2001.(in Chinese)王耀南.計算機圖像處理與識別技術[M].北京:高等教育出版社,2001.
[19]Bian Zhaoqi,Zhang Xuegong.Pattern recognition[M]. Beijing:Tsinghua University Press,2000.(in Chinese)邊肇祺,張學工.模式識別[M].北京:清華大學出版社,2000.
Feature extraction method for multi-spectral image based on algebraic feature
LIU Song-tao1,CHANG Chun1,MA Xin-xing2,WANG He-nan1
(1.Dept.of Information Operation,Dalian Naval Academy,Dalian 116018,China;2.Dept.of Control Engineering,Naval Aeronoutical and Astronoutical University,Yantai264001,China)
The result of feature extraction onmulti-spectral image is related to the complex degree of target recognition algorithm directly,and also has deep influence on the performance of target recognition.On the aspect of algebra featuremethods,the basic principles of 1DPCA,2DPCA,1DSVD,and 2DSVD are studied,then they are used as the feature extraction part of image target recognition algorithm.Whether is suitable for themultispectral image feature extraction is verified through the size of the recognition rate.The experiment results show that,①the feature of PCA and SVD on infrared image has better recognition results than thatof visible image;②when training samples are classified,the improvement of recognition performance based on the feature of PCA and SVD is notobvious;③under the condition of little training sample,the features of SVD reconstructing image,2DSVD and 1DPCA have good recognition performance.
multi-spectral image;feature extraction;principal component analysis; singular value decomposition
TP391.41
A
10.3969/j.issn.1001-5078.2013.11.25
1001-5078(2013)11-1316-06
國家自然科學基金項目(No.61303192)資助。
劉松濤(1978-),男,博士后,副教授,碩士生導師。主要從事圖像處理,成像制導,光電對抗等研究工作。E-mail:navylst@163.com
2013-04-03;
2013-04-23