嚴(yán)林
摘 要:如何有效的描述每個(gè)人臉的個(gè)體特征,使之容易區(qū)別于其他人,是人臉識(shí)別特征抽取中最關(guān)鍵的一部分。近年來(lái),子空間分析方法因其具有描述性強(qiáng)、計(jì)算代價(jià)小等優(yōu)點(diǎn)在人臉識(shí)別領(lǐng)域中得到了廣泛的使用。本文重點(diǎn)對(duì)線性子空間方法中的2DPCA,2DLDA,2DICA做了理論上的比較,并利用matlab編程獲得了實(shí)驗(yàn)數(shù)據(jù)的支持。同等的實(shí)驗(yàn)條件下,在ORL姿態(tài)庫(kù)和CMU表情庫(kù)的實(shí)驗(yàn)結(jié)果表明2DLDA識(shí)別效果最優(yōu),2DPCA識(shí)別效率最高,而無(wú)論是從識(shí)別率還是識(shí)別速度上來(lái)說(shuō),2DICA均介于二者之間。
關(guān)鍵詞:人臉識(shí)別;2DPCA;2DLDA;2DICA
本文受到三峽大學(xué)碩士論文培優(yōu)基金的支持(2013PY040)
1 引言
人臉識(shí)別因其具有自然性且易被人接受已成為計(jì)算機(jī)視覺(jué)與模式識(shí)別領(lǐng)域的一大研究熱點(diǎn)[1-2]。但識(shí)別率的高低主要受到表情,姿態(tài),光照等因素的制約,近些年已有大量的科研工作者提出了很多方法來(lái)解決這類問(wèn)題[3],其中子空間分析因其描述性強(qiáng)、易實(shí)現(xiàn)等優(yōu)點(diǎn),在人臉識(shí)別領(lǐng)域受到了廣泛的關(guān)注。子空間分析的思想就是根據(jù)一定的性能目標(biāo)來(lái)尋找一線性或非線性的空間變換,把原始信號(hào)數(shù)據(jù)壓縮到一個(gè)低維子空間,使數(shù)據(jù)在子空間中的分布更加緊湊,為數(shù)據(jù)的更好描述提供了手段,另外計(jì)算的復(fù)雜度也得到了大大的降低。目前在人臉識(shí)別中得到成功運(yùn)用的線性子空間分析方法有:主成分分析(PCA)[4]、線性判別分析(LDA)[5]、獨(dú)立成分分析(ICA)[6]和非負(fù)矩陣因子分解(NMF)[7]及其改進(jìn)算法[8-10]。
2 實(shí)驗(yàn)與分析
本文中統(tǒng)一將訓(xùn)練樣本圖像集設(shè)為, 表示第類的第個(gè)大小為的訓(xùn)練樣本,C為樣本總類別數(shù),為每一類樣本數(shù),總樣本數(shù)為。
2.1 2DPCA
2DPCA[11]是在PCA基礎(chǔ)上的改進(jìn),基本思想來(lái)源于K-L變換[12],目的是從訓(xùn)練樣本圖像中,通過(guò)線性變換得到一組特征臉圖像,那么任意給定的人臉圖像都可以近似為這組特征臉圖像的線性組合,而組合的系數(shù)即作為人臉的特征向量。其本質(zhì)特點(diǎn)在于采用最大化類間離散度作為準(zhǔn)則。但是PCA是將圖像轉(zhuǎn)換成的向量,破壞了圖像的二維結(jié)構(gòu)特征,并且轉(zhuǎn)換成向量之后計(jì)算量太大,2DPCA方法就很好地解決了以上的問(wèn)題,不僅保持了人臉圖像的結(jié)構(gòu)特性,更容易準(zhǔn)確地評(píng)估協(xié)方差矩陣,即在圖像的特征提取上更加簡(jiǎn)單直觀,而且確定相應(yīng)的特征向量時(shí)需要的時(shí)間更少,因而可以顯著提高圖像的特征提取速度,計(jì)算量小。
基于二維主成分分析的人臉識(shí)別的具體步驟如下:
讀入訓(xùn)練樣本圖象A并算出所有訓(xùn)練樣本的平均圖象
計(jì)算訓(xùn)練樣本集總體散度矩陣即圖像的協(xié)方差矩陣
(1)
構(gòu)造矩陣并進(jìn)行奇異值分解,求其特征值構(gòu)成的對(duì)角陣V及其對(duì)應(yīng)的特征向量組成的矩陣U
取出V中按降序排列的前d個(gè)最大特征值對(duì)應(yīng)的特征向量組成特征空間
2.2 2DLDA
性性判別分析(LDA)技術(shù)是模式識(shí)別中的又一經(jīng)典的特征提取和數(shù)據(jù)降維的方法。采用了Fisher判別準(zhǔn)則函數(shù),因此也稱為FLD,是R.A.Fisher于1936 年提出的。但是它僅適用于兩類分類問(wèn)題。在Fisher思想的基礎(chǔ)之上,Wilks和Duda分別提出了判別矢量集的概念,即尋找由一組判別矢量構(gòu)成的投影子空間,將樣本投影到該子空間上得到投影向量,并作為最終提取的特征向量從而解決了多分類問(wèn)題,該方法被稱為經(jīng)典的Fisher線性判別分析方法。2DLDA[13]是LDA在矩陣模式下的平行推廣,但都是以樣本的可分性為目標(biāo),尋找線性變換從高維輸入空間里提取出最具有判別能力的低維特征,這些特征能幫助將同一個(gè)類別的所有樣本聚集在一起,而不同類別的樣本盡量分開,即尋找線性變換使得變換后的樣本類間離散度和類內(nèi)離散度的比值最大。
基于線性判別分析的人臉識(shí)別的具體步驟如下:
讀入訓(xùn)練樣本圖像并計(jì)算第i類訓(xùn)練樣本均值和所有訓(xùn)練樣本均值
(2)
求內(nèi)類散度矩陣和內(nèi)間散度矩陣
(3)
基于Fisher準(zhǔn)則尋找最優(yōu)的投影矩陣
(4)
計(jì)算的特征值V和對(duì)應(yīng)的特征向量U
取出V中按降序排列的前d個(gè)最大特征值對(duì)應(yīng)的特征向量組成特征空間
2.3 2DICA
獨(dú)立元分析(ICA)是近幾年才發(fā)展起來(lái)的一種新的統(tǒng)計(jì)方法,最早提出ICA概念的是Jutten和Herault,當(dāng)時(shí)他們對(duì)ICA給出了一種相當(dāng)簡(jiǎn)單的描述,認(rèn)為ICA是從線性混合信號(hào)里恢復(fù)出一些基本的源信號(hào)的方法。由于ICA是基于信號(hào)高階統(tǒng)計(jì)特性的分析方法,并且經(jīng)ICA分解出的各信號(hào)分量之間是相互獨(dú)立的,因此,ICA在信號(hào)處理領(lǐng)域受到了廣泛的關(guān)注?;舅枷刖褪峭ㄟ^(guò)線性變換,從訓(xùn)練樣本中找到一組相互獨(dú)立的基,并以此來(lái)描述樣本數(shù)據(jù)。2DICA[14]是直接運(yùn)用圖像矩陣參與計(jì)算,在時(shí)間上更具優(yōu)勢(shì)。
基于獨(dú)立成分分析的人臉識(shí)別的具體步驟如下:
讀入訓(xùn)練樣本圖象A并中心化訓(xùn)練樣本,中心化后的訓(xùn)練樣本集為
(5)
計(jì)算訓(xùn)練樣本的協(xié)方差矩陣S
(6)
其中, E是由S的特征向量組成的正交矩陣, D是由相應(yīng)的特征值組成的對(duì)角矩陣
求出白化矩陣V,
則白化后的數(shù)據(jù)為:
(7)
用 FastICA 方法計(jì)算得到分離矩陣Xk
所有的識(shí)別過(guò)程:
對(duì)于一幅給定的人臉圖像A,向特征空間Xk投影之后即可得到m*d維的特征矩陣,其中 。在這里任意的兩個(gè)特征矩陣和之間的歐式距離定義為
(8)
假設(shè)N個(gè)訓(xùn)練樣本,每一個(gè)樣本都屬于某個(gè)特定的類別。給定一個(gè)樣本B,若滿足式(9),則認(rèn)為。
(9)
3 仿真實(shí)驗(yàn)
實(shí)驗(yàn)選擇ORL姿態(tài)庫(kù)和CMU表情庫(kù),將人臉庫(kù)中的人臉圖像分成兩組,前幾張作為訓(xùn)練樣本,剩下的作為測(cè)試樣本,記錄實(shí)驗(yàn)中的正確識(shí)別率以及識(shí)別時(shí)間。
圖1為ORL姿態(tài)庫(kù)和CMU 表情庫(kù)上三種方法識(shí)別率對(duì)比的實(shí)驗(yàn)結(jié)果,橫軸均代表訓(xùn)練樣本的個(gè)數(shù)。從識(shí)別率上來(lái)看,這三種方法的識(shí)別率都隨著訓(xùn)練樣本數(shù)的增加而變大,尤其在CMU表情庫(kù)上識(shí)別率均達(dá)到了100%。在訓(xùn)練樣本數(shù)相同的條件下,2DLDA的方法表現(xiàn)的要優(yōu)于2DICA,而2DICA要優(yōu)于2DPCA。但2DLDA方法有一個(gè)最大的缺點(diǎn)是當(dāng)只有一個(gè)訓(xùn)練樣本時(shí),是無(wú)法識(shí)別的,這也就是所謂的奇異問(wèn)題,在小樣本的情況下,識(shí)別率要低于其他兩種方法。圖2為ORL姿態(tài)庫(kù)和CMU 表情庫(kù)上三種方法識(shí)別時(shí)間對(duì)比的實(shí)驗(yàn)結(jié)果圖,從識(shí)別時(shí)間上來(lái)看,2DLDA方法需要的時(shí)間最長(zhǎng),當(dāng)有兩個(gè)以上的樣本參與訓(xùn)練時(shí),時(shí)間為20S以上。而2DPCA和2DICA識(shí)別時(shí)間低于10S。2DPCA方法的識(shí)別時(shí)間隨著訓(xùn)練樣本數(shù)的增加變化的不明顯。
圖1 不同訓(xùn)練樣本數(shù)的識(shí)別率
圖2 不同訓(xùn)練樣本數(shù)的識(shí)別時(shí)間
出現(xiàn)這種結(jié)果的原因在于PCA是將高維圖像投影到由所有樣本協(xié)方差矩陣的特征向量組成的子空間上,達(dá)到了很好的去相關(guān)和降維的效果,能對(duì)原圖像進(jìn)行很好的表示卻不具有很好的分類能力,僅僅抓住了人臉的描述特征,經(jīng)過(guò)K--L變換分解后只考慮了圖像的二階統(tǒng)計(jì)信息而忽略了高階統(tǒng)計(jì)信息。獨(dú)立成分分析不僅涉及到變量間的二階相關(guān)性還涉及到變量間的高階相關(guān)性,因此獨(dú)立成分分析可視為主成分分析方法的一種推廣,而圖像的高階統(tǒng)計(jì)信息在分類識(shí)別的過(guò)程中也是尤為重要的,因此其識(shí)別率要高于主成分分析方法的識(shí)別率。線性判別分析方法抓住的是人臉的判別特征,是以分類為目的的有監(jiān)督算法,比起主成分分析和獨(dú)立判別分析這兩種無(wú)監(jiān)督方法,自然會(huì)有很好地分類效果。但同時(shí)線性判別分析在求解特征空間的時(shí)候利用了類間散度矩陣的逆矩陣,故而在提取特征的時(shí)候時(shí)間復(fù)雜度要大于其他二種方法。
4 結(jié)論
論文研究了人臉識(shí)別中線性子空間分析方法的經(jīng)典算法2DPCA、2DLDA、2DICA,分析了他們的原理以及各自的優(yōu)缺點(diǎn),通過(guò)在ORL和CMU人臉庫(kù)上的實(shí)驗(yàn)結(jié)果表明:
1)2DLDA的識(shí)別效果要優(yōu)于2DPCA和2DICA,但識(shí)別時(shí)間也是最長(zhǎng)的,另外2DLDA存在小樣本問(wèn)題。2) ICA 基向量比PCA基向量在空間上更局部化,而局部特征對(duì)人臉表示很重要,因而2DICA 識(shí)別精度比2DPCA要高。
參考文獻(xiàn)
[1]A. F. Abate, M. Nappi. 2D and 3D face recognition: A survey. Pattern Recognition Letters. 2007, 28(14):1885-1906.
[2]F. Dai, N. Kushida, L. Shang. A survey of genetic algorithm-based face recognition. Artificial Life and Robotics, 2011, 16(2):271-274.
[3]P.Jonathon Phillips et.al.FRVT2006 and ICE 2006 large-scale results.Technical Report NISTIR7408,National Institute of Standards and Technology,2007.
[4]M.A.Turkand A.P.Pentland.Eigenfaces for Recognition. Cogn. Neurosci, 1991, 3(1), :71-86.
[5]Bellhumeur P N, Hespanha J P, Kriegman D J. Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection. IEEE Trans on Pattern Analysis and Machine Intelligence, 1997, 19(7), pp: 711-720.
[6]Bartlett M S. Independent component representations for face recognition[M]//Face Image Analysis by Unsupervised Learning. Springer US, 2001: 39-67.
[7]李樂(lè), 章毓晉. 非負(fù)矩陣分解算法綜述[J]. 電子學(xué)報(bào), 2008, 36(4).
[8]Liu N,Wang H.Feature extraction using evolutionary weighted principal component analysis,IEEE International Conference on Systems,Man and Cybernetics,2005:346-350.
[9]Q. Gao, L. Zhang, D. Zhang. Face recognition using FLDA with single raining image per person. Applied Mathematics and Computation, 2008, 205(2):726-734.
[10]Z. Sun, C. Sun. Feature extraction using 2DIFDA with fuzzy membership. Soft Computing, 2012, 16(10):1783-1793.
[11]Yang J, Zhang D, Frangi A F, et al. 2004. Two-dimensional PCA: a new approach to appearance-based face representation and recognition[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 26(1): 131-137.
[12]Kirby M, Sirovich L. 1990. Application of the Karhunen-Loeve procedure for the characterization of human faces[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 12(1): 103-108.
[13]Li M, Yuan B. 2005. 2D-LDA: A statistical linear discriminant analysis for image matrix[J]. Pattern Recognition Letters, 26(5): 527-532.
[14]GAN J, LI C. 2DICA based on wavelet transformation and applications in face recognition[J]. Journal of System Simulation, 2007, 3: 036.