馮海亮,王應(yīng)健,羅甫林
?
基于稀疏相似保持算法的人臉識(shí)別
馮海亮,王應(yīng)健,羅甫林
( 重慶大學(xué) 光電技術(shù)及系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室,重慶 400044 )
鑒于人為選取近鄰大小和權(quán)重矩陣對(duì)局部保持投影(LPP)算法的高維人臉圖像特征提取有較大影響,結(jié)合稀疏表示原理提出了一種稀疏相似保持(SSP)算法。SSP算法利用稀疏表示,在全局結(jié)構(gòu)中自適應(yīng)地選取數(shù)據(jù)間的相似關(guān)系,構(gòu)建非負(fù)稀疏關(guān)系圖,在低維空間中保持高維原始數(shù)據(jù)的內(nèi)在稀疏特性不變,能有效地提取出低維鑒別特征。在Extend Yale B、CMU PIE人臉數(shù)據(jù)庫上進(jìn)行實(shí)驗(yàn),其識(shí)別率分別達(dá)到了87.35%、90.09%,驗(yàn)證了算法的有效性。
人臉識(shí)別;局部保持投影;稀疏圖;稀疏相似保持
0 引 言
人臉識(shí)別是模式識(shí)別領(lǐng)域的一個(gè)重要研究項(xiàng)目,在人工智能、公共安全等領(lǐng)域具有巨大的應(yīng)用前景。由于人臉圖像是典型的高維數(shù)據(jù),為避免“維數(shù)災(zāi)難”,人們提出了各種各樣的維數(shù)約簡方法。傳統(tǒng)的降維方法,如主成分分析(Principal Component Analysis,PCA)[1]、線性判別分析(Linear Discriminant Analysis,LDA)[2]是全局線性降維方法,而研究表明,人臉空間更可能存在于非線性流形子空間中。為此,研究人員提出了一系列基于流形的子空間學(xué)習(xí)方法,如等距映射(Isometric Mapping,ISOMAP)[3]、局部保持嵌入(Locally Linear Embedding,LLE)[4]和拉普拉斯特征映射(Laplacian Eigenmaps,LE)[5]。該類方法的主要思想是假設(shè)每個(gè)樣本數(shù)據(jù)點(diǎn)和其鄰域點(diǎn)位于一個(gè)線性或近似線性的流形上,采用非線性映射方式,在低維嵌入空間中保持?jǐn)?shù)據(jù)間的內(nèi)在結(jié)構(gòu)關(guān)系不變。通過流形學(xué)習(xí)方法學(xué)習(xí)樣本數(shù)據(jù)就能有效地揭示數(shù)據(jù)中的內(nèi)在屬性,進(jìn)而得到隱含鑒別特征。但是這些方法只在所學(xué)習(xí)的樣本中有定義,對(duì)外來的新樣本無法直接進(jìn)行投影,使其泛化能力受到限制。為此,He等人提出LE和LLE的線性近似方法,分別為局部保持投影(locality Preserving Projection,LPP)[6]和鄰域保持嵌入(Neighborhood Preserving Embedding,NPE)[7]。其中LPP通過投影矩陣把LE中隱含的非線性映射轉(zhuǎn)換為線性映射,因而能夠直接通過投影矩陣得到新樣本數(shù)據(jù)點(diǎn)在嵌入空間中的映射。雖然LPP本質(zhì)上為線性方法,但同傳統(tǒng)的主成分分析(PCA)、線性判別分析(LDA)等方法相比,LPP算法能夠在嵌入空間中保持?jǐn)?shù)據(jù)原始空間的局部幾何結(jié)構(gòu),進(jìn)而揭示出高維空間中的內(nèi)在低維流形結(jié)構(gòu)。在LPP 算法中需要通過歐氏距離選取近鄰,但是歐氏距離受數(shù)據(jù)噪聲影響較大,且人為設(shè)置的近鄰大小不能自適應(yīng)地反映局部結(jié)構(gòu)特性,導(dǎo)致所提取的特征鑒別力不足[8]。
作為近年來新興的一種數(shù)據(jù)表示方法,稀疏表示以其良好的魯棒性、抗干擾能力、可解釋性和判別性等優(yōu)勢(shì),在人臉識(shí)別領(lǐng)域引起了廣泛關(guān)注。Qiao[9]等提出了稀疏保持投影(Sparsity Preserving Projection,SPP) 的人臉識(shí)別算法,較好的反映了人臉圖像全局非幾何結(jié)構(gòu),然而SPP算法沒能得到子空間的正交向量基,這使其真實(shí)表征數(shù)據(jù)變得困難;Liu[10]等提出了一種稀疏保持嵌入(Sparsity Preserving Embedding with Manifold Learning and Discriminant Analysis,SPE)算法,以鑒別分析和流形學(xué)習(xí)為基礎(chǔ),利用稀疏表示理論,在低維嵌入空間中保持?jǐn)?shù)據(jù)在高維空間中的稀疏特性不變,即通過非負(fù)稀疏表示揭示出各類型數(shù)據(jù)在高維空間中的內(nèi)在特性。然而,包括 SPP 和SPE 在內(nèi)的基于稀疏表示的人臉識(shí)別方法,在對(duì)原始樣本進(jìn)行稀疏重構(gòu)時(shí)都沒有很好的利用樣本之間的局部結(jié)構(gòu)信息,極易造成誤學(xué)習(xí)。
結(jié)合LPP和稀疏表示各自的優(yōu)點(diǎn),本文提出了一種稀疏相似保持(Sparse Similarity Preserving,SSP)算法。SSP算法根據(jù)稀疏表示揭示出高維數(shù)據(jù)在全局結(jié)構(gòu)中的相似關(guān)系,并通過非負(fù)稀疏系數(shù)大小來反映相似性程度,構(gòu)造非負(fù)稀疏關(guān)系圖,在低維嵌入空間中保持?jǐn)?shù)據(jù)在高維空間中的稀疏特性不變,受局部結(jié)構(gòu)關(guān)系的影響小,能有效地提取出低維鑒別特征。SSP算法根據(jù)稀疏表示原理自動(dòng)地選取數(shù)據(jù)間的相似關(guān)系,減小了近鄰設(shè)置和選取方式帶來的影響。選取Extend Yale B人臉數(shù)據(jù)庫和CMU PIE人臉數(shù)據(jù)庫進(jìn)行識(shí)別率實(shí)驗(yàn)和算法的有效性驗(yàn)證。
1 相關(guān)原理分析
1.1 局部保持投影算法(LLP)
局部保持投影算法(LLP)是通過數(shù)據(jù)集構(gòu)建反映數(shù)據(jù)流形結(jié)構(gòu)的無向權(quán)重圖矩陣={,},其中為圖中的頂點(diǎn),表示各頂點(diǎn)對(duì)應(yīng)邊的權(quán)值矩陣。LLP的特點(diǎn)是用一個(gè)保持頂點(diǎn)間相似關(guān)系不變的低維向量來表征圖的每個(gè)頂點(diǎn),用邊的權(quán)值衡量頂點(diǎn)間的相似性。
LPP算法的主要步驟為
1) 構(gòu)造近鄰關(guān)系圖。采用近鄰法得到近鄰,若x與x為近鄰,則在近鄰關(guān)系矩陣中有邊連接;否則無邊連接。
3) 計(jì)算投影矩陣。投影矩陣可以通過求解如下目標(biāo)函數(shù)最小化問題得到:
1.2 稀疏表示
近年來,信號(hào)的稀疏表示在模式識(shí)別等相關(guān)領(lǐng)域已引起研究人員極大的興趣。稀疏表示的主要思想是利用字典,將信號(hào)表示成少數(shù)原子的線性組合,以一種簡潔、稀疏的形式反映信號(hào)的主要特征和內(nèi)在結(jié)構(gòu)。
過完備字典是指樣本維數(shù)小于樣本個(gè)數(shù)(即>)。稀疏表示是對(duì)通過中的少數(shù)幾個(gè)能夠反映內(nèi)在特征的元素來近似表示,它是一個(gè)全局性的算法。其求解模型為
2 稀疏相似保持算法
由稀疏表示理論可知,稀疏表示能夠較好的揭示各數(shù)據(jù)在全局結(jié)構(gòu)的內(nèi)在特性,具有自然鑒別能力和自動(dòng)選擇近鄰功能。由LLP算法理論可知,LLP能夠在低維空間很好的保持高維空間中原始數(shù)據(jù)頂點(diǎn)間相似關(guān)系不變,具有良好的維數(shù)約簡效果,但是人為選取近鄰大小和權(quán)重矩陣對(duì)LLP的結(jié)果有較大影響。針對(duì)這種情況,本文提出了一種稀疏相似保持(Sparse Similarity Preserving, SSP)算法。SSP算法在全局結(jié)構(gòu)中自適應(yīng)地選取數(shù)據(jù)間的相似關(guān)系,構(gòu)造非負(fù)稀疏關(guān)系圖,能夠在低維空間中保持高維空間中原始數(shù)據(jù)的稀疏特性不變。因此,它在構(gòu)建無向權(quán)重圖時(shí)不需要任何模型參數(shù),并且保留了數(shù)據(jù)的稀疏結(jié)構(gòu)關(guān)系。
SSP算法首先使用稀疏表示計(jì)算圖的相似矩陣。式(3)是一個(gè)NP-hard問題,可以把求解范數(shù)最小化問題轉(zhuǎn)換為求解范數(shù)最小化問題。為得到非負(fù)稀疏系數(shù),增加約束條件。因此,我們采用非負(fù)稀疏表示得到非負(fù)稀疏系數(shù)矩陣。其稀疏求解函數(shù)變?yōu)?/p>
然后根據(jù)非負(fù)稀疏系數(shù)矩陣構(gòu)建無向圖,在圖中,如果兩頂點(diǎn)與之間的非負(fù)稀疏系數(shù)為非零,就在這兩個(gè)頂點(diǎn)間設(shè)置一條邊,相應(yīng)的權(quán)值設(shè)為該兩點(diǎn)間的非負(fù)系數(shù),即;如果兩頂點(diǎn)與之間非負(fù)稀疏系數(shù)為零,該兩個(gè)頂點(diǎn)之間不設(shè)置邊,相應(yīng)的權(quán)值為0,即。為在低維嵌入空間保持稀疏特性,目標(biāo)函數(shù)設(shè)置如下
其中:tr(×)表示矩陣的跡,為對(duì)角矩陣,且;為拉普拉斯矩陣,且;為權(quán)值矩陣,即。為得穩(wěn)定解,使降維數(shù)據(jù)對(duì)矩陣單位化,增加約束:
則目標(biāo)函數(shù)可被轉(zhuǎn)換成如下最小化問題:
對(duì)式(7)用Lagrange乘子法可得:
通過對(duì)式(8)求取廣義特征值特征向量,取出個(gè)最小的特征值及其對(duì)應(yīng)的特征向量,令,則降維數(shù)據(jù)為。
3 實(shí)驗(yàn)結(jié)果與分析
為驗(yàn)證算法的有效性,本文分別選取Extend Yale B人臉數(shù)據(jù)庫和CMU PIE人臉數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)中,將所有的人臉圖像基于眼部對(duì)齊裁剪為32 pixels×32 pixels大小,并將人臉圖像歸一化處理。實(shí)驗(yàn)選取最近鄰分類器(Nearest Neighbor, NN)估算識(shí)別率。為研究算法的特征提取效果,對(duì)PCA、NPE、LPP、SPP、MFA(Marginal Fisher Analysis)[11]、DLSP(Discriminative Learning by Sparse Representation Projections)[12]、SSP進(jìn)行了不同訓(xùn)練樣本下總體識(shí)別率隨嵌入維數(shù)變化的對(duì)比實(shí)驗(yàn)。所有訓(xùn)練圖片均采用隨機(jī)抽取的方法獲得,并重復(fù)進(jìn)行10組實(shí)驗(yàn),最后取10次實(shí)驗(yàn)結(jié)果的均值作為最終結(jié)果進(jìn)行分析。
3.1 Extend Yale B人臉數(shù)據(jù)庫實(shí)驗(yàn)
Extended Yale B人臉庫包含有38個(gè)人,每人有約64張不同光照條件下的近似正面人臉圖像,共計(jì)2 414幅人臉圖像。圖1展示了Extended Yale B人臉庫部分人臉樣本圖像,體現(xiàn)出了明顯的光照、表情變化以及輕微的姿態(tài)變化。在實(shí)驗(yàn)中,從該庫中的38類樣本隨機(jī)選取每類中的個(gè)樣本組成訓(xùn)練集,剩余個(gè)樣本組成測(cè)試集。
圖1 Extended Yale B人臉庫中某一個(gè)人的部分人臉圖像
圖2 Extend Yale B人臉庫中各算法在不同訓(xùn)練樣本數(shù)不同維度下的總體識(shí)別率
表1 Extend Yale B人臉庫中各算法總體識(shí)別率的最高值及其方差(平均值±方差)
由圖2和表1可知,隨著訓(xùn)練樣本數(shù)的增加,各算法的總體識(shí)別率和最高總體識(shí)別率都呈現(xiàn)出增加趨勢(shì),這是因?yàn)橛?xùn)練樣本數(shù)越多,已知信息越豐富,在特征提取時(shí),可利用的信息就越充足,使各算法的總體識(shí)別精度也就越高。顯然,SSP算法比PCA、NPE、LPP、SPP、MFA、DLSP的總體識(shí)別率和最高總體識(shí)別率都好,這是因?yàn)镾SP算法通過稀疏表示能夠很好地從全局結(jié)構(gòu)中揭示出數(shù)據(jù)間的相似關(guān)系,減小了局部幾何結(jié)構(gòu)帶來的影響,且不受近鄰選取和選取方式的影響,并能較好地體現(xiàn)出各類型數(shù)據(jù)在全局結(jié)構(gòu)中的相似關(guān)系,降維后保持相似關(guān)系不變,使提取出的鑒別特征更有效,總體識(shí)別精度更好。
3.2 CMU PIE人臉數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)
PIE人臉庫含有68個(gè)人,每個(gè)人13種姿態(tài),43種光照條件,4種表情,共41 368張圖片。本文選擇在所有光照條件和表情條件下的5個(gè)近似正向的姿態(tài)(C05,C07,C09,C27,C29),每個(gè)人170張,總共11 560張圖片。圖3展示了PIE人臉庫中某一個(gè)人的部分人臉圖像,體現(xiàn)出了明顯的光照、表情變化以及輕微的姿態(tài)變化。
圖3 PIE人臉庫中某一個(gè)人的部分人臉圖像
在實(shí)驗(yàn)中,從該庫中的68類樣本隨機(jī)選取每類中的個(gè)樣本組成訓(xùn)練集,剩余個(gè)樣本組成測(cè)試集。圖4給出了各種算法總體識(shí)別率隨訓(xùn)練樣本數(shù)和維數(shù)變化的結(jié)果,表2給出了在不同訓(xùn)練樣本下不同算法總體識(shí)別率的最高值及其方差。由圖4和表2可知,本文提出的SSP算法的識(shí)別率是最好的,SSP算法在全局結(jié)構(gòu)中自適應(yīng)地選取數(shù)據(jù)間的相似關(guān)系,構(gòu)造非負(fù)稀疏關(guān)系圖,能夠在低維空間中保持高維空間中原始數(shù)據(jù)的稀疏特性不變,增強(qiáng)了算法的識(shí)別性能,因此能夠獲得最好的識(shí)別性能。
圖4 CMU PIE人臉庫中各算法在不同訓(xùn)練樣本數(shù)不同維度下的總體識(shí)別率
表2 CMU PIE人臉庫中各算法總體識(shí)別率的最高值及其方差(平均值±方差)
4 結(jié) 論
本文基于稀疏表示和LLP提出了稀疏相似嵌入算法(SSP),對(duì)人臉圖像進(jìn)行特征提取。同其它流形學(xué)習(xí)算法(如LPP、NPE等)相比,SSP算法通過稀疏表示能較好地揭示出各數(shù)據(jù)點(diǎn)在全局結(jié)構(gòu)中的相似性,可自適應(yīng)地選取數(shù)據(jù)間的近鄰關(guān)系,受局部幾何結(jié)構(gòu)影響較小,并在低維嵌入空間中保持這種相似性不變,能更有效地提取出低維鑒別特征。在Extend Yale B人臉數(shù)據(jù)庫和CMU PIE人臉數(shù)據(jù)庫上進(jìn)行識(shí)別率實(shí)驗(yàn),結(jié)果表明本文方法比PCA、NPE、LPP、SPP、MFA、DLSP特征提取的效果都好,驗(yàn)證了SSP算法有效性。
[1] KIM K I,JUNG K,HANG J K. Face Recognition Using Kernel Principal Component Analysis [J]. IEEE Signal Processing Letters(S1070-9908),2002,9(2):40-42.
[2] LU J,PLATANIOTIS K N,VENETSANOPOULOS A N. Regularization Studies of Linear Discriminant Analysis in Small Sample Size Scenarios with Application to Face Recognition [J]. Pattern Recognition Letters(S0167-8655),2005,26(2):181-191.
[3] TENENBAUM J B,SILVA D V,LANGFORD J C. A Global Geometric Framework for Nonlinear Dimensionality Reduction [J]. Science(S0036-8075),2000,290(5500):2319-2323.
[4] ROWEIS S T,SAUL L K. Nonlinear Dimensionality Reduction by Locally Linear Embedding [J]. Science(S0036-8075),2000,290(5500):2323-2326.
[5] BELKIN M,NIYOGI P. Laplacian Eigenmaps for Dimensionality Reduction and Data Representation [J]. Neural computation (S0899-7667),2003,15(6):1373-1396.
[6] DORNAIKA F,ASSOUM A. Enhanced and Parameterless Locality Preserving Projections for Face Recognition [J]. Neurocomputing(S0925-2312),2013,99(1):448–457.
[7] GUI Jie,SUN Zhenan,JIA Wei,. Discriminant Sparse Neighborhood Preserving Embedding for Face Recognition [J]. Pattern Recognition(S0031-3203),2012,45(8):2884–2893.
[8] NGUYEN T,KHOSRAVI A,CREIGHTON D,. Spike Sorting using Locality Preserving Projection with Gap Statistics and Landmark-based Spectral Clustering [J]. Journal of Neuroscience Methods(S0165-0270),2014,238:43–53.
[9] QIAO Lishan,CHEN Songcan,TAN Xiaoyang. Sparsity Preserving Projections with Applications to Face Recognition [J]. Pattern Recognition(S0031-3203),2010,43(1):331–341.
[10] LIU Qian,LAN Chao,JING Xiaoyuan,. Sparsity Preserving Embedding with Manifold Learning and Discriminant Analysis [J]. IEICE Transactions on Information & Systems(S0916-8532),2012,95-d(1):271-274.
[11] ZHAO Cairong,LAI Zhihui,MIAO Duoqian,. Graph Embedding Discriminant Analysis for Face Recognition [J]. Neural Computing & Applications(S0941-0643),2014,24(78):1697-1706.
[12] ZHANG Fei,ZHANG Jiangshe. Discriminative Learning by Sparse Representation for Classification [J]. Neurocomputing (S0925-2312),2011,74(12/13):2176–2183.
Face Recognition Based on Sparse Similarity Preserving Algorithm
FENG Hailiang,WAGN Yingjian,LUO Fulin
( Key Laboratory on Opto-Electronic Technique and Systems of Ministry of Education, Chongqing University, Chongqing 400044, China )
The Locality Preserving Projection (LPP) algorithms have been extensively applied for feature extraction of high dimensional face images, but selecting the neighborhood size and defining the affinity weight have a significant impact on the efficiency of LPP algorithms. In this paper, a new sparse manifold learning method was proposed, called Sparse Similarity Preserving (SSP), for dimensionality reduction of face images. It adaptively selected the similarity relation in the global structure of the data and constructed non-negative sparse graph using the sparse coefficients which reserved the global sparsity and non-linear manifold structure of face images, effectively extracting the low dimensional discriminant features. Experiments on two popular face databases (Extended Yale B, and CMU PIE), whose recognition rate reached 87.35% and 90.09%, demonstrated the effectiveness of the presented SSP algorithm.
face recognition; locality preserving projection; sparse graph; sparse similarity preserving
1003-501X(2016)06-0019-06
TP391
A
10.3969/j.issn.1003-501X.2016.06.004
2015-07-08;
2015-12-16
國家自然科學(xué)基金(61101168);中國博士后科學(xué)基金(2012M511906,2013T60837)
馮海亮(1962-),男(漢族),陜西涇陽人。教授,博士,主要研究方向?yàn)樾畔@取與處理領(lǐng)域流形學(xué)習(xí)算法、模式識(shí)別算法的理論及其應(yīng)用研究。
王應(yīng)健(1989-),男(漢族),河南商城人。碩士研究生,主要從事數(shù)字圖像處理,模式識(shí)別。E-mail:fhliang@cqu.edu.cn。