雷明軍,彭進業(yè),馮曉毅
(西北工業(yè)大學(xué) 電子信息學(xué)院,陜西 西安 710129)
改進SRC算法在人臉識別中的應(yīng)用
雷明軍,彭進業(yè),馮曉毅
(西北工業(yè)大學(xué) 電子信息學(xué)院,陜西 西安 710129)
稀疏表示分類算法(Sparse Representation-based Classification,SRC)在人臉數(shù)據(jù)庫上有很高的識別性能。然而,對于姿態(tài)變化,SRC的識別效果并不理想。針對SRC算法不能解決測試樣本與訓(xùn)練樣本存在偏移誤差的問題,本文提出了基于SRC的改進算法。該算法將每一類的訓(xùn)練樣本單獨作為訓(xùn)練字典,利用迭代校正和基于金字塔分層機構(gòu)的運動偏移估計方法得到最終的偏移量,最后對校正后的測試樣本使用SRC算法實現(xiàn)分類。實驗結(jié)果表明該方法對于有偏移誤差的人臉圖像具有較好的魯棒性及識別率。
SRC;人臉識別;迭代校正;運動偏移估計
基于圖像的人臉識別技術(shù)是近年來計算機視覺領(lǐng)域研究熱點之一,人臉識別技術(shù)利用從人臉圖像中提取出有效特征信息,與數(shù)據(jù)庫中的已知人臉信息進行匹配,計算出待測試人臉的特征與數(shù)據(jù)庫中哪一類人臉最相近,從而鑒別個人身份?,F(xiàn)有多數(shù)人臉識別算法主要基于統(tǒng)計學(xué)習(xí)理論,利用大量訓(xùn)練樣本來學(xué)習(xí)人臉分類器,根據(jù)得到的分類器模型進行人臉識別。
稀疏表示人臉識別算法(簡稱“SRC方法”)是近年來新出現(xiàn)的一個比較有效的人臉識別算法[1]。它假設(shè)任一張人臉圖像都可以用同一個人訓(xùn)練樣本的線性組合來表示,通過尋找測試樣本相對于整個訓(xùn)練集的稀疏表示系數(shù)來發(fā)現(xiàn)測試圖像所屬的用戶身份。借助于先進的高維凸優(yōu)化技術(shù)(如L1范數(shù)最小化[2]),稀疏表示系數(shù)可以被精確穩(wěn)定地恢復(fù)出來,解的精度和魯棒性都有理論上的保證。與現(xiàn)有多數(shù)方法相比,SRC方法直接利用了高維數(shù)據(jù)分布的基本特性(即“稀疏性”)進行統(tǒng)計推斷,可以有效地應(yīng)對維數(shù)災(zāi)難問題。同時,SRC方法直接利用原始像素進行人臉識別,可以有效地避免各種預(yù)處理過程。通過選擇合適的訓(xùn)練圖像(不同光照和表情)并利用稀疏信號對損毀像素建模,SRC方法可以有效地應(yīng)對光照變化、表情變化、局部遮擋等問題,具有良好的魯棒性。但是,現(xiàn)有SRC方法要求測試圖像和訓(xùn)練圖像嚴(yán)格對齊,姿態(tài)變化會引起人臉圖像產(chǎn)生對齊誤差,降低SRC方法的識別性能。姿態(tài)問題已經(jīng)成為SRC方法走向?qū)嵱帽仨毥鉀Q的一個主要問題。
第 i類訓(xùn)練樣本按列排列表示成矩陣 Ai,Ai=[vi,1,vi,2,…,vi,ni]∈Rm×ni。 其中 vi,j表示第 i類目標(biāo)的第 j個樣本,對于一幅w×h 的灰度圖像 vi,j∈Rm(m=wh)。 根據(jù)線性子空間原理,如果第i類樣本足夠多,那么第i類測試樣本y可以寫成:
A表示k類目標(biāo)的所有訓(xùn)練樣本所組成的矩陣。將測試樣本y擴展到用所有訓(xùn)練樣本進行線性表示,則表示式如下:
其中,x0=[0,…,0,αi,1,αi,2,…,αi,ni,0,…,0]T是系數(shù)向量,x0中只有和y同一類的訓(xùn)練樣本所對應(yīng)的系數(shù)是非零值,而其他系數(shù)均為零值。當(dāng)訓(xùn)練集的樣本總數(shù)遠大于第i類訓(xùn)練樣本的個數(shù),則是稀疏的。由于y=Ax通常是欠定系統(tǒng),因此,方程y=Ax的解是不唯一的,由于要求所求的x是稀疏的,由壓縮感知原理可知,問題可以轉(zhuǎn)換為求解lo范數(shù)最小化問題,模型如下:
其中,‖·‖0表示lo范數(shù),表示向量中非零元素的個數(shù)。然而此模型屬于非凸優(yōu)化模型,求解是一個NP問題,近年來在稀疏表示和壓縮感知領(lǐng)域的研究表明,如果x足夠稀疏,那么lo范數(shù)最優(yōu)化問題等效于下面的l1范數(shù)最小化問題:
如果測試樣本包含輕微污損(含噪聲或局部遮擋),可以通過求解x和e的最小范數(shù)問題,實現(xiàn)正確的分類,該算法的模型為下式:
在測試圖像與訓(xùn)練圖像沒有對齊的情況下,測試樣本不能用訓(xùn)練樣本稀疏表示。但是,可以對測試樣本先校正,再對校正后的測試樣本求解稀疏表示。算法模型如式(1):
其中,y是原始圖像,τ是仿射變換參數(shù),T(·)是仿射變換算子。T(y,τ)表示測試樣本y經(jīng)過仿射變換與訓(xùn)練樣本對齊后的圖像。當(dāng)τ未知時,要同時最優(yōu)化x、e和τ是一個非凸的最優(yōu)化問題。如果用戶自己設(shè)定的初始值τ求解問題(1),測試圖像y可能會與非同類的訓(xùn)練樣本形成校正的趨勢,從而陷入局部最小值,最終得到的x和e不是全局最優(yōu)的。為了避免陷入局部最小值,本算法將每一類用戶的訓(xùn)練圖像單獨用作訓(xùn)練字典,算法模型變?yōu)槭剑?):
其中k表示訓(xùn)練圖像中的種類。在模型(2)中,由于只使用一類用戶的圖像作為訓(xùn)練樣本,所以只需使e最稀疏化,而不必使x稀疏化。
假設(shè)測試樣本與訓(xùn)練樣本只存在微小的平移偏差,則可以通過一階泰勒展開式來近似校正后的測試圖像:
其中,Yx是圖像y水平方向的一階導(dǎo)數(shù),Yy表示圖像y豎直方向的一階導(dǎo)數(shù)。所以對于只有較小偏移的測試樣本可以將模型(3)改寫成(4)。偏移量較大時,可以不斷迭代將上述過程,同時更新校正后的測試樣本,每次迭代都能得到相對偏移量Δτ,直到Δτ收斂停止迭代。再將每次得到的相對偏移量累加,最終得到原始的測試樣本相對于同類訓(xùn)練樣本偏移量。
將模型(4)寫成如下形式:
其中,
因此問題(5)轉(zhuǎn)成經(jīng)典的范數(shù)最小化問題:
由于圖像的維度很大,計算復(fù)雜度很高。因此,對式(6)等號左右兩邊同時乘以隨機投影矩陣R,以降低維度。因此問題(6)轉(zhuǎn)換為:
求出測試樣本相對于不同的訓(xùn)練樣本的仿射變換參數(shù)τi后,利用式(9)求解原始測試樣本相對于校正后的不同類型的訓(xùn)練樣本的誤差e。當(dāng)訓(xùn)練樣本矩陣Ai與測試樣本同類時,測試樣本y可以用同類校正后的訓(xùn)練樣本線性表示,則e主要是噪聲所引起的誤差,所以e的模值最小。但是,當(dāng)訓(xùn)練樣本矩陣Ai與測試樣本不同類時,測試樣本不會與非同類的經(jīng)仿射變換后的訓(xùn)練樣本對齊,測試樣本不能用這樣的訓(xùn)練樣本線性表示,e不僅包含噪聲,還包含由于未對齊所導(dǎo)致的誤差,所以e的模值較大。因此可以通過比較不同類的訓(xùn)練樣本矩陣Ai所對應(yīng)的e的模值的大小來對測試樣本進行分類,如式(10)。
總結(jié)文中改進算法步驟如表1所示。
實驗選擇目前常用的Extended Yale B人臉數(shù)據(jù)庫作為實驗數(shù)據(jù)集。然后將本文提出的改進方法與SRC方法,文獻[3]的算法在該數(shù)據(jù)庫下進行比較。本實驗是在MATLAB R2007b平臺下完成,PC機配置為2.0 GHz,1 G內(nèi)存。
本實驗隨機選取了10個人的人臉圖像作為實驗數(shù)據(jù),并且對每類人臉隨機選取30幅圖像作為訓(xùn)練樣本,再在剩余的圖像中隨機選取15幅圖像作為測試樣本,并采用雙線性插值法將所選的樣本圖像都?xì)w一化至9684(單位:像素)的尺寸。因此,本實驗中一共有300幅訓(xùn)練圖像和150幅測試圖像。
為了公平比較,將本文的算法、SRC算法和文獻[3]的算法都采用隨機臉特征,用隨機矩陣將人臉圖像投影至150維(d=150)的低維特征空間。對于特征臉識別方法也將人臉圖
表1 改進的SRC算法步驟Tab.1 Improved SRC algorithm steps
像降維到150維的特征臉空間。
實驗結(jié)果如表2所示,為了使比較更加直觀,采用折線圖2展現(xiàn)出來。
表2 識別結(jié)果比較Tab.2 Comparison of recognition results
圖1 識別結(jié)果圖Fig.1 Recognition results map
從圖1實驗結(jié)果可以看出,在測試樣本和訓(xùn)練樣本對齊的情況下(偏移值等于零),SRC的識別率最高,但是隨著偏移誤量的增大,識別率急劇下降。說明了SRC對圖像平移十分敏感,魯棒性差。本文方法與文獻[3]的方法,明顯優(yōu)于SRC方法,識別率和魯棒性得到明顯的改善。但是,本文提出的方法的識別率比起文獻[3]的方法又略高一籌。
針對SRC算法的不能解決測試樣本與訓(xùn)練樣本存在偏移誤差的問題,提出了基于SRC的改進算法。該算法利用迭代校正的方法得到每一次校正的偏移量,直到迭代停止,將每次的偏移結(jié)果累加就是最終的偏移量。估計當(dāng)前測試樣本與校正樣本的偏移量的過程中,使用了基于金字塔分層機構(gòu)的運動偏移估計方法。為了避免求出的稀疏解偏向于非同類的訓(xùn)練樣本,而收斂到局部最小值的情況,這里只將每一類的訓(xùn)練樣本單獨作為訓(xùn)練字典。最后對校正后的測試樣本使用SRC算法實現(xiàn)分類。實驗結(jié)果表明該方法對于有偏移誤差的圖像具有較好的魯棒性,識別性能良好。
[1]周激流,張曄.人臉識別理論研究進展[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,1999,11(2):180-184.
ZHOU Ji-liu,ZHANG Ye.Face recognition theory research progress[J].Computer Aided Design and Computer Graphics,1999,11(2):180-184.
[2]Hong Z Q.Algebraic feature extraction of image for recognition[J].Pattern Recognition,1991,24(3):211-219.
[3]HuangJ,HuangX,MetaxasD.Simultaneousimagetransformation and sparse represen-tation recovery[J].In CVPR,2008.
[4]Lades M,Vorbuggen J,Buhumann J C,et al.Distortion invariant object recognition in the dynamic link architecture[J].IEEE Transactions on Computers,1993,42(3):300-311.
[5]Samaria F.Face recognition using hidden markov models[M].Ph.Dthesis, University of Cambridge,1994.
[6]Yuile A L.Deformable templates for face recognition[J].Journal of Cognitive Neuroscience,1991,3(1):59-70.
[7]Liu C J,Wechsler H.Comparative assessment of independent component analysis(ICA) for face recognition[C]//Int.Conf.on Audio and Video Based Biometric Person Authentication,1999.
[8]Moghaddam B.Principal manifolds and Bayesian subspaces for visual recognition[C]//Tech Report 99~35,A Mistsubish Electric Research Lab,1999.
[9]Wright,Yang A,Ganesh A,et al.Robust face recognition via sparse representation [C]//IEEE Transactions on Pattern Analysis and Machine Intelligence,2007.
[10]Wagner A,Wright J,Ganesh A,et al.Towards a practical face recognition system:Robust registration and illumination via sparse representation [C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Miami, USA:IEEE Computer Society,2009:597-604.
[11]Bergen J,Anandan P,Hanna K,et al. Hingorani.Hierarchical model-based motion estimation[J].In Proceedings of ECCV,1992:237-252.
Application of a kind of improved SRC algorithm in face recognition
LEI Ming-jun, PENG Jin-ye, FENG Xiao-yi
(Dept.of Electronics and Information, Northwestern Polytechnical University, Xi’an 710129, China)
Sparse representation of classification algorithm has high identification performance on the face database.However,because of the attitude changes,SRC recognition effect is not ideal.Because the SRC algorithm can not solve the offset error problem between test samples and the training samples,this paper puts forward the improved algorithm based on SRC.The algorithm regards each type of training samples as training dictionary individually and get the final offset using the iterative correction and based on the Pyramid layered motion offset estimation method,finally using SRC algorithm classified the corrected test samples.The experimental results show that this method for face images with offset error performs better robustness and the identification rate.
SRC;face recognition;iterative correction;motion estimation
TP312
A
1674-6236(2013)04-0137-03
2012-10-07稿件編號201210015
國家自然科學(xué)基金資助(61075014)
雷明軍(1986—),男,湖南常德人,碩士。研究方向:圖像信息處理。