廖延娜,馬超
(1.西安郵電大學(xué)理學(xué)院,陜西西安710121;2.西安郵電大學(xué)電子工程學(xué)院,陜西西安710121)
基于稀疏表示的人臉識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
廖延娜1,馬超2
(1.西安郵電大學(xué)理學(xué)院,陜西西安710121;2.西安郵電大學(xué)電子工程學(xué)院,陜西西安710121)
針對(duì)人臉識(shí)別在實(shí)際應(yīng)用中存在光照異常、姿態(tài)變化、遮擋、樣本缺乏等情況,研究了結(jié)合主成分分析的稀疏表示人臉識(shí)別分類(lèi)算法,設(shè)計(jì)并實(shí)現(xiàn)了人臉識(shí)別系統(tǒng)。系統(tǒng)依據(jù)訓(xùn)練字典對(duì)實(shí)時(shí)采集的人臉圖像進(jìn)行識(shí)別,并支持訓(xùn)練字典的實(shí)時(shí)更新。測(cè)試結(jié)果表明,在訓(xùn)練樣本充分的情況下,系統(tǒng)對(duì)正面無(wú)表情人臉識(shí)別率在99%以上,滿足正常人臉識(shí)別的使用需求;在訓(xùn)練樣本不充分的情況下,識(shí)別率仍可以達(dá)到70%以上,可用于安防預(yù)警。
計(jì)算機(jī)圖像處理;人臉識(shí)別;稀疏表示;主成分分析
人臉識(shí)別技術(shù)(Face Recognition,F(xiàn)R)[1]涵蓋了生物技術(shù)和計(jì)算機(jī)技術(shù),涉及到計(jì)算機(jī)圖像處理、機(jī)器學(xué)習(xí)、模式識(shí)別、人體生理學(xué)和認(rèn)知科學(xué)等多個(gè)技術(shù)領(lǐng)域[2]。人臉識(shí)別算法已經(jīng)經(jīng)歷了長(zhǎng)時(shí)間的研究,在圖像背景簡(jiǎn)單、樣本充分的情形下,大部分算法都能夠?qū)ζ溥M(jìn)行高精度的識(shí)別。
在實(shí)際應(yīng)用中,由于環(huán)境因素的異同,能否應(yīng)對(duì)復(fù)雜情形下的人臉圖像,成為目前檢驗(yàn)各類(lèi)算法的難題?;趶椥詧D匹配法的人臉識(shí)別算法[3]以同類(lèi)人臉圖像相似的拓?fù)浣Y(jié)構(gòu)為依據(jù)進(jìn)行識(shí)別分類(lèi)。但其處理過(guò)程中計(jì)算量較大,識(shí)別效率較緩慢[4]?;?D模型的人臉識(shí)別算法[5]可以從單張人臉圖像還原模型參數(shù),并進(jìn)行匹配識(shí)別。但對(duì)圖像質(zhì)量要求較高,應(yīng)用范圍較狹窄?;谶z傳算法[6]的人臉識(shí)別算法可以高效地選取最優(yōu)判別系數(shù),但其對(duì)不同環(huán)境下的人臉特征提取差異較大[7]。因此,采用基于稀疏表示的分類(lèi)算法(Sparse Representation based Classifier,SRC)[8-9]構(gòu)建人臉識(shí)別系統(tǒng)。
1.1算法原理
SRC的基本思想為:假設(shè)識(shí)別系統(tǒng)有足夠多的樣本,其中每一類(lèi)的訓(xùn)練樣本可以通過(guò)其自身的線性組合來(lái)表示同類(lèi)的測(cè)試樣本。將所有的訓(xùn)練樣本組合在一起形成一個(gè)冗余字典,由于測(cè)試樣本只可以被同屬一類(lèi)的訓(xùn)練樣本表示,即只有與測(cè)試樣本同類(lèi)的訓(xùn)練樣本系數(shù)有值,其它類(lèi)訓(xùn)練樣本的表示系數(shù)為零,因此系數(shù)向量是稀疏的。根據(jù)壓縮感知理論[10],采用稀疏重構(gòu)算法對(duì)欠定方程進(jìn)行求解,得到測(cè)試樣本的稀疏表示系數(shù),從而進(jìn)行歸類(lèi)判別。
根據(jù)上述描述,可以將稀疏表示表達(dá)為y=Ax,其中,y是目標(biāo)信號(hào)樣本,A為訓(xùn)練樣本空間,x為系數(shù)向量。x中只有少數(shù)值為非0元素,即是稀疏的,所以求解x可以轉(zhuǎn)化為求x的l0范數(shù),即:
‖x‖0表示x的l0范數(shù),即x中非零元素的個(gè)數(shù)。求解l0范數(shù)是一個(gè)NP-hard問(wèn)題,它的解極不穩(wěn)定。在x是足夠稀疏的條件下,可以將方程(1)轉(zhuǎn)化為求解x的l1范數(shù)問(wèn)題,即:
一般情況下,圖像中有噪聲存在,故需要考慮誤差項(xiàng),即y=Ax+e。則方程(2)轉(zhuǎn)化為:
式(3)是一個(gè)凸優(yōu)化問(wèn)題,由于噪聲等因素影響,x的非零元素會(huì)散布于多類(lèi)間,使用系數(shù)重構(gòu)誤差的方法進(jìn)行判斷分類(lèi):
其中di是i與第類(lèi)相關(guān)的系數(shù)。利用式(4)得到的最小誤差,可以確定樣本所屬類(lèi)別。
在求解y=Ax的過(guò)程中,需要對(duì)圖像矩陣A進(jìn)行降維處理,采用主成分分析法實(shí)現(xiàn)降維。主成分分析(Principal Component Analysis,PCA)[11-12]是將一個(gè)高維向量通過(guò)一個(gè)特征向量矩陣U,投影到一個(gè)低維的向量空間,雖然產(chǎn)生了數(shù)據(jù)的損失,但保留了決定性的主要信息。在人臉識(shí)別算法中,假設(shè)有N個(gè)訓(xùn)練樣本,每個(gè)樣本中所有的像素灰度值列為一個(gè)向量ai,從而構(gòu)成訓(xùn)練樣本集{a1,a2,…,aN},其協(xié)方差矩陣為:
協(xié)方差矩陣C的特征向量ui及對(duì)應(yīng)特征值λi組成人臉空間的正交基底。圖像的主要信息聚集在特征值較大的特征向量中,將特征值按降序排列,取前d個(gè)特征值對(duì)應(yīng)的特征向量為主成分,構(gòu)成變換矩陣U=(u1,u2,…,ud),即人臉識(shí)別系統(tǒng)的字典,在此基礎(chǔ)上求解稀疏向量。
1.2算法仿真
為測(cè)試稀疏表示算法的性能,在YaleB[13],ORL[14]和AR[15]3個(gè)人臉數(shù)據(jù)庫(kù)上進(jìn)行了仿真實(shí)驗(yàn),并記錄測(cè)試數(shù)據(jù),如表1所示。
其中YaleB包含數(shù)據(jù)有10類(lèi)64張人臉圖像;ORL數(shù)據(jù)集包含數(shù)據(jù)有40類(lèi)10張人臉圖像;AR數(shù)據(jù)包含數(shù)據(jù)有120類(lèi)14張人臉圖像,因其人臉?lè)N類(lèi)較多,數(shù)據(jù)庫(kù)較大,所以也是公認(rèn)度較高的一種數(shù)據(jù)庫(kù)。
測(cè)試時(shí),在每一類(lèi)人臉圖像中進(jìn)行隨機(jī)標(biāo)記作為訓(xùn)練樣本,通過(guò)設(shè)置不同標(biāo)記率觀察識(shí)別算法的性能。
表1 算法在3種數(shù)據(jù)庫(kù)上的識(shí)別率(%)
由表中數(shù)據(jù)可知,隨著訓(xùn)練樣本的增加,對(duì)人臉的識(shí)別率也在不斷提升。同時(shí),在標(biāo)記率達(dá)到50%后,對(duì)各類(lèi)人臉的識(shí)別率都達(dá)到90%以上,顯示了其很好的魯棒性。
設(shè)計(jì)的系統(tǒng)包括人臉數(shù)據(jù)庫(kù)采集訓(xùn)練部分和識(shí)別檢測(cè)部分,如圖1所示。
圖1 人臉識(shí)別系統(tǒng)結(jié)構(gòu)
人臉數(shù)據(jù)庫(kù)采集訓(xùn)練部分結(jié)合UI界面,通過(guò)攝像頭拍照采集人臉圖像,或從外界資源文件直接導(dǎo)入人臉圖像,建立人臉數(shù)據(jù)庫(kù)。訓(xùn)練部分支持人臉數(shù)據(jù)庫(kù)的實(shí)時(shí)擴(kuò)展和字典數(shù)據(jù)包更新,入庫(kù)的人臉圖像首先進(jìn)行歸一化作用的處理,包括彩色圖像的灰度化,降噪處理。然后對(duì)圖像庫(kù)進(jìn)行樣本訓(xùn)練,生成人臉識(shí)別分類(lèi)字典數(shù)據(jù)包。識(shí)別檢測(cè)部分從監(jiān)測(cè)攝像頭返回的視頻流中定位截取人臉圖像,并進(jìn)行預(yù)處理,然后根據(jù)已生成的人臉識(shí)別分類(lèi)字典進(jìn)行實(shí)時(shí)識(shí)別。兩部分的軟件流程如圖2所示。
圖2 系統(tǒng)軟件流程
3.1人臉類(lèi)別對(duì)測(cè)試結(jié)果的影響
對(duì)所設(shè)計(jì)的系統(tǒng),采集了多類(lèi)人臉圖像數(shù)據(jù)作為實(shí)驗(yàn)樣本。
采集樣本時(shí),正常情況下會(huì)選擇清晰度較高、面部基本對(duì)齊的正臉或小角度側(cè)臉(小于30度)作為優(yōu)質(zhì)訓(xùn)練樣本的原子,如圖3(a)所示。在樣本來(lái)源不可控的情況下,也有可能存在訓(xùn)練樣本效果不理想,光線弱、成像模糊、側(cè)臉過(guò)多等現(xiàn)象,如圖3(b)所示。
圖3 訓(xùn)練樣本圖片示例
考慮到實(shí)際情況的復(fù)雜性,選擇A、B兩類(lèi)人臉圖像作為測(cè)試樣本的原子。A類(lèi)為多種表情、小部分遮擋(即遮擋面積小于50%)的人臉,如圖4(a)所示;B類(lèi)為大角度側(cè)面、大面積遮擋、光線昏暗等情況,如圖4(b)所示。
圖4 測(cè)試樣本圖片示例
文中將所采集到的多類(lèi)人臉圖像數(shù)據(jù)分為以下4種情況進(jìn)行測(cè)試:
Test 1:優(yōu)質(zhì)訓(xùn)練樣本+A類(lèi)測(cè)試樣本;
Test 2:優(yōu)質(zhì)訓(xùn)練樣本+B類(lèi)測(cè)試樣本;
Test 3:惡劣訓(xùn)練樣本+A類(lèi)測(cè)試樣本;
Test 4:惡劣訓(xùn)練樣本+B類(lèi)測(cè)試樣本。
當(dāng)每一類(lèi)取不同的訓(xùn)練樣本數(shù)進(jìn)行訓(xùn)練得到字典時(shí),識(shí)別測(cè)試統(tǒng)計(jì)結(jié)果如表2所示。
表2 在各類(lèi)情況下的識(shí)別率(%)
由上表數(shù)據(jù)可知,Test 1中,即使在單訓(xùn)練樣本條件下,對(duì)A類(lèi)測(cè)試樣本的識(shí)別率也高達(dá)90%以上;當(dāng)訓(xùn)練樣本數(shù)取到10時(shí),識(shí)別率可達(dá)到99.64%,完全可以滿足正常情況下的人臉識(shí)別要求。
Test 2中,當(dāng)訓(xùn)練樣本數(shù)增多時(shí),對(duì)B類(lèi)測(cè)試樣本的識(shí)別率得到顯著的提高,表明優(yōu)質(zhì)的訓(xùn)練樣本生成的分類(lèi)字典,對(duì)惡劣測(cè)試樣本良好的包容性。
Test 3和Test 4中,惡劣訓(xùn)練樣本使特征提取不明顯,導(dǎo)致對(duì)A類(lèi)和B類(lèi)測(cè)試樣本識(shí)別率均較低,不過(guò)此時(shí)增加訓(xùn)練樣本的數(shù)量,也可以較大程度的提高識(shí)別率,當(dāng)訓(xùn)練樣本數(shù)為10時(shí),識(shí)別率可達(dá)70%以上,這一結(jié)果表明,在訓(xùn)練樣本質(zhì)量較差的特殊需求中,如安防預(yù)警等,該系統(tǒng)有一定使用價(jià)值。
3.2訓(xùn)練樣本數(shù)目對(duì)測(cè)試結(jié)果的影響
為得到最佳訓(xùn)練樣本數(shù)目,在采集建立人臉數(shù)據(jù)庫(kù)基礎(chǔ)上,進(jìn)行了不同個(gè)數(shù)的訓(xùn)練樣本對(duì)識(shí)別率影響的測(cè)試,測(cè)試結(jié)果如圖5所示。
圖5中,折線1表示不同數(shù)目的優(yōu)質(zhì)訓(xùn)練生成的字典對(duì)各類(lèi)測(cè)試樣本的識(shí)別率;折線2表示不同數(shù)目的惡劣訓(xùn)練生成的字典對(duì)各類(lèi)測(cè)試樣本的識(shí)別率。由圖可見(jiàn),隨著訓(xùn)練樣本數(shù)目的增加,兩種情況的識(shí)別率都得到了顯著提高。當(dāng)優(yōu)質(zhì)訓(xùn)練樣本數(shù)目達(dá)到10以后,識(shí)別率達(dá)99%以上;對(duì)于劣質(zhì)訓(xùn)練樣本,當(dāng)訓(xùn)練樣本數(shù)小于8時(shí),由于樣本質(zhì)量情況不穩(wěn)定,增幅差異較大,達(dá)到9張之后,識(shí)別率平穩(wěn)增長(zhǎng)。
圖5 不同訓(xùn)練樣本數(shù)對(duì)識(shí)別率的影響
研究并采用基于稀疏表示的識(shí)別算法設(shè)計(jì)并實(shí)現(xiàn)了人臉識(shí)別系統(tǒng),系統(tǒng)可在動(dòng)態(tài)視頻流中實(shí)時(shí)截取圖像進(jìn)行識(shí)別。通過(guò)實(shí)際采集樣本測(cè)試,在訓(xùn)練樣本充分時(shí),系統(tǒng)對(duì)測(cè)試人臉樣本的小角度側(cè)面、多表情、小部分遮擋等情況下的識(shí)別率在99%以上,可滿足正常情況下的人臉識(shí)別需求,如門(mén)禁考勤、身份識(shí)別等應(yīng)用場(chǎng)合。同時(shí),系統(tǒng)對(duì)于惡劣的訓(xùn)練樣本和測(cè)試樣本有較好的包容性,在安防預(yù)警等特殊應(yīng)用場(chǎng)合有一定的使用價(jià)值。后續(xù)可引入多人臉定位算法,將應(yīng)用擴(kuò)大到等更多場(chǎng)合。
[1]張會(huì)森,王映輝.人臉識(shí)別技術(shù)[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,27(11):1923-1928.
[2]韓增錕.基于人臉識(shí)別技術(shù)的考生身份驗(yàn)證系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)與數(shù)字工程,2012(1):148-150.
[3]俞燕,李正明.基于特征的彈性圖匹配人臉識(shí)別算法改進(jìn)[J].計(jì)算機(jī)工程,2011(5):216-218.
[4]孫大瑞,吳樂(lè)南.基于特征的彈性圖匹配人臉識(shí)別算法[J].應(yīng)用科學(xué)學(xué)報(bào),2002,20(4):377-381.
[5]肖云.基于3D人臉識(shí)別研究的探索[J].電腦知識(shí)與技術(shù),2011,7(9):2136-2137.
[6]陰亞芳,張婧琪,廖延娜.小生境遺傳算法在多車(chē)牌定位中的應(yīng)用[J].西安郵電大學(xué)學(xué)報(bào),2015,20(1):40-43.
[7]倪紅霞,朱啟偉.基于遺傳算法的人臉識(shí)別系統(tǒng)設(shè)計(jì)[J].杭州電子科技大學(xué)學(xué)報(bào),2010,30(4):45-49.
[8]陰亞芳,李倩,廖延娜.基于低秩矩陣分解和協(xié)作表示的人臉圖像分類(lèi)[J].西安郵電大學(xué)學(xué)報(bào),2015(1):70-74.
[9]Wright J,Yang Allen,Ganesh A,et al.Robust face recognition via sparse representation[J].IEEE Transations on Parttern Analysis and Machine Intelligence,2009,31(2): 210-227.
[10]王小剛,田小平,吳成茂.基于壓縮感知的圖像快速重構(gòu)去噪算法[J].西安郵電學(xué)院學(xué)報(bào),2012(4):11-14,20.
[11]余付平,馮有前,范成禮,等.基于主成分分析的字典學(xué)習(xí)[J].控制與決策,2013(7):1109-1112.
[12]陳佩.主成分分析法研究及其在特征提取中的應(yīng)用[D].西安:陜西師范大學(xué),2014.
[13]LEE K C,HO J,Kriegman D.Acquiring linear subspaces for face recognition under variable lighting[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2005,27(5): 684-698.
[14]陳丹,王國(guó)胤,龔勛,等.一種適用于人臉檢測(cè)的自適應(yīng)光照補(bǔ)償方法[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(22): 175-178.
[15]Martinez A.Benavente R.The AR face database[R].CVC Tech.Report,1998.
The design and implementation of face recognition system based on sparse representation
LIAO Yan-na1,MA Chao2
(1.School of Science,Xi'an University of Posts and Telecommunications,Xi'an 710121,China;2.School of Electronic Engineering,Xi'an University of Posts and Telecommunications,Xi'an 710121,China)
In order to solve the situations of abnormal light,attitude change,obscured,samples lack in actual application of human face recognition system,the recognition algorithm based on sparse representation combined with principal component analysis is studied.A human face recognition system is designed to realize real time face image recognition in real time according to training dictionary,and the training dictionary can be updated real time.According to the test results,when the training samples are adequate end the face images are expressionless,frontal,the rate of system identification over 99%,meetting the demand of normal use of face recognition.when the training samples are not adequate,the rate over 70%,can be used in the security warning.
computer image processing;sparse representation;face recognition;principal component analysis
TN911.73
A
1674-6236(2016)17-0153-03
2016-01-14稿件編號(hào):201601106
陜西省教育廳專項(xiàng)科研計(jì)劃項(xiàng)目(12JK0559);陜西省自然科學(xué)基礎(chǔ)研究計(jì)劃項(xiàng)目(2014JM2-6117)
廖延娜(1974—),女,安徽懷遠(yuǎn)人,碩士,副教授。研究方向:電路與系統(tǒng)及信號(hào)與信息處理研究。