摘 要:人臉識別技術(shù)是生物特征識別技術(shù)的一種,它根據(jù)人臉來識別人的身份。人臉識別技術(shù)具有準確、經(jīng)濟、可擴展性良好等特點,更重要的是,它比其它生物特征識別技術(shù)更加簡便、直觀、可靠。現(xiàn)在應(yīng)用于人臉識別的算法有3種:基于PCA的人臉識別算法、基于Fisher線性判別的人臉識別算法、基于LBP特征的人臉識別算法。對前兩種算法進行了深入研究,在人臉數(shù)據(jù)庫上進行識別,取得了預(yù)期效果。
關(guān)鍵詞:人臉識別技術(shù);PCA;K-L變換;Fisher線性判別
DOIDOI:10.11907/rjdk.151986
中圖分類號:TP312
文獻標識碼:A 文章編號文章編號:1672-7800(2015)012-0069-03
作者簡介作者簡介:方潔(1980-),女,湖北武漢人,武漢大學(xué)珞珈學(xué)院電子信息與機械工程學(xué)院副教授,研究方向為計算機技術(shù)。
0 引言
人臉識別[1]技術(shù)涵蓋了數(shù)字圖像處理、計算機視覺、模式識別以及數(shù)學(xué)等多方面內(nèi)容。目前,相關(guān)研究雖然取得了一些重要成果,但該技術(shù)在實際應(yīng)用中仍存在很多問題。由于人臉五官分布的相似性,人臉表情、姿態(tài)、發(fā)型、化妝的不同都給識別帶來了困難。如何快速正確地識別大量人臉是目前急需解決的難題。人臉識別在身份認證、信息安全、金融交易、國防安全[2]等方面應(yīng)用廣泛。人臉識別是對人臉部信息處理的重要研究課題之一,有很高的研究價值。人臉識別又是一個非常具有挑戰(zhàn)性的課題,面臨著諸多難題。
1 基于PCA的人臉識別方法
1.1 K-L變換
K-L(Karhunen-Loeve)變換是研究人員常用的特征提取方法。K-L變換也可稱為主成分變換PCA,可以使大維數(shù)的數(shù)據(jù)集合簡化。
依據(jù)K-L變換[3]流程,首先從人臉樣本中提取出人臉關(guān)鍵特征。假設(shè)圖像為N*N的人臉圖像,一幅N*N個像素組成的圖像則是一個N*N維的矩陣,人臉圖像可以視為一個N2維向量的樣本。但是由于維數(shù)太高,需要對這些特征降維。
不考慮類別標號,利用所有的樣本估計總協(xié)方差矩陣為:
∑=1m∑mi=1(xi-μ)(xi-μ)T=1mXXT(1)
其中,X是由所有去均值的樣本構(gòu)成的N2*m維矩陣?!品Q為總體散布矩陣,其維數(shù)是N2*N2。要對樣本降維,要求∑正交歸一的本征向量。由于矩陣維數(shù)過高,直接進行計算比較困難。
由樣本集組成的矩陣R=XTX,維數(shù)為m*m,通常m< XTXυi=λiυi(2) 兩邊同時左乘X,得: XXTXυi=Xλiυi 即: 1,對應(yīng)的本征值表示為μi,相應(yīng)的μ0,μ1,μ,2,…,μM-1被稱為特征臉,所有的特征臉又可稱為特征臉空間。在特征臉空間中,大的特征屬性值可以表示為人臉整體輪廓以及附近環(huán)境,而小的值用來表述細節(jié)特征。 步驟四:將訓(xùn)練集合和測試集合映射到特征空間中。將全部的人臉圖像映射到特征子空間,每一幅圖像對應(yīng)特征子空間的每一個坐標,該坐標有自己的坐標系數(shù),這組系數(shù)代表相應(yīng)的人臉圖像。在一般情況下,一個特定的人臉圖像可以通過多個特征臉的加權(quán)組合得到,用于最終的人臉識別。通過K-L變換產(chǎn)生的系數(shù),即為y=UTf。經(jīng)過相應(yīng)的矩陣以及系數(shù)的轉(zhuǎn)變,原始圖像能夠轉(zhuǎn)變成新圖像:fΛ=Uy。 步驟五:對待識別樣本進行分類。通過分類器將待識別的樣本進行分類,分類方法可以是貝葉斯算法、SVM算法等。 2 基于Fisher線性判別的人臉識別方法 Fisher線性判別分析(Fisher Discriminant Analysis)算法[4]是降低特征維數(shù)的一種方法。即把d維空間中的所有模式全部投影到一條直線上,然后將該模式的維數(shù)縮減到一維,并且需要同一類型的樣本之間聚在一起,不同類型樣本之間分開。而關(guān)于c類問題,需要c-1個判別函數(shù)。由d維空間向c-1維空間進行投影,假如d>c,關(guān)于樣本的類內(nèi)散布矩陣SW和類間散布矩陣SB定義如下: SW=∑∑(xj-ui)(xij-ui)T(1)SB=∑ci=1(ui-u)(ui-u)T(2) 式中,c為類別數(shù);ni為ci的樣本數(shù);ui為ci的樣本均值,ui=1N∑nj=1xj;u為所有樣本的均值,ui=1N∑ci=1niui;xij為ci類中的第j個樣本。 為了找出一個矩陣W,使類間離散度[5]和類間離散度的比值達到最大值,散布矩陣的行列式的值是離散度的一種簡單的標量度量,得到Fisher 準則函數(shù)定義為: J(Wopt)=BWargmaxwWTSBWWTSWW(3) 當(dāng) Fisher 準則函數(shù)取最大值時,Wopt=[W1,W2,…,Wc-1]則是使類間離散度和類內(nèi)離散度的比值最大時的最優(yōu)投影方向。求解[W1,W2,…,Wc-1]特征值可以求出最優(yōu)投影方向,即方程的前c-1個最大特征值對應(yīng)的特征向量,即: SSBWi=λiswwi;i=1,2,…,c-1(4) 在SW可逆時,得到: S-1WSBWi=λWi;i=1,2,…c-1(5) 在求出特征向量[W1,W2,…,Wc-1]后,確定式(4)中c-1個判別函數(shù),由式gi(X)>gj(X)可知,對于所有的i≠j有yi(X)>yj(X),則把X歸為Wi類。 3 結(jié)語 通過選用FERET人臉數(shù)據(jù)庫和AT&T人臉數(shù)據(jù)庫進行人臉識別實驗,實現(xiàn)了人臉識別實驗平臺的效果,驗證了兩種人臉識別算法的有效性。基于PCA的人臉識別算法,主要被用來進行圖像的特征提取,而基于Fisher線性判別的人臉識別算法,可達到將高維空間進行降維,映射到最佳鑒別向量空間中,求得最佳鑒別平面,并在圖像的局部層級通過對圖像紋理特征的描繪達到描述圖像的目的,在圖像的識別、檢索以及分析方面有更多應(yīng)用。 參考文獻參考文獻: [1] 周德華,毛敏峰,徐浩.一種多人臉跟蹤算法的研究與實現(xiàn)[J].電視技術(shù),2005,275(5):88-90. [2] 王偉,張佑生,方芳.人臉檢測與識別技術(shù)綜述[J].合肥工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2006(2):158-163. [3] 高建坡,王煜堅,楊浩,等.一種基于KL變換的橢圓模型膚色檢測方法[J].電子與信息學(xué)報,2007(7):1739-1743. [4] 王芳.基于五官特征定位的人臉識別技術(shù)在防盜門中的應(yīng)用[D].青島:中國海洋大學(xué),2006. [5] 高建坡.視頻序列中的人臉檢測與跟蹤算法研究[D].南京:東南大學(xué),2007. (責(zé)任編輯:黃 ?。?