余元輝, 鄧 瑩
(1.集美大學(xué)計算機工程學(xué)院,福建 廈門 361021;2.廈門工學(xué)院,福建 廈門 361021)
?
基于改進的加權(quán)分塊2D-PCA人臉識別技術(shù)的研究
余元輝1, 鄧 瑩2
(1.集美大學(xué)計算機工程學(xué)院,福建 廈門 361021;2.廈門工學(xué)院,福建 廈門 361021)
比較了PCA(Principal Component Analysis)和2D-PCA(Two-Dimensional Principal Component Analysis)人臉識別算法。在2D-PCA的基礎(chǔ)上提出了一種改進算法,即基于整體區(qū)域、感興趣區(qū)域與非感興趣區(qū)域的加權(quán)分塊2D-PCA算法。該算法借助權(quán)值的動態(tài)調(diào)整,最終實現(xiàn)了最優(yōu)解?;谥槑霴RL設(shè)計實驗來驗證文中提出的改進的加權(quán)分塊2D-PCA算法。分析試驗結(jié)果表明,發(fā)現(xiàn)本算法識別率達到97.5%,較PCA算法提高21.66%,較2D-PCA算法提高10.08%,進一步證實本算法較PCA和2D-PCA顯著提高了人臉識別的準確率。
人臉識別;PCA;2D-PCA;分塊PCA;特征矩陣
信息服務(wù)技術(shù)日新月異、發(fā)展迅猛,人們在享受豐富多彩的信息服務(wù)的同時也越發(fā)關(guān)注其安全性。在機場、銀行、司法等諸多涉及大量公民敏感信息的地方,人們更加關(guān)心怎樣才能安全有效地識別驗證個人的身份信息。在黑客技術(shù)猖獗的當代,如果依然采用傳統(tǒng)的身份識別技術(shù)(基于證件、卡片等身份標識物或用戶名、密碼等身份標識知識),顯然無法保障其安全性,傳統(tǒng)的身份識別技術(shù)近年來已經(jīng)暴露出諸多嚴重缺陷,因此研究更加安全、可靠、準確和實用的身份識別技術(shù)已經(jīng)迫在眉睫,其中基于人臉生理特征的識別技術(shù)已經(jīng)成為專家學(xué)者近年來研究的熱點,其市場份額僅次于基于指紋特征的識別,在基于生物特征身份認證家族中占據(jù)了主導(dǎo)地位[1]。相比于家族中的其他技術(shù)人臉識別具有以下幾個優(yōu)點:1)方便性??梢允褂贸杀镜土钠胀〝z像頭、掃描儀、數(shù)碼相機等設(shè)備進行人臉數(shù)據(jù)采集; 2)隱蔽性??梢栽诓灰讋e人察覺的條件下進行人臉監(jiān)測識別;3)友好性??梢苑墙佑|的情況下對人臉進行快速識別;4)多源性。人臉數(shù)據(jù)庫的獲取渠道比較多樣化,比如國內(nèi)一些職能部門所建立的數(shù)據(jù)庫(公民身份證照片數(shù)據(jù)庫,職工健康賬戶照片數(shù)據(jù)庫、公民醫(yī)保照片數(shù)據(jù)庫等),國外很多機構(gòu)也建立了人臉圖像數(shù)據(jù)庫,如美國國防部的FERET人臉庫、耶魯計算視覺與控制中心的Yale人臉庫、英國劍橋大學(xué)的 ORL(Olivetti Research Laboratory)人臉庫、歐洲的 M2VTS 多模態(tài)人臉數(shù)據(jù)庫等。人臉識別(Face Identification)從狹義上講就是先判斷人臉的存在性, 當人臉存在條件為真時萃取人臉特征,比對人臉樣本庫中的已知臉,若滿足匹配條件則給出人臉識別結(jié)果。人臉識別從廣義的角度上理解主要分為存在性檢測、特征信息表達、檢測人臉、姿態(tài)表情分析和生理類別劃分等方面[2]。當然狹義上的人臉識別不會涉及人臉表情姿態(tài)分析與生理分類。鑒于人臉圖像的復(fù)雜性,人臉識別過程中如何提取人臉的有效特征以及人臉匹配策略是研究的難點。文中所研究人臉識別技術(shù)的重點指的是人臉有效特征的提取算法。通常情況下人臉識別方法有3類:第一類是考慮人臉局部特征的方法、第二類是考慮人臉整體特征的方法,第三類是既考慮人臉局部特征又考慮整體特征的方法。在第二類方法的研究領(lǐng)域內(nèi),PCA人臉識別方法是公認的主要方法,該方法基于臉部圖像整體統(tǒng)計特征作K-L正交基變換萃取主成分,生成特征子空間[3],所有待測臉圖像基于該子空間作投影運算,獲得一組投影系數(shù),然后比對樣本庫中已知臉部圖像完成識別。PCA算法對正面圖像有很高的識別率,但是PCA將二維圖像矩陣轉(zhuǎn)換成一維列向量的計算量超大,特征提取速度慢,且易受光照、位移、旋轉(zhuǎn)等因素的影響。后來學(xué)者為了改善PCA算法中圖像處理的高維問題提出了2D-PCA算法[4]。本研究在2D-PCA算法的基礎(chǔ)上提出一種改進的加權(quán)分塊2D-PCA算法,該算法借助權(quán)值的動態(tài)調(diào)整實現(xiàn)最優(yōu)解。最后利用ORL人臉樣本數(shù)據(jù)庫進行試驗仿真,以確定算法的有效性。
1991年TURK 等提出了主成分分析(PCA)方法,并將其用于人臉識別領(lǐng)域中,即著名的特征臉(Eigenface)算法[5]。PCA算法是一種以向量空間轉(zhuǎn)換為基礎(chǔ)的特征萃取方式。其核心就是找到一個轉(zhuǎn)換矩陣,將人臉原空間信息轉(zhuǎn)換到另一個向量空間以得到特征臉[6]。給定1幅人臉圖像F,其大小為m×n,其每列相連構(gòu)成1個大小為D=m×n維的列向量。假定M表示訓(xùn)練樣本數(shù)目,F(xiàn)j表示第j幅人臉圖像形成的人臉向量。具體過程如下[7]:
(1)
(2)
(3)
②計算Gt的特征向量ui。根據(jù)K-L變換原理,需要計算Gt的特征向量ui,鑒于Gt維數(shù)為D×D,若直接計算運算量很大,可采取基于奇異值(Singular Value Decomposition,簡稱SVD)的策略分解TTT計算、轉(zhuǎn)換其特征值以及特征向量。令li(i=1,2,…,M)為矩陣TTT的特征值,vi為TTT對應(yīng)于li的特征向量,根據(jù)SVD定理的內(nèi)容,TTT的正交歸一特征向量ui為:
(4)
④基于特征子空間對訓(xùn)練集中的圖像作投影運算。遍歷訓(xùn)練集中的樣本Fi,將其作投影運算到特征子空間,得到一組由K個特征向量的線性組合表示的投影向量Ωi:
(5)
在進行人臉識別時,只需將每一幅待測臉圖像基于特征子空間作投影運算得到投影向量,并且和訓(xùn)練樣本的投影向量作相應(yīng)的比較運算即可。
經(jīng)典的PCA算法是將人臉圖像看成是1-D的隨機向量,在計算其特征子空間的過程中為了降低計算的高復(fù)雜度問題,引入了奇異值分解(SVD)策略,可是SVD是基于大樣本數(shù)據(jù)空間的,若樣本空間不足則很可能降低所算出的協(xié)方差矩陣的可靠性及穩(wěn)定性。若樣本數(shù)據(jù)規(guī)模巨大又會直接造成計算復(fù)雜度難以控制。為此,有研究人員在PCA基礎(chǔ)上提出二維主成分分析(2D-PCA)算法[8],2D-PCA采用人臉圖像矩陣直接進行圖像特征分析,非PCA算法那樣需要生成列向量后再進行,其基本原理[9-10]如下。
給定一幅人臉圖像矩陣A,其大小為m×n,XIRn@d表示投影矩陣,X矩陣中每列為正交向量,且滿足nd。
①圖像矩陣A投影到X上得到矩陣Y
Y=AX
(6)
令J(X)表示X的總體散度(Y的協(xié)方差矩陣的跡),即投影矩陣X的優(yōu)劣。則總體散度J(X)計算公式如下:
J(X)=tr(SX)
(7)
其中:SX=E{[Y-E(Y)][Y-E(Y)]T}=XTE{[A-E(A)]T[A-E(A)]}X。
②計算協(xié)方差矩陣Gt的特征向量X,生成特征子空間
(8)
(9)
則J(X)可以改寫為:
J(X)=tr(SX)=tr(XTGtX)
(10)
顯然,若J(X)最大則投影矩陣X的各列向量必為矩陣Gt的r個非零特征值對應(yīng)的特征向量。取前P個特征向量生成投影矩陣(特征子空間);
(11)
③提取人臉圖像測試樣本的特征和分類
任意給定2副人臉圖像B1、B2,分別在投影矩陣X=(X1,X2,…,Xp)上做投影計算Si=B1Xi,Si=B2Xi,i=1,2,…,p,分別得到B1、B2的特征矩陣φ1、φ2。
(12)
(13)
特征矩陣φ1、φ2間的歐氏距離Distance(φ1、φ2)計算如下:
(14)
遵循最近鄰距離原則(NN),對人臉圖像測試樣本進行分類。
綜合以上的研究,不難發(fā)現(xiàn)PCA與2D-PCA的計算過程比較類似。二者均是對整幅人臉圖像做離散K-L正交變換,均是一種基于目標統(tǒng)計的方法。唯一區(qū)別在于2D-PCA采用原圖像矩陣無需生成列向量而直接對圖像特征進行分析。無論PCA還是2D-PCA算法都是將人臉為一個整體對象來完成特征提取,更多強調(diào)的是人臉的全局特征,這勢必影響到人臉全局特征之間的相關(guān)性,所以很難體現(xiàn)出一些有利于分類的人臉局部信息。鑒于以上的分析,筆者提出來一種改進的加權(quán)分塊2D-PCA算法,即考慮到人臉局部特征的提取又兼顧到人臉的整體特征,實現(xiàn)在降低人臉圖像數(shù)據(jù)維數(shù)的前提下,提取到穩(wěn)健可靠的人臉特征。算法過程描述如下:
①給定人臉圖像A(大小為m×n),如圖1所示。按照4×3方式對整個人臉圖像A進行均勻分塊,如圖2所示。
圖1 人臉圖像
圖像A的分塊表示如下:
圖2 人臉圖像4×3分塊2D-PCA
(15)
其中:
(16)
②接下來利用2D-PCA算法完成特征提取,得到訓(xùn)練樣本庫X’的特征子空間δ,且初始化子空間δ的權(quán)值α1=0.5;
③對原人臉圖像A,按照以下圖3中所示的紅色區(qū)域B1,B2,B3,B4部分、分別對人臉圖像A的關(guān)鍵局部特征(左眼、右眼、鼻子、嘴巴)進行非均勻分塊處理。
定義:包含在B1,B2,B3,B44塊區(qū)域范圍中的藍色區(qū)域為感興趣區(qū)域(記為ROI),對應(yīng)圖3中的虛線框范圍區(qū)域;未包含在B1,B2,B3,B44塊區(qū)域范圍中的區(qū)域為非感興趣區(qū)域(記為NROI),對應(yīng)圖3中的虛線框范圍以外的區(qū)域。這樣人臉圖像A就按照ROI/NROI被非均勻地劃分成2塊,如下圖3所示。
④視樣本圖像的ROI區(qū)域為一個整體,利用2D-PCA算法萃取臉特征,直至創(chuàng)建訓(xùn)練樣本庫X’的特征子空間ε,同時完成權(quán)值的初始化工作,設(shè)置α2=0.2。
⑤視樣本圖像的NROI區(qū)域為一個整體,利用2D-PCA算法萃取臉特征,直至創(chuàng)建訓(xùn)練樣本庫X’的特征子空間η,同時完成權(quán)值的初始化工作,設(shè)置α3=0.3。
⑥基于以上的3種訓(xùn)練樣本庫,分別計算各自測試樣本與訓(xùn)練樣本間的歐式距離。并依照上述α1、α2、α3權(quán)值加權(quán)3種距離,求得加權(quán)后的測試樣本和訓(xùn)練樣本的距離。
圖3 人臉圖像ROI / NROI分塊2D-PCA
⑦遵循最近鄰距離原則(NN),進行結(jié)果識別,同時記錄識別率φi與程序運行時間τi,識別過程中按照公式(17)不斷更新權(quán)值α1、α2、α3。
(17)
⑧循環(huán)執(zhí)行步驟⑥、⑦,直到識別率φi≥給定閾值θ。
為檢驗文中提出的改進的人臉識別算法的優(yōu)劣,作者設(shè)計了相應(yīng)的人臉識別實驗進行驗證。本試驗的設(shè)計是基于英國劍橋大學(xué)的 Olivetti Research Laboratory (簡稱ORL)人臉庫,ORL是目前人臉識別技術(shù)研究中廣泛采用的一種基準性樣本庫。如圖4所示,每一張人臉圖像均以灰色為背景,其中部分圖像采取了分期拍攝的方式,所有人臉圖像在光照、表情﹑細節(jié)﹑姿態(tài)等方面均有一定程度的變化。
圖4 ORL人臉庫圖像
試驗的主要目的是驗證改進的加權(quán)分塊2D-PCA算法的識別率較傳統(tǒng)的PCA、2D-PCA是否有顯著提高。在對人臉圖像分塊前,首先建立左眼、右眼、鼻子和嘴巴的分類器(haarcascade_mcs_lefteye.xml,haarcascade_mcs_righteye.xml,haarcascade_mcs_nose.xml,haarcascade_mcs_mouth.xml)并訓(xùn)練好,然后再將人臉圖像的左眼、右眼、鼻子和嘴巴同時檢測出來,保存在vector
表1 3種算法的識別結(jié)果比較
從表1的結(jié)果數(shù)據(jù)可以看出,本研究提出的改進的加權(quán)分塊2D-PCA算法在分類精度上是相當準確的,就3種算法而言其人臉測試樣本識別率達到了97.5%,是三者中最高的。這是因為采用了加權(quán)處理后的分塊2D-PCA算法,在結(jié)果識別過程中會不斷地自我更新分塊的權(quán)值,直到最終找到理想的權(quán)值。當然此過程勢必會增加系統(tǒng)的時間復(fù)雜度,正如表1中結(jié)果所呈現(xiàn)的那樣,本文算法識別過程的平均耗時達到了85.48 ms,較PCA算法增加了21.66%,較2D-PCA算法增加了10.08%,也是3種算法中最高的。當然從大幅提高人臉識別的精度而言,平均耗時增加的代價是完全可以忽略不計的。
PCA是基于人臉全局特征的統(tǒng)計算法,計算圖像的協(xié)方差矩陣是在獲得原圖像行向量或者列向量的前提下完成的。鑒于PCA敏感于影響臉部圖像變化的外部條件(表情、姿態(tài)、光照等),一旦外部條件改變了人臉圖像,PCA的識別率就會下降,且無法監(jiān)督其訓(xùn)練過程,這意味著訓(xùn)練樣本的類別信息不能使用。與PCA不同的是,2D-PCA采用基于原始圖像矩陣的方式來計算生成協(xié)方差矩陣,提取特征的方式更加直接,其識別率也高于PCA算法,并且2D-PCA可接受更小的人臉圖像樣本,所計算的矩陣協(xié)方差也更準確,這也是優(yōu)于PCA算法的關(guān)鍵。但是2D-PCA算法表示原始人臉圖像需要更多的系數(shù),因此會增加內(nèi)存空間復(fù)雜度。
經(jīng)過改進的加權(quán)分塊2D-PCA算法對訓(xùn)練圖像集進行均勻分塊和ROI / NROI的非均勻分塊,重點關(guān)注了人臉圖像全局特征中的關(guān)鍵局部信息的相關(guān)性,這在很大程度上彌補了PCA與2D-PCA算法的基于人臉全局特征統(tǒng)計思想的不足,試驗結(jié)果顯示本算法識別率達到97.5%,較PCA算法提高21.66%,較2D-PCA算法提高10.08%,充分證實本算法的識別率較PCA和2D-PCA有顯著的提高。鑒于分塊可以抽取到人臉圖像每一單元塊的局部特征,因此其識別結(jié)果較2D-PCA、PCA而言更具有魯棒性。當然,本文提出的改進的加權(quán)分塊2D-PCA算法在表示人臉圖像時,較PCA、2D-PCA需要更多的系數(shù),算法識別過程中所耗費的內(nèi)存空間也會增加,識別的平均耗時也隨之增加。所以,如何進一步縮短算法識別的平均耗時、降低內(nèi)存空間的占用,還需要進一步研究。
[1] 朱玉蓮,陳松燦.特征采樣和特征融合的子圖像人臉識別方法[J].軟件學(xué)報,2012,23 (12):3209-3220.
[2] 馬小虎,譚延琪.基于鑒別稀疏保持嵌入的人臉識別算法[J].自動化學(xué)報,2014,40(1):73-81.
[3] KWONTAEG C, KAR-ANN T, HYERAN B.Incremental face recognition for large-scale social network services[J]. Pattern Recognition,2012, 45(8):2868-2883.
[4] YANG J, ZHANG D, ALEJANDRO F,et al. Two-Dimensional PCA: A new approach to appearance-based face representation and recognition[J]. IEEE Trans on Pattern Analysis and Machine Intelligence,2004, 26(1):117-129.
[5] 孫 強,葉玉堂,邢同舉,等. 基于主成分分析法的人臉識別的探討與研究[J].電子設(shè)計工程,2011,19(20):101-104.
[6] 孫 鑫,劉 兵,劉本永.基于分塊 PCA 的人臉識別[J].計算機工程與應(yīng)用,2005,41(27):80-82.
[7] 蔡 玉.基于主元分析和小波變換的人臉識別方法研究與實現(xiàn)[D] .沈陽:東北大學(xué),2006.
[8] LU G F, ZOU J, WANG Y. Incremental complete LDA for face recognition [J].Pattern Recognition, 2012, 45(7):2510-2521.
[9]萬建武,楊明,吉根林,陳銀娟.一種面向人臉識別的加權(quán)代價敏感局部保持投影[J],軟件學(xué)報,20013,24(5):1155-1164.
[10]張潔玉,趙鴻萍,陳 曙.自適應(yīng)閾值及加權(quán)局部二值模式的人臉識別[J],電子與信息學(xué)報,2014,36(6):1327-1333.
(責(zé)任編輯:蔣國良)
Research of the technology of face recognition based on the improved weighted block 2D-PCA
YU Yuanhui1, DENG Ying2
(1.School of Computer Engineering, Jimei University, Xiamen 361021, China; 2.Xiamen Institute of Technology, Xiamen 361021, China)
This paper compares the PCA (Principal Component Analysis) and 2D-PCA (Two-Dimensional Principal Component Analysis) face recognition algorithm. On the basis of the 2D-PCA, an improved weighted block 2D-PCA algorithm was proposed, which is based on the whole region, the region of interest and other regions. By dynamically adjusting the weights, this algorithm finally achieved the optimal solution. To verify the improved weighted block 2D-PCA algorithm proposed in this paper, experiments based on the well-known face database ORL were designed, and the experimental results show that the proposed algorithm recognition rate reached 97.5%, 21.66% higher than that of PCA algorithm, 10.08% higher than that of 2D-PCA algorithm, which further confirmed that compared with PCA and 2D-PCA, the proposed algorithm significantly improves the accuracy of face recognition.
face recognition algorithm; PCA; 2D-PCA; block 2D-PCA; feature matrix
2015-01-17
福建省科技廳高校專項基金項目(JK2012026)
余元輝(1973-),男,河南平頂山人,副教授,主要從事多媒體圖像處理、數(shù)據(jù)挖掘研究。
1000-2340(2015)04-0500-05
TP391
A