卜 婷
(淮陰師范學院物理與電子電氣工程學院,江蘇淮安 223300)
基于最大邊距局部敏感鑒別分析的人臉識別
卜 婷
(淮陰師范學院物理與電子電氣工程學院,江蘇淮安 223300)
局部敏感鑒別分析(LSDA)是一種基于向量學習的提取特征的算法,該算法使得屬于同一類的相鄰數(shù)據(jù)經(jīng)投影后盡量靠近,但不同類的鄰近數(shù)據(jù)則相遠離.在實際應用中,由于小樣本問題,通常先利用PCA算法對原始數(shù)據(jù)進行降維處理,然后再使用LSDA算法提取特征.然而,這種方法會丟掉一些重要的鑒別信息.提出了最大邊距局部敏感鑒別分析(MM?LSDA)算法,直接從原始數(shù)據(jù)中提取特征,避免了鑒別信息的損失,同時使得同類中的近鄰數(shù)據(jù)盡量靠近,而不同類之間的樣本遠離.在ORL和Yale人臉庫上的仿真實驗表明此算法更有效.
局部敏感鑒別分析;最大邊距準則;人臉識別
特征提取是人臉識別和表情識別中的關鍵技術,其中比較著名的算法有主成分分析(PCA)[1]和線性鑒別分析(LDA)[2]等.主成分分析(PCA)是一種無監(jiān)督的線性特征提取算法,此算法的思想是通過求解出訓練樣本散布矩陣的特征值,得到一組數(shù)量遠遠小于樣本空間維數(shù)的正交基來表示訓練樣本張成的子空間.從線性重建的角度來看,這組基的優(yōu)點是可以最充分地表示樣本,但是沒有考慮到類內(nèi)、類間的不同.而線性鑒別分析(LDA)是有監(jiān)督的線性特征提取算法,該算法能夠使樣本所生成的子空間類間離散度最大,而類內(nèi)離散度最小.但是,使用LDA算法時經(jīng)常會遇到小樣本問題,由于訓練樣本的數(shù)量通常會小于每一個樣本的維數(shù),因此類內(nèi)散布矩陣一般是奇異的.最近,Li Haifeng等人用最大邊距準則(MMC)[5]替代Fisher準則,從另外一個角度解決了小樣本問題,所采用的基于最大邊距準則提取的特征相比較于其他算法具有更好的高效性和魯棒性.
上述算法都是基于全局結構的算法,它們可以較好的揭示具有線性結構的高維數(shù)據(jù)集的全局分布,但是對于嵌入在高維空間中具有非線性流形結構的數(shù)據(jù),很難學習出隱含在數(shù)據(jù)集中的低維流行結構[6?8].線性流形學習是近年來出現(xiàn)的一種新的機器學習理論,該類算法能夠?qū)W習出嵌入在高維空間中的低維流行結構,所提取的特征能夠保持原始數(shù)據(jù)的局部信息.這類算法主要有局部保持投影(Locality Preserving Projection,LPP)[9]算法、近鄰關系保持嵌入(Neighborhood Preserving Embedding,NPE)[10]算法、局部敏感鑒別分析(Locality Sensitive Discriminant Analysis,LSDA)[11]算法等.局部敏感鑒別分析算法的主要思想是構造兩個近鄰圖,分別為類內(nèi)近鄰圖和類間近鄰圖,目的是使在原始樣本空間中原本屬于同一類的鄰近樣本點經(jīng)線性映射后盡可能的靠近,而在原始樣本空間中鄰近的不同類樣本點經(jīng)線性映射后盡可能的遠離.
為了避免使用PCA算法處理數(shù)據(jù)帶來的鑒別信息的損失,在局部敏感鑒別分析算法的基礎上,本文提出了最大邊距局部敏感鑒別分析(MM?LSDA)算法.該算法直接從原始數(shù)據(jù)中提取特征,同時使得同類中的近鄰數(shù)據(jù)盡量靠近,而不同類之間的樣本遠離.
設數(shù)據(jù)集X=(x1,x2,…,xN),其中xi∈Rn,已知的c個模式類別分別為c1,c2,…,cc為,每個類別ci包含Ni(i=1,2,…,c)個樣本.尋找轉(zhuǎn)換矩陣A∈Rn×d,將X=(x1,x2,…,xN)映射為Rd中的數(shù)據(jù)集Y=(y1,y2,…,yN),其中d?n,yi代表xi,即yi=ATxi.
1.1 局部敏感鑒別分析
根據(jù)文獻[11],令Nw(xi)表示與xi同類的近鄰點,而Nb(xi)表示與xi不同類的近鄰點,并構造類內(nèi)近鄰圖Gw和類間近鄰圖Gb.如果xj∈Nw(xi),則Gw有邊xixj;如果xj∈Nb(xi),則Gb有邊xixj.那么,Gw和Gb的權重矩陣Ww和Wb可由下式得到:
LSDA算法的兩個目標函數(shù)為:
其中yi=aTxi,yT=aTX且y=(y1,y2,…,yN)T.
經(jīng)推導,目標函數(shù)式(3)可以簡化為:
其中,Dw是對角陣,
1.2 類間近鄰關系矩陣
根據(jù)文獻[12],定義類間近鄰關系矩陣:
其中,Rb為類間近鄰關系權重矩陣:
經(jīng)運算,式(6)可化簡為:
其中,D為對角陣,對角線上的元素為類間近鄰關系權重矩陣Rb的行或列的和(因為Rb為對稱陣)
算法的提出及理論.為了避免了鑒別信息的損失,同時使得同類中的近鄰數(shù)據(jù)盡量靠近,而不同類之間的數(shù)據(jù)遠離,因此,MM?LSDA算法的目標函數(shù)為:根據(jù)式(5)和(8),目標函數(shù)可簡化為:
其中,G=L-Lw,限制條件為:aTa=1.
這里,我們使用拉格朗日乘法算子求解目標函數(shù):
那么,可以通過解XGXT的前d個最大特征值對應的特征向量得到最佳轉(zhuǎn)換矩陣A.得
為了檢測算法的性能,分別在ORL和Yale人臉庫上進行了實驗,將MM?LSDA算法與PCA、LDA和LSDA算法的檢測結果做了比較.實驗中將每個人臉庫劃分為訓練集和測試集兩部分,實驗分別在這兩部分中進行,訓練階段有兩個步驟:一是將經(jīng)過歸一化處理的圖像分別利用上述幾種算法進行特征提取從而得到最佳轉(zhuǎn)換矩陣;二是轉(zhuǎn)換訓練樣本.在測試階段中,將測試樣本轉(zhuǎn)換到之前在訓練階段得出的特征向量上,再與經(jīng)過轉(zhuǎn)換的訓練樣本進行比較,然后進行識別.識別過程采用k=1的KNN方法. 3.1 ORL人臉庫實驗
ORL人臉庫中包含40個人的臉部圖像,其中的每個人都含有不同的10幅圖像,每幅圖像的原始維數(shù)為112×92,這里面的有些圖片是在不同時間拍攝的,從而會產(chǎn)生不同光照條件和不同的表情(比如睜眼/閉眼,笑/不笑)以及不同的臉部細節(jié)(比如戴眼鏡/不帶眼鏡);此外,人臉的姿態(tài)也各不相同,甚至有高達20°的深度旋轉(zhuǎn)和平面旋轉(zhuǎn)以及多達10%的人臉尺度變化.實驗前對原始人臉圖片進行了預處理,將人臉部分提取出來,圖片歸一化為32×32大小的灰度圖像,每張圖像的人眼被定位在同一位置.圖1為ORL人臉庫中經(jīng)過預處理的某一人的部分幅圖像.
圖1 歸一化后ORL人臉庫中同一個人的部分人臉圖像
圖2 不同算法的識別率隨特征維數(shù)變化的曲線圖
實驗中隨機取l=6個樣本進行訓練,剩下的樣本作為測試樣本,重復實驗50次得到平均識別率.圖2示出不同算法的識別率隨特征維數(shù)變化的曲線圖.從圖中可以看出,PCA算法的性能最差,因為該算法是無監(jiān)督的,提取的特征鑒別能力不強,LDA算法的性能與LSDA算法的性能相近,而本文提出的MM?LSDA算法比LSDA算法識別性能有所提高,因為MM?LSDA算法沒有使用PCA對原始數(shù)據(jù)進行處理,避免了鑒別信息的損失,所以性能有所提高
表1列出了不同算法達到的最高識別率及相應維數(shù).從表1可以看出,本文提出的MM?LSDA算法的識別率最高為96.15%,從而說明了的MM?LSDA算法的有效性.
表1 ORL人臉庫上各種算法的最高識別率及相應維數(shù)
3.2 Yale人臉庫實驗
Yale人臉庫中含有15個人的臉部圖像,其中每個人包含11張圖像,一共有165張.每個人的11張圖像都各不相同,如表情不同、燈光角度不同或者人臉細節(jié)不同.處理方法同ORL人臉庫一樣,先將人臉部分提取出來,圖片歸一化為32×32大小的灰度圖像,每張圖像的人眼被定位在同一位置.圖3為經(jīng)處理后的部分Yale人臉圖像示例.實驗同樣分為50組,每組從每類中隨機選取l=6個人臉圖片作為訓練樣本,其余的作測試樣本,記錄每組的識別率,最后得到平均識別率.
圖3 歸一化后Yale人臉庫中同一個人的部分人臉圖像
圖4為Yale人臉庫上各種算法的識別率與降維后的維數(shù)的關系.由圖4可以看出,MM?LSDA算法的識別率要高于其他所有的算法,這說明該算法在表情和光照變化比較大的情況下也能取得很好的識別效果.因此,本文提出的算法具有魯棒性和高效性.
圖4 不同算法的識別率隨特征維數(shù)變化的曲線圖
表2列出了Yale人臉庫上各種算法的最高識別率及相應的維數(shù).由表2可知,本文的算法識別率最高為93.68%.
表2 Yale人臉庫上各種算法的最高識別率及相應維數(shù)
本文基于局部敏感鑒別分析算法提出了最大邊距局部敏感鑒別分析(MM?LSDA)算法,概算直接從原始數(shù)據(jù)中提取特征,避免了鑒別信息的損失,同時使得同類中的近鄰數(shù)據(jù)盡量靠近,而不同類之間的樣本遠離.在ORL和Yale人臉數(shù)據(jù)庫上的實驗表明,本文提出的算法更有效.
瞼板腺功能障礙(Meibomain gland dysfunction,MGD)是瞼板腺的慢性、彌漫性功能異常,終末分泌導管開口堵塞伴有脂質(zhì)分泌量異常和(或)成分改變,導致淚膜異常,出現(xiàn)眼部刺激癥狀,發(fā)生炎癥反應的一類眼表疾病[1]。臨床上大多數(shù)合并MGD的白內(nèi)障患者在就診時,其合并的MGD并未引起眼科醫(yī)師的高度關注。但當這部分患者進行白內(nèi)障手術后,往往很快出現(xiàn)眼表癥狀加劇,嚴重影響白內(nèi)障手術效果及患者術后生活質(zhì)量。本研究采用相關眼表參數(shù)來評價白內(nèi)障手術是否影響瞼板腺功能,結果報告如下。
參考文獻:
[1] Turk M A,Pentland A P.Face Recognition Using Eigenfaces[J].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition,1991,11:586-591.
[2] Belhumeur PN,Hespanha JP,Kriegman D J.Eigenfaces vs Fisherface:Recognition Using Class Specific Linear Projec?tion[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,1997,19:711-720.
[3] 楊鑫,田捷.生物特征識別技術理論與應用[M].北京:電子工業(yè)出版社,2005.
[4] Raudys Sarunas J,Jain Anil K.Small Sample Size Effects in Stistical Pattern Recognition:Recommendation for Practition?ers[J].IEEE Transactions On Pattern Analysis And Machine Inteligence,1991,13:252-264.
[5] Li H F,Jiang T,Zhang K S.Efficientand Robust Feature Extraction by Maximum Margin Criterion[J].IEEE Transactions on Neural Networks,2006,17(1):157-165.
[7] Zhang J,Li S Z,Wang J.Manifold learning and applications in recognition[J].Intelligent Multimedia Processing with Soft Computing,2004:105:281-300.
[8] Chang Y,Hu C,Turk M.Manifold of facial expression[J].Proceedings of the IEEE InternationalWorkshop on Analysis and Modeling of Faces and Gestures,2003,10:28-35.
[9] He X F,Yan SC.Face Recognition Using Laplacianfaces[J].IEEE Transactions on Pattern Analysis and Machine Intel?ligence,2005,27(3):328-340.
[10] He X F,CaiD,Yan SC.Neighborhood preserving embedding[M].//Proceedings of the Tenth IEEE International Con?ference on Computer Vision,Beijing,China,2005:1-6.
[11] Cai D,He X F,Zhou K,Han J,Bao H.Locality sensitive discriminantanalysis[M].//In Proceedings of the20th Inter?national Joint Conference on Artificial Intelligence,2007:708-713.
[12] Hu H F.Orthogonal neighborhood preserving discriminant analysis for face recognition[J].Pattern Recognition,2008,41:2045-2054.
M aximum M argin Neigborhood Preserving Embeding for Face Recognition
BU Ting
(School of Physics and Electronic Electrical Engineering,Huaiyin Normal University,Huaian Jiangsu 223300,China)
Locality Sensitive Discriminant Analysis(LSDA)was a liner manifold learning algorithm,it makes that the nearby data pointswith the same label are closed to each otherwhile the nearby pointswith dif?ferent labels are far apart.In practice,because of small sample size problem,PCA is applied to reduce the di?mension of original data space before utilizing LSDA.However,this strategymay discard important discrimina?tive information.Maximum Margin Locality Sensitive Discriminant Analysis(MM?LSDA)is proposed to over?come the above problem in this paper.The new method extracts features directly from original data,preserving the nearby data points with the same label,while aparting data points with different labels.Experiments on ORL and Yale databases show that the proposed method ismore effective.
locality sensitive discriminant analysis;feature extraction;face recognition
TP391.41
A
1671?6876(2014)03?0226?05
[責任編輯:蔣海龍]
2014?03?08
卜婷(1981?),女,江蘇連云港人,講師,碩士,研究方向為信號與圖像處理.E?mail:buting1213@126.com