鮑庭瑞
人臉識別是一種基于人臉特征信息的識別技術(shù),是模式識別與計算機視覺的結(jié)合[1].由于用于識別的人臉圖像易受外界因素干擾,影響識別的準確性.同時人臉識別需要與樣本數(shù)據(jù)庫中的數(shù)據(jù)進行一一比對,識別的效率也不可忽視.因此,如何快速簡便、準確可靠地進行人臉識別成為亟需解決的問題[2].
本文設(shè)計一種基于快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)和奇異值分解(Singular Value Decomposition,SVD)的人臉識別算法,先對已預(yù)處理過的人臉圖像進行二維離散傅里葉變換,將復(fù)雜的二維圖像用頻率域中的振幅譜來表示,然后用奇異值分解的方法對振幅譜進行降維,最后進行人臉的匹配識別.這兩種處理技術(shù)都有效地提高了識別率與識別速度.
人臉識別處理由人臉圖像采集及檢測、預(yù)處理、特征提取,以及匹配識別四個部分組成.如圖1所示.
圖1 人臉識別流程圖
(1)人臉圖像采集是指自動搜索并采集捕獲用戶的面部圖像,并傳輸回存儲器儲存.檢測的主要功能是檢測并校準圖像中面部位置和大小,以便進行后續(xù)處理.
(2)預(yù)處理主要是為了去除圖像采集中各種不利因素和隨機產(chǎn)生的干擾,常用的預(yù)處理方法有圖像灰度化、直方圖均衡、濾波和銳化等.本文采用直方圖均衡的方法對原始人臉圖像進行預(yù)處理.
(3)特征提取是提取預(yù)處理后人臉圖像的面部部分特征并進行建模.本文采用FFT和SVD相結(jié)合方法進行人臉的特征提?。?].
(4)匹配識別是將特征提取出的人臉特征與樣本數(shù)據(jù)庫中的樣本數(shù)據(jù)進行匹配,并輸出識別結(jié)果.
人臉識別需要建立一個樣本數(shù)據(jù)庫進行匹配,假設(shè)有P個人臉樣本數(shù)據(jù),每一個樣本數(shù)據(jù)有M幅已經(jīng)過預(yù)處理的圖像用于進行訓(xùn)練,令第i個個體的第j幅人臉圖像為Xij(i=1,…,P,j=1,…,M),訓(xùn)練方法如下:
(1)對所有Xij進行二維離散快速傅里葉變換,得到振幅譜為FXij;
(2)計算所有振幅譜FXij的均值SF=作為標準臉;
(3)對進行奇異值分解并降維,得到標準特征矩陣U*和V*;
(4)將振幅譜FXij投影到正交矩陣U*和V*上,得到低維系數(shù)矩陣作為第i個個體的樣本特征存入人臉數(shù)據(jù)庫中.
基于樣本數(shù)據(jù)庫的識別過程與樣本訓(xùn)練過程類似,先將待識別的人臉圖像進行預(yù)處理,再進行二維離散快速傅里葉變換,得到振幅譜為FYij;再將其投影到標準特征矩陣U*和V*上,得到其投影低維系數(shù)矩陣SkY;然后計算矩陣和之間的距離;最后通過比較將該人臉圖像判別到距離最小的一類[4].
第一組實驗的人臉圖像與樣本數(shù)據(jù)庫中人臉圖像表情是一致的.首先對采集到的人臉圖像利用直方圖均衡的方法進行預(yù)處理,增強圖像對比度,提高圖像質(zhì)量,如圖2所示.對圖像進行二維快速傅里葉變換,如圖3所示.
設(shè)標準臉A的奇異值分解為A=USVT,則人臉X在A的特征矩陣上的投影可記為:
人臉X能夠?qū)⒛芰看蟛糠侄技性赟X的一子陣中,其表達式如下[5]:
將人臉矩陣X投影到標準臉矩陣A的前k個最大奇異值所對應(yīng)的特征矢量U*(u1,u2…uk)、V*(v1,v2…vk)上之后,則大部分的能量都會集中在所得到的系數(shù)上,這樣就可以得到標準特征矩陣U*和V*.待識別圖像的振幅譜表征FY投影到U*和V*上,提取其投影系數(shù)特征,計算的距離進行最后的識別.識別結(jié)果如圖4所示.
圖2 圖像的預(yù)處理
圖3 圖像的二維傅里葉變換
圖4 表情一致人臉識別結(jié)果
第二組實驗的人臉圖像與樣本數(shù)據(jù)庫中人臉圖像的光照和表情略有不同,但仍然識別成功,如圖5所示.說明該人臉識別方法對光照和表情具有一定的魯棒性.
圖5 表情不同人臉識別結(jié)果
第三組實驗采用的是不完整人臉圖像,識別結(jié)果發(fā)生錯誤,如圖6所示.說明該人臉識別方法對人臉面部圖像的完整性是有要求的.
圖6 圖像不完整人臉識別結(jié)果
通過仿真實驗可以看出,基于FFT和SVD的人臉識別方法對光照和表情具有一定的不敏感性,識別效果比較好.但對人臉面部圖像的完整性要求較高.其自動化和智能化還有待進一步提高,還沒能達到與人類主觀判別一致的能力.