鄭崇微
(1.中北大學,山西 太原 030051;2.太原工業(yè)學院,山西 太原 030008)
人臉識別技術指將靜態(tài)圖像或視頻圖像中檢測出的人臉圖像與數(shù)據(jù)庫中已存的人臉圖像進行相互比照,從中找出與之匹配的人臉的過程,以達到身份鑒定與識別的目的,它是同屬于生物特征識別領域和人工智能領域的一個課題[1]。
人臉識別:是指利用已有的人臉數(shù)據(jù)庫來鑒定給定的靜止或動態(tài)圖像中的一個或多個人。
人臉自動識別系統(tǒng)包括:人臉檢測及定位和特征提取與識別兩個主要技術環(huán)節(jié),如圖1[2]。
圖1 人臉自動識別系統(tǒng)
首先,判斷圖像中是否存在人臉,若存在,則將其從背景中分離出來,并確定其在圖像中的所處位置。
在某些控制拍攝條件的場合,背景相對簡單,定位比較容易。而在復雜背景下獲得的圖像,其中人臉的位置是未知的,此時對人臉的檢測與定位將受到以下因素的影響:(1)圖像中人臉所處的位置、旋轉角度及尺度的變化;(2)化妝和發(fā)型會遮蓋某些人臉特征;(3)圖像中的噪聲影響。
主要分為圖像預處理、特征提取和人臉識別三部分:
圖像預處理:為使獲得圖像的有效特征信息更精確,一般需要在特征提取前對圖像做歸一化處理。幾何歸一化是指依據(jù)人臉定位的結果將圖像中的人臉尺度、位置調整到同樣大小和同一位置;灰度歸一化主要是采用光照補償?shù)忍幚矸椒ㄒ越鉀Q光照的改變對人臉檢測的影響。
特征提取:針對不同的識別方法,應采用不同的提取形式。如在基于幾何特征的識別方法中,需要提取特征點,然后構造特征矢量;在基于統(tǒng)計的特征臉方法中,則是提取圖像相關矩陣的特征矢量來構造特征臉;在模板匹配法中,則提取相關系數(shù)作為特征;而在基于神經(jīng)網(wǎng)絡的識別中,一般不需要專門的特征提取過程。
人臉識別:人臉識別在特征提取之后。識別的目的就是將待識別的圖像或特征與預先存放在數(shù)據(jù)庫中已知的人臉圖像或有關的特征值數(shù)據(jù)進行匹配。
基于幾何特征的人臉識別方法,通常需要檢測出重要的面部形狀特征、及其他們之間的相對位置,以及這些特征之間的距離等相關參數(shù),得到描述每個臉的特征矢量。用這些特征矢量和庫中已知臉中的特征矢量比較,尋找最佳匹配。Roder[3]對幾何特征提取的精確性進行了實驗性的研究,其結果并不滿意。
Yuille[4]等提出基于彈性模板的人臉檢測方法。用彈性模板進行人臉檢測時,將可調模板在待測圖像中移動,并動態(tài)地調整其參數(shù),計算能量函數(shù)。其優(yōu)點是因為使用了可調彈性模板,所以能夠檢測大小不同、偏轉角度不同的人臉。其缺點是彈性模板的輪廓必須在檢測前根據(jù)待測人臉的形狀來設計,否則會影響收斂的結果;進行全局搜索時,計算時間過長。
基于幾何特征的識別算法對獲得圖像的質量要求很高,要求特征點的定位要非常準確,假如人臉有一定的轉向或有裝飾物則會影響識別率。所以這種方法,現(xiàn)在常是作為其他識別方法的輔助手段。
主元分析法(PCA)最早是由Sirovitch和Kirby[5]引入人臉識別領域,其中特征臉方法是該類方法中最具代表性的。其與經(jīng)典的模板匹配算法一起成為測試人臉識別系統(tǒng)性能的基準算法。Turk 等人通過實驗指出,特征臉方法在光照變化下的正確識別率為96%,在圖像尺寸變化下的正確識別率為64%,而在人臉朝向有變化下的正確識別率為85%。
2.2.1 特征臉(Eigenface)方法[6]
Turk和Pentland 等人首先提出特征臉方法,該方法是從主成分分析(PCA)導出的一種人臉描述和識別技術。其識別過程是將人臉圖像映射到由特征臉張成的子空間上,通過比較待測人臉與已知人臉在特征臉空間中的位置差別來識別。特征臉方法的原理根據(jù)公式1 可知,是將包含人臉的圖像區(qū)域看作隨機向量,采用K-L 變換獲得其正交K-L 基,對應其中較大特征值的基,具有與人臉相似的形狀。人臉的識別與合成,正可以利用由這些基的線性組合所描述、表達和逼近人臉圖像來完成。
式中:xk為第k個訓練樣本的圖像向量,μ為訓練樣本集的平均圖向量,N為訓練樣本總數(shù)。
特征臉方法中所產生的最大特征向量,雖然考慮了圖像之間所有的差異,但是它不能區(qū)分這些差異產生的來源,即是由外在因素帶來的還是人臉本身帶來的,所以該方法有一定的局限性,研究者在此基礎上提出了許多改進的方法。
洪子泉和楊靜宇[7]提出了基于奇異值分解(SVD)的人臉識別方法。基于Sammon 最佳判斷平面,建立了Baves 分類模型。為了得到比較高的識別效果,常將SVD 與其他識別算法組合進行人臉識別。
高全學等人認為圖像奇異值是圖像在一定基空間分解得到的,該基空間是由圖像本身決定的。研究還表明奇異值向量與人臉圖像之間并不存在一一對應關系,這是因為不同的人臉圖像對應的奇異值向量所在的基空間不一致所致。
基于隱馬爾科夫模型的人臉識別方法是一種經(jīng)典算法。其理論形成于20 世紀60 年代末期和70 年代初期。Samaria等人[8]最早建立了關于人臉的隱馬爾科夫模型。因為人臉識別方法的好壞取決于對圖像原始信息的利用程度,因此他認為人臉圖像從上至下包括額頭、眼睛、鼻子、嘴巴和下巴五個顯著特征區(qū)域,隱含五個狀態(tài),可以用一組數(shù)值特征來描述人臉的各個器官。其缺點是所占存儲空間要求較大[9]。
光照問題和姿態(tài)估計與匹配問題在人臉識別領域是所面臨的關鍵問題。而為了避免光照和姿態(tài)大幅度變化對研究的影響,研究學者提出了基于圖像重建和圖像融合的人臉識別方法??煞謨煞N情況:(1)根據(jù)對人臉的多角度拍攝生成人臉的三維模型,然后進行與數(shù)據(jù)庫中的三維模型的對比。(2)根據(jù)二維人臉圖計算出姿態(tài)偏轉角度,將數(shù)據(jù)庫中三維圖按同樣角度偏轉后投影得二維圖,兩者進行匹配對比[10]。
人臉識別的復雜性決定了單獨使用任何一種現(xiàn)有的方法都不會取得很好的識別效果,如何有效地與其他生物特征識別方法結合來提高識別效率也是一個重要的研究方向。
[1]ZHAOW,CHELLAPPA R,PUILLIPS P J,et al.Face Recognition:a Literature Survey[J].ACM Computing Surveys,2003,35(4):399-458.
[2]劉永信,李琳莉,巴雅日圖.人臉識別方法綜述[J].內蒙古大學學報(自然科學版),2009,40(4):493-498.
[3]Roder N,Li X.Accuracy Analysis for Facial Feature Detection[J].Pattern Recognition,1996,29:143-157.
[4]Yuille A L.Deformable Templates for Face Recognition[J].Journal of Cognitive Neuroscience,1989,3(1):59-70.
[5]SIROVITCH L,KIRBYM.Low- dimensional Procedure for the Characterization of Human Face[J].Journal of the Optical Society of America,1987,4(3):519-524.
[6]Turk M,Pentland A.Eigenfaces for Recognition [J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[7]洪子泉,楊靜宇.用于圖像識別的圖像代數(shù)特征抽?。跩].自動化學報,1992,18(2):233-238.
[8]SAMARIA F,YOUNG S.HMM Based Architecture for Face Identification[J].Image and Computer Vision,1994,12(8):537-543.
[9]吳巾一,周德龍.人臉識別方法綜述[J]計算機應用研究,2009,26(9):3205-3209.
[10]鄒志煌,孫鑫,程武山.人臉識別技術產品的發(fā)展概況[J].視頻應用與工程,2008,32(3):91-93.