張楠 陳新 王洪信
摘 要:人臉識(shí)別技術(shù)有著重要的應(yīng)用,同時(shí)因?yàn)槿四樧R(shí)別易受干擾,對(duì)此課題的研究也面臨著許多困難之處,本文分析研究了目前流行的幾種主要的人臉識(shí)別方法,指出了克服研究難點(diǎn)的方法,并對(duì)未來(lái)的研究做出來(lái)展望,提出了有前景的研究方向。
關(guān)鍵詞:人臉識(shí)別;幾何特征;特征臉;神經(jīng)網(wǎng)絡(luò)
1 引言
人臉識(shí)別技術(shù)是生物識(shí)別技術(shù)的一種,它結(jié)合了圖像處理、模式識(shí)別、人體生理學(xué)、認(rèn)知科學(xué)等多個(gè)研究領(lǐng)域,由于人臉識(shí)別在身份認(rèn)證、視覺(jué)監(jiān)控等方面有極其廣泛的應(yīng)用前景,與指紋等其他生物特征識(shí)別方法相比,雖然人臉識(shí)別的唯一性相比指紋與虹膜識(shí)別要差,但是對(duì)于安全性要求一般的情況下,人臉識(shí)別已經(jīng)足夠滿足需求。人臉識(shí)別擁有友好、直接、信息易獲取等突出特點(diǎn),近年來(lái),人臉識(shí)別一直是科技工作者研究的熱點(diǎn)問(wèn)題。
人臉識(shí)別技術(shù)是指利用從包含人臉的靜態(tài)或動(dòng)態(tài)圖像信息中,提取出人臉的生物特征,通過(guò)某種算法,將該生物特征與已知信息做對(duì)比,從而識(shí)別出人的身份。
人臉識(shí)別技術(shù)研究早期,Bledsoe[1]以人臉特征點(diǎn)的間距、比率等參數(shù)為依據(jù),建成了一個(gè)半自動(dòng)的人臉識(shí)別系統(tǒng)。在三維人臉研究過(guò)程中,Parke[2]將人臉模型參數(shù)化,并且可以通過(guò)參數(shù)的變化產(chǎn)生簡(jiǎn)單的動(dòng)畫(huà)。隨后出現(xiàn)了使用人臉紋理合成圖像技術(shù)、幾何模型變形建模方法等。
2 人臉識(shí)別系統(tǒng)的構(gòu)成
人臉識(shí)別系統(tǒng)主要由人臉的檢測(cè)與定位[3]、人臉的規(guī)范化、人臉表征、人臉識(shí)別幾部分組成。
對(duì)于一張輸入圖像,首先要對(duì)其進(jìn)行分析,從中提取出有可能存在的人臉,之后對(duì)人臉進(jìn)行規(guī)范化處理,校正人臉在光照、角度等方面的的變化。然后利用某種算法將檢測(cè)出的人臉表示出來(lái),最后將表示出的數(shù)據(jù)與數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行比對(duì)匹配。
3 人臉識(shí)別的難點(diǎn)分析
能夠影響人臉識(shí)別的因素很多[4],最典型的如光照、姿勢(shì)、表情、背景、年齡等,這些因素的變化都會(huì)使人臉圖像產(chǎn)生明顯差別,從而使識(shí)別準(zhǔn)確率大幅度下降,目前還沒(méi)有行之有效的算法能夠完全解決消除這些因素的影響。
光照和姿態(tài)兩個(gè)因素是影響人臉識(shí)別的兩個(gè)最重要因素。為了消除它們對(duì)識(shí)別結(jié)果的影響,對(duì)于光照影響,廣泛采用的方法是擴(kuò)大樣本空間,收集各種光照和姿態(tài)下的樣本,識(shí)別匹配時(shí)考慮輸入圖像與多種條件下的樣本差異。另一種方法是結(jié)合多種識(shí)別方法,利用直方圖均等化等技術(shù)對(duì)圖像進(jìn)行處理,改進(jìn)人臉處的亮度和對(duì)比度。姿態(tài)影響方面,可以采用彈性圖匹配的方法,對(duì)面部的關(guān)鍵特征點(diǎn)變化進(jìn)行跟蹤,估計(jì)姿態(tài)參數(shù)。
4 人臉識(shí)別的主要技術(shù)
4.1 基于幾何特征的方法
早期的人臉識(shí)別研究主要是基于幾何特征。基本思想是利用人臉的主要結(jié)構(gòu)特征點(diǎn)的相對(duì)位置和相對(duì)距離。這種方法用一個(gè)幾何特征矢量將人臉表示出來(lái)。首先檢測(cè)到人臉部的特征點(diǎn),通過(guò)測(cè)量這些特征點(diǎn)的相對(duì)距離,得出特征矢量,如鼻子、眼睛、嘴的寬度和位置,以及它們之間的歐式距離,用這些特征矢量來(lái)表示人臉。將獲取的特征矢量和數(shù)據(jù)庫(kù)中已有的數(shù)據(jù)進(jìn)行匹配,直到找到最佳匹配結(jié)果?;趲缀翁卣鞯姆椒ㄔ砗?jiǎn)單,識(shí)別速度快,缺點(diǎn)是準(zhǔn)確率低。
4.2 基于代數(shù)特征的方法
基于代數(shù)特征的方法就是尋找一種變換,使人臉圖像經(jīng)變換后不但處于低維空間,且具有良好的人臉表征能力和聚類(lèi)性。
該方法主要分為以下三種:
4.2.1基于特征臉?lè)?/p>
主分量分析(PCA)[5]。主分量分析是一種常用的方法。它根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行正交變換(K-L變換),以消除原有向量各個(gè)分量之間的相關(guān)性。KL變換是圖像壓縮中的一種最優(yōu)正交變換。通過(guò)KL變換,可以把圖像從高維空間表示轉(zhuǎn)變成低維空間表示,而圖像從低維空間恢復(fù)的圖像與原圖像相比,具有最小的均方誤差,因此可以將圖像在低維空間的變換系數(shù)作為人臉圖像的描述特征。這種主特征向量所占的能量是總能量的90%以上,任何一副人臉圖像都可以表示為這組特征向量的線性組合,其加權(quán)系數(shù)稱(chēng)為該圖像的代數(shù)特征。
4.2.2線性判別分析。
線性判別分析的基本思想是將樣本從多維空間投影到一條直線上,形成一維特征空間,再利用類(lèi)的成員信息形成一組特征向量,以訓(xùn)練樣本的類(lèi)內(nèi)散布矩陣與類(lèi)間散布矩陣為基礎(chǔ)構(gòu)造最優(yōu)投影空間,線性判別分析只在樣本數(shù)較多之時(shí),優(yōu)于主分量分析。
4.2.3 獨(dú)立成分分析
獨(dú)立分量分析不僅考慮了待識(shí)別信息的低階統(tǒng)計(jì)信息,還考慮了高階信息,通過(guò)基于信號(hào)的高階統(tǒng)計(jì)特性的分析方法,使分解出的各種信號(hào)相互獨(dú)立?;舅枷胧抢镁€性變換,找到一組相互獨(dú)立的基,并以此描述樣本數(shù)據(jù)。
4.3 神經(jīng)網(wǎng)絡(luò)方法
人工神經(jīng)網(wǎng)絡(luò)[6]是在生物神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展起來(lái)的,Gutt等提出了混合神經(jīng)網(wǎng)絡(luò)、Law rence等通過(guò)一個(gè)多級(jí)的SOM實(shí)現(xiàn)樣本的聚類(lèi),將卷積神經(jīng)網(wǎng)絡(luò)CNN用于人臉識(shí)別。通常情況下,選取人臉圖像區(qū)域或包含人臉的整幅圖像作為神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),特征提取的維數(shù)由隱層節(jié)點(diǎn)個(gè)數(shù)決定,輸出層節(jié)點(diǎn)的個(gè)數(shù)為待識(shí)別人臉的類(lèi)數(shù)。神經(jīng)網(wǎng)絡(luò)方法的缺點(diǎn)是輸入節(jié)點(diǎn)龐大,結(jié)構(gòu)復(fù)雜難以訓(xùn)練。目前的神經(jīng)網(wǎng)絡(luò)方法進(jìn)行人臉識(shí)別效果還沒(méi)有取得良好的效果。
4.4 彈性匹配方法
在多數(shù)基于人臉整體圖像特征的識(shí)別方法中,人臉的姿態(tài)、表情因素的變化都對(duì)分類(lèi)識(shí)別有很大的影響,原因在于沒(méi)有考慮到人臉圖像的局部變形。彈性圖匹配方法允許局部特征有一定程度的變形,很大程度上消除了干擾,提高了識(shí)別算法的魯棒性。
該方法采用屬性拓補(bǔ)圖表述人臉模式,屬性拓補(bǔ)圖的每個(gè)頂點(diǎn)均包含一特征矢量,它記錄了人臉在該頂點(diǎn)位置的分布信息,該拓補(bǔ)圖可以使用如小波特征、統(tǒng)計(jì)特征等描述局部信息。
從二維稀疏網(wǎng)格到實(shí)際人臉圖像的映射數(shù)目很大,如此匹配所需時(shí)間極長(zhǎng),通常用嚴(yán)格硬匹配找出匹配的最佳位置。然后在此基礎(chǔ)上,隨機(jī)選取各頂點(diǎn)附近做匹配,可節(jié)省大量計(jì)算時(shí)間。
5 總結(jié)與未來(lái)展望
人臉自動(dòng)識(shí)別技術(shù)經(jīng)過(guò)多年研究,已經(jīng)取得了巨大的成就,但是在實(shí)際應(yīng)用中依然存在很多困難,要做到快速、準(zhǔn)確的檢測(cè)識(shí)別,還需要進(jìn)行多方面研究。要構(gòu)建一個(gè)穩(wěn)健的人臉識(shí)別系統(tǒng),以下是有待于解決的幾個(gè)主要問(wèn)題。
(1)準(zhǔn)確的人臉檢測(cè)是提高人臉識(shí)別的重要前提。
(1)多特征融合和多分類(lèi)器融合是改善識(shí)別性的一個(gè)手段。
(3)局部與整體信息的相互結(jié)合能有效地描述人臉的特征,如何更好地提取和組合局部與整體的特征值得深入研究。
參考文獻(xiàn)
[1]張翠平. 人臉識(shí)別技術(shù)綜述[J].中國(guó)圖象圖形學(xué)報(bào),2000.5(11):885-894.
[2]Parke F I.A parametric model of human faces[D].Salt Lake City:University of Utah,1974.
[3]Hjelmas E,Low B K.Face detection:A survey.Journal of Computer Vision and Image Understanding,2001,83(3):236-274.
[4]何東風(fēng).人臉識(shí)別技術(shù)綜述[J].微機(jī)發(fā)展,2003.12(12).75-78.
[5]董琳.人臉識(shí)別技術(shù)的研究現(xiàn)狀與展望[J].安防科技,2011(10)22-25.
[6]邵虹.基于BP神經(jīng)網(wǎng)絡(luò)的人臉圖像識(shí)別方法的研究[J].沈陽(yáng)工業(yè)大學(xué)學(xué)報(bào),2002,24(6):1832-1837.