人臉自動(dòng)識(shí)別技術(shù)綜述

2010-08-15 00:51:52尚麗，陳杰，張愉

蘇州市職業(yè)大學(xué)學(xué)報(bào) 2010年1期

關(guān)鍵詞：人臉識(shí)別人臉神經(jīng)網(wǎng)絡(luò)

尚麗，陳杰，張愉

(蘇州市職業(yè)大學(xué) 電子信息工程系，江蘇蘇州 215104）

傳統(tǒng)的識(shí)別方式已不能滿(mǎn)足目前人們對(duì)身份進(jìn)行有效辨識(shí)的需要，生物識(shí)別技術(shù)成為社會(huì)生活中身份認(rèn)證的重要手段[1-6].生物特征識(shí)別技術(shù)以生物技術(shù)為基礎(chǔ)，以信息技術(shù)為手段，將生物和信息兩大技術(shù)交匯融合成為一體.生物特征識(shí)別技術(shù)涉及到模式識(shí)別、計(jì)算機(jī)圖形學(xué)、圖像處理、計(jì)算機(jī)視覺(jué)以及人機(jī)交互等多個(gè)信息技術(shù)領(lǐng)域，這些相關(guān)領(lǐng)域的發(fā)展又為生物特征識(shí)別技術(shù)的進(jìn)步創(chuàng)造了條件.目前出現(xiàn)的生物識(shí)別技術(shù)產(chǎn)品都以其高科技和自動(dòng)化而得以廣為應(yīng)用，使得人們對(duì)于生物識(shí)別技術(shù)的研究越來(lái)越廣泛和深入，較為成熟的有基于人臉、指紋、手部幾何學(xué)、虹膜、視網(wǎng)膜等的識(shí)別技術(shù).

人臉是人類(lèi)視覺(jué)中最常見(jiàn)的模式，人臉識(shí)別由于其自然、直觀、非接觸、安全、快捷等特點(diǎn)而倍受關(guān)注，已經(jīng)成為最具發(fā)展?jié)摿Φ纳锾卣髯R(shí)別技術(shù)之一，也是當(dāng)前模式識(shí)別和人工智能領(lǐng)域的一個(gè)研究熱點(diǎn).但是，由于人臉結(jié)構(gòu)的復(fù)雜性、人臉表情的多樣性以及人臉成像過(guò)程的多變性等原因，人臉機(jī)器自動(dòng)識(shí)別至今仍然被公認(rèn)是一個(gè)具有挑戰(zhàn)性的研究領(lǐng)域.

1 人臉自動(dòng)識(shí)別技術(shù)的主要研究?jī)?nèi)容

人臉識(shí)別按照信息的來(lái)源可以分為兩大類(lèi)[3-4]：基于靜態(tài)人臉圖像的識(shí)別和基于包含人臉的動(dòng)態(tài)視頻信息的識(shí)別.因?yàn)閯?dòng)態(tài)視頻信息并不能明顯提高人臉識(shí)別的性能，因此本文僅涉及到靜態(tài)人臉圖像的識(shí)別.

廣義地講，人臉自動(dòng)識(shí)別技術(shù)包括人臉檢測(cè)和人臉身份認(rèn)證技術(shù).在商業(yè)系統(tǒng)和專(zhuān)利中，人臉識(shí)別是將人臉檢測(cè)作為系統(tǒng)的一個(gè)組成部分.在已發(fā)表的多數(shù)文獻(xiàn)中，人臉識(shí)別技術(shù)是指在一些假設(shè)的條件下與個(gè)人身份驗(yàn)證相關(guān)的技術(shù)(如假設(shè)輸入圖像沒(méi)有復(fù)雜的背景).概括地講，計(jì)算機(jī)人臉自動(dòng)識(shí)別技術(shù)主要包括以下幾個(gè)方面的內(nèi)容[3，5-6]：

(1) 人臉檢測(cè)，系統(tǒng)判斷輸入圖像中是否存在人臉圖像，如果存在，則同時(shí)給出存在人臉圖像的數(shù)量和位置.這個(gè)檢測(cè)過(guò)程主要受光照、面部角度、環(huán)境噪聲及各種遮擋物的影響.

(2) 人臉的規(guī)范化，校正人臉在尺度、光照和旋轉(zhuǎn)等方面的變化.

(3) 人臉表征，通常這一過(guò)程是對(duì)人臉的特征提取過(guò)程，是人臉識(shí)別技術(shù)中最重要的研究?jī)?nèi)容之一，在人臉識(shí)別中，特征的分類(lèi)能力、算法復(fù)雜度和可實(shí)現(xiàn)性是確定特征提取法需要考慮的因素，所提取特征對(duì)最終分類(lèi)結(jié)果有著決定性的影響，而分類(lèi)器所能實(shí)現(xiàn)的分辨率上限就是各類(lèi)特征間最大可區(qū)分度.

(4) 人臉識(shí)別，通過(guò)人臉特征的匹配識(shí)別完成對(duì)個(gè)人身份信息的確認(rèn)和查找，人臉識(shí)別算法屬于典型的模式識(shí)別問(wèn)題，主要有在線(xiàn)匹配和離線(xiàn)學(xué)習(xí)兩個(gè)過(guò)程組成，人臉識(shí)別的實(shí)現(xiàn)需要綜合考慮特征選擇、特征提取和分類(lèi)器設(shè)計(jì)等問(wèn)題.

(5) 人臉表情、姿態(tài)分析，通過(guò)對(duì)人臉情緒和形態(tài)對(duì)應(yīng)關(guān)系的建模，對(duì)人臉表情進(jìn)行分析、分類(lèi)處理.

(6) 生理分類(lèi)，通過(guò)對(duì)人類(lèi)生理信息和人臉形態(tài)對(duì)應(yīng)關(guān)系的研究和建模，完成對(duì)人臉年齡和性別等生理信息的推斷.

(7) 人臉編碼，對(duì)人臉表征獲得的特征進(jìn)行編碼分析.

從分類(lèi)的角度來(lái)說(shuō)，人臉驗(yàn)證是一個(gè)兩類(lèi)問(wèn)題，它驗(yàn)證的內(nèi)容是某張臉同其所“聲稱(chēng)”身份(IdeDlity)對(duì)應(yīng)的臉是否一致，因而最終給出的是一個(gè)真或假的答案.人臉辨識(shí)則是一個(gè)多類(lèi)問(wèn)題.它辨識(shí)的內(nèi)容是某張臉同數(shù)據(jù)庫(kù)中的哪一個(gè)身份相一致.因而最終給出的是一個(gè)身份標(biāo)號(hào).

2 人臉自動(dòng)識(shí)別技術(shù)的研究歷史與現(xiàn)狀

2.1 人臉自動(dòng)識(shí)別技術(shù)研究歷史的典型階段

人臉識(shí)別的研究已經(jīng)有相當(dāng)長(zhǎng)的歷史，甚至可以追溯到19世紀(jì)末20世紀(jì)初[3，6]，在當(dāng)時(shí)Galton分別于1888年和1910年在《Nature》雜志上發(fā)表了兩篇關(guān)于利用人臉進(jìn)行身份識(shí)別的文章[6]，對(duì)人類(lèi)人臉識(shí)別的能力進(jìn)行了分析.人臉識(shí)別的輸入圖像通常為正面、斜面、側(cè)面三種情況.由于人臉正面圖像包含了人臉更明顯的特征，所以大多數(shù)文獻(xiàn)對(duì)靜態(tài)人臉正面圖像的研究較多.人臉識(shí)別技術(shù)的發(fā)展過(guò)程大致可以概況為以下四個(gè)階段[4-10]：

第一階段：20世紀(jì)50年代在心理學(xué)方面的研究和60年代在工程學(xué)方面的研究.典型的文獻(xiàn)如J.S.Bruner在1954年發(fā)表的關(guān)于心理學(xué)的The perception of people；Bledsoe在1964年就工程學(xué)發(fā)表的Facial Recognition Project Report.國(guó)外高校也涌現(xiàn)了眾多研究人臉識(shí)別的研究小組[7].這些研究小組分別從不同的角度開(kāi)展該課題的研究，例如美國(guó)Texas at Dallas大學(xué)的Abdi和Tool小組[1，5，7]、英國(guó)Stirling大學(xué)的Bruce教授和Glasgow大學(xué)的Burton教授合作領(lǐng)導(dǎo)的小組主要從感知和心理學(xué)角度探索人類(lèi)識(shí)別人臉機(jī)理[3，11-12]；英國(guó)的Graw小組[13-14]和荷蘭Groningen大學(xué)的Petkov小組[15]則從視覺(jué)機(jī)理角度進(jìn)行研究.

第二階段：關(guān)于人臉的機(jī)器識(shí)別研究開(kāi)始于20世紀(jì)70年代.以Allen和Parke為代表，主要研究人臉識(shí)別所需要的面部特征.研究者用計(jì)算機(jī)實(shí)現(xiàn)了較高質(zhì)量的人臉灰度圖模型.但是，這一階段工作的特點(diǎn)是識(shí)別過(guò)程全部依賴(lài)于操作人員，不是一種可以完成自動(dòng)識(shí)別的系統(tǒng).

第三階段：人機(jī)交互式識(shí)別階段.代表性的工作如Goldstion、Harmaon和Lesk用幾何特征參數(shù)來(lái)表示人臉正面圖案，他們采用了21維特征矢量表示人臉面部特征[6，16]；Kaya和Kobayashi[6，17]采用了統(tǒng)計(jì)識(shí)別方法，用歐氏距離來(lái)表征人臉特征，如嘴唇與鼻子之間的距離、兩眼之間的距離、嘴唇的厚度等；T.Kanad[6，18]設(shè)計(jì)了一個(gè)高速而且有一定知識(shí)引導(dǎo)的半自動(dòng)回溯識(shí)別系統(tǒng)，運(yùn)用積分投影法從單幅圖像上計(jì)算出一組臉部特征參數(shù)，再利用模式分類(lèi)技術(shù)與標(biāo)準(zhǔn)人臉相匹配，該系統(tǒng)實(shí)現(xiàn)了快速、實(shí)時(shí)的處理，是一個(gè)非常大的進(jìn)步.但這類(lèi)方法需要利用操作員的某些先驗(yàn)知識(shí)，仍然擺脫不了人的干預(yù).

第四階段：20世紀(jì)90年代以來(lái)，隨著高性能計(jì)算機(jī)的出現(xiàn)，人臉識(shí)別方法有了重大突破，進(jìn)入了真正的機(jī)器自動(dòng)識(shí)別階段.近年來(lái)，隨著高速度、高性能計(jì)算機(jī)的發(fā)展，人臉模式識(shí)別方法有了較大突破，出現(xiàn)了多種機(jī)器自動(dòng)識(shí)別系統(tǒng)[6-7，10].

目前的人臉識(shí)別方法主要有三種：基于幾何特征的人臉識(shí)別方法、基于代數(shù)特征的人臉識(shí)別方法、基于連接機(jī)制的識(shí)別方法.雖然它們都取得了一定的成功，但是仍是各有其缺點(diǎn).基于幾何特征的識(shí)別方法困難在于沒(méi)有形成統(tǒng)一、優(yōu)秀的特征提取標(biāo)準(zhǔn)，由于成人面部模式千變?nèi)f化，即使是同一個(gè)人的面部圖像，由于時(shí)間、光照、攝像角度等的不同，也很難用一個(gè)統(tǒng)一的模式來(lái)表達(dá)，造成特征提取的困難；基于代數(shù)特征的識(shí)別在本質(zhì)上依賴(lài)訓(xùn)練幾何測(cè)試及圖像的灰度相關(guān)性，而且要求測(cè)試集和訓(xùn)練集比較理想，所以有很大的局限性；基于連接機(jī)制的識(shí)別方法采用神經(jīng)網(wǎng)絡(luò)，結(jié)構(gòu)上類(lèi)似于人腦，在編碼壓縮和信息處理方面有一定的優(yōu)勢(shì)，但由于原圖像數(shù)據(jù)量大，因此神經(jīng)網(wǎng)絡(luò)元很多，訓(xùn)練時(shí)間很長(zhǎng).因此，尋找有效的人臉識(shí)別算法仍是目前研究的熱點(diǎn)之一.近年來(lái)，除了基于K-L變換的特征臉?lè)椒ㄅc以奇異值特征為代表的代數(shù)特征方法取得了新進(jìn)展外，人工神經(jīng)網(wǎng)絡(luò)、小波變換在人臉識(shí)別研究中都取得了很廣泛的應(yīng)用，而且出現(xiàn)了不少新方法[6，19].

2.2 人臉檢測(cè)方法研究歷史與現(xiàn)狀

人臉檢測(cè)的早期文獻(xiàn)大約起始于20世紀(jì)60年代末[19-20]，90年代末達(dá)到高潮.90年代初，Graham等主要采取了圖像分塊(Block)方法和向量量化(Vector Quantisation)技術(shù)[21].其后十幾年的發(fā)展過(guò)程中涌現(xiàn)出大量的人臉檢測(cè)方法[19].

2.2.1 基于知識(shí)的方法

基于知識(shí)的方法是將典型的人臉形成規(guī)則庫(kù)對(duì)人臉進(jìn)行編碼，通過(guò)面部特征之間的關(guān)系進(jìn)行人臉定位.基于知識(shí)的方法是基于規(guī)則的人臉檢測(cè)方法，規(guī)則來(lái)源于研究者關(guān)于人臉的先驗(yàn)知識(shí).一般比較容易提出簡(jiǎn)單的規(guī)則來(lái)描述人臉特征和它們的相互關(guān)系，比如，一幅人臉圖像中，通常包含具有對(duì)稱(chēng)性的兩只眼睛，一個(gè)鼻子和一個(gè)嘴巴.他們之間的關(guān)系可以用相對(duì)距離和位置等規(guī)則來(lái)表示，在輸入圖像中首先提取面部特征，確定基于編碼規(guī)則的人臉候選區(qū)域.當(dāng)人臉候選區(qū)域選擇出來(lái)之后，人臉面部特征常用來(lái)作為驗(yàn)證手段以去除虛假的人臉區(qū)域.問(wèn)題在于如何制定規(guī)則：太過(guò)“寬松”和太過(guò)“嚴(yán)謹(jǐn)”的規(guī)則將導(dǎo)致“虛檢”和“漏檢”.典型的基于規(guī)則的人臉檢測(cè)方法有：Chetverikov用斑點(diǎn)(blob)和縫隙(streak)成功地表示了面部的特征[22]；Yang和Huang[23]利用分層的思想實(shí)現(xiàn)基于知識(shí)的人臉檢測(cè)方法[24]；Graf[25]將形態(tài)濾波方法應(yīng)用到面部特征定位中；Sirohey[26]使用Canlly算子對(duì)人臉圖像進(jìn)行預(yù)處理，然后用橢圓實(shí)現(xiàn)了臉部區(qū)域的擬合；Kotropoulos 和Pitas[27]利用投影方法確定了面部特征，并應(yīng)用于ACTs M2VTS庫(kù)，取得了86.5%的檢測(cè)率；盧春雨等人[28]提出的基于馬賽克的改進(jìn)鑲嵌圖方法；李華勝等人[29]提出通過(guò)區(qū)域增長(zhǎng)從人臉圖像中分割出人臉，再利用邊緣檢測(cè)、Hough 變換、模板匹配和方差投影技術(shù)快速有效地提取出人臉面部器官；姜軍等人在楊光正提出的符合人臉生理結(jié)構(gòu)特征的人臉鑲嵌圖模型的基礎(chǔ)上，提出了一種基于知識(shí)的快速人臉檢測(cè)方法[30]等.

基于規(guī)則的方法存在的問(wèn)題是很難將人類(lèi)知識(shí)轉(zhuǎn)換為明確定義的規(guī)則，另外，很難將這種方法擴(kuò)展到在不同的位置下檢測(cè)人臉，因?yàn)榱信e所有的情況是一項(xiàng)很困難的工作.

2.2.2 特征不變方法

該算法的目的是在姿態(tài)、視角或光照條件改變的情況下找到存在的結(jié)構(gòu)特征，然后使用這些特征確定人臉.這些特征包括人臉輪廓特征、灰度分布特征、器官特征、模板特征等.典型的研究工作有：楊光正提出的鑲嵌圖方法[24]；Sirohey[31]使用邊緣圖和啟發(fā)式算法來(lái)去除和組織邊緣，而只保存一個(gè)邊緣輪廓，然后用一個(gè)橢圓擬合頭部區(qū)域和背景間的邊界；Graf[25]等人提出定位灰度圖像的面部特征和人臉的檢測(cè)方法；Leung等人[32]提出基于局部特征檢測(cè)器和任意圖匹配的概率方法；Yow和Cipolla提出了一種基于二階段特征檢測(cè)的方法[33]；Han 等人提出的基于形態(tài)學(xué)的技術(shù)進(jìn)行眼部分割進(jìn)而實(shí)現(xiàn)人臉檢測(cè)的方法[34]；彭進(jìn)業(yè)等人提出的利用反對(duì)稱(chēng)雙正交小波分解實(shí)現(xiàn)多尺度對(duì)稱(chēng)變換的臉部主要特征點(diǎn)定位方法[35]；王延江等人提出的快速彩色圖像中復(fù)雜背景下人臉檢測(cè)方法[36].在模板特征匹配方面，Sakai等人最早把模板的思想用于人臉檢測(cè)[19]；Craw等人建立了主要由Sobel算子的邊緣信息刻畫(huà)的正面人臉的形狀模板[19]，并進(jìn)一步提出了多模板匹配策略來(lái)定位人臉[19]；Veukatraman提出了基于小波域邊緣信息建立的模板算法[19]；Samal等則主要用PCA的方法提取主輪廓來(lái)建立模板[19]；Miao等人采用了由Laplacian算子在面部主要特征上的邊緣信息來(lái)刻畫(huà)多級(jí)模板[19]；Yuille等人提出了變形模板的思想[19]；Lanitis等提出了PDM模型，PDM由訓(xùn)練樣本的位置信息和灰度信息確定，通過(guò)ASM搜索確定人臉的位置[19].

基于特征的方法適于簡(jiǎn)單背景下的正面單人人臉檢測(cè)，在復(fù)雜環(huán)境下或者面部有遮擋的情況下很難獲得理想的檢測(cè)效果.

2.2.3 基于膚色的方法

膚色特征是人臉檢測(cè)中最常用的一種特征.己有研究表明，不同人之間的膚色差異主要體現(xiàn)在色度上而不是強(qiáng)度上[24].因而，尋找穩(wěn)健的色度空間進(jìn)行有效的膚色區(qū)域分割是關(guān)鍵所在.常用的色度空間包括RGB空間、規(guī)范化RGB空間、HSV空間、YerCb空間、YIQ空間、YES空間、CIEXYZ和CIELtJV空間[24].常用的膚色模型有：高斯模型、混合高斯模型和直方圖模型.Terrillon等考察了九種色度空間，發(fā)現(xiàn)一般情況下，需要使用混合高斯模型才能較好地描述膚色分布區(qū)域，并同時(shí)指出，最終限制檢測(cè)性能的因素是不同色度空間中膚色和非膚色區(qū)域的重疊程度特征[24]；Rein等首先對(duì)光照進(jìn)行補(bǔ)償和色度非線(xiàn)性變換，膚色分割后產(chǎn)生人臉候選區(qū)域.并利用面部特征的映射圖(眼睛、嘴巴、以及邊緣信息)來(lái)進(jìn)行有效地驗(yàn)證[19].

基于膚色模型的人臉檢測(cè)方法應(yīng)用廣泛，對(duì)姿態(tài)不敏感，在單調(diào)背景下檢測(cè)率高，但是其在光照和復(fù)雜背景下效果不理想，故其經(jīng)常與其他方法相結(jié)合使用.

2.2.4 基于統(tǒng)計(jì)理論的方法

存儲(chǔ)幾種標(biāo)準(zhǔn)的人臉模式，用來(lái)分別描述整個(gè)人臉和面部特征；計(jì)算輸入圖像和存儲(chǔ)的模式間的相互關(guān)系并用于檢測(cè).基于統(tǒng)計(jì)理論的人臉檢測(cè)方法是利用統(tǒng)計(jì)分析與機(jī)器學(xué)習(xí)的方法來(lái)尋找人臉樣本與非臉樣本各自的統(tǒng)計(jì)特征，再用各自的特征構(gòu)建分類(lèi)器，用分類(lèi)器完成人臉檢測(cè).基于統(tǒng)計(jì)理論的人臉檢測(cè)方法主要有：

(1) 神經(jīng)網(wǎng)絡(luò)方法.Propp最早提出了用神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉檢測(cè)[19，37]；Burel利用Kohonen's SMO算法訓(xùn)練多層感知器學(xué)習(xí)正樣本和負(fù)樣本，檢測(cè)過(guò)程中對(duì)樣本在多分辨率上進(jìn)行掃描以確定是否為人臉圖像[38]；Vailant提出了多級(jí)網(wǎng)絡(luò)人臉檢測(cè)方法[39]；Rowlcy等在這方面的工作具有重要的意義[40-41]，并提出通過(guò)對(duì)輸入窗口圖像進(jìn)行旋轉(zhuǎn)等操作，可以檢測(cè)到旋轉(zhuǎn)人臉[41].其它用于人臉檢測(cè)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)還有很多，比如卷積神經(jīng)網(wǎng)絡(luò)、基于概率決策的神經(jīng)網(wǎng)絡(luò)、自相關(guān)神經(jīng)網(wǎng)絡(luò)等等[19].

(2) 支持向量機(jī)方法.Osuna等人首次把支持向量機(jī)(SVM)算法引入到人臉檢測(cè)領(lǐng)域[42].與神經(jīng)網(wǎng)絡(luò)不同的是，SVM側(cè)重于結(jié)構(gòu)風(fēng)險(xiǎn)最小化(Structura1 Risk Minimization)，其最優(yōu)超平面由支持向量來(lái)確定，而神經(jīng)網(wǎng)絡(luò)側(cè)重于訓(xùn)練誤差最小化.SVM用來(lái)訓(xùn)練人臉和非人臉兩種模式.算法在標(biāo)準(zhǔn)測(cè)試集上的檢測(cè)率達(dá)到了90%以上[19].SVM的訓(xùn)練樣本特征也已經(jīng)由最初的圖像灰度特征發(fā)展為小波特征、獨(dú)立主元特征等等[19].

(3) 線(xiàn)性子空間方法.線(xiàn)性子空間方法主要包括主成分分析方法(PCA)、線(xiàn)性判別分析方法(LD)和因式分析方法(FA)等.PCA法是K-L變換的別稱(chēng)，該方法根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行正交K-L變換，以消除原有向量與分量間的相關(guān)性，變換得到對(duì)應(yīng)特征值依次遞減的特征向量，即特征臉[19，43].線(xiàn)性判別分析方法通過(guò)某非線(xiàn)性變換把人臉圖像區(qū)域?qū)傩钥臻g的屬性向量映射到高維的特征空間，計(jì)算被測(cè)圖像區(qū)域與該特征空間的距離是否小于某一閾值來(lái)判斷其是否包含人臉.典型的方法為Yang等提出的Fisher線(xiàn)性判別方法[19].FA因素分析方法類(lèi)似于PCA方法，但不同點(diǎn)是：FA雖然也是從原變量中提取信息，以使多元問(wèn)題降維，但它是從一定的模型出發(fā)，找出幾個(gè)反映原有變量的公共因子，并力求使它們有較為合理的專(zhuān)業(yè)解釋.FA方法可以克服PCA方法對(duì)噪聲的敏感性.

(4) 隱馬爾可夫模型.HMM(Hidden Markov Model)隱馬爾可夫模型假定模式由一隨機(jī)過(guò)程的參數(shù)來(lái)表征，且參數(shù)是可以精確估計(jì)的.在建模之前，首先要確定隱狀態(tài)的數(shù)目.轉(zhuǎn)移概率函數(shù)可通過(guò)HMM學(xué)習(xí)代表觀測(cè)狀態(tài)的樣本而得到.而HMM的輸出概率值則決定了樣本的類(lèi)別屬性.Nefian等首先采用HMM 方法進(jìn)行人臉檢測(cè)[24]，此后，他還將嵌入式HMM引入人臉檢測(cè)和識(shí)別中，以進(jìn)一步提高檢測(cè)和識(shí)別精度.該方法使用了二維HMM，并且采用了二維DCT變換系數(shù)作為觀測(cè)向量.

(5) Boosting方法.Bosting在機(jī)器學(xué)習(xí)領(lǐng)域指的是通過(guò)對(duì)粗糙的、不精確的規(guī)則進(jìn)行學(xué)習(xí)、組合而產(chǎn)生出精確規(guī)則的學(xué)習(xí)方法.Adabost由Freund等人于1995年首次提出并解決了早期Bosting方法所遇到的一些實(shí)際困難而使得這一算法逐漸走向?qū)嵱肹44].Viola和Jones的貢獻(xiàn)在于提出了新的圖像特征表征模式—積分圖像(Integral image)，使得快速的特征選取成為可能[45]；基于Adabost的學(xué)習(xí)方法，將大量的弱分類(lèi)器進(jìn)行加權(quán)組合而成為強(qiáng)分類(lèi)器；通過(guò)級(jí)聯(lián)的方式快速去除非目標(biāo)區(qū)域而大幅提高檢測(cè)速度；2004年，Stan(李子青)等[46]結(jié)合特征選擇中的Floatsearch進(jìn)一步提出了FloatBoost方法用于人臉檢測(cè)，并建立了新的弱分類(lèi)器學(xué)習(xí)的統(tǒng)計(jì)模型，使得強(qiáng)分類(lèi)器的構(gòu)建所需弱分類(lèi)器的數(shù)目更少[47].到目前為止，基于Bosting的Adabos內(nèi)FIoatBost方法是集精度、速度于一體的最優(yōu)人臉檢測(cè)方法之一[19].

人臉檢測(cè)的方法相當(dāng)繁多，鑒于篇幅，不再一一論述.

2.3 人臉特征提取與識(shí)別研究歷史與現(xiàn)狀

早期人臉識(shí)別研究主要有兩大方向：基于人臉集合特征的提取方法；模板匹配的方法.Betro在1993年對(duì)這兩類(lèi)方法作了全面的介紹和比較后認(rèn)為模板匹配的方法優(yōu)于幾何特征的方法[2].目前的研究也主要有兩個(gè)方向：基于整體的研究方法，它考慮了模式的整體屬性，包括特征臉?lè)椒?、SVD分解方法、人臉等密度線(xiàn)分析匹配方法、彈性圖匹配(elastic graph matching)方法、隱馬爾科夫模型方法以及神經(jīng)網(wǎng)絡(luò)方法等；基于特征分析的方法，也就是將人臉基準(zhǔn)點(diǎn)的相對(duì)比率和其它描述人臉臉部特征的形狀參數(shù)或類(lèi)別參數(shù)等一起構(gòu)成識(shí)別特征向量.從20世紀(jì)90年代開(kāi)始，人臉識(shí)別的研究可以說(shuō)進(jìn)入了高潮期，本文將人臉識(shí)別方法歸納為以下幾種：(1) 基于幾何特征的人臉識(shí)別方法；(2) 基于模型的人臉識(shí)別方法；(3)基于統(tǒng)計(jì)的人臉識(shí)別方法；(4) 基于神經(jīng)網(wǎng)絡(luò)的識(shí)別方法；(5) 多分類(lèi)器集成方法.

2.3.1 基于幾何特征的方法

最早的這類(lèi)識(shí)別法將人臉用一個(gè)幾何特征矢量表示，用模式識(shí)別中層次聚類(lèi)的思想設(shè)計(jì)分類(lèi)器達(dá)到識(shí)別目的.采用的幾何特征主要有[4]：(1) 眉毛厚度及眉毛與眼睛中心的垂直距離；(2) 眉毛弧度的11個(gè)描述數(shù)據(jù)；(3) 鼻寬及鼻的垂直位置；(4) 嘴寬、上下唇厚度及嘴的垂直位置；(5) 下巴形狀的描述數(shù)據(jù)；(6) 鼻孔位置的臉寬；(7) 半臉寬(鼻孔與眼睛中間位置的臉寬)人臉器官的關(guān)鍵點(diǎn)分別對(duì)應(yīng)于不同的積分投影方式產(chǎn)生出的波峰波谷，根據(jù)人臉結(jié)構(gòu)的先驗(yàn)知識(shí)，可以得出人臉各器官之間的幾何位置關(guān)系.

最早的基于幾何特征的算法是由Bledsoe在1966年提出的[2，48]；Kanade首先通過(guò)測(cè)量眼角、鼻孔、嘴巴、下巴等面部特征之間的距離和它們之間角度以及其它幾何關(guān)系實(shí)現(xiàn)了人臉識(shí)別工作，但識(shí)別率較低，在一個(gè)20人的數(shù)據(jù)庫(kù)上識(shí)別率為45%～75%[2]；Brunelli和Poggio通過(guò)測(cè)量鼻子的寬度和長(zhǎng)度、嘴巴位置和下巴形狀等進(jìn)行識(shí)別，在47人的數(shù)據(jù)庫(kù)上識(shí)別率為90%[2]；Samal等人提出的側(cè)影方法也是較早的基于幾何特征的方法，該方法從人臉的側(cè)影輪廓線(xiàn)上提取特征點(diǎn)，將側(cè)影轉(zhuǎn)化為輪廓曲線(xiàn)，從中提取基準(zhǔn)點(diǎn)，根據(jù)這些點(diǎn)之間的幾何特征來(lái)進(jìn)行識(shí)別[2，7].由于側(cè)影方法較簡(jiǎn)單且應(yīng)用面小，對(duì)該方法的研究較少.

基于幾何特征的方法簡(jiǎn)單、直觀、識(shí)別速度較快、容易理解，但沒(méi)有形成統(tǒng)一的特征提取標(biāo)準(zhǔn)；從圖像中抽取穩(wěn)定的特征較困難，特別是特征受到遮擋時(shí)；對(duì)較大的表情變化或姿態(tài)變化的魯棒性較差，識(shí)別率較低.

2.3.2 基于模型的方法

早期發(fā)表的基于模型的人臉識(shí)別方法的文獻(xiàn)中，使用的模型主要為HMM隱馬爾可夫模型、主動(dòng)形狀模型ASM(Active Shape Model)[49]、主動(dòng)外觀模型(Active Appearance Model)[50].HMM模型用于人臉識(shí)別時(shí)的魯棒性較好，對(duì)表情、姿態(tài)變化不太敏感，識(shí)別率高.該模型在人臉檢測(cè)的研究歷史與現(xiàn)狀中已有論述，這里不再累述.主動(dòng)形狀模型ASM[49]方法由Cootes等人提出，這種模型也被稱(chēng)之為可變形模型.ASM主要根據(jù)形狀信息和局部灰度信息進(jìn)行建模，并能夠根據(jù)訓(xùn)練數(shù)據(jù)對(duì)于參數(shù)的調(diào)整使得形狀的改變?cè)谝粋€(gè)合理的范圍內(nèi).主動(dòng)外觀模型AAM在ASM的基礎(chǔ)上加入了紋理信息，因而，除具有ASM特性之外，還可以用于圖像的重建.在ASM和AAM的建模過(guò)程中，都用到了PCA技術(shù).目前，已經(jīng)出現(xiàn)了很多ASM、AAM的改進(jìn)模型[51-52].

3D模型在十多年前被引入到人臉識(shí)別領(lǐng)域，最近幾年有了較大的發(fā)展，是人臉識(shí)別中較有效的方法之一.Blanz等人提出的三維形態(tài)模板(3DMorphableMode)在基于三維的人臉識(shí)別方法中可以說(shuō)是一項(xiàng)開(kāi)創(chuàng)性的工作[53-54].在該方法中，圖像數(shù)據(jù)是通過(guò)一特殊的三維掃描儀(3D Laser Scaner)獲取的.因而可以采用圖形學(xué)模擬的方法對(duì)圖像采集過(guò)程的透視投影和光照模型進(jìn)行建模，使得人臉形狀和紋理等內(nèi)部屬性與攝像機(jī)配置和光照等外部參數(shù)分開(kāi)來(lái)，有利于人臉圖像的分析與識(shí)別[19].該方法對(duì)三維空間成像過(guò)程進(jìn)行模擬，通過(guò)用一個(gè)3D可變型的人臉模型對(duì)圖像進(jìn)行擬合，從圖像中估計(jì)出人臉的三維形狀和紋理信息.模型將非正面人臉圖像校正為正面人臉圖像，然后在正面人臉圖像中進(jìn)行匹配.實(shí)驗(yàn)表明在同時(shí)存在任意光照和姿態(tài)變化的情況下，該方法取得了較好的識(shí)別效果.

2.3.3 基于統(tǒng)計(jì)的方法

基于統(tǒng)計(jì)的人臉識(shí)別方法將人臉圖像視為隨機(jī)向量，從而用一些統(tǒng)計(jì)方法來(lái)分析人臉模式.典型的研究工作如下：

(1) 特征臉(EigenFace)方法最早由Turk和Pentland提出[13]，開(kāi)創(chuàng)了人臉識(shí)別領(lǐng)域的新局面.

(2) FisherFace方法是這一時(shí)期的另一重要成果[19].Belhumeur等把Swets的方法發(fā)展為FisherFace方法，并在光照變化、表情變化以及有無(wú)戴眼鏡的情況下與EigenFace作了對(duì)比試驗(yàn).在圖像條件變化較小時(shí)，二者的性能不分優(yōu)劣；但是在光照、表情變化較大時(shí)，F(xiàn)isherFace的性能更棒[19].Belhumeur還發(fā)現(xiàn)，EignFace中前三個(gè)最大的特征值對(duì)應(yīng)的主元對(duì)光照的變化比較敏感.目前，該方法依然是主流的人臉識(shí)別方法之一，并在此基礎(chǔ)上擴(kuò)展了很多方法，如零空間法[55]、增強(qiáng)判別模型[56]、直接LDA方法[57]等.

(3) Bartlett等人首次把獨(dú)立分量分析(Independent Component Analysis，ICA)方法引入到人臉識(shí)別領(lǐng)域[58]，區(qū)別于EigenFace和FisherFace，ICA認(rèn)為高階的統(tǒng)計(jì)信息對(duì)識(shí)別也是有用的.ICA的思想就是通過(guò)線(xiàn)性變換，從而找到一組相互獨(dú)立的基，即獨(dú)立主元，以此來(lái)描述樣本數(shù)據(jù).EigenFace方法是在二階統(tǒng)計(jì)意義下的去相關(guān)，而ICA方法則是在所有統(tǒng)計(jì)意義下的去相關(guān)，這也導(dǎo)致了ICA的求解相對(duì)復(fù)雜一些，目前主要有三種方法：基于信息論的方法；固定點(diǎn)算法；聯(lián)合近似對(duì)角化特征矩陣方法.對(duì)于如何自動(dòng)選取有效的獨(dú)立主元，目前還沒(méi)有一個(gè)很好的標(biāo)準(zhǔn)，通常都是根據(jù)經(jīng)驗(yàn)來(lái)選取.

(4) 非負(fù)矩陣分解(Non-negative Matrix Factorization，NMF)方法最早由Lee等人提出[57]，其思想就是要找到一組基，基的各個(gè)分量都是非負(fù)的，并且當(dāng)用這些基來(lái)線(xiàn)性表征圖像的時(shí)候，其線(xiàn)性系數(shù)也都是非負(fù)的.需要注意的是，NMF方法是基于局部特征的描述方法，而EigenFace和FisherFace方法都是一種全局描述的方法.雖然在自然場(chǎng)景中，ICA具有邊緣濾波器的作用，但是當(dāng)用獨(dú)立主元的線(xiàn)性組合來(lái)表征圖像的時(shí)候，不可避免地會(huì)存在減性關(guān)系，這一點(diǎn)也存在于EigenFace和FisherFace方法中.在Lee提出的NMF算法的基礎(chǔ)上，研究人員已提出一些新的方法，并取得了較好的實(shí)驗(yàn)效果[19].

(5) 基于核(Kernel-based)的方法.所謂“核”，其基本思想是利用非線(xiàn)性映射，把原始空間的數(shù)據(jù)映射到“核”空間中，然后在“核”空間中對(duì)數(shù)據(jù)進(jìn)行分析，但是在計(jì)算上，可以通過(guò)核函數(shù)的計(jì)算來(lái)替代這一非線(xiàn)性變換[19].基于核的方法期望將原始空間中的非線(xiàn)性問(wèn)題在“核”空間中通過(guò)線(xiàn)性分類(lèi)器得以解決.“核”的思想在支持向量機(jī)上得到了較為成功的應(yīng)用[42]，研究人員陸續(xù)研究了核主成分分析[59-60]、核判別分析[61]、核獨(dú)立主元分析[62]等一系列方法.

(6) Moghaddam等人提出了基于Bayes的人臉識(shí)別方法[2，63].應(yīng)用Bayes決策理論進(jìn)行模式分類(lèi)，首先要知道各類(lèi)的先驗(yàn)概率和概率密度函數(shù)[2].Moghaddam等人提出的是一種基于概率的圖像相似度度量方法，將人臉圖像之間的差異分為類(lèi)間差異和類(lèi)內(nèi)差異，而實(shí)際圖像之間的差異為兩者之和.由于Bayes相似度的計(jì)算涉及復(fù)雜的非線(xiàn)性計(jì)算，Moghaddam等人提出了一種線(xiàn)性的快速計(jì)算方法，這種人臉識(shí)別方法在1996年美國(guó)DAPAR組織的FERET人臉測(cè)試中取得了較好的效果[2].

(7) 基于奇異值分解(Singular Value Decomposition，SVD)的方法是一種有效的代數(shù)特征提取方法.奇異值特征具有良好的穩(wěn)定性、轉(zhuǎn)置不變性、旋轉(zhuǎn)不變性、位移不變性以及鏡像變換不變性等重要性質(zhì).因此，奇異值分解技術(shù)也被應(yīng)用到人臉識(shí)別領(lǐng)域.

(8) 基于頻域的方法.圖像的空域信息即象素的成像信息較容易受到外在因素的影響，研究人員試圖從圖像的頻域?qū)ふ腋鼮榉€(wěn)健的圖像特征.傳統(tǒng)的傅里葉變換、離散余弦變換曾被用于人臉?lè)治雠c識(shí)別；后來(lái)發(fā)展起來(lái)的小波變換、Gabor小波變換也被引入到這一領(lǐng)域.在以上方法中，Gabor小波因其具有良好的空間局部性和方向選擇性能而引起了廣泛的關(guān)注.Gabor變換所采用的核與人類(lèi)視覺(jué)皮層細(xì)胞的ZD感受特性非常的相似，能夠抓住圖像局部區(qū)域內(nèi)多個(gè)尺度和局部性結(jié)構(gòu)特征，從而使得保留總體信息的同時(shí)增強(qiáng)了局部特征.Gabor小波在圖像分析、人臉識(shí)別等方面已經(jīng)得到了廣泛的應(yīng)用[2].

(9) 基于流形學(xué)習(xí)(Manifold leaming)的方法.流形是一種非歐式幾何空間，不滿(mǎn)足傳統(tǒng)意義下的全局線(xiàn)性結(jié)構(gòu).然而，在局部意義下可以獲得近似的全局線(xiàn)性結(jié)構(gòu)，并通過(guò)各種流形學(xué)習(xí)方法發(fā)現(xiàn)其全局意義下的結(jié)構(gòu)[2].流形學(xué)習(xí)的目的是在數(shù)據(jù)集所在空間表現(xiàn)為流形結(jié)構(gòu)時(shí)，要從存在于這種空間結(jié)構(gòu)的數(shù)據(jù)集中提取出其對(duì)應(yīng)的內(nèi)蘊(yùn)結(jié)構(gòu)(hitrlnsicstructllre)及其規(guī)律[63].當(dāng)今的流形學(xué)習(xí)方法中，幾個(gè)熱點(diǎn)方法有Principal Curves[64]，Locally Linear embedding[65]，Laplacian Eigenmap[66]等.

2.3.4 基于神經(jīng)網(wǎng)絡(luò)的方法

基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法其實(shí)也是基于統(tǒng)計(jì)人臉識(shí)別方法的一種，為了突出這類(lèi)方法，故單獨(dú)作為小節(jié)進(jìn)行描述.前面已敘述過(guò)，基于神經(jīng)網(wǎng)絡(luò)的方法在人臉檢測(cè)領(lǐng)域中得到廣泛應(yīng)用，同樣地，該法也廣泛應(yīng)用于人臉識(shí)別領(lǐng)域.這類(lèi)識(shí)別法將人臉直接用灰度圖表征，利用了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)及分類(lèi)能力.其優(yōu)勢(shì)在于保存了人臉圖像中的材質(zhì)信息及細(xì)微的形狀信息，同時(shí)避免了較為復(fù)雜的特征提取工作.而且，由于圖像被整體輸入，符合格氏塔心理學(xué)中對(duì)人類(lèi)識(shí)別能力的解釋.

(1) 基于自組織映射(Self Organizing Map，SOM)的方法.1988年，Kohonen[67]最早將自組織映射SOM神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別研究，主要利用SOM的聯(lián)想能力“回憶”人臉.當(dāng)輸入圖像具有較大噪音干擾或者部分圖像丟失時(shí)，也能恢復(fù)出完整的人臉.

(2) 基于彈性圖匹配的方法.1992年，Lades M等人將動(dòng)態(tài)鏈接結(jié)構(gòu)(Dynamic Link Architecture，DLA)方法[68]用于人臉識(shí)別取得了較好的效果.DLA方法利用突觸的可塑性將神經(jīng)元集合劃分成若干圖結(jié)構(gòu)，同時(shí)保留神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn).該法將人臉用格狀的稀疏圖表示，圖中的節(jié)點(diǎn)用圖像位置的Gabor小波分解得到的特征向量標(biāo)記；圖的邊用連接節(jié)點(diǎn)的距離向量標(biāo)記.Wiskott等人使用彈性圖匹配法在FERET數(shù)據(jù)庫(kù)上得到97.3%的準(zhǔn)確率，進(jìn)一步地，Wiskott在原有方法的基礎(chǔ)上提出聚束圖匹配方法[2].

(3) 基于SOM和卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的混合神經(jīng)網(wǎng)絡(luò)方法.在SOM算法的基礎(chǔ)上，Lawrence和Giles等人[69]提出了基于SOM和卷積神經(jīng)網(wǎng)絡(luò)的混合神經(jīng)網(wǎng)絡(luò)方法.在ORL人臉庫(kù)進(jìn)行仿真實(shí)驗(yàn)的結(jié)果與用K-L變換代替SOM或者用多層感知器MLP代替卷積神經(jīng)網(wǎng)絡(luò)相比，該方法取得了較低的錯(cuò)誤率[2]；與特征臉?lè)椒ㄏ啾龋?dāng)待識(shí)別對(duì)象的訓(xùn)練樣本數(shù)1到5變化時(shí)，該方法取得了較好的識(shí)別性能[2].

(4) Lin和Kung[70]提出了一種基于概率決策的神經(jīng)網(wǎng)絡(luò)(Probabilistic Decision Based Neural Network，PDBNN)方法.該法主要利用虛擬樣本進(jìn)行強(qiáng)化和反強(qiáng)化學(xué)習(xí)，并采用模塊化的網(wǎng)絡(luò)結(jié)構(gòu)加快網(wǎng)絡(luò)學(xué)習(xí)過(guò)程.

(5) 除了上述具有代表性的人臉識(shí)別方法以外，還有許多基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法，如時(shí)滯神經(jīng)網(wǎng)絡(luò)[71](Time Delay Neural Networks，TDNN)方法、徑向基函數(shù)網(wǎng)絡(luò)(Radial Basis Function Neural Network，RBFNN)[72]、Hopfield網(wǎng)絡(luò)[73]等人臉識(shí)別方法，能夠?qū)崿F(xiàn)低分辨率人臉的聯(lián)想和識(shí)別.

對(duì)于人臉這類(lèi)復(fù)雜的、難以顯式描述的模型，基于神經(jīng)網(wǎng)絡(luò)的方法比其他類(lèi)型的方法有其獨(dú)到的優(yōu)勢(shì)：便于建模，魯棒性好，避免了復(fù)雜的特征提取工作，把模型的統(tǒng)計(jì)特征隱含于神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)中；此外，神經(jīng)網(wǎng)絡(luò)以并行方式處理信息，如果能用硬件實(shí)現(xiàn)，就能顯著提高速度.但是，神經(jīng)網(wǎng)絡(luò)方法運(yùn)算時(shí)間都較長(zhǎng)，并可能陷入局部最優(yōu).

2.3.5 多分類(lèi)器集成方法

在特定約束條件下，人臉識(shí)別可以取得較好的性能.在現(xiàn)實(shí)應(yīng)用中，人臉的表象會(huì)因?yàn)楣庹辗较?、姿態(tài)、表情變化而產(chǎn)生較大的變化，每種特點(diǎn)的識(shí)別器只對(duì)其中一部分變化敏感.因此，使用多個(gè)分類(lèi)器集成可以整合互補(bǔ)信息，提高系統(tǒng)的分類(lèi)準(zhǔn)確率.

Gutta等人提出將集成的RBF與決策樹(shù)(Decision Tree)結(jié)合起來(lái)進(jìn)行人臉識(shí)別[74]，該法結(jié)合了全局的模板匹配和離散特征的優(yōu)點(diǎn)，在350人的人臉數(shù)據(jù)庫(kù)上測(cè)試結(jié)果較好.Huang等人[75]在多特征臉空間的基礎(chǔ)上采用神經(jīng)網(wǎng)絡(luò)集成(Neural Network Ensemble)的方法實(shí)現(xiàn)了對(duì)多視角人臉的識(shí)別.該法首先將人臉深度方向的偏轉(zhuǎn)角度分為幾組(多個(gè)視角)，然后為每組(每個(gè)視角)訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)，最后對(duì)所有組對(duì)應(yīng)的多個(gè)神經(jīng)網(wǎng)絡(luò)的輸出進(jìn)行集成.實(shí)驗(yàn)表明，該法不必預(yù)先估計(jì)偏轉(zhuǎn)角度就可以取得較好的識(shí)別性能，而且能實(shí)現(xiàn)人臉偏轉(zhuǎn)角度的自動(dòng)判斷[2].Lü等人通過(guò)將PCA、ICA、LDA進(jìn)行集成人臉識(shí)別.首先分別用這三種方法對(duì)同一張人臉進(jìn)行識(shí)別，每種方法的識(shí)別分為測(cè)試人臉與數(shù)據(jù)庫(kù)中人臉的投影向量之間夾角的余弦值，然后用簡(jiǎn)單求和方式或RBF網(wǎng)絡(luò)對(duì)三個(gè)得分進(jìn)行集成，在一個(gè)包含有206個(gè)人，每人10張照片的人臉庫(kù)上進(jìn)行實(shí)驗(yàn)，集成方法的識(shí)別性能最好[2].

3 人臉識(shí)別技術(shù)的應(yīng)用

與指紋識(shí)別、視網(wǎng)膜識(shí)別、虹膜識(shí)別等技術(shù)相比，人臉識(shí)別技術(shù)有其獨(dú)特的優(yōu)勢(shì)：(1) 數(shù)據(jù)采集設(shè)備簡(jiǎn)單、快捷，不像指紋和虹膜識(shí)別那樣需要專(zhuān)用的特殊設(shè)備.一般來(lái)說(shuō)，常見(jiàn)的攝像頭就可以用來(lái)進(jìn)行人臉圖像的采集，采集一般可在數(shù)秒內(nèi)完成.(2) 無(wú)侵?jǐn)_性.只要被識(shí)別者在攝像機(jī)前停留片刻，其身份就會(huì)被正確識(shí)別，因此人臉識(shí)別無(wú)需干擾人的正常行為，無(wú)需擔(dān)心被識(shí)別者是否愿意把手指放在指紋采集設(shè)備上、被識(shí)別者的眼睛是否能夠?qū)?zhǔn)虹膜掃描裝置，被識(shí)別對(duì)象很容易接受.(3) 自然性、可視化.人類(lèi)自身也是通過(guò)人臉來(lái)鑒別人的身份，因此人臉識(shí)別是最自然的可視化身份確認(rèn)方式.鑒于上述優(yōu)點(diǎn)，人臉識(shí)別已在許多領(lǐng)域中得到廣泛應(yīng)用，而且也是極具潛力的一種生物特征身份識(shí)別方式.

目前，計(jì)算機(jī)人臉識(shí)別的應(yīng)用領(lǐng)域主要包括：(1) 個(gè)人身份識(shí)別.在信用卡、駕駛證、護(hù)照、身份證等個(gè)人身份證明中，進(jìn)行自動(dòng)個(gè)人身份辨識(shí).(2) 公安系統(tǒng).在刑偵中的尸體辨認(rèn)、罪犯辨認(rèn)，搜救中尋找失蹤人員以及公共安全保障等方面有重要應(yīng)用.(3) 政府部門(mén).在檔案管理、海關(guān)、機(jī)場(chǎng)和交通部門(mén)對(duì)身份證或駕駛執(zhí)照等證件查驗(yàn)方面有廣泛應(yīng)用.(4) 商業(yè)領(lǐng)域.ATM機(jī)、智能卡、電子商務(wù)、門(mén)禁系統(tǒng)、監(jiān)控系統(tǒng)、互聯(lián)網(wǎng)接入驗(yàn)證、用戶(hù)終端接入、視頻會(huì)議、計(jì)算機(jī)動(dòng)畫(huà)等方面對(duì)人臉識(shí)別技術(shù)有大量需求[1-6，19，24，29-30].

據(jù)統(tǒng)計(jì)，截止到2007年，人臉識(shí)別產(chǎn)品的國(guó)際市場(chǎng)份額由原來(lái)的微不足道迅速上升到12.9%，僅小于指紋識(shí)別，而且比重還在不斷增加，打破了國(guó)際生物識(shí)別市場(chǎng)上“指紋”一統(tǒng)天下的局面.而在中國(guó)，國(guó)產(chǎn)人臉識(shí)別產(chǎn)品的國(guó)際市場(chǎng)份額仍然還較小，大多數(shù)公司采用國(guó)外提供的核心技術(shù)進(jìn)行后加工，產(chǎn)品多集中在門(mén)禁和考勤機(jī)上.這些公司沒(méi)有自主知識(shí)產(chǎn)權(quán)，自主研發(fā)能力差，同時(shí)，由各種渠道獲得的核心技術(shù)水平參差不齊，其產(chǎn)品可靠性得不到保障.2007年以后，國(guó)內(nèi)的人臉識(shí)別技術(shù)迅速地發(fā)展，該領(lǐng)域內(nèi)的科研人員也取得了較大的進(jìn)展；2008年，隨著政府推動(dòng)的“平安城市”建設(shè)、城市報(bào)警與監(jiān)控系統(tǒng)(“3111”工程)的深入展開(kāi)，加之奧運(yùn)會(huì)、世博會(huì)等大型活動(dòng)的帶動(dòng)，全國(guó)進(jìn)入了安防設(shè)施建設(shè)的高潮期，安防行業(yè)持續(xù)保持了快速的增長(zhǎng).而且，除了傳統(tǒng)的考勤、門(mén)禁等應(yīng)用外，各種新的應(yīng)用需求的不斷涌現(xiàn)，也極大地推動(dòng)了這一市場(chǎng)的發(fā)展.

目前，國(guó)內(nèi)已經(jīng)具有完全自主知識(shí)產(chǎn)權(quán)的人臉識(shí)別系統(tǒng).例如中科院自動(dòng)化所的中科奧森(AuthenMetric)近紅外人臉識(shí)別系統(tǒng)和國(guó)際識(shí)別領(lǐng)域巨頭漢王科技的“漢王人臉通”人臉識(shí)別產(chǎn)品.中科奧森近紅外人臉識(shí)別系統(tǒng)獨(dú)樹(shù)一幟，徹底解決了困擾人臉識(shí)別領(lǐng)域的環(huán)境光照影響問(wèn)題.在實(shí)際應(yīng)用環(huán)境下，中科奧森近紅外人臉識(shí)別系統(tǒng)在準(zhǔn)確率和速度上在國(guó)際上絕對(duì)領(lǐng)先.該系統(tǒng)有機(jī)結(jié)合了電子標(biāo)簽和射頻識(shí)別技術(shù)，為2008年北京奧運(yùn)定制人臉識(shí)別快速身份驗(yàn)證系統(tǒng)，可以對(duì)所有持票者進(jìn)行實(shí)名制人臉身份驗(yàn)證.使用該系統(tǒng)時(shí)，事先對(duì)入場(chǎng)券持有者提交的人臉身份照片進(jìn)行掃描，提取人臉特征，并錄入信息數(shù)據(jù)庫(kù).在進(jìn)入現(xiàn)場(chǎng)時(shí)，利用視頻攝像頭對(duì)入場(chǎng)券持有者進(jìn)行人臉圖像采集，并與數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行對(duì)比，從而實(shí)現(xiàn)人臉身份識(shí)別.“漢王人臉通”是全球首款嵌入式雙攝像頭人臉識(shí)別機(jī)，它的上市標(biāo)志著人臉智能時(shí)代的到來(lái).2008年12月，在北京國(guó)際展覽中心舉行的中國(guó)國(guó)際社會(huì)公共安全產(chǎn)品博覽會(huì)上，“漢王人臉通”喜獲2008北京安博會(huì)“創(chuàng)新產(chǎn)品獎(jiǎng)”，也是門(mén)禁領(lǐng)域唯一獲獎(jiǎng)產(chǎn)品.

4 人臉識(shí)別技術(shù)中的難點(diǎn)

人臉識(shí)別包含人臉檢測(cè)與定位、人臉特征提取與分類(lèi)器等技術(shù)的綜合運(yùn)用，整個(gè)識(shí)別過(guò)程是非常困難的.這種困難一方面源于計(jì)算機(jī)本身學(xué)習(xí)能力的局限，另一方面則是由于人臉識(shí)別技術(shù)所具有的復(fù)雜性造成的.人臉具有相對(duì)穩(wěn)定的特征和結(jié)構(gòu)，這為人臉識(shí)別技術(shù)帶來(lái)了實(shí)現(xiàn)的可能，但人臉具體形態(tài)的多樣性和所處環(huán)境的復(fù)雜性又造成了識(shí)別的巨大困難.人臉識(shí)別本質(zhì)上是三維塑性物體向二維投影圖像的匹配問(wèn)題，具體的困難表現(xiàn)在：人臉結(jié)構(gòu)的復(fù)雜性；人臉的數(shù)目；不同人臉的差異；人臉隨年齡的變化；表情的變化；發(fā)型、胡須、眼鏡等對(duì)人臉的干擾；光照對(duì)人臉圖像的影響；成像角度和距離；成像背景的復(fù)雜度等等.此外，人臉是立體的，但在識(shí)別時(shí)的成像卻是平面的，所以從二維圖像重建三維人臉是個(gè)病態(tài)過(guò)程，目前尚沒(méi)有比較理想的描述人臉的三維模型.至于對(duì)人的肢體器官的識(shí)別，常常還受到背景環(huán)境的影響.

客觀來(lái)講，目前已經(jīng)報(bào)道的各類(lèi)方法都有其特定的實(shí)驗(yàn)背景，因而不可能解決人臉檢測(cè)、定位、特征提取與識(shí)別等的所有問(wèn)題.另外，以上所提到的諸多方法基本上都是建立在正視圖的基礎(chǔ)上的.當(dāng)人臉的姿態(tài)發(fā)生三維深度旋轉(zhuǎn)特別是旋轉(zhuǎn)角度超過(guò)45°時(shí)，面部特征的結(jié)構(gòu)信息的完整性會(huì)發(fā)生較大的破壞.在這種情況下，絕大多數(shù)的方法都會(huì)失效.

人臉識(shí)別技術(shù)的研究同時(shí)涉及到計(jì)算機(jī)視覺(jué)、模式識(shí)別、人工智能、心理學(xué)、生理學(xué)等諸多學(xué)科，這些使得人臉識(shí)別技術(shù)成為一項(xiàng)極富挑戰(zhàn)性的研究課題.

5 總結(jié)與展望

人臉識(shí)別技術(shù)是一個(gè)極富挑戰(zhàn)性的問(wèn)題，盡管目前存在許多的人臉檢測(cè)和人臉識(shí)別算法，但是每種算法都是在特定的實(shí)驗(yàn)環(huán)境中得到驗(yàn)證的，評(píng)價(jià)標(biāo)準(zhǔn)不統(tǒng)一，而且目前還沒(méi)有一種算法適用各種不同的實(shí)驗(yàn)環(huán)境.目前在特定的條件下人臉識(shí)別的研究算法已取得了顯著的進(jìn)展，但是，一個(gè)穩(wěn)定性和魯棒性強(qiáng)的人臉識(shí)別系統(tǒng)需要在不同的環(huán)境，如光照、人臉旋轉(zhuǎn)角度、姿勢(shì)和部分遮擋、面部表情以及外部飾物等干擾下，也具有很好的有效性和穩(wěn)定性.因此，在未來(lái)幾年中，特征獲取問(wèn)題、人臉?lè)蔷€(xiàn)性建模問(wèn)題、3D建模問(wèn)題、人臉模式的流形學(xué)習(xí)、多特征融合策略以及分類(lèi)器的泛化能力研究將是具有代表性的幾個(gè)發(fā)展方向.

[1] 張翠萍，蘇光大.人臉識(shí)別技術(shù)綜述[J].中國(guó)圖像圖形學(xué)報(bào)，2000，5(11)：885-894.

[2] 李武軍，王崇駿，張煒，等.人臉識(shí)別研究綜述[J].模式識(shí)別與人工智能，2006，19(1)：58-66.

[3] 周激流，張曄.人臉識(shí)別理論研究進(jìn)展[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào)，1999，11(2)：180-184.

[4] 趙桂敏.基于綜合集成的人臉識(shí)別[D].長(zhǎng)沙：中南大學(xué)，2004.

[5]祝秀萍，吳學(xué)毅，劉文.人臉識(shí)別綜述與展望[EB/OL].(2008-05-02)[2009-08-15] http：//www.studa.net/pc-theory/080502/ 10591461.html.

[6] 趙玲.基于獨(dú)立分量分析和非負(fù)矩陣分解的人臉識(shí)別研究[D].蘭州：蘭州大學(xué)，2006.

[7] SAMAL A，IYENGAR P A.Automatic recognition and analysis of human faces and facial expressions： a survey[J].Pattern Recognition，1992，25(1)：65-77.

[8] CHELLAPPA R，WILSON C L，SIRONEY S，et al.Human and machine recognition of faces： a survey[J].Proceedings of the IEEE，1995，83(5)：705-740.

[9] BRUNELLI R，POGGIO T.Face recognition： features versus templates[J].IEEE Trans.on Pattern Analysis and Machine Intelligence，1993，15(10)：1042-1052.

[10] VALENTIN D，ABDI H，O'TOOLE A J，et al.Connectionist models of face processing： a survey[J].Patttern Recognition，1994，27(9)：1209-1230.

[11] O'TOOLE A J，ABDI H，DEFFENBACHER K A，et al.Low-dimensional representation of faces in higher dimensions of the face space[J].Journal of the Optical Society of America A，1993，10(3)：405-411.

[12] 萬(wàn) 輝.人臉識(shí)別技術(shù)研究與實(shí)現(xiàn)[D].廣州：華南理工大學(xué)，2004.

[13] TURK M，PENTLAND A.Eigenfaces for recognition[J].Journal of Cognitive Neuroscience，1991，3(1)：71-86.

[14] BARTLETT M S，MOVELLAN J R，SEJNOWSKI T J，et al.Face recognition by independent component analysis[J].IEEE Trans.on Neural Networks，2002，13(6)：1450-1464.

[15] MANJUNATH B S，SHEKHAR C，CHELLAPPA R，et al.A new approach to image feature detection with applications[J].Pattern Recognition，1996，29(4)：627-640.

[16] GOLDSTION R J，HARMAON L D，LESK A B.Man-machine interaction in human face identification[J].Bell System Tech.，1972，51(2)：399-427.

[17] KAYA Y，KOBAYASHI K.A basic study on human recognition[J].Frontiers of Pattern Recognition，1972：265-289.

[18] KANAD T.Picture processing system by computer complex and recognition of human faces[D].Kyoto：Kyoto University，1973.

[19] 鄧忠龍.人臉識(shí)別中新算法的實(shí)現(xiàn)與改進(jìn)[D].上海：上海交通大學(xué)，2005.

[20] SAKAI T，NAGAO M，F(xiàn)UJIBAYASHI S，et al.Line extraction and pattern detection in a photograph[J].Pattern Recognition，1969，1(3)：233-248.

[21] SEXTON G，NEWCASTLE P.Automatic face detection for video conferencing[J].IEEE Colloquium on Low Bit Rate Image Coding，1990(2)：27-30.

[22] CHELVERIKOV D，LERCH A.Multiresolution face detection[J].Theoretical Foundations of Computer Vision，1993，69：131-140.

[23] YANG Guangzheng，HUANG T S.Human face detection in a complex background[J].Pattern Recognition，1994，27(1)：53-63.

[24] 趙麗紅，劉紀(jì)紅，徐心和，等.人臉檢測(cè)方法綜述[J].計(jì)算機(jī)應(yīng)用研究，2004，21(9)：1-4.

[25] GRAF H P，CHEN T，PENTAJAN E，et al.Locating faces and facial parts：proc.First Int.Workshop Automatic Face and Gesture Recognition，Zurich，June 26-28，1995[C].Zurich：WAFGR，c1995.

[26] SIROHEY S A，PITAS I.Human face segmentation and identification[D].Massachusetts：MIT，1995.

[27] KOTROPOULOS C，PITAS I.Rule-based face detection in frontal views：ICA SSP97：proc.Of IEEE Int.Conf.On Acoustics，Speech and Signal Processing，Munich，April，1997[C].New York：IEEE Press，c1997.

[28] 盧春雨，張長(zhǎng)水，聞芳，等.基于區(qū)域特征的快速人臉檢測(cè)法[J].清華大學(xué)學(xué)報(bào)：自然科學(xué)版，1999，39(1)：101-105.

[29] 李華勝，楊樺，袁保宗，等.人臉識(shí)別系統(tǒng)中的特征提取[J].北京交通大學(xué)學(xué)報(bào)，2001，25(2)：47-50.

[30] 姜軍，張桂林.一種基于知識(shí)的快速人臉檢測(cè)方法[J].中國(guó)圖像圖形學(xué)報(bào)，2002，7(1)：6-10.

[31] SIROHEY S A.Human face segmentation and identification，Technical report CS-TR-3176[R].Maryland：Univ.of Maryland，1993.

[32] LEUNG T K，BURL M C，PERONA P，et al.Finding faces in cluttered scenes using labeled random graph matching：ICCV95：proc.5th IEEE Int.Conf.Computer Vision，Boston，June，1995[C].Washington：IEEE Computer Society，c1995.

[33] YOW K C，CIPOLLA1 R.Feature-based human face detection[J].Image and Vision Computing，1997，15(9)：713-735.

[34] HAN Chinchuan，YU Kuochung，CHEN Lianghua，et al.Fast face detection via morphology-based Pre-Processing[J].Pattern Recognition，2000，33(10)：1701-1712.

[35] 彭進(jìn)業(yè)，俞卞章，王大凱，等.多尺度對(duì)稱(chēng)變換及其應(yīng)用于定位人臉特征點(diǎn)[J].電子學(xué)報(bào)，2002，30(3)：363-366.

[36] 王延江，袁保宗，唐晚芳.一種快速彩色圖像中復(fù)雜背景下人臉檢測(cè)方法[J].電子學(xué)報(bào)，2002，30(10)：1566-1569.

[37] PROPP M，SAMAL A.Artificial neural network for human face detection[J].Intelligent Eng.Systems through Artificial Neural Network，1992，2：535-540.

[38] BUREL G，CAREL D.Detection and localization of faces on digital images[J].Pattern Recognition Letters，1994，15(10)：963-967.

[39] VAILLANT R，MONROCQ C，CUN Y L，et al.Original approach for the localization of objects in images[J].IEEE proc.Vision，Image and Signal Processing，1994，141(4)：245-250.

[40] ROWLEY H A，BALUJA S，KANADE T，et al.Human face detection in visual scenes，Carnegie Mellon Computer Science Technical Report CMU-CS-95-158[R].Pittsburghers：Carnegie Mellon University，1995.

[41] ROWLEY H A，BALUJA S，KANADE T，et al.Rotation invariant neural network-based face detection：CVPR1998：proceedings of IEEE Conf.Computer Vision and Pattern Recognition，Santa Barbara，June，1998[C].New York：IEEE Computer Society，c1998.

[42] OSUNA E，F(xiàn)REUND R，GIROSI F.Support vector machines： training and applications[R].Massachusetts：AI Lab.，MIT，1997.

[43] TURK M，PENTLAND A.Eigenfaces for Recognition[J].Jounal of Cognitive Neuroscience，1991，3(1)：71-86.

[44] FREUND Y，SCHAPIRE R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences，1997，55(1)：119-139.

[45] VIOLA P，JONCES M.Rapid object detection using a boosted cascade of simple[J].IEEE Trans.on CVPR，2001，1(2)：511-518.

[46] LI STAN Z，ZHANG Zhenqiu.Floatboost learning and statistical face detection[J].IEEE Trans.on PAMI，2004，26(9)：1112-1123.

[47] PUDIL P.Floating search methods in feature selection[J].Pattern Recognition Letters，1994，15(11)：1119-1125.

[48] BLEDSOE W.Man-machine facial recognition，PRI：22[R]，Palo Alto：Panoramic Research Inc.，1966.

[49] COOTES T F，TAYLOR C J，COOPER D H，et al.Active shape models-their training and application[J].Computer Vision and Image Understanding，1995，61(1)：38-59.

[50] COOTES T F，EDWARDS G J，TAYLOR C J，et al.Active appearance models[J].IEEE Trans.on Pattern Analysis and Machine Intelligence，2001，23(6)：681-685.

[51] YAN Shuicheng，LIU Ce.Face alignment using texture-constrained active shape model[J].Image and Vision Computing，2003，21(1)：69-75.

[52] SHAN Shiguang，GAO Wen.Enhanced active shape models with global texture constraints for face image analysis：ISMIS2003：proceedings of the Fourteenth International Symposium on Methodologies for Intelligent Systems，Maebashi，October，2003[C].Hamburg：Springer，c2003.

[53] BLANZ V，VETTER T.Face recognition based on fitting a 3D morphable model[J].IEEE Trans.on PAMI，2003，25(9)：1063-1075.

[54] BLANZ V，ROMDHANI S，VETTER T，et al.Face identification across different poses and illuminations with a 3D morphable model：proc.of the 5th Int.Conference on Automatic Face and Gesture Recognition，Washington D.C.，May 20-21，2002[C].NewYork：IEEE Press，c2002.

[55] CHEN Lifen，LIAO Hongyuan，LIN Jiachen，et al.A new LDA-based face recognition system which can solve the small sample size problem[J].Pattern Recognition，2000，33(10)：1713-1726.

[56] LIU Chengjun，WECHSLER H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition[J].IEEE Trans.On Image Processing，2002，11(4)：467-476.

[57] YU Hua，YANG Jie.A direct LDA algorithm for high-dimensional data with application to face recognition[J].Pattern Recognition，2001，34(10)：2067-2070.

[58] BARTLETT M S.Independent component representations for face recognition：proceedings of SPIE Symposium on Electronic Imaging：Science and Technology Conference on Human Vision and Electronic Imaging III，San Jose，January 24-30，1998[C].San Jose：SPIE，c1998.

[59] 尚麗.稀疏編碼算法及其應(yīng)用研究[D].合肥：中國(guó)科學(xué)技術(shù)大學(xué)，2006.

[60] KIM K I，JUNG K，KIM H J，et al.Face recognition using kernel principal component analysis[J].IEEE Signal Processing Letters，2002，9(2)：40-42.

[61] BAUDAT G，ANOUAR F.Generalized discriminant analysis using a kernel approach[J].Neural Computation，2000，12：2385-2404.

[62] 張燕昆.基于核方法的人臉識(shí)別技術(shù)研究[D].上海：上海交通大學(xué)，2004.

[63] MOGHADDAM B，JEBARA T，PENTLAND A，et al.Bayesian face recogniton[J].Pattern Recognition，2000，33(11)：1771-1782.

[64] ZHANG Junping，WANG Jue.An overview of principal curves[J].Chinese Journal of Computers，2003，26(2)：1-18.

[65] TENENBAUM J B，SILVA V D，LANGFORD J C，et al.A global geometric framework for nonlinear dimensionality reduction[J].Science，2000，260：2319-2323.

[66] BELKIN M，NIYOGI P.Using manifold structure for partially labeled classification：NIPS2002：proceedings of Neural Information Processing System，Vancouver，December 9-14，2002[C].Vancouver：NIPS，c2002.

[67] KOHONEN T.Self-organization and associative memory[M].3rd ed.Berlin： Springer，1988.

[68] LADES M，VORBROGGEN J C，BUBMANN J，et al.Distortion Invariant object recognition in the dynamic link architecture[J].IEEE Trans.on Computers，1992，42(3)：300-311.

[69] LAWRENCE S，GILES C L，TSOI A C，et al.Face recognition： a convolutional neural network approach[J].IEEE Trans.on Neural Networks，1997，8(1)：98-113.

[70] LIN Shanghung，KUNG Sunyuan，LIN Longji，et al.Face recognition/detection by probabilistic decision based neural network[J].IEEE Trans.on Neural Networks，1997，8(1)：114-132.

[71] SAMARIA F S，HARTER A C.Parameterization of a stochastic model for human face identification：WACV1994：proc.of 2nd IEEE Workshop on Applications of Computer Vision，Saraota，January，1994[C].New York：IEEE Press，c1994.

[72] RANGANATH S，ARUN K.Face recognition using transform features and neural network[J].Pattern Recognition，1997，30(10)：1615-1622.

[73] HAYWOOD K，LEBBY G L，RICANEK K J，et al.Hopfield like networks for pattern recognition with applications to face recognition：ICNN1999：proc.of the International Joint Conference on Neural Networks，Washington，July，1999[C].Washington：ICNN，c1999.

[74] GUTTA S，WECHSLER H.Face recognition using hybrid classifier systems：ICNN1996：proc.of the International Conference on Neural Networks，Washington，June，1996[C].Virginia：George Mason University，c1996.

[75] HUANG Fujie，ZHANG Hongjiang，ZHOU Zhihua，et al.Pose invariant face recognition：proc.of the 4th IEEE International Conference on Automatic Face and Gesture Recognition，Grenoble，March，2000[C].New York：Institute of Electrical and Electronics Engineer，Inc.，c2000.