• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      人臉自動(dòng)識(shí)別技術(shù)綜述

      2010-08-15 00:51:52麗,陳杰,張
      關(guān)鍵詞:人臉識(shí)別人臉神經(jīng)網(wǎng)絡(luò)

      尚 麗,陳 杰,張 愉

      (蘇州市職業(yè)大學(xué) 電子信息工程系,江蘇 蘇州 215104)

      傳統(tǒng)的識(shí)別方式已不能滿(mǎn)足目前人們對(duì)身份進(jìn)行有效辨識(shí)的需要,生物識(shí)別技術(shù)成為社會(huì)生活中身份認(rèn)證的重要手段[1-6].生物特征識(shí)別技術(shù)以生物技術(shù)為基礎(chǔ),以信息技術(shù)為手段,將生物和信息兩大技術(shù)交匯融合成為一體.生物特征識(shí)別技術(shù)涉及到模式識(shí)別、計(jì)算機(jī)圖形學(xué)、圖像處理、計(jì)算機(jī)視覺(jué)以及人機(jī)交互等多個(gè)信息技術(shù)領(lǐng)域,這些相關(guān)領(lǐng)域的發(fā)展又為生物特征識(shí)別技術(shù)的進(jìn)步創(chuàng)造了條件.目前出現(xiàn)的生物識(shí)別技術(shù)產(chǎn)品都以其高科技和自動(dòng)化而得以廣為應(yīng)用,使得人們對(duì)于生物識(shí)別技術(shù)的研究越來(lái)越廣泛和深入,較為成熟的有基于人臉、指紋、手部幾何學(xué)、虹膜、視網(wǎng)膜等的識(shí)別技術(shù).

      人臉是人類(lèi)視覺(jué)中最常見(jiàn)的模式,人臉識(shí)別由于其自然、直觀、非接觸、安全、快捷等特點(diǎn)而倍受關(guān)注,已經(jīng)成為最具發(fā)展?jié)摿Φ纳锾卣髯R(shí)別技術(shù)之一,也是當(dāng)前模式識(shí)別和人工智能領(lǐng)域的一個(gè)研究熱點(diǎn).但是,由于人臉結(jié)構(gòu)的復(fù)雜性、人臉表情的多樣性以及人臉成像過(guò)程的多變性等原因,人臉機(jī)器自動(dòng)識(shí)別至今仍然被公認(rèn)是一個(gè)具有挑戰(zhàn)性的研究領(lǐng)域.

      1 人臉自動(dòng)識(shí)別技術(shù)的主要研究?jī)?nèi)容

      人臉識(shí)別按照信息的來(lái)源可以分為兩大類(lèi)[3-4]:基于靜態(tài)人臉圖像的識(shí)別和基于包含人臉的動(dòng)態(tài)視頻信息的識(shí)別.因?yàn)閯?dòng)態(tài)視頻信息并不能明顯提高人臉識(shí)別的性能,因此本文僅涉及到靜態(tài)人臉圖像的識(shí)別.

      廣義地講,人臉自動(dòng)識(shí)別技術(shù)包括人臉檢測(cè)和人臉身份認(rèn)證技術(shù).在商業(yè)系統(tǒng)和專(zhuān)利中,人臉識(shí)別是將人臉檢測(cè)作為系統(tǒng)的一個(gè)組成部分.在已發(fā)表的多數(shù)文獻(xiàn)中,人臉識(shí)別技術(shù)是指在一些假設(shè)的條件下與個(gè)人身份驗(yàn)證相關(guān)的技術(shù)(如假設(shè)輸入圖像沒(méi)有復(fù)雜的背景).概括地講,計(jì)算機(jī)人臉自動(dòng)識(shí)別技術(shù)主要包括以下幾個(gè)方面的內(nèi)容[3,5-6]:

      (1) 人臉檢測(cè),系統(tǒng)判斷輸入圖像中是否存在人臉圖像,如果存在,則同時(shí)給出存在人臉圖像的數(shù)量和位置.這個(gè)檢測(cè)過(guò)程主要受光照、面部角度、環(huán)境噪聲及各種遮擋物的影響.

      (2) 人臉的規(guī)范化,校正人臉在尺度、光照和旋轉(zhuǎn)等方面的變化.

      (3) 人臉表征,通常這一過(guò)程是對(duì)人臉的特征提取過(guò)程,是人臉識(shí)別技術(shù)中最重要的研究?jī)?nèi)容之一,在人臉識(shí)別中,特征的分類(lèi)能力、算法復(fù)雜度和可實(shí)現(xiàn)性是確定特征提取法需要考慮的因素,所提取特征對(duì)最終分類(lèi)結(jié)果有著決定性的影響,而分類(lèi)器所能實(shí)現(xiàn)的分辨率上限就是各類(lèi)特征間最大可區(qū)分度.

      (4) 人臉識(shí)別,通過(guò)人臉特征的匹配識(shí)別完成對(duì)個(gè)人身份信息的確認(rèn)和查找,人臉識(shí)別算法屬于典型的模式識(shí)別問(wèn)題,主要有在線(xiàn)匹配和離線(xiàn)學(xué)習(xí)兩個(gè)過(guò)程組成,人臉識(shí)別的實(shí)現(xiàn)需要綜合考慮特征選擇、特征提取和分類(lèi)器設(shè)計(jì)等問(wèn)題.

      (5) 人臉表情、姿態(tài)分析,通過(guò)對(duì)人臉情緒和形態(tài)對(duì)應(yīng)關(guān)系的建模,對(duì)人臉表情進(jìn)行分析、分類(lèi)處理.

      (6) 生理分類(lèi),通過(guò)對(duì)人類(lèi)生理信息和人臉形態(tài)對(duì)應(yīng)關(guān)系的研究和建模,完成對(duì)人臉年齡和性別等生理信息的推斷.

      (7) 人臉編碼,對(duì)人臉表征獲得的特征進(jìn)行編碼分析.

      從分類(lèi)的角度來(lái)說(shuō),人臉驗(yàn)證是一個(gè)兩類(lèi)問(wèn)題,它驗(yàn)證的內(nèi)容是某張臉同其所“聲稱(chēng)”身份(IdeDlity)對(duì)應(yīng)的臉是否一致,因而最終給出的是一個(gè)真或假的答案.人臉辨識(shí)則是一個(gè)多類(lèi)問(wèn)題.它辨識(shí)的內(nèi)容是某張臉同數(shù)據(jù)庫(kù)中的哪一個(gè)身份相一致.因而最終給出的是一個(gè)身份標(biāo)號(hào).

      2 人臉自動(dòng)識(shí)別技術(shù)的研究歷史與現(xiàn)狀

      2.1 人臉自動(dòng)識(shí)別技術(shù)研究歷史的典型階段

      人臉識(shí)別的研究已經(jīng)有相當(dāng)長(zhǎng)的歷史,甚至可以追溯到19世紀(jì)末20世紀(jì)初[3,6],在當(dāng)時(shí)Galton分別于1888年和1910年在《Nature》雜志上發(fā)表了兩篇關(guān)于利用人臉進(jìn)行身份識(shí)別的文章[6],對(duì)人類(lèi)人臉識(shí)別的能力進(jìn)行了分析.人臉識(shí)別的輸入圖像通常為正面、斜面、側(cè)面三種情況.由于人臉正面圖像包含了人臉更明顯的特征,所以大多數(shù)文獻(xiàn)對(duì)靜態(tài)人臉正面圖像的研究較多.人臉識(shí)別技術(shù)的發(fā)展過(guò)程大致可以概況為以下四個(gè)階段[4-10]:

      第一階段:20世紀(jì)50年代在心理學(xué)方面的研究和60年代在工程學(xué)方面的研究.典型的文獻(xiàn)如J.S.Bruner在1954年發(fā)表的關(guān)于心理學(xué)的The perception of people;Bledsoe在1964年就工程學(xué)發(fā)表的Facial Recognition Project Report.國(guó)外高校也涌現(xiàn)了眾多研究人臉識(shí)別的研究小組[7].這些研究小組分別從不同的角度開(kāi)展該課題的研究,例如美國(guó)Texas at Dallas大學(xué)的Abdi和Tool小組[1,5,7]、英國(guó)Stirling大學(xué)的Bruce教授和Glasgow大學(xué)的Burton教授合作領(lǐng)導(dǎo)的小組主要從感知和心理學(xué)角度探索人類(lèi)識(shí)別人臉機(jī)理[3,11-12];英國(guó)的Graw小組[13-14]和荷蘭Groningen大學(xué)的Petkov小組[15]則從視覺(jué)機(jī)理角度進(jìn)行研究.

      第二階段:關(guān)于人臉的機(jī)器識(shí)別研究開(kāi)始于20世紀(jì)70年代.以Allen和Parke為代表,主要研究人臉識(shí)別所需要的面部特征.研究者用計(jì)算機(jī)實(shí)現(xiàn)了較高質(zhì)量的人臉灰度圖模型.但是,這一階段工作的特點(diǎn)是識(shí)別過(guò)程全部依賴(lài)于操作人員,不是一種可以完成自動(dòng)識(shí)別的系統(tǒng).

      第三階段:人機(jī)交互式識(shí)別階段.代表性的工作如Goldstion、Harmaon和Lesk用幾何特征參數(shù)來(lái)表示人臉正面圖案,他們采用了21維特征矢量表示人臉面部特征[6,16];Kaya和Kobayashi[6,17]采用了統(tǒng)計(jì)識(shí)別方法,用歐氏距離來(lái)表征人臉特征,如嘴唇與鼻子之間的距離、兩眼之間的距離、嘴唇的厚度等;T.Kanad[6,18]設(shè)計(jì)了一個(gè)高速而且有一定知識(shí)引導(dǎo)的半自動(dòng)回溯識(shí)別系統(tǒng),運(yùn)用積分投影法從單幅圖像上計(jì)算出一組臉部特征參數(shù),再利用模式分類(lèi)技術(shù)與標(biāo)準(zhǔn)人臉相匹配,該系統(tǒng)實(shí)現(xiàn)了快速、實(shí)時(shí)的處理,是一個(gè)非常大的進(jìn)步.但這類(lèi)方法需要利用操作員的某些先驗(yàn)知識(shí),仍然擺脫不了人的干預(yù).

      第四階段:20世紀(jì)90年代以來(lái),隨著高性能計(jì)算機(jī)的出現(xiàn),人臉識(shí)別方法有了重大突破,進(jìn)入了真正的機(jī)器自動(dòng)識(shí)別階段.近年來(lái),隨著高速度、高性能計(jì)算機(jī)的發(fā)展,人臉模式識(shí)別方法有了較大突破,出現(xiàn)了多種機(jī)器自動(dòng)識(shí)別系統(tǒng)[6-7,10].

      目前的人臉識(shí)別方法主要有三種:基于幾何特征的人臉識(shí)別方法、基于代數(shù)特征的人臉識(shí)別方法、基于連接機(jī)制的識(shí)別方法.雖然它們都取得了一定的成功,但是仍是各有其缺點(diǎn).基于幾何特征的識(shí)別方法困難在于沒(méi)有形成統(tǒng)一、優(yōu)秀的特征提取標(biāo)準(zhǔn),由于成人面部模式千變?nèi)f化,即使是同一個(gè)人的面部圖像,由于時(shí)間、光照、攝像角度等的不同,也很難用一個(gè)統(tǒng)一的模式來(lái)表達(dá),造成特征提取的困難;基于代數(shù)特征的識(shí)別在本質(zhì)上依賴(lài)訓(xùn)練幾何測(cè)試及圖像的灰度相關(guān)性,而且要求測(cè)試集和訓(xùn)練集比較理想,所以有很大的局限性;基于連接機(jī)制的識(shí)別方法采用神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)上類(lèi)似于人腦,在編碼壓縮和信息處理方面有一定的優(yōu)勢(shì),但由于原圖像數(shù)據(jù)量大,因此神經(jīng)網(wǎng)絡(luò)元很多,訓(xùn)練時(shí)間很長(zhǎng).因此,尋找有效的人臉識(shí)別算法仍是目前研究的熱點(diǎn)之一.近年來(lái),除了基于K-L變換的特征臉?lè)椒ㄅc以奇異值特征為代表的代數(shù)特征方法取得了新進(jìn)展外,人工神經(jīng)網(wǎng)絡(luò)、小波變換在人臉識(shí)別研究中都取得了很廣泛的應(yīng)用,而且出現(xiàn)了不少新方法[6,19].

      2.2 人臉檢測(cè)方法研究歷史與現(xiàn)狀

      人臉檢測(cè)的早期文獻(xiàn)大約起始于20世紀(jì)60年代末[19-20],90年代末達(dá)到高潮.90年代初,Graham等主要采取了圖像分塊(Block)方法和向量量化(Vector Quantisation)技術(shù)[21].其后十幾年的發(fā)展過(guò)程中涌現(xiàn)出大量的人臉檢測(cè)方法[19].

      2.2.1 基于知識(shí)的方法

      基于知識(shí)的方法是將典型的人臉形成規(guī)則庫(kù)對(duì)人臉進(jìn)行編碼,通過(guò)面部特征之間的關(guān)系進(jìn)行人臉定位.基于知識(shí)的方法是基于規(guī)則的人臉檢測(cè)方法,規(guī)則來(lái)源于研究者關(guān)于人臉的先驗(yàn)知識(shí).一般比較容易提出簡(jiǎn)單的規(guī)則來(lái)描述人臉特征和它們的相互關(guān)系,比如,一幅人臉圖像中,通常包含具有對(duì)稱(chēng)性的兩只眼睛,一個(gè)鼻子和一個(gè)嘴巴.他們之間的關(guān)系可以用相對(duì)距離和位置等規(guī)則來(lái)表示,在輸入圖像中首先提取面部特征,確定基于編碼規(guī)則的人臉候選區(qū)域.當(dāng)人臉候選區(qū)域選擇出來(lái)之后,人臉面部特征常用來(lái)作為驗(yàn)證手段以去除虛假的人臉區(qū)域.問(wèn)題在于如何制定規(guī)則:太過(guò)“寬松”和太過(guò)“嚴(yán)謹(jǐn)”的規(guī)則將導(dǎo)致“虛檢”和“漏檢”.典型的基于規(guī)則的人臉檢測(cè)方法有:Chetverikov用斑點(diǎn)(blob)和縫隙(streak)成功地表示了面部的特征[22];Yang和Huang[23]利用分層的思想實(shí)現(xiàn)基于知識(shí)的人臉檢測(cè)方法[24];Graf[25]將形態(tài)濾波方法應(yīng)用到面部特征定位中;Sirohey[26]使用Canlly算子對(duì)人臉圖像進(jìn)行預(yù)處理,然后用橢圓實(shí)現(xiàn)了臉部區(qū)域的擬合;Kotropoulos 和Pitas[27]利用投影方法確定了面部特征,并應(yīng)用于ACTs M2VTS庫(kù),取得了86.5%的檢測(cè)率;盧春雨等人[28]提出的基于馬賽克的改進(jìn)鑲嵌圖方法;李華勝等人[29]提出通過(guò)區(qū)域增長(zhǎng)從人臉圖像中分割出人臉,再利用邊緣檢測(cè)、Hough 變換、模板匹配和方差投影技術(shù)快速有效地提取出人臉面部器官;姜軍等人在楊光正提出的符合人臉生理結(jié)構(gòu)特征的人臉鑲嵌圖模型的基礎(chǔ)上,提出了一種基于知識(shí)的快速人臉檢測(cè)方法[30]等.

      基于規(guī)則的方法存在的問(wèn)題是很難將人類(lèi)知識(shí)轉(zhuǎn)換為明確定義的規(guī)則,另外,很難將這種方法擴(kuò)展到在不同的位置下檢測(cè)人臉,因?yàn)榱信e所有的情況是一項(xiàng)很困難的工作.

      2.2.2 特征不變方法

      該算法的目的是在姿態(tài)、視角或光照條件改變的情況下找到存在的結(jié)構(gòu)特征,然后使用這些特征確定人臉.這些特征包括人臉輪廓特征、灰度分布特征、器官特征、模板特征等.典型的研究工作有:楊光正提出的鑲嵌圖方法[24];Sirohey[31]使用邊緣圖和啟發(fā)式算法來(lái)去除和組織邊緣,而只保存一個(gè)邊緣輪廓,然后用一個(gè)橢圓擬合頭部區(qū)域和背景間的邊界;Graf[25]等人提出定位灰度圖像的面部特征和人臉的檢測(cè)方法;Leung等人[32]提出基于局部特征檢測(cè)器和任意圖匹配的概率方法;Yow和Cipolla提出了一種基于二階段特征檢測(cè)的方法[33];Han 等人提出的基于形態(tài)學(xué)的技術(shù)進(jìn)行眼部分割進(jìn)而實(shí)現(xiàn)人臉檢測(cè)的方法[34];彭進(jìn)業(yè)等人提出的利用反對(duì)稱(chēng)雙正交小波分解實(shí)現(xiàn)多尺度對(duì)稱(chēng)變換的臉部主要特征點(diǎn)定位方法[35];王延江等人提出的快速彩色圖像中復(fù)雜背景下人臉檢測(cè)方法[36].在模板特征匹配方面,Sakai等人最早把模板的思想用于人臉檢測(cè)[19];Craw等人建立了主要由Sobel算子的邊緣信息刻畫(huà)的正面人臉的形狀模板[19],并進(jìn)一步提出了多模板匹配策略來(lái)定位人臉[19];Veukatraman提出了基于小波域邊緣信息建立的模板算法[19];Samal等則主要用PCA的方法提取主輪廓來(lái)建立模板[19];Miao等人采用了由Laplacian算子在面部主要特征上的邊緣信息來(lái)刻畫(huà)多級(jí)模板[19];Yuille等人提出了變形模板的思想[19];Lanitis等提出了PDM模型,PDM由訓(xùn)練樣本的位置信息和灰度信息確定,通過(guò)ASM搜索確定人臉的位置[19].

      基于特征的方法適于簡(jiǎn)單背景下的正面單人人臉檢測(cè),在復(fù)雜環(huán)境下或者面部有遮擋的情況下很難獲得理想的檢測(cè)效果.

      2.2.3 基于膚色的方法

      膚色特征是人臉檢測(cè)中最常用的一種特征.己有研究表明,不同人之間的膚色差異主要體現(xiàn)在色度上而不是強(qiáng)度上[24].因而,尋找穩(wěn)健的色度空間進(jìn)行有效的膚色區(qū)域分割是關(guān)鍵所在.常用的色度空間包括RGB空間、規(guī)范化RGB空間、HSV空間、YerCb空間、YIQ空間、YES空間、CIEXYZ和CIELtJV空間[24].常用的膚色模型有:高斯模型、混合高斯模型和直方圖模型.Terrillon等考察了九種色度空間,發(fā)現(xiàn)一般情況下,需要使用混合高斯模型才能較好地描述膚色分布區(qū)域,并同時(shí)指出,最終限制檢測(cè)性能的因素是不同色度空間中膚色和非膚色區(qū)域的重疊程度特征[24];Rein等首先對(duì)光照進(jìn)行補(bǔ)償和色度非線(xiàn)性變換,膚色分割后產(chǎn)生人臉候選區(qū)域.并利用面部特征的映射圖(眼睛、嘴巴、以及邊緣信息)來(lái)進(jìn)行有效地驗(yàn)證[19].

      基于膚色模型的人臉檢測(cè)方法應(yīng)用廣泛,對(duì)姿態(tài)不敏感,在單調(diào)背景下檢測(cè)率高,但是其在光照和復(fù)雜背景下效果不理想,故其經(jīng)常與其他方法相結(jié)合使用.

      2.2.4 基于統(tǒng)計(jì)理論的方法

      存儲(chǔ)幾種標(biāo)準(zhǔn)的人臉模式,用來(lái)分別描述整個(gè)人臉和面部特征;計(jì)算輸入圖像和存儲(chǔ)的模式間的相互關(guān)系并用于檢測(cè).基于統(tǒng)計(jì)理論的人臉檢測(cè)方法是利用統(tǒng)計(jì)分析與機(jī)器學(xué)習(xí)的方法來(lái)尋找人臉樣本與非臉樣本各自的統(tǒng)計(jì)特征,再用各自的特征構(gòu)建分類(lèi)器,用分類(lèi)器完成人臉檢測(cè).基于統(tǒng)計(jì)理論的人臉檢測(cè)方法主要有:

      (1) 神經(jīng)網(wǎng)絡(luò)方法.Propp最早提出了用神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉檢測(cè)[19,37];Burel利用Kohonen's SMO算法訓(xùn)練多層感知器學(xué)習(xí)正樣本和負(fù)樣本,檢測(cè)過(guò)程中對(duì)樣本在多分辨率上進(jìn)行掃描以確定是否為人臉圖像[38];Vailant提出了多級(jí)網(wǎng)絡(luò)人臉檢測(cè)方法[39];Rowlcy等在這方面的工作具有重要的意義[40-41],并提出通過(guò)對(duì)輸入窗口圖像進(jìn)行旋轉(zhuǎn)等操作,可以檢測(cè)到旋轉(zhuǎn)人臉[41].其它用于人臉檢測(cè)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)還有很多,比如卷積神經(jīng)網(wǎng)絡(luò)、基于概率決策的神經(jīng)網(wǎng)絡(luò)、自相關(guān)神經(jīng)網(wǎng)絡(luò)等等[19].

      (2) 支持向量機(jī)方法.Osuna等人首次把支持向量機(jī)(SVM)算法引入到人臉檢測(cè)領(lǐng)域[42].與神經(jīng)網(wǎng)絡(luò)不同的是,SVM側(cè)重于結(jié)構(gòu)風(fēng)險(xiǎn)最小化(Structura1 Risk Minimization),其最優(yōu)超平面由支持向量來(lái)確定,而神經(jīng)網(wǎng)絡(luò)側(cè)重于訓(xùn)練誤差最小化.SVM用來(lái)訓(xùn)練人臉和非人臉兩種模式.算法在標(biāo)準(zhǔn)測(cè)試集上的檢測(cè)率達(dá)到了90%以上[19].SVM的訓(xùn)練樣本特征也已經(jīng)由最初的圖像灰度特征發(fā)展為小波特征、獨(dú)立主元特征等等[19].

      (3) 線(xiàn)性子空間方法.線(xiàn)性子空間方法主要包括主成分分析方法(PCA)、線(xiàn)性判別分析方法(LD)和因式分析方法(FA)等.PCA法是K-L變換的別稱(chēng),該方法根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行正交K-L變換,以消除原有向量與分量間的相關(guān)性,變換得到對(duì)應(yīng)特征值依次遞減的特征向量,即特征臉[19,43].線(xiàn)性判別分析方法通過(guò)某非線(xiàn)性變換把人臉圖像區(qū)域?qū)傩钥臻g的屬性向量映射到高維的特征空間,計(jì)算被測(cè)圖像區(qū)域與該特征空間的距離是否小于某一閾值來(lái)判斷其是否包含人臉.典型的方法為Yang等提出的Fisher線(xiàn)性判別方法[19].FA因素分析方法類(lèi)似于PCA方法,但不同點(diǎn)是:FA雖然也是從原變量中提取信息,以使多元問(wèn)題降維,但它是從一定的模型出發(fā),找出幾個(gè)反映原有變量的公共因子,并力求使它們有較為合理的專(zhuān)業(yè)解釋.FA方法可以克服PCA方法對(duì)噪聲的敏感性.

      (4) 隱馬爾可夫模型.HMM(Hidden Markov Model)隱馬爾可夫模型假定模式由一隨機(jī)過(guò)程的參數(shù)來(lái)表征,且參數(shù)是可以精確估計(jì)的.在建模之前,首先要確定隱狀態(tài)的數(shù)目.轉(zhuǎn)移概率函數(shù)可通過(guò)HMM學(xué)習(xí)代表觀測(cè)狀態(tài)的樣本而得到.而HMM的輸出概率值則決定了樣本的類(lèi)別屬性.Nefian等首先采用HMM 方法進(jìn)行人臉檢測(cè)[24],此后,他還將嵌入式HMM引入人臉檢測(cè)和識(shí)別中,以進(jìn)一步提高檢測(cè)和識(shí)別精度.該方法使用了二維HMM,并且采用了二維DCT變換系數(shù)作為觀測(cè)向量.

      (5) Boosting方法.Bosting在機(jī)器學(xué)習(xí)領(lǐng)域指的是通過(guò)對(duì)粗糙的、不精確的規(guī)則進(jìn)行學(xué)習(xí)、組合而產(chǎn)生出精確規(guī)則的學(xué)習(xí)方法.Adabost由Freund等人于1995年首次提出并解決了早期Bosting方法所遇到的一些實(shí)際困難而使得這一算法逐漸走向?qū)嵱肹44].Viola和Jones的貢獻(xiàn)在于提出了新的圖像特征表征模式—積分圖像(Integral image),使得快速的特征選取成為可能[45];基于Adabost的學(xué)習(xí)方法,將大量的弱分類(lèi)器進(jìn)行加權(quán)組合而成為強(qiáng)分類(lèi)器;通過(guò)級(jí)聯(lián)的方式快速去除非目標(biāo)區(qū)域而大幅提高檢測(cè)速度;2004年,Stan(李子青)等[46]結(jié)合特征選擇中的Floatsearch進(jìn)一步提出了FloatBoost方法用于人臉檢測(cè),并建立了新的弱分類(lèi)器學(xué)習(xí)的統(tǒng)計(jì)模型,使得強(qiáng)分類(lèi)器的構(gòu)建所需弱分類(lèi)器的數(shù)目更少[47].到目前為止,基于Bosting的Adabos內(nèi)FIoatBost方法是集精度、速度于一體的最優(yōu)人臉檢測(cè)方法之一[19].

      人臉檢測(cè)的方法相當(dāng)繁多,鑒于篇幅,不再一一論述.

      2.3 人臉特征提取與識(shí)別研究歷史與現(xiàn)狀

      早期人臉識(shí)別研究主要有兩大方向:基于人臉集合特征的提取方法;模板匹配的方法.Betro在1993年對(duì)這兩類(lèi)方法作了全面的介紹和比較后認(rèn)為模板匹配的方法優(yōu)于幾何特征的方法[2].目前的研究也主要有兩個(gè)方向:基于整體的研究方法,它考慮了模式的整體屬性,包括特征臉?lè)椒?、SVD分解方法、人臉等密度線(xiàn)分析匹配方法、彈性圖匹配(elastic graph matching)方法、隱馬爾科夫模型方法以及神經(jīng)網(wǎng)絡(luò)方法等;基于特征分析的方法,也就是將人臉基準(zhǔn)點(diǎn)的相對(duì)比率和其它描述人臉臉部特征的形狀參數(shù)或類(lèi)別參數(shù)等一起構(gòu)成識(shí)別特征向量.從20世紀(jì)90年代開(kāi)始,人臉識(shí)別的研究可以說(shuō)進(jìn)入了高潮期,本文將人臉識(shí)別方法歸納為以下幾種:(1) 基于幾何特征的人臉識(shí)別方法;(2) 基于模型的人臉識(shí)別方法;(3)基于統(tǒng)計(jì)的人臉識(shí)別方法;(4) 基于神經(jīng)網(wǎng)絡(luò)的識(shí)別方法;(5) 多分類(lèi)器集成方法.

      2.3.1 基于幾何特征的方法

      最早的這類(lèi)識(shí)別法將人臉用一個(gè)幾何特征矢量表示,用模式識(shí)別中層次聚類(lèi)的思想設(shè)計(jì)分類(lèi)器達(dá)到識(shí)別目的.采用的幾何特征主要有[4]:(1) 眉毛厚度及眉毛與眼睛中心的垂直距離;(2) 眉毛弧度的11個(gè)描述數(shù)據(jù);(3) 鼻寬及鼻的垂直位置;(4) 嘴寬、上下唇厚度及嘴的垂直位置;(5) 下巴形狀的描述數(shù)據(jù);(6) 鼻孔位置的臉寬;(7) 半臉寬(鼻孔與眼睛中間位置的臉寬)人臉器官的關(guān)鍵點(diǎn)分別對(duì)應(yīng)于不同的積分投影方式產(chǎn)生出的波峰波谷,根據(jù)人臉結(jié)構(gòu)的先驗(yàn)知識(shí),可以得出人臉各器官之間的幾何位置關(guān)系.

      最早的基于幾何特征的算法是由Bledsoe在1966年提出的[2,48];Kanade首先通過(guò)測(cè)量眼角、鼻孔、嘴巴、下巴等面部特征之間的距離和它們之間角度以及其它幾何關(guān)系實(shí)現(xiàn)了人臉識(shí)別工作,但識(shí)別率較低,在一個(gè)20人的數(shù)據(jù)庫(kù)上識(shí)別率為45%~75%[2];Brunelli和Poggio通過(guò)測(cè)量鼻子的寬度和長(zhǎng)度、嘴巴位置和下巴形狀等進(jìn)行識(shí)別,在47人的數(shù)據(jù)庫(kù)上識(shí)別率為90%[2];Samal等人提出的側(cè)影方法也是較早的基于幾何特征的方法,該方法從人臉的側(cè)影輪廓線(xiàn)上提取特征點(diǎn),將側(cè)影轉(zhuǎn)化為輪廓曲線(xiàn),從中提取基準(zhǔn)點(diǎn),根據(jù)這些點(diǎn)之間的幾何特征來(lái)進(jìn)行識(shí)別[2,7].由于側(cè)影方法較簡(jiǎn)單且應(yīng)用面小,對(duì)該方法的研究較少.

      基于幾何特征的方法簡(jiǎn)單、直觀、識(shí)別速度較快、容易理解,但沒(méi)有形成統(tǒng)一的特征提取標(biāo)準(zhǔn);從圖像中抽取穩(wěn)定的特征較困難,特別是特征受到遮擋時(shí);對(duì)較大的表情變化或姿態(tài)變化的魯棒性較差,識(shí)別率較低.

      2.3.2 基于模型的方法

      早期發(fā)表的基于模型的人臉識(shí)別方法的文獻(xiàn)中,使用的模型主要為HMM隱馬爾可夫模型、主動(dòng)形狀模型ASM(Active Shape Model)[49]、主動(dòng)外觀模型(Active Appearance Model)[50].HMM模型用于人臉識(shí)別時(shí)的魯棒性較好,對(duì)表情、姿態(tài)變化不太敏感,識(shí)別率高.該模型在人臉檢測(cè)的研究歷史與現(xiàn)狀中已有論述,這里不再累述.主動(dòng)形狀模型ASM[49]方法由Cootes等人提出,這種模型也被稱(chēng)之為可變形模型.ASM主要根據(jù)形狀信息和局部灰度信息進(jìn)行建模,并能夠根據(jù)訓(xùn)練數(shù)據(jù)對(duì)于參數(shù)的調(diào)整使得形狀的改變?cè)谝粋€(gè)合理的范圍內(nèi).主動(dòng)外觀模型AAM在ASM的基礎(chǔ)上加入了紋理信息,因而,除具有ASM特性之外,還可以用于圖像的重建.在ASM和AAM的建模過(guò)程中,都用到了PCA技術(shù).目前,已經(jīng)出現(xiàn)了很多ASM、AAM的改進(jìn)模型[51-52].

      3D模型在十多年前被引入到人臉識(shí)別領(lǐng)域,最近幾年有了較大的發(fā)展,是人臉識(shí)別中較有效的方法之一.Blanz等人提出的三維形態(tài)模板(3DMorphableMode)在基于三維的人臉識(shí)別方法中可以說(shuō)是一項(xiàng)開(kāi)創(chuàng)性的工作[53-54].在該方法中,圖像數(shù)據(jù)是通過(guò)一特殊的三維掃描儀(3D Laser Scaner)獲取的.因而可以采用圖形學(xué)模擬的方法對(duì)圖像采集過(guò)程的透視投影和光照模型進(jìn)行建模,使得人臉形狀和紋理等內(nèi)部屬性與攝像機(jī)配置和光照等外部參數(shù)分開(kāi)來(lái),有利于人臉圖像的分析與識(shí)別[19].該方法對(duì)三維空間成像過(guò)程進(jìn)行模擬,通過(guò)用一個(gè)3D可變型的人臉模型對(duì)圖像進(jìn)行擬合,從圖像中估計(jì)出人臉的三維形狀和紋理信息.模型將非正面人臉圖像校正為正面人臉圖像,然后在正面人臉圖像中進(jìn)行匹配.實(shí)驗(yàn)表明在同時(shí)存在任意光照和姿態(tài)變化的情況下,該方法取得了較好的識(shí)別效果.

      2.3.3 基于統(tǒng)計(jì)的方法

      基于統(tǒng)計(jì)的人臉識(shí)別方法將人臉圖像視為隨機(jī)向量,從而用一些統(tǒng)計(jì)方法來(lái)分析人臉模式.典型的研究工作如下:

      (1) 特征臉(EigenFace)方法最早由Turk和Pentland提出[13],開(kāi)創(chuàng)了人臉識(shí)別領(lǐng)域的新局面.

      (2) FisherFace方法是這一時(shí)期的另一重要成果[19].Belhumeur等把Swets的方法發(fā)展為FisherFace方法,并在光照變化、表情變化以及有無(wú)戴眼鏡的情況下與EigenFace作了對(duì)比試驗(yàn).在圖像條件變化較小時(shí),二者的性能不分優(yōu)劣;但是在光照、表情變化較大時(shí),F(xiàn)isherFace的性能更棒[19].Belhumeur還發(fā)現(xiàn),EignFace中前三個(gè)最大的特征值對(duì)應(yīng)的主元對(duì)光照的變化比較敏感.目前,該方法依然是主流的人臉識(shí)別方法之一,并在此基礎(chǔ)上擴(kuò)展了很多方法,如零空間法[55]、增強(qiáng)判別模型[56]、直接LDA方法[57]等.

      (3) Bartlett等人首次把獨(dú)立分量分析(Independent Component Analysis,ICA)方法引入到人臉識(shí)別領(lǐng)域[58],區(qū)別于EigenFace和FisherFace,ICA認(rèn)為高階的統(tǒng)計(jì)信息對(duì)識(shí)別也是有用的.ICA的思想就是通過(guò)線(xiàn)性變換,從而找到一組相互獨(dú)立的基,即獨(dú)立主元,以此來(lái)描述樣本數(shù)據(jù).EigenFace方法是在二階統(tǒng)計(jì)意義下的去相關(guān),而ICA方法則是在所有統(tǒng)計(jì)意義下的去相關(guān),這也導(dǎo)致了ICA的求解相對(duì)復(fù)雜一些,目前主要有三種方法:基于信息論的方法;固定點(diǎn)算法;聯(lián)合近似對(duì)角化特征矩陣方法.對(duì)于如何自動(dòng)選取有效的獨(dú)立主元,目前還沒(méi)有一個(gè)很好的標(biāo)準(zhǔn),通常都是根據(jù)經(jīng)驗(yàn)來(lái)選取.

      (4) 非負(fù)矩陣分解(Non-negative Matrix Factorization,NMF)方法最早由Lee等人提出[57],其思想就是要找到一組基,基的各個(gè)分量都是非負(fù)的,并且當(dāng)用這些基來(lái)線(xiàn)性表征圖像的時(shí)候,其線(xiàn)性系數(shù)也都是非負(fù)的.需要注意的是,NMF方法是基于局部特征的描述方法,而EigenFace和FisherFace方法都是一種全局描述的方法.雖然在自然場(chǎng)景中,ICA具有邊緣濾波器的作用,但是當(dāng)用獨(dú)立主元的線(xiàn)性組合來(lái)表征圖像的時(shí)候,不可避免地會(huì)存在減性關(guān)系,這一點(diǎn)也存在于EigenFace和FisherFace方法中.在Lee提出的NMF算法的基礎(chǔ)上,研究人員已提出一些新的方法,并取得了較好的實(shí)驗(yàn)效果[19].

      (5) 基于核(Kernel-based)的方法.所謂“核”,其基本思想是利用非線(xiàn)性映射,把原始空間的數(shù)據(jù)映射到“核”空間中,然后在“核”空間中對(duì)數(shù)據(jù)進(jìn)行分析,但是在計(jì)算上,可以通過(guò)核函數(shù)的計(jì)算來(lái)替代這一非線(xiàn)性變換[19].基于核的方法期望將原始空間中的非線(xiàn)性問(wèn)題在“核”空間中通過(guò)線(xiàn)性分類(lèi)器得以解決.“核”的思想在支持向量機(jī)上得到了較為成功的應(yīng)用[42],研究人員陸續(xù)研究了核主成分分析[59-60]、核判別分析[61]、核獨(dú)立主元分析[62]等一系列方法.

      (6) Moghaddam等人提出了基于Bayes的人臉識(shí)別方法[2,63].應(yīng)用Bayes決策理論進(jìn)行模式分類(lèi),首先要知道各類(lèi)的先驗(yàn)概率和概率密度函數(shù)[2].Moghaddam等人提出的是一種基于概率的圖像相似度度量方法,將人臉圖像之間的差異分為類(lèi)間差異和類(lèi)內(nèi)差異,而實(shí)際圖像之間的差異為兩者之和.由于Bayes相似度的計(jì)算涉及復(fù)雜的非線(xiàn)性計(jì)算,Moghaddam等人提出了一種線(xiàn)性的快速計(jì)算方法,這種人臉識(shí)別方法在1996年美國(guó)DAPAR組織的FERET人臉測(cè)試中取得了較好的效果[2].

      (7) 基于奇異值分解(Singular Value Decomposition,SVD)的方法是一種有效的代數(shù)特征提取方法.奇異值特征具有良好的穩(wěn)定性、轉(zhuǎn)置不變性、旋轉(zhuǎn)不變性、位移不變性以及鏡像變換不變性等重要性質(zhì).因此,奇異值分解技術(shù)也被應(yīng)用到人臉識(shí)別領(lǐng)域.

      (8) 基于頻域的方法.圖像的空域信息即象素的成像信息較容易受到外在因素的影響,研究人員試圖從圖像的頻域?qū)ふ腋鼮榉€(wěn)健的圖像特征.傳統(tǒng)的傅里葉變換、離散余弦變換曾被用于人臉?lè)治雠c識(shí)別;后來(lái)發(fā)展起來(lái)的小波變換、Gabor小波變換也被引入到這一領(lǐng)域.在以上方法中,Gabor小波因其具有良好的空間局部性和方向選擇性能而引起了廣泛的關(guān)注.Gabor變換所采用的核與人類(lèi)視覺(jué)皮層細(xì)胞的ZD感受特性非常的相似,能夠抓住圖像局部區(qū)域內(nèi)多個(gè)尺度和局部性結(jié)構(gòu)特征,從而使得保留總體信息的同時(shí)增強(qiáng)了局部特征.Gabor小波在圖像分析、人臉識(shí)別等方面已經(jīng)得到了廣泛的應(yīng)用[2].

      (9) 基于流形學(xué)習(xí)(Manifold leaming)的方法.流形是一種非歐式幾何空間,不滿(mǎn)足傳統(tǒng)意義下的全局線(xiàn)性結(jié)構(gòu).然而,在局部意義下可以獲得近似的全局線(xiàn)性結(jié)構(gòu),并通過(guò)各種流形學(xué)習(xí)方法發(fā)現(xiàn)其全局意義下的結(jié)構(gòu)[2].流形學(xué)習(xí)的目的是在數(shù)據(jù)集所在空間表現(xiàn)為流形結(jié)構(gòu)時(shí),要從存在于這種空間結(jié)構(gòu)的數(shù)據(jù)集中提取出其對(duì)應(yīng)的內(nèi)蘊(yùn)結(jié)構(gòu)(hitrlnsicstructllre)及其規(guī)律[63].當(dāng)今的流形學(xué)習(xí)方法中,幾個(gè)熱點(diǎn)方法有Principal Curves[64],Locally Linear embedding[65],Laplacian Eigenmap[66]等.

      2.3.4 基于神經(jīng)網(wǎng)絡(luò)的方法

      基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法其實(shí)也是基于統(tǒng)計(jì)人臉識(shí)別方法的一種,為了突出這類(lèi)方法,故單獨(dú)作為小節(jié)進(jìn)行描述.前面已敘述過(guò),基于神經(jīng)網(wǎng)絡(luò)的方法在人臉檢測(cè)領(lǐng)域中得到廣泛應(yīng)用,同樣地,該法也廣泛應(yīng)用于人臉識(shí)別領(lǐng)域.這類(lèi)識(shí)別法將人臉直接用灰度圖表征,利用了神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)及分類(lèi)能力.其優(yōu)勢(shì)在于保存了人臉圖像中的材質(zhì)信息及細(xì)微的形狀信息,同時(shí)避免了較為復(fù)雜的特征提取工作.而且,由于圖像被整體輸入,符合格氏塔心理學(xué)中對(duì)人類(lèi)識(shí)別能力的解釋.

      (1) 基于自組織映射(Self Organizing Map,SOM)的方法.1988年,Kohonen[67]最早將自組織映射SOM神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別研究,主要利用SOM的聯(lián)想能力“回憶”人臉.當(dāng)輸入圖像具有較大噪音干擾或者部分圖像丟失時(shí),也能恢復(fù)出完整的人臉.

      (2) 基于彈性圖匹配的方法.1992年,Lades M等人將動(dòng)態(tài)鏈接結(jié)構(gòu)(Dynamic Link Architecture,DLA)方法[68]用于人臉識(shí)別取得了較好的效果.DLA方法利用突觸的可塑性將神經(jīng)元集合劃分成若干圖結(jié)構(gòu),同時(shí)保留神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn).該法將人臉用格狀的稀疏圖表示,圖中的節(jié)點(diǎn)用圖像位置的Gabor小波分解得到的特征向量標(biāo)記;圖的邊用連接節(jié)點(diǎn)的距離向量標(biāo)記.Wiskott等人使用彈性圖匹配法在FERET數(shù)據(jù)庫(kù)上得到97.3%的準(zhǔn)確率,進(jìn)一步地,Wiskott在原有方法的基礎(chǔ)上提出聚束圖匹配方法[2].

      (3) 基于SOM和卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的混合神經(jīng)網(wǎng)絡(luò)方法.在SOM算法的基礎(chǔ)上,Lawrence和Giles等人[69]提出了基于SOM和卷積神經(jīng)網(wǎng)絡(luò)的混合神經(jīng)網(wǎng)絡(luò)方法.在ORL人臉庫(kù)進(jìn)行仿真實(shí)驗(yàn)的結(jié)果與用K-L變換代替SOM或者用多層感知器MLP代替卷積神經(jīng)網(wǎng)絡(luò)相比,該方法取得了較低的錯(cuò)誤率[2];與特征臉?lè)椒ㄏ啾龋?dāng)待識(shí)別對(duì)象的訓(xùn)練樣本數(shù)1到5變化時(shí),該方法取得了較好的識(shí)別性能[2].

      (4) Lin和Kung[70]提出了一種基于概率決策的神經(jīng)網(wǎng)絡(luò)(Probabilistic Decision Based Neural Network,PDBNN)方法.該法主要利用虛擬樣本進(jìn)行強(qiáng)化和反強(qiáng)化學(xué)習(xí),并采用模塊化的網(wǎng)絡(luò)結(jié)構(gòu)加快網(wǎng)絡(luò)學(xué)習(xí)過(guò)程.

      (5) 除了上述具有代表性的人臉識(shí)別方法以外,還有許多基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法,如時(shí)滯神經(jīng)網(wǎng)絡(luò)[71](Time Delay Neural Networks,TDNN)方法、徑向基函數(shù)網(wǎng)絡(luò)(Radial Basis Function Neural Network,RBFNN)[72]、Hopfield網(wǎng)絡(luò)[73]等人臉識(shí)別方法,能夠?qū)崿F(xiàn)低分辨率人臉的聯(lián)想和識(shí)別.

      對(duì)于人臉這類(lèi)復(fù)雜的、難以顯式描述的模型,基于神經(jīng)網(wǎng)絡(luò)的方法比其他類(lèi)型的方法有其獨(dú)到的優(yōu)勢(shì):便于建模,魯棒性好,避免了復(fù)雜的特征提取工作,把模型的統(tǒng)計(jì)特征隱含于神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)中;此外,神經(jīng)網(wǎng)絡(luò)以并行方式處理信息,如果能用硬件實(shí)現(xiàn),就能顯著提高速度.但是,神經(jīng)網(wǎng)絡(luò)方法運(yùn)算時(shí)間都較長(zhǎng),并可能陷入局部最優(yōu).

      2.3.5 多分類(lèi)器集成方法

      在特定約束條件下,人臉識(shí)別可以取得較好的性能.在現(xiàn)實(shí)應(yīng)用中,人臉的表象會(huì)因?yàn)楣庹辗较?、姿態(tài)、表情變化而產(chǎn)生較大的變化,每種特點(diǎn)的識(shí)別器只對(duì)其中一部分變化敏感.因此,使用多個(gè)分類(lèi)器集成可以整合互補(bǔ)信息,提高系統(tǒng)的分類(lèi)準(zhǔn)確率.

      Gutta等人提出將集成的RBF與決策樹(shù)(Decision Tree)結(jié)合起來(lái)進(jìn)行人臉識(shí)別[74],該法結(jié)合了全局的模板匹配和離散特征的優(yōu)點(diǎn),在350人的人臉數(shù)據(jù)庫(kù)上測(cè)試結(jié)果較好.Huang等人[75]在多特征臉空間的基礎(chǔ)上采用神經(jīng)網(wǎng)絡(luò)集成(Neural Network Ensemble)的方法實(shí)現(xiàn)了對(duì)多視角人臉的識(shí)別.該法首先將人臉深度方向的偏轉(zhuǎn)角度分為幾組(多個(gè)視角),然后為每組(每個(gè)視角)訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),最后對(duì)所有組對(duì)應(yīng)的多個(gè)神經(jīng)網(wǎng)絡(luò)的輸出進(jìn)行集成.實(shí)驗(yàn)表明,該法不必預(yù)先估計(jì)偏轉(zhuǎn)角度就可以取得較好的識(shí)別性能,而且能實(shí)現(xiàn)人臉偏轉(zhuǎn)角度的自動(dòng)判斷[2].Lü等人通過(guò)將PCA、ICA、LDA進(jìn)行集成人臉識(shí)別.首先分別用這三種方法對(duì)同一張人臉進(jìn)行識(shí)別,每種方法的識(shí)別分為測(cè)試人臉與數(shù)據(jù)庫(kù)中人臉的投影向量之間夾角的余弦值,然后用簡(jiǎn)單求和方式或RBF網(wǎng)絡(luò)對(duì)三個(gè)得分進(jìn)行集成,在一個(gè)包含有206個(gè)人,每人10張照片的人臉庫(kù)上進(jìn)行實(shí)驗(yàn),集成方法的識(shí)別性能最好[2].

      3 人臉識(shí)別技術(shù)的應(yīng)用

      與指紋識(shí)別、視網(wǎng)膜識(shí)別、虹膜識(shí)別等技術(shù)相比,人臉識(shí)別技術(shù)有其獨(dú)特的優(yōu)勢(shì):(1) 數(shù)據(jù)采集設(shè)備簡(jiǎn)單、快捷,不像指紋和虹膜識(shí)別那樣需要專(zhuān)用的特殊設(shè)備.一般來(lái)說(shuō),常見(jiàn)的攝像頭就可以用來(lái)進(jìn)行人臉圖像的采集,采集一般可在數(shù)秒內(nèi)完成.(2) 無(wú)侵?jǐn)_性.只要被識(shí)別者在攝像機(jī)前停留片刻,其身份就會(huì)被正確識(shí)別,因此人臉識(shí)別無(wú)需干擾人的正常行為,無(wú)需擔(dān)心被識(shí)別者是否愿意把手指放在指紋采集設(shè)備上、被識(shí)別者的眼睛是否能夠?qū)?zhǔn)虹膜掃描裝置,被識(shí)別對(duì)象很容易接受.(3) 自然性、可視化.人類(lèi)自身也是通過(guò)人臉來(lái)鑒別人的身份,因此人臉識(shí)別是最自然的可視化身份確認(rèn)方式.鑒于上述優(yōu)點(diǎn),人臉識(shí)別已在許多領(lǐng)域中得到廣泛應(yīng)用,而且也是極具潛力的一種生物特征身份識(shí)別方式.

      目前,計(jì)算機(jī)人臉識(shí)別的應(yīng)用領(lǐng)域主要包括:(1) 個(gè)人身份識(shí)別.在信用卡、駕駛證、護(hù)照、身份證等個(gè)人身份證明中,進(jìn)行自動(dòng)個(gè)人身份辨識(shí).(2) 公安系統(tǒng).在刑偵中的尸體辨認(rèn)、罪犯辨認(rèn),搜救中尋找失蹤人員以及公共安全保障等方面有重要應(yīng)用.(3) 政府部門(mén).在檔案管理、海關(guān)、機(jī)場(chǎng)和交通部門(mén)對(duì)身份證或駕駛執(zhí)照等證件查驗(yàn)方面有廣泛應(yīng)用.(4) 商業(yè)領(lǐng)域.ATM機(jī)、智能卡、電子商務(wù)、門(mén)禁系統(tǒng)、監(jiān)控系統(tǒng)、互聯(lián)網(wǎng)接入驗(yàn)證、用戶(hù)終端接入、視頻會(huì)議、計(jì)算機(jī)動(dòng)畫(huà)等方面對(duì)人臉識(shí)別技術(shù)有大量需求[1-6,19,24,29-30].

      據(jù)統(tǒng)計(jì),截止到2007年,人臉識(shí)別產(chǎn)品的國(guó)際市場(chǎng)份額由原來(lái)的微不足道迅速上升到12.9%,僅小于指紋識(shí)別,而且比重還在不斷增加,打破了國(guó)際生物識(shí)別市場(chǎng)上“指紋”一統(tǒng)天下的局面.而在中國(guó),國(guó)產(chǎn)人臉識(shí)別產(chǎn)品的國(guó)際市場(chǎng)份額仍然還較小,大多數(shù)公司采用國(guó)外提供的核心技術(shù)進(jìn)行后加工,產(chǎn)品多集中在門(mén)禁和考勤機(jī)上.這些公司沒(méi)有自主知識(shí)產(chǎn)權(quán),自主研發(fā)能力差,同時(shí),由各種渠道獲得的核心技術(shù)水平參差不齊,其產(chǎn)品可靠性得不到保障.2007年以后,國(guó)內(nèi)的人臉識(shí)別技術(shù)迅速地發(fā)展,該領(lǐng)域內(nèi)的科研人員也取得了較大的進(jìn)展;2008年,隨著政府推動(dòng)的“平安城市”建設(shè)、城市報(bào)警與監(jiān)控系統(tǒng)(“3111”工程)的深入展開(kāi),加之奧運(yùn)會(huì)、世博會(huì)等大型活動(dòng)的帶動(dòng),全國(guó)進(jìn)入了安防設(shè)施建設(shè)的高潮期,安防行業(yè)持續(xù)保持了快速的增長(zhǎng).而且,除了傳統(tǒng)的考勤、門(mén)禁等應(yīng)用外,各種新的應(yīng)用需求的不斷涌現(xiàn),也極大地推動(dòng)了這一市場(chǎng)的發(fā)展.

      目前,國(guó)內(nèi)已經(jīng)具有完全自主知識(shí)產(chǎn)權(quán)的人臉識(shí)別系統(tǒng).例如中科院自動(dòng)化所的中科奧森(AuthenMetric)近紅外人臉識(shí)別系統(tǒng)和國(guó)際識(shí)別領(lǐng)域巨頭漢王科技的“漢王人臉通”人臉識(shí)別產(chǎn)品.中科奧森近紅外人臉識(shí)別系統(tǒng)獨(dú)樹(shù)一幟,徹底解決了困擾人臉識(shí)別領(lǐng)域的環(huán)境光照影響問(wèn)題.在實(shí)際應(yīng)用環(huán)境下,中科奧森近紅外人臉識(shí)別系統(tǒng)在準(zhǔn)確率和速度上在國(guó)際上絕對(duì)領(lǐng)先.該系統(tǒng)有機(jī)結(jié)合了電子標(biāo)簽和射頻識(shí)別技術(shù),為2008年北京奧運(yùn)定制人臉識(shí)別快速身份驗(yàn)證系統(tǒng),可以對(duì)所有持票者進(jìn)行實(shí)名制人臉身份驗(yàn)證.使用該系統(tǒng)時(shí),事先對(duì)入場(chǎng)券持有者提交的人臉身份照片進(jìn)行掃描,提取人臉特征,并錄入信息數(shù)據(jù)庫(kù).在進(jìn)入現(xiàn)場(chǎng)時(shí),利用視頻攝像頭對(duì)入場(chǎng)券持有者進(jìn)行人臉圖像采集,并與數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行對(duì)比,從而實(shí)現(xiàn)人臉身份識(shí)別.“漢王人臉通”是全球首款嵌入式雙攝像頭人臉識(shí)別機(jī),它的上市標(biāo)志著人臉智能時(shí)代的到來(lái).2008年12月,在北京國(guó)際展覽中心舉行的中國(guó)國(guó)際社會(huì)公共安全產(chǎn)品博覽會(huì)上,“漢王人臉通”喜獲2008北京安博會(huì)“創(chuàng)新產(chǎn)品獎(jiǎng)”,也是門(mén)禁領(lǐng)域唯一獲獎(jiǎng)產(chǎn)品.

      4 人臉識(shí)別技術(shù)中的難點(diǎn)

      人臉識(shí)別包含人臉檢測(cè)與定位、人臉特征提取與分類(lèi)器等技術(shù)的綜合運(yùn)用,整個(gè)識(shí)別過(guò)程是非常困難的.這種困難一方面源于計(jì)算機(jī)本身學(xué)習(xí)能力的局限,另一方面則是由于人臉識(shí)別技術(shù)所具有的復(fù)雜性造成的.人臉具有相對(duì)穩(wěn)定的特征和結(jié)構(gòu),這為人臉識(shí)別技術(shù)帶來(lái)了實(shí)現(xiàn)的可能,但人臉具體形態(tài)的多樣性和所處環(huán)境的復(fù)雜性又造成了識(shí)別的巨大困難.人臉識(shí)別本質(zhì)上是三維塑性物體向二維投影圖像的匹配問(wèn)題,具體的困難表現(xiàn)在:人臉結(jié)構(gòu)的復(fù)雜性;人臉的數(shù)目;不同人臉的差異;人臉隨年齡的變化;表情的變化;發(fā)型、胡須、眼鏡等對(duì)人臉的干擾;光照對(duì)人臉圖像的影響;成像角度和距離;成像背景的復(fù)雜度等等.此外,人臉是立體的,但在識(shí)別時(shí)的成像卻是平面的,所以從二維圖像重建三維人臉是個(gè)病態(tài)過(guò)程,目前尚沒(méi)有比較理想的描述人臉的三維模型.至于對(duì)人的肢體器官的識(shí)別,常常還受到背景環(huán)境的影響.

      客觀來(lái)講,目前已經(jīng)報(bào)道的各類(lèi)方法都有其特定的實(shí)驗(yàn)背景,因而不可能解決人臉檢測(cè)、定位、特征提取與識(shí)別等的所有問(wèn)題.另外,以上所提到的諸多方法基本上都是建立在正視圖的基礎(chǔ)上的.當(dāng)人臉的姿態(tài)發(fā)生三維深度旋轉(zhuǎn)特別是旋轉(zhuǎn)角度超過(guò)45°時(shí),面部特征的結(jié)構(gòu)信息的完整性會(huì)發(fā)生較大的破壞.在這種情況下,絕大多數(shù)的方法都會(huì)失效.

      人臉識(shí)別技術(shù)的研究同時(shí)涉及到計(jì)算機(jī)視覺(jué)、模式識(shí)別、人工智能、心理學(xué)、生理學(xué)等諸多學(xué)科,這些使得人臉識(shí)別技術(shù)成為一項(xiàng)極富挑戰(zhàn)性的研究課題.

      5 總結(jié)與展望

      人臉識(shí)別技術(shù)是一個(gè)極富挑戰(zhàn)性的問(wèn)題,盡管目前存在許多的人臉檢測(cè)和人臉識(shí)別算法,但是每種算法都是在特定的實(shí)驗(yàn)環(huán)境中得到驗(yàn)證的,評(píng)價(jià)標(biāo)準(zhǔn)不統(tǒng)一,而且目前還沒(méi)有一種算法適用各種不同的實(shí)驗(yàn)環(huán)境.目前在特定的條件下人臉識(shí)別的研究算法已取得了顯著的進(jìn)展,但是,一個(gè)穩(wěn)定性和魯棒性強(qiáng)的人臉識(shí)別系統(tǒng)需要在不同的環(huán)境,如光照、人臉旋轉(zhuǎn)角度、姿勢(shì)和部分遮擋、面部表情以及外部飾物等干擾下,也具有很好的有效性和穩(wěn)定性.因此,在未來(lái)幾年中,特征獲取問(wèn)題、人臉?lè)蔷€(xiàn)性建模問(wèn)題、3D建模問(wèn)題、人臉模式的流形學(xué)習(xí)、多特征融合策略以及分類(lèi)器的泛化能力研究將是具有代表性的幾個(gè)發(fā)展方向.

      [1] 張翠萍,蘇光大.人臉識(shí)別技術(shù)綜述[J].中國(guó)圖像圖形學(xué)報(bào),2000,5(11):885-894.

      [2] 李武軍,王崇駿,張 煒,等.人臉識(shí)別研究綜述[J].模式識(shí)別與人工智能,2006,19(1):58-66.

      [3] 周激流,張 曄.人臉識(shí)別理論研究進(jìn)展[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),1999,11(2):180-184.

      [4] 趙桂敏.基于綜合集成的人臉識(shí)別[D].長(zhǎng)沙:中南大學(xué),2004.

      [5]祝秀萍,吳學(xué)毅,劉 文.人臉識(shí)別綜述與展望[EB/OL].(2008-05-02)[2009-08-15] http://www.studa.net/pc-theory/080502/ 10591461.html.

      [6] 趙 玲.基于獨(dú)立分量分析和非負(fù)矩陣分解的人臉識(shí)別研究[D].蘭州:蘭州大學(xué),2006.

      [7] SAMAL A,IYENGAR P A.Automatic recognition and analysis of human faces and facial expressions: a survey[J].Pattern Recognition,1992,25(1):65-77.

      [8] CHELLAPPA R,WILSON C L,SIRONEY S,et al.Human and machine recognition of faces: a survey[J].Proceedings of the IEEE,1995,83(5):705-740.

      [9] BRUNELLI R,POGGIO T.Face recognition: features versus templates[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,1993,15(10):1042-1052.

      [10] VALENTIN D,ABDI H,O'TOOLE A J,et al.Connectionist models of face processing: a survey[J].Patttern Recognition,1994,27(9):1209-1230.

      [11] O'TOOLE A J,ABDI H,DEFFENBACHER K A,et al.Low-dimensional representation of faces in higher dimensions of the face space[J].Journal of the Optical Society of America A,1993,10(3):405-411.

      [12] 萬(wàn) 輝.人臉識(shí)別技術(shù)研究與實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2004.

      [13] TURK M,PENTLAND A.Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.

      [14] BARTLETT M S,MOVELLAN J R,SEJNOWSKI T J,et al.Face recognition by independent component analysis[J].IEEE Trans.on Neural Networks,2002,13(6):1450-1464.

      [15] MANJUNATH B S,SHEKHAR C,CHELLAPPA R,et al.A new approach to image feature detection with applications[J].Pattern Recognition,1996,29(4):627-640.

      [16] GOLDSTION R J,HARMAON L D,LESK A B.Man-machine interaction in human face identification[J].Bell System Tech.,1972,51(2):399-427.

      [17] KAYA Y,KOBAYASHI K.A basic study on human recognition[J].Frontiers of Pattern Recognition,1972:265-289.

      [18] KANAD T.Picture processing system by computer complex and recognition of human faces[D].Kyoto:Kyoto University,1973.

      [19] 鄧忠龍.人臉識(shí)別中新算法的實(shí)現(xiàn)與改進(jìn)[D].上海:上海交通大學(xué),2005.

      [20] SAKAI T,NAGAO M,F(xiàn)UJIBAYASHI S,et al.Line extraction and pattern detection in a photograph[J].Pattern Recognition,1969,1(3):233-248.

      [21] SEXTON G,NEWCASTLE P.Automatic face detection for video conferencing[J].IEEE Colloquium on Low Bit Rate Image Coding,1990(2):27-30.

      [22] CHELVERIKOV D,LERCH A.Multiresolution face detection[J].Theoretical Foundations of Computer Vision,1993,69:131-140.

      [23] YANG Guangzheng,HUANG T S.Human face detection in a complex background[J].Pattern Recognition,1994,27(1):53-63.

      [24] 趙麗紅,劉紀(jì)紅,徐心和,等.人臉檢測(cè)方法綜述[J].計(jì)算機(jī)應(yīng)用研究,2004,21(9):1-4.

      [25] GRAF H P,CHEN T,PENTAJAN E,et al.Locating faces and facial parts:proc.First Int.Workshop Automatic Face and Gesture Recognition,Zurich,June 26-28,1995[C].Zurich:WAFGR,c1995.

      [26] SIROHEY S A,PITAS I.Human face segmentation and identification[D].Massachusetts:MIT,1995.

      [27] KOTROPOULOS C,PITAS I.Rule-based face detection in frontal views:ICA SSP97:proc.Of IEEE Int.Conf.On Acoustics,Speech and Signal Processing,Munich,April,1997[C].New York:IEEE Press,c1997.

      [28] 盧春雨,張長(zhǎng)水,聞 芳,等.基于區(qū)域特征的快速人臉檢測(cè)法[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,1999,39(1):101-105.

      [29] 李華勝,楊 樺,袁保宗,等.人臉識(shí)別系統(tǒng)中的特征提取[J].北京交通大學(xué)學(xué)報(bào),2001,25(2):47-50.

      [30] 姜 軍,張桂林.一種基于知識(shí)的快速人臉檢測(cè)方法[J].中國(guó)圖像圖形學(xué)報(bào),2002,7(1):6-10.

      [31] SIROHEY S A.Human face segmentation and identification,Technical report CS-TR-3176[R].Maryland:Univ.of Maryland,1993.

      [32] LEUNG T K,BURL M C,PERONA P,et al.Finding faces in cluttered scenes using labeled random graph matching:ICCV95:proc.5th IEEE Int.Conf.Computer Vision,Boston,June,1995[C].Washington:IEEE Computer Society,c1995.

      [33] YOW K C,CIPOLLA1 R.Feature-based human face detection[J].Image and Vision Computing,1997,15(9):713-735.

      [34] HAN Chinchuan,YU Kuochung,CHEN Lianghua,et al.Fast face detection via morphology-based Pre-Processing[J].Pattern Recognition,2000,33(10):1701-1712.

      [35] 彭進(jìn)業(yè),俞卞章,王大凱,等.多尺度對(duì)稱(chēng)變換及其應(yīng)用于定位人臉特征點(diǎn)[J].電子學(xué)報(bào),2002,30(3):363-366.

      [36] 王延江,袁保宗,唐晚芳.一種快速彩色圖像中復(fù)雜背景下人臉檢測(cè)方法[J].電子學(xué)報(bào),2002,30(10):1566-1569.

      [37] PROPP M,SAMAL A.Artificial neural network for human face detection[J].Intelligent Eng.Systems through Artificial Neural Network,1992,2:535-540.

      [38] BUREL G,CAREL D.Detection and localization of faces on digital images[J].Pattern Recognition Letters,1994,15(10):963-967.

      [39] VAILLANT R,MONROCQ C,CUN Y L,et al.Original approach for the localization of objects in images[J].IEEE proc.Vision,Image and Signal Processing,1994,141(4):245-250.

      [40] ROWLEY H A,BALUJA S,KANADE T,et al.Human face detection in visual scenes,Carnegie Mellon Computer Science Technical Report CMU-CS-95-158[R].Pittsburghers:Carnegie Mellon University,1995.

      [41] ROWLEY H A,BALUJA S,KANADE T,et al.Rotation invariant neural network-based face detection:CVPR1998:proceedings of IEEE Conf.Computer Vision and Pattern Recognition,Santa Barbara,June,1998[C].New York:IEEE Computer Society,c1998.

      [42] OSUNA E,F(xiàn)REUND R,GIROSI F.Support vector machines: training and applications[R].Massachusetts:AI Lab.,MIT,1997.

      [43] TURK M,PENTLAND A.Eigenfaces for Recognition[J].Jounal of Cognitive Neuroscience,1991,3(1):71-86.

      [44] FREUND Y,SCHAPIRE R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.

      [45] VIOLA P,JONCES M.Rapid object detection using a boosted cascade of simple[J].IEEE Trans.on CVPR,2001,1(2):511-518.

      [46] LI STAN Z,ZHANG Zhenqiu.Floatboost learning and statistical face detection[J].IEEE Trans.on PAMI,2004,26(9):1112-1123.

      [47] PUDIL P.Floating search methods in feature selection[J].Pattern Recognition Letters,1994,15(11):1119-1125.

      [48] BLEDSOE W.Man-machine facial recognition,PRI:22[R],Palo Alto:Panoramic Research Inc.,1966.

      [49] COOTES T F,TAYLOR C J,COOPER D H,et al.Active shape models-their training and application[J].Computer Vision and Image Understanding,1995,61(1):38-59.

      [50] COOTES T F,EDWARDS G J,TAYLOR C J,et al.Active appearance models[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2001,23(6):681-685.

      [51] YAN Shuicheng,LIU Ce.Face alignment using texture-constrained active shape model[J].Image and Vision Computing,2003,21(1):69-75.

      [52] SHAN Shiguang,GAO Wen.Enhanced active shape models with global texture constraints for face image analysis:ISMIS2003:proceedings of the Fourteenth International Symposium on Methodologies for Intelligent Systems,Maebashi,October,2003[C].Hamburg:Springer,c2003.

      [53] BLANZ V,VETTER T.Face recognition based on fitting a 3D morphable model[J].IEEE Trans.on PAMI,2003,25(9):1063-1075.

      [54] BLANZ V,ROMDHANI S,VETTER T,et al.Face identification across different poses and illuminations with a 3D morphable model:proc.of the 5th Int.Conference on Automatic Face and Gesture Recognition,Washington D.C.,May 20-21,2002[C].NewYork:IEEE Press,c2002.

      [55] CHEN Lifen,LIAO Hongyuan,LIN Jiachen,et al.A new LDA-based face recognition system which can solve the small sample size problem[J].Pattern Recognition,2000,33(10):1713-1726.

      [56] LIU Chengjun,WECHSLER H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition[J].IEEE Trans.On Image Processing,2002,11(4):467-476.

      [57] YU Hua,YANG Jie.A direct LDA algorithm for high-dimensional data with application to face recognition[J].Pattern Recognition,2001,34(10):2067-2070.

      [58] BARTLETT M S.Independent component representations for face recognition:proceedings of SPIE Symposium on Electronic Imaging:Science and Technology Conference on Human Vision and Electronic Imaging III,San Jose,January 24-30,1998[C].San Jose:SPIE,c1998.

      [59] 尚 麗.稀疏編碼算法及其應(yīng)用研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2006.

      [60] KIM K I,JUNG K,KIM H J,et al.Face recognition using kernel principal component analysis[J].IEEE Signal Processing Letters,2002,9(2):40-42.

      [61] BAUDAT G,ANOUAR F.Generalized discriminant analysis using a kernel approach[J].Neural Computation,2000,12:2385-2404.

      [62] 張燕昆.基于核方法的人臉識(shí)別技術(shù)研究[D].上海:上海交通大學(xué),2004.

      [63] MOGHADDAM B,JEBARA T,PENTLAND A,et al.Bayesian face recogniton[J].Pattern Recognition,2000,33(11):1771-1782.

      [64] ZHANG Junping,WANG Jue.An overview of principal curves[J].Chinese Journal of Computers,2003,26(2):1-18.

      [65] TENENBAUM J B,SILVA V D,LANGFORD J C,et al.A global geometric framework for nonlinear dimensionality reduction[J].Science,2000,260:2319-2323.

      [66] BELKIN M,NIYOGI P.Using manifold structure for partially labeled classification:NIPS2002:proceedings of Neural Information Processing System,Vancouver,December 9-14,2002[C].Vancouver:NIPS,c2002.

      [67] KOHONEN T.Self-organization and associative memory[M].3rd ed.Berlin: Springer,1988.

      [68] LADES M,VORBROGGEN J C,BUBMANN J,et al.Distortion Invariant object recognition in the dynamic link architecture[J].IEEE Trans.on Computers,1992,42(3):300-311.

      [69] LAWRENCE S,GILES C L,TSOI A C,et al.Face recognition: a convolutional neural network approach[J].IEEE Trans.on Neural Networks,1997,8(1):98-113.

      [70] LIN Shanghung,KUNG Sunyuan,LIN Longji,et al.Face recognition/detection by probabilistic decision based neural network[J].IEEE Trans.on Neural Networks,1997,8(1):114-132.

      [71] SAMARIA F S,HARTER A C.Parameterization of a stochastic model for human face identification:WACV1994:proc.of 2nd IEEE Workshop on Applications of Computer Vision,Saraota,January,1994[C].New York:IEEE Press,c1994.

      [72] RANGANATH S,ARUN K.Face recognition using transform features and neural network[J].Pattern Recognition,1997,30(10):1615-1622.

      [73] HAYWOOD K,LEBBY G L,RICANEK K J,et al.Hopfield like networks for pattern recognition with applications to face recognition:ICNN1999:proc.of the International Joint Conference on Neural Networks,Washington,July,1999[C].Washington:ICNN,c1999.

      [74] GUTTA S,WECHSLER H.Face recognition using hybrid classifier systems:ICNN1996:proc.of the International Conference on Neural Networks,Washington,June,1996[C].Virginia:George Mason University,c1996.

      [75] HUANG Fujie,ZHANG Hongjiang,ZHOU Zhihua,et al.Pose invariant face recognition:proc.of the 4th IEEE International Conference on Automatic Face and Gesture Recognition,Grenoble,March,2000[C].New York:Institute of Electrical and Electronics Engineer,Inc.,c2000.

      猜你喜歡
      人臉識(shí)別人臉神經(jīng)網(wǎng)絡(luò)
      人臉識(shí)別 等
      有特點(diǎn)的人臉
      揭開(kāi)人臉識(shí)別的神秘面紗
      神經(jīng)網(wǎng)絡(luò)抑制無(wú)線(xiàn)通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      三國(guó)漫——人臉解鎖
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      基于類(lèi)獨(dú)立核稀疏表示的魯棒人臉識(shí)別
      基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
      馬面部與人臉相似度驚人
      邢台县| 淮阳县| 常宁市| 汕尾市| 镶黄旗| 平武县| 宁国市| 万全县| 科技| 伊吾县| 上林县| 井冈山市| 海城市| 榆社县| 东方市| 木兰县| 江西省| 通州市| 绥宁县| 聊城市| 临潭县| 营山县| 永城市| 班戈县| 商洛市| 杭锦后旗| 政和县| 尖扎县| 浮梁县| 和平县| 冀州市| 西吉县| 南岸区| 丽江市| 广东省| 佳木斯市| 九龙坡区| 荥阳市| 塔城市| 永德县| 枞阳县|