張凱
人臉識(shí)別已成為生物統(tǒng)計(jì)學(xué)的一個(gè)重要方向,在安防、考勤、門禁等方面有著廣泛的應(yīng)用[1]。人臉識(shí)別分為閉集識(shí)別和開集識(shí)別兩種,閉集識(shí)別假定測(cè)試樣本一定屬于人臉庫中的某個(gè)已知類,識(shí)別過程中只需要找出測(cè)試樣本最相似的類別即可;而開集識(shí)別則假定測(cè)試樣本可能不屬于人臉庫中的任何一個(gè)已知類,它首先需要判斷測(cè)試樣本是否不屬于人臉庫,再找出測(cè)試樣本與人臉庫中最相似的類。
由于開集識(shí)別更符合人臉識(shí)別系統(tǒng)在安防、門禁等場(chǎng)合的實(shí)用環(huán)境,因此具有更廣泛的研究?jī)r(jià)值。在已有的開集人臉識(shí)別方法中,最近鄰方法[2]獲得測(cè)試樣本與已知類樣本中相似度最大者,與一個(gè)預(yù)先設(shè)定的閾值進(jìn)行比較,若高于該閾值,則接受樣本為已知類,反之拒絕;歸一化方法[3]為了減小在識(shí)別過程中受到的光照,年齡等影響,對(duì)相似度最大值求取最小的歸一化的距離,以提高其分辨能力;文獻(xiàn)[4]引入傳導(dǎo)原理進(jìn)行集內(nèi)集外的判定,將求取的距離通過傳導(dǎo)公式轉(zhuǎn)化為置信度,再取置信度最高者與閾值做比較。雖然歸一化和傳導(dǎo)原理方法相比最近鄰都提高了相似度最大者的分類能力,在同等錯(cuò)誤拒絕率的情況下,降低了錯(cuò)誤接受率,但是它們同最近鄰方法一樣,都只利用了相似度最大者這一個(gè)維度的信息進(jìn)行判別。
然而判別的信息并不僅存在于相似度最大者這一個(gè)維度中,測(cè)試樣本與各個(gè)已知類樣本求取的一系列相似度都包含了部分可用于開集判別的信息,這些信息在上述的方法中都沒有得到利用。為了充分利用這些信息,提高判別的準(zhǔn)確率,本文將所獲取的相似度構(gòu)成相似度空間,利用多個(gè)維度的相似度信息找尋最優(yōu)的超平面,利用該超平面劃分需要拒絕的樣本。
在開集人臉識(shí)別中,測(cè)試樣本與人臉庫中已知類樣本進(jìn)行比較,通過各種識(shí)別方法獲得了與每一個(gè)已知類之間的相似度。在最近鄰的方法中,直接利用相似度最大者,將其與一個(gè)預(yù)先設(shè)定的閾值進(jìn)行比較,當(dāng)大于該閾值時(shí),則接受測(cè)試樣本為已知類樣本,否則拒絕為未知樣本。該方法僅利用了相似度最大者這一維的信息,為了利用相似度中包含的完整信息,我們將獲取的相似度按照從大到小排序,獲得相似度向量(如圖1)。
圖1 相似度向量的獲取方法
如果測(cè)試樣本帶有標(biāo)識(shí),我們可以對(duì)相似度向量進(jìn)行分類。假設(shè)相似度最大者對(duì)應(yīng)類 A,共有三種情況:1、測(cè)試樣本屬于已知類別,且類別A為正確分類;2、測(cè)試樣本屬于已知類別,但類別A為錯(cuò)誤分類;3、測(cè)試樣本不屬于已知類別。開集問題進(jìn)行的判別,就是將第一種情況的相似度向量與第二三種情況分開。于是將第一種情況的向量歸為0類,第二三種情況的向量歸為1類,通過大量帶標(biāo)識(shí)的測(cè)試樣本,獲得兩類相似度向量在空間中的分布。我們?cè)贔ERET庫上使用PCA(Principle Component Analysis)+歐氏距離進(jìn)行實(shí)驗(yàn),獲取相似度向量的前兩維表示出來得到的分布如圖2。
圖2 PCA+歐式距離求取的相似度向量前兩維在FERET庫上的分布
圖2中,三角形表示的是應(yīng)該被接受的測(cè)試樣本,星型表示的是應(yīng)該被拒絕的測(cè)試樣本,虛線表示的是使用最近鄰方法進(jìn)行判別的情況,實(shí)線表示的是尋找相似度空間最優(yōu)超平面進(jìn)行判別的情況。從中明顯可以看出,僅使用相似度最大者進(jìn)行判別的方法,相當(dāng)于以垂直相似度最大者所在維度的超平面切割相似度空間,進(jìn)行開集判別,并沒有利用相似度空間所提供的全部判別信息,而利用多維的相似度空間找出的最優(yōu)超平面,能夠獲得更強(qiáng)的判別能力。
為了尋找最優(yōu)的切割超平面,先尋找一根法向量,再在該法向量上求取最優(yōu)的分割點(diǎn),這根法向量和分割點(diǎn)便確定了一個(gè)超平面。其尋優(yōu)指標(biāo)為該超平面的分類能力,獲取方法如下:首先用帶標(biāo)識(shí)的測(cè)試樣本通過各種識(shí)別方法,獲得與各已知類樣本的相似度,然后由各相似度構(gòu)成該接受的和該拒絕的相似度向量。在相似度空間中,需要獲得一根法向量的分類能力指標(biāo)時(shí),將相似度空間中所有的向量向該法向量做映射。得到數(shù)軸如圖3:
圖3 兩類的相似度向量向法向量映射(三角形為正確分類,星形為錯(cuò)誤分類)
為了尋找這根軸上最優(yōu)的閾值,假設(shè)樣本數(shù)為m,再假設(shè)當(dāng)前選定的閾值是eval[j](1 <j<m),為當(dāng)前數(shù)軸上第j個(gè)映射值。計(jì)算兩類樣本在該閾值下的集中程度:
其中yk為分類值,當(dāng)?shù)趉個(gè)值屬于第0類時(shí)為-1,屬于第1類時(shí)為+1。curleft反應(yīng)了樣本在該閾值左邊的集中程度,若curleft > 0,表明左邊1類樣本較為集中,若curleft < 0,表明左邊0類樣本較為集中。同樣curright也反應(yīng)了樣本在該閾值右邊的集中程度。由此計(jì)算兩類樣本在該閾值下的分散程度:
一個(gè)最好的閾值必然使得左右兩邊的分散程度達(dá)到最低,因此(curlerror+currerror)反應(yīng)了該閾值的分類能力。當(dāng)該值越小,分類能力越強(qiáng)。因此,當(dāng)獲得一根法向量時(shí),我們對(duì)法向量上的所有閾值進(jìn)行遍歷,就可以找尋分類能力最強(qiáng)的閾值。同時(shí)也獲得了該法向量的分類能力評(píng)價(jià)。
依照該分類能力的指標(biāo),用黃金分割法逐一尋找最優(yōu)法向量的各維度的系數(shù)。為了求取一根n維的最優(yōu)法向量[a1,a2…an],首先取a1=1,用黃金分割法搜索出最優(yōu)的a2,然后固定[a1,a2],搜索出最優(yōu)的a3,依次類推,直至搜索出[a1,a2…an]。
為了說明建議的方法的優(yōu)良性能,本文基于FERET[5]和 CAS[6]人臉庫共進(jìn)行兩組實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果采用錯(cuò)誤接受率(False Accept Rate,F(xiàn)AR)和錯(cuò)誤拒絕率(False Reject Rat,FRR)相等時(shí)的正確識(shí)別率進(jìn)行評(píng)估。
圖像均經(jīng)由人眼定位、校準(zhǔn)(根據(jù)雙眼位置平面內(nèi)旋轉(zhuǎn))、大小歸一化、加掩模,直方圖均衡等處理。然后,依次通過 Gabor變換,PCA特征降維和 LDA(Linear Discriminant Analysis)特征選擇等過程。接著,選取不同的相似度求取方式,獲得相似度向量。在尋優(yōu)超平面過程中將人臉庫中一部分圖像作為訓(xùn)練集,找出最優(yōu)超平面,最后根據(jù)該超平面在非訓(xùn)練集進(jìn)行開集判別;在最近鄰方法中,選取相似度向量最大者,與閾值進(jìn)行比較進(jìn)行開集判別。
表1和表2為當(dāng)FAR和FRR相等時(shí)的本文所述LDA方法和最近鄰方法的正確識(shí)別率的統(tǒng)計(jì)。在FERET數(shù)據(jù)庫中,本文所述方法在不同的識(shí)別方法中分別使識(shí)別率提高31.8%,12.3%,20.3%,6.3%;而在 CAS數(shù)據(jù)庫中,新算法在不同的識(shí)別方法中分別使識(shí)別率提高 39.1%,31.5%,3.8%,23.6%。由表1、表2可以看出,本文提出的新算法由于引入了更加豐富的相似度空間信息,顯著地提高了開集識(shí)別的性能。
表1 在FERET上FAR=FRR時(shí)正確識(shí)別率
表2 在CAS上FAR=FRR時(shí)正確識(shí)別率
圖4為超平面尋優(yōu)引入前后分值的直方圖分布的比較。圖4中,人臉庫采用FERET,特征采用灰度特征,分類方法為 PCA,相似度求取方式為歐氏距離。同類分值分布曲線根據(jù)集內(nèi)樣本分值大小統(tǒng)計(jì),異類分值分布曲線根據(jù)集外樣本分值大小統(tǒng)計(jì)。在最近鄰方法中,分值是指相似度最高值,在本方法中,分值是指相似度向量向最優(yōu)法向量映射后得到的值。圖中實(shí)線為本方法的分值分布,虛線為最近鄰方法的分值分布。
不難看出,引入尋優(yōu)超平面方法之后,分值交疊區(qū)域大大減小,也就是說引入該方法后,集內(nèi)分值和集外分值更為分開,說明本方法在利用了相似度空間中更多信息之后,相較最近鄰方法而言,提取出的分值具有更強(qiáng)的分類能力。
圖4 引入機(jī)器學(xué)習(xí)前后分值比較
新算法對(duì)于各種特征和分類器具有良好的魯棒性。無論采用Gabor或灰度特征,在多種識(shí)別方法和相似度求取方式下,正確識(shí)別率明顯提高。
現(xiàn)有最近鄰方法僅利用了相似度分布中一個(gè)維度的信息,為了充分利用相似度空間的信息,以提高識(shí)別率,本文針對(duì)整個(gè)相似度空間進(jìn)行尋優(yōu),尋找最優(yōu)超平面來分隔接受樣本和拒絕樣本,并通過判斷與超平面的相對(duì)位置實(shí)現(xiàn)集內(nèi)集外的判別過程。本文所述相似度空間尋優(yōu)方法對(duì)于各種特征和分類器具有良好的魯棒性,無論采用 Gabor或灰度特征,在多種識(shí)別方法和相似度求取方式下,識(shí)別正確率總在尋優(yōu)后明顯提高。算法簡(jiǎn)便,易于實(shí)現(xiàn),適于多種人臉庫、多種特征以及識(shí)別方法。實(shí)驗(yàn)表明該算法在判別準(zhǔn)確率上,明顯高于傳統(tǒng)的最近鄰判別方法。
[1]Jain A K, Ross A and Prabhakar S: An Introduction to Biometric Recognition[J].IEEE Trans on Circuits and Systems for Video Technology, Special Issue on Image and Video Based Biometrics, 2004, 14(1): 4-20.
[2]Richard O,Duda, Peter E.Hart, David G.Stork. Pattern Classification[M]. New York: John Wiley & Sons,Inc.2001:146-160.
[3]Jain A K, Nandakumar K, Ross A A. Score Normalization in Multimodal Biometric Systems[J].Pattern Recognition,2005, 38(12): 2270-2285.
[4]Fayin Li,and Harry Wechsler.Open Set Face Recognition Using Transduction[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(11): 1686-1697.
[5]Phillips P J, Moon H.et al. The FERET evaluation methodology for face-recognition algorithms[J].IEEE Trans on Pattern Analysis and Machine Intelligence, 2000,22(10): 1090-1104.
[6]Wen Gap, Bo Cao.Shiguang Shan et al. The CAS-PEAL Large-Scale Chinese Face Database and Evaluation Protocols[R],Joint Research & Development Laboratory,CAS, No.JDL_TR_04_FR_001, 2004.