池義勇
(日東高速公路 臨沂管理處,山東 臨沂273400)
責任編輯:任健男
最近在模式識別領域,研究人員提出了一個有前景的圖像識別方法,即所謂的稀疏表示法[1],該方法沒有利用傳統(tǒng)的方式進行圖像分類,而是首先使用訓練樣本子集的線性組合來表示測試樣本,然后基于表達式的結(jié)果,對測試樣本進行分類。這種方法已經(jīng)獲得了非常不錯的性能,并且被一致認為是人臉識別研究的一個突破[2]。然而,稀疏表示法有非常高的計算開銷,主要是因為它依賴迭代算法來實現(xiàn)解決方案。稀疏表示法也可用于乳腺癌的識別分類、信號處理及圖像分解等[3]。
以前的人臉識別方法通常由特征提取、分類器的選擇及分類這三個階段組成。通常,特征提取階段由變換方法實現(xiàn),如基于獨立成分分析方法[4]、主成分分析方法[5]和判別分析方法[6]。然而,稀疏表示法采用了引人注目的新的方法來解決人臉識別問題,它不包含特征提取和分類器選擇階段,相反它嘗試用測試樣本表示為訓練集的稀疏線性組合。術語“訓練樣本的稀疏線性組合”意味著如果測試樣本可表示為所有訓練樣本的線性組合,那么大部分成分的組合都是零[6]。如此看來,稀疏表示法試圖尋求不同訓練樣本在“構(gòu)建”測試樣本時潛在的影響,并打算將測試樣本分類,它的訓練樣本具有最大的效果。換句話說,這種方法假定,測試樣本可使用不同類的訓練樣本效果的總和近似表示,并且具有最大效果的類與測試樣本最相似[7-8]。
本文提出了一個簡單并且快速的人臉識別方法,該方法與稀疏表示法部分相似,然而它在計算上卻更加有效,并且有一個獨特的特征,其解決方案可以很容易地實現(xiàn)。首先,所提方法從每個類中為每個測試樣本,只選擇一個鄰居樣本,然后把測試樣本表示為所有選定鄰居樣本的線性組合,最后,基于表達式結(jié)果,該方法構(gòu)造一個分類過程。所提方法在人臉識別應用中表現(xiàn)出了很好的性能。
由于所提方法僅使用了L個訓練樣本來表示及分類測試樣本(L是所有的類的數(shù)目),也是一種稀疏表示法,且能夠繼承該方法的優(yōu)點。分析表明,使用本文方法來選擇及使用訓練樣本是最合適的,因為可產(chǎn)生最小的分類錯誤。也就是說,如果使用其他L個訓練樣本來表示和分類測試樣本,將獲得更高的分類錯誤。實驗結(jié)果表明,本文方法比最近鄰方法(Nearest Neighbor Classication Methods,NNCM)更好。最近鄰方法的確是一種特殊形式的K近鄰分類器[9],最近鄰方法首先要確定的是與測試樣本最近的訓練樣本,然后把測試樣本分到訓練樣本的類中。本文的方法由歐氏度量決定,通過修改測試樣本和訓練樣本之間的鄰居關系,以達到更好的性能。而且,雖然本文方法執(zhí)行分類時,依賴的訓練樣本比NFS[10]方法少得多,但它能獲得更好的性能。
本節(jié)開始描述了所提的基于表示的簡單快速方法(Simple and Fast Face Recognition,RSF),該方法包含兩個步驟:第一步,從每個類中選擇與測試樣本最近的訓練樣本。假設有L個類,先獲得測試樣本的L個最近的訓練樣本(NTS),每個都各來自一個類;第二步,把測試樣本表示為所有選擇的L個NTSs的線性組合,并利用所確定的線性組合來對測試樣本分類。此外,假設每個訓練樣本和測試樣本均為列向量。
RSF的第二步工作為:假設測試樣本y可近似表示為所有NTSk,k=1,2,…,L的線性組合,即假定下面的等式滿足
式(2)可改寫成
式中:β=(β1,β2,…,βL)T。如果STS是非奇異的,則可以用β=(STS)-1STY來得到式(3)的最小二乘解。如果STS幾乎奇異,則利用β=(STS+μⅠ)-1STY來求解β,其中μ是一個正常量,Ⅰ是標識。利用這個方法作為RSF的正規(guī)化解決方案。得到β之后,再利用表示Sβ,即=Sβ,為RSF的表達式結(jié)果。
等式(2)表明,每個NTS對表示測試樣本有著自己的貢獻,第i個NTS做的貢獻為βiNTSi。此外,第i個NTS表示的測試樣本的能力可由βiNTSi與Y之間的偏差來評估。把偏差定義為ei=‖Y-βiNTSi‖2。RSF認為,ei越小,第i個NTS表示測試樣本的能力就越強。第二步標識了NTS,其在測試樣本中具有最小偏差,并把測試樣本分到標識的NTS的類中。應當指出的是,每個類只有一個NTS和第i個NTS對應的第i個類。如果et=minei,那么,測試樣本被分到第t類中,參考第t類的最近鄰,可以把它當作是RSF所確定的最近鄰。
RSF方法與稀疏表示法[2]不同,它有一個非常簡單的解決方案,然而,稀疏表示法的迭代解決方案計算不是很高效;此外,RSF方法可以看作是一種特殊的稀疏表示法。其實,如果RSF中的線性組合強制改寫為所有訓練樣本的線性組合,那么,除了NTS,所有訓練樣本的線性組合的系數(shù)都應該為零。
雖然RSF和文獻[2]中的方法都為稀疏表示法,但是它們使用了兩種不同的方式來得到稀疏性。RSF使用第一步來產(chǎn)生稀疏性,系數(shù)很稀疏(即有多少零系數(shù)),且它的系數(shù)均為零。然而稀疏表示法通過迭代算法得到稀疏性,并不知道線性組合的哪些系數(shù)等于或近似等0。把所以,也可以把RSF方法稱作“硬”稀疏表示法,文獻[2]中的方法稱為“軟”稀疏表示法。
RSF方法有兩個優(yōu)勢。第一,它僅利用較少數(shù)目的訓練樣本來表示和分類測試樣本。其結(jié)果是,RSF方法可以有效地解決式(3)中的計算,當解決式(3)中的線性系統(tǒng)時,它需要的時間復雜度為O(L2M+L3+LM),其中,M是樣本向量的維數(shù)。NFS方法解決線性系統(tǒng),所需要的時間復雜度為O(n2M+n3+nM)=O(nNM+Nn2+NM),其中,n和N分別是每個類訓練樣本的數(shù)目和所有訓練樣本的數(shù)目。RSF的第二個好處是,雖然簡單并且與NNCM部分相似,但是,它比NNCM的性能更好,NNCM可以描述成這樣一種方法,它利用每個類的最近鄰來對測試樣本進行分類。NNCM過程如下:首先,NNCM從每個類中為測試樣本選擇最近鄰。NNCM標識的樣本是,在L個選擇的最近鄰(NTS)中與測試樣本最近的那個,并且假設測試樣本來自于同一個類中,L是所有類的數(shù)目。RSF優(yōu)于NNCM的主要原因是修改了由歐氏度量決定的測試樣本和訓練樣本之間的鄰居關系。如第1.1節(jié)所述,在RSF方法中的測試樣本與訓練樣本之間的鄰居關系,最終由測試樣本與表示NTS測試樣本的貢獻之間的偏差決定。
RSF的過程如下:第一步,使用歐氏度量來為測試樣本從每個類中選擇鄰居樣本;第二步,使用在前面定義的偏差來對測試樣本和鄰居樣本之間的鄰居關系重新排序,其中鄰居樣本由第一步?jīng)Q定。即第二步使用的測試樣本與表示NTS測試樣本的貢獻之間的偏差作為度量標準。第二步使用了這個度量,決定了“最后的近鄰”,并且把測試樣本分到“最后的近鄰”屬于的類中。圖1顯示了所提出的RSF方法的流程圖,從圖1可以清楚地看到,RSF方法標識的RTS具有最小偏差,假定測試樣本來自RTS標識的類中,則RSF方法中的分類等價于基于偏差度量的最近鄰分類。
圖1 RSF方法的流程圖
當RSF嘗試使用L個訓練樣本來表示測試樣本時,它需要使用最合適并且最重要的L個樣本。即在所有訓練樣本中,就表示測試樣本的能力而言,L個最近鄰(NTSs)是最重要的L個訓練樣本。但其實,如果使用其他的L個樣本來表示和對測試樣本進行分類,分類的性能可能會很差。
實驗使用了ORL和Yale兩大通用人臉數(shù)據(jù)庫來測試所提出的RSF方法。所有的實驗均在4 Gbyte內(nèi)存的Intel Core 2.93 GHz Windows XP計算機上完成,編程環(huán)境為MATLAB 7.0。ORL數(shù)據(jù)庫包含40個人的400張人臉圖像,每人10張,包含不同的面部表情的變化(笑/不笑,睜/閉眼)和面部細節(jié)。對象處于直立正面的位置且具有高達200的傾斜和旋轉(zhuǎn),每張人臉圖像為112×92像素,圖2為ORL上某人的10張不同的人臉圖像。
圖2 ORL上某人的10張人臉圖像
Yale數(shù)據(jù)庫包含15個人的165張人臉圖像,每人11張,具有許多表情,如正常的、悲傷的、快樂的、困乏的、驚訝的、眨眼的等,且都是在不同的光照條件下獲得的,還有一些人臉是帶著眼鏡的,Yale上某人的11張人臉圖像如圖3所示。
圖3 Yale上某人的11張人臉圖像
為了更好地體現(xiàn)出所提方法的優(yōu)越性,將所提方法與NNCM[9]、NFS[10]、最遠鄰方法[4]、使用第一個樣本方法[6]、使用最后一個樣本方法[6]的錯誤分類率進行了對比。而且,對于測試樣本,通過為每個測試樣本選擇每個類的第一個或最后一個訓練樣本,來修改RSF方法,通過選擇的第一個或最后一個訓練樣本來表示和分類測試樣本。前面提到的使用了第一個和最后一個訓練樣本的方法,分別可視為使用第一個樣本的方法和使用最后一個樣本的方法。從每個類中對測試樣本選擇最遠的鄰居來修改所提的RSF方法,利用它們來表示和分類測試樣本,引用此方法是因為該方法使用了最遠的鄰居。
實驗選用了ORL及Yale的前l(fā)(l=1,2,3,4)張圖像作為訓練樣本,剩下的圖像作為測試樣本。實現(xiàn)所有的方法之前,先把每個樣本向量轉(zhuǎn)換成長度為1的單位向量。使用正則法來獲得RSF的解決辦法,并設置μ為0.01。參考各方法的所在文獻,為各個方法設置不同的參數(shù),進行了大量的實驗,并取最佳的實驗結(jié)果,如表1、表2所示。
表1 各方法在Yale上的平均分類錯誤率
表2 各方法在ORL上的平均分類錯誤率
從表1、表2可以看出,所提的RSF方法比NNCM、NFS、最遠鄰的方法、使用第一個樣本方法、使用最后一個樣本方法分類都精確。RSF的錯誤率比NNCM、RSF、最遠鄰方法、使用第一個樣本方法、使用最后一個樣本方法分別低了0.91%,0.49%,22.26%,8.93%,9.62%。
ORL數(shù)據(jù)庫中RSF的錯誤率比NNCM、RSF、最遠鄰方法、使用第一個樣本方法、使用最后一個樣本方法分別低了1.50%,0.74%,35.72%,22.43%,25.38%。雖然這些方法都使用相同數(shù)目的訓練樣本來表達和分類測試樣本,但是RSF使用了最適合的訓練樣本,所以,無論是在ORL還是Yale數(shù)據(jù)庫,也無論訓練樣本數(shù)為多少,RSF的分類性能總是比其他各個方法更優(yōu)。
RSF通過利用抑制訓練樣本中的測試樣本的能力,而不僅僅是一個簡單的距離來分類測試樣本,已被驗證是一個用來產(chǎn)生較高分類精度的好方法。分析表明,對于RSF方法,使用的L個最近鄰是最合適的訓練樣本,用其表示和分類測試樣本。而且,盡管RSF比NFS方法要更稀疏,但它可能會獲得更好的性能。
本文提出了一種基于表示的簡單快速的人臉識別方法(RSF),使用了每個類中的最近鄰來表示測試樣本并對其進行分類。RSF方法比NNCM獲得更低的錯誤率,這兩種方法之間準確度的最大差值可能大于10%。除了方法設計和實驗分析,本文也直觀地描述了RSF的基本原理和特點。
[1]廖海斌,郝寧波,陳慶虎.基于奇異值與稀疏表示的穩(wěn)健性人臉識別[J].計算機科學,2010,34(7):99-103.
[2]蘇煜,山世光,陳熙霖,等.基于全局和局部特征集成的人臉識別[J].軟件學報,2010,21(8):1849-1862.
[3]朱杰,楊萬扣,唐振民.基于字典學習的核稀疏表示人臉識別方法[J].模式識別與人工智能,2012,25(5):859-864.
[4]柴智,劉正光.應用復小波和獨立成分分析的人臉識別[J].計算機應用,2010,30(7):1863-1866.
[5]嚴慧,金忠,楊靜宇.非負二維主成分分析及在人臉識別中的應用[J].模式識別與人工智能,2009,22(6):809-814.
[6]周春光,孫明芳,王甦菁,等.基于稀疏張量的人臉圖像特征提取[J].吉林大學學報:工學版,2012,42(6):1521-1526.
[7]崔鵬,張汝波.半監(jiān)督系數(shù)選擇法的人臉識別[J].哈爾濱工程大學學報,2012,33(7):855-861.
[8]蘇超,肖南峰.基于集成BP網(wǎng)絡的人臉識別研究[J].計算機應用研究,2012,29(11):4334-4337.
[9]張強,戚春,蔡云澤.基于判別改進局部切空間排列特征融合的人臉識別方法[J].電子與信息學報,2012,34(10):2396-2401.
[10]王娜,李霞,劉國勝.基于特征子空間鄰域的局部保持流形學習算法[J].計算機應用研究,2012,29(4):1318-1321.