基于降維的人臉識別方法研究與應(yīng)用*

2018-12-25 02:32:40簡彩仁莊凌宇林智鵬

網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2018年12期

簡彩仁，莊凌宇，林智鵬

(廈門大學(xué)嘉庚學(xué)院,福建漳州 363105)

0 引言

人臉識別是基于人臉的面部特征辨識身份的生物識別技術(shù)。人臉識別最主要的用途是確定人的身份。隨著計算機技術(shù)的不斷發(fā)展，人們獲取人臉圖像數(shù)據(jù)變得異常容易，因此人臉識別的發(fā)展和應(yīng)用更是不斷深入和普及。人臉識別技術(shù)已經(jīng)廣泛應(yīng)用在軍隊、醫(yī)療、銀行、公安、電子商務(wù)等行業(yè)。由于當(dāng)前人臉識別的應(yīng)用場景得到的高維數(shù)據(jù)愈發(fā)龐大，因此研究基于降維的人臉識別方法具有重要的意義。

人臉識別研究是當(dāng)前研究的熱點問題。許多降維方法被應(yīng)用于人臉識別研究?；诰€性降維方法的人臉識別研究代表性方法是線性判別分析(LDA)[1]，該方法使降維數(shù)據(jù)類內(nèi)距離小，類間距離大，但是對小樣本數(shù)據(jù)容易產(chǎn)生非奇異解。基于流形學(xué)習(xí)的降維方法，如等距映射(ISOMAP)[2]、局部線性嵌入(LLE)[3]等，旨在保持局部結(jié)構(gòu)實現(xiàn)降維，更適合非線性數(shù)據(jù)的降維，但是這些方法嚴(yán)重依賴于近鄰關(guān)系，當(dāng)存在較小誤差時，可能會對全局估計產(chǎn)生較大的影響。基于稀疏表示的降維方法在人臉識別中也有重要的應(yīng)用，該方法的優(yōu)點是可以避免過擬合問題，但是運算效率不高[4-5]。

本文從降維的角度研究人臉識別。通過線性降維方法主成分分析和非線性降維方法核主成分分析對人臉圖像數(shù)據(jù)進行降維研究。降維方法可以有效剔除人臉圖像數(shù)據(jù)的冗余特征，從而提高識別準(zhǔn)確率。通過實驗比較降維人臉圖像數(shù)據(jù)與原始人臉圖像數(shù)據(jù)的識別準(zhǔn)確率。

1 相關(guān)方法

1.1 主成分分析

主成分分析(Principal Component Analysis，PCA)方法將一組可能存在相關(guān)性的變量通過正交變換轉(zhuǎn)換為一組線性不相關(guān)的變量，使其成為統(tǒng)計的依據(jù)，轉(zhuǎn)換后的這組變量叫主成分。主成分分析的主要思想是投影樣本點的方差最大化。從最大可分性的角度可以對主成分分析進行另一種解釋。通過投影矩陣W將樣本點xi投影到新空間的超平面上，投影得到WTxi?？梢酝ㄟ^最大化投影樣本點的方差達到盡可能區(qū)分投影樣本點的目的。

s.t.WTW=I

(1)

通過拉格朗日乘子法，式(1)可以通過特征值問題XXTW=λW求解。

1.2 核主成分分析

主成分分析是一種經(jīng)典的線性降維方法，但不利于發(fā)現(xiàn)高維小樣本數(shù)據(jù)的本質(zhì)特征。針對這一不足，核主成分分析基于核理論對主成分分析進行“核化”，擴展成適合非線性降維的方法。

給定非線性特征空間映射Φ:Rm→M，其中Rm為高維樣本空間，M是低維流形空間，因此原始高維數(shù)據(jù)X的低維流形表示為Φ(X)。對高維空間樣本Φ(X)進行主成分分析得到核主成分分析問題的優(yōu)化目標(biāo)函數(shù)為：

s.t.WTW=I

(2)

直接定義非線性映射Φ(X)是困難的，核表示理論給出了一種不需要定義非線性映射的技術(shù)[6-7]。設(shè)K∈Rn×n是一個半正定核矩陣，它們的元素定義為:

[K]ij=[(Φ(X),Φ(X))M]ij=Φ(xi)TΦ(xj)=k(xi,xj)

因此核主成分分析的目標(biāo)函數(shù)(2)可以轉(zhuǎn)化為:

s.t.WTW=I

(3)

通過拉格朗日乘子法，式(3)可以通過特征值問題KW=λW求解。

2 基于降維的人臉識別方法

人臉圖像數(shù)據(jù)具有高維數(shù)的特點，因此人臉圖像數(shù)據(jù)存在大量的冗余，通過降維可以得到更適合人臉識別的數(shù)據(jù)集。本節(jié)利用主成分分析和核主成分分析研究基于降維的人臉識別方法。

首先利用主成分分析或核主成分分析對數(shù)據(jù)集進行降維，再對降維后的數(shù)據(jù)集進行識別研究。結(jié)合第1節(jié)的理論，將基于降維的人臉識別方法的實現(xiàn)步驟總結(jié)成如下算法：

算法:基于降維的人臉識別方法輸入:人臉圖像數(shù)據(jù)集X,主成分保留比率pcaratio輸出:識別準(zhǔn)確率acc(1)標(biāo)準(zhǔn)化訓(xùn)練人臉圖像數(shù)據(jù)集X,使每個樣本具有單位L2范數(shù);(2)利用式(1)或式(3)求投影矩陣W;(3)對投影數(shù)據(jù)WTX用K最近鄰分類法進行分類。

3 實驗分析

本節(jié)通過實驗驗證主成分分析和核主成分分析兩種降維方法對人臉識別的影響。

3.1 數(shù)據(jù)集簡介

實驗數(shù)據(jù)集為兩個常用的人臉識別數(shù)據(jù)集Yale和ORL。

Yale人臉數(shù)據(jù)集總共采集了15個人的人臉圖像，該數(shù)據(jù)集共15個類別，165個樣本，特征數(shù)量為1 024個。在這15個對象中，每一個對象都具有11張各不相同的人臉。在這些圖像中，包含各種阻擋因素，例如角度因素、光照強度因素、相關(guān)環(huán)境變化因素以及遮擋物的影響和不同表情的變化等。圖1為部分Yale人臉圖像。

圖1 Yale人臉圖像示意圖

ORL人臉數(shù)據(jù)集共有40個對象，每一個對象都具有10張人臉，總數(shù)量達到400張灰度圖像人臉，特征數(shù)量為1 024個。每一個對象的人臉通過觀察存在肉眼可見的變化，包括遮擋物的變化、表情的變化等，在此基礎(chǔ)之上每個人臉的每一張圖片的大小都是按照一定的規(guī)律進行漸次變化，并且每個人臉之間存在20°的水平以及垂直的旋轉(zhuǎn)變化。圖2為部分ORL人臉圖像。

圖2 ORL人臉數(shù)據(jù)示意圖

3.2 實驗參數(shù)設(shè)置

實驗環(huán)境為Windows 7系統(tǒng)，安裝內(nèi)存8.00 GB(3.42 GB可用)，用MATLAB R2011b編程實現(xiàn)。利用交叉驗證對比各種方法下的識別準(zhǔn)確率。對兩個數(shù)據(jù)集通過主成分分析(PCA)和核主成分分析(KPCA)進行降維后與原始數(shù)據(jù)集進行對比，選用K最近鄰分類法進行分類對比分類準(zhǔn)確率和運行時間。實驗參數(shù)設(shè)置如下：主成分保留比率為90%，K最近鄰分類法的最近鄰參數(shù)選為1，交叉驗證折數(shù)設(shè)置為{4,5,6,7,8,9,10}。比較方法為原始數(shù)據(jù)用K最近鄰分類(KNN)、主成分分析降維數(shù)據(jù)用K最近鄰分類(PCA-KNN)、核主成分分析降維數(shù)據(jù)用K最近鄰分類(KPCA-KNN)。

3.3 實驗結(jié)果與分析

實驗1：Yale人臉圖像數(shù)據(jù)集識別實驗。該實驗利用KNN、PCA-KNN、KPCA-KNN 3種方法研究Yale人臉圖像數(shù)據(jù)集的識別準(zhǔn)確率。在不同交叉驗證折數(shù)下的識別準(zhǔn)確率如表1所示，圖3也直觀顯示了不同方法的識別準(zhǔn)確率。

表1 Yale人臉圖像數(shù)據(jù)識別準(zhǔn)確率對比 (%)

圖3 Yale人臉圖像數(shù)據(jù)集識別準(zhǔn)確率對比圖

從表1和圖3的實驗結(jié)果可以發(fā)現(xiàn)，降維后的數(shù)據(jù)集具有更好的識別準(zhǔn)確率。因此降維方法可以有效地緩解人臉圖像數(shù)據(jù)的冗余問題。再對比核主成分分析和主成分分析兩種降維方法，發(fā)現(xiàn)KPCA-KNN方法顯著優(yōu)于PCA-KNN，這反映了核主成分分析這種非線性降維方法更適應(yīng)人臉圖像的非線性性質(zhì)，從而取得更好的識別準(zhǔn)確率。

此外，表2給出了不同方法對Yale人臉圖像數(shù)據(jù)集進行識別的運行時間。

表2 Yale人臉圖像數(shù)據(jù)集識別時間對比 (s)

從表2可以發(fā)現(xiàn)，降維后可以明顯提高識別的效率。而且，非線性降維方法KPCA比線性降維方法PCA更有效率。

實驗2：ORL人臉圖像數(shù)據(jù)集識別實驗。該實驗利用KNN、PCA-KNN、KPCA-KNN 3種方法研究ORL人臉圖像數(shù)據(jù)集的識別準(zhǔn)確率。在不同交叉驗證折數(shù)下的識別準(zhǔn)確率如表3所示，圖4直觀顯示了不同方法的識別準(zhǔn)確率。

表3 ORL人臉圖像數(shù)據(jù)識別準(zhǔn)確率對比 (%)

圖4 ORL人臉圖像數(shù)據(jù)集識別準(zhǔn)確率對比圖

從表3和圖4的實驗結(jié)果可以發(fā)現(xiàn)，ORL人臉圖像數(shù)據(jù)集的識別實驗結(jié)果與Yale人臉圖像數(shù)據(jù)集的識別實驗結(jié)果類似：降維有利于人臉圖像的識別，并且核主成分分析這種非線性降維方法更適應(yīng)人臉圖像的非線性性質(zhì)，有更好的識別準(zhǔn)確率。

表4給出了ORL人臉圖像數(shù)據(jù)集在不同交叉折數(shù)下進行識別的運行時間。

表4 ORL人臉圖像數(shù)據(jù)集識別時間對比 (s)

從表4的運行時間對比可以發(fā)現(xiàn)，降維可以明顯提高識別的效率。非線性降維方法KPCA比線性降維方法PCA更有效率。不僅如此，當(dāng)樣本的個數(shù)更多時，KPCA的運行效率比PCA有明顯的改善。

通過以上兩個人臉圖像識別實驗的識別準(zhǔn)確率和運行時間對比分析，可以明顯地發(fā)現(xiàn)經(jīng)過主成分分析和核主成分分析的降維，無論是識別準(zhǔn)確率還是識別效率對比無降維數(shù)據(jù)，都具有顯而易見的優(yōu)勢。其中，核主成分分析作為主成分分析的改進，比主成分分析有更加精確的識別準(zhǔn)確率以及更好的識別效率。

4 結(jié)論

本文利用主成分分析和核主成分分析對基于降維的人臉識別方法進行了研究。實驗結(jié)果表明降維可以有效地提高人臉識別準(zhǔn)確率，而非線性降維方法更適合人臉圖像數(shù)據(jù)的降維。不僅如此，降維后的數(shù)據(jù)可以明顯提高識別效率。因此，本文的研究具有一定的實用價值。