陳 斌,東一舟,朱晉寧
(南京師范大學(xué) 信息化建設(shè)管理處,江蘇 南京210046)
人臉識(shí)別有著極其廣闊的應(yīng)用前景,由于其無(wú)侵犯性,操作較為隱蔽,可交互性好[1],近年來(lái)對(duì)其研究逐漸成為主流焦點(diǎn)。目前針對(duì)受控場(chǎng)景下的人臉識(shí)別研究已經(jīng)較為成熟并獲得了較好的效果,同時(shí)也已經(jīng)在部分領(lǐng)域推廣產(chǎn)品化應(yīng)用。然而受光照、遮擋、表情、姿態(tài)、圖像質(zhì)量等因素影響,非受控場(chǎng)景下的人臉識(shí)別技術(shù)還處于發(fā)展初期,由于其環(huán)境條件復(fù)雜、訓(xùn)練樣本要求高、算法難度大、魯棒性差、識(shí)別率低,目前仍是計(jì)算機(jī)視覺(jué)及模式識(shí)別領(lǐng)域中有待深入研究和攻克的難題。自20年前首例將主成分分析法(Principal Component Analysis,PCA)[2]引入人臉識(shí)別研究領(lǐng)域以來(lái),隨著特征提取技術(shù)手段的不斷發(fā)展,各類經(jīng)典方法也不斷推陳出新,判別分析[3]、稀疏誤差字典學(xué)習(xí)[4]、聯(lián)合輔助字典學(xué)習(xí)[5],鑒別稀疏保持[6]等方法持續(xù)為人臉識(shí)別研究中遇到的問(wèn)題提供各種解決手段。
當(dāng)前人臉識(shí)別的主要思路是通過(guò)對(duì)面部有辨識(shí)性的特征進(jìn)行提取并加以訓(xùn)練,進(jìn)而得到分類器樣本進(jìn)一步完成辨別分類工作。對(duì)于非受控場(chǎng)景下圖像質(zhì)量不佳,光照無(wú)法保證,遮擋情況嚴(yán)重,姿勢(shì)變換頻繁等因素,其最為核心的要素可以歸納為對(duì)兩類問(wèn)題的解決:如何提取人臉主要特征成分的純凈低秩信息與干擾稀疏信息加以表示,以及如何對(duì)提取出的高維矩陣進(jìn)行降維。
為進(jìn)一步提高非受控場(chǎng)景下的人臉識(shí)別率,降低非受控場(chǎng)景下干擾因素的影響,本文提出了以主成分稀疏表示方法對(duì)人臉特征進(jìn)行表征,并采用低秩分解方式減少各種干擾因素對(duì)圖像造成的影響,降低聚合相關(guān)性的方法。本文通過(guò)將圖像向低秩子空間進(jìn)行投射并轉(zhuǎn)換為稀疏表示的方式來(lái)完成識(shí)別,并通過(guò)低秩分解將噪聲影響減小,從而增加了識(shí)別效果的健壯性和魯棒性。
一般人臉識(shí)別包含人臉檢測(cè)、預(yù)處理、特征提取、分類識(shí)別和身份確認(rèn)這5個(gè)主要階段,基本流程如圖1所示[7]。人臉識(shí)別屬于模式識(shí)別的范疇,其主體工作思路步驟如下:第一步對(duì)樣本庫(kù)的圖像進(jìn)行預(yù)加工,提取其關(guān)鍵特征,減少圖像信息的數(shù)據(jù)量,也就是進(jìn)行圖像數(shù)據(jù)的降維處理,從而獲得對(duì)應(yīng)圖像的特征向量,以此為基礎(chǔ)建立樣本向量分類庫(kù)。第二步對(duì)待識(shí)別圖像重復(fù)進(jìn)行類似操作,繼而獲得待識(shí)別圖像的特征向量。第三步使用提取出的待識(shí)別圖像的特征向量與樣本庫(kù)中特征向量進(jìn)行匹配,檢索有無(wú)滿足匹配的情況。所謂非受控場(chǎng)景下的人臉識(shí)別,指的是在待檢測(cè)對(duì)象自身未知并無(wú)刻意干涉的條件下被執(zhí)行的,通過(guò)對(duì)其圖像進(jìn)行識(shí)別從而完成對(duì)其身份進(jìn)行確認(rèn)的過(guò)程。由于同受控場(chǎng)景下的人臉圖像相比非受控場(chǎng)景下的圖像質(zhì)量差,存在不同程度遮擋,姿態(tài)角度變化大,光照無(wú)法保證等情況,造成非受控場(chǎng)景的人臉識(shí)別面臨巨大的障礙。
目前針對(duì)非受控條件下的人臉識(shí)別主要有4類方法:基于圖像修復(fù)手段的遮擋人臉識(shí)別算法;基于局部特征分析手段的遮擋人臉識(shí)別算法;基于魯棒性估計(jì)方法的遮擋人臉識(shí)別算法;基于稀疏表示方法的遮擋人臉識(shí)別算法[8]。第一類方法原理是從未被遮擋區(qū)域提取灰度值,進(jìn)而對(duì)鄰域遮擋區(qū)域進(jìn)行修復(fù),該方法在小范圍遮擋情況下識(shí)別率較高,但在較大遮擋情況下識(shí)別成功率會(huì)大幅衰減。第二類方法原理是對(duì)各個(gè)區(qū)域的特征進(jìn)行抽取,各自設(shè)置不同的權(quán)重,但由于加權(quán)過(guò)程本身具有隨機(jī)性,所以識(shí)別效果較難達(dá)到預(yù)期。第三類方法原理是利用機(jī)器學(xué)習(xí)方法,以無(wú)遮擋區(qū)域?yàn)榛A(chǔ),對(duì)鄰域有遮擋區(qū)域進(jìn)行估算,由于其噪聲敏感性強(qiáng),對(duì)訓(xùn)練樣本要求又非常高,所以應(yīng)用可行性較差。第四類方法的原理是依據(jù)圖片的稀疏表示結(jié)果對(duì)其進(jìn)行判別和分類,該方法對(duì)空間相關(guān)性的遮擋識(shí)別效果較好,但對(duì)于連續(xù)性遮擋的識(shí)別效果較差。
非受控場(chǎng)景下由于受到光照、遮擋和姿態(tài)的影響,人臉識(shí)別的效果無(wú)法保證,這三者也是導(dǎo)致非受控場(chǎng)景下識(shí)別效果差的最主要的3個(gè)因素。通常對(duì)于這3個(gè)影響因素分別進(jìn)行處理,以期達(dá)到集成處理效果。由于人臉圖像采集場(chǎng)景受光照條件的影響,即便同一個(gè)人,在不同的燈光照射條件下成像效果也會(huì)有非常大的差別。對(duì)于光照影響的處理方式一般為通過(guò)光照補(bǔ)償預(yù)處理提升圖像人臉的可識(shí)別率,主流的光照補(bǔ)償預(yù)處理方法有以下幾種:(1)依托圖像再加工技術(shù)修正,例如直方圖均衡化處理,直方圖合規(guī)化處理,以及Gamma灰度校正處理[9];(2)依托光照模型修正,例如單尺度或多尺度自商圖像光照預(yù)處理[10];(3)子空間分析修正。對(duì)于遮擋和姿態(tài)變化的影響一般采用圖像合成重構(gòu)手段來(lái)解決,具體常用方法有Mulit-View集成方法[11]以及3D建模重構(gòu)的方法[12]。
基本的人臉圖像表示方法為通過(guò)提取圖像的所有像素點(diǎn),并按照灰度值進(jìn)行行列級(jí)聯(lián)向量表征。但對(duì)于非受控場(chǎng)景下的圖片,光照、遮擋和姿態(tài)等因素使得其圖像的灰度值變化非常大,如果直接進(jìn)行像素點(diǎn)行列級(jí)聯(lián)表征,將會(huì)使得識(shí)別準(zhǔn)確率迅速衰減,極不穩(wěn)定。所以通常在非受控場(chǎng)景下一般都是采用捕捉圖像的基于頻域或者小波域的特征對(duì)人臉進(jìn)行表示,比較重要的有傅里葉變換[13]、離散余弦變換[14]、離散小波變換[15]及Gabor小波變換[16]。人臉識(shí)別的最重要基礎(chǔ),是對(duì)待檢測(cè)人臉特征的提取。在非受控條件下進(jìn)行人臉識(shí)別,優(yōu)秀的特征表征方法應(yīng)當(dāng)是能夠在外部環(huán)境影響和變化較大的背景下,依然能夠分辨出待檢測(cè)個(gè)體之間的本質(zhì)差異,也只有魯棒性和健壯性都符合要求的表征手段才可能滿足非受控場(chǎng)景下多變的需求。
圖1 人臉識(shí)別主要階段框架流程圖Fig.1 Frame flow chart of the main phase of face recognition
主成分分析是一種統(tǒng)計(jì)方法,通過(guò)正交變換將一組可能存在相關(guān)性的變量轉(zhuǎn)換為一組線性不相關(guān)的變量,轉(zhuǎn)換后的這組變量叫做主成分。稀疏表示即如何通過(guò)最小數(shù)量的系數(shù)集合盡可能更多的描述信號(hào)的能量,也可以視為信息的容量。不同類型的信號(hào),其在不同變換模式下系數(shù)的分布會(huì)不同。由于主成分分析的對(duì)象即主成分是數(shù)據(jù)變量的線性組合,當(dāng)進(jìn)一步需要對(duì)主成分進(jìn)行分析和解釋時(shí),便無(wú)法表示每一個(gè)主成分對(duì)應(yīng)的具體特征。主成分稀疏表示方法便是為了解決此問(wèn)題而演進(jìn)得出的一個(gè)算法。它會(huì)把主成分系數(shù)稀疏化解,即對(duì)大量干擾系數(shù)進(jìn)行辨識(shí),并將其進(jìn)行置零轉(zhuǎn)化,通過(guò)這一處理,主成分的核心部分就被顯性表示。
針對(duì)圖像識(shí)別領(lǐng)域,特別對(duì)于面向人臉檢測(cè)識(shí)別方向,將由同一個(gè)待測(cè)對(duì)象的多幅圖像組成一組列向量:
Ri=[ki,1,ki,2,…,ki,ni]∈Km×ni,
(1)
其中:m代表圖片的特征向量維度,k代表訓(xùn)練集樣本列矢量集,待檢測(cè)對(duì)象的訓(xùn)練樣本的全局矢量集可以按式(2)表示:
R=[R1,R2,…,RT]=[k1,1,k1,2,…,kT,nT]∈Km×M,
(2)
(3)
其中:s為低秩矩陣S的秩數(shù)。利用傳統(tǒng)主成分分析方法對(duì)R分析求解,理論上可以得到最優(yōu)解,但實(shí)際情況比較復(fù)雜,矩陣D通常不滿足泊松分布,傳統(tǒng)主成分分析方法得出的結(jié)果就會(huì)有較大的偏差。對(duì)于待測(cè)圖像對(duì)象,這種偏差或誤差可以用稀疏矩陣表示,進(jìn)而將問(wèn)題演化為雙目標(biāo)的優(yōu)化求解:
(4)
但雙目標(biāo)化帶來(lái)的直接后果將是高維復(fù)雜度,求解效率曲線陡降。為解決該問(wèn)題,需要在低秩質(zhì)量和稀疏誤差這一對(duì)關(guān)系相異的目標(biāo)之間設(shè)置最優(yōu)權(quán)重,權(quán)重參數(shù)由λ表示。于是求解過(guò)程演化為:
(5)
通過(guò)多次迭代演算,逐步收斂得到最優(yōu)解。稀疏表示的最佳影射矩陣是按照向量的內(nèi)聯(lián)緊密度及外聯(lián)疏散度來(lái)衡量的。訓(xùn)練樣本集S由n個(gè)單獨(dú)樣本構(gòu)成,樣本集中每個(gè)樣本的列向量表示為si,假設(shè)si屬于S的第x種類別,該類別中具備的樣本體量為tx??蓪?nèi)聯(lián)緊密度定義為:
(6)
其中下列兩個(gè)集合序列:
Sx=[sx,1,sx,2,…,sx,nx]∈Km×nx,
(7)
(8)
為內(nèi)聯(lián)稀疏密度,k代表內(nèi)聯(lián)方式。內(nèi)聯(lián)緊密度標(biāo)的表示為:
(9)
(10)
其中下列兩個(gè)集合序列:
Sx=[S1,S2,…,St],
(11)
(12)
為外聯(lián)稀疏密度。外聯(lián)疏散度標(biāo)的表示為:
(13)
對(duì)于非受控場(chǎng)景,受光照變化,遮擋頻繁,姿態(tài)表情多變等因素的影響,干擾成因復(fù)雜,數(shù)據(jù)噪聲種類和體量龐大,關(guān)鍵數(shù)據(jù)丟失嚴(yán)重。而正是由于各類不可控因素對(duì)非受控場(chǎng)景造成的影響,使得在這種情況下內(nèi)聯(lián)變化的作用力遠(yuǎn)超過(guò)外聯(lián),這也將使得識(shí)別效果陡降。為提高非受控場(chǎng)景下人臉識(shí)別的準(zhǔn)確度,提出了非受控場(chǎng)景下主成分稀疏表示與低秩分解算法相結(jié)合的方法。首先對(duì)待測(cè)樣本提取主成分,然后把主成分系數(shù)稀疏化解,置零轉(zhuǎn)化,獲取到樣本對(duì)象的主成分低秩矩陣以及稀疏誤差矩陣,再通過(guò)雙目標(biāo)權(quán)重設(shè)置,迭代演算形成最終結(jié)果。
非受控場(chǎng)景下,光照對(duì)成像質(zhì)量的影響特別明顯,在非均勻光照情況下,人臉中的關(guān)鍵特征信息難于捕捉提取,大量光影噪聲會(huì)對(duì)主成分辨識(shí)過(guò)程產(chǎn)生嚴(yán)重干擾。利用低秩分解對(duì)待測(cè)對(duì)象關(guān)鍵特征及稀疏偏差有較強(qiáng)的分離作用,對(duì)低秩矩陣進(jìn)行離散濾波編碼,以增強(qiáng)光照情況下的圖像識(shí)別處理能力。設(shè)備成像處理過(guò)程較為復(fù)雜,光照變化較大時(shí),落在待測(cè)對(duì)象,特別是人臉對(duì)象上關(guān)鍵信息點(diǎn)的像素值會(huì)有非常大的跳變。Lambert光照模型是光源照射到物體表面后,向四面八方反射,產(chǎn)生的漫反射效果,它是一種理想的漫反射光照模型。根據(jù)該模型的定義,待測(cè)對(duì)象特征點(diǎn)的像素值可以表示為P(u,v)=R(u,v)×S(u,v),其中R(u,v)為該點(diǎn)的光照向量,S(u,v)為該點(diǎn)的反射向量。一般情況下,光照向量用來(lái)表示待測(cè)對(duì)象點(diǎn)在光照影響下的全局像素信息,而反射向量則用來(lái)表示反映了待測(cè)對(duì)象點(diǎn)關(guān)鍵本質(zhì)的紋理信息。由于待檢測(cè)人臉對(duì)象的光照向量變化趨緩,且關(guān)鍵特征并存于同級(jí)低秩空間,所以可以使用主成分稀疏表示與低秩分解對(duì)圖像主成分特征和光照影響噪聲進(jìn)行低秩分離。由于在連續(xù)光照背景下的多幅面部成像之間進(jìn)行低秩分量的分解,光照影響會(huì)被削弱,所以光照邊緣誤差也會(huì)降低,進(jìn)而反射向量中面部關(guān)鍵信息會(huì)增多。對(duì)待檢測(cè)對(duì)象進(jìn)行低秩分解,形成面部低秩矩陣圖像。以Ps作為面部對(duì)象P在(u,v)像素點(diǎn)上對(duì)應(yīng)的像素值,由此可以得出:
(14)
式(15)為P(u,v)的低秩階梯增量:
(15)
式(16)為點(diǎn)位(u,v)的反正切階梯向位:
(16)
K=[ls1,ls2,…,lsx]為x張待測(cè)對(duì)象的集合,lp∈Sm(i=1,2,…x)為低秩階梯增量遞進(jìn)拼接而成的m維向量。低秩分解終極目標(biāo)就是對(duì)下式求最優(yōu)解:
MinRank(R)+η‖Q‖0,s.t.K=R+Q,
(17)
其中:R為K的低秩光照向量,Q為K的稀疏反射向量。為了將問(wèn)題線性簡(jiǎn)化,可以對(duì)上面問(wèn)題進(jìn)行凸最優(yōu)化處理,計(jì)算過(guò)程轉(zhuǎn)換為:
Min‖R‖*+η‖Q‖1,s.t.K=R+Q,
(18)
根據(jù)增廣拉格朗日乘子法(Augmented Lagrange multiplier,ALM)可以獲取上述凸最優(yōu)化處理范式的目標(biāo)范式:
MinRank(B),s.t.R=B×K.
(19)
上述計(jì)算過(guò)程及范式與初始低秩分解最優(yōu)解范式一致,其中R為K的低秩光照向量,Q為K的稀疏反射向量。按照低秩階梯增量分解并按照光照向量與光照反射邊緣稀疏誤差相結(jié)合計(jì)算處理后,主成分稀疏表示與低秩分解算法表現(xiàn)出了較好的魯棒性。
同時(shí),在非受控場(chǎng)景下,遮擋和表情變化對(duì)成像質(zhì)量的影響也尤為顯著。雖然很多經(jīng)典算法在人臉識(shí)別領(lǐng)域,特別是對(duì)臉部關(guān)鍵特征捕捉上,都有著不錯(cuò)的表現(xiàn)。而一旦在非受控開放環(huán)境中,存在遮擋和表情變化的場(chǎng)景下,由于受噪聲污染的影響,識(shí)別效果魯棒性較差。非受控場(chǎng)景下主成分稀疏表示與低秩分解算法旨在將待檢測(cè)對(duì)象通過(guò)算法分解,分離出包含面部關(guān)鍵特征信息的低秩全局?jǐn)?shù)據(jù),以及涵蓋遮擋和表情變化等噪聲在內(nèi)的稀疏誤差數(shù)據(jù)。對(duì)于非受控條件下存在遮擋和表情變化的場(chǎng)景中,對(duì)圖像處理最棘手也是最重要的問(wèn)題,就是對(duì)待測(cè)高維圖像的降維,如何將包含多元復(fù)合信息的高維圖像數(shù)據(jù)投射到低維標(biāo)識(shí)空間。主成分分析方法被公認(rèn)為解決這一問(wèn)題的最佳途徑,然而該方法受噪聲影響特別明顯,在這種非受控場(chǎng)景中,該算法執(zhí)行分解后面臨的將是NP問(wèn)題,需要再對(duì)其進(jìn)行核范數(shù)轉(zhuǎn)化。對(duì)數(shù)據(jù)集當(dāng)中的數(shù)據(jù)按照職能輕重劃分為關(guān)鍵數(shù)據(jù)集與關(guān)聯(lián)數(shù)據(jù)集,與內(nèi)聯(lián)緊密度及外聯(lián)疏散度似而不同,它們可以分別進(jìn)行訓(xùn)練,并將分解結(jié)果直接用于對(duì)低秩子空間的初始化,并建立關(guān)鍵字典和關(guān)聯(lián)字典,從而高效精準(zhǔn)的對(duì)主成分和干擾信息進(jìn)行分類提取。
對(duì)不同人臉對(duì)象以及同一人在不同表情和遮擋程度情況下的分類,其本質(zhì)上是相同的。在對(duì)人臉的關(guān)鍵點(diǎn),例如雙眼,眉毛,鼻子,嘴巴,耳朵之間的歐氏距離的計(jì)算和對(duì)比,并增加內(nèi)聯(lián)相關(guān)性作為正則表達(dá)式的附加項(xiàng),將對(duì)識(shí)別效果產(chǎn)生積極的影響。訓(xùn)練集中的所有圖片都需要被向量化處理為N個(gè)類別,單類別向量u可以用該類別的成員集合來(lái)表示:
(20)
其中:pi為第i列向量,pi∈Sz×1,S為全局向量集,z為行秩。這里假定每個(gè)單類pi映射于相同的秩空間,投射關(guān)系表示為Ui∈Sz×ki,單類別向量u向ki維的秩空間投射關(guān)系表示為Vi∈Ski×z,可以得出:
pi=UiViu,
(21)
設(shè)置非控場(chǎng)景噪聲項(xiàng)n∈Sz×1,上式演變?yōu)椋?/p>
(22)
其中式(23)是互為稀疏誤差關(guān)系的組向量,其數(shù)值表示了u的具體分類:
[(V1u)I,(V2u)I,…(VNu)I,]I,
(23)
另外,增設(shè)了以下排除向量間的面部共性關(guān)鍵點(diǎn)的系數(shù):
(24)
最終的目標(biāo)范式可以定義為:
(25)
(26)
在訓(xùn)練構(gòu)建的基礎(chǔ)上,進(jìn)一步整合優(yōu)化目標(biāo)范式為:
(27)
(28)
基于該主成分稀疏表示與低秩分解算法作用下,受控場(chǎng)景下存在表情變化和部分遮擋的情況可以得到較好的處理。
通過(guò)實(shí)驗(yàn)驗(yàn)證非受控場(chǎng)景下主成分稀疏表示與低秩分解算法對(duì)人臉識(shí)別的準(zhǔn)確度。本實(shí)驗(yàn)使用的是自構(gòu)建基礎(chǔ)人臉庫(kù)NNUFD(NNU Gace Dataset)作為實(shí)驗(yàn)數(shù)據(jù)源,實(shí)驗(yàn)通過(guò)核心機(jī)房基礎(chǔ)信息系統(tǒng)平臺(tái)庫(kù)采集的數(shù)據(jù)為支撐,實(shí)驗(yàn)環(huán)境基礎(chǔ)配置為:八核4.8 GHz×8CPU,256 GB內(nèi)存,32TB硬盤,雙200 GB/s網(wǎng)卡的機(jī)架型服務(wù)器。虛擬機(jī)操作系統(tǒng)選擇了64位的Linux,虛擬機(jī)最大并發(fā)數(shù)為1 024臺(tái),開發(fā)工具為PhCharm2018.2.5。NNUFD人臉庫(kù)是根據(jù)測(cè)試實(shí)驗(yàn)對(duì)象而遴選的,該實(shí)驗(yàn)中庫(kù)容量為404個(gè)人每人一張照片共404張照片,全部以正面光照良好的標(biāo)準(zhǔn)照為樣本構(gòu)成的樣本集,并且來(lái)源均為同一采集環(huán)境,攝像器材、燈光、角度以及拍攝距離等均保持一致。同時(shí),對(duì)基準(zhǔn)樣本人臉庫(kù)的圖片均進(jìn)行了統(tǒng)一裁剪,保持為180×240的一致像素。
本實(shí)驗(yàn)結(jié)合課堂教學(xué)環(huán)境進(jìn)行人臉識(shí)別效果的測(cè)評(píng),因?yàn)檎n堂環(huán)境屬于非受控情況下具備較好排他干擾因素的場(chǎng)景,該環(huán)境特點(diǎn)是連續(xù)(待測(cè)對(duì)象大致位置確定)、光線陰影變化來(lái)源單一(正常情況下人員位置固定,光照影響情況突變性較小)、遮擋和表情變化情況簡(jiǎn)單(主要為低頭、側(cè)臉、托腮等小范圍動(dòng)作),混合干擾情況少(除了所在位置光照變化以及低頭托腮等動(dòng)作,幾乎沒(méi)有其他遮擋和光線陰影變化因素)。圖2為基礎(chǔ)人臉庫(kù)NNUFD的部分示例,對(duì)課堂采樣照片通過(guò)主成分稀疏表示和低秩分解算法分割,并以基礎(chǔ)人臉庫(kù)為樣本進(jìn)行匹配識(shí)別,并將未進(jìn)行低秩分解的情況與低秩分解后的情況進(jìn)行比較,以說(shuō)明低秩分解與主成分稀疏表示方式相結(jié)合在非受控場(chǎng)景下所產(chǎn)生影響的重要性。表1給出了低秩分解前后5組實(shí)驗(yàn)中識(shí)別率數(shù)據(jù)的比對(duì)。
圖2 基礎(chǔ)人臉庫(kù)NNUFD示例Fig.2 Example of base face library NNUFD
圖3 非受控場(chǎng)景下通過(guò)主成分稀疏表示與低秩分解算法的識(shí)別結(jié)果Fig.3 Recognition results of principal component sparse representation and low rank decomposition algorithm in uncontrolled scence
圖3為教室授課非受控場(chǎng)景下通過(guò)主成分稀疏表示與低秩分解算法的識(shí)別結(jié)果,將識(shí)別到并與基礎(chǔ)人臉庫(kù)NNUFD匹配的人臉進(jìn)行框選,并將身份識(shí)別號(hào)(學(xué)號(hào))顯性標(biāo)識(shí)。分別針對(duì)是否疊加低秩分解和各類干擾因素設(shè)置了5組實(shí)驗(yàn),從實(shí)驗(yàn)結(jié)果來(lái)看,在非受控場(chǎng)景下通過(guò)主成分稀疏表示疊加低秩分解的識(shí)別效果對(duì)光照變化影響的魯棒性較強(qiáng),對(duì)遮擋情況受到的影響相對(duì)明顯。從不同實(shí)驗(yàn)場(chǎng)景結(jié)果來(lái)看,光照陰影因素對(duì)該算法的識(shí)別效果干擾非常小,一旦存在遮擋,特別是嚴(yán)重遮擋情況,致使圖像呈部分不完整呈現(xiàn)時(shí),識(shí)別效果陡降。從圖像中人臉位置角度比較,前排較近人臉和后排較遠(yuǎn)人臉的識(shí)別率比較而言,該算法也具備較好的穩(wěn)定性,識(shí)別效果沒(méi)有明顯的變化。表2給出了5組實(shí)驗(yàn)中存在干擾和非存在干擾情況下,光照、遮擋和位置改變情況對(duì)實(shí)驗(yàn)識(shí)別率所造成的影響。
表1 主成分稀疏表示與低秩分解疊加前后實(shí)驗(yàn)效果比對(duì)
Tab.1 Comparison of the effect of the principal component sparse representation combine the low-rank decomposition superposition
實(shí)驗(yàn)組序號(hào)是否進(jìn)行低秩分解已進(jìn)行低秩分解識(shí)別率/%未進(jìn)行低秩分解識(shí)別率/%實(shí)驗(yàn)組191.179.3實(shí)驗(yàn)組290.579.5實(shí)驗(yàn)組390.983.1實(shí)驗(yàn)組490.976.9實(shí)驗(yàn)組592.481.3
實(shí)驗(yàn)在多種場(chǎng)景下進(jìn)行了測(cè)試,測(cè)試結(jié)果顯示,總體識(shí)別正確率最高達(dá)到92.4%,而未結(jié)合低秩分解方法的情況下,總體識(shí)別正確率最高只能達(dá)到83.1%。由此可見(jiàn),主成分稀疏表示結(jié)合低秩分解的人臉識(shí)別算法在非受控場(chǎng)景下達(dá)到了較好的效果。
除了對(duì)教室授課非受控環(huán)境進(jìn)行了驗(yàn)證,同時(shí)也對(duì)開放型非受控場(chǎng)景進(jìn)行了實(shí)驗(yàn),主要通過(guò)校園監(jiān)控,機(jī)房監(jiān)控,宿舍閘機(jī)監(jiān)控等調(diào)取的圖片進(jìn)行了對(duì)比分析。所得到的實(shí)驗(yàn)結(jié)果與教室實(shí)驗(yàn)環(huán)境相比,識(shí)別正確率有一定的降低,這主要不取決于監(jiān)控對(duì)象在照片中成像的進(jìn)深,而是受到各種遮擋情況影響的概率較大所致。
表2 干擾因素對(duì)主成分稀疏表示與低秩分解疊加的影響Tab.2 Influence of interference factors on principal component sparse representation combine the low-rank decomposition superposition
本文使用基于主成分稀疏表示結(jié)合低秩分解的算法對(duì)非受控場(chǎng)景下的圖片進(jìn)行人臉識(shí)別,基于場(chǎng)景圖片分解結(jié)果與基礎(chǔ)人臉庫(kù)進(jìn)行比較得到匹配結(jié)果。實(shí)驗(yàn)結(jié)果顯示,該方法可以有效的檢測(cè)到非受控場(chǎng)景下的人臉,同時(shí)總體識(shí)別正確率最高可以達(dá)到92.4%。該算法針對(duì)遮擋情況較嚴(yán)重的場(chǎng)景下識(shí)別正確率較低,作為應(yīng)用型識(shí)別算法而言,普適場(chǎng)景下混合復(fù)雜模式的識(shí)別效果才是最終目的,這也是下一步該算法研究改進(jìn)的方向。