劉一平,袁富宇
(江蘇自動(dòng)化研究所,江蘇連云港 222061)
一種應(yīng)用于超大數(shù)據(jù)庫(kù)的人臉識(shí)別方法
劉一平,袁富宇
(江蘇自動(dòng)化研究所,江蘇連云港 222061)
針對(duì)數(shù)據(jù)庫(kù)中待識(shí)別人臉數(shù)目巨大,計(jì)算困難的問(wèn)題,提出了一種基于小波變換和主成分分析的人臉識(shí)別方法。該方法首先對(duì)數(shù)據(jù)庫(kù)中的人臉進(jìn)行小波變換,然后對(duì)小波變換后的圖像進(jìn)行主成分分析提取特征,將特征送入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練、識(shí)別。經(jīng)過(guò)對(duì)比實(shí)驗(yàn),結(jié)果表明:該方法可以在保證較高識(shí)別率的前提下,大大降低數(shù)據(jù)維數(shù),從而該方法可以應(yīng)用于超大數(shù)據(jù)庫(kù)的人臉識(shí)別。
人臉識(shí)別;超大數(shù)據(jù)庫(kù);小波分解;主成分分析;BP神經(jīng)網(wǎng)絡(luò)分類器
人臉識(shí)別[1]是利用計(jì)算機(jī)技術(shù)從包含人臉的靜止圖像或視頻序列中提取人臉個(gè)性化特征,并以此識(shí)別出人的身份的一種技術(shù)。如何有效地從人臉圖像中提取特征并設(shè)計(jì)分類算法對(duì)特征進(jìn)行分類識(shí)別是人臉識(shí)別的關(guān)鍵問(wèn)題。在基于主成分分析的人臉識(shí)別系統(tǒng)[2]中進(jìn)行實(shí)驗(yàn)發(fā)現(xiàn),主成分分析法具有處理速度快、識(shí)別率高的特點(diǎn),可以很好地用于實(shí)踐。為減少主成分分析的計(jì)算量,可以用樣本散布矩陣間接求得特征值及特征臉[3]。文獻(xiàn)[4]在主成分提取特征之前先對(duì)圖像進(jìn)行小波分解,將分解后的子圖像進(jìn)行加權(quán)求和構(gòu)成新的圖像,然后對(duì)該圖像進(jìn)行主成分分析,實(shí)驗(yàn)證明該方法減少圖像噪聲對(duì)識(shí)別率的影響。文獻(xiàn)[5]提出構(gòu)建小波變換和稀疏表示的人臉識(shí)別分層框架也取得了不錯(cuò)的結(jié)果。
提取人臉個(gè)性化特征首先要解決人臉數(shù)據(jù)表示的問(wèn)題,即如何將一個(gè)二維圖像矩陣表示為一個(gè)低維個(gè)性特征向量。小波分解就是將一幅二維圖像分解為不同頻率的子圖像,其中:高頻成分代表圖像邊緣和細(xì)節(jié),低頻成分表示圖像的主要內(nèi)容,這樣就降低了圖像的尺寸。主成分分析是將高維信息在低維空間中進(jìn)行投影,以投影系數(shù)作為特征向量,從而降低數(shù)據(jù)維數(shù)。通過(guò)對(duì)小波分解和主成分分析的融合,可以減少特征提取計(jì)算量,從而可以應(yīng)用到超大數(shù)據(jù)庫(kù)中。本文在小波分析(Wavelet Analysis,WA)和主成分分析的基礎(chǔ)上設(shè)計(jì)新的特征提取方案,旨在適用于超大數(shù)據(jù)庫(kù)的人臉特征提取,用反向傳播(Back Propagation,BP)網(wǎng)絡(luò)進(jìn)行分類識(shí)別。實(shí)驗(yàn)證明,在保證正確識(shí)別率的情況下,該方法可以加快識(shí)別速度。
1.1 小波分解
文獻(xiàn)[6]提出了一種基于小波分析的人臉特征提取方法,利用小波變換的多分辨性,對(duì)人臉進(jìn)行低維表達(dá),然后在小波系數(shù)矩陣中直接進(jìn)行特征定位和提取。圖1是對(duì)圖像用小波db3進(jìn)行一階分解的結(jié)果,從圖片上可以看出:低頻成分(LL)顯示了人臉的主要成分;高頻成分代表了細(xì)節(jié)和邊緣輪廓(HH)。文獻(xiàn)[6]還描述了小波變換的遞推公式,通過(guò)連續(xù)對(duì)低頻圖像進(jìn)行小波變換可以對(duì)一幅圖像進(jìn)行連續(xù)階數(shù)的小波分解。
本文對(duì)小波分解后的低頻圖像和高頻圖像分別進(jìn)行特征提取,將低頻和高頻特征進(jìn)行組合構(gòu)造新特征,以此來(lái)降低計(jì)算量。將一幅人臉圖像用小波db3進(jìn)行一階小波分解,得到圖像如圖1所示。
1.2 主成分分析
1)基本原理
由正交變換,將存在冗余信息的P個(gè)原始向量變?yōu)镸個(gè)彼此相互正交的新向量,而這M個(gè)相互正交向量中的前K個(gè)具有較大功率的向量成為主要成分,即主成分[7]。將這K個(gè)相互正交并且具有較大功率的向量張成一個(gè)子空間,將原始向量在該空間中進(jìn)行投影,投影系數(shù)構(gòu)成特征向量。
圖1 一階小波分解圖像
主成分分析的本質(zhì)就是將高維數(shù)據(jù)投影到低維空間中,從而實(shí)現(xiàn)數(shù)據(jù)降維,進(jìn)而實(shí)現(xiàn)人臉特征提?。?]。
2)具體步驟
①圖像數(shù)據(jù)庫(kù)預(yù)處理
假設(shè)數(shù)據(jù)庫(kù)中圖像大小為R×W,訓(xùn)練樣本數(shù)為N。將圖像表示為n×1維向量,其中n=R×W記為xi(i表示第i幅訓(xùn)練圖像,i=1,2,…,N)。生成訓(xùn)練樣本集,記為:
那么訓(xùn)練樣本集的總體散布矩陣記為:
或者
②構(gòu)造類間散布矩陣
假設(shè)第i(i=0,1,2,…,p-1)個(gè)人有k幅圖像,那么第i個(gè)人的平均圖像就是
所有訓(xùn)練樣本圖像矢量的平均矢量為
其中:p是訓(xùn)練樣本庫(kù)中的總?cè)藬?shù)。
定義類間散布矩陣
其中p(wi)表示第i個(gè)人的人臉圖像先驗(yàn)概率,p(wi)=k/N。
③用S矩陣求特征向量
求散布矩陣S的特征值λ1,λ2,…,λn,并求得這些特征值所對(duì)應(yīng)的正交特征向量u1,u2,…,un,并且有如下關(guān)系:λ1≥λ2≥…≥λn。取前t個(gè)較大的特征向量張成特征空間U,即U=span{u1,u2,…,ut}。將圖像x在特征空間U中進(jìn)行投影,得
那么向量[k1,k2,…,kt]T就是圖像X生成的特征向量。
圖2是利用該方法進(jìn)行人臉特征提取的效果展示,取占總能量90%的前t個(gè)最大特征值所對(duì)應(yīng)的特征向量構(gòu)成空間U=span{u1,u2,…,ut}。將圖像在該空間中投影,實(shí)驗(yàn)結(jié)果如圖。那么α=[8630.8,8739.9,-1752.9,2061.4,…]T就是左側(cè)人臉圖像的特征向量。
圖2 主成分分析提取特征
1.3 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)是一種基于誤差反向傳播的前饋神經(jīng)網(wǎng)絡(luò),Robert Hecht?Nielson[9]已經(jīng)證明具有單個(gè)隱含層的BP神經(jīng)網(wǎng)絡(luò)可以有效地逼近任意的連續(xù)函數(shù)。但是BP神經(jīng)網(wǎng)絡(luò)有容易陷入局部極小值的缺陷,可以用遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化[10]。三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 三層BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)是將原始輸入信號(hào)正向傳播,經(jīng)隱含層到達(dá)輸出層。如果輸出的結(jié)果不滿足期望,就會(huì)在輸出層產(chǎn)生誤差信號(hào),則將誤差信號(hào)作為調(diào)整信號(hào)反向傳播。在本文中,輸入層的輸入就是第1.2節(jié)中產(chǎn)生的人臉特征向量;輸出層的期望輸出就是每個(gè)人的編號(hào),一般情況下用0、1表示,即輸出40維列向量,第i個(gè)人的期望輸出為第i個(gè)元素為1其余元素為0的40維向量。本文中的期望輸出用0.1、0.9表示,因?yàn)椴煌瑯颖局g存在一定得模糊性,實(shí)驗(yàn)也證明該方法識(shí)別率有所提高。
2.1 改進(jìn)特征提取方法
本文介紹了主成分分析方法,其中假設(shè)數(shù)據(jù)庫(kù)中圖像大小為R×W,訓(xùn)練樣本數(shù)為N。將圖像表示為n ×1維向量,其中n=R×W,記為xi(i表示第i幅訓(xùn)練圖像,i=1,2,…,N)。生成訓(xùn)練樣本集,記為:
那么訓(xùn)練樣本集的總體散布矩陣記為:
或者
ORL數(shù)據(jù)庫(kù)中圖像大小為112×92,即R=112,W=92;樣本數(shù)為200,即N=200。
那么矩陣X的大小為10304×200,總體散布矩陣C為10304×10304的矩陣。如此大的矩陣要計(jì)算出其特征值、特征向量是很困難的,為了克服這個(gè)困難,我們可以根據(jù)奇異值定理求XTX200×200的特征值和特征向量來(lái)間接求得C的特征值、特征向量。算法如下:
假設(shè)XTX的r個(gè)特征值為λ1,λ2,…,λr相應(yīng)的特征向量為v1,v2,…,vr。由奇異值(SVD)分解定理[7],XTX相應(yīng)的特征向量為
那么特征臉空間為U=span{u1,u2,…,ur}。
根據(jù)奇異值分解定理可以將求C10304×10304的特征值變?yōu)榍笠粋€(gè)200×200矩陣的特征值,大大減少了計(jì)算量。但是隨著數(shù)據(jù)庫(kù)的增大,當(dāng)樣本容量N?200,即使使用奇異值定理,新的矩陣為N×N,該矩陣也很難計(jì)算特征值和特征向量。
本文就是計(jì)算當(dāng)數(shù)據(jù)容量N?200時(shí),通過(guò)降低散布矩陣維數(shù)進(jìn)而減少計(jì)算量,使得主成分分析方法不因?yàn)閿?shù)據(jù)容量增加而變得不可實(shí)現(xiàn)。
本文思路是:在生成訓(xùn)練樣本之前,首先對(duì)每幅人臉圖像進(jìn)行小波變換,旨在降低圖像尺寸;用小波變換后的尺度較小的低頻和高頻圖像構(gòu)造訓(xùn)練樣本矩陣,然后分別對(duì)低頻和高頻圖像分別進(jìn)行特征提??;最后將低頻和高頻特征進(jìn)行融合送入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別。例如ORL數(shù)據(jù)庫(kù)圖像為10304維,如果進(jìn)行小波變換使得圖像降低為K維記為x′,K?10304,那么不用利用奇異值定理,訓(xùn)練樣本的總體散布矩陣就變成:
C的尺寸將會(huì)變成K×K,計(jì)算復(fù)雜度降低,使得處理超大數(shù)據(jù)庫(kù)更加簡(jiǎn)單。
2.2 計(jì)算步驟
1)小波變換
本次實(shí)驗(yàn)使用ORL數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)中共40個(gè)人,每人10幅圖像。取每人前5幅圖像,共200幅圖像,作為訓(xùn)練樣本集,剩余圖像作為測(cè)試樣本集。圖4為ORL中兩個(gè)人的人臉數(shù)據(jù)庫(kù)。
圖4 ORL部分人臉數(shù)據(jù)庫(kù)
首先將人臉圖像進(jìn)行小波變換,分別取低頻、高頻圖像A、B,按照上文步驟生成訓(xùn)練樣本集:
如果進(jìn)行三階小波變換,那么M、N均是270×的矩陣。
2)主成分分析
步驟1)得到了低頻人臉數(shù)據(jù)庫(kù)M和高頻人臉數(shù)據(jù)庫(kù)N。按照如下公式分別求得M和N的散布矩陣。
其中,A-mean和B-mean分別為低頻人臉庫(kù)和高頻人臉庫(kù)的平均臉向量。
分別求得矩陣S1和S2的特征值和特征向量,取占能量90%的前k個(gè)特征值的個(gè)數(shù)作為子空間維數(shù),生成兩個(gè)特征子空間U=span{u1,u2,…,uk}和V=span{v1,v2,…,vl}。
將每幅人臉圖像的低、高頻圖像分別在低頻子空間和高頻子空間中進(jìn)行投影,得到兩個(gè)特征向量。即任意幅圖像i對(duì)應(yīng)兩個(gè)特征向量:
3)BP神經(jīng)網(wǎng)絡(luò)分類識(shí)別
將得到的每幅圖像的兩個(gè)特征向量,分別送入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別;或?qū)蓚€(gè)特征向量進(jìn)行融合,構(gòu)成一個(gè)特征向量,送入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別。訓(xùn)練樣本送入神經(jīng)網(wǎng)絡(luò)訓(xùn)練之前,要將訓(xùn)練樣本輸入順序隨機(jī)打亂,這樣便于充分訓(xùn)練,提高識(shí)別率。
本文實(shí)驗(yàn)分為四部分:1)原來(lái)方法的復(fù)現(xiàn),直接對(duì)圖像進(jìn)行主成分特征提??;2)首先將圖像進(jìn)行一階小波分解,對(duì)低頻和高頻圖像分別進(jìn)行主成分分析提取特征,對(duì)特征進(jìn)行分類識(shí)別;3)將2)生成的低頻圖像再次進(jìn)行小波分解,將分解后的低頻和高頻圖像分別進(jìn)行主成分分析提取特征,對(duì)特征進(jìn)行分類識(shí)別;最后是把3)生成的低頻圖像再次進(jìn)行小波變換,然后對(duì)低頻和高頻圖像分別進(jìn)行主成分分析提取特征,對(duì)特征進(jìn)行分類識(shí)別。
3.1 原始圖像的主成分特征識(shí)別
將原始訓(xùn)練圖像按列展成向量,例如將第i幅圖像展成列向量xi(i=1,2,…,200),構(gòu)成矩陣X=(x1,x2,…,x200)。根據(jù)奇異值定理求X的特征值、特征向量,將特征值按照從大到小順序排列。占總能量90%的特征值個(gè)數(shù)是71,即取前71個(gè)最大特征值對(duì)應(yīng)的特征向量構(gòu)成主成分子空間,將圖像在該子空間上進(jìn)行投影得到特征向量,特征向量維數(shù)是71。
表1 隱含層神經(jīng)元個(gè)數(shù)對(duì)識(shí)別率影響
將特征送入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行確認(rèn)識(shí)別,實(shí)驗(yàn)中隱含層取值范圍為多次實(shí)驗(yàn)獲得的峰值附近;改變隱含層神經(jīng)元的數(shù)目進(jìn)行10次實(shí)驗(yàn),表中為10次實(shí)驗(yàn)中的最大值和最小值及平均值,結(jié)果如表1、圖5??梢钥闯?,不進(jìn)行小波變換,即不損失原始信息的前提下,識(shí)別率可以達(dá)到90%左右;識(shí)別率在一定范圍內(nèi)隨隱含層神經(jīng)元個(gè)數(shù)增加而增加,但是二者不成正比例關(guān)系。
圖5 識(shí)別率與隱含層節(jié)點(diǎn)數(shù)關(guān)系折線圖
3.2 一階小波圖像的主成分特征識(shí)別
對(duì)原始圖像進(jìn)行小波變換,得到一階小波變換的低頻圖像矩陣和高頻圖像矩陣S1、S2。分別計(jì)算S1、S2的特征值,占總能量90%的特征值個(gè)數(shù)分別是59、141??芍闯?,高頻矩陣的特征值比較均勻,即能量沒(méi)有集中在少數(shù)幾個(gè)特征向量上。用低頻特征進(jìn)行仿真實(shí)驗(yàn),然后在將低頻和高頻特征進(jìn)行融合計(jì)算識(shí)別率。
1)低頻特征仿真實(shí)驗(yàn)
用低頻散布矩陣的前59個(gè)特征值(其和大于所有特征值和的90%)對(duì)應(yīng)的特征向量作為子空間,將圖像在該子空間中進(jìn)行投影,提取特征向量。經(jīng)實(shí)驗(yàn),該向量為59維,構(gòu)造輸入層神經(jīng)元為59,輸出層神經(jīng)元個(gè)數(shù)為40,隱含層神經(jīng)元個(gè)數(shù)可變的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表2,低頻特征識(shí)別率與隱含層神經(jīng)元個(gè)數(shù)關(guān)系如圖6。
圖6 識(shí)別率與隱含層神經(jīng)元個(gè)數(shù)關(guān)系
從表2、圖6可以看出一階小波變換后,低頻圖像的主成分特征的識(shí)別率可以達(dá)到90%左右,即人臉圖像主要信息包含在低頻成分中;識(shí)別率和隱含層神經(jīng)元數(shù)目不成比例關(guān)系。
表2 識(shí)別率與隱層神經(jīng)元個(gè)數(shù)關(guān)系
2)低頻、高頻融合特征仿真實(shí)驗(yàn)
將圖像低頻特征和部分高頻特征融合成一個(gè)新的向量,用該特征作為圖像的特征向量進(jìn)行識(shí)別,結(jié)果如表3所示。
表3 高頻特征個(gè)數(shù)與識(shí)別率關(guān)系
小波分解后,圖像維數(shù)由原來(lái)的10304降低到2784,變?yōu)樵瓉?lái)的27.02%。計(jì)算量大大降低,而實(shí)驗(yàn)結(jié)果卻幾乎不受影響,且識(shí)別結(jié)果很穩(wěn)定。
本次實(shí)驗(yàn)發(fā)現(xiàn)只用圖像低頻和高頻成分進(jìn)行分類識(shí)別可以保證較高的識(shí)別率,但是計(jì)算量大大減少,而且不受數(shù)據(jù)庫(kù)人臉數(shù)增多的影響,因此該方法可以應(yīng)用到超大人臉數(shù)據(jù)庫(kù)的人臉識(shí)別中;隨著隱含層神經(jīng)元數(shù)量的增加,識(shí)別率有所提高,但是神經(jīng)元增多網(wǎng)絡(luò)結(jié)構(gòu)更加復(fù)雜,甚至出現(xiàn)過(guò)擬合現(xiàn)象。
為了驗(yàn)證低頻成分在多大程度上保持原始圖像信息,下面對(duì)原始圖像分別計(jì)算二階和三階小波變換,然后提取特征、計(jì)算識(shí)別率。
3.3 二階小波圖像的主成分特征識(shí)別
對(duì)一階小波變換得到的低頻圖像S1再次進(jìn)行小波變換,得到二階小波變換的低頻圖像矩陣和高頻圖像矩陣S11、S12。分別計(jì)算S11、S12的特征值及特征向量,占總能量90%的特征值個(gè)數(shù)分別是42、122。用低頻特征進(jìn)行仿真實(shí)驗(yàn),然后在將低頻和高頻特征進(jìn)行融合計(jì)算識(shí)別率。
1)低頻特征仿真實(shí)驗(yàn)
用低頻散布矩陣的前42個(gè)特征值(其和大于所有特征值和的90%)對(duì)應(yīng)的特征向量作為子空間,將圖像在該子空間中進(jìn)行投影,提取特征向量。經(jīng)實(shí)驗(yàn),特征向量為42維,構(gòu)造輸入層神經(jīng)元為42、輸出層神經(jīng)元個(gè)數(shù)為40、隱含層神經(jīng)元個(gè)數(shù)可變的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行三次實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表4。
表4 識(shí)別率與隱含層神經(jīng)元關(guān)系
圖7 識(shí)別率與隱含層神經(jīng)元個(gè)數(shù)關(guān)系
低頻特征識(shí)別率與隱含層神經(jīng)元個(gè)數(shù)關(guān)系如圖7。對(duì)比實(shí)驗(yàn)二,圖像大小變?yōu)樵瓉?lái)的7.82%,計(jì)算量大大降低;圖像識(shí)別率有所下降,但是仍保持較高水平,即二階低頻圖像仍保持原始圖像的主要信息。
2)低頻、高頻融合特征仿真實(shí)驗(yàn)
將圖像低頻特征和部分高頻特征融合成一個(gè)新的向量,用該特征作為圖像的特征向量進(jìn)行識(shí)別,實(shí)驗(yàn)結(jié)果如表5所示。
表5 高頻特征個(gè)數(shù)與識(shí)別率關(guān)系
二階小波分解后,圖像維數(shù)降低為806,變?yōu)樵瓉?lái)的7.82%。計(jì)算量大大降低,而實(shí)驗(yàn)結(jié)果仍然保持較高水平;融合了低頻和高頻特征的特征向量,識(shí)別率有所提高。
3.4 三階小波圖像的主成分特征識(shí)別
對(duì)二階小波變換得到的低頻圖像S11繼續(xù)進(jìn)行小波變換,得到三階小波變換的低頻圖像矩陣和高頻圖像矩陣S111、S112。通過(guò)實(shí)驗(yàn),分別求得S111、S112的特征值,占總能量90%的特征值個(gè)數(shù)分別是25、77,然后將低頻、高頻特征分別進(jìn)行仿真實(shí)驗(yàn),最后將二者組合在一起進(jìn)行仿真實(shí)驗(yàn)。
1)低頻特征仿真實(shí)驗(yàn)
用低頻散布矩陣的前25個(gè)特征值(某和大于所有特征值和的90%)對(duì)應(yīng)的特征向量作為子空間,將圖像在該子空間中進(jìn)行投影,提取特征向量。經(jīng)實(shí)驗(yàn),該向量為25維,構(gòu)造輸入層神經(jīng)元為25、輸出層神經(jīng)元個(gè)數(shù)為40、隱含層神經(jīng)元個(gè)數(shù)可變的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表6。
圖8 低頻圖像識(shí)別率與隱層神經(jīng)元個(gè)數(shù)關(guān)系
低頻圖像識(shí)別率與隱含層神經(jīng)元個(gè)數(shù)n的關(guān)系折線圖如圖8所示。從表6、圖8中可以看出,在一定范圍內(nèi)識(shí)別率隨著隱含層神經(jīng)元個(gè)數(shù)增加而有所提高,但是在達(dá)到某一識(shí)別率后上升緩慢,甚至有所回落;低頻圖像像素?cái)?shù)點(diǎn)為270,即經(jīng)小波變換原始圖像尺寸變?yōu)樵瓉?lái)的2.62%,但依然保持較高的識(shí)別率。
表6 低頻圖像識(shí)別率與隱層神經(jīng)元個(gè)數(shù)關(guān)系
2)高頻特征仿真實(shí)驗(yàn)
用高頻散布矩陣的前77個(gè)特征值(其和大于所有特征值和的90%)對(duì)應(yīng)的特征向量作為高頻子空間,將圖像在該子空間中進(jìn)行投影,提取特征向量。經(jīng)實(shí)驗(yàn),該向量為77維,構(gòu)造輸入層神經(jīng)元為77、輸出層神經(jīng)元個(gè)數(shù)為40、隱含層神經(jīng)元個(gè)數(shù)可變的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表7。
表7 高頻圖像識(shí)別率與隱層個(gè)數(shù)關(guān)系
從圖7可以看出,用高頻圖像提取的特征進(jìn)行仿真實(shí)驗(yàn)會(huì)失效。
3)低頻、高頻融合特征仿真實(shí)驗(yàn)
前面兩個(gè)實(shí)驗(yàn)中說(shuō)明低頻成分可以用來(lái)識(shí)別人臉,高頻成分可以用來(lái)定位人臉。本次實(shí)驗(yàn)是在原來(lái)低維特征向量(25維)的基礎(chǔ)上融合了高頻特征(n個(gè),共25+n維特征向量),來(lái)檢驗(yàn)二者融合后識(shí)別率變化。實(shí)驗(yàn)結(jié)果如表8。
表8 高頻特征個(gè)數(shù)與識(shí)別率關(guān)系
圖9 高頻特征個(gè)數(shù)與識(shí)別率關(guān)系折線圖
表8中隱含層神經(jīng)元個(gè)數(shù)是在確定了輸入層神經(jīng)元個(gè)數(shù)(25+n)的個(gè)數(shù)以后,經(jīng)過(guò)反復(fù)實(shí)驗(yàn)測(cè)得的最佳結(jié)果。圖9為識(shí)別率與高頻神經(jīng)元個(gè)數(shù)關(guān)系折線圖。
3.5 實(shí)驗(yàn)結(jié)果分析
綜上4個(gè)實(shí)驗(yàn)可以看出,用以區(qū)別人臉的主要特征集中在低頻成分中;高頻成分包含人臉輪廓和細(xì)節(jié),主要是人臉的共性成分。所以在很多情況下可以用高頻圖像定位人臉,用低頻圖像來(lái)識(shí)別人臉。下面考慮用融合了低頻成分和部分高頻成分的特征向量來(lái)識(shí)別人臉。
通過(guò)對(duì)改進(jìn)實(shí)驗(yàn)結(jié)果和原始實(shí)驗(yàn)結(jié)果對(duì)比后發(fā)現(xiàn),該方法可以大大減少訓(xùn)練矩陣尺度;一階小波分解后產(chǎn)生的特征向量可以保持和原始圖像相當(dāng)?shù)淖R(shí)別率,即使是三階小波分解產(chǎn)生的特征也在減少計(jì)算量大同時(shí)保持了較高的識(shí)別率。
該方法旨在研究超大數(shù)據(jù)庫(kù)的識(shí)別方法,所以在識(shí)別率上并沒(méi)有很好的提高。僅有在一階小波分解時(shí)識(shí)別率略有提高,其他階的小波分解識(shí)別率甚至有所下降。
實(shí)驗(yàn)中還發(fā)現(xiàn):
1)融合了低頻圖像特征向量和高頻圖像的特征向量,識(shí)別率有顯著提高;
2)和直接將圖像進(jìn)行PCA特征提取的特征向量相比,上述方法除了在計(jì)算量上大大減少之外識(shí)別率差別不大。即融合低頻和高頻圖像特征向量的新特征向量可以在不犧牲識(shí)別率的條件下大大降低計(jì)算量;
3)隨著特征向量維數(shù)的不斷增加,在保證最優(yōu)識(shí)別率的條件下,隱含層神經(jīng)元個(gè)數(shù)也在不斷增加,即BP伸進(jìn)網(wǎng)絡(luò)中輸入層神經(jīng)元個(gè)數(shù)增加,隱含層神經(jīng)元個(gè)數(shù)也需隨之增加。
本文是在小波圖像變換和主成分分析的基礎(chǔ)上,提取圖像特征向量,用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別。實(shí)驗(yàn)表明一階小波變換后,像素?cái)?shù)變?yōu)樵瓉?lái)的27.02%,計(jì)算量大大降低,但是識(shí)別率幾乎不變,即小波變換后圖像很好地保持了圖像可以用來(lái)識(shí)別的個(gè)性,這也是該方法的可行條件。通過(guò)三階小波變換,可以將用來(lái)定位人臉的高頻成分和用于識(shí)別人臉的低頻成分提取出來(lái)。經(jīng)過(guò)三階小波分解提取出來(lái)的低頻和高頻圖像的像素?cái)?shù)僅為原始圖像像素?cái)?shù)的2.62%,計(jì)算量大大減少。經(jīng)過(guò)仿真實(shí)驗(yàn),這種方法不會(huì)太大降低識(shí)別率,可以用來(lái)處理超大人數(shù)據(jù)庫(kù)人臉識(shí)別問(wèn)題。
[1] 肖兵,王映輝.人臉識(shí)別研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2005,22(8):1?5.
[2] 譚光鴻,王兵.基于主成分分析法的人臉識(shí)別系統(tǒng)構(gòu)建[J].裝備制造技術(shù),2016(5):219?220.
[3] 郭黎,冷潔,梅文蘭,等.基于PCA和SVM的人臉識(shí)別技術(shù)研究[J].湖北民族學(xué)院學(xué)報(bào)(自然科學(xué)版),2015,33(2):193?196.
[4] 龔飛,金煒,付冉笛,等.融合小波包細(xì)節(jié)子圖及稀疏表示的人臉識(shí)別[J].光電工程,2016,43(6):36?42,54.
[5] 翟素蘭,曹慶,謝文浩.基于稀疏表示與小波特征的人臉識(shí)別分層框架[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(14):146?149,171.
[6] 付瑤,劉志鏡,谷明波.基于小波分析的人臉特征提取方法[J].計(jì)算機(jī)工程與科學(xué),2002,24(6):52?54.
[7] 張賢達(dá).矩陣分析與應(yīng)用[M].第2版.北京:清華大學(xué)出版社,2013.
[8] 李康順,李凱,張文生.一種基于改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)的PCA人臉識(shí)別算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(1):158?161.
[9] Robert Hecht?Nielson.Theory of the Back Propagation Neural Network[J].Proceedings of the Internal Joint Con?ference on Neural Networks,1989:593?605.
[10]崔向東,崔婧楠.基于GA?BP神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法研究[J].安徽職業(yè)技術(shù)學(xué)院學(xué)報(bào),2016,15(2):30?32.
A Face Recognition Method Applied to Huge Databases
LIU Yi?ping,YUAN Fu?yu
(Jiangsu Automation Research Institute,Lianyungang 222061,China)
Traditional face recognition methods can’t work well,if there are too many faces in the database.In order to solve the problem,this paper presents a face recognition method based on wavelet transform and principal component analy?sis.Experimental results show that the method can guarantee a high recognition rate,by greatly reducing the data dimension.
face recognition;huge database;wavelet analysis;PCA;BP neural network classifier
TP391
A
10.3969/j.issn.1673?3819.2016.06.025
1673?3819(2016)06?0118?07
2016?08?31
2016?10?13
劉一平(1990?),男,山東濰坊人,碩士研究生,研究方向?yàn)榛谏疃葘W(xué)習(xí)的人臉識(shí)別技術(shù)。
袁富宇(1964?),男,研究員,博士生導(dǎo)師。