楊穎嫻
(廣東司法警官職業(yè)學(xué)院信息管理系,廣東 廣州 510520)
改進(jìn)ICA的人臉特征提取方法
楊穎嫻
(廣東司法警官職業(yè)學(xué)院信息管理系,廣東 廣州 510520)
在人臉特征提取的過程中主要采用ICA方法。介紹了ICA算法的原理,并對ICA算法的優(yōu)缺點進(jìn)行了討論,給出了改進(jìn)的ICA算法。試驗結(jié)果表明,改進(jìn)的ICA算法應(yīng)用于人臉的特征提取比PCA算法更具有優(yōu)越性,所提取的人臉特征更利于人臉的分類,從而獲得較高的識別率。
獨立元分析法;特征提??;人臉識別
近年來,人臉識別的研究已經(jīng)成為生物識別和人工智能領(lǐng)域的一個研究熱點,得到了越來越多的關(guān)注。由于人臉識別與其他生物特征識別相比具有更直接、無侵犯性、隱蔽性、采集設(shè)備便宜等優(yōu)勢,所以該項技術(shù)已被廣泛地應(yīng)用于公安、智能門禁、交通流量控制、智能視頻監(jiān)控、銀行卡持卡人身份驗證、ATM識別認(rèn)證、司機(jī)駕照驗證、醫(yī)學(xué)、視頻會議、人機(jī)交互系統(tǒng)等各方面。特征提取是人臉識別中一個非常重要的環(huán)節(jié),目的是為了降低人臉圖像的維數(shù)。目前,常用的基于統(tǒng)計的特征提取方法有主成分分析(PCA)[1]和線性判別分析(LDA)[2]等。獨立元分析(ICA)[3]是近年來發(fā)展起來的一種新的多維數(shù)字信號處理技術(shù),其基本思想是在最大程度保持信息量的前提下,從高維數(shù)據(jù)空間中提取出低維數(shù)據(jù)的特征分量,是一種基于人臉全局特征的識別方法。相比較于PCA算法,ICA算法的思想是獲取數(shù)據(jù)的獨立分量,是一種基于人臉局部特征的識別方法,并且考慮了傳統(tǒng)的PCA未考慮信號的高階統(tǒng)計特性,去除了信號中高階冗余信息。但I(xiàn)CA算法在獲取獨立分量的過程中需要獲取人臉圖像的先驗知識,這影響了識別的準(zhǔn)確率。P.C.Yuenet[4]針對ICA算法的不足,利用類內(nèi)距離均值和類間距離均值獲取獨立分量,取得了較好的效果。筆者在此基礎(chǔ)上采用小波變換對輸入的人臉圖像進(jìn)行降維,再利用改進(jìn)的ICA方法獲取獨立分量,有效減少了后續(xù)工作的計算量,取得了較高的識別率。
ICA作為一種盲源信號分離技術(shù)[5],是基于信號的高階統(tǒng)計特性的分析方法。由原始樣本數(shù)據(jù)求一個特征空間,然后把新的數(shù)據(jù)映射到這個特征空間,獲得一組特征向量,用來分類識別。ICA算法要求各個分量間是統(tǒng)計獨立的,其獨立性由概率密度來定義。如果2個隨機(jī)變量是獨立的,當(dāng)且僅當(dāng)聯(lián)合概率密度為:
p(y1,y2)=p1(y1)p2(y2)
(1)
式中,p1(y1),p2(y2)是y1、y2概率密度分布函數(shù);p(y1,y2)是y1、y2的聯(lián)合概率密度分布函數(shù)。
由式(1),定義連續(xù)型隨機(jī)變量f(x)的數(shù)學(xué)期望:
對獨立隨機(jī)變量可以衍生如下重要特性,對任意2個連續(xù)型隨機(jī)變量f1和f2,如果f1,f2獨立,總有:
E{f1(y1)f2(y2)}=E{f1(y1)}E{f2(y2)}
(2)
將獨立元分析應(yīng)用于人臉識別時,上述獨立隨機(jī)變量就是訓(xùn)練人臉的特征向量。
記xi為1幅人臉數(shù)據(jù),可以構(gòu)造一個訓(xùn)練人臉集合{x1,x2,…,xm}(xi表示一幅m×n大小的人臉圖像按列展開成的mn維向量),其中每個人臉數(shù)據(jù)看作是n個獨立元素s1,s2,…,sn的線性組合,這些獨立元素是互相概率獨立的并具有零均值。將觀察變量xi記做向量X,X={x1,x2,…,xm)T,將元素si記做向量S,S=(s1,s2,…sn)T。S與X的關(guān)系表述如下:
X=AS
(3)
式中,A是一個滿秩的m×n的矩陣;si表示觀察值xi的第i個特征的幅值。如果獨立元素si滿足E{sisi}=1(i=1,2,…,n),那么獨立元素將是除符號外唯一的。
ICA方法的基本目標(biāo)是尋找一個線性變換稱之為分離矩陣W,使得:
Y=WAS
(4)
可見輸出的人臉數(shù)據(jù)向量Y是獨立統(tǒng)計分量S的一個估計,當(dāng)分離矩陣W是A的一個逆矩陣時,S在Y中得到了分離。則訓(xùn)練樣本集X在獨立基子空間上的投影為U=SXT,任何輸入人臉圖像可以通過獨立基重建。計算出Y以后,特征空間可以由Y的行向量構(gòu)造,把每一張待測試的人臉圖像映射到這個特征空間,得到一組系數(shù)向量用于識別。
在實際應(yīng)用中,上述方法往往受到一些限制。因為A、S都是未知的,雖然可以根據(jù)輸出信號的獨立性原則來有效地估計A、S,但由于沒有任何參照目標(biāo),上述過程是無監(jiān)督、無組織的過程。其次,令P=WA,則P可用來衡量ICA算法的分離性能,當(dāng)P=I時,估計的性能最理想,但由于缺少獨立信號源的先驗知識,P化為單位矩陣的過程往往會遇到困難。
由于分離矩陣W的計算存在困難,可通過輸入人臉圖像的類內(nèi)距離均值和類間距離均值的比值來控制獨立特征之間的差別性。
記X的i行、j列為aij。記j列的類內(nèi)距離均值為Wj[5]:
(5)
記j列的類間距離均值為Bj,則:
(6)
(7)
小波變換通過對預(yù)處理過的人臉圖像進(jìn)行降維,可提取人臉全局特征,因而將小波變換和改進(jìn)的ICA算法相融合來進(jìn)行人臉特征的提取。首先利用小波變換對人臉圖像進(jìn)行降維,這樣可以有效消除噪聲且減少運(yùn)算量,然后利用改進(jìn)的ICA算法獲取人臉圖像的獨立特征子空間。
3.1人臉圖像的預(yù)處理
圖2 PCA、改進(jìn)ICA方法識別率的比較
現(xiàn)實的人臉識別中,樣本經(jīng)常受到噪聲的影響,會出現(xiàn)重疊或離群的情況,而且人臉圖像中的頭發(fā)、衣服和背景等的像素灰度值也會影響到人臉特征提取。為此, 對輸入的人臉圖像進(jìn)行預(yù)處理是人臉識別系統(tǒng)的前期工作。首先需要把彩色圖像轉(zhuǎn)變?yōu)榛叶葓D像,采用列像素灰度值之和的直方圖尋找人臉的左右邊界,然后采用行像素灰度值之和的直方圖尋找人臉的上下邊界,再利用直方圖均衡化方法對人臉圖像進(jìn)行灰度歸一化,從而有效消除噪聲對人臉圖像灰度分布的影響。
3.2在ORL人臉庫上的對比試驗
英國ORL人臉圖像庫是目前使用最廣泛的人臉數(shù)據(jù)庫,筆者所做試驗都是基于該數(shù)據(jù)庫進(jìn)行測試。該圖像庫由40人、每人10幅112×92圖像組成,不僅人的臉部表情和臉部細(xì)節(jié)有著不同程度的變化,而且人臉姿態(tài)也有相當(dāng)程度的變化。根據(jù)不同視角、表情、不同的人臉細(xì)節(jié),選擇該圖像庫中10人,每人選擇前3幅為訓(xùn)練集,另7幅作為測試集,樣本集和測試集分別包含30張和70張人臉。PCA、改進(jìn)ICA方法識別率的比較如圖2所示。從圖2可以看出,隨著獨立分量個數(shù)的增加,改進(jìn)ICA方法比PCA方法的識別率更高。這是由于獨立分量數(shù)越多,樣本投影到的獨立子空間的基向量也越多,特征分量間的高階冗余度越小。上述測試表明,利用改進(jìn)ICA方法進(jìn)行人臉的特征提取比PCA算法更具有優(yōu)越性,其獲得的特征子空間更利于人臉的分類。
闡述了ICA方法的相關(guān)理論,并利用獨立元分析提取人臉特征。在人臉圖像的預(yù)處理階段,利用小波變換保留人臉識別的大部分有用信息,可大大降低人臉數(shù)據(jù)的維數(shù),而改進(jìn)的ICA算法利用類內(nèi)距離均值和類間距離均值獲取獨立分量,不再需要獲取人臉圖像的先驗知識,可使運(yùn)算的復(fù)雜度降低。因此,提取的人臉特征更利于人臉的分類,從而獲得較高的識別率。
[1]余曉梅,徐丹.基于外觀的子空間人臉識別方法研究[J].計算機(jī)應(yīng)用研究,2007,24(5):10-12.
[2]Belhumeur P N,Hespanha J P,Kriengman D J.Fishedaces lRecognition using class specific linear projection[J].IEEE Transaction on Pattern Analysis and MachineIntelligence,1997,19(7):771-720.
[3]張賢達(dá),保錚.盲信號分離[J].電子學(xué)報,2001,29(12):1767-1771.
[4]Yuenet P C. Face representation using independent component analysis[J].Pattern Recognition, 2002,35(6):1247-1257.
[5]Bell A J.An information maximization approach to blind separation and blinddeconvolution[J].Neural computation,1995,7(6):l129-l131.
[編輯] 李啟棟
10.3969/j.issn.1673-1409.2011.05.030
TP391.4
A
1673-1409(2011)05-0088-03