張 劍,李 坤,王潤明
(湖南科技大學(xué) 信息與電氣工程學(xué)院,湖南 湘潭 411100)
人臉檢測技術(shù)就是對所輸入的圖像進行檢測,判斷出圖像是否存在人臉,如果存在,則返回人臉在圖像中的確切位置和范圍的技術(shù)[1]。人臉檢測是人臉識別系統(tǒng)中的關(guān)鍵的第一步,這一步所獲得的精度與速度直接影響整個系統(tǒng)的性能[2]。此外,人臉檢測技術(shù)在人臉追蹤、視頻會議、基于內(nèi)容的圖像檢索和人類情感研究系統(tǒng)中都有廣泛的應(yīng)用,而且具有重要的學(xué)術(shù)價值。人臉的自動檢測具有一定的挑戰(zhàn)性,主要有以下難點:(1)由于人臉是一類高度非剛性的目標(biāo),存在相貌、表情、膚色、姿態(tài)等差異;(2)人臉上很可能存在一些附屬物,如眼鏡、胡須、裝飾品等;(3)人臉的姿態(tài)千變?nèi)f化,并且可能存在遮擋物;(4)待檢測的圖像其性質(zhì)的差異,如圖像的分辨率、攝錄器材的質(zhì)量等;(5)光源的種類、強弱和角度的不同,其作用在人臉上所產(chǎn)生的性質(zhì)不同的反射,造成不同區(qū)域的陰影。因此,人臉檢測成為計算機視覺和模式識別領(lǐng)域內(nèi)的一個研究熱點[3]。目前比較常用的人臉檢測方式可以概括為基于知識、基于結(jié)構(gòu)特征、基于模板匹配及基于統(tǒng)計模型的方法[4]。本文將Walsh特征用于人臉檢測是基于結(jié)構(gòu)特征的一種方法。本文通過構(gòu)造Walsh變換矩陣,得到相互正交且形狀豐富的Walsh特征算子,在相同情況下將Walsh特征與傳統(tǒng)的Haar特征用于快速人臉檢測,通過對比其各自的特點得出Walsh特征用于人臉檢測的優(yōu)越性。
Haar特征是VIOLA等提出的一種簡單矩形特征,因類似于Haar小波而得名[5]。Haar特征的定義是黑色矩形和白色矩形在圖像子窗口中對應(yīng)區(qū)域的灰度級總和之差,可見,它反映了圖像局部的灰度變化。VIOLA等用到的Haar特征共有三類,圖1顯示了部分在圖像子窗口起點位置處的Haar特征,其中第一、二行屬于二矩形特征,第三行屬于三矩形特征,第四行屬于四矩形特征[6]。在實際使用時,必須將每一特征在圖像子窗口中進行滑動計算,從而獲得各個位置的多個Haar特征。如果選用的訓(xùn)練圖像分辨率為24×24,每個圖像得到用于訓(xùn)練的Haar特征超過18萬個[7],但是實際上不一定需要,因為過多的特征會大大加大訓(xùn)練過程的時間和空間復(fù)雜度,實際上過細的特征中也會引起過多的冗余,所以在選擇特征時可適當(dāng)放粗一些。
在實際檢測過程中,為了加快Haar特征的計算,VIOLA等提出了積分圖像的定義,灰度圖像F的積分圖像 I定義為[8]:
圖1 Haar部分特征算法
使用積分圖像,只是使用少量的加減法運算就可以計算出Haar特征,如圖2所示。
圖2 使用積分圖進行特征提取
圖2(b)是積分圖,要計算圖2(a)中某個位置的某種特征,只需要采用積分圖中的相應(yīng)點的值進行加減法運算,圖 2(b)特征數(shù)值 d=P4+P1-P2-P3-(P6+P3-P4-P5),這樣可以大大節(jié)省計算時間[9]。
通過對上述Haar特征的用于人臉檢測的理論深入研究可以發(fā)現(xiàn),從理論上來說,Haar特征用于人臉檢測,訓(xùn)練樣本時間長,檢測精度低,缺點明顯。
離散Walsh變換(Discrete Walsh Transform)是數(shù)字信號處理方面經(jīng)常采用的一種正交變換,并且該變換同離散傅里葉變換一樣,可以很好地反映數(shù)字信號的頻率變化情況,而且變換矩陣只是由1和-1組成,可以較大程度減少計算量[10]。Walsh特征構(gòu)造方法如下:
(1)設(shè) Walsh特征算子的高度、寬度分別為 m、n(必須是2的整數(shù)次方);
(2)分別構(gòu)造 m×m、n×n 維的 Walsh 變換矩陣 Hm、Hn;
(3)得到Walsh特征算子:
其中,(Hk)t表示 Hk第 t行向量,Walsh變換矩陣 Hk=(hi,j)可以按照式(3)來構(gòu)造:
其中,R(t+1,j)是拉德梅克函數(shù),g(i)t是 i的格雷碼的第t位數(shù)字。為了在檢測過程能夠使用積分圖計算方法進行加速,一般選用左上角的中低頻特征。實驗采用如圖3所示的黑線框以內(nèi)的10個形態(tài)(黑白位置分布),其中有幾種特征形態(tài)和Haar-Like特征相似或一樣。
由于所有m×n維的Walsh特征算子都是相互正交,這意味著它對圖像某個局部特征的提取不產(chǎn)生冗余,并且特征算子的形狀比Haar特征算子的形狀要豐富。另外,m、n都要求是2的整數(shù)次方,所以對一幅訓(xùn)練圖像而言,它的全部Walsh特征數(shù)是有限的,即Walsh特征的數(shù)量小于Haar特征的數(shù)量。在實際的Haar特征提取過程中,很多特征都非常相近,冗余很大,采用Walsh特征來代替Haar特征可以大大降低特征之間的冗余。
圖3 一組Walsh特征
為了證明使用較少的Walsh特征也具備很好的分類特性,這里采用了5 785個Walsh特征和14 091個Haar-Like進行了對比實驗,分類器學(xué)習(xí)算法Real AdaBoost,每個弱分類器按照其對應(yīng)特征的數(shù)值被劃分為40個區(qū)間。實驗在MIT-CBCL庫上進行,其訓(xùn)練庫包含2 429個分辨率為19×19的配準(zhǔn)人臉樣本,覆蓋各種膚色、遮擋、姿態(tài)、光照等情況;也包含4 548個分辨率為19×19非人臉樣本,部分樣本如 4圖所示,其中圖4(a)是人臉樣本,圖4(b)是非人臉樣本。使用MIT-CBCL訓(xùn)練庫進行實驗的原因是其中的人臉和非人臉圖像具有一定的代表性,并且在實驗中可以將訓(xùn)練庫中的人臉和非人臉樣本一分為二,使得訓(xùn)練樣本和測試樣本具有一定的相似性。另外,使用該庫可以保證所有算法在同樣的訓(xùn)練樣本和測試樣本下進行實驗,以保證實驗結(jié)果的可比性。
圖4 MIT-CBCL庫中的部分樣本
在實驗中,將所有樣本分辨率放大到20×20并作標(biāo)準(zhǔn)化處理 (每個樣本中的所有元素的均值為0,方差為1),實驗中使用了3種樣本選擇模式得到訓(xùn)練樣本集和測試樣本集:偶數(shù)編號訓(xùn)練、奇數(shù)編號測試(s1);奇數(shù)編號訓(xùn)練,偶數(shù)編號測試 (s2);5次隨機選擇50%樣本訓(xùn)練,剩余樣本測試,將5次結(jié)果疊加取平均(s3)。實驗環(huán)境為:Matlab7、P4 2.8 GHz CPU、1 GB 內(nèi)存。在 MIT-CBCL庫上的實驗結(jié)果如表1所示。從表1可以看出,兩種特征訓(xùn)練得到的弱分類器數(shù)目相似,但是使用Haar特征時訓(xùn)練花費的時間卻大大高于Walsh特征,且每種樣本模式下的測試精度也比Walsh特征稍低??梢娛褂肳alsh特征不僅可以加速訓(xùn)練過程,而且檢測性能并沒有下降。
表1 MIT-CBCL庫上的實驗結(jié)果
以上的實驗結(jié)果證明,Walsh特征不僅沒有降低檢測精度,而且加快了訓(xùn)練速度,說明Walsh特征用于人臉檢測比Harr特征用于人臉檢測更加優(yōu)越。本文基本達到了預(yù)期的目標(biāo)。
[1]蘇景龍,林天威,王科俊,等.視頻流下的人臉檢測與跟蹤[J].應(yīng)用科技,2011(03):2-6.
[2]李偉生,張勤.基于局部線性嵌入和 Haar小波的人臉識別方法[J].計算機工程與應(yīng)用,2011,47(4):181-184.
[3]梁路宏,艾海舟,何克忠.基于多模板匹配的單人臉檢測[J].中國圖象圖形學(xué)報,1999,4(10):823-830.
[4]周激流,張曄,郭晶,等.基于先驗?zāi)0宓娜四樏娌刻卣魈崛〉难芯?[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2000,12(5):337-339.
[5]姜軍,張桂林.一種基于知識的快速人臉檢測方法[J].中國圖象圖形學(xué)報,2002,7(1):6-10.
[6]DAI Y,NAKANO Y.Face-texture model based on SGLD and its application in face detection in a color scene[J].Pattern Recognition, 1996,29(6):1007-1017.
[7]YOW K C, CIPOLLA R.Feature-basedhumanface detection [J].Image and Vision Computing,1997,15(9):713-735.
[8]JENG S H, LIAO H Y M, HAN C C.Facial feature detection using geometrical face model: an efficient approach[J].Pattern Recognition, 1998, 31(3): 273~282.
[9]KONDO T, YAN H.Automatic human Face Detection and Recognition undernon-uniform illumination [J].Pattern Recognition, 1999,32:1707-1718.
[10]HAN C C, LIAO H Y, YU G J, et al.Fast face detection via morphology-based pre-processing[J].Pattern Recognition, 2000,33(10):1701-1712.