高 濤
(長安大學(xué)信息工程學(xué)院,陜西西安 710072)
目前,對光照變化的人臉識別中,通常有以下幾種處理光照變化的方法:基于傳統(tǒng)的圖像預(yù)處理方法,如直方圖均衡、Gamma變換等;抽取具有光照穩(wěn)健性的特征點方法[1],對圖像進行浮雕化處理(embossing)[2]和采用邊緣圖表示方法等;基于光照模型,比較典型的如光照錐(Illumination Cone)[3]、熵圖像(Quotient Image)[4]、球諧函數(shù)(Spherical Harmonic)[5]等模型;基于人類感知模型,較為典型的是Retinex算法[6],該算法利用了人的視網(wǎng)膜、大腦皮層構(gòu)造亮度和顏色的感知模型,對光照變化圖像的補償有明顯效果,但是圖像的對比度和亮度的乘積較小。本文從人臉識別系統(tǒng)實用性角度考慮,借鑒Retinex理論的研究成果,提出了一種基于小波域多尺度Retinex模型(DWT-MSR)。該方法在二維小波變換后的小波域中,將其低頻小波系數(shù)變換到對數(shù)空間,使用三種不同的高斯濾波系數(shù)和對數(shù)空間中的小波系數(shù)進行卷積操作,將三種標準偏差尺度下得到的結(jié)果進行加權(quán)平均,采用均值方差歸一化的方法,對輸出圖像進行灰度值線性拉伸;小波域中其他三種高頻系數(shù)保持不變,然后再將變換后的低頻系數(shù)和高頻系數(shù)作小波反變換,得到的新圖像則為小波域多尺度Retinex模型的處理結(jié)果,最后使用定點獨立分量分析和神經(jīng)網(wǎng)絡(luò)進行分類識別。從實驗結(jié)果來看,在提高光照變化穩(wěn)健性方面,該方法優(yōu)于SSR、MSR以及直方圖均衡、Log等傳統(tǒng)圖像處理方法。
Retinex理論[7-9]于1963 年由 E.Land 提出,該理論是一種感知亮度和色度的計算理論,主要論述了人眼是如何獲取外界圖像的。E.Land基于Retinex模型,定義理想的圖像 f(x,y) 為
式中:i(x,y)表示圖像中的亮度,r(x,y)表示圖像的反射函數(shù)。
E.Land引入了Center/Surround模型,后面的研究者在此基礎(chǔ)上進行大量的研究,其中以Jobson的單尺度Retinex(Single-Scale Retinex,SSR)算法比較著名,算法的表達如下
K值由下式來確定
式中:σ是計算的標準方差,σ的大小會對圖像的效果有一定影響,直接關(guān)系到圖像中能夠保留多少細節(jié)信息,當(dāng)選擇比較小的σ時,雖然能夠壓縮動態(tài)范圍,但是色感度較差;當(dāng)選取較大的標準偏差時,色感一致性較好,但是動態(tài)范圍的壓縮就較差。通常都是在動態(tài)范圍壓縮和色感一致性之間尋找平衡點。但是單一尺度無法在圖像動態(tài)范圍和圖像色感一致性之間做到很好的平衡,實際需要在這兩方面都能取得完成好的性能,所以在此基礎(chǔ)上改進單尺度Retinex(SSR)算法為多尺度Retinex(MSR)算法。
MSR的算法可以使用下式描述
式中:Fk(x,y)表示由標準差σk決定的與(x,y)坐標點像素有關(guān)的一個環(huán)境函數(shù),Wk表示與Fk(x,y)相對應(yīng)的加權(quán)系數(shù)。多尺度Retinex變換能夠較好地壓縮圖像的動態(tài)范圍,同時能夠保證圖像的色感一致性。但是在選用σk仍然會將圖像的部分高頻細節(jié)信息給平均模糊掉,所以筆者提出了DWT-MSR算法,它不僅能夠?qū)崿F(xiàn)成圖像的動態(tài)范圍壓縮和保證圖像的色感一致性,并且能夠保留圖像的高頻細節(jié)信息。
設(shè)輸入圖像為f0(x,y),其二維小波變換為
實驗表明,對于大多數(shù)圖像而言,選取大、中、小等3個尺度就可以滿足動態(tài)范圍壓縮和色感一致性的要求,即N=3,然后加權(quán)系數(shù)并取其平均值。最終得到的R(x,y)會出現(xiàn)負值,即超出了顯示的范圍,使用Gain/Offset方法進行修正,如式(8)和式(9)所示
其中,R'(x,y)和R″(x,y)分別表示圖像小波系數(shù)的變換輸出值和修正后用來顯示的灰度值,針對增益系數(shù)G和偏移量offset做了大量實驗,結(jié)果表明這2個值可以取相對穩(wěn)定的值,其中G取值為3,offset取值為50,rmin和rmax為修正后圖像系數(shù)中的最小值和最大值。最終對修正后的低頻系數(shù)和小波變換后的3組高頻系數(shù)作二維小波逆變換,最終逆變換的結(jié)果為DWT-MSR的變換結(jié)果,整個過程如圖1所示。實驗表明,二維小波變換在分解層數(shù)上,單層分解和多層分解的識別率差距很小,平均識別率差值不大于1%,多層小波變換中計算量比單層大很多,所以本文算法中采用單層小波變換。
圖2為SSR,MSR,DWT-MSR算法對一幅光照不均勻圖像的作用效果,從視覺角度來講,MSR的效果優(yōu)于
圖1 DWT-MSR框圖
SSR,DWT-MSR的效果優(yōu)于MSR,這和上面的論述是相吻合的。
FPICA在進行信號降維時,同時考慮了信號的二階和高階統(tǒng)計特性,人臉的特征描述方面,許多比較重要的細節(jié)信息隱藏在的高階統(tǒng)計量中,所以本文使用獨立分量分析的方法,ICA的結(jié)構(gòu)圖如圖3所示。
圖3 ICA結(jié)構(gòu)模型
設(shè)人臉庫矩陣X=(x1,x2,…,xL)T為L個隨機的觀測量,每一個量都是由P(P≤L)個獨立分量以進行線性組合,公式為
式中:A 為 L × P 的滿秩矩陣,S=(s1,s2,…,sP)T,其中si是一個獨立分量,它滿足均值為零,方差為1的非高斯分布。通過迭代計算出A時,則有S=A-1X=WX,其中W=A-1。ICA的最終目標就是根據(jù)觀測矩陣X,計算出獨立分量S和混合矩陣A。
本文采用根據(jù)負熵判別準則分離獨立分量的算法FastICA。算法可分兩步實現(xiàn):首先白化處理觀測信號X為,有
白化過程可由PCA實現(xiàn),再進行獨立分量提取。
為了驗證算法的有效性,在YaleB人臉數(shù)據(jù)庫上測試該模型,取YaleB數(shù)據(jù)庫中的10個人,每人45張照片,其部分圖像如圖4所示。按照光源與照相機間角度增加的順序排列這些圖像并將其分成2個子集,第1個是訓(xùn)練集,包含每個人的9幅圖像,第2個是測試集,包含每人剩下的35幅圖像。在每個測試過程中,共選取10余組人臉的訓(xùn)練樣本。
圖4 YaleB庫部分圖像
為了證明算法的有效性,對本文算法DWT-MSR與基于傳統(tǒng)的圖像預(yù)處理方法(直方圖均衡(Hist)、Log算子)、抽取具有光照穩(wěn)健性的特征點方法(Embossing)、基于光照模型(Quotient Image)方法、基于人類感知模型(SSR,MSR)等算法進行比較。特征提取使用 ICA和PCA等經(jīng)典算法來實驗。結(jié)果如圖5所示,在相同的特征提取算法和分類器的情況下,DWT-MSR的方法明顯優(yōu)于其他的算法。這是由于DWT-MSR算法在考慮到圖像均衡陰影部分的同時保留了圖像的高頻信息,變換后的圖像不僅降低了光線的干擾,同時恢復(fù)了圖像部分高頻細節(jié)信息。獨立分量同時考慮到信號的二階統(tǒng)計特性和高階統(tǒng)計特性,所以它的識別率明顯高于PCA?;谏窠?jīng)網(wǎng)絡(luò)的方法識別率明顯高于傳統(tǒng)的方法,而當(dāng)數(shù)據(jù)量急劇增大時,神經(jīng)網(wǎng)絡(luò)算法尤其體現(xiàn)出了它對大樣本分類的優(yōu)勢。
筆者提出了一種基于小波域多尺度Retinex模型(DWT-MSR)。算法在二維小波變換域中,對低頻圖像作多尺度Retinex變換,保留圖像的高頻細節(jié)信息,最后再經(jīng)過小波逆變換。通過實驗證明,在提高光照變化穩(wěn)健性方面,該算法優(yōu)于SSR、MSR、直方圖均衡以及Log等傳統(tǒng)圖像處理方法。由于ICA不僅考慮了信號的二階統(tǒng)計特性,還考慮了高階統(tǒng)計特性,所以性能優(yōu)于PCA,當(dāng)獨立分量個數(shù)遞增時,識別率得到了明顯的提升。
:
[1]ADINI Y,MOSES Y,ULLMAN S.Face recognition:the problem of compensating for changes in illumination direction [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):721-732.
[2]KOUZANI A Z,HE F,SAMMUT K.Towards invariant face recognition[J].Information Sciences,2000,123(122):75-101.
[3]GEORGHIADES A S,BELHUMEUR P N,KRIEGMAN D J.From few to many illumination cone models for face recognition under variable lighting and pose[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,23(6):643-660.
[4]SHASHUA A,RAVIV T R.The quotient image:class-based reentering and recognition with varying illuminations[J].IEEE Trans.Pattern A-nalysis and Machine Intelligence,2001,23(2):129-139.
[5]BASRI R,JACOBS D W.Reflectance and linear subspaces[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2003,25(2):218-233.
[6]RAHMAN Zia-ur.Investigating the relationship between image enhancement and image compression in the context of the multi-scale Retinex[J].Journal of Visual Communication and Image Representation,2011,22(3):237-250.
[7]NAIK G R.An overview of independent component analysis and its applications[J].Informatica(Ljubljana),2011,35(1):63-81.
[8]WANG Ronggui.Image enhancement in the compressed domain based on Retinex theory[J].Computer Research and Development,2011,48(2):259-270.
[9]WANG Jinhua.Retinex-based color correction for displaying high dynamic range images[C]//2010 IEEE 10th International Conference on Signal Processing.[S.l.]:IEEE Press,2010:1021-1024.