沈思+司思思
摘要: 應(yīng)用于面部表情識別的算法中,傳統(tǒng)的局部二進(jìn)制模式(LBP)算法能夠分析出中心像素與相鄰像素之間的灰度關(guān)系,但是忽略了額頭、眼睛、嘴巴以及其他一些區(qū)域在梯度方向上的表情分布趨勢。因此,提出了基于5×5鄰域內(nèi)局部梯度方向(LGC-FN)的特征提取方法,通過對5×5鄰域內(nèi)橫向和對角線方向上的二進(jìn)制編碼得到融合的特征,可以準(zhǔn)確地描述由于皺紋、面部肌肉等形變產(chǎn)生的表情信息。最后,使用支持向量機(jī)(SVM)進(jìn)行特征分類。通過實(shí)驗(yàn)證明了提出的方法可以有效地提高面部表情的識別率。
關(guān)鍵詞: 中圖分類號: 文獻(xiàn)標(biāo)志碼: A文章編號: 2095-2163(2017)06-0047-03
Abstract: The traditional Local Binary Pattern (LBP) algorithm can analyze the gray relationship between the center pixel and neighboring pixels, using in facial expression recognition, but neglect the expression feature different trends of the eys, mouth, forehead and other areas in the gradient direction. Therefore, this paper proposes a method of local gradient direction in the 5×5 neighborhood(LGC-FN), through the binary encoding to the horizontal, vertical gradients respectively, to produce the fusion characteristic, then this can fully describe the experssion information contained in the wrinkles, facial muscles texture, and other local deformation. Finally, the paper applies the Support Vector Machine(SVM) to classify the extracted. The experimental results show that the proposed method can effectively improve the recognition rate of facial expression.
0引言
人與機(jī)器之間的高級智能交互是研究表情識別的重要目標(biāo)之一[1]。表情特征提取是面部表情識別系統(tǒng)中的關(guān)鍵[2]。局部特征方法對姿態(tài)變化、遮擋以及光照等因素的影響具有較強(qiáng)魯棒性,其中局部二進(jìn)制模式[3]和Gabor[4]小波變換是最具有代表性的兩種方法[5]。Gabor小波變換能夠檢測出多尺度、多方向紋理的變化,但特征尺度巨大并且耗時長。
LBP(Local Binary Pattern)算法卻可快速提取面部表情特征,具有強(qiáng)大的紋理識別能力,并在模式識別領(lǐng)域也得到了越來越多的認(rèn)可[6]。但傳統(tǒng)的LBP算法不能準(zhǔn)確地描述面部肌肉、皺紋以及其他局部形變的紋理信息。2014年,Tong等人提出了LGC方法,但仍然會使一部分梯度方向上的特征無法得到區(qū)分[7]。
針對上述問題,提出了一種基于5×5鄰域內(nèi)的LGC (LGC-FN)特征提取方法,實(shí)驗(yàn)表明,與傳統(tǒng)的局部二進(jìn)制模式算法、LGC-HD算法[7]、Gabor小波變換相比,本文提出的方法可以使表情識別率得到提高。
1LGC算子
4結(jié)束語
實(shí)驗(yàn)結(jié)果表明,本文提出的方法能夠更加準(zhǔn)確地描述由于面部肌肉形變所產(chǎn)生的梯度方向上的表情信息,提高表情識別率,但是由于沒有結(jié)合使用降維方法,獲得的特征向量維度偏高,使得時間消耗稍大,為了進(jìn)一步優(yōu)化該方法,后續(xù)研究需要結(jié)合一些降維方法以降低向量維度,提高識別效率,減少時間消耗。
參考文獻(xiàn):
[1] FASEL B, LUETTIN J. Automatic facial expression analysis: A survey[J]. Pattern Recognition, 2003,36 (1): 259-275.
[2] SHAN Caifeng, GONG Shaogang, MCOWAN P W. Facial expression recognition based on local binary patterns: A comprehensive study[J]. Image and Vision Computing, 2009,27 (6): 803-816.
[3] OJALA T, PIETIKAINEN M, HARWOOD D. A comparative study of texture measures with classification based on feature distributions[J]. Pattern Recognition, 1996, 29 (1):51-59.
[4] DAUGMAN J G. Uncertainty relation for resolution in space, spatial frequency,and orientation optimized by two-dimensional visual cortical filters[J]. J. Opt. Soc.Am. A,1985, 2 (7):1160-1169.
[5] AHONEN T, HADID A, PIETIKAINEN M. Face description with local binary patterns: Application to face recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28 (12):2037–2041.
[6] WANG Wei, HUANG Feifei, LI Jianwei, et al. Face description and recognition by LBP pyramid[J]. Journal of Computer-Aided Design & Computer Graphics, 2009, 21 (1): 94-100, 106.
[7] TONG Ying, CHEN Rui, CHENG Yong. Facial expression recognition algorithm using LGC based on horizontal and diagonal prior principle[J]. OptikInternational Journal for Light and Electron Optics,2014,125(16):4186-4189.
[8] KANADE T, TIAN Yingli, COHN J F. Comprehensive database for facial expression analysis[C]//Fourth IEEE International Conference on Automatic Face and Gesture Recognition. Washington, DC, USA:IEEE, 2000:46-53.
[9] ROSENFELD A, KAK A C. Digital image processing[M]. 2nd Ed. New York:Academic Press, 1982.endprint