摘要:本文從新冠肺炎疫情防控的應(yīng)用場景引出了計(jì)算機(jī)視覺領(lǐng)域中的人臉識別技術(shù),指出了部分遮擋下人臉識別存在的困難與挑戰(zhàn),概述了部分遮擋下人臉識別技術(shù)的研究進(jìn)展以及深度學(xué)習(xí)在部分遮擋人臉識別技術(shù)中的應(yīng)用。
關(guān)鍵字:部分遮擋;人臉識別;計(jì)算機(jī)視覺;深度學(xué)習(xí)
一、引言
隨著新冠病毒的全球擴(kuò)散,為了防控新冠肺炎疫情和新冠病毒感染,越來越多的人選擇戴上口罩出行。在一些人流量較大的場所中,則要求所有人戴上口罩才能進(jìn)入。而在一些需要人臉識別的場景下,例如人流量較大的火車站、機(jī)場等場所的非人工通道,人們不得不摘下口罩,等待機(jī)器進(jìn)行人臉識別。在這一過程中,極大地增加了感染新冠病毒的風(fēng)險(xiǎn)和概率。因此,部分遮擋下的人臉識別技術(shù)成為解決這一問題的關(guān)鍵。
人臉識別是計(jì)算機(jī)視覺領(lǐng)域長期被研究的一項(xiàng)任務(wù)。隨著深度學(xué)習(xí)的興起以及卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),研究者們提出了眾多經(jīng)典網(wǎng)絡(luò)模型,如AlexNet[1]、VGG[2]、GoogLeNet[3]、ResNet[4]等,推動(dòng)了人臉識別技術(shù)的發(fā)展,先后出現(xiàn)了DeepFace[5]、DeepID[6]、FaceNet[7]等人臉識別模型,顯著提升了人臉識別的精度和性能,從而使得人臉識別被廣泛應(yīng)用于安保、監(jiān)控、信息安全等領(lǐng)域。然而,部分遮擋的面部存在人臉信息缺失,會(huì)嚴(yán)重影響人臉特征的提取,進(jìn)而導(dǎo)致識別精度的大幅下降。如何提升部分遮擋下的人臉識別精度成為計(jì)算機(jī)視覺領(lǐng)域的一大挑戰(zhàn)。
二、部分遮擋下人臉識別技術(shù)的研究進(jìn)展
部分遮擋下的人臉識別對于人臉識別系統(tǒng)甚至是人類來說都是巨大的挑戰(zhàn),使用可見的部分面部進(jìn)行人臉識別,可在一定程度上緩解面部遮擋識別問題。
2008年,Hyun Jun Oh等人[8]提出了一種1-NN(nearest neighbor)監(jiān)督閾值分類器,用于主成分分析子空間中每塊人臉?biāo)槠恼趽鯔z測,然后應(yīng)用選擇性局部非負(fù)矩陣分解方法去選擇與無遮擋區(qū)域相對應(yīng)的特征用于識別。實(shí)驗(yàn)結(jié)果表明,該方法相較于傳統(tǒng)的方法,如主成分分析、局部非負(fù)矩陣分解方法等,具有更高的識別率。
2011年,Zhaohua Chen等人[9]和Rui Min等人[10]提出了一種新的方法,首先使用主成分分析和改進(jìn)的支持向量機(jī)的方法檢測遮擋部分,然后采用基于塊的加權(quán)局部二進(jìn)制模式只處理非遮擋臉部區(qū)域。
2014年,A Morelli Andrés等人[11]提出了一種基于壓縮感知進(jìn)行遮擋檢測的人臉識別算法,該算法在識別過程中通過排除遮擋區(qū)域提取識別信息。
2016年,Yizhang Xia等人[12]基于深度學(xué)習(xí)設(shè)計(jì)了一種檢測遮擋的多任務(wù)卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)有四個(gè)特定區(qū)域的遮擋檢測任務(wù),分別對左眼、右眼、鼻子和嘴巴被遮擋的概率進(jìn)行預(yù)測,而對特定區(qū)域進(jìn)行預(yù)測限制了遮擋的靈活性,會(huì)在一定程度上限制系統(tǒng)的性能。
2018年,Weitao Wan等人[13]提出了一種MaskNet模型,并將其插入卷積神經(jīng)網(wǎng)絡(luò)模型中,該模型會(huì)對臉部非遮擋部分的隱藏單元設(shè)置更高的權(quán)重,對臉部遮擋部分的隱藏單元設(shè)置更低的權(quán)重,實(shí)驗(yàn)結(jié)果表明MaskNet模型在遮擋人臉識別中可以有效改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)模型的魯棒性。
2019年,Lingxue Song等人[14]提出了一種成對差分連體網(wǎng)絡(luò),利用掩膜學(xué)習(xí)策略構(gòu)建被遮擋的面部模塊與被破壞的特征元素之間的對應(yīng)關(guān)系。實(shí)驗(yàn)結(jié)果表明,該算法在合成和真實(shí)遮擋人臉數(shù)據(jù)集上的性能顯著優(yōu)于現(xiàn)有的系統(tǒng)。
綜上所述,深度學(xué)習(xí)被越來越多地用于部分遮擋的人臉識別,通過改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)可進(jìn)一步提升算法的性能和識別精度。
三、結(jié)束語
部分遮擋下的人臉識別技術(shù)面臨諸多挑戰(zhàn),在識別精度和識別性能上還有很大的進(jìn)步空間,將深度學(xué)習(xí)用于部分遮擋的人臉識別有望獲得新的突破。部分遮擋下的人臉識別技術(shù)在新冠肺炎疫情防控中具有重要作用,應(yīng)用范圍很廣,具有很大的應(yīng)用前景,發(fā)展部分遮擋下的人臉識別技術(shù)具有重要意義。
作者單位: 羅億 中國民用航空飛行學(xué)院
參? 考? 文? 獻(xiàn)
[1]Krizhevsky A, Sutskever I, Hinton G. ImageNet Classification with Deep Convolutional Neural Networks[J]. Advances in neural information processing systems, 2012,25(2).
[2]Simonyan K, Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. Computer ence, 2014.
[3]Szegedy C, Liu W, Jia Y, et al. Going Deeper with Convolutions[J]. 2014.
[4]He K, Zhang X, Ren S, et al. Deep Residual Learning for Image Recognition: IEEE Conference on Computer Vision & Pattern Recognition, 2016[C].
[5]Taigman Y, Yang M, Ranzato M, et al. DeepFace: Closing the Gap to Human-Level Performance in Face Verification: IEEE Conference on Computer Vision & Pattern Recognition, 2014[C].
[6]Sun Y, Wang X, Tang X. Deep Learning Face Representation from Predicting 10,000 Classes: IEEE Conference on Computer Vision & Pattern Recognition, 2014[C].
[7]Schroff F, Kalenichenko D, Philbin J. FaceNet: A Unified Embedding for Face Recognition and Clustering[J]. 2015.
[8]Oh H J, Lee K M, Lee S U. Occlusion invariant face recognition using selective local non-negative matrix factorization basis images[J]. Image & Vision Computing, 2008,26(11):1515-1523.
[9]Chen Z, Xu T, Han Z. Occluded face recognition based on the improved SVM and block weighted LBP: International Conference on Image Analysis & Signal Processing, 2011[C].
[10]Min, Rui, Hadid, et al. Improving the recognition of faces occluded by facial accessories[J]. IEEE, 2012:442-447.
[11]Andres A M, S. Padovani M T, Jacobo-Berlles J. Face recognition on partially occluded images using compressed sensing[J]. Pattern Recognition Letters, 2014,36(jan.15):235-242.
[12]Xia Y, Zhang B, Coenen F. Face occlusion detection based on multi-task convolution neural network[J]. 2015 12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD), 2016,12thInternationalConferenceonFuzzySystemsandKnowledgeDiscovery(FSKD).
[13]Wan W, Chen J. Occlusion robust face recognition based on mask learning: 2017 IEEE International Conference on Image Processing (ICIP), 2018[C].
[14]Song L, Gong D, Li Z, et al. Occlusion Robust Face Recognition Based on Mask Learning With Pairwise Differential Siamese Network, 2019[C]. IEEE, 2019.
基金項(xiàng)目:部分遮擋下的人臉識別技術(shù)研究(項(xiàng)目編號:QJ2021-090)。
中國民航飛行學(xué)院科研基金(ZJ2022-003,JG2022-27,J2020-060);四川省通用航空器維修工程技術(shù)研究中心資助課題(GAMRC2021YB08)。
羅億(1992.06-),女,漢族,四川廣漢,碩士研究生,講師,研究方向:人臉識別技術(shù)。