劉婷
引言
人臉識別技術廣泛應用于對安全性有高要求的人員身份鑒定場景,隨著人臉識別技術的日趨成熟,商業(yè)化應用愈加廣泛,然而極易用照片、視頻以及立體面具等方式進行復制[1],若不法分子利用傳統(tǒng)人臉識別技術的這個安全性隱患,使用假體人臉成功冒用合法用戶身份,從短期來看,侵犯了合法用戶的權益,較大可能造成生命財產(chǎn)損失;從長遠來看,亦會影響人臉識別技術的進一步廣泛深入應用。因此,人臉活體檢測技術應運而生,其是指辨別當前獲取的人臉圖像是來自活體人臉還是假體人臉的過程,以此來達到區(qū)分活體人臉和假體人臉的目的,其中活體人臉指有生命的真實人臉,假體人臉指冒充真人身份的人臉仿冒品[2]。如今,隨著人臉識別技術的廣泛應用,人臉活體檢測作為保障人臉識別技術安全性的關鍵環(huán)節(jié),逐漸成為計算機視覺、模式識別、人臉識別領域非?;钴S的研究方向。
1.人臉活體檢測技術概述
人臉識別起源于1960年-1970年后期,我國的相關技術始于1980年左右,直到1990年,才出現(xiàn)了真正的機器識別,Kohonen、Kirby等[3]提出了基于特征的識別方法,實現(xiàn)了機器識別。隨著人臉識別技術逐漸成為研究學者們偏愛的熱門課題,至今數(shù)千篇論文已經(jīng)在國際上發(fā)表,取得了令人矚目的結果,也廣泛地應用于各個領域。
非法分子在傳感器面前進行攻擊時主要通過三個途徑,分別是非法照片、非法視頻、三維立體模型。但是非法照片相對來講比較容易被識別出來,照片和真人的最大差別就是照片是靜態(tài)的,而真實的人是動態(tài)的。非法視頻可以從現(xiàn)有的合法用戶的視頻中獲取,在使用高清設備錄制視頻時,視頻圖像清晰且可以和真實活體人臉一樣,能夠眨動眼睛等五官發(fā)生變化,所以人臉識別面臨的視頻攻擊對活體檢測系統(tǒng)有著更大的威脅。三維立體人臉模型可以利用人臉部位的不同角度的圖像信息或視頻信息合成,Pighin等就曾經(jīng)利用人臉照片合成了具有不同人臉表情的三維立體人臉模型;Blanz 等人曾經(jīng)通過一張包含人臉圖像的照片合成了具有人臉紋理信息的三維立體模型,提出了Morphable 3D Face Model;Z.Liu等人從包含面部圖像的視頻中建立與真實五官極其相近的三維人臉模型。面臨著人臉識別系統(tǒng)被多種方式攻擊的嚴峻挑戰(zhàn),學者們對活體檢測系統(tǒng)開始了細致的探索,提出了多種解決方案。
2. 人臉活體檢測技術分解
現(xiàn)有的人臉活體檢測方法從多種不同的角度致力于將活體人臉圖像與假體人臉圖像區(qū)分開來,關于人臉活體檢測方法的分類,根據(jù)不同的分類依據(jù)可以得到不同的分類體系。人臉活體檢測方法一般將人臉活體檢測問題作為一個活體人臉圖像和假體人臉圖像的二分類問題來處理。分類問題的性能很大程度上由算法是否使用了區(qū)分性足夠強的特征以及是否使用了合適的分類策略。
考慮到特征的重要性,本文擬以人臉活體檢測方法所利用的特征種類為線索將當前的人臉活體檢測方法分為兩個技術分支:一是交互式人臉活體檢測;二是非交互式人臉活體。
2.1交互式人臉活體檢測
交互式人臉活體檢測利用動作指令與用戶交互,系統(tǒng)通過判斷用戶是否準確完成了指定動作來辨別攝像頭前的人臉是活體人臉還是假體人臉。在交互式人臉活體檢測技術分支,可以根據(jù)檢測的目標內(nèi)容,將檢測方法分為基于臉部動作以及基于聲音兩個二級分支。
(a)臉部動作檢測:基于隨機動作指令的交互式人臉活體檢測中,常見的隨機動作指令有點頭、抬頭、眨眼、閉眼、遮擋眼睛、揚眉、皺眉、笑臉、吐舌頭、張嘴等,在此過程中涉及到利用相關算法對用戶面部動作的識別,以對用戶的動作進行匹配,以判斷當前人臉是否為活體。比如,指導用戶完成隨機表情動作,通過計算多幀圖像的SIFT流能量值來判斷用戶是否完成了指定表情。
(b)朗讀檢測:基于隨機動作指令的交互式人臉活體檢測中,常見的隨機動作指令除去上述臉部動作外,還包括讓用戶朗讀一段文字,通過獲取用戶的聲音,對用戶的發(fā)聲來判斷當前人臉是否為活體。比如通過檢測人臉嘴部區(qū)域的變化幅度進行唇語識別,輔以語音識別獲取用戶響應的語音信息共同判斷用戶是否按要求朗讀了系統(tǒng)隨機給出的語句。
2.2非交互式人臉活體檢測
在非交互式人臉活體檢測技術分支,可以根據(jù)所利用的特征種類,將檢測方法分為基于圖像質(zhì)量、基于圖像紋理特征、基于生命信息特征以及基于熱紅成像特征四個二級分支。
(a)基于圖像質(zhì)量:假體人臉的呈現(xiàn)需要一定的媒介,不管是照片紙、打印紙、電子設備、硅膠、塑料等各類媒介的材料屬性與活體人臉的五官、皮膚材質(zhì)都有差異。材質(zhì)的差異會導致反射屬性的差異,比如照片紙、手機顯示屏會有一些鏡面反射而活體人臉基本不會存在這種現(xiàn)象?;趫D像質(zhì)量的方法主要利用圖像失真、反射屬性方面的差異分辨真假人臉。
(b)基于圖像紋理特征:活體人臉有復雜的三維立體結構,照片、視頻類攻擊是二維的平面結構,光在三維結構和二維結構表面不同的反射會形成臉部顏色明暗區(qū)域的差異?;诩y理的方法主要利用這些差異為線索進行活體人臉和假體人臉的分類,比如,通過LBP、HOG、Gabor 等描述符從灰度圖中抽取的灰度紋理特征,再利用支持向量機完成分類,檢測出圖像是否來自實際活體用戶??傮w來說,基于紋理的方法計算量少,計算復雜度低,容易實現(xiàn),但是該方法著重利用紋理顏色方面的差異進行分類,要求輸入圖像的分辨率高,對采集設備有高要求。
(c)基于生命信息特征:活體人臉和假體人臉之間一個明顯的區(qū)別是活體有心跳、血液流動、眨眼、臉部肌肉不自主的微運動等生命特征,而大部分類別的假體人臉難以完美模仿此類生命特征。主要有光流法、運動成分分解檢測活體不自主的眨眼,臉部、唇部的微運動,以及遠程光學體積描記術(rPPG) 信息檢測待測對象是否具有心率等,來檢測人臉是否來自活體。此類方法對照片類假體人臉的識別準確率高,但是需要視頻為輸入,計算量大,速度慢,難以防范視頻攻擊,并且對假體制造的微運動魯棒性不夠強。
(d)基于熱紅成像特征:假體人臉的材質(zhì)與活體人臉的皮膚、眼睛、嘴唇、眉毛等部位的材質(zhì)不同,而材質(zhì)的不同就會造成反射屬性有差異。不同于可見光條件下呈現(xiàn)出來的圖像,其實能反應人臉熱輻射狀態(tài)的熱紅圖像本身就表明了被檢測的人為真實活體,具有準確率高的特點。目前,基于熱紅成像的面向人臉識別的活體檢測還處于試驗階段,沒有大量的數(shù)據(jù)樣本測試它的性能,熱紅外不會受到光照的影響,但是受溫度的影響較大,而且酒精、玻璃遮擋也會影響熱紅成像的結果,并且需要額外的昂貴設備支持。
3. 結語
本文對人臉活體檢測技術領域進行分析和整理,以交互式人臉活體檢測和非交互式人臉活體檢測為主線。經(jīng)過對該技術領域的梳理,有助于全面了解人臉活體檢測技術領域的基本發(fā)展態(tài)勢,對涉及人臉活體檢測技術領域的發(fā)展創(chuàng)新有一定幫助。
參考文獻:
[1] Li Y, Xu K, Yan Q, Li Y J, Deng R H. Understanding osn-based facial disclosure against face authentication systems. In: Proceedings of the 9th ACM Symposium on Information, Computer and Communications Security. Kyoto, Japan: ACM, 2014. 413-424.
[2] Ministry of Public Security of the People's Republic of China. Ga/T1212-2014 Face recognition application in security systems-testing methodologies for anti-spooing,2014.
[3]徐瓊, 干宗良, 劉峰, 陳昌紅. 基于提升樹的自然場景中文文本定位算法研究[J].南京郵電大學學報(自然科學版), 2013, 06:76-82.