朱海榮
摘 要 活體檢測是一種驗證對象真實生理特征的技術(shù),隨著人臉識別技術(shù)在支付、門禁、移動設(shè)備等的廣泛應(yīng)用,人們對人臉識別的安全性也提出了更高的要求,活體檢測技術(shù)也越來越被重視,其可有效抵御屏幕錄制的照片、視頻、打印的照片、立體假面等攻擊手段,甄別欺詐行為,保障用戶利益。本文通過深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)(CNN)的分類網(wǎng)絡(luò),提供一種簡單高效、識別率高、可擴展行強的靜默活體檢測方法。并提出了一種小區(qū)域特征對齊圖像提高活體檢測準(zhǔn)確度和魯棒性的方法。
關(guān)鍵詞 活體檢測;深度學(xué)習(xí);靜默;特征對齊
活體檢測技術(shù)早期采用配合式檢測方法,需要檢測體按照提示配合眨眼、張嘴、搖頭、點頭等組合動作,使用人臉關(guān)鍵點定位技術(shù)判斷動作的正確性來決定是否為活體操作,進一步?jīng)Q定終止或繼續(xù)人臉識別過程。此方式的缺點:檢測時間長,對檢測體要求高,不適應(yīng)門禁、閘機等要求快速完成檢測的場景。靜默活體檢測不需要煩瑣的臉部動作配合,根據(jù)真實人臉成像和照片、屏幕、面具成像的差別判斷是否活體。照片、屏幕成像會出現(xiàn)摩爾紋,并且紋理和光線反射率和真實人臉差異較大,通過讓機器捕捉學(xué)習(xí)這個特性準(zhǔn)確完成活體檢測,并且每幀圖像都可檢測得到結(jié)果,檢測過程短、實時性強。
1設(shè)計思路
為了讓機器學(xué)習(xí)到偽造圖像和真實活體圖像的區(qū)別,而不受人臉個體差異的影響,提高魯棒性,需要把學(xué)習(xí)和檢測的圖像特征對齊、減少干擾內(nèi)容、有較多的可用特征、減小圖像區(qū)域。
1.1 圖像特征對齊
活體檢測圖像位置一致,獲取人臉相同區(qū)域圖像,使機器學(xué)習(xí)的特征單一,學(xué)習(xí)收斂速度快,特征提取準(zhǔn)確。獲取高度為雙眼中較高眼睛的中心位置到嘴巴中心、寬度為左眼中心到右眼中心的圖像作為訓(xùn)練和檢測圖像。
1.2 減少干擾內(nèi)容
活體檢測圖像減少人臉干擾圖像內(nèi)容,減少因個體差異而影響檢測結(jié)果,盡量減少眼、鼻、嘴等個體差異圖像內(nèi)容,保留皮膚紋理等個體差異小的圖像特征。
1.3 有較多的可用特征
活體檢測圖像要保留較多的可用特征,比如摩爾紋、反光、紋理等可用作檢測判斷的特征盡量保留,提高機器學(xué)習(xí)準(zhǔn)確度[1]。
1.4 小區(qū)域圖像
小區(qū)域圖像在經(jīng)過預(yù)處理縮小圖像和后期的池化層后保留較完整的可用特征。
2訓(xùn)練過程
2.1 模型設(shè)計
模型輸入為3層24寬24高的RGB圖片輸入,歸一化到[-1,1]之間,進過4個卷積層加兩個全連接層,輸出一個代表活體和非活體的二分類張量。使用Softmax loss作為損失估算函數(shù),增加Accuracy進行準(zhǔn)確率測試。
2.2 素材采集
將視頻或者圖片通過人臉檢測獲取人臉和關(guān)鍵點位置,使用雙眼位置和嘴的中心位置,獲取高度為雙眼中較高眼睛的中心位置到嘴巴中心、寬度為左眼中心到右眼中心的圖像作為訓(xùn)練和檢測圖像。按照真實人臉和偽造人臉分類保存采集的圖像。
2.3 預(yù)處理
將采集的圖像縮放(Resize)處理到3x24x24,并歸一化數(shù)據(jù)到[-1,1]之間,保存到各自的分類目錄中。
2.4 訓(xùn)練
將分類保存的數(shù)據(jù)集按照7:3的比例分成訓(xùn)練集和測試集,使用較為流行的深度學(xué)習(xí)訓(xùn)練工具Caffe、TensorFlow或者Pytorch訓(xùn)練。訓(xùn)練中可以發(fā)現(xiàn)在迭代5000次后損失值快速減小收斂,并且準(zhǔn)確率可達到99%以上[2]。
2.5 結(jié)果
進過10萬次迭代的訓(xùn)練,發(fā)現(xiàn)損失基本穩(wěn)定在0.0001±0.0005,準(zhǔn)確率達到0.999±0.0005。結(jié)束訓(xùn)練。
2.6 應(yīng)用
由于模型深度淺,輸入圖像小,推理速度在Arm A53 CPU上達到15fps,在帶有NPU的Rk1808上達到150fps。
3優(yōu)缺點對比
3.1 優(yōu)點
訓(xùn)練圖像和推理圖像特征對齊,干擾較少,訓(xùn)練收斂速度快,準(zhǔn)確率高;模型小,推理速度快,可在移動設(shè)備上部署,正常運行;靜默檢測,無須檢測體配合動作,檢測時間短,檢測速度快;推理圖像只保留相關(guān)的可用特征,減少了干擾特征,魯棒性高,泛化能力強,無須不同人員的大量素材訓(xùn)練。
3.2 缺點
由于依靠人臉檢測技術(shù)的關(guān)鍵點進行特征對齊,在關(guān)鍵點不準(zhǔn)確的某些場景下,活體檢測能力有所下降;在強光下由于圖像過曝,圖像特征缺失,或者弱光場景下噪點干擾,活體檢測能力有所下降,可通過改用近紅外攝像頭改進對環(huán)境光的影響[3]。
4結(jié)束語
綜上所述,本文提供的基于深度學(xué)習(xí)的小區(qū)域特征對齊的活體檢測方法,檢測速度理想、魯棒性高,可在各種移動設(shè)備上部署,并為人臉識別的安全性和體驗性提供了保障。
參考文獻
[1] 李新豆.基于圖像擴散速度模型和紋理信息的人臉活體檢測[J].計算機科學(xué),2020(2):112-117.
[2] 黃海新.基于深度學(xué)習(xí)的人臉活體檢測算法[J].電子技術(shù)應(yīng)用,2019(8):44-47.
[3] 宛根訓(xùn).人臉識別應(yīng)用活體檢測技術(shù)研究[J].中國安全防范技術(shù)與應(yīng)用,2019(6):58-62.