王飛龍
(武漢市武鋼三中湖北武漢 430080)
隨著圖像識(shí)別技術(shù)的不斷進(jìn)步,我們生活中通過人臉識(shí)別來進(jìn)行的活動(dòng)范圍不斷擴(kuò)大,火車站機(jī)場(chǎng)等可以“刷臉”進(jìn)站、超市可以“刷臉”購(gòu)物、圖書館采用了“刷臉”借書、部分公司“刷臉”打考勤、小區(qū)物業(yè)也采用了人臉識(shí)別門禁,就連公安機(jī)關(guān)也啟用了出入境邊防檢查人臉識(shí)別系統(tǒng)——人臉識(shí)別已經(jīng)逐步占據(jù)了我們的日常生活的方方面面,真正開啟了“刷臉”時(shí)代。
目前,人臉識(shí)別主要有兩種應(yīng)用場(chǎng)景,一種是驗(yàn)證“這是不是某人”,這是一對(duì)一的身份驗(yàn)證,就如同身份證審核一樣,也就是我們平時(shí)說的的“刷臉”。另一種是一對(duì)多的模式,在海量干擾信息存在的情況下,識(shí)別出“這是誰(shuí)”,也就是公安機(jī)關(guān)追捕罪犯、邊防檢查時(shí)需要用到的。第二種識(shí)別更加具有復(fù)雜性和隱蔽性,由于往往提供的圖像信息不是正面的,對(duì)識(shí)別技術(shù)的要求更高,具有非強(qiáng)制性和高效性的特點(diǎn)。
人臉識(shí)別的發(fā)展經(jīng)歷了三個(gè)階段:基于結(jié)構(gòu)特征(1973年—1990年)、基于統(tǒng)計(jì)特征(1991年—2000年)和基于大數(shù)據(jù)和復(fù)雜模型(2001年至今)。這只是一個(gè)大致的劃分,階段之間的界限并不明顯,但基本上對(duì)應(yīng)著計(jì)算機(jī)技術(shù)的發(fā)展歷程,從另一個(gè)側(cè)面印證了人臉識(shí)別的進(jìn)程與計(jì)算機(jī)技術(shù)整體水平的進(jìn)步息息相關(guān)。
人臉識(shí)別是生物特征信息對(duì)個(gè)人進(jìn)行識(shí)別的一種,說起生物特征識(shí)別,人們首先想到的是指紋以及眼睛虹膜識(shí)別,這也是最初生物識(shí)別在個(gè)人身份鑒定方面的應(yīng)用,很容易聯(lián)想到電影中的偵探情節(jié),讓人感覺神秘、高科技。其實(shí)從技術(shù)方面簡(jiǎn)單闡述生物特征識(shí)別的過程,就是先把生物特征提取出來,將收集到的特征轉(zhuǎn)換為代碼,進(jìn)而建立模型、然后在認(rèn)證階段,從數(shù)據(jù)模型中進(jìn)行比對(duì),從而實(shí)現(xiàn)識(shí)別的過程。
目前,生物識(shí)別主要有指紋識(shí)別、聲紋識(shí)別、人臉識(shí)別、虹膜識(shí)別、靜脈識(shí)別等。相比之下,虹膜識(shí)別的準(zhǔn)確性最高,安全性也最高,但是其識(shí)別設(shè)備成本太高,不適用于日常生活;語(yǔ)音識(shí)別設(shè)備成本最低,但是其準(zhǔn)確性和安全性不高;而人臉識(shí)別便利性最高,準(zhǔn)確性和安全級(jí)別也較高,且設(shè)備成本不高,在今后的生物識(shí)別領(lǐng)域發(fā)展將更加突出,應(yīng)用也會(huì)越來越廣泛。
另外,區(qū)別于其他生物識(shí)別方式,人臉識(shí)別方式可以是自然的、不被覺察的和非強(qiáng)制性的,就如同嬰兒在出生不久就能認(rèn)出父母的臉,成年人之間的結(jié)識(shí),演員的分辨等,這些都是人類通過觀察和感知、比較,從而進(jìn)行識(shí)別,不需要在像指紋或者識(shí)別,需要采集指紋或者虹膜圖像。這也是人臉識(shí)別在大數(shù)據(jù)時(shí)代背景下得以迅速應(yīng)用和發(fā)揮越來越重要作用的本質(zhì)原因。
從人臉識(shí)別的流程圖中,我們可以了解到,人臉識(shí)別首先要進(jìn)行人臉檢測(cè),在眾多的環(huán)境和圖片中檢測(cè)到人臉,第二步才是將獲取需要的人臉圖像進(jìn)行特征提取,隨后在數(shù)據(jù)庫(kù)中進(jìn)行對(duì)比、識(shí)別,也就是說人臉識(shí)別應(yīng)用起來是兩個(gè)步驟:人臉檢測(cè)(FaceDetect,以下簡(jiǎn)稱FD)和人臉識(shí)別(FaceRecognition,以下簡(jiǎn)稱FR)。
人臉識(shí)別的前提是檢測(cè),人臉檢測(cè)通常有四種方法:基于知識(shí)的人臉檢測(cè)、基于特征的人臉檢測(cè)、基于模板匹配的算法、基于學(xué)習(xí)的算法。
特點(diǎn)優(yōu)點(diǎn)缺點(diǎn)基于知識(shí)的FD利用人臉特有的規(guī)則,如五官相對(duì)位置等速度快、計(jì)算量小正確率不高基于特征的FD利用人臉的特征,如膚色、鼻子凸起等速度快正確率不高基于模板匹配的FD使用預(yù)定義模板來逐個(gè)檢測(cè)圖像 操作簡(jiǎn)單依賴于大小、旋轉(zhuǎn)燈因素,正確率不高基于學(xué)習(xí)的算法利用機(jī)器學(xué)習(xí)和統(tǒng)計(jì)分析進(jìn)行檢測(cè),更能適應(yīng)不同姿態(tài)的臉識(shí)別速率高,不依賴于先驗(yàn)知識(shí)和參數(shù)模型操作復(fù)雜、訓(xùn)練時(shí)間長(zhǎng)
人臉識(shí)別技術(shù)主要有基于特征臉的識(shí)別技術(shù)、基于模型的識(shí)別技術(shù)(包括隱馬爾科夫模型、3D形變模型等)、基于幾何特征的識(shí)別技術(shù)、基于神經(jīng)網(wǎng)絡(luò)的識(shí)別技術(shù)(BP神經(jīng)網(wǎng)絡(luò)),下表對(duì)幾種技術(shù)進(jìn)行了特點(diǎn)對(duì)比。
特點(diǎn) 優(yōu)點(diǎn) 缺點(diǎn)基于特征臉的FR 構(gòu)對(duì)人臉進(jìn)行識(shí)別 識(shí)別效率高 對(duì)光照和尺度變化適應(yīng)性不好基于模型的FR根據(jù)人臉的特征和結(jié)將一幅待測(cè)試的圖像和一個(gè)代表整張人臉的單個(gè)模板做比較方法簡(jiǎn)單,比特征匹配方法更合乎邏輯可用模型較多,需要區(qū)別選擇基于幾何特征匹配的FR基礎(chǔ)是從人臉圖像中計(jì)算一組幾何特征, 速度快方法依賴于特征定位算法的準(zhǔn)確性,算法復(fù)雜度較高基于神經(jīng)網(wǎng)絡(luò)的FR將神經(jīng)網(wǎng)絡(luò)作為一個(gè)分類器,模擬人的多種行為,從復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)共同特征非線性的映射性能、自適應(yīng)和自學(xué)習(xí)性能訓(xùn)練時(shí)間長(zhǎng)
盡管近年來人臉識(shí)別技術(shù)得到了飛躍發(fā)展,但是對(duì)于技術(shù)的研究成果往往是在條件理想或者苛刻的情況下獲得的,當(dāng)采集的圖像不理想,識(shí)別的效果就會(huì)大打折扣,這也是人臉識(shí)別還需進(jìn)一步解決的難點(diǎn)。
(1)光線問題:光線照射方向和角度不同,光線折射到人臉的部分陰影也不同,此時(shí)人臉的特征值會(huì)發(fā)生變化,影響識(shí)別率。
(2)表情姿態(tài)問題:在識(shí)別過程中,當(dāng)人臉發(fā)生很大程度的扭曲時(shí)(例如夸張表情、大哭、大笑、做怪相等),或者是側(cè)臉、低頭等姿態(tài)不正時(shí),人臉識(shí)別的識(shí)別率將會(huì)下降。
(3)遮擋問題:對(duì)于一對(duì)多的非強(qiáng)制性采集到的人臉圖像,如出入境視頻監(jiān)控中采集到的圖像,圖片都會(huì)帶著墨鏡、戴帽子等日常的飾物,長(zhǎng)留海也會(huì)遮擋住部分臉部特征,使得被采集出來的人臉圖像當(dāng)中,人臉的特征不完整,導(dǎo)致算法的失效。
(4)年齡的變化:隨著年齡的增長(zhǎng),臉部皺紋變多,紋理特征改變,對(duì)采用紋理特征來進(jìn)行識(shí)別的方法,就會(huì)明顯降低識(shí)別率。
人臉識(shí)別技術(shù)已經(jīng)得到了較大的發(fā)展,然而技術(shù)是否達(dá)到了大規(guī)模應(yīng)用的階段?很多研究報(bào)道都表明人臉識(shí)別準(zhǔn)確率超過99%,但是據(jù)GeekPwn2017國(guó)際安全極客大賽上的比賽結(jié)果中可以看到[1],黑客們用2分30秒就成功擊破了人臉識(shí)別門禁系統(tǒng),用一張打印的照片在處理之后解鎖了一部人臉識(shí)別鎖的手機(jī),并且評(píng)委說“理論上,只要拍到一張手機(jī)主人的清晰照片就可以解鎖了”,這給大家?guī)砹撕艽蟮睦Щ螅四樧R(shí)別到底是否可靠?其安全性如何保證?的確,隨著人臉識(shí)別技術(shù)的逐步應(yīng)用,安全風(fēng)險(xiǎn)隱患日益凸顯,主要存在三個(gè)方面的隱患:(1)利用3D打印等先進(jìn)技術(shù)結(jié)合照片制作“假人臉”;(2)在目前人臉識(shí)別應(yīng)用的金融領(lǐng)域,盜用人臉進(jìn)行金融犯罪活動(dòng),造成廣大群眾經(jīng)濟(jì)損失;(3)通過對(duì)人臉識(shí)別的破解,以病毒入侵等方式,竊取使用者的個(gè)人信息和公共安全信息。
面對(duì)這樣的隱患,是不是就該放棄人臉識(shí)別呢?當(dāng)然不是,技術(shù)總是在曲折中不斷發(fā)展。生物識(shí)別在某種意義上來說還是更加安全可靠的,畢竟人臉只有一個(gè),相比密碼、聲紋等,破解的技術(shù)要求和難度也更大,正如專家所說,現(xiàn)在發(fā)現(xiàn)漏洞,只是為了讓廣大企業(yè)和研究單位更加關(guān)注技術(shù)安全,提高安全意識(shí),而不是因噎廢食。應(yīng)該如何進(jìn)一步在發(fā)展技術(shù)的同時(shí)提高安全性是目前需要解決的問題。
由于存在安全隱患,應(yīng)針對(duì)人臉識(shí)別安全隱患的幾個(gè)方面來尋找解決方案:
(1)首先,對(duì)于利用技術(shù)制作“假人臉”,應(yīng)該在人臉識(shí)別技術(shù)上進(jìn)一步研究,使用先進(jìn)的算法等,解決人臉識(shí)別的技術(shù)難題,例如光線、膚色、面部紋理等,只有把技術(shù)做精了,才能更好地防止“盜版”。
(2)對(duì)于盜用人臉進(jìn)行金融犯罪活動(dòng),除了技術(shù)的研發(fā),最重要的還是市場(chǎng)準(zhǔn)入標(biāo)準(zhǔn)的規(guī)范化。預(yù)計(jì)2020年,生物識(shí)別技術(shù)將使用在總額超過36.4萬(wàn)億美元資金的移動(dòng)支付中[2],當(dāng)前各個(gè)金融機(jī)構(gòu)都在爭(zhēng)搶先機(jī),而在這其中部分公司為了盡早占領(lǐng)市場(chǎng),采用的是還不太規(guī)范或者沒有周全考慮安全隱患的技術(shù),導(dǎo)致市場(chǎng)比較混亂,安全防護(hù)標(biāo)準(zhǔn)缺乏。應(yīng)該盡早做出市場(chǎng)準(zhǔn)入標(biāo)準(zhǔn)的規(guī)范化,對(duì)技術(shù)安全不到位的企業(yè)強(qiáng)制要求其退出,以統(tǒng)一和完善的標(biāo)準(zhǔn)促進(jìn)行業(yè)內(nèi)的知識(shí)共享和良性競(jìng)爭(zhēng)。
(3)針對(duì)通過對(duì)人臉識(shí)別的破解,以病毒入侵等方式,竊取使用者的個(gè)人信息和公共安全信息的問題,目前國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局、國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)批準(zhǔn)發(fā)布的《公共安全人臉識(shí)別應(yīng)用圖像技術(shù)要求》等就是好的開端。
另外,雖然人臉識(shí)別技術(shù)已經(jīng)得到了大幅發(fā)展,然而為了更加安全,還是應(yīng)該結(jié)合多種生物識(shí)別技術(shù)共同提高識(shí)別的準(zhǔn)確率,從而解決安全隱患問題。
在計(jì)算機(jī)科學(xué)技術(shù)大發(fā)展、大數(shù)據(jù)廣泛應(yīng)用的時(shí)代,人臉識(shí)別技術(shù)將得到飛躍的發(fā)展,小到手機(jī)解鎖等生活領(lǐng)域、大到公安機(jī)關(guān)檢查追捕等國(guó)家公共安全領(lǐng)域,滲透到從金融領(lǐng)域到教學(xué)領(lǐng)域等方方面面,相信在今后十年還將是熱門的研究領(lǐng)域,專注解決光線問題、表情問題等技術(shù)難題,將進(jìn)一步推進(jìn)人臉識(shí)別的應(yīng)用。讓“刷臉”時(shí)代真正安全、可靠。