本文主要針對(duì)動(dòng)態(tài)人臉識(shí)別系統(tǒng)誤報(bào)警率進(jìn)行分析研究,通過實(shí)驗(yàn)測(cè)試,提出利用報(bào)警過濾機(jī)制降低誤報(bào)警率的解決思路,并進(jìn)行了驗(yàn)證性測(cè)試。
人臉識(shí)別是一項(xiàng)熱門的生物特征識(shí)別技術(shù)。生物特征識(shí)別技術(shù)是對(duì)生物體(一般特指人)本身的生物特征來區(qū)分個(gè)體,所研究的生物特征包括臉、指紋、手掌紋、虹膜、視網(wǎng)膜、聲音、體形、個(gè)人習(xí)慣(例如簽字)等,相應(yīng)的識(shí)別技術(shù)就有人臉識(shí)別、指紋識(shí)別、掌紋識(shí)別、虹膜識(shí)別、視網(wǎng)膜識(shí)別、語音識(shí)別。
廣義的人臉識(shí)別實(shí)際包括構(gòu)建人臉識(shí)別系統(tǒng)的一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、人臉識(shí)別預(yù)處理、身份確認(rèn)以及身份查找等;而狹義的人臉識(shí)別特指通過人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。
人臉識(shí)別技術(shù)相對(duì)于其他生物特征識(shí)別技術(shù)的優(yōu)勢(shì)在于其自然性和不被被測(cè)個(gè)體察覺的特點(diǎn)。
自然性:是指該識(shí)別方式同人類(甚至其他生物)進(jìn)行個(gè)體識(shí)別時(shí)所利用的生物特征相同。例如人臉識(shí)別,人類也是通過觀察比較人臉區(qū)分和確認(rèn)身份的,另外具有自然性的識(shí)別還有語音識(shí)別、體形識(shí)別等,而指紋識(shí)別、虹膜識(shí)別等都不具有自然性,因?yàn)槿祟惢蛘咂渌锊⒉煌ㄟ^此類生物特征區(qū)別個(gè)體。
不被察覺:對(duì)于一種識(shí)別方法很重要,這會(huì)使該識(shí)別方法不令人反感,并且因?yàn)椴蝗菀滓鹑说淖⒁舛蝗菀妆黄垓_。人臉識(shí)別具有這方面的特點(diǎn),它完全利用可見光獲取人臉圖像信息,而不同于指紋識(shí)別或者虹膜識(shí)別,需要利用電子壓力傳感器采集指紋,或者利用紅外線采集虹膜圖像,這些特殊的采集方式很容易被人察覺,從而更有可能被偽裝欺騙。
構(gòu)成人臉識(shí)別的5步:抓取圖像、在圖像中找到臉、提取特征(建模板)、比較模板、宣布比對(duì)結(jié)果。
在算法確定的情況下,一個(gè)成功的人臉識(shí)別系統(tǒng),特別是超大規(guī)模數(shù)據(jù)庫(數(shù)百萬模板以上)系統(tǒng)的建構(gòu)與管理取決于集成商的綜合能力,包括:
1、環(huán)境控制技術(shù):圖像預(yù)處理(增強(qiáng),光線補(bǔ)償、自動(dòng)動(dòng)態(tài)范圍調(diào)整等)、圖像采集技術(shù)、光照管理技術(shù)、影像設(shè)備的把握與理解、圖像質(zhì)量評(píng)價(jià)技術(shù)。
2、系統(tǒng)技術(shù):硬件設(shè)備性能與匹配、嵌入式數(shù)據(jù)庫(基于鍵值對(duì)的文件數(shù)據(jù)庫)、多引擎并行比對(duì)服務(wù)技術(shù)、數(shù)據(jù)庫技術(shù)、應(yīng)用接口技術(shù)。
現(xiàn)階段國內(nèi)的大規(guī)模人臉識(shí)別應(yīng)用主要集中在公安系統(tǒng)已有人像資源的建模和比對(duì),由于人臉動(dòng)態(tài)識(shí)別技術(shù)自身的復(fù)雜性,而且其對(duì)于光線、角度等外在環(huán)境要求高,因此應(yīng)用效果還很有限,影響實(shí)際使用的主要有漏報(bào)率和誤報(bào)率,本文主要圍繞降低誤報(bào)率進(jìn)行探討。
1、漏報(bào)率MP(S)
已列入監(jiān)視名單中的測(cè)試對(duì)象進(jìn)行一次通行測(cè)試中,若系統(tǒng)未能報(bào)警或者報(bào)警結(jié)果中不包含該人員在監(jiān)視名單中的正確身份,則記為一次漏報(bào)通行測(cè)試。漏報(bào)通行測(cè)試總次數(shù)與已列入監(jiān)視名單中的測(cè)試對(duì)象通行測(cè)試總次數(shù)之比即為監(jiān)視名單漏報(bào)率。
記已列入監(jiān)視名單中的測(cè)試對(duì)象通行測(cè)試次數(shù)為R,漏報(bào)通行測(cè)試次數(shù)為M,則監(jiān)視名單漏報(bào)率MP計(jì)算方法如式(1)所示:
2、正確報(bào)警率NP(S)
已列入監(jiān)視名單中的測(cè)試對(duì)象進(jìn)行一次通行測(cè)試中,若系統(tǒng)正確報(bào)警,則記為一次正確報(bào)警通行測(cè)試。正確報(bào)警通行測(cè)試總次數(shù)與已列入監(jiān)視名單中的測(cè)試對(duì)象通行測(cè)試總次數(shù)之比即為監(jiān)視名單正確報(bào)警率。
記已列入監(jiān)視名單中的測(cè)試對(duì)象通行測(cè)試次數(shù)為R,正確報(bào)警通行測(cè)試次數(shù)為N,則監(jiān)視名單正確報(bào)警率NP計(jì)算方法如下式所示:
NP=N/R*100%=1-MP
3、誤報(bào)率FP(S)
未列入監(jiān)視名單中的測(cè)試對(duì)象進(jìn)行一次通行測(cè)試中,若系統(tǒng)將其識(shí)別為監(jiān)視名單中的任何身份,則記為一次誤報(bào)通行測(cè)試。誤報(bào)通行測(cè)試總次數(shù)與未列入監(jiān)視名單中的測(cè)試對(duì)象通行測(cè)試總次數(shù)之比即為非監(jiān)視名單誤報(bào)率。
記未列入監(jiān)視名單中的的測(cè)試對(duì)象通行測(cè)試次數(shù)為W,誤報(bào)通行測(cè)試次數(shù)為F,則非監(jiān)視名單誤報(bào)率FP計(jì)算方法如下式所示:
4、正確接受率CAR(S)
在假定的閾值s下,為在同一人中算法正確識(shí)別為同一人的比率。又稱為正確識(shí)別率、正確報(bào)警率、靈敏度等。
5、錯(cuò)誤拒絕率FRR(S)
在假定的閾值s下,為在同一人中算法錯(cuò)誤識(shí)別為不同一人的比率。又稱為拒真率、漏報(bào)率等。
6、正確拒絕率CRR(S)
在假定的閾值s下,為在不同一人中算法正確識(shí)別為不同一人的比率。也叫特異度。
7、錯(cuò)誤接受率FAR(S)
在假定的閾值s下,為在不同一人中算法錯(cuò)誤識(shí)別為同一人的比率。又稱為錯(cuò)誤識(shí)別率、誤報(bào)率、認(rèn)假率等。
在上述術(shù)語中,漏報(bào)率MP(s)、正確報(bào)警率NP(s)和誤報(bào)率FP(s)為動(dòng)態(tài)人臉識(shí)別的術(shù)語;而正確接受率CAR(s)、錯(cuò)誤拒絕率FRR(s)、正確拒絕率CRR(s)和錯(cuò)誤接受率FAR(s)為靜態(tài)人臉識(shí)別比對(duì)的術(shù)語。
CAR(s)+ FRR(s)=1。即,正確接受率+錯(cuò)誤拒絕率=100%
FAR(s)+ CRR(s)=1。即,錯(cuò)誤接受率+正確拒絕率=100%
MP(s)= a*FRR(s) 其中a為視頻圖像的影響因子,a〉=1。即,漏報(bào)率=視頻因子*漏報(bào)率。
NP(s)= 1-MP(s)=1-a*FRR(s)。即正確報(bào)警率+漏報(bào)率=100%
FP(s)= F/W*100%=b*[1-FAR(s)]L≈b*L*FAR(s),其中b為視頻圖像的影響因子,a〉=1,L為監(jiān)控名單的庫容量且FAR(s)很小時(shí)。即當(dāng)FAR(s)很小時(shí),誤報(bào)率約等于視頻因子b乘以監(jiān)控名單的庫容量L和錯(cuò)誤接受率FAR(s)。
在動(dòng)態(tài)人臉識(shí)別的實(shí)際運(yùn)用中除了追求高正確報(bào)警率(或者是低漏報(bào)率)外,低誤報(bào)率也是推廣使用動(dòng)態(tài)人臉識(shí)別技術(shù)的關(guān)鍵。但是漏報(bào)率和誤報(bào)率是一對(duì)杠桿性的矛盾,降低漏報(bào)率(提高正確報(bào)警率)必將造成誤報(bào)率的提高。同時(shí),誤報(bào)率與監(jiān)控名單的庫容量是一個(gè)成正比的關(guān)系。根據(jù)不同場(chǎng)景,我們做了幾個(gè)測(cè)試:
1、單一算法的誤報(bào)率
根據(jù)我們掌握的幾個(gè)算法,用二代證照片作為測(cè)試庫進(jìn)行測(cè)試,結(jié)果如圖1:
圖1
圖1為ROC曲線圖,橫軸為FAR,縱軸為CAR,測(cè)評(píng)的照片庫為2.6萬組同人的二代證照片。從圖中可以看出,在FAR(S)為萬分之一的時(shí)候,其中一個(gè)算法的CAR(S)大約在76%左右,而另外兩個(gè)算法大約在72%左右。
如果我們希望正確報(bào)警率在70%以上,此時(shí),錯(cuò)誤接受率約為萬分之一,那么在1000個(gè)監(jiān)控名單的庫容量時(shí),非監(jiān)控名單誤報(bào)率將達(dá)到10%。
反過來,如果我們要求在1000個(gè)監(jiān)控名單的庫容量時(shí)將誤報(bào)率控制在1%,那么正確報(bào)警率可能要低于60%。以上的理論值是基于假設(shè)視頻圖像能取得與靜態(tài)圖像質(zhì)量相同的人像。但實(shí)際情況要受光照、采集攝像機(jī)和網(wǎng)絡(luò)等因素的影響,效果將更差。
2、監(jiān)控名單庫容量與誤報(bào)警率的關(guān)系
我們使用同樣一段測(cè)試視頻,用算法一在閾值為0.71的情況下,用5011人、10011人和50011人等三種不同的監(jiān)控名單庫容量進(jìn)行測(cè)試,具體的正確報(bào)警率和誤報(bào)警率分別如下:
算法 閾值 庫容量 正確報(bào)警數(shù)非監(jiān)控名單 監(jiān)控名單正確報(bào)警率 漏報(bào)率 誤報(bào)數(shù) 誤報(bào)警率5011 60 54.5% 45.5% 2 0.5%10011 60 54.5% 45.5% 7 1.6%50011 60 54.5% 45.5% 37 8.6%算法1 0.71
從上面的測(cè)試結(jié)果表明,正確報(bào)警率與監(jiān)控名單的庫容量基本上沒有關(guān)系,但誤報(bào)警率與監(jiān)控庫容量有很大的正相關(guān)性,監(jiān)控名單的庫容量越大,誤報(bào)警率越高。此測(cè)試結(jié)果與第一條“各種比率的關(guān)系”中誤報(bào)率FP(s)和監(jiān)控名單庫容量L的關(guān)系相符。
3、單算法通過調(diào)整閾值來控制誤報(bào)率
我們也可以通過閾值的調(diào)整來控制誤報(bào)警率,下面的例子就是我們選定算法一,在庫容量為50011萬人時(shí),將閾值0.68提高到0.71時(shí)正確報(bào)警率和誤報(bào)警率的變化情況:
算法 閾值 正確報(bào)警數(shù) 正確報(bào)警率 誤報(bào)警數(shù) 誤報(bào)警率算法1 0.68 69 62.7% 97 22.7%算法1 0.71 60 54.5% 37 8.6%
從以上的測(cè)試結(jié)果可以看出,調(diào)整報(bào)警閾值可以控制誤報(bào)警率,但是正確報(bào)警率也隨之降低。而且控制誤報(bào)警率獲取的好處和造成正確報(bào)警率降低帶來的損失幾乎是相當(dāng)?shù)摹R虼?,在傳統(tǒng)運(yùn)用中,如果希望較高的正確報(bào)警率就必須承受高誤報(bào)警率;如果希望低誤報(bào)警率就必須接受低正確報(bào)警率的事實(shí)。
4、某地鐵站內(nèi)實(shí)地測(cè)試
1)測(cè)試基本環(huán)境和條件
測(cè)試監(jiān)控點(diǎn):地鐵站下行扶梯
測(cè)試人員:共11人
測(cè)試姿態(tài):自然姿態(tài)
測(cè)試人員通過測(cè)試:每個(gè)測(cè)試人員通過10次,測(cè)試人員共通過110次
旅客通過人次:428人次
測(cè)試庫容量:50016人
測(cè)試庫照片質(zhì)量:身份證二代制證用照片
2)測(cè)試結(jié)論
我們?cè)谶x定兩個(gè)算法并設(shè)定相應(yīng)較為合理的閾值后,正確報(bào)警率(漏報(bào)率)和誤報(bào)率的情況如下表:
算法 閾值 正確報(bào)警數(shù) 正確報(bào)警率 誤報(bào)警數(shù) 誤報(bào)警率算法1 0.71 60 54.5% 37 8.6%算法2 2.7 62 56.4% 18 4.2%
從上面的測(cè)試結(jié)果表明,在正確報(bào)警率都為55%左右的情況下,算法二比算法一在誤報(bào)警率控制的更好一些,但都遠(yuǎn)遠(yuǎn)超過了1%的水平。
影響誤報(bào)率的因素除了基礎(chǔ)的人臉識(shí)別算法外,還包括監(jiān)控區(qū)域的光照問題、被監(jiān)控者通過監(jiān)控區(qū)域時(shí)的姿態(tài)、采集監(jiān)控者人像使用的攝像機(jī)和鏡頭,還有傳輸監(jiān)控視頻的網(wǎng)絡(luò)環(huán)境等。
人臉識(shí)別的基礎(chǔ)算法是通過提取人臉的特征模板并進(jìn)行比對(duì)識(shí)別過程。不同的算法提取的特征不同,識(shí)別結(jié)果也不同,但是作為有效的算法,都追求高準(zhǔn)確接受率的同時(shí)降低錯(cuò)誤接受率。如果兩個(gè)基礎(chǔ)算法采用的是自主的、非同源的技術(shù),那么他們正確識(shí)別同一人的可能性就很大,而錯(cuò)誤識(shí)別不同人時(shí)的可能性就很小?;谝陨系乃伎己驼J(rèn)識(shí),我們將非同源、高互補(bǔ)性的算法進(jìn)行融合,建立報(bào)警過濾機(jī)制,達(dá)到降低誤報(bào)率的目的。
從理論上說,算法融合有三種模式,分別是決策層融合、比對(duì)分?jǐn)?shù)層融合和特征層融合。
決策層融合:每一個(gè)算法都會(huì)給出各自的決策,決策層融合過程將這些決策綜合起來給出最后的決策。通常采用諸如投票或者加權(quán)平均等策略。
比對(duì)分?jǐn)?shù)融合:每一個(gè)算法的識(shí)別過程都會(huì)給出一個(gè)比對(duì)分值,比對(duì)分?jǐn)?shù)融合過程將這些分?jǐn)?shù)綜合成一個(gè)最終的比對(duì)分?jǐn)?shù),并根據(jù)這個(gè)分?jǐn)?shù)做出決策。
特征層融合:每個(gè)算法的識(shí)別過程都會(huì)給出一組提前的特征,特征層融合過程將這些特征綜合成為一個(gè)特征集合或者特征向量,用于比對(duì)和決策。
目前我們采用決策層融合的方式建立報(bào)警過濾機(jī)制,來降低單算法的誤報(bào)率。
針對(duì)前述測(cè)試視頻,我們引入報(bào)警過濾機(jī)制進(jìn)行了測(cè)試,具體的測(cè)試結(jié)果如下:
算法 閾值 正確報(bào)警數(shù) 正確報(bào)警率 誤報(bào)警數(shù) 誤報(bào)警率算法1 0.68 69 62.7% 97 22.7%3 39 35.5% 0 0 2.7 46 41.8% 0 0 2.3 51 46.4% 0 0 2.0 60 54.5% 1 0.2%1.7 64 58.2% 4 0.9%算法1提高閾值 0.71 60 54.5% 37 8.6%報(bào)警過濾算法
從以上的測(cè)試結(jié)果看,我們可以在50011人的監(jiān)控名單庫中,將誤報(bào)警率控制在千分之二的情況下,正確報(bào)警率從62.7%只降低到54.5%。比只通過調(diào)整單算法的閾值達(dá)到的效果好很多,可以說此技術(shù)在控制誤報(bào)警率上已達(dá)到實(shí)際使用的水平。
(一)對(duì)算法和閾值進(jìn)一步優(yōu)化,使之達(dá)到在正確報(bào)警率基本不變的情況下,降低誤報(bào)警率。
(二)尋求更適合動(dòng)態(tài)人臉識(shí)別技術(shù)的硬件設(shè)備,特別是攝像機(jī)和鏡頭,希望能進(jìn)一步提高正確報(bào)警率的水平,目標(biāo)是能在目前的基礎(chǔ)上提高5%的正確報(bào)警率。
(三)繼續(xù)測(cè)試能提高正確報(bào)警率的完善監(jiān)控區(qū)域光照標(biāo)準(zhǔn),在有條件的地方,進(jìn)行適當(dāng)?shù)墓庠凑{(diào)整,以改善圖像質(zhì)質(zhì)量,提高正確報(bào)警率。
(四)探討與警務(wù)機(jī)制更加有效結(jié)合報(bào)警機(jī)制,如分級(jí)報(bào)警、多方式報(bào)警等。