饅頭老妖
如今,人臉識別技術已經在生活中的各個領域得到廣泛使用。從超市買單時的刷臉支付、高鐵檢票時刷臉過閘,到諸多手機App的用戶身份驗證,比如手機游戲里的防沉迷系統(tǒng)…… 可以說,我們的這張臉,已經成為網絡時代最好用的身份識別手段。
然而,也有很多人對此表示擔憂:倘若不法之徒盜用了我的形象,冒充我進行人臉識別,偷花我的錢,甚至還可能給我?guī)砟涿畹墓偎?,那該怎么辦?
那么,人臉識別,真的有那么容易忽悠嗎?
人臉識別的分級管理
我們都知道,越是重要的場合,對安保技術的可靠性、穩(wěn)定性要求也就越高。人臉識別的應用也是如此。盡管都叫作“人臉識別”技術,但在不同的應用場景里,它抵抗忽悠的能力也是不同的。
大體上,人臉識別的設備,可以分為兩大類:一類是使用手機、平板電腦的攝像頭來識別人臉,另一類則是通過專門的設備,比如高鐵、機場安檢臺的高清攝像頭來識別。后者體積更大,從價格來說,也更貴。一分錢一分貨,其識別的準確率和抗欺騙的能力,也遠遠超過前者。所以,在那些重大的場合,人臉識別的可靠性還是相當有保證的。
鏡頭前是活人嗎?
技術上把這種抵抗忽悠的能力, 稱為“ 活體檢測”。那么,要如何判斷站在鏡頭前的,是一個真人,還是打印出來的照片或者手機上的畫面?
最常用的檢測方式是動作檢測。通過語音、文字等方法,要求被驗證的用戶做出一系列指定的動作,如張嘴、搖頭、眨眼、念出某個隨機數字等等。很顯然,照片上的人臉,是不會做出這些動作的。這種方式的成本低,可靠性也很高,但缺點就是需要用戶予以配合。
不需要用戶配合的方法里,比較常用的有兩種:人臉深度信息的鑒別和多光譜下人臉反射的鑒別。
先來說說人臉深度信息的鑒別。無論是平板、手機,還是打印出來的人臉照片,人臉都是二維化的,眼睛、鼻子、耳朵都處于同一個平面內。而真正的人臉,當然是三維的:鼻尖在最前面,耳朵在最后面,眼睛位于兩者之間。
在數學上,常用“曲率”這個參數,來描述一個物體表面的凹凸、彎曲情況。在人臉識別中使用的也是這個邏輯:先用一束人眼無法看到的光,在被識別的“臉”上進行大致的3D掃描,通過反射回來的微小差異,得到耳朵、鼻尖、額頭等位置的特征點在空間中的坐標,從而計算一個綜合曲率;再和已知的人體曲率范圍相比較,就能知道這個曲率是否合理。如果算出來曲率很小,那就說明識別的只是一個二維的平面,不是活人。
要做到這一點,需要比較專業(yè)的設備,手機恐怕是很難的。但近年來,隨著雙攝手機的普及,人臉識別的能力也得到了全面提升:兩個鏡頭之間有一定的距離,就像是我們的左右眼;當它識別的是一個凹凸有致的人臉時,兩個鏡頭“看到”的畫面,一定是有較大差異的。如果兩個畫面幾乎完全一致,那一定不是真人。
而多光譜鑒別,是在人臉深度信息的基礎上再加了一道保險:它會用不同顏色的可見光、近紅外光、近紫外光等很安全的光源,交替掃描人臉。人的皮膚對這些光源的反射能力,和照片、屏幕差異極大,容易看出破綻。即便能讓其中一種光源蒙混過關,也很難同時模擬人臉對其他幾種光線的反射情況。
總體而言,人臉識別中的活體檢測技術,就是在與不法分子進行較量,兩者都在對抗中不斷進化。但愿,不會真的出現我們的“臉”被人偷走的那一天吧。