張璟 張奕 張永梅 楊飛 李旭茹
摘要:2015年考試作弊已被列入我國刑法,考生的誠信和考場的紀律也越來越值得關注和重視。因此需要一種合理便捷的方法檢查并防止作弊現(xiàn)象的發(fā)生。人與人之間的特征有很大區(qū)別,生物特征識別技術就是利用人類自身特征來證明身份,相對于傳統(tǒng)考試驗證身份,該技術有很大的優(yōu)勢和發(fā)展前景。本文討論了4種常用的生物識別技術:指紋考試檢測技術、虹膜考試檢測技術、人臉考試檢測技術、靜脈考試檢測技術。通過對這些技術的分析與研究,發(fā)現(xiàn)人臉識別技術最為有效。本文設計與實現(xiàn)了一種人臉檢測與識別方法,實現(xiàn)對考生身份的確認,檢測和識別效果較好。
關鍵詞:考試身份識別系統(tǒng);虹膜識別;人臉識別;Haar特征;識別準確率
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2016)24-0194-05
Abstract: Exam cheating has been included in Chinas criminal law in 2015. Therefore, it needs a reasonable and convenient method to prevent the occurrence of cheating. The characteristics of human beings are very different, so biometric identification technologies valid peoples identity by using human biometric characteristics. Compared with the traditional ways to verify the identity, the technology has great advantages and application prospects. This paper discusses fingerprint detection technology, iris detection technology, face detection technology and vein detection technology in the exams. Through the study of these technologies, face recognition technology is found to be the most effective way. The paper designs and implements a face detection and recognition method of the exam identity confirmation, achieves better detection and recognition effects.
Key words: Identification system in examination; Iris recognition; Face recognition; Haar feature; Identification accuracy
高考、研究生入學等大型考試,最大特點就是準備時間長,參考人數(shù)多,公民關注度高。以往考試中,教育部一般按照當?shù)貙W校提供的身份證、照片等個人信息制作準考證。在考試過程中,監(jiān)考教師要在10分鐘之內核查全部考生的身份。隨著科技發(fā)展,流程化和集體作弊的技術日趨猖獗。替考團隊可以偽造考生的信息,修改考生照片,甚至找外貌相似的學生替考。在不熟悉考生的情況下,監(jiān)考教師很難迅速地判斷考生身份,而且每個監(jiān)考教師的判斷標準參差不一,無法保證考試的公平性。
為了提高考試的規(guī)范性、權威性和公平性,杜絕考場出現(xiàn)替考的作弊情況,生物識別技術應運而生。生物識別技術利用考生獨一無二的特點進行核查。相比傳統(tǒng)的人工識別,生物識別速度快、識別率高、客觀性強,并且簡化了考試核查流程,節(jié)約了大量的人力物力,可以從根本上解決考試作弊問題,維護考試的公平。
1 生物識別的主要方法及特點
生物識別技術就是利用人類獨一無二且易于識別的信息,用一組特別的算法進行取樣核對,分析其特征,得到一組唯一的編碼,如果編碼與數(shù)據(jù)庫中保存的相同就表明其驗證成功,反之驗證失敗。這種技術跨越了生物領域、物理領域、計算機領域與統(tǒng)計領域,同時借助大數(shù)據(jù)、云端處理來準確高效地識別,從而實現(xiàn)了智能化和自動化,符合考場的要求和當代社會發(fā)展的趨勢。
指紋識別是當今社會發(fā)展最為迅速的生物檢測技術。指紋是最容易殘留的個人信息,它包含的特征多,我們的雙手至少有5000個可以識別的特征,現(xiàn)在國內外的指紋識別技術大都采用基于細節(jié)特征,即采用基于圖像處理的指紋識別算法,有兩種比較有代表性的指紋識別算法,一種是基于方向濾波增強,并在指紋細化圖上提取特征的算法,另一種是直接從指紋灰度圖上提取特征的算法[1,2]。由于指紋圖像的噪音、皮膚彈性引起的非線性形變,或者在手指出汗或者有污漬的情況下,會出現(xiàn)不易識別的情況,導致識別過程中出現(xiàn)誤差,影響識別率等。而且在大型考試中,由于考生人數(shù)龐大,因此設計的數(shù)據(jù)庫很龐大,也不利于系統(tǒng)的運行和維護[3,4]。另外它還存在一個重大漏洞,就是當替考者使用指紋膜,甚至更隱蔽的透明指紋貼時,機器可能誤判,這樣一個不可避免的隱患使指紋不適合作為考場中取證的特征。
靜脈識別系統(tǒng)用紅外線提取考生靜脈的分布及特點并作為判斷依據(jù)來進行識別。用一組唯一的編碼保存其特征值,若特征值與以前考生存儲的信息相同,則可以進行判斷。首先,靜脈識別是活體識別,由于需要采集手部皮下的靜脈圖像,用紅外對手背皮下的靜脈圖像進行照影,與手背表面的圖像特征無關。所以手背表面的污漬或者天氣炎熱時出汗等帶來的障礙均沒有影響。另外雙手無須接觸設備,衛(wèi)生安全,考生易于接受。在考場中使用靜脈識別,安全性特別高。作為活體識別的靜脈識別花費的代價太高昂,而且研究復雜。不利于在高考和研究生這樣上百萬人數(shù)的考試中大規(guī)模使用和推廣,可以在今后選拔性更高且考生不多的情況下使用。
虹膜識別是一種不需要接觸考生的生物識別技術。首先抓拍并確定人的整個眼部圖像,在特定的算法下抓取虹膜的某些特征,這樣就獲取到了一組唯一的編碼,如果與本地數(shù)據(jù)庫中保存的編碼信息一致,則可以判斷其為本人。在考場中,虹膜識別無須接觸機器就可以檢測,方便快捷,僅僅數(shù)秒就可以給出結果,并且識別率很高[5]。但虹膜識別很難將圖像獲取設備的尺寸小型化,設備造價高,無法大范圍推廣,而且鏡頭可能產(chǎn)生圖像畸變,而使虹膜識別的可靠性降低。
人臉識別需要對考生的面部進行掃描,通過系統(tǒng)特定的算法對其某些特征進行提取來識別人的身份特征[6,7,8]。人的五官、臉型等一些微小的特征都可以作為觀察點來鑒別,將這些特征點編排得到一組獨特序列,與數(shù)據(jù)庫中已經(jīng)存儲好的數(shù)據(jù)進行比較,當達到一定閾值,就可以判斷為本人,反之亦然。該技術需要考生在報名時提前存儲其人臉信息,在考試時,只需簡單拍攝一下就可以輕松識別,實現(xiàn)對考生身份的確認,以達到又好又快的檢測和識別效果。相比于人工檢查的繁瑣與不確定性,其整個過程快速高效,很符合考場的環(huán)境。
2 一種人臉檢測與識別方法
2.1 系統(tǒng)主要功能
該系統(tǒng)采用Visual C++編程實現(xiàn),主要完成了三個功能:從給定的圖像中檢測出人臉區(qū)域并識別;從給定的視頻流中檢測出所有出現(xiàn)的人臉信息;檢測出攝像頭拍攝區(qū)域的人臉信息,顯示相關信息。
該系統(tǒng)具體實現(xiàn)分為三個階段:(1)訓練。先采集人臉圖像組成訓練集,識別訓練所需要的數(shù)據(jù),保存每個人的代表臉;(2)檢測識別。當再次輸入圖像、視頻時,利用已知特征,截取圖像或視頻中的人臉區(qū)域;(3)身份認證。最后提取該區(qū)域人臉特征,與訓練階段得到的特征相對比,識別并顯示相應的人物信息。
在人臉圖像的訓練階段,常用的臉部特征包括基于面部的幾何特征,基于模板的模板匹配特征,基于數(shù)學的主成分分析特征等。在本系統(tǒng)中,用到了兩種特征:主成分分析特征和基于統(tǒng)計的Haar特征。其中,Haar特征用于人臉檢測部分所需要的分類器,主成分分析特征用于人臉識別階段。
在人臉檢測與識別階段,采用前一階段訓練得到的Haar特征分類器從輸入的圖像中截取出人臉區(qū)域,然后用前一階段得到的主成分分析特征對截取到的人臉進行主成分分析,并與訓練階段得到的特征相對比,識別出相應的信息。
本文在統(tǒng)計學習的基礎上,對待識別的對象、視頻加以處理,從中提取人臉區(qū)域,提取所需要的人臉特征,與已經(jīng)訓練過的人臉相比較,識別出人物身份。圖1給出了人臉檢測與識別系統(tǒng)的組成。
2.2圖像的預處理方法
在圖像處理過程中,圖像增強是一個十分重要的環(huán)節(jié)。圖像增強就是采用一系列技術來改善圖像的視覺效果或將圖像轉換成一種更適合于人眼觀察和計算機自動分析的形式。本文將所有待處理圖像轉換為灰度圖像統(tǒng)一處理。由于受光線影響,人臉區(qū)域可能出現(xiàn)陰影或是整體區(qū)域顯示暗淡。針對這一問題,本文采用直方圖均衡化方法對圖像進行增強處理。
2.3 人臉區(qū)域的檢測方法
在實際應用中,輸入的圖像不可能是規(guī)則的截取人臉區(qū)域,所以,對于輸入圖像,應先找出圖像中的人臉區(qū)域。從一幅圖像里提取出人臉區(qū)域,就必須遍歷圖像,計算量將會大大增加。如何從一幅圖像中快速準確地找出人臉區(qū)域是本文考慮的重要因素。
本文處理的主要是包含人臉以及背景的圖像或是一幅圖像中也可能含有多個人臉的圖像;另外,在處理視頻流時,圖像較多,對速度要求較高。針對這幾種要求,本文采用Haar特征作為人臉檢測的依據(jù),它具有檢測準確,速度快的特點。
Haar特征分為三類:邊緣特征、線性特征、中心特征和對角線特征,組合成特征模板。特征模板內有白色和黑色兩種矩形,并定義該模板的特征值為白色矩形像素和減去黑色矩形像素和。Haar特征值反映了圖像的灰度變化情況。例如:臉部的一些特征能由矩形特征簡單的描述,例如:眼睛要比臉頰顏色要深,鼻梁兩側比鼻梁顏色要深,嘴巴比周圍顏色要深等。但矩形特征只對一些簡單的圖形結構,如邊緣、線段較敏感,所以只能描述特定走向(水平、垂直、對角)的結構。
對于圖2中的A、B和D這類特征,特征數(shù)值計算公式為:v=Sum(白)-Sum(黑),而對于C來說,計算公式如下:v=Sum(白)-2*Sum(黑);之所以將黑色區(qū)域像素和乘以2,是為了使兩種矩形區(qū)域中像素數(shù)目一致。通過改變特征模板的大小和位置,可在圖像子窗口中窮舉出大量的特征。圖2的特征模板稱為“特征原型”;特征原型在圖像子窗口中擴展(平移伸縮)得到的特征稱為“矩形特征”;矩形特征的值稱為“特征值”。矩形特征可位于圖像任意位置,大小也可以任意改變,所以矩形特征值是矩形模版類別、矩形位置和矩形大小這三個因素的函數(shù)。故類別、大小和位置的變化,使得很小的檢測窗口含有非常多的矩形特征。
由于訓練樣本通常有近萬個,并且矩形特征的數(shù)量非常龐大,如果每次計算特征值都要統(tǒng)計矩形內所以像素之和,將會大大降低訓練和檢測的速度。因此引入了一種新的圖像表示方法——積分圖像,矩形特征的特征值計算,只與此特征矩形的端點的積分圖有關,所以無論此特征矩形的尺度變換如何,特征值的計算所消耗的時間都是常量。這樣只要遍歷圖像一次,就可以求得所有子窗口的特征值。
Adaboost是adaptive boost的縮寫,它是一種迭代算法。其核心思想是針對同一個訓練集訓練不同的分類器(弱分類器),然后把這些弱分類器集合起來,構成一個更強的最終分類器 (強分類器)。其算法本身是通過改變數(shù)據(jù)分布來實現(xiàn)的,它根據(jù)每次訓練集之中每個樣本的分類是否正確,以及上次的總體分類的準確率,來確定每個樣本的權值。將修改過權值的新數(shù)據(jù)集送給下層分類器進行訓練,最后將每次訓練得到的分類器融合起來,作為最后的決策分類器。使用Adaboost分類器可以排除一些不必要的訓練數(shù)據(jù)特征,并將重點放在關鍵的訓練數(shù)據(jù)上。
2.4人臉識別方法
對于一張截取的人臉區(qū)域圖,由于受拍攝角度、光照、表情、飾物、年齡等的影響,也會表現(xiàn)出很大的差異;對于這些差異,如何提取特征,準確識別出相應的人臉,是人臉識別研究的重點。
在人臉識別階段,本文所要處理的是檢測階段提取的規(guī)則的人臉,且識別的人臉一定是事先采集過的人臉圖像,在訓練集中對所有人臉提取PCA特征,并保存。識別時,采用主成分分析的方法提取待識別人臉特征,并與訓練階段的人臉特征相比較,識別出相應的人臉。
完整的PCA 人臉識別包括如下步驟:人臉圖像預處理、讀入人臉庫、訓練形成特征子空間、將訓練圖像和測試圖像投影到上一步驟中得到的子空間上、選擇一定的距離函數(shù)進行識別。下面詳細給出整個過程。
(1)讀入人臉庫。歸一化人臉庫后,將庫中的每人選擇一定數(shù)量的圖像構成訓練集,其余構成測試集。設歸一化后的圖像是n×m,按列相連就構成N=n×m 維矢量,可視為N 維空間中的一個點,可以通過K-L 變換用一個低維子空間描述這個圖像。
2.5實驗結果與分析
本文的具體步驟主要包括訓練階段、識別階段。訓練階段:在CAS-PEAL人臉數(shù)據(jù)庫中選取40個人的人臉圖像,包括20個男性和20個女性,每個人選取的有不同表情的、帶有飾物、不同光照的、正常表情的一共12幅圖像,共480幅。其中選取240幅(每人6幅)作為訓練對象,在這6幅圖像中選取一幅作為這個人的代表圖像。訓練過程分為兩步:
(1)對這240幅圖像做人臉檢測、加入到人臉庫、輸入個人信息、輸入密碼,這些數(shù)據(jù)都將作為識別階段的識別依據(jù),所輸入的個人信息將寫入單獨文件保存;
(2)對這240個歸一化的人臉進行K-L變換,提取這240幅人臉的平均臉、特征向量矩陣,并把這240幅人臉圖像投影到特征向量矩陣,保存特征值。
識別階段:
(1)讀入圖像,本文選擇灰度圖像作為處理對象,所以在接收到一幅圖像時,首先轉換為灰度圖像;
(2)預處理。本文采用直方圖均衡化方法處理減弱光線帶來的影響,通過把原圖像的直方圖通過變換函數(shù)修正為分布比較均勻的直方圖,從而改變圖像整體偏暗或整體偏亮,灰度層次不豐富的情況;
(3)人臉檢測。利用訓練階段所得的Haar特征分類器,檢測圖像中的人臉區(qū)域并標記,同時,將檢測到的人臉區(qū)域截取保存,將截取區(qū)域顯示為“當前臉”。當一幅圖像中含有多幅人臉時,檢測標記出多個人臉,點擊“下一個人臉”時,則可識別一幅圖像中不同的人臉;
(4)人臉識別。點擊“識別”,本文將識別當前顯示在“當前臉”區(qū)域的人臉。提取當前檢測到的人臉,先做預處理,然后進行K-L變換,投影到訓練階段所得的特征臉矩陣,得到的特征值與訓練階段的特征值求歐氏距離。將最小的歐氏距離對應的人臉作為識別人臉,并顯示出對應的代表圖像。
本文在Visual C++平臺,利用MFC庫編程實現(xiàn)。鼠標左鍵雙擊界面,顯示運行主界面,主界面中包括當前處理的步驟等。如圖3所示,按鈕“打開圖像”、“打開視頻”、“打開攝像”分別打開不同的數(shù)據(jù)來源,對于這三種數(shù)據(jù)來源,有其不同的用處。圖像將主要用于構建人臉數(shù)據(jù)庫、輸入個人信息、輸入個人代表圖像、識別當前圖像人物身份。對于視頻文件,本文主要監(jiān)測視頻中出現(xiàn)的人物,并顯示其相應的信息。對于攝像頭采集到的數(shù)據(jù),主要對其進行認證登陸處理。其中,視頻文件、攝像頭實時視頻文件也可轉化為圖像來源。以下將對三種不同來源的數(shù)據(jù)處理過程分別加以說明。
當處理對象為圖像時,打開的圖像顯示在“待檢測圖像區(qū)域”,當點擊“人臉檢測”時,將檢測顯示在“待檢測圖像”區(qū)域的圖像,檢測完成后,以方框的形式標記在待檢測圖像中。此時,若圖像中沒有檢測到人臉區(qū)域,將彈出“未檢測到人臉”的提示框;當檢測到人臉區(qū)域時,標記并將顯示在“檢測到的人臉”區(qū)域,這個是歸一化的人臉,是識別的具體對象。此時,若檢測到多幅人臉,點擊“下一個臉”按鍵,可依次把各個人臉顯示在“檢測的人臉”區(qū)域。人臉檢測結果如圖4所示。
此時,若點擊“添加到庫”,則將“檢測到的人臉”區(qū)域顯示的人臉圖添加到人臉庫,同時彈出個人信息輸入界面,提示輸入個人信息。輸入完成后,點擊確定,系統(tǒng)自動保存?zhèn)€人信息,并把該人臉圖加入到人臉庫。當添加新的人臉后,一定要重新訓練,即點擊“訓練”按鈕。在圖4界面時,當點擊識別按鈕時,本文將對檢測到的人臉進行識別,并將識別結果顯示在個人信息區(qū)域,給出個人姓名,以及識別到的具體圖像。如圖5所示。
當打開的數(shù)據(jù)是視頻文件時,本文彈出“Vedio”視頻播放窗口,當檢測到視頻文件中的人臉區(qū)域時,本文將視頻截圖顯示在主界面的“待檢測圖像”區(qū)域。然后對此圖像按照圖像人臉檢測方法進行,并彈出所有檢測到的人物信息。
本文完成了對圖像、視頻文件、實時視頻人臉檢測提取、人臉識別,人臉識別平均正確率為90%,具有較高的安全性。關于其缺陷可能的原因如下:
(1)Haar特征訓練時,針對的是正常人臉區(qū)域,而且光線較好。當遇到戴有飾物或是光線變化的人臉時,檢測效果不夠理想;
(2)主成分分析的方法對于表情變化較大的人臉,或是人戴有飾物時,容易識別錯誤,這可能是訓練人臉數(shù)量有限造成的。
3結論
本文對各個領域中廣泛使用的4種生物識別技術進行了剖析,設計了人臉防作弊檢測技術。本文將多種特征結合起來進行檢測、識別,先用Haar特征與Adaboost分類器相結合的方法對人臉與非人臉區(qū)域加以區(qū)分,實現(xiàn)對人臉的檢測;而后對檢測到的人臉進行分割處理,最后利用主成分分析的方法對人臉進行識別。
參考文獻
[1] 劉成, 彭進業(yè). 基于多任務學習的自然圖像分類研究[J]. 計算機應用研究,2012,29(7):2773-2775.
[2] 畢雪芹, 蘇艷娟, 王琪. 嵌入式指紋識別系統(tǒng)的設計及試驗研究[J]. 國外電子測量技術,2015,2:50-53.
[3] 宋思瑤. 指紋識別在學校考試系統(tǒng)中的應用[D]. 吉林大學,2011.
[4] 馬建敏. 基于指紋識別的考試管理系統(tǒng)設計與實現(xiàn)[D]. 河北科技大學,2011.
[5]陳晴, 易開軍.現(xiàn)代虹膜識別技術在考生身份驗證系統(tǒng)中的應用初探[J]. 工業(yè)和信息化教育,2015,8:81-85.
[6] 李鑫, 張俊. 基于深度信念網(wǎng)絡和多任務學習的人臉識別[J]. 電腦知識與技術,2016,12(17):165-168.
[7] 劉向東. 基于PCA算法人臉識別的MATLAB實現(xiàn)[J]. 電腦知識與技術,2016,12(12):193-194.
[8] 袁正海. 人臉識別系統(tǒng)及關鍵技術研究[D]. 南京郵電大學,2013.