陳春杰
(常州市公安局,江蘇 常州 213000)
步態(tài)識別作為一種新興的生物特征識別技術,步態(tài)識別利用圖像和視頻序列,通過建立模型提取目標人物步態(tài)輪廓特征,從而對人物目標進行身份識別。與人像識別、指紋識別等生物特征相比,步態(tài)識別具有遠距離、非受控、多視角和不容易偽裝等優(yōu)點,最適合在視頻監(jiān)控中應用的生物特征識別方法之一。本文將針對步態(tài)特征的身份識別方法與算法展開分析[1]。
在步態(tài)特征身份識別檢測過程中,運動目標檢測是重要環(huán)節(jié),是了解和掌握運動目標步態(tài)特征的前提?;趫D像排序,通過背景建模、減除,將得到的前景圖像展開形態(tài)學處理,再進行連通性分析,并剪裁圖像,最后利用邊緣提取技術,提取運動目標,進而提取運動目標的特征[2]。
2.1.1 圖像提取
在步態(tài)特征的身份識別過程中,通過幀差法、光流法以及背景減除法提取序列圖像。其中,幀差法對背景逐漸轉變狀況并不敏感;光流法計算煩瑣、缺少實時性成效;而背景減除法快捷、簡便,適宜視頻采集設備選擇的場景。文章通過背景減除法提取運動目標特征,它主要包括3種算法,即混合高斯函數(shù)(Mixture of Gaussian,MOG)、GMG、MOG2。其中,GMG算法是用較少的圖像進行背景建模的,精準度不高,當前運用并不多。本文選擇MOG2算法進行前景提取,是基于高斯混合模型的前景分割算法,是各像素選擇適當數(shù)量的高斯分布,MOG2算法更加適合在亮度轉變出現(xiàn)的場景轉變。此種算法,能夠進行陰影檢測,速度超過MOG算法[3]。MOG2算法前景提取圖如圖1所示。
圖1 MOG2算法前景提取圖
2.1.2 形態(tài)學處理
利用背景減除法得到步態(tài)圖像存在噪聲、空洞等現(xiàn)象,為避免此種現(xiàn)象對識別分析產(chǎn)生的影響,可通過圖像形態(tài)學處理方式處理得到的二值步態(tài)圖像。比較常用的形態(tài)學處理包括腐蝕、膨脹、開/閉操作等方法。首先,腐蝕是指更加簡便地清除不相關元素,能夠消除圖像中的噪聲等,公式為其中A為圖像,B為結構元素,為B對A進行腐蝕操作,即通過B遍歷A,清除二者不完全相交的元素值,從而完成腐蝕。其次,膨脹可看作簡便的連接操作,能夠修復圖像中的斷裂情況,公式為,其中A為圖像,b為結構元素B有關中心點的映射,為B對A進行膨脹,即通過B遍歷A,記錄二者在交集點進行膨脹。在腐蝕與膨脹的前提下,還需要進行開/閉操作。開操作可以使物體輪廓更加平滑,切斷細小間隔,公式為其中A為圖像,B為結構元素,為B對A進行開操作。閉操作不僅可以充分填充圖像空洞,還能夠使物體邊緣更加平滑,公式為其中A為圖像,B為結構元素,為B對A進行閉操作。文章對于二值化后步態(tài)圖像先進行開操作,再進行閉操作。形態(tài)學處理的前后對比圖如圖2所示。
圖2 形態(tài)學處理前后對比示意圖
2.1.3 互通性
將互相連通位置進行套標記,并且計算像素點情況,然后按照像素點數(shù)量,可以明確身體和背景區(qū)域,并且體現(xiàn)出步態(tài)特征,同時還可以有效地清除噪聲區(qū)影響。
2.1.4 圖像剪裁
在進行圖像剪裁過程中,應當凸顯剪裁重點,這樣操作的主要目的,就是為了進一步清除背景中的多余信息。在剪裁過程中,不僅要注意圖像尺寸,還應確保圖像的完整性。
2.1.5 圖像輪廓提取
在辨識步態(tài)特征時,應當根據(jù)重點區(qū)域,在圖像區(qū)域邊緣,通過邊緣跟蹤算法對剪裁圖像提取輪廓線,從而得到更精準的人體步態(tài)特征[4]。
特征提取是基于運動目標檢測的前提下,對圖像序列展開周期性監(jiān)測,對關鍵幀進行提取,從而掌握人體輪廓特征、肢體動作特征與反射對稱特征,綜合特征矢量,在分類器中識別步態(tài)特征。
2.2.1 步態(tài)周期檢測
人體在運動過程當中,步態(tài)體現(xiàn)出相應的周期性,根據(jù)身體結構、個體習慣以及行為規(guī)律進行重復性動作。通常情況下,兩步可以作為一個步態(tài)周期。由于步態(tài)具有煩瑣性,周期難以完全精準,所以可以參考大概值。檢測步態(tài)周期時,通過快捷、簡便的方式,不僅能夠預估步態(tài)周期,還可以按照人體行走動作特征開展全方位分析,從而得到精準的步態(tài)周期。
2.2.2 圖像幀提取
由于步態(tài)周期的不同,在對運動目標進行圖像幀提取過程中,要根據(jù)顯示情況,提取其中的關鍵幀,這樣才能充分體現(xiàn)步態(tài)情況,從而精準把握特征。
2.2.3 步態(tài)特征提取
提取步態(tài)特征包含人體外部輪廓特征、肢體動作特征與反射對稱特征等要素。通過傅里葉描述子對人體外部輪廓特征進行提取,可以全面體現(xiàn)步態(tài)特征;反射對稱特征是按照人體走路的動作習慣,把反射對稱特征當作步態(tài)差別依據(jù),進行多方面分析,從而完成基于步態(tài)特征的身份識別。
視頻采集設備通常是固定的,容易造成在視頻設備采集范疇內(nèi),運動目標外形是從小到大再變小的過程。在提取步態(tài)特征時,統(tǒng)一目標圖像能夠更容易被識別。通過圖像歸一化方式,讓各個運動目標圖像統(tǒng)一,包含圖像當中運行目標的大小以及區(qū)域位置等。在系統(tǒng)程序當中,制定圖像尺寸,把目標圖像統(tǒng)一成64 px×64 px[5]。
基于智能手機設計快捷簡單的數(shù)據(jù)提取軟件。傳感器相應頻率在5 000 Hz,為確保檢測數(shù)據(jù)盡量全面地描述目標運動,并且不加大后續(xù)計算工作量,程序運行時長設置每0.02 s讀取一次數(shù)據(jù),也就是數(shù)據(jù)樣本采集頻率在50 Hz,同時記錄被檢測人員的五種運動數(shù)據(jù)[6]。所選擇被檢測者身高在160~180 cm,體重在45~85 kg,年齡在20~45歲。在相同空氣流通、地面摩擦、衣著相近以及健康的前提下,經(jīng)過10組各100 s的自然行走進行檢測,得到50組五種實時數(shù)據(jù),總共200 000條實時檢測記錄數(shù)據(jù),讓實驗結果更精準可靠[7]。針對每一個步態(tài)序列來講,開展步態(tài)檢測算法對運動目標進行跟蹤。圖3呈現(xiàn)步態(tài)模式時空變化。訓練與投影前,其輪廓圖像序列轉化成1D距離信號序列,通過距離信號序列,以PCA訓練過程來執(zhí)行。按照特征空間特征幅度與相應積累的方差曲線,選擇用前10個特征值與相應特征向量構建特征空間轉化矩陣。圖4呈現(xiàn)三種角度下的特征形狀信號,其體現(xiàn)步態(tài)運動對稱特征。FERET算法識別主要分為兩種:一種是半自動算法,這種算法需要人工方式來指出圖像當中人兩眼中心的坐標;另一種是全自動算法,這種算法可以自動定位圖像中人臉,然后進行充分識別。在測試時,人臉圖像可以分為兩個集合:一個是已知身份的人圖像組成的目標集;另一個是輸入算法,對未知身份人圖像組成的探測集和查詢集。通過測試可以發(fā)現(xiàn),主要問題就在于識別算法對于光照變化比較敏感,因此在查詢圖像和目標圖像時,應當注意其他情況的影響[8]。
圖3 步態(tài)模式時空變化圖
圖4 三種角度下的特征形狀信號圖
3.2.1 識別性能
在具體應用過程中,應當充分考量小數(shù)量樣本情況,然后通過留一交叉驗證法,可以得到更高的識別率。之后針對相同角度,還有各個序列狀況,每次都預留一個樣本序列,同時訓練剩余序列,最后再根據(jù)剩余樣本進行相近性歸類,并預留部分樣本。在這個過程中,針對各角度狀況進行了重復。表1匯總了身份識別算法和正確分類率(CCR),因此實驗結果非常顯著。比分類誤差通過ROS,能夠定義檢測度量類型,并在最前n個匹配值間,積累了概率p(n)。性能統(tǒng)計特性,利用了累積匹配分值標識,將階次n表示在橫軸上,而垂直抽表示了正確匹配累積百分比[9]。通過ROS對算法和性能進行評估,如圖5所示。FERET算法運用了STC和NED度量累積匹配圖,其中(a)運用了STC度量,(b)運用了投影實線和標本投影虛線NED度量,因此正確分類率等價于p(1)。
表1 算法的正確分類率
3.2.2 校驗性能
運用留一校驗法,對錯誤接受率(FAR)與錯誤決絕率(FRR)進行預估。并運用剩余樣本訓練分類器,之后在多個類別當中校驗留出的樣本,如圖6所示,呈現(xiàn)基于NED度量ROC曲線,其中能夠看出對應于0°、45°、90°角度等誤差率(EER)分別為20%、13%與9%。
圖6 基于NED度量ROC曲線
3.2.3 結果分析
根據(jù)圖5能夠得出以下幾個結論:
圖5 FERET算法識別結果
第一,在一定情況下,STC能夠有效捕捉時空特性,并且識別率較好。由于每幀分割誤差,或者是相應序列間的衣著抖動影響,使得幀間區(qū)別累積到一定程度時,會提升總時空匹配誤差;當總體序列統(tǒng)計平均數(shù)值,投影可以有效克服每幀間的噪聲問題。
第二,標本投影NED和單一序列投影NED對比執(zhí)行情況分析。由于不同階段的步態(tài)間存在細微差異,所以運用單一隨機樣本序列進行對比,可以給指定人體提供更加標準的步態(tài)模式。
第三,正面識別性能較好。由于角度和輪廓形狀沒有明顯變化,在提取特征時,更多的是對個體外形信息進行捕捉[10]。
當前算法主要是在小規(guī)模數(shù)據(jù)庫中對性能進行評估。此樣本數(shù)據(jù)來源于國外,包含7個人,每人4個序列,總共28個步態(tài)序列。個體針對固定設備來講是側面運動的,全部凸顯國際于25幀/秒的速度進行拍攝,并且原始大小在384 px×288 px。另外對比實驗和文中不同的是其選用運動圖像的相關圖當作原始特征,并且通過特征空間轉化降低特征向量位數(shù),本文選擇側面角度的NLPR數(shù)據(jù)庫對此算法進行檢測,最好識別率在73%,即便其與本文算法性能相近,但計算時長遠遠高于本文算法。對比二者,首先,和以往對比,由于特征提取簡便,本文算法更加容易實現(xiàn);其次,識別算法性能評估是在當前大規(guī)模數(shù)據(jù)庫中開展,以往是在小規(guī)模樣本數(shù)據(jù)庫中完成;再次,識別性能與小樣本數(shù)據(jù)庫對比,識別率低;最后,以往是指單一側面角度開展,而本文從三個角度進行分析,同時觀察步態(tài)特征調整對角度的敏感性。
與虹膜識別、人臉識別、指紋識別等身份識別技術相比,基于步態(tài)特征的身份識別有著較明顯的優(yōu)勢。今后,通過不斷優(yōu)化和改進算法模型,進一步提高算法的識別率,從而更好地將基于步態(tài)特征的身份識別技術運用于相關領域,為社會提供更安全、可靠的服務。