汪西原,閆 輝
(寧夏大學(xué)物理電氣信息學(xué)院,寧夏銀川750021)
由于人體步態(tài)特征具有難以偽裝,正常情況下不易修改,識(shí)別時(shí)具有遠(yuǎn)距離非接觸,對(duì)系統(tǒng)分辨率要求低的特點(diǎn)而逐漸成為模式識(shí)別研究領(lǐng)域的一個(gè)重點(diǎn)。步態(tài)識(shí)別算法可分為基于模型(橢圓模型[1]、鐘擺模型[2]、三維模型[3]等)和基于特征兩種。由于運(yùn)動(dòng)過程中步態(tài)特征的復(fù)雜性,基于模型的方法描述步態(tài)運(yùn)動(dòng)具有一定的局限性?;谔卣鞯姆椒ㄈ珀悓?shí)等人[4]采用極直方圖的方法描述步態(tài)輪廓;Rahati等人[5]采用小波變換;馬勤勇等人[6]利用一幅步態(tài)輪廓圖提取三段步態(tài)輪廓線;楊旗等人[7]提出的動(dòng)靜態(tài)信息融合及動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的步態(tài)識(shí)別算法等。但是,當(dāng)人體目標(biāo)與攝像機(jī)在相對(duì)運(yùn)動(dòng)過程中出現(xiàn)幾何變化(位置、尺度和方向)時(shí),上述基于特征的方法無(wú)法獲得準(zhǔn)確的步態(tài)特征信息,因此識(shí)別的正確率會(huì)降低,而利用不變矩提取的特征對(duì)發(fā)生幾何變化的圖像也有很好的不變性,尤其可以很好地描述視頻序列中單幀人體形狀的步態(tài)特征,如林敏等人[8]提出了一種基于統(tǒng)一Hu矩和支持向量機(jī)的步態(tài)識(shí)別算法;張前進(jìn)等人[9]提出了基于Radon變換特征提取的步態(tài)識(shí)別;Xiao等人[10]提出了基于Zernike矩和BP神經(jīng)網(wǎng)絡(luò)的步態(tài)識(shí)別算法;Lu[11]利用偽Zernike矩聯(lián)合付立葉描述子和小波描述子并采用決策級(jí)融合的方法進(jìn)行步態(tài)特征識(shí)別。但是,這些基于不變矩的步態(tài)識(shí)別算法需要對(duì)視頻序列中檢測(cè)到的灰度目標(biāo)圖像進(jìn)行二值化和歸一化處理,之后再進(jìn)行不變性特征的提取,而二值化過程會(huì)造成很多細(xì)節(jié)與有用信息丟失,歸一化過程則會(huì)引入重采樣與重量化誤差,這必然導(dǎo)致算法識(shí)別率的降低。
為了克服上述不足,本文將基于Radon變換和解析Fourier-Mellin變換[12]的不變性特征提取算法應(yīng)用于步態(tài)識(shí)別。由于直接對(duì)灰度圖像進(jìn)行特征提取,沒有二值化和歸一化,因此得到的特征具有更多的細(xì)節(jié)信息,對(duì)原圖像有更好的描述能力。圖1和圖2為兩種算法實(shí)現(xiàn)框圖。
該算法首先對(duì)目標(biāo)灰度圖像利用Radon變換(見圖2)將原圖像的旋轉(zhuǎn)變化轉(zhuǎn)化到沿H方向平移的投影空間(見圖3),尺度變化轉(zhuǎn)換為在r軸的尺度與幅度變化,然后對(duì)Radon投影空間利用解析Fourier-Mellin變換進(jìn)一步變換,由此即可實(shí)現(xiàn)將Radon投影空間H方向的平移和r軸的尺度變化與幅度變化分別轉(zhuǎn)化為相位因子和幅度變化,最后即可通過定義一些具有旋轉(zhuǎn)與尺度不變性的函數(shù)提取步態(tài)特征,應(yīng)用分類算法實(shí)現(xiàn)分類識(shí)別。
圖3 f(x,y)的Radon變換
對(duì)于一個(gè)二維函數(shù)f(x,y),它的Radon變換就是該函數(shù)沿平面內(nèi)不同的直線的線積分,如圖3所示。其定義如下
對(duì)于圖像的幾何變換,Radon變換有以下性質(zhì):
1)平移性質(zhì)
2)旋轉(zhuǎn)性質(zhì)
3)尺度變換性質(zhì)
用極坐標(biāo)表示的情況下,二維函數(shù)g(r,θ)的解析Fourier-Mellin變換的定義式為
式中:s=σ-iu,u為實(shí)數(shù)變量,σ為大于0的實(shí)常數(shù),一般取值為0.5。因此式(5)可以寫為
本文對(duì)于步態(tài)的識(shí)別過程主要分為兩個(gè)步驟,首先是對(duì)視頻序列中檢測(cè)到的人體運(yùn)動(dòng)目標(biāo)進(jìn)行步態(tài)周期的檢測(cè)并得到一個(gè)步態(tài)周期的關(guān)鍵幀,其次是利用不變性特征函數(shù)對(duì)得到的關(guān)鍵幀提取不變性特征并用K近鄰分類算法對(duì)特征進(jìn)行分類識(shí)別。
根據(jù)人體寬度變化分析步態(tài)周期是一種相對(duì)簡(jiǎn)單的方法,人體下肢的寬度變化一般不會(huì)受到其他因素的影響,因此本文根據(jù)人體下肢區(qū)域?qū)挾葋?lái)分析步態(tài)周期。此處的下肢區(qū)域的高度指的是膝蓋到腳底的距離,這個(gè)距離既不會(huì)受到上肢的影響,也可以很好地反映步態(tài)周期的變化。需要說明的是,根據(jù)醫(yī)學(xué)對(duì)人體研究表明,膝蓋到腳底的高度約為人體高度的0.260倍,如圖4所示[13]。
在正常的行走狀態(tài)下,步態(tài)具有重復(fù)性,也就是說具有準(zhǔn)周期性。根據(jù)醫(yī)學(xué)上對(duì)步態(tài)周期的定義,如圖5所示,以右腳跟著地為起始點(diǎn),當(dāng)左腳跟著地時(shí)為半個(gè)周期,當(dāng)右腳跟再次著地時(shí)即為一個(gè)步態(tài)循環(huán)。因此,根據(jù)人體下肢的寬度變化就可以得到人體運(yùn)動(dòng)的周期。
圖5 人體步態(tài)周期分析
由于已采用上述方法檢測(cè)到了一個(gè)運(yùn)動(dòng)周期內(nèi)步態(tài)寬度的最大值和最小值,可以將這些極值幀作為關(guān)鍵幀,如果想得到更多的關(guān)鍵幀,可以在極值幀之間選取得到。
設(shè)圖像f(x,y)經(jīng)過尺度因子λ與角度旋轉(zhuǎn)φ變換后獲得的圖像為(x,y)表示,則由式(2)~式(4)可得(x,y)的Radon變換為
式中:P(r,θ)是函數(shù)f(x,y)的 Radon 變換。對(duì)P^(r,θ)進(jìn)行Fourier-Mellin變換后有
dr=λdτ ,dθ=dβ ,式(8)可變?yōu)?/p>
式中:M(u,k)為函數(shù)P(r,θ)的 Fourier-Mellin 變換。
由式(9)可以看出原圖像f(x,y)的旋轉(zhuǎn)和尺度變換經(jīng)過Radon變換和Fourier-Mellin變換后轉(zhuǎn)化為相位和幅度因子,由此可以定義函數(shù)
由式(9)和式(10)可得
由式(11)可知,函數(shù)Z(u,k)與原圖像的旋轉(zhuǎn)和尺度變換無(wú)關(guān),因此基于不變函數(shù)Z(u,k)提取旋轉(zhuǎn)和尺度變換后圖像的不變性特征如下
算法采用MATLAB2008編程進(jìn)行實(shí)驗(yàn)仿真。所采用的數(shù)據(jù)庫(kù)(CASIA步態(tài)數(shù)據(jù)庫(kù))是由中科院自動(dòng)化所提供,本實(shí)驗(yàn)從中分別選取了10個(gè)人和20個(gè)人,每個(gè)人有2個(gè)步態(tài)的視頻序列。每個(gè)人的一個(gè)步態(tài)視頻作為訓(xùn)練樣本,另一個(gè)作為測(cè)試樣本,分別采用Hu矩、Zernike矩和本文的不變矩進(jìn)行步態(tài)特征的提取和識(shí)別。此處本實(shí)驗(yàn)選取了1個(gè)步態(tài)周期內(nèi)的8幅關(guān)鍵幀圖像(如圖6所示)進(jìn)行步態(tài)特征的提取,其圖像和對(duì)應(yīng)的不變矩特征如表1~表3所示。
圖6 1個(gè)步態(tài)周期的關(guān)鍵幀圖像
表中F1,F(xiàn)2,…,F(xiàn)8表示圖6中從左至右每一個(gè)關(guān)鍵幀圖像,e,H,Z分別代表不同算法得到的矩特征。
表1 本文不變矩提取不變性特征得到的特征值
采用K近鄰算法分類得到的識(shí)別正確率如表4所示。由表4可以看出,在均采用K近鄰分類算法時(shí),本文提出的步態(tài)特征提取算法的分類能力較好,有效解決了目前基于不變矩的步態(tài)特征提取算法需要對(duì)灰度圖像進(jìn)行二值化和歸一化的問題,克服了目前方法僅能對(duì)二值圖像提取步態(tài)特征的不足,同時(shí),采用本文算法提取的步態(tài)特征的分類正確率遠(yuǎn)高于目前采用Hu矩和Zernike矩的方法,說明本文算法應(yīng)用于步態(tài)識(shí)別是可行且更有效的。
表2 Hu不變矩不變性特征得到的特征值
表3 Zernike不變矩不變性特征得到的特征值
表4 3種算法的分類正確率
本文提出了一種基于Radon變換和解析Fourier-Mellin變換的步態(tài)識(shí)別算法,該算法首先對(duì)灰度圖像進(jìn)行Radon變換,之后再進(jìn)一步進(jìn)行Fourier-Mellin變換,這樣就避免了目前基于不變矩的方法對(duì)灰度圖像二值化和歸一化時(shí)所造成的量化誤差和細(xì)節(jié)信息的丟失,因此,采用本文算法提取的特征更準(zhǔn)確地描述了步態(tài)信息,進(jìn)行步態(tài)識(shí)別有更高的識(shí)別率。但是,與目前成熟的指紋、虹膜等識(shí)別方法相比,本文算法的識(shí)別率還有待于進(jìn)一步提高,尤其是當(dāng)樣本數(shù)據(jù)增大時(shí),識(shí)別率也明顯下降,下一步工作的研究重點(diǎn)是將本文算法提取的特征與顏色、紋理、人耳或人臉等一種或多種特征融合以提高算法識(shí)別率,同時(shí)考慮采用快速Fourier變換來(lái)提高算法執(zhí)行效率,使本文算法最終達(dá)到實(shí)際應(yīng)用的目的。
[1] XU JH,WANGC,LIJ,etal.Gait recognition based on key frame and ellipticalmodel[C]//Proc.2010 IEEE International Conference on Information and Automation(ICIA).Harbin,China:IEEE Press,2010:2483-2487.
[2] HEW H,LIP.Gait recognition using the temporal information of leg angles[C]//Proc.2010 3rd IEEE International Conference on Computer Science and Information Technology.Chengdu,China:IEEE Press,2010:78-83.
[3] JEGOON R,KAMATA S.Front view gait recognition using spherical spacemodelwith human point clouds[C]//Proc.2011 18th IEEE International Conference on Image Processing.Brussels,Belgium:IEEE Press,2011:3209-3212.
[4] CHEN S,GAO Y X.An invariant appearance model for gait recognition[C]//Proc.2007 IEEE International Conference on Multimedia and Expo.Beijing,China:IEEE Press,2007:1375-1378.
[5] RAHATI S,MORAVEJIAN R,KAXEMI F M.Gait recognition using wavelet transform[C]//Proc.the Fifth InternationalConferenceon Information Technology:New Generations.Las Vegas,USA:[s.n.],2008:932-936.
[6]馬勤勇,聶棟棟,王申康.基于主運(yùn)動(dòng)輪廓線的步態(tài)表示與識(shí)別[J].自動(dòng)化學(xué)報(bào),2009,35(5):519-525.
[7]楊旗,薛定宇.動(dòng)靜態(tài)信息融合及動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的步態(tài)識(shí)別[J].中國(guó)圖象圖形學(xué)報(bào),2012,17(7):783-790.
[8]林敏,吳清江.基于統(tǒng)一Hu和支持向量機(jī)的步態(tài)識(shí)別[J].微計(jì)算機(jī)信息,2010,26(13):197-199.
[9]張前進(jìn),徐素莉,孫炎增.基于Radon變換特征提取的步態(tài)識(shí)別[J].數(shù)據(jù)采集與處理,2010,25(2):268-272.
[10] LU JW,ZHANG E H.Gait recognition for human identification based on ICA and fuzzy SVM throughmultiple views fusion[J].Pattern Recognition Letters,2007,28(16):2401-2411.
[11] XIAO D G,YANG L.Gait recognition using zernike moments and BP neural network[C]//Proc.2008 IEEE International Conference on Networking,Sensing and Control.Sanya, China:IEEE Press,2008:418-423.
[12] WANG X,XIAOB,MA JF,etal.Scaling and rotation invariantanalysis approach to object recognition based on radon and Fourier-Mellin transforms[J].Pattern Recognition,2007,40(12):3503-3508.
[13]蘇開娜,劉玉棟,馬麗.身份識(shí)別中步態(tài)特征的提?。跩].北京工業(yè)大學(xué)學(xué)報(bào),2005,31(4):388-393.