薛 傲 韓成順 張俊豪
(1 安徽公安職業(yè)學(xué)院刑事科學(xué)技術(shù)系 安徽 合肥 230088;2 東遼縣公安局交通管理大隊(duì)吉林 遼源 136600;3 鐵道警察學(xué)院圖像與網(wǎng)絡(luò)偵查系 河南 鄭州 450053)
基于動態(tài)足底壓力的步態(tài)識別方法具有易于隱蔽、便于偽裝和無需客體配合等優(yōu)點(diǎn),在刑事偵查、身份認(rèn)定、行人追蹤等公共安全領(lǐng)域具有廣泛的應(yīng)用前景[1],尤其在公安領(lǐng)域,傳統(tǒng)的刑事技術(shù)對于足跡的檢驗(yàn)經(jīng)驗(yàn)性過強(qiáng),沒有扎實(shí)的理論知識作為支撐,從而導(dǎo)致了足跡這一重要物證在司法鑒定中頗受爭議,因此尋找科學(xué)理論來支撐足跡鑒定非常必要。隨著計算機(jī)視覺和模式識別快速發(fā)展,有些學(xué)者開始研究足底壓力分布來進(jìn)行身份識別,足底壓力分布具有特定性和相對穩(wěn)定性,與人腳的行走方式與腳部生理結(jié)構(gòu)都有著非常高的關(guān)聯(lián)性[2-4],因而能滿足身份識別的需求。
基于足底壓力分布的生物識別技術(shù)出現(xiàn)在20世紀(jì)90年代,目前的研究還較少,通常是利用地面的反作用力(Ground Reaction Force,GRF)。人行走過程中作用于地面的壓力變化即為足底壓力圖像。生物醫(yī)學(xué)和法庭科學(xué)研究表明,通過人體運(yùn)動姿勢和地面壓力分布能夠進(jìn)行人身識別[5]。Gurney[6]等將腳底區(qū)域按照解剖學(xué)分為10個區(qū)域,考察每個區(qū)域的4個參數(shù):最大壓強(qiáng)、最大壓力、沖量和接觸時間、計算所有參數(shù)的組間相關(guān)系數(shù)和變異系數(shù),證實(shí)每個人的足底壓力具有重復(fù)性。高毅利用Footscan壓力分析系統(tǒng),定量的研究了不同時期的足底動力形態(tài)特征,足底與承受客體間作用方式和相互作用過程[7]。Takeda等運(yùn)用壓力地毯對人行走時足底壓力數(shù)據(jù)進(jìn)行采集,并將足底的后跟、足弓區(qū)、腳掌區(qū)和腳趾區(qū)分為8個區(qū)域進(jìn)行特征提取[8]。梁棟等對測試者赤腳靜止于壓力地板的足底壓力數(shù)據(jù)進(jìn)行采集,并實(shí)現(xiàn)自動劃分成6個部分,提取不同部分壓力中心點(diǎn)與最大壓力點(diǎn)的坐標(biāo)信息,并提取壓力值的拉普拉斯譜特征進(jìn)行人身識別[9]。本文基于動態(tài)壓力信息,由于足底壓力分布變化符合高斯分布,因此采用PCA進(jìn)行特征提取。
實(shí)驗(yàn)中從Footscan步態(tài)分析系統(tǒng)導(dǎo)出測試者的動態(tài)足底壓力數(shù)據(jù),得到包含各幀足底壓力數(shù)據(jù)的xls格式的文件,從xls文件中將足底動態(tài)變化過程中的每幀數(shù)據(jù)提取,并存儲成txt格式的文件,一個txt文件即對應(yīng)一幀足底壓力數(shù)據(jù)。將提取的每只足底的各幀壓力數(shù)據(jù)進(jìn)行重疊,記錄每個壓力傳感器獲得的最大壓力數(shù)據(jù),從而得到峰值壓力數(shù)據(jù)。由于數(shù)據(jù)采集的過程中,每個人對應(yīng)的足底尺碼不同,獲取的不同人峰值壓力數(shù)據(jù)維度各不相同,因此,需對足底壓力峰值數(shù)據(jù)進(jìn)行維度歸一化處理,得到相同維度的壓力峰值數(shù)據(jù)。
圖1為預(yù)處理后的壓力峰值數(shù)據(jù),從上至下依次為足跟、足弓、足掌壓力數(shù)值,矩陣中的每個數(shù)值分別表示壓力傳感器在足底運(yùn)動過程記錄的最大壓力值,即壓力峰值。
圖1 壓力峰值數(shù)據(jù)
主成分分析法(PCA)(又稱KL-變換)[10],是一種常見的運(yùn)用變量協(xié)方差矩陣來對數(shù)據(jù)進(jìn)行壓縮、處理及提取的方法。該方法是通過將多個變量進(jìn)行線性變換來提取較少的主要變量的一種基于多元統(tǒng)計分析的理論,其對于先前提出的所有變量,通過變換提取新變量,使提取的這些變量線性無關(guān),并且最大地保存原始信息。
PCA算法進(jìn)行特征提取過程:
步驟2:計算平均向量:
步驟3:計算差值向量:
用每個壓力數(shù)據(jù)減去平均壓力
步驟4:構(gòu)建協(xié)方差矩陣:
步驟5:運(yùn)用協(xié)方差矩陣求特征值與特征向量,建立特征空間。
在求解的過程中,計算量隨著協(xié)方差矩陣的維數(shù)增大也相應(yīng)增大,因此需要運(yùn)用奇異值分解定理(Singular Value Decomposition,SVD),先求得的特征向量及特征值,從而求得的特征向量及特征值。
通常a超過95%,就能很好的表達(dá)原始數(shù)據(jù)空間。
特征空間:選擇上述求得的 個特征向量構(gòu)建投影矩陣 ,將選取的訓(xùn)練樣本到矩陣獲得每個訓(xùn)練樣本的特征空間投影通過以上變換,便將 維的原始數(shù)據(jù)轉(zhuǎn)化成 維的數(shù)據(jù)。上述過程完成了對足底壓力數(shù)據(jù)的特征提取。
基于足底壓力分布的步態(tài)識別涉及多值分類。因此,本文在進(jìn)行分類識別時,運(yùn)用多分類支持向量機(jī)的方法。
在實(shí)際應(yīng)用中,大多為多分類問題,支持向量機(jī)(SVM)基礎(chǔ)理論僅適用于二值分類問題[11]。目前,將SVM基礎(chǔ)理論擴(kuò)展到處理多分類問題的方法主要有:一對一、一對多,其主要原理是通過構(gòu)建多個二分類器來解決多值分類問題。這兩種方法中,從構(gòu)建二分類器網(wǎng)絡(luò)方面來看,一對多的方法是先建立多個SVM模型,再求解決策函數(shù),給定的模式將會被分到擁有最大決策函數(shù)值的一類。一對一方法就是采用兩兩分類,它的主要原理是用個分類器對所有類別進(jìn)行兩兩匹配。通常N分類方法通過建立多個超平面來將每個類別與其他類別分離開來。也就是說,具有N個決策函數(shù)滿足公式所以可以將N分類問題看做一個判別向量,這樣分類的結(jié)果就是最大分量的指數(shù)。
為了簡化計算復(fù)雜度,在分類過程中,引入了核函數(shù),在進(jìn)行非線性問題到線性問題的轉(zhuǎn)換過程中,核函數(shù)起著非常大的作用,較為常用的SVM分類核函數(shù)包括:線性、多項(xiàng)式、徑向基和sigmoid核函數(shù),其中最為常用的是徑向基核函數(shù),該函數(shù)對于非線性分類問題效果較好,本文在實(shí)驗(yàn)中選取的是徑向基核函數(shù)。
(1)讀取實(shí)驗(yàn)數(shù)據(jù),其中包含訓(xùn)練樣本和測試樣本,訓(xùn)練樣本標(biāo)簽和測試樣本標(biāo)簽,分別對訓(xùn)練集和測試集數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)據(jù)歸一化到(0,1)范圍,以便于數(shù)據(jù)的運(yùn)算。
(2)設(shè)置核函數(shù)參數(shù)g和懲罰因子C的尋優(yōu)范圍,范圍均設(shè)定為(-210,210),選取底數(shù)為2的對數(shù)函數(shù)進(jìn)行網(wǎng)格劃分,共20個參數(shù)g和20個參數(shù)C進(jìn)行隨機(jī)組合。識別率初始值設(shè)定為0。
(3)每次選取一組參數(shù)組合進(jìn)行分類識別運(yùn)算,選取一對一多分類識別方法,在任意兩類樣本之間訓(xùn)練一個SVM分類器,對測試樣本進(jìn)行分類階段,測試樣本通過所有分類器進(jìn)行判定,當(dāng)某個分類器將測試樣本判定為某一類別時,則表示該類獲得一票,最終將測試樣本判定為得票數(shù)最多的一類。完成所有類別的測試樣本分類后,計算分類識別率,并將所獲得的分類識別結(jié)果與前一次結(jié)果進(jìn)行比較,保留識別率較高的結(jié)果。分類識別率計算公式:
其中:M為算法正確識別的測試樣本個數(shù);N為測試樣本的總個數(shù)。
重復(fù)(3)中步驟,繼續(xù)進(jìn)行運(yùn)算,直到獲得最高分類識別率。
步態(tài)數(shù)據(jù)采集由比利時研制的Footscan壓力地毯采集,該壓力地毯板面積為0.5m×0.5m,厚度為0.8cm,內(nèi)嵌4096個壓力傳感器,采樣頻率為300Hz。將壓力地毯放置在水平地面上,通過數(shù)據(jù)線與電腦上壓力數(shù)據(jù)采集系統(tǒng)連接起來,實(shí)驗(yàn)中選取50名健康青年人作為測試者,采集50名測試者赤腳狀態(tài)自然行走通過壓力地毯時的足底壓力數(shù)據(jù),每次讓一只腳踩在地毯上,左右腳分別踩一次為一組,每名測試者采集6組,通過壓力采集系統(tǒng)得到動態(tài)足底壓力數(shù)據(jù),從該系統(tǒng)中將數(shù)據(jù)導(dǎo)出,導(dǎo)出數(shù)據(jù)為xls格式,其中包含了足底壓力變化的所有幀數(shù)據(jù),圖1的數(shù)值即表示傳感器在人行走過程中采集到的壓力值,單位為N。本實(shí)驗(yàn)的數(shù)據(jù)預(yù)處理、特征提取、分類識別運(yùn)行環(huán)境均為MATLAB 2013a。
如圖2所示為壓力系統(tǒng)中記錄左腳的4幀動態(tài)壓力圖像,其中顏色由淺到深表示壓力值由小到大,并記錄該幀圖像發(fā)生的時刻。
圖2 動態(tài)足底壓力圖像
本實(shí)驗(yàn)采集了50個人正常行走狀態(tài)下的足底壓力數(shù)據(jù),每人采集6組,共300個樣本,實(shí)驗(yàn)中選取每個人的5組動態(tài)壓力數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),命名為1~5,共250組樣本。將每個人序號為1、2、3、4的壓力數(shù)據(jù)作為訓(xùn)練樣本,序號5的壓力數(shù)據(jù)作為測試樣本。首先,分別對每組樣本的動態(tài)壓力數(shù)據(jù)進(jìn)行疊加,通過計算機(jī)獲得足底壓力變化中每個傳感器達(dá)到的最大值,得到壓力峰值數(shù)據(jù),然后對壓力峰值數(shù)據(jù)進(jìn)行歸一化處理,獲得相同維度的數(shù)據(jù),最后利用PCA算法進(jìn)行特征提取,運(yùn)用一對一支持向量機(jī)(SVM)進(jìn)行分類識別,選取徑向基核函數(shù)作為SVM核函數(shù)。實(shí)驗(yàn)中在20人和50人的數(shù)據(jù)庫上分別對左右腳進(jìn)行測試。如表1所示,運(yùn)用測試者左腳數(shù)據(jù)進(jìn)行實(shí)驗(yàn),通過網(wǎng)格搜索法確定最優(yōu)的核函數(shù)參數(shù),20名和50名測試者的識別率為90%、90%。如表2所示,運(yùn)用測試者右腳數(shù)據(jù)進(jìn)行實(shí)驗(yàn),同樣方法獲得最優(yōu)核函數(shù)參數(shù),20名和50名測試者的識別率為80%,70%。
表1 左腳壓力峰值實(shí)驗(yàn)結(jié)果
表2 右腳峰值壓力實(shí)驗(yàn)結(jié)果
比較左腳和右腳識別率,運(yùn)用左腳壓力峰值數(shù)據(jù)進(jìn)行實(shí)驗(yàn)獲得的識別率高于右腳,分析原因主要為實(shí)驗(yàn)數(shù)據(jù)的采集,在實(shí)驗(yàn)數(shù)據(jù)的采集過程中由于壓力采集板長度為0.5m,每次只能采集一只腳的數(shù)據(jù),采集左腳數(shù)據(jù)過程中關(guān)注度高均為正常狀態(tài)下行走,右腳數(shù)據(jù)存在少量的非正常行走,沒有進(jìn)行剔除,導(dǎo)致了最終的分類識別率稍低。
本文采集并分析了動態(tài)足底壓力,用動態(tài)足底壓力來進(jìn)行人身識別,通過累加每幀動態(tài)足底壓力數(shù)據(jù)獲得壓力峰值數(shù)據(jù),對數(shù)據(jù)進(jìn)行歸一化處理后,運(yùn)用PCA提取壓力數(shù)據(jù)特征,采用一對一的SVM多分類方法對樣本進(jìn)行訓(xùn)練。采集50人的足底壓力數(shù)據(jù)作為實(shí)驗(yàn)樣本,實(shí)驗(yàn)中運(yùn)用足底壓力數(shù)據(jù)進(jìn)行測試,實(shí)驗(yàn)結(jié)果表明該方法性能較好,在公安、商業(yè)等領(lǐng)域具有很好的應(yīng)用前景。今后工作將在特征提取上開展更深入的研究,提取更加豐富、多樣的特征,使識別效果進(jìn)一步提升。后續(xù)還可能將數(shù)據(jù)采集擴(kuò)展到穿鞋行走的壓力采集,獲得更好的應(yīng)用價值。