喬勝男,朱玉婷
(中國刑事警察學(xué)院,遼寧 沈陽 110035)
運(yùn)用赤足跡多元回歸分析同質(zhì)人群身高
喬勝男,朱玉婷
(中國刑事警察學(xué)院,遼寧 沈陽 110035)
通過選取相同地區(qū)、不同年齡、不同性別的120份赤足跡樣本,分別對(duì)跟壓后緣凸點(diǎn)到五趾前緣凸點(diǎn)的距離、跟壓后緣凸點(diǎn)到前掌內(nèi)外側(cè)凸點(diǎn)的距離進(jìn)行測(cè)量,使用SPSS統(tǒng)計(jì)分析軟件對(duì)數(shù)據(jù)進(jìn)行多元回歸分析和逐步回歸分析,發(fā)現(xiàn)七個(gè)距離與身高之間存在線性相關(guān)關(guān)系,建立相應(yīng)的數(shù)學(xué)模型并得出回歸方程,比較模型之間的誤判率和準(zhǔn)確度,為利用足跡分析同質(zhì)人群身高提供更可靠有力的方法。
赤足跡;同質(zhì)人群;身高分析;多元回歸
傳統(tǒng)分析身高的方法基于足長(zhǎng)[1]這一單一元素分析,該方法簡(jiǎn)單但是也存在自身的局限性,不能涵蓋不同種族、不同地域、不同生活環(huán)境等客觀差異對(duì)身高的影響。本文通過對(duì)同一地區(qū)人群的足跡進(jìn)行采集并掃描入庫,使用數(shù)碼分規(guī)測(cè)量統(tǒng)計(jì)跟壓后緣凸點(diǎn)到五趾前緣凸點(diǎn)的距離、跟壓后緣凸點(diǎn)到前掌內(nèi)外側(cè)凸點(diǎn)的距離七個(gè)長(zhǎng)度,分析同一地區(qū)這七個(gè)距離與身高之間的相關(guān)性,得出相應(yīng)的回歸方程,為根據(jù)足跡推算身高提供新方法。
(一)實(shí)驗(yàn)數(shù)據(jù)的收集
通過測(cè)量來自同一省份、不同性別、不同年齡的健康人群140名,且足部健康無任何疾病。借助油墨捺印盒,遵循羅賓斯采集足跡步驟[2]對(duì)實(shí)驗(yàn)者左右足都進(jìn)行采集。并將這些樣本掃描入庫,剔除采集質(zhì)量較差的足跡樣本,最終選取較好的足跡樣本共計(jì)120份。在身高測(cè)量時(shí)實(shí)驗(yàn)者光腳靠墻站立且手懸空下垂,是頭部定點(diǎn)(在法蘭克福水平面[3])與地板的垂直距離,用標(biāo)準(zhǔn)計(jì)量方式標(biāo)記測(cè)量。
(二)實(shí)驗(yàn)數(shù)據(jù)的選取
為了使得測(cè)量的數(shù)據(jù)更加準(zhǔn)確,基于易于發(fā)現(xiàn)便于測(cè)量的原則,對(duì)捺印的足跡樣本選擇了跟壓后緣凸點(diǎn)到五趾前緣凸點(diǎn)的距離、前掌寬、后跟寬、跟壓后緣凸點(diǎn)到前掌內(nèi)外側(cè)凸點(diǎn)的距離。考慮到現(xiàn)場(chǎng)出現(xiàn)的足跡,不論清晰的或模糊的,跟壓后緣和五趾壓前緣出現(xiàn)率比較高,提出后跟的寬度較難測(cè)定,本實(shí)驗(yàn)最終選取的足跡特征點(diǎn)是五趾前緣凸點(diǎn)分別為A、B、C、D、E;跟壓后緣凸點(diǎn)為O點(diǎn),前掌內(nèi)外側(cè)凸點(diǎn)為M、N點(diǎn);(見圖1),分析足長(zhǎng)測(cè)量使用的數(shù)據(jù)分別是:
1.跟壓后緣凸點(diǎn)到拇趾前緣凸點(diǎn)的距離為L(zhǎng)OA;
2.跟壓后緣凸點(diǎn)到第二趾前緣凸點(diǎn)的距離為L(zhǎng)OB;
3.跟壓后緣凸點(diǎn)到第三趾前緣凸點(diǎn)的距離為L(zhǎng)OC;
圖1 足跡測(cè)量圖
4.跟壓后緣凸點(diǎn)到第四趾前緣凸點(diǎn)的距離為L(zhǎng)OD;
5.跟壓后緣凸點(diǎn)到第五趾前緣凸點(diǎn)的距離為L(zhǎng)OE
6.跟壓后緣凸點(diǎn)到前掌內(nèi)外側(cè)凸點(diǎn)的距離為L(zhǎng)OM;
7.跟壓后緣凸點(diǎn)到前掌內(nèi)外側(cè)凸點(diǎn)的距離為L(zhǎng)ON;
使用數(shù)碼分規(guī)將以上七個(gè)長(zhǎng)度一一進(jìn)行測(cè)量并記錄下來,由數(shù)據(jù)可以看出足長(zhǎng)與身高之間的大致關(guān)系。
(一)數(shù)據(jù)錄入EXCEL表格并進(jìn)行預(yù)處理
使用EXCEL表格對(duì)數(shù)據(jù)進(jìn)行預(yù)處理分析并畫出散點(diǎn)圖,(見圖2-1、圖2-2),目的是為了查看輸入錯(cuò)誤,對(duì)分析結(jié)果造成影響,及時(shí)對(duì)數(shù)據(jù)進(jìn)行分析與修正,快速排除特異點(diǎn)。
從散點(diǎn)圖可以看出左右腳的七個(gè)距離長(zhǎng)度與身高具有很高的相關(guān)性,并且這七個(gè)變量與身高之間可能存在線性相關(guān),使用SPSS軟件對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的分析驗(yàn)證。
圖2-1 左腳各測(cè)量值與身高之間的散點(diǎn)圖
(二)利用SPSS數(shù)理統(tǒng)計(jì)軟件對(duì)數(shù)據(jù)進(jìn)行顯著性檢驗(yàn)分析
在使用SPSS軟件對(duì)數(shù)據(jù)進(jìn)行分析時(shí),為了便于觀察將使用x1表示OA,x2表示OB,x3表示OC,x4表示OD,x5表示OE,x6表示OM,X7表示ON。
表1 多個(gè)測(cè)量值與身高之間的相關(guān)性分析
從表格1中可以看出x1與x2、x3、x4、x5、x6、x7的相關(guān)性系數(shù)分別為0.930、0.904、0.824、0.743、0.142、0.585;x2 與 x3、x4、x5、x6、x7的相關(guān)性系數(shù)分別為0.974、0.924、0.871、-0.103、0.568;;x3 與 x4、x5、x6、x7的相關(guān)性系數(shù)分別為0.964、0.905、-0.190、0.557;x4與x5、x6、x7的相關(guān)性系數(shù)分別為0.949、-0.358、0.511;x5與x6、x7的相關(guān)性系數(shù)分別為-0.487、0.445;x6與x7的相關(guān)性系數(shù)為0.111;Pearson相關(guān)系數(shù)反映相關(guān)性的強(qiáng)弱,該表格反映的數(shù)據(jù)可以說明足長(zhǎng)與X1、x2、x3、x4、x5、x7是具有較高的相關(guān)性,與x6的相關(guān)性較弱。在以下的試驗(yàn)中需要去除前掌內(nèi)緣凸點(diǎn)到跟后緣凸點(diǎn)的距離這一變量,其他的變量之間具有較高相關(guān)性。
(三)多元回歸模型分析
在相關(guān)性較高的變量和身高之間,使用多元回歸模型分析身高。在建立模型的時(shí)候,應(yīng)該對(duì)變量進(jìn)行篩選,這就需要根據(jù)某個(gè)變量t值大小來確定,將不顯著的變量剔除。本實(shí)驗(yàn)過程中使用多元逐步回歸分析的方法對(duì)變量進(jìn)行選擇,見表2。
表2 左腳模型匯總
在模型1中,進(jìn)入模型的自變量是X1,多元相關(guān)系數(shù)為0.639;在模型2中,進(jìn)入模型的自變量是x1和x7,在系數(shù)上標(biāo)注a和b代表的是進(jìn)入模型相關(guān)系數(shù)對(duì)應(yīng)的自變量,調(diào)整的系數(shù)R2數(shù)據(jù)較大代表模型效果比較好,在模型1和模型2之間的比較后發(fā)現(xiàn)模型1的效果較好于模型,標(biāo)準(zhǔn)估計(jì)的誤差約為5.03。
表3 兩個(gè)回歸模型的整體顯著性檢驗(yàn)
表格3為兩個(gè)回歸模型的整體顯著性檢驗(yàn)。由表3可知兩個(gè)模型的標(biāo)準(zhǔn)差均為0.000<0.01,兩個(gè)模型的F值分別為78.608和32.468,模型整體顯著性檢驗(yàn)F值均已達(dá)到顯著性水平,每個(gè)模型模型中的變量解釋能力均達(dá)到顯著性水平,即兩個(gè)模型的變量系數(shù)不為零,兩個(gè)模型中各個(gè)變量來解釋身高是有意義的。
表4 模型參數(shù)及檢驗(yàn)結(jié)果
表格4給出了身高與變量之間關(guān)系的系數(shù),結(jié)合模型檢驗(yàn)結(jié)果可以得出最佳的模型應(yīng)該是模型1,即身高S=100.627+3.06*x1,轉(zhuǎn)化到測(cè)量的變量上就是身高S=100.627+3.06*(足跟后緣凸點(diǎn)到拇趾前緣凸點(diǎn)的距離)。在逐步回歸分析過程中,剔除了其他六個(gè)對(duì)模型的貢獻(xiàn)率不高的變量。
(四)線性回歸模型分析
使用SPSS統(tǒng)計(jì)分析軟件中的回歸分析功能,建立各變量與足長(zhǎng)之間的系數(shù)方程并進(jìn)行系數(shù)評(píng)價(jià)與比較,見表格5。從表格5可以看出,最佳的線性回歸模型就是S=101.578+3.019*x1,相比較其他公式,該公式的標(biāo)準(zhǔn)誤差最小。
表5 線性回歸模型建立表
將上述的實(shí)驗(yàn)結(jié)果進(jìn)行驗(yàn)證,左腳的變量所得的模型均與X1有關(guān),根據(jù)回歸
分析中的逐步回歸模型建立的方程式是身高S=100.627+3.06*(足跟后緣凸點(diǎn)到拇趾前緣凸點(diǎn)的距離),標(biāo)準(zhǔn)誤差較低;而使用線性回歸分析模型建立的方程式是身高S=101.578+3.019*(足跟后緣凸點(diǎn)到拇趾前緣凸點(diǎn)的距離),二者使用的原理不同,得出的實(shí)驗(yàn)結(jié)論有一定的差異性,接下來將從庫中抽樣100余份驗(yàn)證二者的身高估計(jì)值與實(shí)際身高的誤差,以及誤差在一定區(qū)間的數(shù)據(jù)占樣本總數(shù)的百分比。見表格6。
表格6 不同誤差范圍與百分比的統(tǒng)計(jì)結(jié)果
經(jīng)上述分析比較發(fā)現(xiàn),使用第一個(gè)模型即使用逐步回歸方法得出的效果較好一些,出錯(cuò)率相比較低,說明使用逐步回歸得出的回歸模型:身高=100.627+3.06*(足跟后緣凸點(diǎn)到拇趾前緣凸點(diǎn)的距離)推算身高的效果較好一些。在結(jié)果評(píng)價(jià)過程中將同一地區(qū)的足跡抽樣檢測(cè)發(fā)現(xiàn),逐步回歸模型建立的回歸方程效果接近于真實(shí)身高值。
在實(shí)驗(yàn)過程中考慮到人的生活環(huán)境、種族、地域等條件的影響因素,本實(shí)驗(yàn)基于120份樣本研究同質(zhì)人群、同省份、不同年齡、不同性別的油墨捺印足跡作為研究對(duì)象,通過統(tǒng)計(jì)軟件分析各個(gè)測(cè)量值與身高之間的關(guān)系并建立回歸方程,在一定程度上可以為分析推算身高提供較為量化的依據(jù)。根據(jù)結(jié)果統(tǒng)計(jì)評(píng)價(jià)的結(jié)果顯示,使用該方法測(cè)量足長(zhǎng)推算身高在小范圍的有比較高的準(zhǔn)確度。
該實(shí)驗(yàn)存在的誤差來源分析主要是提取的都是警校大學(xué)生的足跡,取樣范圍相對(duì)較狹窄。雖提取的樣本是不同年齡,但是年齡的分布均集中在17歲至30歲之間,對(duì)于中老年人的同質(zhì)人群足跡還并未進(jìn)行統(tǒng)計(jì)測(cè)量,所以目前系統(tǒng)誤差會(huì)受到一定的客觀制約。
[1]史力民.足跡學(xué)[M].北京:中國人民公安大學(xué)出版社,2007.
[2]Robbins LM.Footprints collection,analysis and interpretation.Springfield,IL: Charles C. Thomas,1985.
[3]Irene Atef Fawzy,Nashwa Nabil Kamal. Stature and Body Weight Estimation from Various F ootprint Measurements Among Egyptian Population [J]. Forensic Sic,2010,55(4):884-888.
[4]賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].北京:中國人民公安大學(xué)出版社,20014.
Measure the Bare Footprint Though Using Multiple Regression Method to Analyze Homogeneous Population Height
QIAN Sheng-nan
(National Police University of China,Liaoning,Shenyang,110035)
By selecting 120 bare footprint samples the same areas,different ages and gender,measured respectively the distance of trailing edge pressure bumps to five toe front convex point and the distance of trailing edge pressure bumps into the ball inside and outside convex point.Using SPSS statistical analysis software for data to carry on the multiple regression analysis and stepwise regression analysis,finding there are linear relationship between the seven distance and height,set up corresponding mathematical model and obtained the regression equation,and compared the difference between misjudgment rate and accuracy rate.This is a more reliable and powerful method for using footprint analysis homogeneous population height.
bare footprint; homogeneous groups; analysis height; multiple regression
天下溪)
D918.91
A
2095-1140(2017)05-0033-04
2017-06-21
公安部2016年科技強(qiáng)警基礎(chǔ)工作專項(xiàng)項(xiàng)目“足跡步態(tài)特征的生物力學(xué)基礎(chǔ)研究”(2016GABJCD)
喬勝男(1992- ),女,河南靈寶人,中國刑事警察學(xué)院2015級(jí)痕跡檢驗(yàn)專業(yè)碩士研究生,主要從事痕跡檢驗(yàn)足跡研究;朱玉婷(1991- ),女,重慶人,中國刑事警察學(xué)院2015級(jí)痕跡檢驗(yàn)專業(yè)碩士研究生,主要從事痕跡檢驗(yàn)足跡研究。
湖南警察學(xué)院學(xué)報(bào)2017年5期