向懷坤
(深圳職業(yè)技術(shù)學(xué)院,深圳 518055)
隨著“公交都市”建設(shè)的不斷深入,城市公共交通的調(diào)度管理信息化水平被賦予了更高的要求,而公交客流的自動(dòng)統(tǒng)計(jì)正是滿足這一要求的重要技術(shù)舉措。城市公交乘客人數(shù)統(tǒng)計(jì)成果不僅是衡量交通運(yùn)輸部門(mén)效率的一個(gè)關(guān)鍵標(biāo)準(zhǔn),也是交通運(yùn)輸服務(wù)部門(mén)制定計(jì)劃、安排行程和進(jìn)行預(yù)測(cè)的重要依據(jù)[1-3]。公交客流計(jì)數(shù)方法由傳統(tǒng)的人工計(jì)數(shù)發(fā)展到現(xiàn)在的自動(dòng)計(jì)數(shù),既降低了成本又提高了計(jì)數(shù)精度。調(diào)查表明,目前可用于公交客流自動(dòng)計(jì)數(shù)的方法主要包括:圖像處理技術(shù)、紅外監(jiān)測(cè)技術(shù)以及壓敏踏板檢測(cè)技術(shù)三種[4-10]。其中圖像處理技術(shù)的精度受光照及運(yùn)動(dòng)物體的影響較大,紅外監(jiān)測(cè)技術(shù)很難分辨多人同時(shí)上下車(chē)的情況,壓敏踏板檢測(cè)技術(shù)無(wú)法同時(shí)檢測(cè)多人上下車(chē)。這些技術(shù)由于均存在一定的局限性,因此在目前的公交客流信息管理中沒(méi)有得到廣泛應(yīng)用。本文提出并實(shí)驗(yàn)研究了一種基于人體運(yùn)動(dòng)學(xué)原理及譜系聚類(lèi)分析的接觸式傳感器陣列乘客計(jì)數(shù)方法,通過(guò)人體踩踏傳感器時(shí)獲取腳型信號(hào),將信號(hào)傳送到控制器進(jìn)行處理。此種方法可以涵蓋進(jìn)出車(chē)門(mén)的多種行為模式,實(shí)現(xiàn)乘客人數(shù)及其走向的實(shí)時(shí)辨別,可以較好地適應(yīng)我國(guó)城市公交客流統(tǒng)計(jì)的工作環(huán)境要求。
公交乘客腳型高靈敏度開(kāi)關(guān)式柵格陣列傳感器數(shù)據(jù)采集系統(tǒng)是筆者自主設(shè)計(jì)研發(fā)的一款接觸式公交客流采集系統(tǒng)[4]。該系統(tǒng)由前端客流傳感器單元、車(chē)載處理器單元和車(chē)載GPS/4G終端控制機(jī)三部分構(gòu)成。其中,前端客流傳感器單元即前、后門(mén)乘客上、下車(chē)傳感器檢測(cè)模塊,主要包括敏感元件、高強(qiáng)度玻璃纖維、傳感器陣列及相關(guān)輔件,核心任務(wù)是準(zhǔn)確采集乘客上、下車(chē)行為數(shù)據(jù),為了減輕后面的數(shù)據(jù)處理壓力,該單元內(nèi)嵌了基本的數(shù)據(jù)預(yù)處理模塊。車(chē)載處理器單元即數(shù)據(jù)處理模塊,由數(shù)據(jù)處理芯片及相關(guān)元器件組成,負(fù)責(zé)接收前端客流傳感器單元的數(shù)據(jù),并進(jìn)行乘客上、下車(chē)行為的檢測(cè)、分析、判別和客流量統(tǒng)計(jì)工作。車(chē)載GPS/4G終端控制機(jī)即數(shù)據(jù)通信及輔助數(shù)據(jù)處理模塊,主要是實(shí)現(xiàn)車(chē)載端與城市公共交通的調(diào)度管理中心之間的數(shù)據(jù)通信,其中GPS用于車(chē)輛定位,輔助開(kāi)展公交客流量分析。圖1給出了該公交客流數(shù)據(jù)采集及預(yù)處理系統(tǒng)的基本結(jié)構(gòu)。
圖1 公交客流數(shù)據(jù)采集及預(yù)處理系統(tǒng)構(gòu)成
在公交客流數(shù)據(jù)采集及預(yù)處理系統(tǒng)中,乘客上、下車(chē)的數(shù)據(jù)采集、數(shù)據(jù)處理方法是整個(gè)系統(tǒng)需要研究解決的關(guān)鍵技術(shù)問(wèn)題。其中包括腳型數(shù)據(jù)采集、腳型數(shù)據(jù)修訂、運(yùn)動(dòng)方向判別等數(shù)學(xué)模型與算法設(shè)計(jì),總體而言這些工作屬于計(jì)算機(jī)處理的內(nèi)容,為了準(zhǔn)確判別乘客上下車(chē)行為,本文提出根據(jù)人體運(yùn)動(dòng)學(xué)原理以及聚類(lèi)分析方法,來(lái)分析判定上下公交車(chē)門(mén)的乘客數(shù)量及其運(yùn)動(dòng)方向,從而達(dá)到客流計(jì)數(shù)的目的。
1.2.1 數(shù)據(jù)采集模型
通過(guò)前端客流傳感器單元[4],可以獲得腳型數(shù)據(jù)為一網(wǎng)格點(diǎn)陣(如圖2所示),腳型位置和大小取決于所占的網(wǎng)格坐標(biāo)以及網(wǎng)格數(shù)。以兩位數(shù)組G[line][col]表示每一個(gè)傳感器的網(wǎng)格陣列,總的行數(shù)由line表示,總的列數(shù)由col表示,其中每一個(gè)感知點(diǎn)j<col)表示第i行第j列的傳感器點(diǎn),可以將其稱(chēng)為觸點(diǎn)。如果某個(gè)觸點(diǎn)被踩下,則其數(shù)值置為數(shù)字0,如果該觸點(diǎn)未被踩下,其值置為數(shù)字1,對(duì)應(yīng)于圖2所示概念模型,即表示某觸點(diǎn)是否屬于所判斷圖像內(nèi)的點(diǎn)。
1.2.2 腳型數(shù)據(jù)存儲(chǔ)
當(dāng)乘客上、下車(chē)經(jīng)過(guò)客流傳感器單元時(shí),雙腳觸點(diǎn)會(huì)在傳感器上形成一系列的時(shí)序感知數(shù)據(jù)。一方面,這些感知數(shù)據(jù)會(huì)隨著接觸的時(shí)間而變化,另一方面,因接觸面的改變這些感知數(shù)據(jù)集的大小規(guī)模也會(huì)發(fā)生變化,整體上呈現(xiàn)出稀疏分布。本文在兼顧稀疏分布和時(shí)序分布兩個(gè)特征的基礎(chǔ)上,考慮到后期數(shù)據(jù)解譯的便利性,通過(guò)參考腳型運(yùn)動(dòng)規(guī)律和圖像柵格數(shù)據(jù)壓縮模式,提出基于RLE(行程長(zhǎng)度編碼)的數(shù)據(jù)存儲(chǔ)算法,具體實(shí)現(xiàn)是將腳型采樣數(shù)據(jù)存于數(shù)組G中,如果其中某數(shù)據(jù)項(xiàng)d在輸入流中連續(xù)出現(xiàn)n次,則以單個(gè)字符對(duì)nd替換n次出現(xiàn)者,這n個(gè)連續(xù)出現(xiàn)的數(shù)據(jù)項(xiàng)叫做游程 n,最后得到[1,n1,n0,n1…]系列數(shù)據(jù),由此解決了客流傳感器單元采集數(shù)據(jù)的存儲(chǔ)問(wèn)題。
圖2 腳型數(shù)據(jù)采集模型
1.2.3 腳型數(shù)據(jù)修訂
依次掃描方陣坐標(biāo)系中的每一行及每一列,并對(duì)所采集到的腳型數(shù)據(jù)陣列進(jìn)行行列數(shù)據(jù)修訂。具體修訂原則如下:
列掃描中,提取踩下點(diǎn)0開(kāi)始的網(wǎng)格位置坐標(biāo)(xi,yk)及 0結(jié)束的位置(xj,yk),存儲(chǔ)在數(shù)組P={(xi,xj)} (0<i,j<line)中,數(shù)組P中的每一個(gè)元素對(duì)應(yīng)一個(gè)連續(xù)0序列,并對(duì)相同列的連續(xù)0進(jìn)行分析,整合原則是針對(duì)同一列,若是(xi-xj)≤6,則將這點(diǎn)(xi,yk)與點(diǎn)(xj,yk)之間的所有觸點(diǎn)置零補(bǔ)齊。
同理,在行掃描中,提取踩下點(diǎn)0開(kāi)始的位置(xk,yi)及 0結(jié)束的位置(xk,yj),存儲(chǔ)在數(shù)組P={(yi,yj)} (0<i,j<col)中,數(shù)組P中的每一個(gè)元素對(duì)應(yīng)一個(gè)連續(xù)0序列,并對(duì)相同列的連續(xù)0進(jìn)行分析,整合原則是對(duì)同一列,若是(yi-yj)≤3,則將這點(diǎn)(xk,yi)與點(diǎn)(xk,yj)之間的所有觸點(diǎn)置零補(bǔ)齊。
數(shù)據(jù)修訂中所采用的6和3為經(jīng)驗(yàn)數(shù)據(jù),可根據(jù)不同的情況進(jìn)行修改,修訂前后的可視化對(duì)比結(jié)果如圖3所示。
圖3 腳型數(shù)據(jù)修訂前后結(jié)果對(duì)比
由人體運(yùn)動(dòng)學(xué)原理可知,對(duì)于正常人體的運(yùn)動(dòng)而言,其自身位置的移動(dòng)主要依靠腿和腳的前后左右交替輪回運(yùn)動(dòng),從而產(chǎn)生了人體位置的變化。在此過(guò)程中,身體的重心也在兩腿之間不斷轉(zhuǎn)換,由此表明人體的運(yùn)動(dòng)實(shí)際上是接受重心和移出重心的過(guò)程。從腿的角度可分為動(dòng)力腿和擺動(dòng)腿,從腳的角度可分為重心腳和非重心腳。當(dāng)身體前行時(shí),重心由重心腳(支撐腳)轉(zhuǎn)移到另一只腳(非承重腳),在此移出重心和接受重心的過(guò)程中,必定有一個(gè)很短暫的時(shí)間,讓無(wú)重心的腳抬離地面未做任何重心轉(zhuǎn)換[4-9]。
基于上述原理并經(jīng)過(guò)大量實(shí)際數(shù)據(jù)分析,我們對(duì)公交車(chē)乘客的上下車(chē)行為規(guī)律進(jìn)行了總結(jié),得出如下三類(lèi)基本的運(yùn)動(dòng)規(guī)律。
2.1.1 上下車(chē)人體的雙腳距離特征
人體的雙腳距離特征是指在人體靜態(tài)或運(yùn)動(dòng)過(guò)程中,人體的空間占有率決定一個(gè)人的兩腳之間必定擁有某一個(gè)空間距離,這是基于人體的基本構(gòu)成決定的?;谠摼嚯x特征進(jìn)行實(shí)測(cè)數(shù)據(jù)分析,可以較清晰準(zhǔn)確地獲取相應(yīng)的客流參數(shù)。
2.1.2 上下車(chē)腳型分離的時(shí)序特征
絕大部分情況下,對(duì)于上車(chē)或下車(chē)而言,乘客都是采用腳掌前端最后離地的運(yùn)動(dòng)模式,這一點(diǎn)在臺(tái)階上表現(xiàn)得最為明顯。由于上下車(chē)人體運(yùn)動(dòng)存在空間上的高度變化,與簡(jiǎn)單的平面位移具有較大的區(qū)別,這種運(yùn)動(dòng)特征可以有效地輔助對(duì)前后腳的運(yùn)動(dòng)時(shí)序進(jìn)行分離。
2.1.3 前后門(mén)上下車(chē)通道的時(shí)空特征
根據(jù)實(shí)測(cè)數(shù)據(jù)分析可知,多人同時(shí)上下車(chē)時(shí),需要綜合分析前后門(mén)通道的空間特征。前門(mén)通道一般較窄小,故在指定時(shí)間內(nèi)讓乘客優(yōu)先上車(chē)或下車(chē);后門(mén)通道一般較寬敞,可同時(shí)允許乘客上下車(chē)。無(wú)論是上車(chē)還是下車(chē),通道上的腳型方向及其時(shí)序都呈現(xiàn)出明顯的頻譜效應(yīng),這為多人同時(shí)上下車(chē)時(shí)的腳型判別提供了有效特征。
聚類(lèi)分析是多元統(tǒng)計(jì)分析的一種,也是非監(jiān)督模式識(shí)別的一個(gè)重要分支。它直接比較各事物之間的性質(zhì),將性質(zhì)相近的歸為一類(lèi),將性質(zhì)差別較大的歸入不同的類(lèi)。從實(shí)現(xiàn)方法上分,聚類(lèi)分析可大致分為四種類(lèi)型:譜系聚類(lèi)法、基于等價(jià)關(guān)系的聚類(lèi)方法、圖論聚類(lèi)法和基于目標(biāo)函數(shù)的聚類(lèi)方法等[7-8]。
在此給出聚類(lèi)分析的一般性原理。設(shè)X={x1,x2,…xn}是待聚類(lèi)分析對(duì)象的全體(稱(chēng)為論域),X中的每個(gè)對(duì)象(稱(chēng)為樣本)xk(k=1,2,…,n)常用有限個(gè)參數(shù)值來(lái)進(jìn)行刻畫(huà),每個(gè)參數(shù)值刻畫(huà)xk的某個(gè)特征。由此每個(gè)對(duì)象xk將伴隨一個(gè)向量P(xk)=(xk1,xk2,…,xks),其中xkj(j=1,2,…,s)是xk在第j個(gè)特征上的賦值,P(xk)稱(chēng)為xk的特征向量或模式矢量。聚類(lèi)分析就是分析論域X中的n個(gè)樣本所對(duì)應(yīng)的模式矢量間的相似性,按照各樣本的親疏關(guān)系把x1,x2,…,xn劃分成多個(gè)不相交的子集x1,x2,…,xc,并要求滿足下列條件:
樣本xk(1≤k≤n)對(duì)子集(類(lèi))Xi(1≤i≤c)的隸屬關(guān)系可用如下的隸屬函數(shù)表示為:
上式中,隸屬函數(shù)必須滿足條件μik∈Eh。換言之,要求每一個(gè)樣本能且只能隸屬于某一類(lèi),同時(shí)要求每個(gè)子集(類(lèi))都是非空的,這樣的聚類(lèi)分析為硬劃分。
在上述聚類(lèi)分析原理基礎(chǔ)上,本文采用聚類(lèi)分析中的譜系聚類(lèi)法進(jìn)行腳型分離,其主要思路是在一般聚類(lèi)分析流程基礎(chǔ)上,將模式樣本按距離準(zhǔn)則逐步聚類(lèi),類(lèi)別由少到多,直到滿足合適的分類(lèi)要求為止。
圖4是單腳踏過(guò)傳感器時(shí)的腳型變化分布圖像。圖幅長(zhǎng)23單位,寬30單位,選取所采集的3幀典型數(shù)據(jù)的圖像,分別是圖 4(a)、圖 4(b)和圖 4(c)。
圖4 單腳踏過(guò)傳感器時(shí)的腳型變化分布圖
腳型判別算法中,為識(shí)別出乘客上下車(chē)方向,將采集到的每一幀數(shù)據(jù)用矩形包圍起來(lái),并確定矩形的絕對(duì)腳頭方向,由此可通過(guò)最后一幀數(shù)據(jù)的矩形框離腳頭方向的遠(yuǎn)近來(lái)判定乘客的上下車(chē)方向。通過(guò)上下車(chē)所采集到的腳型圖像對(duì)比可知,若離腳頭方向近則判定為上車(chē),否則判定下車(chē)。
公交乘客在上下車(chē)時(shí),由于前門(mén)窄小,在指定的時(shí)間內(nèi),優(yōu)先下車(chē),再上車(chē),而后門(mén)相比之下較為寬敞,乘客一般可同時(shí)上下車(chē),要準(zhǔn)確判別出上下車(chē)的人數(shù),必須進(jìn)行多只腳的分離。根據(jù)人體雙腳基本構(gòu)成的分析可知人的雙腳之間的距離取決于人體在空間的占有率。調(diào)查發(fā)現(xiàn),約99%的乘客都符合這樣的雙腳距離原則。本文采用譜系聚類(lèi)法對(duì)踏板上的多只腳印進(jìn)行分類(lèi)識(shí)別。具體識(shí)別算法如下[4]:
通過(guò)依次掃描如圖2所示坐標(biāo)系中的每一列被感知數(shù)據(jù),找出列中連續(xù)的最左邊與最右邊,分別加以數(shù)據(jù)讀取標(biāo)記,再根據(jù)編輯確定腳印所在的列寬,將其記為一個(gè)腳印區(qū)域(夾在左右邊界之間的部分),同時(shí)根據(jù)腳印區(qū)域的個(gè)數(shù)來(lái)確定腳型的個(gè)數(shù),如圖5所示。其中,列連續(xù)是指圖形P的第j列與第j+1列都有點(diǎn)屬于P,則稱(chēng)第j列與第j+1列為列連續(xù)。確定腳型的過(guò)程是確定腳印所占區(qū)域的左右邊界的過(guò)程,該圖形時(shí)間占據(jù)了網(wǎng)格中的哪些具體的點(diǎn)并不重要。因此,對(duì)同一列上的點(diǎn)按位相或運(yùn)算,公式為,若 g值為真表示該列中有點(diǎn)屬于圖形區(qū)域P,為假則該列屬于空白區(qū)域。通過(guò)接觸數(shù)據(jù)集T(其值為0或1)與g的值,合并判斷腳印的左右邊界。當(dāng)g=0時(shí)T由1變?yōu)?,當(dāng)前列j為腳印P的左邊界則P.left_edge=j;當(dāng)g=1時(shí)T由0變?yōu)?,則前一列j-1為腳印P的右邊界,即 P.right_edge=j-1。
當(dāng)乘客腳型區(qū)域顯現(xiàn)時(shí),不同的腳之間會(huì)有一定的空白區(qū)域,據(jù)此可進(jìn)行腳型分離識(shí)別和方向判定。對(duì)于乘客腳型及上下車(chē)方向判定,有惟下幾種處理情況:
(1)單只腳?。焊鶕?jù)腳印的方向性直接進(jìn)行上下車(chē)人數(shù)累加。
(2)兩只腳?。焊鶕?jù)人體運(yùn)動(dòng)學(xué)原理以及同一個(gè)人的雙腳距離原則,若是同一個(gè)人的兩只腳,則兩個(gè)腳印之間的空白區(qū)域長(zhǎng)度Length<15,即將這兩個(gè)腳印判定為一個(gè)人的上下車(chē);若是兩個(gè)腳印之間的空白區(qū)域長(zhǎng)度Length>15,同方向腳印則累計(jì)2人次,若是異方向腳印則上下人次各累計(jì)1人;
(3)對(duì)于多于兩個(gè)腳印的情況,將兩腳之間的空白區(qū)域長(zhǎng)度Length<10的兩個(gè)腳印歸為一類(lèi),其余的腳印則歸為另一類(lèi),并根據(jù)方向判定方法進(jìn)行上下人次累加,如圖6所示。
圖5 一只腳判別模型
圖6 兩只腳和三只腳判別模型
由聚類(lèi)判定可知:圖 6(a)為 1 人;圖 6(b)為 2 人;再根據(jù)方向判定方法進(jìn)行上下車(chē)人數(shù)累加。從而解決客流量統(tǒng)計(jì)問(wèn)題。
為驗(yàn)證系統(tǒng)性能,選擇了深圳市101路、226路和382路三條公交線路部分連續(xù)站點(diǎn),進(jìn)行早(7:30開(kāi)始)、中(14:30開(kāi)始)、晚(17:30開(kāi)始)三個(gè)時(shí)段跟車(chē)對(duì)前、后門(mén)上、下車(chē)乘客數(shù)統(tǒng)計(jì)情況進(jìn)行對(duì)比實(shí)驗(yàn)。每一臺(tái)公交車(chē)5人參與實(shí)驗(yàn),其中3人負(fù)責(zé)安裝設(shè)備、看管電腦和現(xiàn)場(chǎng)維護(hù),另外2人分別手持錄像機(jī)記錄前、后車(chē)門(mén)的上下乘客信息,連續(xù)跟車(chē)3天完成3條公交線路測(cè)試,單程最大樣本數(shù)146人,全部測(cè)試樣本數(shù)1829人。
表1、表2、表3分別顯示了上述3條公交線路在早、中、晚三個(gè)時(shí)段的實(shí)驗(yàn)對(duì)比結(jié)果,每條線路又分為單向和雙向兩種情況進(jìn)行準(zhǔn)確率對(duì)比。準(zhǔn)確率的計(jì)算公式為:λ=(1-|(pa-ps)|/ps)×100%,其中λ表示準(zhǔn)確率(%),pa表示實(shí)驗(yàn)設(shè)備的統(tǒng)計(jì)值(人),ps表示人工統(tǒng)計(jì)的真實(shí)值(人)。由三張表可以看出,早上和晚上觀測(cè)時(shí)段的客流量比中午大,表明早晚存在高峰客流量;早上客流統(tǒng)計(jì)準(zhǔn)確率最低為90.19%,中午最低為91.75%,晚上最低為90.05%,準(zhǔn)確率總體上不低于90%;相比之下中午的客流統(tǒng)計(jì)準(zhǔn)確率整體最好,這表明早晚高峰期客流對(duì)統(tǒng)計(jì)精度有較大的影響;整體而言,單程的統(tǒng)計(jì)準(zhǔn)確率低于雙向統(tǒng)計(jì)準(zhǔn)確率,這表明統(tǒng)計(jì)過(guò)程中的誤差呈現(xiàn)出隨機(jī)性分布,雙向疊加導(dǎo)致準(zhǔn)確率反而上升了,這需要在后期的研究中加以重視;另外,從實(shí)驗(yàn)結(jié)果還可以看出,該統(tǒng)計(jì)方法的準(zhǔn)確率沒(méi)有出現(xiàn)大的波動(dòng),在一定的時(shí)段內(nèi)處于相對(duì)穩(wěn)定的狀態(tài)。
表1 早上(7:30開(kāi)始)實(shí)驗(yàn)結(jié)果分析表
表2 中午(14:30開(kāi)始)實(shí)驗(yàn)結(jié)果分析表
表3 晚上(17:30開(kāi)始)實(shí)驗(yàn)結(jié)果分析表
本文重點(diǎn)研究了基于腳型傳感器系統(tǒng)在數(shù)據(jù)采集、存儲(chǔ),以及腳型識(shí)別和客流統(tǒng)計(jì)所涉及的一些關(guān)鍵算法問(wèn)題,具有以下兩方面的特點(diǎn):①在采用行程長(zhǎng)度編碼壓縮采樣數(shù)據(jù)基礎(chǔ)上,根據(jù)人體運(yùn)動(dòng)學(xué)原理對(duì)腳型數(shù)據(jù)陣列進(jìn)行了行列數(shù)據(jù)修訂,為后續(xù)的乘客是上車(chē)還是下車(chē)以及是幾個(gè)上下車(chē)的判別奠定了基礎(chǔ);②在公交乘客上下車(chē)的三類(lèi)人體運(yùn)動(dòng)學(xué)特征基礎(chǔ)上設(shè)計(jì)了基于聚類(lèi)分析法的客流量判別與統(tǒng)計(jì)算法,實(shí)現(xiàn)了對(duì)乘客上下車(chē)方向的智能化判定和客流量統(tǒng)計(jì)。對(duì)比分析表明,本文研究成果在公交客流統(tǒng)計(jì)的準(zhǔn)確率和穩(wěn)定性方面有較好的改進(jìn),具有一定的應(yīng)用價(jià)值。