李宏勝 孔慧慧 康玉芳
(1.南京工程學(xué)院自動化學(xué)院,211167,南京; 2.江蘇省常熟職業(yè)教育中心校,215500,常熟;3.國網(wǎng)安微省電力有限公司宣城供電公司,242000,宣城//第一作者,教授)
通行邏輯是地鐵車站閘機系統(tǒng)的關(guān)鍵技術(shù)。多年來,國內(nèi)外許多研究人員一直致力于閘機通行特征識別與通行邏輯相關(guān)技術(shù)的研究。但是,由于閘機通行邏輯的設(shè)計受閘機通道長度、傳感器的數(shù)量和布置,以及乘客的通行速度、攜帶物、衣著等影響,因此難以找到確切的事件識別邏輯方法。這正是閘機系統(tǒng)通行邏輯判斷的難點所在。
本文采用通行特征識別方法:將傳感器信號通行序列轉(zhuǎn)換為元素為0或1的特征矩陣,如果將每一個特征矩陣的元素看作是圖像的像素,則特征矩陣可以看作是一幅黑白二值圖像;通過雙線性插值對矩陣進行縮放處理,將所采集的樣本圖像縮放為標準的16×16矩陣,則特征矩陣可以看作是一幅黑白灰度圖像?;谶@一思路,常見的機器學(xué)習(xí)(例如典型的MINST字符圖像分類識別)圖像分類方法與思路即可用于通行合法與非法的二分類識別。本文首先采用上述原理將通行過程轉(zhuǎn)換為標準大小的特征矩陣,然后采用BP(反向傳播)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)進行合法通行以及非法通行的傳感器數(shù)據(jù)識別和分類。
樣本和標記的選取對神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效果起著重要的作用,因此所選取的樣本應(yīng)盡可能全面反應(yīng)閘機的各種合法與非法通行狀況。在研究前期,通過建立閘機、傳感器、乘客模型以及乘客攜帶物品模型,搭建了乘客通過閘機的虛擬仿真系統(tǒng)。該仿真系統(tǒng)可以模擬乘客身高、體重,以及乘客是否攜帶行李、乘客是否尾隨及尾隨距離等各種情況下的通行狀況。通過該仿真系統(tǒng),可以方便獲取大量的通行數(shù)據(jù),作為現(xiàn)場采集的乘客通過閘機數(shù)據(jù)的補充。
閘機通行情況比較復(fù)雜,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本應(yīng)盡可能覆蓋各種通行情況。乘客在地鐵車站通過閘機的各類情況描述如表1~2所示。
表1 乘客通過閘機案例采集——正常通行
表2 乘客通過閘機案例采集——根據(jù)距離判斷
閘機通道內(nèi)安裝有16個對射穿透光束傳感器,其發(fā)射器和接收器位于閘機通道兩側(cè),當乘客通行時,發(fā)射端發(fā)射向接收端的紅外線會被切斷,接收端會因此產(chǎn)生輸出信號的變化。閘機控制系統(tǒng)定時采集16個傳感器的信號,在沒有檢測到目標物體時,傳感器輸出信號為0,當檢測到任何人或任何物遮擋時,傳感器輸出信號為1。矩陣圖1~3為采集的單人、單人背包、雙人之間有間隔3種通過閘機情況下的矩陣序列。乘客通過閘機行走速度不同,所需時間也不同,由此矩陣行數(shù)也會不同。將矩陣的元素看做圖像的像素,得到對應(yīng)的如圖4~6所示的傳感器遮擋序列圖。其中:“●”表示傳感器信號被遮擋,對應(yīng)矩陣元素為1;“○”表示傳感器信號未被遮擋,對應(yīng)矩陣元素為0。
圖1 單人通過閘機通行信號矩陣
圖2 單人背書包通過閘機通行信號矩陣
如圖4所示,測試單人乘客以較快速度通過閘機通道時,傳感器遮擋圖近似為1條直線,乘客在閘機通道內(nèi)可被視為1個運動個體。如圖5所示,背包相對于乘客呈靜止狀態(tài),因此背包乘客在閘機通道內(nèi)也可被視為1個運動個體。如圖6所示,兩名乘客相距一定距離通過閘機時,傳感器遮擋圖近似為2條直線,兩名乘客在閘機通道內(nèi)可被視為2個運動個體。
圖3 雙人通過閘機通行信號矩陣
圖4 單人通過閘機被遮擋信號矩陣
圖5 單人背書包通過閘機被遮擋信號矩陣
圖6 雙人通過閘機被遮擋信號矩陣
實際上,閘機通行的合法性判斷可以被看作是對類似圖4~6圖像的特征識別和分類。由于乘客通過閘機的行走速度不同,傳感器信號采集所形成的二值矩陣的列數(shù)不變,但行數(shù)不同,因此需要對閘機通行信號矩陣作標準化處理。
雙線性插值的原理是:插值點像素值取在其鄰域4個像素點在2個方向上的線性內(nèi)插,即通過加權(quán)平均來確定待插值點像素值,權(quán)重大小由待插值點距離其4個鄰域點的距離來確定[7]。
乘客通過閘機的熟練程度、是否攜帶行李以及持卡方式都會影響乘客通過閘機的時間。由于閘機邏輯控制板的采樣頻率一定,如果乘客通過閘機的速度很慢,則采集到的傳感器數(shù)據(jù)相對就多;反之,如果乘客通過閘機的速度很快,則采集到的傳感器數(shù)據(jù)相對就少。因此,每次采集的傳感器信號矩陣所有元素均為0或1,但矩陣的行數(shù)不同。為便于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),通過雙線性插值法處理,將傳感器信號矩陣的行數(shù)進行縮放,生成一致的16×16矩陣,如圖7~9所示。雙線性插值法處理后,閘機通行信號矩陣不再是0和1的二值化像素矩陣,而是一個取值范圍為[0,1]之間的灰度像素矩陣。圖10~12為圖4~6經(jīng)過雙線性插值法處理之后得到的灰度化的圖像。
圖7 單人通過閘機通行信號16×16矩陣
圖8 單人背書包通過閘機通行信號16×16矩陣
圖9 雙人通過閘機通行信號16×16矩陣
圖10 單人通過閘機通行信號灰度化圖像
圖11 單人背書包通過閘機通行信號灰度化圖像
圖12 雙人通過閘機通行信號灰度化圖像
人體運動行為識別作為人工智能和智能家居領(lǐng)域研究的一部分,一直以來備受關(guān)注[8]。人體行走運動過程比較復(fù)雜,主要是腿圍繞臀部的轉(zhuǎn)動帶動人的身體進行平移,是一個循環(huán)的、帶有周期性的運動。乘客的身高體重、衣著,以及是否攜帶行李、進入閘機的行為動作、是否雙人通過等都會增加閘機通行邏輯設(shè)計的復(fù)雜性。由于乘客通過閘機的過程具有波動性,且很多影響因素無法量化,具有明顯的非線性特征,因此很難直接找出符合其通行過程的確切邏輯或函數(shù)。神經(jīng)網(wǎng)絡(luò)具有較強的自適應(yīng)能力、自學(xué)習(xí)能力和對非線性函數(shù)的逼近能力,可以描述非線性映射并建立系統(tǒng)模型[9]。神經(jīng)網(wǎng)絡(luò)通過對乘客合法通行以及非法通行的大量樣本的學(xué)習(xí),可以根據(jù)相關(guān)數(shù)據(jù)自動進行有效特征提取,從而找出隱含的乘客合法通行以及非法通行對傳感器信號影響的邏輯規(guī)律。
本研究共采集2 164組通行數(shù)據(jù)樣本,其中正常合法通行傳感器信號有1 064組,設(shè)置訓(xùn)練標簽為1;非正常非法通行的傳感器信號有1 000組,設(shè)置訓(xùn)練標簽為0。數(shù)據(jù)樣本中訓(xùn)練樣本為1 514組,驗證集和測試集均為325組。
所采用BP神經(jīng)網(wǎng)絡(luò)模型參數(shù)(包括模型結(jié)構(gòu)、傳遞函數(shù)、網(wǎng)絡(luò)訓(xùn)練參數(shù))[10],將16×16的像素矩陣展開為一行256個輸入,則每個樣本有256維的特征向量作為神經(jīng)網(wǎng)絡(luò)的輸入層。同時,每一個學(xué)習(xí)樣本有對應(yīng)的label(標簽)標注信息,將合法通行的狀況對應(yīng)位置的值設(shè)為1,非法通行的狀況對應(yīng)位置的值設(shè)為0,標注信息則為一個1×1的特征向量。因此,BP神經(jīng)網(wǎng)絡(luò)的輸入層節(jié)點數(shù)為256,輸出層的節(jié)點數(shù)為1。
設(shè)計采用2層前饋神經(jīng)網(wǎng)絡(luò),使用帶有Sigmod函數(shù)的隱藏神經(jīng)元和非線性輸出神經(jīng)元(Softmax)。根據(jù)經(jīng)驗公式以及反復(fù)測試,選取隱含層節(jié)點數(shù)為30。網(wǎng)絡(luò)模型訓(xùn)練誤差收斂過程如圖13所示。由該訓(xùn)練誤差曲線可以看出,驗證集與測試集誤差曲線的變化基本趨于一致,網(wǎng)絡(luò)訓(xùn)練經(jīng)過了20次迭代提前停止,達到了期望的誤差目標,訓(xùn)練誤差為0.090 545。
圖13 神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差曲線
地鐵閘機的主要作用就是使合法通行的乘客安全通過閘機并且安全有效地阻擋非法通行的乘客,是二分類問題。上述網(wǎng)絡(luò)學(xué)習(xí)結(jié)果如圖14混淆矩陣和圖15 ROC(接受者操作特性曲線)曲線所示,圖14和圖15神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)預(yù)測均說明,神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果很好,分類準確率達到96.8%。神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)預(yù)測結(jié)果表明,通過神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,網(wǎng)絡(luò)模型分類準確性很高,具有較好的泛化能力,可以較好地識別未經(jīng)訓(xùn)練的通行傳感器數(shù)據(jù)是否合法。
圖14 神經(jīng)網(wǎng)絡(luò)混淆矩陣
本文通過采集乘客遮擋閘機傳感器信號產(chǎn)生的時間序列特征矩陣作為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,借鑒圖像識別技術(shù),采用雙線性插值法將傳感器序列圖縮放為統(tǒng)一大小的標準圖像,并通過對訓(xùn)練樣本添加合適的標簽作為輸出,實現(xiàn)了對正常合法通行以及非法通行的識別。
后續(xù)工作將將加強訓(xùn)練樣本分類、增強學(xué)習(xí)精度和速度。在本次研究中,當出現(xiàn)成人乘客跟隨距離小于30 cm時,為避免發(fā)生夾傷乘客的情形發(fā)生,作為合法通行的案例,在以后的訓(xùn)練中盡量縮短安全距離進行訓(xùn)練;同時將乘客通過閘機的情形進行細致分類,如將合法通行中的單人通行、背包通行、攜帶行李箱以及帶小孩的情形等作為輸出,實現(xiàn)多目標同時識別。
圖15 神經(jīng)網(wǎng)絡(luò)ROC曲線
全連接神經(jīng)網(wǎng)絡(luò)具有較好的學(xué)習(xí)能力,但連接參數(shù)數(shù)量多,學(xué)習(xí)與預(yù)測的實時性會受到影響。采用深度學(xué)習(xí)可以有效克服這一缺點,實現(xiàn)更加快速準確地分類和識別。