廖宇杰 東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院
隨著城市經(jīng)濟(jì)的快速發(fā)展,帶動(dòng)了城市軌道交通的發(fā)展。目前,越來(lái)越多的人在出行時(shí)選擇軌道交通,因此,保障軌道交通的出行安全是十分必要的。城市軌道交通的安全防護(hù)系統(tǒng)針對(duì)因客流聚集而容易發(fā)生意外事故這一情況,采取了利用智能視頻客流監(jiān)測(cè)技術(shù)進(jìn)行預(yù)測(cè)這一預(yù)防措施。智能視頻客流監(jiān)測(cè)技術(shù)的應(yīng)用可以對(duì)突發(fā)事件進(jìn)行預(yù)防,提升了現(xiàn)場(chǎng)的管理水平,減少突發(fā)事件為軌道交通的運(yùn)輸帶來(lái)的影響。因此,智能視頻客流監(jiān)測(cè)技術(shù)的研究,對(duì)于城市軌道交通有著重要的意義。
掌握實(shí)時(shí)客流情況,預(yù)測(cè)未來(lái)客流規(guī)模,對(duì)于避免大規(guī)模旅客滯留具有重要意義。然而,傳統(tǒng)的客流監(jiān)測(cè)技術(shù)存在設(shè)備安裝和維護(hù)困難,數(shù)據(jù)存儲(chǔ)量大,監(jiān)測(cè)范圍不完整等問(wèn)題。
目前,更主流的客流監(jiān)測(cè)技術(shù)包括:多傳感器協(xié)同監(jiān)測(cè)方法,基于計(jì)算機(jī)視覺(jué)的視頻監(jiān)測(cè)方法,基于移動(dòng)通信網(wǎng)絡(luò)信令數(shù)據(jù)的監(jiān)測(cè)方法,以及WiFi 嗅探監(jiān)測(cè)方法。當(dāng)人數(shù)較少時(shí),多傳感器協(xié)同監(jiān)控更準(zhǔn)確,一旦人群擁擠,就很難發(fā)揮作用。基于計(jì)算機(jī)視覺(jué)的視頻監(jiān)控范圍有限,需要大量攝像機(jī)覆蓋所有目標(biāo)區(qū)域。而且,由于攝像機(jī)視角的影響,近處和遠(yuǎn)處的檢測(cè)率將不可避免地逐漸降低或甚至不可識(shí)別。該方法適合作為關(guān)鍵區(qū)域的輔助判斷手段?;谝苿?dòng)通信網(wǎng)絡(luò)的信令數(shù)據(jù)的監(jiān)控要求三大通信運(yùn)營(yíng)商公開(kāi)用戶移動(dòng)電話的實(shí)時(shí)數(shù)據(jù)信息,由于隱私和商業(yè)秘密而難以實(shí)現(xiàn)。同時(shí),由于無(wú)法區(qū)分室內(nèi)和室外,這種方法不適合監(jiān)測(cè)建筑物的內(nèi)部客流。
現(xiàn)行的人群計(jì)數(shù)的方法主要包括:基于檢測(cè)的方法,基于回歸的方法,以及基于深度學(xué)習(xí)的方法。這些方法都有著一些缺點(diǎn)導(dǎo)致其檢測(cè)效果不盡如意?,F(xiàn)行軌道交通客流狀態(tài)監(jiān)測(cè)多采用單一視頻監(jiān)測(cè),單一視頻監(jiān)測(cè)客流信息存在較大誤差,存在信息遺漏、信息重疊等問(wèn)題。本項(xiàng)目綜合采用視頻監(jiān)控、WiFi 嗅探、閘機(jī)刷卡多元數(shù)據(jù)收集分析手段,力求得到更為詳實(shí)可靠的客流信息數(shù)據(jù)。
早期的人群研究主要聚焦于基于檢測(cè)的方法。基于檢測(cè)的方法主要分為兩大類:一種是基于整體的檢測(cè)方法,主要訓(xùn)練一個(gè)分類器,利用從行人全身提取的小波,HOG,邊緣等特征去檢測(cè)行人?;谡w檢測(cè)的方法主要適用于稀疏的人群計(jì)數(shù),隨著人群密度的提升,人與人之間的遮擋變得越來(lái)越嚴(yán)重;另一種是基于部分身體檢測(cè)的方法,被用來(lái)處理人群計(jì)數(shù)問(wèn)題。其主要通過(guò)檢測(cè)身體的部分結(jié)構(gòu),例如頭、肩膀等去統(tǒng)計(jì)人群的數(shù)量。這種方法比之基于整體的檢測(cè),在效果上有略微的提升。
無(wú)論何種基于檢測(cè)的方法,都很難處理人群之間嚴(yán)重的遮擋問(wèn)題。所以,基于回歸的方法逐漸被用來(lái)解決人群計(jì)數(shù)的問(wèn)題。
基于回歸的方法,主要思想是通過(guò)學(xué)習(xí)一種特征到人群數(shù)量的映射。這類方法步驟主要分為兩步:
第一步提取低級(jí)的特征,例如前景特征,邊緣特征,紋理和梯度特征;
第二步是學(xué)習(xí)一個(gè)回歸模型,例如線性回歸,分段線性回歸,嶺回歸和高斯過(guò)程回歸等方法學(xué)習(xí)一個(gè)低級(jí)特征到人群數(shù)的映射關(guān)系。
優(yōu)點(diǎn)在于對(duì)高密度人群圖像來(lái)說(shuō),其效果是比基于目標(biāo)檢測(cè)方法的好,但缺點(diǎn)是沒(méi)有精確的定位。
深度學(xué)習(xí)技術(shù)始于2006 年Hinton 等人在Science 發(fā)表的文 章“Reducing the Dimensionality of Data with Neural Networks”。近些年來(lái),DL 被廣泛應(yīng)用于各個(gè)研究領(lǐng)域(計(jì)算機(jī)視覺(jué),自然語(yǔ)言處理等)。 DL 憑借其出色的特征學(xué)習(xí)能力,同樣被研究人員用于人群計(jì)數(shù)的研究中。近年來(lái)所提出的方法主要 有:MCNN(CVPR 2016),CP-CNN(CVPR 2017),Switch-CNN(CVPR 2017),CSRNet(CVPR2018),ic-CNN(ECC V2018),SANet(ECCV 2018)。上述各種模型有的是提取多尺度特征,有的是逐步細(xì)化密度圖,但無(wú)論哪種模型,目前最困難的問(wèn)題仍然是:在人群密集的區(qū)域,如何讓模型更精細(xì)的區(qū)分出人的特征(如人頭重疊);如何教會(huì)模型“聚焦”,即在一幅人群密度分布廣泛的圖像中對(duì)較小尺度的局部特征能“看”得更清晰。
不同角度拍攝所得的樣本的監(jiān)測(cè)效果相差非常大,因此一個(gè)優(yōu)化方向就是采樣相機(jī)的擺放角度。在基于深度學(xué)習(xí)的人群計(jì)數(shù)方法中,不同距離的特征提取和重疊部分的特征提取仍是難點(diǎn)。對(duì)于軌道交通這一個(gè)特定的應(yīng)用場(chǎng)景,可以很容易想到通過(guò)將攝像頭垂直放置采樣,這樣就避免了遮擋和距離不同的問(wèn)題,基本控制了目標(biāo)特征的一致性。這樣不論是深度學(xué)習(xí)的方法,還是基于監(jiān)測(cè)的方法,都可以比較容易地提升效果。
通常的行人檢測(cè)采樣中,往往只從一個(gè)角度獲取視頻信息。采用多組攝像頭組合采樣,可以減弱遮擋、明暗對(duì)視頻處理的影響。此外,在傳統(tǒng)的行人檢測(cè)方法中,研究人員只能通過(guò)圖像像素反映出的基本特征來(lái)完成行人檢測(cè),不能有效利用景深信息。深度攝像頭除了能夠獲取平面圖像以外還可以獲得拍攝對(duì)象的深度信息??梢酝ㄟ^(guò)景深構(gòu)建技術(shù)解決行人遮擋問(wèn)題,輔助行人檢測(cè)算法對(duì)行人信息進(jìn)行更快速、準(zhǔn)確地提取。
行人統(tǒng)計(jì)的關(guān)鍵在于尋找含有行人的區(qū)域并提取其特征。由于人群分布的隨意性使得特定時(shí)間段內(nèi)場(chǎng)景中人群不規(guī)律聚集,稠密度不均。在不同稠密度的場(chǎng)景下分別使用不同的特征提取方法:在人數(shù)密集的場(chǎng)景下,人和人之間存在遮擋,人群呈團(tuán)塊區(qū)域狀分布,此時(shí)采用基于特征回歸的方法,如提取區(qū)域紋理、密度分布特征來(lái)估計(jì)行人數(shù)量。在人群稀少的場(chǎng)景中,使用統(tǒng)計(jì)回歸方法來(lái)估 計(jì)人數(shù)誤差會(huì)很大,此時(shí)采用基于目標(biāo)檢測(cè)的方法可以簡(jiǎn)單快捷的來(lái)統(tǒng)計(jì)人數(shù)。因此,可以將檢測(cè)模型優(yōu)化為行人識(shí)別和特征回歸兩部分以應(yīng)對(duì)不同復(fù)雜度的人群場(chǎng)景。
單單靠視頻分析存在許多缺陷。引進(jìn)WiFi 嗅探技術(shù)作為補(bǔ)充,可較好地解決地鐵網(wǎng)絡(luò)客流分布和乘客個(gè)體出行路徑的高精度識(shí)別問(wèn)題。WiFi 嗅探數(shù)據(jù)是探針設(shè)備(AF)與WiFi 設(shè)備(如手機(jī)、平板電腦等)的交互信息數(shù)據(jù),可以實(shí)現(xiàn)對(duì)攜帶WiFi 設(shè)備對(duì)象的動(dòng)態(tài)跟蹤,從而解決視頻檢測(cè)難以追蹤對(duì)象的問(wèn)題。同時(shí),其具有檢測(cè)范圍相對(duì)集中、檢測(cè)速度快、采樣率高、實(shí)時(shí)性強(qiáng)等特點(diǎn),可實(shí)現(xiàn)乘客出行時(shí)空軌跡的精準(zhǔn)化識(shí)別。
閘機(jī)刷卡數(shù)據(jù)也可作為視頻分析的補(bǔ)充。軌道交通站點(diǎn)大多設(shè)有閘機(jī)進(jìn)行放行管理。閘機(jī)的結(jié)構(gòu)組成中包含了計(jì)數(shù)模塊,用于記錄通行人數(shù);作為一種通道管理設(shè)備,其最本質(zhì)的功能是通過(guò)攔阻和放行實(shí)現(xiàn)一次只通過(guò)一人。閘機(jī)的工作模式使其在客流量統(tǒng)計(jì)上具有很強(qiáng)的準(zhǔn)確性。通過(guò)獲取閘機(jī)刷卡數(shù)據(jù)輔助客流量統(tǒng)計(jì),可以充分發(fā)揮軌道交通站點(diǎn)設(shè)有閘機(jī)設(shè)備的優(yōu)勢(shì),彌補(bǔ)視頻分析的不足。
綜上所述,城市軌道的發(fā)展?jié)M足人們的出行需求,但是密集的客流量導(dǎo)致事故的頻繁發(fā)生,而智能視頻客流監(jiān)測(cè)技術(shù)的應(yīng)用保障了軌道交通的安全。智能視頻客流監(jiān)測(cè)技術(shù)可以通過(guò)高效的計(jì)數(shù)方法,可以對(duì)人流量進(jìn)行精確控制,并進(jìn)行實(shí)時(shí)危險(xiǎn)預(yù)警,最大程度減小事故的發(fā)生。獲取各個(gè)客流通道的客流相關(guān)數(shù)據(jù),可以以此為依據(jù)對(duì)客流通道進(jìn)行優(yōu)化,提高通行效率。獲取大量的客流數(shù)據(jù)可以為其他相關(guān)的研究提供數(shù)據(jù)??蓪?duì)目標(biāo)行人進(jìn)行路徑規(guī)劃,優(yōu)化軌道交通資源配置。