王錦玉 王齊榮
【摘 要】?目前我國鐵路客運車站通過靜態(tài)的方法設(shè)計車站內(nèi)各種設(shè)施的規(guī)模和布局來實現(xiàn)車站總體服務(wù)能力的最大化,車站運營管理部門缺少能夠動態(tài)評估車站設(shè)施服務(wù)能力與客流不確定需求之間匹配程度的手段。文章基于深度學(xué)習(xí)理論,提出了一種車站設(shè)施服務(wù)能力與客流不確定需求適應(yīng)性評估的視頻圖像檢測方法,通過視頻圖像檢測出車站重要設(shè)施范圍內(nèi)乘客排隊的人數(shù),結(jié)合制定的適應(yīng)性分級標(biāo)準(zhǔn)對車站設(shè)施服務(wù)能力與客流需求進行適應(yīng)性評估。實驗結(jié)果表明,所提出的方法檢測速度快,能夠滿足實際應(yīng)用中實時性的要求,而且對人群目標(biāo)檢測的平均準(zhǔn)確率為81.25 %。其檢測結(jié)果可以輔助管理者評估車站設(shè)施在動態(tài)客流需求下的運營情況。
【關(guān)鍵詞】車站; 深度學(xué)習(xí); 人群目標(biāo)檢測; 適應(yīng)性評估
近年來,我國鐵路旅客出行人數(shù)與日俱增,特別是客流高峰期,車站面臨重要設(shè)施服務(wù)能力與客流需求嚴(yán)重不匹配的情況,運營管理部門也缺少能夠準(zhǔn)確把握客流需求的技術(shù)手段。利用城市軌道交通自動售檢票系統(tǒng)[1]和手機信令數(shù)據(jù)[2]進行客流監(jiān)測是近些年主要的研究方向,但是檢票閘機只能檢測進出站乘客的出行信息和數(shù)量,時效性不高,手機信令數(shù)據(jù)無法采集車站內(nèi)局部區(qū)域擁堵點的數(shù)據(jù)[3]。隨著智能視頻監(jiān)控系統(tǒng)和計算機視覺技術(shù)的發(fā)展,基于視頻圖像的行人檢測技術(shù)廣泛應(yīng)用于公共場所,也為公共交通領(lǐng)域的客流檢測提供了借鑒。
國外的圖像研究較早,已經(jīng)形成了大量成熟的技術(shù),ObjectVideo、Visio Wave、Citi Log等軟件都能夠?qū)崿F(xiàn)對視頻的智能分析和圖像識別。Object Video軟件能夠?qū)σ曨l中行人的人數(shù)進行識別,準(zhǔn)確率已經(jīng)能達到80 %~90 %[4]。目前廣泛應(yīng)用的方法有背景差分法、光流場法、幀間差分法[5-8]等。近些年,國內(nèi)學(xué)者研究人群目標(biāo)檢測技術(shù)實現(xiàn)對城市軌道交通客流的實時檢測,采用深度卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network ,CNN)大幅度的提高了客流檢測的準(zhǔn)確率,具有較高的研究價值和廣闊的應(yīng)用前景[9-11]。這些相關(guān)研究表明,深度學(xué)習(xí)在軌道交通客流檢測的性能和準(zhǔn)確度方面表現(xiàn)都較為出色,而YOLO v3 又是目前速度和精度都很高的一個網(wǎng)絡(luò)模型,在CPU計算下可以獲得45 幀/s圖片處理的效率,完全可以應(yīng)用于視頻圖像的檢測任務(wù)[12]。因此本文提出了一種基于YOLOv3算法檢測車站設(shè)施服務(wù)能力與客流需求適應(yīng)性評估的方法,該方法能夠輔助管理者評估車站設(shè)施在動態(tài)客流需求下的運營情況。
1 適應(yīng)性評估檢測流程
本文提出的客流需求與設(shè)施服務(wù)能力適應(yīng)性評估的視頻檢測算法流程如圖1所示。該算法的完整流程分為三個模塊:預(yù)處理模塊、核心檢測模塊以及輸出模塊。
1.1 預(yù)處理模塊
對輸入的視頻圖像進行預(yù)處理工作,可以使檢測網(wǎng)絡(luò)更好地完成學(xué)習(xí)任務(wù)。
1.1.1 視頻圖像處理。
本文中視頻圖像檢測的輸入數(shù)據(jù)為車站的監(jiān)控視頻,抽取視頻中的圖片,通過抽取的部分視頻畫面完成檢測任務(wù)。
1.1.2 檢測區(qū)域選擇。
根據(jù)運營管理的需求,利用視頻監(jiān)控來掌握乘客的數(shù)量和空間分布,本文將車站范圍內(nèi)的重點設(shè)施:進出站口、安檢處、自動扶梯、檢票口作為重點監(jiān)控區(qū)域,事先圈定視頻畫面中的檢測區(qū)域,可以提高檢測的效率[13]。
1.2 核心檢測模塊
1.2.1 YOLO v3模型框架
YOLO v3網(wǎng)絡(luò)結(jié)構(gòu)包括Darknet-53和YOLO層,Darknet-53的作用是特征提取,YOLO的作用是多尺度預(yù)測。Darknet-53直接舍棄池化操作,大大降低了池化帶來的梯度負(fù)面效果,用卷積層中的步長來實現(xiàn)降采樣,作為YOLO v3的特征提取網(wǎng)絡(luò)具有魯棒性更好的優(yōu)點。YOLOv3的檢測網(wǎng)絡(luò)引入多尺度預(yù)測的概念,即將檢測層數(shù)量由原來的1層增加到3層,3層對應(yīng) 13×13,26×26及52×52三個不同尺度的特征圖,作者用K-means聚類出錨框的尺寸,并將錨框個數(shù)由5個提高到9個,按錨框尺寸大小分到三個檢測層級,YOLOv3多尺度檢測的方法很好的融合了上下文特征信息,可以應(yīng)用于不同尺度目標(biāo)的模型預(yù)測。YOLO v3犧牲了網(wǎng)絡(luò)速度但是提升了準(zhǔn)確度并且提高了網(wǎng)絡(luò)結(jié)構(gòu)的深度。YOLO在GPU中速度達到了45fps,也就是說每秒能夠檢測45張圖片,檢測速度比Fast-R-CNN快了300倍,完全能夠達到實時檢測的目的,而且在實時檢測中,也比其他實時檢測算法的精度都要高[14]。YOLO v3的網(wǎng)絡(luò)框架如圖2所示。
1.3 輸出模塊
本文所研究的視頻檢測模型的重要輸出內(nèi)容之一就是車站重要設(shè)施范圍內(nèi)乘客的實時數(shù)量,但是僅僅獲取到實時的乘客數(shù)量對運營指導(dǎo)意義不大。所以在得到乘客數(shù)量的基礎(chǔ)上,本文希望通過設(shè)置合理的人數(shù)閾值對車站設(shè)施的服務(wù)能力適應(yīng)性做出評估。決定車站設(shè)施服務(wù)能力與客流需求適應(yīng)性的三個主要因素:車站設(shè)施服務(wù)能力,應(yīng)急資源配置以及客流組織策略。在現(xiàn)實場景下,將得到的客流需求與車站設(shè)施服務(wù)能力適應(yīng)性評估與運營組織工作結(jié)合起來,意義重大。本文的輸出模塊將適應(yīng)性劃分為三個等級,依次是良好,差,極差。適應(yīng)性評估的分級以乘客在車站設(shè)施范圍內(nèi)排隊的數(shù)量與其通行能力之間的匹配程度為標(biāo)準(zhǔn)。具體的分級方法本文將在第二部分重點介紹。
2 適應(yīng)性評估分級
車站設(shè)施服務(wù)能力不足的主要表現(xiàn)為客流的擁堵和排隊現(xiàn)象,但是擁堵和排隊不代表車站設(shè)施的服務(wù)能力不足,在客流高峰期影響不大的擁堵排隊現(xiàn)象是合理的[15]。因此選擇一種直觀、易于獲取和理解的識別指標(biāo)來評估車站設(shè)施服務(wù)能力與客流需求適應(yīng)性非常重要。目前常用的識別指標(biāo)主要有兩類,第一類是基于系統(tǒng)仿真[16]的行人宏觀交通流參數(shù),包括客流平均移動速度、客流密度、客流量;第二類是基于排隊理論[17]的排隊理論性能指標(biāo)包括平均排隊時間和平均排隊長度。行人宏觀交通流參數(shù)可以直接用視頻監(jiān)控圖像處理技術(shù)獲取,但是將其作為識別指標(biāo)忽略了乘客的感知,而且不夠直觀。將排隊長度作為識別指標(biāo)不僅在視頻監(jiān)控中更加直觀,而且可以結(jié)合客流的時空分布特征,反映出車站各類設(shè)施擁堵的嚴(yán)重程度。因此本文采用排隊長度即排隊人數(shù)作為識別指標(biāo)。
由于乘客出行特征多樣,所以本文并沒有采用《地鐵設(shè)計規(guī)范》中各種設(shè)施的最大通行能力。通過對成都東站,武漢站客流高峰時段的現(xiàn)場調(diào)查發(fā)現(xiàn),大型鐵路客運車站內(nèi)乘客攜帶的行李較多,影響了車站設(shè)施的通行能力。所以本文采用現(xiàn)場調(diào)研的形式獲取客流高峰期各類服務(wù)設(shè)施的實際最大通行能力和乘客感受更加直觀的最大,最小排隊容忍時間等數(shù)據(jù)。而乘客所能容忍的最大,最小排隊人數(shù)為實際通行能力與最大,最小排隊容忍時間的乘積?,F(xiàn)場調(diào)研獲取的數(shù)據(jù)如表1所示。
分析現(xiàn)場調(diào)研的數(shù)據(jù)發(fā)現(xiàn),面對不同設(shè)施的乘客最小、最大容忍時間差別較大,分析原因在于進站口作為領(lǐng)近車次所有乘客進入車站的通行設(shè)備,排隊擁堵現(xiàn)象更普遍,所以乘客忍耐程度較高,而自動扶梯處由于旁邊有樓梯的存在,當(dāng)排隊人數(shù)較多時,未攜帶行李或攜帶較少行李的乘客會選擇走樓梯,因此乘客的容忍程度較低。通過分析調(diào)研數(shù)據(jù),本文建立的客流需求與車站設(shè)施服務(wù)能力適應(yīng)性評估的等級劃分如表2所示。
3 案例分析
3.1 網(wǎng)絡(luò)模型訓(xùn)練
為了提高訓(xùn)練的效果,本文使用的數(shù)據(jù)集應(yīng)該滿足:①數(shù)據(jù)集為密集的頭部目標(biāo);②目標(biāo)框標(biāo)注類型。SCUT-HEAD作為一個規(guī)模特別大的頭部檢測數(shù)據(jù)集,包含4 405張圖片,共計包含111 251個頭部目標(biāo),平均每張圖片含有25.3個頭部目標(biāo),部分圖片超過100個頭部目標(biāo),因此本文選擇SCUT-HEAD數(shù)據(jù)集作為實驗數(shù)據(jù)集。參照YOLO v3原作者主干網(wǎng)絡(luò)配置文件和訓(xùn)練權(quán)重文件,將神經(jīng)網(wǎng)絡(luò)訓(xùn)練類別改為單一類別,類別名稱改為person,并且在編程中添加了一個計數(shù)器用于統(tǒng)計人數(shù)。本文使用SCUT-HEAD數(shù)據(jù)集訓(xùn)練了YOLOv3網(wǎng)絡(luò)。在它的訓(xùn)練階段,使用了動量項為0.9的異步隨機梯度下降。權(quán)重衰減設(shè)置為0.000 5,最大的迭代次數(shù)設(shè)置是100 000,學(xué)習(xí)速率初始值設(shè)置為0.000 1,50 000次迭代后改成0.001,訓(xùn)練到70 000次后改成0.000 1,迭代到90 000次后改成0.000 01。
本實驗的軟硬件平臺:CPU:Intel(R) Core(TM) i7-7700 CPU @ 3.20GHz * 12;GPU為:NVIDIA GeForce GTX 1080Ti;
操作系統(tǒng):ubuntu 16.04LTS;深度學(xué)習(xí)框架為:darknet。
3.2 實驗結(jié)果分析
通過大量的實驗,YOLOv3算法在人群目標(biāo)數(shù)據(jù)集SCUT-HEAD上成功訓(xùn)練,得到人群目標(biāo)檢測模型后進行訓(xùn)練實驗,將三次實驗的平均值作為最終實驗檢測結(jié)果(表3)。
表中AP表示人群目標(biāo)檢測精確率,81.25 %的精確率表明了YOLOv3具有良好的檢測效果。FPS表示每秒檢測的速度,在本文實驗軟硬件平臺下每秒可以檢測43張人群目標(biāo)圖片。整個網(wǎng)絡(luò)模型從開始訓(xùn)練到模型收斂大約用時7 h 36 min。
3.3 案例
本文將采集到的150張車站安檢處乘客排隊圖像處理作為YOLO v3模型的輸入向量,對客流需求和安檢設(shè)備服務(wù)能力的適應(yīng)性進行評估,從準(zhǔn)確率和速度兩方面來分析識別結(jié)果,每副圖像的平均檢測時間為0.023 s,而平均誤檢為19.75 %,可以實現(xiàn)對車站設(shè)施服務(wù)能力與客流需求進行適應(yīng)性評估實時檢測。并以圖3、圖4作為實際場景下檢測的效果展示。
通過檢測,圖3中安檢處前乘客排隊人數(shù)為13人,小于分級閾值18人,所以識別適應(yīng)狀態(tài)為良好,圖4中安檢處前乘客排隊人數(shù)為33人,大于閾值30人,所以識別適應(yīng)狀態(tài)為極差。當(dāng)識別出安檢處前排隊乘客人數(shù)大于最大閾值30人時,建議運營者再開一條安檢通道,或者是增加經(jīng)驗豐富的工作人員,加快乘客安檢速度。
4 結(jié)論
鐵路客運車站已經(jīng)進入網(wǎng)絡(luò)化運營階段,為了提高車站設(shè)施服務(wù)水平,本文提出了一種基于視頻圖像檢測客流需求與車站設(shè)施服務(wù)能力適應(yīng)性評估的方法。并且對多個實際場景圖像進行案例分析,實驗結(jié)果表明該方法能夠較好的檢測出車站重點設(shè)施范圍內(nèi)的乘客數(shù)量,結(jié)合分級規(guī)則,可以為運營管理者提供可靠的排隊乘客數(shù)量和適應(yīng)性評估。
參考文獻
[1] 李臣,汪波,白云云,等.基于AFC數(shù)據(jù)的城市軌道交通突發(fā)事件客流影響分析[J].鐵道科學(xué)與工程學(xué)報,2019,16(10):2620-2627.
[2] 丁敬安,張欣海.基于手機信令數(shù)據(jù)的地鐵乘客路徑識別研究[J].中國電子科學(xué)研究院學(xué)報,2019,14(11):1194-1201.
[3] 王嬋嬋,張琦.上海城市軌道交通日常大客流檢測及預(yù)警需求研究[J].城市軌道交通研究,2018,21(10):11-15.
[4] 夏令.鐵路客運樞紐客流人數(shù)自動識別系統(tǒng)研究與實現(xiàn)[D].北京:北京交通大學(xué),2011.
[5] Shao L, YangZ, ZhangW. The Application of Intelligent Device and Method for Detecting Dynamic and Static Human Body in Energy-Saving Control of Schools[J].Procedia Engineering ,2017, 205:4017-4021.
[6] Tong Li, Bo Jiang, Dihua Wu, et al.Tracking multiple target cows'ruminant mouth areas using optical flow andinter-frame difference methods [J].IEEE Access,2019(7):185520-185531
[7] Marcin M, Olszewski P, Nowosielski A, et al. Pedestrian Traffic Distribution Analysis Using Face Recognition Technology[C]. In: Mikulski J. (eds) Activities of Transport Telematics. Berlin, Heidelberg: Springer,2013.
[8] Guo D,Van d V A L,Zhou X.Red blood cell tracking usingoptical flow methods [J].IEEE Journal of Biomedical &Health Informatics, 2014,18(3):991-998
[9] 龐夢圓,杜彥君,厲超吉,等.基于圖像采集技術(shù)的地鐵站臺客流引導(dǎo)系統(tǒng)研究[J].都市快軌交通,2017,30(2):37-41.
[10] 彭博,蔣陽升.城市軌道交通車站擁擠踩踏預(yù)警技術(shù)探討[J].公路交通科技,2016,33(7):108-113.
[11] 何文玉. 基于深度學(xué)習(xí)的地鐵客流檢測與跟蹤算法研究[D].江西:江西理工大學(xué),2020.
[12] 徐暢,程文軒,楊遠舟.關(guān)于Yolo目標(biāo)檢測算法的基礎(chǔ)研究[J].電腦與信息技術(shù),2020,28(4):45-47.
[13] 陳毓偉. 基于深度學(xué)習(xí)理論的軌道交通乘客擁擠程度視頻檢測算法研究[D].南京:東南大學(xué),2019.
[14] 盛蕊. 基于視頻圖像的地鐵車站客流安全狀態(tài)識別[D].南京:南京理工大學(xué),2018.
[15] 單征. 地鐵車站集散能力瓶頸識別方法研究[D].北京:北京交通大學(xué),2015.
[16] 陳慧,汪波,朱江斌.基于系統(tǒng)動力學(xué)的城市軌道交通車站客流控制仿真與優(yōu)化[J].大連交通大學(xué)學(xué)報,2020,41(5):1-7.
[17] 單征,宋瑞,李婷婷,等.城市軌道交通車站集散能力瓶頸識別方法研究[J].交通信息與安全,2014,32(1):117-121.
3057501908234