佟慧姣,劉小松,朱磊基,樓亮亮,熊 勇
(1.中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所,上海 200050;2.上海君來軟件有限公司,上海 201901;3.中國科學(xué)院大學(xué),北京 100049)
上海虹橋綜合交通樞紐位于上海西城,占地26.26 km2,集航空、鐵路、高速公路和軌道交通為一體,旅客日吞吐量約110 萬人次,其東部為虹橋機(jī)場,中部核心區(qū)包括東交通廣場、高速和城際鐵路虹橋站、西交通廣場等各類軌道及路面交通設(shè)施,西部為2 700 000 m2的虹橋商務(wù)開發(fā)區(qū)。虹橋樞紐是長三角城市網(wǎng)絡(luò)中的關(guān)鍵性節(jié)點(diǎn),將成為上海企業(yè)服務(wù)長三角、輻射全國乃至世界的商務(wù)中心[1]。因此,針對上海虹橋樞紐的實(shí)際情況,研究客流監(jiān)測的具體方案并盡快實(shí)施具有重要的意義。
目前,對于各類交通樞紐客流量監(jiān)測的方法主要有:基于票務(wù)信息的軌道交通客流量監(jiān)測、基于手機(jī)信令數(shù)據(jù)的客流量監(jiān)測、基于視頻客流量監(jiān)測和基于WiFi 嗅探的客流量監(jiān)測等。文獻(xiàn)[2]通過構(gòu)建城市軌道交通系統(tǒng)客流流動的數(shù)學(xué)模型,實(shí)現(xiàn)了基于票務(wù)信息的軌道交通客流系統(tǒng)設(shè)計(jì)。文獻(xiàn)[3]以重慶北客運(yùn)樞紐為例,采用手機(jī)信令數(shù)據(jù)實(shí)現(xiàn)了在站客流、全日客流和集散時(shí)間的實(shí)時(shí)監(jiān)測。文獻(xiàn)[4]針對大型樞紐站的具體場景與需求,圍繞基于計(jì)算機(jī)視覺技術(shù)的檢測算法展開,研究設(shè)計(jì)并實(shí)現(xiàn)了一套客流監(jiān)測系統(tǒng)。
在這些方法中,基于票務(wù)信息的方法區(qū)域局限性較大,對于票務(wù)信息缺乏的區(qū)域并不適用;基于手機(jī)信令的方法監(jiān)測范圍較大,且受限于基站的位置,適合宏觀區(qū)域的客流估計(jì);基于視頻分析的方法監(jiān)測準(zhǔn)確率高,結(jié)果可靠,但是監(jiān)測范圍太小且算法實(shí)現(xiàn)復(fù)雜,適合一些重點(diǎn)監(jiān)測區(qū)域的客流監(jiān)控。因此,基于WiFi 嗅探的客流監(jiān)測方法以其監(jiān)測范圍適中、硬件及算法原理簡單易實(shí)現(xiàn)和監(jiān)測較為準(zhǔn)確等優(yōu)點(diǎn)受到越來越多的關(guān)注。
本文研究WiFi 嗅探客流監(jiān)測系統(tǒng)在上海虹橋樞紐的具體實(shí)現(xiàn),通過闡述該系統(tǒng)部署實(shí)現(xiàn)中的關(guān)鍵技術(shù),為工程師或?qū)W者提供參考。
上海虹橋樞紐西交通中心,是本文研究的目標(biāo)區(qū)域,其客流具有屬性多樣、流向復(fù)雜和時(shí)變性強(qiáng)等特點(diǎn),無法簡單依靠傳統(tǒng)手段有效地獲取客流信息。WiFi 嗅探客流監(jiān)測方法以其監(jiān)測范圍適中、硬件部署和原理簡單的優(yōu)點(diǎn),適合該區(qū)域客流量的監(jiān)測。
無線終端接入WiFi 網(wǎng)絡(luò)需經(jīng)過掃描、認(rèn)證和關(guān)聯(lián)步驟,三個(gè)步驟全部完成,無線終端才能通過與無線訪問接入點(diǎn)(Wireless Access Point,AP)建立數(shù)據(jù)鏈接而加入網(wǎng)絡(luò)。掃描階段用于發(fā)現(xiàn)周圍AP,有主動和被動兩種掃描方式。根據(jù)IEEE 802.11 系列協(xié)議,開啟WiFi功能的無線終端會通過主動掃描方式,定期向周圍廣播探詢請求幀(Probe Request),告知網(wǎng)絡(luò)自己的存在。探詢請求幀是管理幀的一種子類型,包含終端唯一的媒體訪問控制(Media Access Control,MAC)地址。因此,通過捕獲無線終端廣播的探詢請求幀,從中解析出MAC 地址,即可得知監(jiān)測范圍內(nèi)開啟WiFi功能的無線終端數(shù)量[5-6]。
開啟WiFi 功能的手機(jī)是一種活動的無線終端。由于人群中開啟WiFi 功能的手機(jī)數(shù)量是實(shí)際客流總量的一部分,因此需用擬合方法設(shè)計(jì)出開啟WiFi 功能的手機(jī)數(shù)量在實(shí)際客流總量中所占的比例,用以估計(jì)實(shí)際客流總量,這個(gè)比例稱為擴(kuò)樣系數(shù)。
WiFi 嗅探器完成信息采集并送至服務(wù)器的過程,實(shí)際應(yīng)用時(shí)需要解決兩個(gè)問題:一方面,要在較短時(shí)間內(nèi)捕獲到附近終端的MAC 地址,以免因?yàn)楸槐O(jiān)測人員移動離開信號覆蓋區(qū)域而造成漏檢;另一方面,進(jìn)行初步數(shù)據(jù)清洗后可靠發(fā)送至指定數(shù)據(jù)服務(wù)器,以免大量無效數(shù)據(jù)擁堵通信通道。
1.2.1 捕獲終端MAC
本文采用的WiFi 嗅探器工作在2.4 GHz 頻段,共有14 個(gè)信道,我國設(shè)備可用其中13 個(gè),信道分布如圖1 所示。文獻(xiàn)[7]證明,在行人正常步行速度下,用三個(gè)頻率范圍無重疊的1,6,11 信道偵聽的探針可實(shí)現(xiàn)探詢請求幀80%以上的檢測概率,是性價(jià)比最高的監(jiān)測方案。因此,WiFi 嗅探器工作時(shí),在1,6,11 三個(gè)信道上持續(xù)以偵聽模式捕獲區(qū)域內(nèi)無線終端的探詢請求幀。
圖1 IEEE 802.11協(xié)議2.4 GHz頻段信道分布Fig.1 Channel distribution at 2.4 GHz band according to IEEE 802.11 protocol
1.2.2 數(shù)據(jù)傳輸
WiFi 嗅探器與服務(wù)器之間通過發(fā)送約定格式的數(shù)據(jù)包進(jìn)行通信,數(shù)據(jù)包分下行、上行兩類。下行數(shù)據(jù)包由服務(wù)器發(fā)送至WiFi 嗅探器,為參數(shù)配置數(shù)據(jù)。上行數(shù)據(jù)包是WiFi 嗅探器發(fā)送給服務(wù)器的數(shù)據(jù),是其作為信息采集器完成無線終端信息的捕獲,并以20 s 周期向服務(wù)器發(fā)送數(shù)據(jù)包。上行數(shù)據(jù)包幀格式如圖2 所示。當(dāng)數(shù)據(jù)包中“類型(CMD)”字段值為0x01時(shí),表示數(shù)據(jù)包為上行數(shù)據(jù)包,此時(shí)“數(shù)據(jù)(DATA)”字段內(nèi)是WiFi 嗅探器捕獲的無線終端探詢請求幀的信息,是WiFi 嗅探客流監(jiān)測系統(tǒng)基礎(chǔ)數(shù)據(jù)來源。
圖2 上行數(shù)據(jù)包幀格式Fig.2 Frame format of uplink data packet
WiFi 嗅探器與服務(wù)器之間的數(shù)據(jù)傳輸通過套接字(Socket)實(shí)現(xiàn)[8]。標(biāo)準(zhǔn)套接字有兩種類型:流式套接字(SOCK_STREAM)和數(shù)據(jù)報(bào)套接字(SOCK_DGRAM)。
流式套接字用于TCP 協(xié)議,是面向連接的,提供雙向、有序、無重復(fù)且無記錄邊界的數(shù)據(jù)流服務(wù),適用于處理大量數(shù)據(jù),可靠性高。數(shù)據(jù)報(bào)套接字用于UDP 協(xié)議,提供雙向通信,但是沒有可靠、有序和不重復(fù)的保證,所以UDP 傳送數(shù)據(jù)可能會收到無次序、重復(fù)的信息,甚至信息在傳輸過程中出現(xiàn)遺漏,但傳輸效率高。
本文在實(shí)現(xiàn)數(shù)據(jù)獲取時(shí)采用面向TCP 協(xié)議的流式套接字,Socket建立與偵聽流程如圖3 所示。
圖3 流式套接字實(shí)現(xiàn)流程Fig.3 Implementation process of SOCK_STREAM
建立Socket 連接后,服務(wù)器端將收到的上行數(shù)據(jù)包按照圖2 中的約定格式進(jìn)行實(shí)時(shí)解析,并將解析后的有用信息上傳數(shù)據(jù)庫,用于數(shù)據(jù)處理分析。根據(jù)圖2 中的數(shù)據(jù)包格式,解析后的有用信息包括移動終端的MAC 地址、相應(yīng)的接收信號強(qiáng)度RSSI、嗅探到此探詢請求幀的時(shí)間與數(shù)據(jù)包發(fā)送時(shí)間的偏差等。解析結(jié)果如圖4 所示。
圖4 某個(gè)上行數(shù)據(jù)包的解析結(jié)果Fig.4 Analysis results of a certain uplink data packet
數(shù)據(jù)處理是數(shù)據(jù)服務(wù)器完成由收集的終端MAC 數(shù)據(jù)轉(zhuǎn)換成客流量數(shù)值的過程。終端MAC 數(shù)據(jù)經(jīng)過背景噪聲數(shù)據(jù)濾除、客流停留量分析和數(shù)據(jù)擴(kuò)樣三步處理,實(shí)現(xiàn)從大量數(shù)據(jù)中提取可用數(shù)據(jù)并進(jìn)行有效擴(kuò)樣,最終獲得客流量估計(jì)值。
1.3.1 背景噪聲數(shù)據(jù)濾除
由于目標(biāo)監(jiān)測區(qū)域環(huán)境復(fù)雜,WiFi 嗅探器發(fā)送給服務(wù)器的數(shù)據(jù)中含有大量無效信息,主要包括非手機(jī)廠商無線移動終端的MAC 地址信息、持續(xù)存在的區(qū)域背景噪聲信息、不符合校驗(yàn)格式的錯(cuò)誤信息等。因此,接收到數(shù)據(jù)之后,應(yīng)該根據(jù)各類無效信息的特點(diǎn),對接收到的大量數(shù)據(jù)進(jìn)一步進(jìn)行清洗,確保留存可用信息。
無線移動終端的MAC 地址共有6 B,其中前3 B 是由IEEE 分配給廠商的信息。根據(jù)MAC 地址的前3 B,可以找到并排除非手機(jī)廠商無線終端的MAC 地址,也可以從有效數(shù)據(jù)中獲得客流中手機(jī)品牌的統(tǒng)計(jì)結(jié)果。如圖5 所示為部分背景噪聲。
圖5 背景噪聲示例Fig.5 Example of background noise
1.3.2 客流停留分析算法
客流停留分析算法的目的是持續(xù)準(zhǔn)確地監(jiān)測目標(biāo)區(qū)域的客流停留量,以實(shí)現(xiàn)后續(xù)的客流量分析與超警戒報(bào)警。在目標(biāo)監(jiān)測區(qū)域內(nèi),有效信息中不同MAC 地址的條目數(shù)目即可大致認(rèn)為是該目標(biāo)區(qū)域的客流停留量。
但是,在對有效信息進(jìn)行處理時(shí),會發(fā)生同一批數(shù)據(jù)包中含有某手機(jī)的重復(fù)信息,這些有效重復(fù)信息的MAC 地址是相同的。在進(jìn)行客流停留量分析時(shí),服務(wù)器端分為兩種情況進(jìn)行處理:
1)若是同一個(gè)WiFi 嗅探器在同一個(gè)數(shù)據(jù)包中發(fā)送了重復(fù)的MAC 地址條目,以時(shí)間靠后的為準(zhǔn)。
2)若是不同的WiFi 嗅探器均捕獲到同一個(gè)手機(jī)的信息,同時(shí)向服務(wù)器發(fā)送了MAC 地址相同的數(shù)據(jù),則依據(jù)RSSI 最大原則保留兩條數(shù)據(jù)中RSSI 值較大的條目,認(rèn)為該手機(jī)在發(fā)送RSSI 值較大數(shù)據(jù)的WiFi 嗅探器的監(jiān)測范圍內(nèi)[9-11]。
經(jīng)過客流停留量分析之后,此時(shí)服務(wù)器端保留的有效數(shù)據(jù)條目已經(jīng)可以被認(rèn)為是目標(biāo)監(jiān)測區(qū)域內(nèi)開啟了WiFi的手機(jī)數(shù)目。
1.3.3 數(shù)據(jù)擴(kuò)樣算法
WiFi 嗅探客流監(jiān)測是通過監(jiān)測目標(biāo)區(qū)域內(nèi)打開WiFi的手機(jī)數(shù)目來間接得知目標(biāo)區(qū)域的客流停留量的一種方法。但是,在實(shí)際生活中,并非人人擁有智能手機(jī),也并非人人的智能手機(jī)均處于WiFi 開啟的狀態(tài)。因此,需要數(shù)據(jù)擴(kuò)樣分析算法對目標(biāo)監(jiān)測區(qū)域內(nèi)開啟了WiFi的手機(jī)數(shù)目進(jìn)行擴(kuò)樣。
數(shù)據(jù)擴(kuò)樣算法中,最重要的是擴(kuò)樣系數(shù)的計(jì)算和選取。擴(kuò)樣系數(shù)的計(jì)算公式如下所示:
本文根據(jù)文獻(xiàn)[12]中對擴(kuò)樣系數(shù)時(shí)變性的詳細(xì)研究方法和目標(biāo)區(qū)域客流特點(diǎn),對擴(kuò)樣系數(shù)的選取進(jìn)行了多次實(shí)驗(yàn),確定了合理的數(shù)據(jù)擴(kuò)樣系數(shù)及時(shí)變方案。利用該方案,根據(jù)經(jīng)背景噪聲數(shù)據(jù)濾除和客流停留分析算法得到的有效數(shù)據(jù)條目,可快速計(jì)算出真實(shí)客流量的估計(jì)值。
WiFi嗅探客流監(jiān)測系統(tǒng)架構(gòu)如圖6所示。覆蓋目標(biāo)區(qū)域的WiFi 嗅探器通過有線網(wǎng)絡(luò)將接收到的無線移動終端設(shè)備數(shù)據(jù)打包發(fā)送給部署在附近機(jī)房的客流采集與處理本地服務(wù)器。這些包含無線移動終端設(shè)備的MAC地址、RSSI 值、時(shí)間、來源等信息的原始數(shù)據(jù)經(jīng)過本地服務(wù)器解析與處理后可得到區(qū)域客流量估計(jì)值,推送至云端。手機(jī)APP和網(wǎng)頁通過固定接口從云端取得實(shí)時(shí)客流量數(shù)據(jù)。用戶通過手機(jī)APP或網(wǎng)頁得知目標(biāo)監(jiān)測區(qū)域內(nèi)的客流量,從而使得管理者可及時(shí)獲知現(xiàn)場客流量的異常,采取正確有效的應(yīng)急疏散策略,保障大客流安全。
圖6 WiFi嗅探客流監(jiān)測系統(tǒng)架構(gòu)Fig.6 Architecture of WiFi sniffing passenger flow monitoring system
本文采用的WiFi嗅探器為自行開發(fā)的產(chǎn)品,其核心WiFi模塊為ESP-12F模塊,支持標(biāo)準(zhǔn)的IEEE 802.11b/g/n協(xié)議,搭配基于ISM 頻段的3 dBi 增益的IFA 天線,有效監(jiān)測半徑為150 m。
考慮到場地電源、網(wǎng)絡(luò)等條件,在上海虹橋樞紐西交通中心,本文沿道路部署了10 套WiFi 嗅探器,并通過限制RSSI 值使系統(tǒng)的監(jiān)測范圍完全覆蓋目標(biāo)監(jiān)測區(qū)域。設(shè)備部署情況如圖7 所示。
為驗(yàn)證WiFi 嗅探客流監(jiān)測系統(tǒng)的可靠性,本文利用人工方法,分散在目標(biāo)區(qū)域每個(gè)出入口對來往客流進(jìn)行計(jì)數(shù)。在計(jì)數(shù)開始時(shí)刻,由各小區(qū)域負(fù)責(zé)人統(tǒng)計(jì)各小區(qū)域內(nèi)原始人數(shù),作為客流基準(zhǔn)值。在計(jì)數(shù)時(shí)間段內(nèi),每隔5 min 記錄各個(gè)出入口進(jìn)出人數(shù),作為客流變動值,同時(shí)保證被測試的10 套WiFi嗅探器正常上報(bào)數(shù)據(jù)。
圖7 WiFi嗅探器部署Fig.7 Deployment of WiFi sniffer
對人工計(jì)數(shù)結(jié)果匯總統(tǒng)計(jì)之后,獲得了該區(qū)域某日12:00—18:00的客流真值數(shù)據(jù)。同時(shí),調(diào)取當(dāng)日同時(shí)刻WiFi 嗅探客流監(jiān)測系統(tǒng)客流量計(jì)算值與客流真值進(jìn)行對比,結(jié)果如圖8 所示。
圖8 客流監(jiān)測值與真值對比Fig.8 Comparison of passenger flow monitoring value and true value
圖8 中,曲線1 為實(shí)測真實(shí)客流量曲線,曲線2 為WiFi 嗅探客流監(jiān)測系統(tǒng)客流量曲線。對比發(fā)現(xiàn),客流量趨勢基本一致,滿足大客流到來的報(bào)警需求。統(tǒng)計(jì)12:00—18:00 客流量數(shù)據(jù)得知,實(shí)測真實(shí)客流量為68 185 人,WiFi 嗅探客流監(jiān)測系統(tǒng)客流量為68 155 人。WiFi 嗅探客流監(jiān)測系統(tǒng)監(jiān)測客流量可反映真實(shí)客流量,為相關(guān)部門提供客流大數(shù)據(jù)參考。
WiFi 嗅探客流監(jiān)測系統(tǒng)應(yīng)用界面如圖9 所示,包括以下功能:手機(jī)品牌分析、客流量實(shí)時(shí)監(jiān)測、歷史報(bào)警信息、客流量趨勢分析、熱力圖和特征日客流量分析。
客流量實(shí)時(shí)監(jiān)測區(qū)是系統(tǒng)的主功能區(qū),位于整個(gè)界面的中心區(qū)域,以表盤形式展示當(dāng)前客流量,并以綠色、藍(lán)色和紅色區(qū)分客流擁擠程度。表盤下方以文字形式精確表述當(dāng)前客流量和歷史最高客流量,可更加清晰地反映當(dāng)前客流水平。其他功能區(qū)為輔助功能區(qū),可完成手機(jī)品牌分析、歷史報(bào)警信息展示、客流量趨勢分析、熱力圖展示和特征日客流量分析等功能,提供進(jìn)一步的客流監(jiān)測和分析。
圖9 WiFi嗅探客流監(jiān)測系統(tǒng)界面Fig.9 Interface of WiFi sniffing passenger flow monitoring system
基于WiFi 嗅探的虹橋樞紐西交通中心客流監(jiān)測系統(tǒng)已運(yùn)行一年,經(jīng)受了2017年春節(jié)、勞動節(jié)和國慶節(jié)的客流監(jiān)測考驗(yàn),目前運(yùn)行狀況良好,正在持續(xù)為虹橋樞紐的客流安全保障提供數(shù)據(jù)。
本文針對上海虹橋樞紐西交通中心客流情況復(fù)雜,難以用傳統(tǒng)方法有效監(jiān)測客流量的問題,創(chuàng)新性地選用WiFi 嗅探技術(shù),實(shí)現(xiàn)了WiFi 嗅探客流監(jiān)測系統(tǒng)。在系統(tǒng)開發(fā)的過程中,本文解決了數(shù)據(jù)獲取和處理時(shí)終端信息捕獲、數(shù)據(jù)傳輸、海量數(shù)據(jù)分析與處理、數(shù)據(jù)擴(kuò)樣等一系列實(shí)際問題。在系統(tǒng)設(shè)計(jì)部署之后,本文又將系統(tǒng)監(jiān)測客流量與人工統(tǒng)計(jì)客流量進(jìn)行了對比,驗(yàn)證了其可靠性。該系統(tǒng)運(yùn)行后結(jié)果表明,其所具備的客流監(jiān)測功能可以使管理者實(shí)時(shí)了解區(qū)域運(yùn)行情況和擁擠程度,也能夠分析交通樞紐的長期活動規(guī)律,為行業(yè)管理部門提前制定應(yīng)急預(yù)案、進(jìn)行客流疏散調(diào)度提供參考。
注:本文通訊作者為熊勇。