• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Wi-Fi探針的地鐵車站擁堵點客流量估計方法

      2019-04-01 13:11:50勞超勇劉志鋼
      計算機應用與軟件 2019年2期
      關鍵詞:客流量客流探針

      勞超勇 胡 華 劉志鋼

      (上海工程技術大學城市軌道交通學院 上海 201600)

      0 引 言

      地鐵網(wǎng)絡化運營面臨早晚高峰常態(tài)化或突發(fā)事件下的大客流壓力下,在擁堵位置如何有效采集客流數(shù)據(jù)、實時監(jiān)控客流狀態(tài)是防止突發(fā)事件引起交通癱瘓乃至演變成社會危機的關鍵。

      站內擁堵位置是指站內通行措施的輸出客流和輸入客流之間的客流量超過其通行能力,形成客流擁擠的瓶頸區(qū)域,包括安檢機處、閘機處、樓扶梯處、站臺處等。在早晚高峰或突發(fā)性情況下,站內擁堵點處客流常表現(xiàn)出高密度、不確定性、波動性等特征,增加客流采集的難度且影響采集的精度。地鐵車站采用的AFC(自動售檢票)系統(tǒng)只得到乘客進出站的刷卡數(shù)據(jù)且無法準確獲取站內出行路徑,而依賴于人工經(jīng)驗和應急預案開展車站的大客流管控,已經(jīng)難以確保其效率和運營的安全。因此,需利用模型清分的方式對站內客流數(shù)據(jù)進行估計或預測。

      為實現(xiàn)站內客流流量的采集,視頻監(jiān)控的圖像識別、紅外客流檢測等客流檢測技術[1-3]已經(jīng)在軌道交通地鐵車站進行探索與應用。這些采集技術在特定的區(qū)域內具有一定的應用價值,但由于技術的瓶頸尚不能精確地進行客流流量的采集,且成本較高,無法有效地在站內推廣。Wi-Fi探針采集技術是AP(無線接入點)與Wi-Fi設備(如手機、電子閱讀器)的信息交互,實現(xiàn)對攜帶Wi-Fi設備對象進行采集,解決紅外檢測、視頻采集等技術精度不高的問題,且具有實時性強、布設靈活及設備成本低等特點。目前,關于客流估計方法相關研究[4-6]側重對歷史數(shù)據(jù)或短期時間客流數(shù)據(jù)進行模型估計,但針對站內客流流量的實時采集及分析則處于起步階段。

      本文對Wi-Fi探針采集的原理、數(shù)據(jù)結構、數(shù)據(jù)的預處理進行詳細分析,然后對采集數(shù)據(jù)的分析模型進行詳細闡述,最后以上海徐涇東地鐵站為例進行客流數(shù)據(jù)的獲取及客流量估計模型的有效性進行驗證。

      1 Wi-Fi探針客流數(shù)據(jù)采集與過濾

      1.1 Wi-Fi探針采集原理

      基于IEEE 802.11協(xié)議的Wi-Fi探針是采用WLAN(無線局域網(wǎng))技術實現(xiàn)對于開啟或連接Wi-Fi的設備進行采集,采集原理為:AP會周期性地向四周發(fā)送BEACON(信標)幀,通知周圍的Wi-Fi設備(如手機、筆記本電腦等)AP的存在;Wi-Fi設備也會周期第發(fā)送PROBE(探測)幀,其中包含Wi-Fi設備的MAC地址(Medium Access Control)、信號強度(RSSI)等信息。當AP檢測到Wi-Fi設備傳送的PROBE幀,即記錄Wi-Fi設備傳送的信息。因此,在Wi-Fi探針區(qū)域內打開或連接Wi-Fi則可收集Wi-Fi設備信息。

      1.2 Wi-Fi探針采集數(shù)據(jù)的基本屬性

      在工作狀態(tài)下,對于開啟Wi-Fi功能或連接上Wi-Fi的電子設備,Wi-Fi探針能檢測其發(fā)送的信號且記錄生成數(shù)據(jù)文本,包括Wi-Fi設備MAC地址、RSSI和數(shù)據(jù)抓取的日期和時間等基礎信息,如表1所示。Wi-Fi設備的MAC地址為乘客唯一的標識符;RSSI表示捕獲具有Wi-Fi功能設備的信號強度,表示設備與Wi-Fi探針間的遠近。

      表1 Wi-Fi探針設備記錄的數(shù)據(jù)

      1.3 源數(shù)據(jù)預處理

      在地鐵車站內,非地鐵乘客的干擾或乘客個人行為等會影響Wi-Fi探針捕獲的數(shù)據(jù)總體樣本量,導致輸出不可靠的結果,包括以下情況:(1) 在地面或高架車站可能采集非站內乘客的Wi-Fi設備;(2) 站內存在具有Wi-Fi功能的固定設施設備;(3) 車站工作人員自身攜帶的電子設備;(4) 乘客在站內長時間停留。為篩除上述數(shù)據(jù)識別有效的MAC地址,設計數(shù)據(jù)過濾算法如下:

      (1) 消除數(shù)據(jù)中10 min時間間隔內重復出現(xiàn)的MAC地址,據(jù)此可篩除探針捕獲的非移動設備,如員工攜帶具有Wi-Fi功能的設備以及測試期間未移動的任何其他智能設備;

      (2) 依據(jù)設備供應商提供的RSSI與距離的關系表,如表2所示。RSSI低于-80 dBi的設備,RSSI為-80 dBi的Wi-Fi設備大約對應于距離Wi-Fi探針的40 m,據(jù)此可篩除非站內或距離擁堵點較遠的Wi-Fi設備。

      表2 RSSI與距離間的關系表

      (3) 為了解決由于工作人員或乘客在站內來回走動而產(chǎn)生的重復計數(shù)問題,步驟如下:

      第一步以第1 min到第5 min的MAC地址創(chuàng)建第一個循環(huán)塊。

      第二步檢測第6 min與第一個循環(huán)塊中是否出現(xiàn)相同的MAC地址,若重復則剔除。

      第三步以第2 min到第6 min的MAC地址創(chuàng)建第二個循環(huán)塊,并檢測第7 min與第二個循環(huán)塊,若重復則剔除。重復以上步驟對5 min時間間隔的MAC地址進行檢測去重。

      2 基于Apriori算法建立關聯(lián)探針組

      在地鐵站內,各擁堵點間的客流量存在相關性,臨近探針的檢測范圍也可能存在重疊性。因此,應對探針數(shù)據(jù)間與擁堵點區(qū)域實際客流數(shù)據(jù)間進行相關性分析,從而獲得能用于估計擁堵點實際客流量的獨立關聯(lián)探針組。為了探究擁堵點間的Wi-Fi探針是否存在相關性,以擁堵點間布設探針采集的MAC地址建立關聯(lián)數(shù)據(jù)庫,采用Apriori算法進行關聯(lián)探針規(guī)則挖掘。

      Apriori算法是關聯(lián)規(guī)則常用、經(jīng)典的數(shù)據(jù)挖掘頻繁集的算法,其核心思想是通過連接產(chǎn)生候選項及其支持度,然后通過剪枝生成頻繁項集[7]。關聯(lián)規(guī)則的一般形式:

      (1) 關聯(lián)規(guī)則的相對支持度:項集A、B同時發(fā)生的概率:

      Support(A→B)=P(A∪B)=

      (1)

      (2) 關聯(lián)規(guī)則的置信度:項集A發(fā)生,則B發(fā)生的概率:

      Confidence(A→B)=P(A∪B)=

      (2)

      判斷強規(guī)則的依據(jù):最小支持度和最小置信度。最小支持度是衡量支持度的閾值,表示項目集在統(tǒng)計意義上的最低重要性;最小置信度是衡量置信度的閾值,表示關聯(lián)規(guī)則的最低可靠性。同時滿足最小支持度與最小置信度的閾值稱為強規(guī)則。

      探針關聯(lián)規(guī)則建立包括數(shù)據(jù)的采集、數(shù)據(jù)過濾、建立Apriori關聯(lián)規(guī)則模型、產(chǎn)生強規(guī)則、得到關聯(lián)探針組,如圖1所示。

      圖1 關聯(lián)規(guī)則建立流程

      3 客流量估計模型

      神經(jīng)網(wǎng)絡算法具有較強的非線性處理的能力,能夠很好地解決隨機性與非線性問題,但BP神經(jīng)網(wǎng)絡的本質為梯度下降法的求最優(yōu)的問題,容易陷入局部無窮小,造成局部收斂或無法收斂的問題[8-9]。因此,本文添加動量因子及自調整學習速率對傳統(tǒng)的BP神經(jīng)網(wǎng)絡進行改進,以過濾學習訓練過程中高頻振蕩,使得學習速率以取得較大的值,加快學習速率。

      3.1 網(wǎng)絡結構設計

      本文利用關聯(lián)規(guī)則得到的關聯(lián)探針組作為神經(jīng)網(wǎng)絡的輸入層,采用三層的神經(jīng)網(wǎng)絡結構進行實際客流量估計模型的建立。擁堵點客流量估計神經(jīng)網(wǎng)絡結構圖如圖2所示。

      圖2 擁堵點客流量估計神經(jīng)網(wǎng)絡結構圖

      x1,x2,…,xi為關聯(lián)探針組在工作日早高峰兩小時每5 min檢測的MAC地址數(shù),其中:i表示關聯(lián)探針組中探針的個數(shù);wih為輸入層與隱含層連接權值;wh0為隱含層與輸出層連接權值;bh為隱含層各神經(jīng)元的閾值;b0為輸出層各神經(jīng)元的閾值;Y為擁堵位置客流量的估計值。

      輸入神經(jīng)元個數(shù)和輸出神經(jīng)元個數(shù)決定隱含層的個數(shù)。已有建議值為:

      (3)

      式中:K為隱層的神經(jīng)元個數(shù),n、m分別為輸入神經(jīng)元數(shù)和輸出神經(jīng)元數(shù),N為樣本容量。本預測模型的隱層神經(jīng)元個數(shù)在上述建議值的基礎上經(jīng)多次計算試驗得到。

      3.2 網(wǎng)絡學習規(guī)則

      為了有效解決BP神經(jīng)網(wǎng)絡易陷入局部極小值與無法收斂等問題,本文添加動量和自動調整學習速率的學習規(guī)則,經(jīng)過多次試驗該學習規(guī)則預測精度最高,學習規(guī)則修正權值Δwij的表達形式如下:

      (4)

      式中:e為期望輸出與實際輸出的誤差;η為網(wǎng)絡的學習速率(η>0),當η取值過小時,網(wǎng)絡收斂慢;當η取值過大時,學習過程變得不穩(wěn)定導致誤差過大;γ是動量因子(0<γ<1),通過引入γ可避免學習的不穩(wěn)定和局部收斂。

      學習率η和動量因子γ的恰當選取通常憑經(jīng)驗和實驗選取。本文中γ的值將結合具體算例經(jīng)過計算實驗選取得出,而η是自適應調整的。經(jīng)驗表明,學習率的增加量最好是常數(shù),但它的減小應按幾何律減小,本文采取的自適應函數(shù)如下:

      (5)

      式中:Δe為每次迭代誤差函數(shù)的變化;a、b為適當?shù)某?shù)。

      3.3 網(wǎng)絡訓練停止規(guī)則

      本預測模型以N個樣本的方差小于收斂閾值作為訓練的收斂條件,公式如下:

      (6)

      4 算例驗證

      以上海徐涇東地鐵站作為數(shù)據(jù)采集的實驗車站,采集站廳層安檢至進站閘機區(qū)域內的客流數(shù)據(jù)。該區(qū)域內包括安檢、進站通道、售票區(qū)、出入口和進站閘機五個易發(fā)生擁堵的位置,共布設5臺AP設備,布設方案如圖3所示?;?017年5月某工作日連續(xù)五天早高峰兩小時的客流數(shù)據(jù)約800萬條作為樣本數(shù)據(jù),并通過站內監(jiān)控錄像人工計數(shù)獲取實際客流量。

      圖3 站廳層Wi-Fi探針布局圖及探針布設方案

      4.1 算法設計

      步驟1采集源數(shù)據(jù),本算例以站廳層進站安檢至進站閘機區(qū)域的五個探針(A、B、C、D、E)作為分析對象,獲取五個探針在工作日早高峰兩小時的MAC地址,并統(tǒng)計每5 min的MAC地址數(shù)。

      步驟2源數(shù)據(jù)預處理。利用過濾算法剔除Wi-Fi探針在采集環(huán)境中捕獲的干擾數(shù)據(jù),包括非站內、頻率過低、來回走動的設備。圖4為Wi-Fi探針A數(shù)據(jù)在高峰一小時內過濾前后的對比圖,可見經(jīng)過預處理后,探針A的數(shù)據(jù)在0~200范圍內波動且波動較為平緩。

      圖4 Wi-Fi探針A采集數(shù)據(jù)過濾前后對比圖

      步驟3利用Apriori算法對擁堵點間五個探針進行關聯(lián)挖掘:

      將采集五天早高峰兩小時的MAC地址建立關聯(lián)規(guī)則挖掘的數(shù)據(jù)庫,作5 min間隔統(tǒng)計并記錄間隔內出現(xiàn)相同MAC地址的探針。若5 min間隔內出現(xiàn)共同MAC地址則記錄相應的代表字母。

      根據(jù)關聯(lián)數(shù)據(jù)庫產(chǎn)生頻繁項集,首先產(chǎn)生候選集Ck,即可能成為頻繁項集的項目集合,集合{A,B,C,D,E}為初始頻繁項集。然后利用候選集Ck計算支持度確定最大頻繁項集Lk。設定最小支持度為0.2,最小置信度為0.5,運用Python實現(xiàn)結果如表3所示。從表可見,B、D→A的置信度為0.714 8>0.5,A、D→B的置信度為0.833 3>0.5,說明探針A、B、D為強關聯(lián),則探針A、B、D為該擁堵點的關聯(lián)探針組。

      表3 Apriori算法關聯(lián)結果統(tǒng)計表

      步驟4構建神經(jīng)網(wǎng)絡模型。選取關聯(lián)探針組作為神經(jīng)網(wǎng)絡的輸入,實際客流量作為實際輸出,根據(jù)訓練調整相關參數(shù),建立神經(jīng)網(wǎng)絡預測模型。相關參數(shù)初始設置如表4所示。

      表4 網(wǎng)絡訓練參數(shù)設置

      步驟5預測結果誤差分析。

      4.2 結果分析

      建立的關聯(lián)探針組與實際客流量建立BP神經(jīng)網(wǎng)絡在MATLAB 2015b中實現(xiàn)訓練,神經(jīng)網(wǎng)絡訓練的過程如圖5所示。

      圖5 神經(jīng)網(wǎng)絡訓練過程

      (1) 穩(wěn)定性評價:將120組到站時間預測值與實際值進行對比,如圖6所示。

      圖6 網(wǎng)絡輸出預測客流量和實際客流量對比圖

      從圖中可以看出,預測值曲線與實際值曲線的重合度較高,根據(jù)預測客流量與實際客流量得到最大絕對偏差值為28人,在可接受的預測誤差閾值以內,說明該模型的穩(wěn)定性較好。

      (2) 精確性評價。預測結果的相對誤差箱型圖如圖7所示。

      圖7 預測結果的相對誤差柱狀圖

      由圖7可見:

      (1) 在工作日中,相對誤差絕大部分數(shù)據(jù)在[-20%,20%]區(qū)間內波動。星期三的平均相對誤差較高,而星期四的平均相對誤差較低。

      (2) 星期三、星期五的相對誤差分布比較集中且非常對稱,星期一、星期二及與星期二的相對誤差較分散且非常不平衡。

      (3) 星期三對應的箱形圖出現(xiàn)了3個異常點,分別對應8:50~8:55的5 min內相對誤差為23%、8:05~8:10的5 min內相對誤差為17%、7:00-7:05的5 min內相對誤差為-14%;星期五出現(xiàn)1個異常點,對應8:45~8:50的5 min內相對誤差為5%。

      為了對比標準BP神經(jīng)網(wǎng)絡與改進后BP神經(jīng)網(wǎng)絡算法在客流估計訓練過程中優(yōu)異,本文采用不同的精度進行訓練仿真,結果如表5所示。顯然,在訓練學習速率和訓練精度上改進BP算法要優(yōu)于標準BP神經(jīng)網(wǎng)絡算法。

      表5 改進BP神經(jīng)網(wǎng)絡與傳統(tǒng)神經(jīng)網(wǎng)絡對比

      5 結 語

      基于上海軌道交通地鐵車站,本文對Wi-Fi探針獲取擁堵點的Wi-Fi設備數(shù)據(jù)進行了初步的分析及客流量估計模型的初探。從分析結果看,Wi-Fi探針采集客流的技術條件已經(jīng)具備且采集的客流數(shù)據(jù)質量基本滿足客流模型分析的要求。但由于部分乘客不攜帶Wi-Fi設備或不開啟Wi-Fi模塊功能等因素造成數(shù)據(jù)缺失的問題,再加上針對數(shù)據(jù)的加工處理、數(shù)據(jù)還原、估計模型精度的提高依然面臨極大挑戰(zhàn),這也是未來研究的重點方向。

      猜你喜歡
      客流量客流探針
      客流增多
      基于嵌入式系統(tǒng)的商場客流量統(tǒng)計算法
      多通道Taqman-探針熒光定量PCR鑒定MRSA方法的建立
      BOPIM-dma作為BSA Site Ⅰ特異性探針的研究及其應用
      北京信息科技大學學報(自然科學版)(2016年5期)2016-02-27 06:31:37
      基于AFC數(shù)據(jù)的城軌站間客流量分布預測
      人工免疫算法在電梯客流時段劃分的應用
      透射電子顯微鏡中的掃描探針裝置
      物理實驗(2015年9期)2015-02-28 17:36:47
      城市軌道交通運營客流數(shù)據(jù)分析缺陷及應對
      從客流量推算公交出行PA矩陣的方法
      博白县| 广宗县| 石柱| 临漳县| 丰镇市| 徐水县| 上饶县| 洛川县| 洪湖市| 台东市| 藁城市| 福建省| 灵武市| 尼玛县| 池州市| 新乐市| 泸溪县| 滨海县| 汉川市| 建平县| 恩施市| 罗山县| 南澳县| 新蔡县| 灵武市| 凯里市| 大方县| 辽阳市| 江津市| 阿拉善右旗| 泰州市| 响水县| 兰考县| 京山县| 静海县| 河西区| 宝应县| 广昌县| 略阳县| 周口市| 延川县|