• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Mean Shift 的公交下車站點判定方法

      2021-04-23 05:50:52溫曉麗何子登余紅玲鄒大畢
      軟件導刊 2021年4期
      關鍵詞:居住地公交站點

      溫曉麗,何子登,余紅玲,鄒大畢

      (廣州羊城通有限公司,廣東廣州 510080)

      0 引言

      近年來,隨著廣州市城鎮(zhèn)化發(fā)展進程加快,城市公交線網面臨越來越大的壓力,研究如何提升交通運行效率、優(yōu)化公交線網布局、升級交通出行服務等成為業(yè)界關注的焦點。目前,廣州市公交車普遍安裝了進出站監(jiān)測系統(tǒng)與車載GPS 導航定位設備,按時序記錄公交車進出站信息及GPS 行車軌跡數據。所有連續(xù)運行的公交車輛和眾多的乘客刷卡交易形成了城市公共交通運行及乘客出行大數據,但公交收費多采用“一票制”,只有上車刷卡數據,沒有下車刷卡數據。為進一步研究乘客出行時間、空間及公交系統(tǒng)客流量特征,首先需要確定乘客公交下車站點及下車時間,以公交IC 卡為主的數據分析方法仍是當前公交客流OD 研究的主流做法。國外學者的研究大多基于出行鏈思想,利用AFC、車輛自動定位系統(tǒng)、地鐵公交聯(lián)合數據等,分析推導公交客流與出行時間變化特征等,并驗證城市交通出行過程的連續(xù)性[1-8]。國內學者研究主要集中于IC 卡下車站點的推導,如胡郁蔥等[9]通過IC 卡數據挖掘技術獲取公交OD 矩陣;陳崢嶸[10]將智能公交數據處理方法應用于公交客流OD 研究;胡繼華等[11]提出結合出行鏈的IC 卡公交客流研究方法。

      本文以廣州市一卡通交易數據為實例進行分析研究,根據出行鏈思想,對乘客的連續(xù)交易行為進行分析。以卡交易數據、公交進出站數據和線路站點數據為基礎,針對完整的公交出行鏈,提出一種可判定公交下車站點的最近鄰算法;針對出行鏈不完整的情況,根據乘客長期出行的時空規(guī)律性,通過分析用戶中長期歷史交易情況,提出采用Mean Shift 算法計算乘客的居住地(O)和工作地(D),再利用OD 預測不完整出行鏈里交易記錄的下車站點[12-14]。通過這兩種方法,可補充85% 的公交交易數據,并抽取部分用戶的下車站點數據進行驗證。結果表明,該方法準確率較高,因此具有一定的研究價值。

      1 數據簡介

      本文數據來源于廣州羊城通卡在公交、地鐵場景下的交易數據,公交公司提供的每天進出站數據以及線路站點數據。在“一票制”收費模式下,公交交易數據中包含邏輯卡號、車輛車牌號、班次、線路編碼、上車站點編碼、上車站點及其經緯度、上車時間等信息,但不包含下車站點和下車時間信息。地鐵交易數據中包含邏輯卡號、地鐵進出站站點、進出站時間以及進出站站點經緯度等信息。

      公交車的進出站監(jiān)測系統(tǒng)記錄了所在公交車輛的進出站數據,公交交易數據與公交進出站數據之間存在著對應關系。每輛車都有一個智能調度編號,根據該編號對進出站數據預先劃分好班次,如表1 所示。

      Table 1 Bus frequency information表1 公交車輛班次信息

      Table 2 Bus line stop information表2 公交線路站點信息

      在下車站點判定過程中,本文提出采用地鐵數據和公交數據聯(lián)合分析的方法,采用基于出行鏈的乘客下車站點概率模型進行下車站點判定。

      2 最近鄰推算下車站點算法

      基于廣州市公交交易和地鐵交易的融合數據,按照每個用戶刷卡進站或上車時間對所有交易排序,分析每天有N(N>1)次乘車記錄的乘客出行特點。本文將廣州市常駐人口每天的出行劃分為居住地和工作地,居住地和工作地范圍內聚集公交站點或地鐵站點。大多數上班族用戶每天上午從居住地選取一個站點出發(fā),下午從工作地選取一個站點乘車回家。假定這些乘客的出行鏈是閉合的,則用戶出行方式可歸納為以下兩類情況,如圖1 所示。

      第一類為對稱出行,這類乘客的出行路徑可歸納為H->W->W->H,中間沒有換乘或僅有一兩次換乘,這類乘客最典型的代表就是通勤族或學生;第二類為非對稱出行,這些乘客的出行路徑歸納為H->T1->T2->T3->H(Ti指臨時地),中間可能經過一次或N 次臨時換乘站點,其出行不具有時空規(guī)律性。

      假設乘客在一次乘車記錄中,上車站點為Si,Si∈LA,所屬線路是LA{S1,S2,S3,…},則此次下車站點Sj滿足如下條件:Sj∈Li,j>i。

      Fig.1 User travel mode圖1 用戶出行方式

      最近鄰下車站點判定可描述為:

      (1)按天輸入某個用戶按進站時間排序的交易信息列表:lno:{on_station_time1,on_station_time2…,on_station_timei,… on_station_timelast}。

      (2)如果只有一條記錄,先不作處理。如果有多于兩條記錄,按順序讀取第i 條和i+1 條,如果i 是最后一條記錄,則讀取第i 條和0 條。從0 開始遍歷信息列表,分別讀取相鄰兩次刷卡站點為Si和S(i+1)%last。相鄰兩次交易的下車站點判定如圖2 所示。

      受道教風水學說的影響,古代朝鮮創(chuàng)作了眾多堪輿主題的小說,在這些小說中,堪輿成為小說敘事的主線,貫穿故事始終。 如《定名穴牛臥林間》中,講述了湖西士人為得名穴,誠意侍奉地師樸尚義,無奈樸尚義恃術驕縱,千般推辭,湖西士人一怒之下剝掉樸的衣服,將其緊縛于松樹上。 恰巧遇到尹氏搭救,樸尚義才幸免于死。 樸感念尹氏的再生之恩,遂幫助尹氏相地,但終未告知吉穴所在。 后來尹氏遍請地師占正穴,仍然求之不得。 一日,竟在牛臥之地得到正穴。 移葬親山后,家族逐漸顯赫起來。

      Fig.2 Off site determination of two adjacent transactions圖2 相鄰兩次交易的下車站點判定

      (3)判斷遍歷到的相鄰兩條記錄是否屬于B->B,B->R這類換乘方式,如果屬于這兩種情況,計算Si站點所在線路下游站點LA{Sj},j>i。計算下游每個站點Sj與S(i+1)%last的歐式距離D(Sj,S(i+1)%last),如果D(Sk,Sj)<d(d為指定的一個距離閾值),則放入備選集合R{S1,S2,S3…}。如果相鄰兩條交易記錄為R->R,R->B,則不作處理。

      (4)計算結果集的所有D(Sj,S(i+1)%last)距離,選取其中的最小距離min(D(Sj,S(i+1)%last))站點作為第i 條公交交易記錄的下車站點。如果R 為空,說明下游每個站點Sj與S(i+1)%last的距離都不小于d,認為出行鏈斷裂,先不作處理。對于第i(1<i<last)條公交交易記錄,屬于中途斷裂的,無法確定其下車站點。在R 集中,如果最小站點距離為0,則屬于同站換乘。

      3 Mean Shift 算法

      3.1 Mean Shift 算法計算OD

      每個乘客的居住地或工作地附近會有很多不同的公交站點或地鐵站點,乘客會選擇不同的站點乘車上下班。分析乘客的長期交易記錄,采用求密集點中心的方法得出居住地或工作地的中心點。每一個密集點中心有一個點x,周圍有很多個點xi,采用Mean Shift 算法計算點x 移動到每個點xi所需的偏移量之和,求平均數后得到包含大小和方向的平均偏移量(該偏移量方向是周圍點分布密集的方向)[14-17]。然后,點x 往平均偏移量方向移動,再以此為新起點不斷迭代,直到滿足一定條件后結束。

      給定d 維空間Rd的n 個樣本點,i=1,…,n,在空間中任選一點x,則Mean Shift 向量基本形式定義為:

      Sk是一個半徑為h 的圓形區(qū)域,滿足以下關系的y 點集合:

      k 表示在n 個樣本點xi中,有k 個點落入Sh區(qū)域。在二維坐標中任選一個點,然后以該點為圓心、h 為半徑作圓。落在該圓內的所有點和圓心都會產生一個向量,向量以圓心為起點,以落在圓內的點為終點,然后將這些向量相加求平均得到Mean Shift 向量。如圖3 所示,灰色箭頭為Mh(Mean Shift 向量),以Mean Shift 向量終點為圓心,再作一個二維的圓。重復以上步驟,可再得到一個Mean Shift 向量,如此重復,Mean Shift 向量收斂至概率密度最大的地方。

      Fig.3 The process of finding the center of dense points圖3 求密集點的中心點過程

      結合廣州市常駐人口在工作地和居住地的實際出行場景,根據乘客通勤出行的時空規(guī)律性,分析地面和軌道交通中長期的海量交易數據。假定用戶工作日上午最早的一次交易記錄或非工作日第一次交易記錄的上車站點坐標<home_lon,home_lat>屬于居住地范圍,工作日下午最晚一次交易記錄的上車站點坐標<work_lon,work_lat>屬于工作地范圍。

      少數情況下可能先以非公交方式中途換乘其它地點,再搭乘公交回居住地。這些非工作地或居住地的坐標較為離散,可采用Mean Shift 算法求密集點的中心點。分析多天的居住地坐標{<home_lon1,home_lat1>,<home_lon2,home_lat2>,<home_lon3,home_lat3>…},得到用戶居住地的中心點O,并用類似方法得到用戶工作地的中心點D。

      3.2 斷裂出行鏈的OD 補充算法

      (1)出行鏈尾部斷裂的下車站點算法。lno:{on_station_time1,on_station_time2…,on_station_timei,…on_station_timelast},on_station_timei<13:00:00。針對實際場景中乘客出行記錄都在上午的情形,通過最近鄰站點算法進行計算,判斷當天最后一次交易記錄和首次交易記錄的結果集R 是否為空,如果不為空,這些乘客在上午完成一次H->T->H(T 指臨時地);如果為空,說明乘客出行鏈斷裂,不是回家。對于這些出行鏈尾部斷裂的乘客,假定是前往工作地,如圖4 所示。針對當天上午最后一次公交交易記錄,計算下游站點與工作地中心點D 的距離D(Sj,D),設定另外一個閾值d2,從小于d2的結果集R 中選取距離最小的站點作為最后一次公交下車站點[18-21]。

      Fig.4 The end of travel chain is broken圖4 出行鏈尾部斷裂

      (2)出行鏈頭部斷裂的下車站點算法。lno:{on_station_time1,on_station_time2…,on_station_timei,…on_station_timelast},on_station_timei>13:00:00。針對實際場景中乘客出行記錄都在下午的情形,假定這些乘客無論是否上班,最終都要回居住地。對于出行鏈頭部斷裂的乘客,計算與居住地中心點O 的距離小于d2的結果集R,從R 中選取距離最小的站點作為最后一次公交的下車站點,如圖5所示。

      Fig.5 The head of travel chain is broken圖5 出行鏈頭部斷裂

      (3)不可預測的斷裂出行鏈。經過上述兩步處理后,對于R 集合為空的情況,這類乘客的出行鏈被劃分為不可預測的斷裂出行鏈。這類乘客中途可能因為其它原因選擇非公交的其它出行方式,或者下班后去其它地方,或者上午不去上班,無法作出預測,如圖6 所示。

      Fig.6 Situations unable to predict the drop-off point圖6 無法預測下車站點的情形

      3.3 下車時間補充

      進出站信息表里記錄了每輛公交在每個班次進入每個站點的時間enter_time。通過上述兩階段能確定下車站點名稱off_station_name 和下車站點編號off_station_no,根據乘客當天所乘公交車的車牌號、所屬班次信息,聯(lián)合當天進出站信息中對應車輛的車牌號、班次信息,并根據下車站點編號對應的下車站點信息,以enter_time 時間補充作為此交易記錄下車站點的下車時間。

      4 實驗結果與分析

      以廣州市2019 年12 月12 日的公交和地鐵交易數據為例進行研究,剔除站點坐標有誤差的交易記錄,提取樣本總交易記錄1 413 202 條。根據站點服務便利水平,設置連乘距離閾值d=1km。第一階段補充下車站點數據為769 370,占總數據量的55%,如表3 所示。

      Table 3 Supplementary drop-off station of the first stage表3 第一階段補充下車站點

      實驗進一步采用Mean Shift 算法計算乘客居住地與工作地的中心坐標,分析近2 個月的公交地鐵交易數據,得出用戶的OD 坐標信息(居住地中心和工作地中心),如表4、表5 所示。

      第二階段設置閾值d2=1.5km,利用用戶的OD 坐標信息,補充下車站點后得到的下車站點數據量為1 201 217,占總數據量的85%。

      Table 4 User OD coordinate information 1表4 用戶OD 坐標信息1

      Table 5 User OD coordinate information 2表5 用戶OD 坐標信息2

      5 結語

      本文利用出行鏈的方式,分析了廣州市的公交交易數據和地鐵交易數據,對于連續(xù)出行的乘客,對本次乘車站點所在線路的下游站點與下次乘車上車站點的距離進行比較,取閾值內距離最小的站點作為下車站點。采用聚類算法進行工作地與居住地計算,使用工作地中心和居住地中心對公交交易數據作進一步補充,實驗證明該方法較為有效,準確率高。另外,通過對基于Mean Shift 的公交下車站點判定方法的研究,有助于公交線路優(yōu)化和公交車輛調度,進一步改善城市公交運營服務,提升居民的公共交通出行效率。

      猜你喜歡
      居住地公交站點
      一元公交開進太行深處
      基于Web站點的SQL注入分析與防范
      電子制作(2019年14期)2019-08-20 05:43:42
      2017~2018年冬季西北地區(qū)某站點流感流行特征分析
      等公交
      鳥類居住地
      等公交
      Binturong熊貍
      麋鹿&大象
      首屆歐洲自行車共享站點協(xié)商會召開
      中國自行車(2017年1期)2017-04-16 02:53:52
      怕被人認出
      故事會(2016年21期)2016-11-10 21:15:15
      洛隆县| 吉林市| 汝南县| 濉溪县| 西和县| 托里县| 龙州县| 扎赉特旗| 大安市| 灌阳县| 乌恰县| 汕尾市| 泰和县| 昌江| 九江市| 平舆县| 绍兴市| 曲沃县| 文登市| 和顺县| 铜山县| 达孜县| 海淀区| 浦县| 长岛县| 韶关市| 合山市| 宁强县| 南安市| 商洛市| 双城市| 洪雅县| 游戏| 绍兴县| 龙海市| 顺平县| 高唐县| 尼木县| 花垣县| 靖江市| 嵊泗县|