• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于多源城市交通出行數(shù)據(jù)的定制公交需求辨識方法研究

      2020-11-26 09:01:42陳汐王印海代壯馬曉磊
      大數(shù)據(jù) 2020年6期
      關鍵詞:IC卡公交站點

      陳汐,王印海,代壯,馬曉磊,4

      1. 北京航空航天大學交通科學與工程學院,北京 100191;2. 美國華盛頓大學土木和環(huán)境工程系,美國 西雅圖 98195;3. 西南交通大學交通運輸與物流學院,四川 成都 610031;4. 北京航空航天大學大數(shù)據(jù)科學與腦機智能高精尖創(chuàng)新中心,北京 100191

      1 引言

      優(yōu)先發(fā)展公共交通是我國城市發(fā)展和交通發(fā)展的重大戰(zhàn)略方針,且“公交都市”戰(zhàn)略中也提出要構建多模式公交系統(tǒng),以實現(xiàn)新時期城市交通的轉型發(fā)展。目前公眾對城市交通出行個性化、精細化和品質化的要求逐漸提高,因此發(fā)展多元化的公交出行服務模式已成為必要趨勢。在此背景下,具有需求響應、運行靈活等特點的定制公交開始運營。定制公交通過整合個體的出行需求,為出行起終點(origindestination,OD)、出行時段、服務水平相似的人群(如通勤用戶)提供個性化的公共交通服務[1-2]。常規(guī)公交與定制公交的特點對比見表1。這種新的公交服務模式被認為能夠有效吸引私家車出行用戶轉向乘坐公共交通出行。此外,全國各主要城市在新型冠狀病毒肺炎疫情防控期間也推出了針對通勤用戶的“復工定制公交”線路,保證乘客“一人一座”,以提升市民出行的便捷性和安全性??梢?,定制公交可以作為個性化和精細化出行需求市場中一種很好的補充形式[4]。

      近幾年,“互聯(lián)網(wǎng)+交通”的發(fā)展趨勢有效地促進了定制公交這種新的出行模式在國內的推廣、普及。運營企業(yè)通過搭建線上平臺采集出行需求,用戶通過手機App等渠道提出個性化的出行需求?;诖髷?shù)據(jù)挖掘、人工智能算法、物聯(lián)網(wǎng)等技術手段完成對出行需求的整合、線路的規(guī)劃、運營車輛的調配以及服務信息發(fā)布等環(huán)節(jié)[1-4]。在線路的實際運營中,公交企業(yè)接收乘客反饋的建議,不斷對現(xiàn)有線路進行調整、優(yōu)化,逐步提升服務質量,使定制公交的運營模式形成完整的閉環(huán)。針對以上定制公交服務設計流程,已有文獻對其中涉及的相關理論方法進行了研究。但大部分文獻對出行需求的分析基于小范圍出行需求進行調查,對于城市級的線路設計及大規(guī)模出行分析,存在研究群體相對較少、數(shù)據(jù)周期短、分析的準確度有偏差等問題。隨著移動通信及互聯(lián)網(wǎng)技術的發(fā)展,針對城市居民的出行需求,實現(xiàn)了由單一數(shù)據(jù)源到多源數(shù)據(jù)的采集,如從單一的調查數(shù)據(jù)的收集,到公交IC卡、手機導航應用的普及,這些技術手段可以采集到大量的出行信息。這些海量、多源的出行數(shù)據(jù)可以很好地解決單一調查數(shù)據(jù)難以挖掘城市居民出行規(guī)律的問題。因此,如何在多種出行模式下分析乘客的出行規(guī)律、融合出行需求,特別是辨識乘客的通勤行為、挖掘用戶職住地,輔助定制公交的線路設計以提高其上座率和服務率,是值得深入探討的問題。

      表1 常規(guī)公交與定制公交特點對比

      多源交通出行數(shù)據(jù)符合大數(shù)據(jù)的“4V”特征,即規(guī)模性(volume)、多樣性(variety)、價值性(value)和高速性(velocity)[5]。第一,公共交通數(shù)據(jù)和新型互聯(lián)網(wǎng)數(shù)據(jù)的體量巨大。據(jù)相關統(tǒng)計數(shù)據(jù),來自政府及互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)量正從TB量級增長到PB(EB)量級。第二,本文涉及的相關數(shù)據(jù)類型繁多,即異構多源,包括IC卡、車載GPS、出行導航和規(guī)劃數(shù)據(jù)等。第三,多源出行數(shù)據(jù)具有實時性特點,即出行需求數(shù)據(jù)可以被實時地采集,并反饋給相關企業(yè)的調度和決策人員,研究者需要關注數(shù)據(jù)的計算效率問題。第四,多源交通出行數(shù)據(jù)的價值密度低,但是商業(yè)價值高。例如,車載GPS會實時地傳回大量數(shù)據(jù),但是對于特定的公交運營或調度目的,只需要對其中某些數(shù)據(jù)或字段進行分析。由于多源交通出行數(shù)據(jù)具有以上特征,在分析挖掘時會存在一些難點。第一,在海量數(shù)據(jù)中挖掘所需的有價值的信息是本文的難點之一;第二,本文重點關注異構多源這一特征。異構通常指不同形式或類型的數(shù)據(jù)[6],多源指來源不同的數(shù)據(jù),如公交數(shù)據(jù)包括靜態(tài)數(shù)據(jù)、IC卡數(shù)據(jù)等,新型互聯(lián)網(wǎng)數(shù)據(jù)包括導航數(shù)據(jù)和規(guī)劃數(shù)據(jù)等。對單一數(shù)據(jù)源的分析與挖掘已有大量文獻進行了相關討論,如公交乘客上下車站點的推斷、乘客出行行為分析等相關研究。相比之下,對多源數(shù)據(jù)的分析和應用依舊值得進一步探討。本文討論的多源出行數(shù)據(jù)具有多源和異構兩種性質。因此,將多源數(shù)據(jù)進行融合,最大化地挖掘、提煉每種數(shù)據(jù)的價值以輔助定制公交的設計,是本文重點關注的問題,也是難點之一。

      此外,不同類型的出行數(shù)據(jù)來自多個部門和企業(yè),存在數(shù)據(jù)單位或者數(shù)據(jù)存儲格式不一致的問題。因此在融合過程中還需要考慮數(shù)據(jù)一致性問題。

      基于上述原因,本文在“互聯(lián)網(wǎng)+交通”的大背景下,探究了如何利用多源出行數(shù)據(jù)挖掘城市出行需求,以輔助定制公交的服務設計,并探索了一套從數(shù)據(jù)處理到出行需求分析的流程。特別是針對新型互聯(lián)網(wǎng)數(shù)據(jù),提出了互聯(lián)網(wǎng)用戶的通勤需求識別方法、互聯(lián)網(wǎng)數(shù)據(jù)與傳統(tǒng)公交數(shù)據(jù)的融合算法。最后,將該分析流程應用到成都市的出行數(shù)據(jù)中,以驗證該方法在處理城市級規(guī)模問題中的有效性。

      2 基于多源數(shù)據(jù)的挖掘分析框架

      Liu T和Ceder A在參考文獻[1]中針對國內定制公交的運營與規(guī)劃進行了系統(tǒng)的梳理,其線路設計如圖1所示。其中,出行需求的提取是后續(xù)設計流程的基礎,也是本文重點討論的問題,不同于以往研究偏重于利用調查數(shù)據(jù)或單一數(shù)據(jù)源,本文討論利用多源出行數(shù)據(jù)對需求進行挖掘分析,具體步驟如下。

      步驟1:出行需求分析。出行需求的獲取可以為后續(xù)線路規(guī)劃模型的設計提供準確的數(shù)據(jù)基礎。對于定制公交,該步驟的主要目的是獲得乘客準確的出發(fā)地與目的地等資料。不同于出行調查直接獲取相關信息,本文通過多源數(shù)據(jù)挖掘乘客的出行信息。因此,如何在海量數(shù)據(jù)中識別乘客的出行起終點信息,進一步辨識乘客的出行行為,特別是通勤行為,是需要解決的難點之一。

      步驟2:出行區(qū)域聚類/交通小區(qū)劃分。在設計線路時,每個出行區(qū)域或交通小區(qū)都是線路的構成元素。若出行區(qū)域范圍劃分得過大,則線路中的走行區(qū)域減少,有利于降低線路成本,但是會導致乘客到站點的走行距離變長,降低定制公交的吸引力,且定制公交的目的是為出行需求相似的用戶提供個性化、便捷的公交服務。因此,目前多數(shù)研究通過聚類方法將出行起終點相似的需求進行聚類,并考慮每個區(qū)域的覆蓋半徑,以控制乘客到站點的走行距離,達到平衡乘客和運營者雙方利益的目的。在出行區(qū)域劃分完畢之后,運營者可在區(qū)域內靈活選擇上下車站點位置。

      步驟3:線路設計。在確定好每個出行區(qū)域,并且選擇好站點位置之后,可將提取的需求投影到各出行區(qū)域(站點)之中,進而得到一張起終點需求表。以此需求為基礎,可以構建線路規(guī)劃模型。模型的優(yōu)化可以從乘客、運營商、環(huán)境和社會效益幾個方面來考慮,再通過算法進行求解,最終得到線路運營方案。

      值得注意的是,在實際運營中,該框架是反復迭代的過程,乘客的出行需求是動態(tài)變化的,應根據(jù)運營狀況,結合出行數(shù)據(jù)和乘客反饋,定期更新需求及線路,以提升服務質量。本文重點討論步驟1和步驟2,對于步驟3中的線路設計問題,很多文獻將其歸結為車輛路徑問題(vehicle routing problem,VRP)或者裝卸貨(接乘)問題(pickup and delivery problem,PDP),并進行了很多討論。本文僅在實例分析中展示部分線路設計的結果,不將其作為本文重點研究的問題。

      3 多源交通出行數(shù)據(jù)

      本文涉及的數(shù)據(jù)來源主要包括兩個部分:一類是傳統(tǒng)公交數(shù)據(jù),包括IC卡、車輛GPS數(shù)據(jù)、公交靜態(tài)數(shù)據(jù);另一類是新型互聯(lián)網(wǎng)數(shù)據(jù),即用戶使用手機導航App產生的出行記錄,包括手機規(guī)劃數(shù)據(jù)和手機導航數(shù)據(jù)。

      3.1 傳統(tǒng)公交數(shù)據(jù)

      (1)公交IC卡數(shù)據(jù)

      不同運營商對應的IC卡數(shù)據(jù)結構可能不相同,如單一票制收費系統(tǒng)中只需上車刷卡,無下車刷卡記錄。而北京等城市采用分段計費模式,刷卡系統(tǒng)中可以記錄乘客的上下車站點信息。因此,目前我國的城市公交還沒有形成統(tǒng)一的刷卡數(shù)據(jù)采集和存儲規(guī)范[7]。但IC卡中存儲的數(shù)據(jù)依舊可以反映城市居民的出行情況。表2給出了目前單一票制IC卡系統(tǒng)中存儲的主要字段及其說明。

      (2)公交車輛GPS數(shù)據(jù)

      公交車輛GPS通過經(jīng)緯度定位記錄了該車輛實時的運行狀態(tài),通常每10 s左右產生一條位置記錄。此外,在GPS的數(shù)據(jù)結構中還記錄了車輛的營運線路以及到站、離站等信息。通過分析、融合車輛的狀態(tài)信息可以還原其運行軌跡。表3給出了GPS數(shù)據(jù)包含的主要字段及其說明。

      (3)公交靜態(tài)數(shù)據(jù)

      公交靜態(tài)數(shù)據(jù)描述的是公交系統(tǒng)的整體情況,主要包括車輛、人員、線路及站點等信息,其中與本文討論相關的是站點和線路信息。公交站點的地理信息數(shù)據(jù)記錄了站點對應的編號、類型、經(jīng)緯度等信息。該信息可以與GPS數(shù)據(jù)進行匹配,從而推斷車輛到離站的具體信息[7]。此外,由于一條公交線路包含多個站點,而一個公交站點可能會出現(xiàn)在多條公交線路中,因此公交站點與線路信息表主要用于記錄線路與站點的對應關系,包含的字段內容主要有線路編號、站點的序號及編號。每條線路的基本信息一般被單獨存放在一張表中,包括線路的編號、線路運營長度、走行方向、起終站點及線路類型等信息[7]。

      3.2 新型互聯(lián)網(wǎng)數(shù)據(jù)

      (1)手機導航數(shù)據(jù)

      手機導航數(shù)據(jù)記錄了用戶在使用App時產生的實時位置信息,一般每隔5~30 s記錄一次,原始的導航數(shù)據(jù)字段內容包括用戶ID、時間戳、速度及經(jīng)緯度信息。為獲得用戶每次行程的起終點,需要對原始的軌跡數(shù)據(jù)進行預處理。根據(jù)參考文獻[8],可以設定一個時間閾值5 min,若某用戶兩條連續(xù)的出行記錄大于此閾值,那么將這兩條記錄的位置信息分別記作上一次行程的終點和下一次行程的起點。對每個用戶進行上述操作,可以得到具體的導航起終點信息,見表4。本文涉及的導航數(shù)據(jù)也可被視為私家車(駕車)出行需求。

      (2)手機規(guī)劃數(shù)據(jù)

      用戶在出行之前會查詢導航軟件,以提前對自己的行程進行規(guī)劃,這時系統(tǒng)會記錄查詢的相關信息,該信息即手機規(guī)劃數(shù)據(jù),具體內容見表5。

      表2 公交IC卡數(shù)據(jù)結構說明

      表3 車載GPS數(shù)據(jù)結構說明

      (3)興趣面數(shù)據(jù)

      本文中的興趣面(area of interest,AOI)數(shù)據(jù)是指互聯(lián)網(wǎng)地圖(如高德地圖)中的興趣面。不同于興趣點(point of interest,POI),AOI用來描述地圖中區(qū)域狀的實體,如居住小區(qū)、辦公樓、大型商圈等。每個AOI有自己的編號和用地屬性。本文涉及的AOI數(shù)據(jù)包含3種用地類型,即居住類型、辦公類型和商業(yè)類型。

      表4 手機導航數(shù)據(jù)示例

      表5 手機規(guī)劃數(shù)據(jù)示例

      3.3 數(shù)據(jù)預處理

      在進行多源大數(shù)據(jù)挖掘分析之前,通常要對數(shù)據(jù)進行清洗或預處理工作[7]。其主要目的是檢測原始數(shù)據(jù)中的錯誤,剔除對分析結果有影響的數(shù)據(jù),從而提升數(shù)據(jù)的質量。本節(jié)介紹了相關的數(shù)據(jù)預處理步驟。

      (1)剔除無用字段

      在第3.1節(jié)和第3.2節(jié)中詳細介紹了每種數(shù)據(jù)的主要字段內容。實際上,一些字段與公交的出行需求分析無關,因此可以刪除這些字段,以提升數(shù)據(jù)的分析效率。例如,在公交IC卡數(shù)據(jù)中,只需保留用戶的卡號、刷卡時間、車輛號、線路號等信息。在車載GPS數(shù)據(jù)中,公交車的行駛速度等字段信息對需求分析無影響,可以在預處理階段進行刪除。

      (2)剔除冗余數(shù)據(jù)和錯誤數(shù)據(jù)

      冗余數(shù)據(jù)主要指信息重復的數(shù)據(jù)。冗余數(shù)據(jù)的存在會對后續(xù)的分析結果產生影響。例如,在分析公交IC卡時,重復的數(shù)據(jù)信息會使出行需求的總量偏高。因此,可根據(jù)具體的分析目標對冗余數(shù)據(jù)進行處理,如進行刪除操作,以提高分析的準確性。

      受數(shù)據(jù)采集終端或通信網(wǎng)絡故障影響,采集到的數(shù)據(jù)記錄會出現(xiàn)信息錯誤的情況。例如,對于時間字段,會出現(xiàn)“24:15:00”的情形。此外,數(shù)據(jù)中還會出現(xiàn)部分字段缺失的情況。為確保后續(xù)分析結果的準確性,應對數(shù)據(jù)的有效性進行檢查,剔除錯誤或缺失的數(shù)據(jù)。

      4 分析方法

      本節(jié)根據(jù)多源數(shù)據(jù)挖掘分析框架的幾個主要步驟,從乘客的出行需求分析及站點選址(交通小區(qū)劃分)兩個方面對相關的理論方法進行介紹。

      4.1 用戶出行軌跡重構

      大數(shù)據(jù)等信息技術的應用使得交通信息的采集實現(xiàn)了從單一數(shù)據(jù)源到多源數(shù)據(jù)源的發(fā)展。在本文研究涉及的領域,傳統(tǒng)的公交IC卡數(shù)據(jù)、公交車輛GPS數(shù)據(jù)、公交靜態(tài)數(shù)據(jù)、新型互聯(lián)網(wǎng)數(shù)據(jù)為多元化的出行服務提供了豐富的數(shù)據(jù)基礎。在定制公交設計與優(yōu)化理論中,首要的任務是準確捕獲乘客的出行需求。因此,在海量數(shù)據(jù)資源下,如何有效提取用戶的出行軌跡、挖掘完整的出行信息是需要解決的問題之一。本節(jié)主要討論幾種數(shù)據(jù)類型的出行信息挖掘方法。

      4.1.1 公交IC卡數(shù)據(jù)上下車站點推斷方法

      在使用手機App乘坐公共交通普及之前,國內大部分城市的公交刷卡類型屬于單一票制[9], 即乘客只需上車刷卡,且刷卡時不會記錄站點位置信息。因此,為獲得乘客的起終點信息,需要進行上下車站點的推斷。對于單一票制的推斷,國內外已有大量研究,且方法成熟[7,9-12]。本節(jié)根據(jù)國內公交IC卡數(shù)據(jù)的特征,簡要介紹推斷方法的主要流程。

      (1)乘客上車站點識別方法

      由于公交IC卡數(shù)據(jù)不含站臺等位置信息,因此需要結合GPS數(shù)據(jù)進行上車站點的推斷。上車站點識別算法步驟如下。

      步驟1:公交GPS在運營過程中受到外部環(huán)境影響,會存在數(shù)據(jù)記錄精度有限的情況,因此首先要進行GPS數(shù)據(jù)修正[7,12],并與公交靜態(tài)數(shù)據(jù)表進行匹配。該步驟的目的是得到車輛準確的到站時刻表,該表包含線路編號、車輛編號、站點編號及到站時間等信息[7],見表6。

      步驟2:利用SQL數(shù)據(jù)庫軟件,將公交IC卡數(shù)據(jù)表中的線路編號、車輛編號與表6中的線路編號、車輛編號進行“等號”關聯(lián)。

      步驟3:將公交IC卡數(shù)據(jù)表中的刷卡時間與表6中的“到站時間”進行“大于(>)”關聯(lián),與表6中的“下一站到站時間”進行“小于(<)”關聯(lián)。

      GPS數(shù)據(jù)的記錄事件產生由開啟和關閉公交車門的行為引起,因此在上述算法中,假設乘客上車刷卡時間要晚于表6中車輛到達上車站點時間(或車輛開門時間),且早于下一站到站時間?;谝陨霞僭O,根據(jù)線路的到站時間表,若某用戶刷卡時間晚于車輛到達第i個站點的時間,且早于第i+1個站點的到站時間,則推斷出用戶的上車站點為第i個站點。

      (2)乘客下車站點識別方法

      在單一票制中,由于乘客在下車時無須刷卡,因此在IC卡數(shù)據(jù)字段中無乘客下車相關信息。但在出行需求分析中,目的地是十分關鍵的信息,因此如何提取乘客的出行目的地也是需要解決的問題。目前研究中對此類問題的有效解決方法是基于乘客的出行鏈進行下車站點推斷[7,12]。

      現(xiàn)有文獻認為公共交通的出行鏈可以被描述為一名乘客在一天的出行中至少乘坐了兩次及以上的公共交通[7]。在參考文獻[13]中,基于出行鏈的推斷有兩個假設條件:第一,在出行鏈中乘客本次出行的起點為上一次出行的終點;第二,乘客在一天之中最后一段出行過程的終點與當天第一段出行的起點是相同的。此外,本文討論的公交出行不包含地鐵。

      基于以上假設,并考慮到公交出行通勤占比很大,具有很強的早晚出行規(guī)律性,例如,早高峰從居住地到達工作地,晚高峰從工作地回到居住地。因此對下車站點的識別可采取基于連續(xù)性的推斷方法[12,14]。

      例如,對于某乘客當日的末次出行,假設乘客會選擇距當日首次出行的上車站點最近的站點下車。因此若末次出行乘坐的線路為Ri,首次出行的線路為Rj,則將線路Ri中距離Rj中上車站點最近的站點判定為Ri的下車站點。對于某乘客當日的非末次出行,乘客先乘坐線路Rm,再乘坐Rn。因此,選取Rm中距離Rn上車站點最近的站點作為乘客乘坐線路Rm的下車站點。

      對于不滿足公交出行鏈描述的公交出行,已有文獻中的處理方法是通過乘客出行距離分布并結合公交站臺的吸引特征[9],構建基于概率的下車站點推斷模型,具體方法可參考文獻[7,9,12]。

      4.1.2 用戶通勤行為判別

      前文中提到,通勤用戶是定制公交主要的需求來源。因此,挖掘通勤乘客也是定制公交線路設計的重要任務之一。本節(jié)討論了幾種用戶類型的通勤行為判定方法。

      (1)公交用戶通勤判別

      公交出行通勤用戶在整個出行總量中占比很大,具有明顯的潮汐規(guī)律性,因此可分析乘客在一定周期(如一個月)內的早晚高峰出行規(guī)律或刷卡規(guī)律,通過刷卡頻次并結合刷卡站臺周邊的用地信息(如POI信息)進行判定[15]。具體步驟如下。

      表6 公交到站時刻表示例

      步驟1:查閱已有文獻,根據(jù)頻次設定判定標準。例如,一周工作日中早高峰兩次及以上在同一個站臺刷卡時,可將該站臺視為居住地。類似地,晚高峰兩次及以上在同一個站臺刷卡時,可將該站臺視為工作地。

      步驟2:對于某用戶,根據(jù)步驟1中的通勤標準,判定其居住地和工作地。對于居住地,在推斷其上車站點的基礎上,統(tǒng)計在一個周期內的早高峰時段在不同站臺的刷卡頻次,若頻次最高所對應的站臺達到通勤判定標準,將該站臺標記為居住地,否則判定失敗,該用戶居住地為空。類似地,統(tǒng)計在一個周期內晚高峰時段在不同站臺的刷卡頻次,并進行工作地判定。

      步驟3:對數(shù)據(jù)庫中每個公交用戶的IC卡記錄進行上述步驟的統(tǒng)計和判定,輸出乘客的工作地和居住地。

      (2)規(guī)劃數(shù)據(jù)通勤判別

      不同于公交IC卡數(shù)據(jù)的起終點對應站臺,規(guī)劃數(shù)據(jù)的起終點信息對應的是經(jīng)緯度,這可能導致用戶每次規(guī)劃路徑時所對應的位置信息(經(jīng)緯度)不一致的現(xiàn)象出現(xiàn)。因此,本文提出了一個基于AOI數(shù)據(jù)的通勤用戶判定方法。該方法的主要思路為利用AOI數(shù)據(jù)將經(jīng)緯度信息映射到更大的區(qū)域,以方便統(tǒng)計每次規(guī)劃路徑的位置信息,從而得到用戶出行起終點的對應區(qū)域。具體判定步驟如下。

      算法1規(guī)劃數(shù)據(jù)用戶通勤判別算法

      輸入:規(guī)劃數(shù)據(jù)用戶一個周期內(如一個月)的出行軌跡信息

      輸出:用戶居住地與工作地

      步驟1:將規(guī)劃數(shù)據(jù)中所有用戶的經(jīng)緯度信息映射到AOI上,得到每個經(jīng)緯度信息對應的AOI編號,以及對應的AOI類型。這使得用戶每次的規(guī)劃位置從經(jīng)緯度投影到AOI。

      步驟2:查閱已有文獻,根據(jù)頻次設定判定標準。例如,一周工作日中,規(guī)劃數(shù)據(jù)用戶兩次及以上在同一個AOI并且其類型為“居住類型”規(guī)劃路徑時,可將該AOI視為居住地。類似地,用戶兩次及以上在同一個AOI并且其類型為“辦公類型”規(guī)劃路徑時,可將該AOI視為工作地。

      步驟3:在步驟2的判定標準基礎上,識別規(guī)劃用戶的居住地和工作地,具體方法同公交IC卡用戶的居住地和工作地的識別方法。

      步驟4:對規(guī)劃數(shù)據(jù)中每個用戶的記錄進行上述步驟的統(tǒng)計和判定,輸出乘客的居住地和工作地。

      (3)導航數(shù)據(jù)通勤判別

      導航數(shù)據(jù)的起終點位置信息對應的也是經(jīng)緯度,且由于導航的出行軌跡很多是間斷的,其終點位置不一定是實際的終點位置(一些用戶會在行程中關閉導航)。因此,對導航用戶通勤的判別也需要結合AOI數(shù)據(jù)及導航起點位置信息進行判斷。本文提出一個基于出行頻次的通勤用戶判別算法,具體步驟如下。

      算法2導航用戶通勤判別算法

      輸入:導航用戶一個周期內(如一個月)的出行軌跡信息

      輸出:用戶居住地與工作地

      步驟1:與規(guī)劃數(shù)據(jù)處理方法相同,將導航數(shù)據(jù)中所有用戶的每次軌跡行程的出發(fā)位置信息映射到AOI上,得到每個經(jīng)緯度信息對應的AOI編號,以及對應的AOI類型。

      步驟2:將一天24 h分割成24個單元,每個單元為1 h,初始化兩個N×3的空矩陣M1和M2,其中N為一個周期的天數(shù)(如一個月30天)。

      步驟3:對于第i天,針對該用戶所有軌跡的出發(fā)地位置,找到早高峰第一條軌跡對應的出發(fā)地AOI編號、AOI類型及導航行為發(fā)生時對應的時間區(qū)間,將其存儲到M1的第i行。

      步驟4:對于第i天,針對該用戶所有軌跡的出發(fā)地位置,找到晚高峰第一條軌跡對應的出發(fā)地AOI編號、AOI類型及導航行為發(fā)生時對應的時間區(qū)間,將其存儲到M2的第i行。

      步驟5:按步驟3和步驟4重復操作一個周期內n天的軌跡信息,將相應的出行信息記錄到矩陣M1和M2中。

      步驟6:在M1中找到該用戶AOI類型為“居住類型”的頻次數(shù)最高(最頻)的出行AOI編號,并記錄其次數(shù)Nh;在M2中找到該用戶AOI類型為“辦公類型”的最頻出行AOI編號,并記錄其次數(shù)Nw。

      步驟7:查閱已有文獻,根據(jù)頻次設定判定標準[16]。例如,如果Nh大于8,則將該AOI區(qū)域標記為用戶居住地,否則判定失??;類似地,如果Nw大于8,則將該AOI區(qū)域標記為用戶工作地,否則判定失敗。

      步驟8:對導航數(shù)據(jù)中每個用戶的記錄按步驟1~步驟7進行統(tǒng)計和判定,輸出乘客的居住地和工作地。

      4.2 站點選址/出行區(qū)域聚類

      站點的選址布局在定制公交的服務設計中是重要的一環(huán)。為吸引更多的出行者選擇定制公交,乘客到站點的步行距離不應過大。但前文中提到,乘客的需求在一個區(qū)域內是不均勻的,即公交用戶的需求點對應的是站臺,而導航軟件用戶的需求點對應的是AOI。因此,為保證區(qū)域內用戶與定制公交站點的走行距離在合理范圍之內,通常通過聚類方法將出行起終點相似的需求聚類為一類,在聚類后的區(qū)域中選擇站點位置。一些文獻中也將該問題定義為定制公交的交通小區(qū)劃分問題[3,17-18]。

      不同于其他相關文獻中處理的是單一的數(shù)據(jù)源(公交IC卡數(shù)據(jù)、出租車數(shù)據(jù)或調查數(shù)據(jù))[3-4,18-19],本文涉及多源數(shù)據(jù),且需求點坐標對應的格式不一致。因此,在交通小區(qū)劃分問題中如何融合多源數(shù)據(jù)需求是本文面臨的難點之一。針對此問題,本文提出了一種多源數(shù)據(jù)融合方法。

      首先,運用ArcGis軟件計算每個AOI的中心坐標,將該坐標視為互聯(lián)網(wǎng)用戶的需求點。公交站臺坐標可從數(shù)據(jù)庫中直接抽取。然后,本文提出一個改進的具有噪聲的基于密度的聚類(density-based spatial clustering of applications with noise,DBSCAN)算法,使用該算法對傳統(tǒng)公交數(shù)據(jù)及互聯(lián)網(wǎng)數(shù)據(jù)進行融合。由于所需處理的定制公交需求的數(shù)據(jù)規(guī)模通常較大,且存在很多孤立點,此外,在需求區(qū)域的劃分中往往不能預先確定所需的聚類類別數(shù),因此一般的K-means等聚類算法并不適合本文討論的情況。本文采用DBSCAN算法,該算法不需要預先指定聚類類別的個數(shù)。但該算法易出現(xiàn)“聚類成片”的問題,即相鄰的臨時聚類簇容易聚成一類。此外,該算法也不能考慮每個聚類區(qū)域半徑的大小。也就是說,在劃分定制公交出行區(qū)域時,可能會存在某個區(qū)域劃分過大,這樣在后續(xù)布設站點時,該區(qū)域部分乘客到站點的走行距離會過大,這會降低定制公交的服務質量。因此,本文對該算法進行了改進,具體算法步驟如下。

      算法3:改進的DBSCAN算法

      輸入:多源出行需求點,聚類半徑r,每個類別中的最少需求點個數(shù)minPts

      輸出:每個需求點坐標所屬類別

      算法描述:

      在該算法中,聚類半徑r和每個類別中最少需求點數(shù)目minPts是兩個十分關鍵的參數(shù)。對于聚類半徑r,假設乘客步行的速度為80 m/min,可接受的步行時間為5 min,則聚類半徑r為400 m,這保證了在該區(qū)域內設置站點時乘客的走行時間在可接受的范圍內[19]。對于每個類別中需求點的個數(shù),在參考文獻[18]中提到,在每個區(qū)域中至少應存在一個上車站點和一個下車站點,以對應往返的出行需求。因此,在實際問題中,每個類別中的需求點個數(shù)至少為2。因此,基于上述算法,對于每個劃分好的出行區(qū)域,可利用原有的公交站臺作為定制公交站點,也可根據(jù)實際情況進行考察后確定站點位置。參考文獻[4]討論了站點的具體布設方法。

      表7 公交用戶上車站點推斷示例

      表8 公交用戶通勤判別示例

      5 實例分析

      本文利用成都市一個月(2016年11月1—30日)的出行數(shù)據(jù)對以上分析框架的可行性進行驗證,采用的數(shù)據(jù)包括成都市公交數(shù)據(jù)、互聯(lián)網(wǎng)導航及規(guī)劃數(shù)據(jù)、AOI數(shù)據(jù)。本文使用的數(shù)據(jù)由成都公交集團和高德地圖提供。由于數(shù)據(jù)敏感等原因,本文在結果部分只分析了數(shù)據(jù)的趨勢。圖2是公交IC卡數(shù)據(jù)、互聯(lián)網(wǎng)導航和規(guī)劃數(shù)據(jù)的數(shù)據(jù)量時間分布。從圖2可以看出,公交IC卡數(shù)據(jù)從6:00開始刷卡量逐漸增加,到10:00逐漸平穩(wěn);從16:00開始刷卡量逐漸增加,到19:00高峰時段結束。因此,在通勤判別中將早晚高峰的時間段定義為6:00-10:00和16:00-19:00。而互聯(lián)網(wǎng)用戶的出行量在8:00-18:00時段內都保持在一個相對平穩(wěn)的狀態(tài)。因此,為了統(tǒng)一標準,在對數(shù)據(jù)進行分析、融合時,將互聯(lián)網(wǎng)用戶的通勤時間范圍也定義在6:00-10:00和16:00-19:00這兩個時段。

      (1)首先將GPS數(shù)據(jù)和公交IC卡數(shù)據(jù)進行匹配以推斷上車站點,最終約90%的用戶上車站點可以被成功識別,從而得到乘客的上車站點匹配表,見表7。然后,結合下車站點推斷算法,整理得到乘客在一個月內的上下車站臺、刷卡時段及頻次,見表8。最后,選取早高峰時段6:00-10:00、晚高峰時段16:00-19:00,設定頻次閾值,得到成都市公交通勤用戶識別結果。圖3展示了不同頻次閾值下通勤用戶識別數(shù)量的趨勢。

      (2)對互聯(lián)網(wǎng)導航和規(guī)劃數(shù)據(jù)用戶進行通勤識別,將導航數(shù)據(jù)和規(guī)劃數(shù)據(jù)用戶OD的經(jīng)緯度坐標投影到AOI區(qū)域中。選取早高峰時段6:00-10:00、晚高峰時段16:00-19:00,設定頻次閾值為8[16],按第4.1節(jié)中的算法判定通勤用戶,并得到對應的職住地信息,見表9。

      (3)通過改進的DBSCAN算法融合公交與互聯(lián)網(wǎng)數(shù)據(jù)需求,從而劃分出行區(qū)域。首先計算每個AOI的中心坐標,再與公交站臺坐標進行聚類融合,最終得到每個出行區(qū)域,聚類過程如圖4所示,該方法通過聚類半徑r限定了每個聚類區(qū)域的大小。最終將成都市劃分為多個出行區(qū)域,其聚類中心空間分布如圖5所示,再將出行需求投影到每個出行區(qū)域中,得到成都市公交和互聯(lián)網(wǎng)用戶的潛在出行OD需求表,將其作為線路規(guī)劃的數(shù)據(jù)輸入。受運營成本等因素的影響,定制公交的服務不可能覆蓋所有出行區(qū)域。因此,應優(yōu)先考慮在出行的熱點區(qū)域進行線路設計。在數(shù)據(jù)融合后,將出行OD需求表投影到地圖中,得到數(shù)據(jù)融合后OD熱點區(qū)域的空間分布,如圖6所示。在圖6中,圓圈區(qū)域是公交用戶和互聯(lián)網(wǎng)通勤用戶共有的工作地熱點區(qū)域。因此,在后續(xù)線路中可以優(yōu)先在這兩個區(qū)域提供定制公交服務,以保證定制公交上座率。

      (4)得到出行OD需求后,可通過構建線路設計模型得到線路方案集。例如,以最大化定制公交服務率為目標構建模型。參考文獻[20-21]對此方法進行了研究,本文不再討論具體模型和算法。下面將本文挖掘分析的出行需求作為模型輸入,展示了通勤定制公交的線路案例。圖7是方案集中的某條定制公交線路,該線路的潛在出行需求約2600人/天,線路長度為7 km,目前存在的常規(guī)公交線路是48路。表10給出了該定制公交線路在高峰時段每個站點間的潛在出行需求。表11對比了不同出行時段定制公交與常規(guī)公交線路的預計出行時間。

      表9 互聯(lián)網(wǎng)導航和規(guī)劃數(shù)據(jù)用戶通勤判別示例

      表10 定制公交線路的潛在出行需求(單位:人次)

      本文進一步從出行時間和擁擠度方面對定制公交和常規(guī)公交線路進行對比。圖8是常規(guī)公交48路63輛運營車輛在各時段的線路運營時間和乘客數(shù)量。從圖8可以看出,由于該線路中間站點數(shù)量多,且通勤客流量大,造成停站時間過長,進而影響其運營時間和乘客出行體驗。因此,如果引入定制公交線路,并提供“一人一座”等服務提高舒適度,可以很好地對常規(guī)公交線路進行補充。

      表11 定制公交與常規(guī)公交線路的預計出行時間對比

      6 結束語

      本文提出了一個基于多源數(shù)據(jù)的定制公交需求辨識方法分析框架,并結合成都市的出行數(shù)據(jù)討論了該框架的可行性。不同于傳統(tǒng)基于調查問卷的分析方法,本文通過融合多源出行數(shù)據(jù)、挖掘居民的出行規(guī)律,獲取城市居民的出行需求。本文介紹的方法適用于城市級的大規(guī)模數(shù)據(jù),具有可操作性強、需求覆蓋廣、成本低、出行需求更新及時等優(yōu)點,可作為定制公交服務設計的輔助手段。在未來的研究中,筆者將繼續(xù)圍繞定制公交的線路、時刻表、車輛調度及票價策略等運營規(guī)劃方面開展工作。

      猜你喜歡
      IC卡公交站點
      工商業(yè)IC卡控制器改造為物聯(lián)網(wǎng)控制器實踐
      一元公交開進太行深處
      基于Web站點的SQL注入分析與防范
      電子制作(2019年14期)2019-08-20 05:43:42
      在用電梯加裝外接式IC卡運行控制系統(tǒng)設計改進
      2017~2018年冬季西北地區(qū)某站點流感流行特征分析
      等公交
      一種新的無觸點IC卡的檢測方法
      電子測試(2017年15期)2017-12-18 07:19:05
      等公交
      首屆歐洲自行車共享站點協(xié)商會召開
      中國自行車(2017年1期)2017-04-16 02:53:52
      怕被人認出
      故事會(2016年21期)2016-11-10 21:15:15
      深泽县| 于都县| 如东县| 文化| 广平县| 永吉县| 濮阳县| 砀山县| 张北县| 南丹县| 抚顺市| 辽宁省| 文化| 子洲县| 辽宁省| 高淳县| 福贡县| 剑川县| 吴旗县| 遂溪县| 三台县| 宜昌市| 丰台区| 襄城县| 道真| 秦皇岛市| 满洲里市| 海兴县| 九龙城区| 历史| 盐源县| 固镇县| 浮梁县| 陈巴尔虎旗| 桦川县| 武陟县| 峨眉山市| 民权县| 定南县| 郁南县| 金沙县|