• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于多源數據融合的過江OD調查技術
      ——以江蘇省過江OD調查為例

      2019-02-25 09:28:36
      中國公路 2019年1期
      關鍵詞:信令交通量數據源

      江蘇省規(guī)劃2018年至2020年間新建9座過江通道,然而,自2007年開展“江蘇省主要公路機動車OD調查”以來,近十年全省性交通調查數據未更新,因此開展了本次江蘇省過江OD調查。隨著交通和信息化的快速發(fā)展,傳統(tǒng)的路邊攔車調查難以適用高速機動車調查,越來越多的城市采用大數據技術開展調查工作。

      本研究結合大數據技術,充分利用行業(yè)數據、手機數據和微信問卷進行OD調查,極大提高了調查效率,降低了調查成本。后期在數據處理時,采用多源數據融合技術,汲取各種調查手段的長處,結合各數據特點全面詳實的調查乘客過江出行行為,全面掌握過江出行的交通量、車型、客貨比、OD和出行時耗、載客人數,出行目的、載貨貨重和貨種類型等。

      多源數據獲取

      本次調查在調研國內外學者對調查技術的研究基礎上,結合江蘇省實際數據存儲情況,共獲得高速公路聯網數據、汽渡票根數據、行業(yè)統(tǒng)計數據、調查問卷數據和電信手機信令5種數據。

      調查方法選擇

      傳統(tǒng)的人工問卷調查和微信調查能獲得較完整的交通出行特征信息,但費時費力,并且成本太大而覆蓋率較小,不能完全滿足本次要求。交通行業(yè)數據全面,準確度高,但行業(yè)數據對乘客行程路徑、出行目的等特征信息了解不夠。隨著大數據技術的興起,越來越多的學者采用手機信令數據和百度LBS數據等做交通調查。不同的調查手段獲取的數據質量好壞不一,本次調查綜合各種調查方法的優(yōu)勢,采用取長補短,針對全省23處過江調查采取不同調查方法,如表1所示。

      表1 各調查方式與內容匯總

      多源數據結構

      從江蘇省高速公路聯網營運管理中心搜集聯網收費站數據,調用了調查期間約1個月的3000萬余條數據,該數據可以獲得OD出行,車型、出行頻次、出行時間等信息,但無法獲取實載率、貨物種類、出行目的、收費敏感性等信息;本次采用Oricle進行數據存儲和處理。通過各汽渡管理處搜集獲得13處汽渡過江車輛收費數據及對應的數據字典;通過過江隧道監(jiān)控數據可獲得不同車型(主要以客車為主)的每日流量數據。

      在高速公路過江通道和南京、揚州、泰州航段汽渡,當車輛停車取卡時,調查員站在自助刷卡站臺前向司機發(fā)放二維碼卡片,司機在得空時填寫問卷,問卷信息回傳問卷星。本次問卷調查共出動調查員500余名,調查進行三天三夜,共發(fā)放問卷約16萬份,回收約8萬余份,有效問卷約4萬余份,圓滿完成了本次調查任務。

      手機信令數據覆蓋范圍廣,數據量大,是進行數據補充調查的重要手段。本次利用調查期間全省電信公司的手機信令數據,在Hadoop環(huán)境下完成手機數據清洗、過江行為識別、OD目的地識別,并形成OD矩陣。

      圖1 過江通道大橋客流量調查一覽表

      圖2 區(qū)域OD出行特征無限細分畫像

      5種不同類型的數據均從特定的角度反應了真實的過江特征,本次調查需對獲得的多源異構數據進行整合,形成具有完整的出行特征參數。

      多源數據融合

      多源數據融合體系框架

      多源數據融合主要分為三類:數據層融合、特征層融合和決策層融合。本研究主要在特征層和決策層進行融合,采用集中式分布體系,通過對比分析不同數據源的出行特征、OD結果進行融合擴樣,構建居民過江出行完整的出行屬性表。

      多源數據融合與擴樣

      本次獲得的交通行業(yè)數據較全,基本滿足過江OD出行分析及主要的出行頻次、出行時間、載重等參數分析,因此本次數據融合采用對比擴樣法,以交通行業(yè)數據為主,以微信調查數據和手機信令數據為擴樣對象,以每個過江通道的OD對小區(qū)為擴充對象,按照不同OD小區(qū)對交通量的差值進行出行特征擴樣,并形成完整的出行特征表(包含OD出行對)。

      無效數據剔除方法:微信調查問卷填寫者的素質參差不齊,在實際調查中還存在盜刷問卷紅包的現象,無效問卷較多,對微信問卷無效數據剔除主要規(guī)則如下:一是根據填寫用戶的IP地址批量查詢,與車籍信息匹配,不匹配用戶數值剔除;根據起點地址判斷位于長江南岸或北岸,根據終點地址判斷位于長江南岸或北岸,根據起終點判斷是否具備過江行為,不具備過江行為的剔除;根據起終點給出可能的過江通道,對明顯不符合邏輯選擇的用戶進行剔除等。二是根據用戶編碼、問卷填寫時間,答題時長、人數等,利用箱型圖提取出異常值。三是對開放性問題,如車型、載客人數、載貨重量進行匹配判斷,對載客人數過大,載貨重量過大等明顯不符合邏輯的問卷進行剔除。

      在自校核中,可很據每個過江通道(大橋和汽渡)形成的出行特征進行校核,例如對比區(qū)縣間OD對之間誤差是否大于20%,出行頻次、出行目的、載客人數、載貨和貨種等信息是否合理,以此來判斷各通道的數據結構是否正確。同時,在同一個數據源下,對比相同區(qū)縣OD對的出行特征在不同過江通道的結構差異性,對差異較大的OD對進行進一步審查,分析其原因。

      對于同一數據源形成出行特征自校后,需要對不同數據源形成的出行特征進行對比和融合。本次數據源中,交通行業(yè)數據最全面、最權威,獲得區(qū)縣OD出行對、出行頻次、車型結構及載重是本次對比參照的依據。本次數據對比融合主要對問卷數據和手機信令數據而言,通過將區(qū)縣OD對和特征與交通行業(yè)獲得的特征對比,確保數據結構偏差不大,為后續(xù)數據擴樣提供基礎。本次調查對歷史調查數據和本次調查數據進行對比分析,各已建大橋工可預測數據和實際調查數據進行對比分析,同時還對政策、新建過江通道對過江運輸量的影響進行分析。

      表2 長江二橋客運出行屬性表(整理后)

      在完成數據清洗、校核之后,即可對不同數據源進行融合與擴樣。本次融合與擴樣均以各通道的區(qū)縣OD對為基礎,首先,將客運單位統(tǒng)一歸并到人,貨運單位統(tǒng)一歸并到噸,完成單位歸一化處理;其次,依據各通道各區(qū)縣OD對的比例,對非全樣本數據(微信問卷數據和手機信令數據)進行擴樣,對應的其他出行特征相應進行擴樣;然后,以各通道區(qū)縣OD對為唯一標示碼,用Python語句的Join功能將不同數據源進行連接,將問卷數據中出行目的、載貨貨種、載客人數、出發(fā)時間等信息鏈接到OD數據對后;最后按照通道、區(qū)段和全省三個維度進行數據合并。對隧道過江數據而言,按照南京市內過江出行形成OD屬性表,并形成OD屬性對、出行時間和出行人數一一對應的屬性表。

      出行屬性表的擴充及結論。為了深入分析過江出行規(guī)律,更好的建立過江出行模型,本次在完整的出行屬性表之后,加入了時間、距離和費用參數。本次通過Python語句,調用高德地圖的API接口,按照Driving模式,最短時間模式提取任何兩個區(qū)縣OD對之間的出行時間、距離和費用;并且,通過各區(qū)縣的統(tǒng)計局統(tǒng)計各自的經濟GDP數據,并將二者GDP鏈接到OD對屬性表后面,建立了OD交通量、出行特征、時間費用及經濟參數一一對應的屬性表。

      從出行屬性表各參數的相關關系,可以得出以下結論:客運交通量、載客人數、經濟之間有明顯的正比關系,而且兩城市間經濟差越大,其客流量越大;出行時間越短,其交通占比越大,出行頻次也越高,上班上學等通勤出行特征更明顯;貨運量運輸對出行費用更加敏感,客運出行對出行時間更加敏感;以上班上學為目的的車輛載客人數明顯大于商務出行,載運糧食、快遞等貨物的貨運的出行頻次相對較高,載重較小。

      數據可視化展示

      對手機信令處理后的數據,按照實際坐標導入GIS平臺中,按照南京市街道行政區(qū)劃劃分小區(qū),對融合匯總的客貨運OD數據按照江蘇省各市區(qū)縣行政區(qū)顯示交通量。

      結合實際地理區(qū)劃信息、經濟、產業(yè)及交通網絡信息,區(qū)域過江出行主要表現為南北方向過江出行,城市內部過江出行主要表現為東西向出行。江蘇省過江呈現兩頭重中間輕的空間格局,主要客流沿江分布,沿江城市連綿化特征明顯。從過境出行來看,省內出行占比78%以上,過境出行以蘇中到上海、山東到浙江的交通量為主。

      結語

      本次基于多源數據融合調查方法成功應用于區(qū)域OD調查實踐中,按照交通特征層融合制定了詳細的融合擴樣規(guī)則,以區(qū)縣OD對為標識碼的出行屬性表更加科學高效,便于存入數據庫中;加入出行時間、經濟和費用等參數后,方便利用機器學習深入分析各出行特征與交通量的關系,便于后期利用分布式算法進行運算和數據更新;而且從數據收集、處理、融合、分析到可視化均提供了技術方法,可供其他調查者參考。

      本研究未涉及機器學習部分,需要其他學者進行深入的研究;雖然本研究發(fā)現手機信令數據得出結論與實際數據有較大差距,但仍難以找到適當的調查方法能對隧道出行車輛OD進行準確分析,期待其他學者進一步研究。

      猜你喜歡
      信令交通量數據源
      基于ETC門架數據的高速公路交通量轉換探究
      SLS字段在七號信令中的運用
      移動信令在交通大數據分析中的應用探索
      基于動態(tài)差法的交通量監(jiān)測技術應用
      Web 大數據系統(tǒng)數據源選擇*
      基于信令分析的TD-LTE無線網絡應用研究
      消費導刊(2017年24期)2018-01-31 01:28:37
      高速公路補償交通量模型研究
      基于不同網絡數據源的期刊評價研究
      基于四階段法的公路交通量預測研究
      北方交通(2016年12期)2017-01-15 13:52:51
      LTE網絡信令采集數據的分析及探討
      互聯網天地(2016年2期)2016-05-04 04:03:21
      怀集县| 同心县| 故城县| 洞头县| 德化县| 平顶山市| 岳阳县| 防城港市| 阜平县| 三门峡市| 上饶市| 京山县| 福贡县| 柯坪县| 阿尔山市| 聂拉木县| 锦州市| 东至县| 綦江县| 沈丘县| 屏边| 托里县| 龙州县| 井冈山市| 洮南市| 柘城县| 手机| 合江县| 大冶市| 凌海市| 上蔡县| 高尔夫| 昆山市| 汕头市| 阳山县| 临漳县| 合川市| 屏东县| 巨野县| 莱西市| 武陟县|