張鶴鵬,黃 達(dá),杜 辰,李曉璐,2,朱廣宇,2
(1.北京交通大學(xué) 交通運(yùn)輸學(xué)院,北京 100044;2.北京交通大學(xué) 綜合交通運(yùn)輸大數(shù)據(jù)應(yīng)用技術(shù)交通運(yùn)輸行業(yè)重點(diǎn)實(shí)驗(yàn)室,北京 100044)
識(shí)別用戶出行方式、獲知城市居民出行行為的屬性特征并借此獲知城市居民的出行結(jié)構(gòu),是城市交通管理部門提供交通服務(wù)、實(shí)施交通組織管理的前提[1-2]。隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,通過(guò)智能手機(jī)等設(shè)備采集終端用戶的移動(dòng)數(shù)據(jù)并對(duì)其進(jìn)行分析,可以獲得交通參與者出行相關(guān)信息。而將交通參與者的這些信息進(jìn)行處理后,再采用一定的算法就可以識(shí)別用戶的出行方式,獲得出行偏好等信息。交通出行方式的識(shí)別是對(duì)用戶出行軌跡中每一對(duì)相鄰出行節(jié)點(diǎn)中出行過(guò)程特征的識(shí)別。若相鄰出行過(guò)程中運(yùn)動(dòng)軌跡特征大致相同,則認(rèn)為相鄰兩階段出行方式相同;若出現(xiàn)較大差異,則認(rèn)為被調(diào)查者出現(xiàn)停駐或采用了其他的交通方式。目前很多學(xué)者針對(duì)出行方式識(shí)別的問(wèn)題進(jìn)行了研究,主要是基于以上提到的思路,提取出行者每一個(gè)全球定位系統(tǒng)(Global Positioning System,GPS)軌跡點(diǎn)信息,進(jìn)而識(shí)別出行方式。Chang等[3]、Gong等[4]、Lu等[5]都是基于GPS采集到的數(shù)據(jù),分別采用基于規(guī)則、基于模糊邏輯的算法將數(shù)據(jù)結(jié)合ArcGIS軟件,對(duì)被調(diào)查者的出行方式進(jìn)行識(shí)別。
智能手機(jī)可對(duì)用戶每一時(shí)刻的出行信息進(jìn)行記錄并形成出行軌跡。識(shí)別用戶的出行方式前需要運(yùn)用一定的方法提取出行軌跡中的信息,從而獲取用戶的出行鏈以更加準(zhǔn)確地體現(xiàn)出出行軌跡與出行方式選擇的聯(lián)系。在得到用戶出行鏈的基礎(chǔ)上,提取速度、加速度、方向變化率、出行起止時(shí)刻等特征,接著采用一定的識(shí)別方法,如:基于規(guī)則的方法、構(gòu)建概率矩陣的方法、機(jī)器學(xué)習(xí)的方法對(duì)用戶的出行方式進(jìn)行判別。基于規(guī)則的方法是通過(guò)邏輯特征設(shè)定規(guī)則對(duì)出行方式進(jìn)行判斷,若對(duì)象滿足某種出行方式的判斷條件,就將其歸類到某種方式。例如 Stopher等[6]、Bohte等[7]、Chen 等[8]都通過(guò)對(duì)平均速度、最大速度、出行時(shí)長(zhǎng)設(shè)定不同的閾值來(lái)區(qū)分步行、公交、小汽車等交通方式。通過(guò)已有文獻(xiàn)可以看出,基于規(guī)則的方法主觀性強(qiáng),規(guī)則和閾值的設(shè)定主要依據(jù)研究者的專業(yè)知識(shí)和經(jīng)驗(yàn),其精度和擴(kuò)展性受到限制。而近年來(lái)運(yùn)用機(jī)器學(xué)習(xí)的算法對(duì)用戶出行方式的識(shí)別逐漸成為研究的重點(diǎn),并且其精度和可擴(kuò)展性都比以往的方法有了很大的提升。閆彭[9]、張治華[10]、汪磊等[11]對(duì)GPS采集到的定位數(shù)據(jù)分別使用BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)、多層感知器神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Support Vector Machine,SVM)模型進(jìn)行交通出行方式的識(shí)別,且都到達(dá)了良好的識(shí)別精度。
縱觀國(guó)內(nèi)外文獻(xiàn),通過(guò)GPS定位系統(tǒng)獲取位置數(shù)據(jù)是獲取用戶出行鏈的主要途徑,而利用移動(dòng)終端定位數(shù)據(jù)的相關(guān)研究較少。因此,本文主要對(duì)從移動(dòng)終端獲取到的用戶位置數(shù)據(jù)進(jìn)行分析,提出了一種新的用戶出行鏈獲取方法,并通過(guò)案例分析證明了該方法的有效性。研究文獻(xiàn)[11]~[14]發(fā)現(xiàn),可以采用多種識(shí)別方法對(duì)用戶的出行方式進(jìn)行判別,考慮到?jīng)Q策樹算法具有較強(qiáng)的學(xué)習(xí)能力,且在交通領(lǐng)域已有較多的應(yīng)用,比如道路交通事故預(yù)測(cè)、短時(shí)交通流預(yù)測(cè)、城市道路擁擠預(yù)測(cè)等。因此,本文采用機(jī)器學(xué)習(xí)算法中的C4.5決策樹算法對(duì)移動(dòng)用戶的出行行為進(jìn)行分析,包括用戶的始發(fā)地、速度、交通方式的選擇等。
在對(duì)用戶出行方式判別的過(guò)程中,識(shí)別出各類交通方式的數(shù)據(jù)特征,進(jìn)而確定特征變量和判別閾值是其中較為關(guān)鍵的一部分。根據(jù)文獻(xiàn)[15],最常用到統(tǒng)計(jì)特征為速度、加速度、出行距離、出行時(shí)長(zhǎng)、停止率等統(tǒng)計(jì)量,因此需要對(duì)這些統(tǒng)計(jì)量進(jìn)行特征分析,確定合適的分裂屬性,進(jìn)而構(gòu)建決策樹。
(1)速度
速度是區(qū)分交通方式最重要的特征變量,一般而言機(jī)動(dòng)車速度大于非機(jī)動(dòng)車和行人?,F(xiàn)有文獻(xiàn)中應(yīng)用于出行方式識(shí)別的速度統(tǒng)計(jì)值一般有最大速度、平均速度、百分位速度等。由于定位點(diǎn)存在隨機(jī)誤差,最大速度難以保證準(zhǔn)確性,所以本文采用第75個(gè)百分位速度(表示此車輛車速累計(jì)出現(xiàn)頻率達(dá)75%的行駛速度)代替。
速度能夠較好地區(qū)分各類交通方式,但同時(shí)也是最易誤導(dǎo)識(shí)別的變量之一。雖然不同性能車輛在設(shè)計(jì)速度上具有很大差異,但是城市阻滯的行車環(huán)境其實(shí)較難將不同交通方式的差異顯現(xiàn)出來(lái)。因此還需要結(jié)合其他的特征變量進(jìn)行分析。
(2)速度的百分位數(shù)
文獻(xiàn)[14]、[15]中基于速度的75分位數(shù)比較步行、自行車、公交車、小汽車的速度變化趨勢(shì),得到的結(jié)果如圖1所示。
圖1 速度的75分位數(shù)分布頻率曲線圖
由圖1中各交通方式的分布曲線,文獻(xiàn)指出以3m/s設(shè)定閾值,可以區(qū)分步行與自行車兩種出行方式,而機(jī)動(dòng)車出行速度與非機(jī)動(dòng)車出行速度差別較大,且非機(jī)動(dòng)車速度一般低于16m/s,故本文選取16m/s作為速度閾值,區(qū)分機(jī)動(dòng)車與非機(jī)動(dòng)車出行。
(3)軌跡點(diǎn)數(shù)量占比
為了進(jìn)一步區(qū)分公交車出行和小汽車出行兩種方式,首先提取瞬時(shí)速度大于15m/s的軌跡點(diǎn)作為
式(1)中:Ni是速度大于15 m/s的軌跡點(diǎn)個(gè)數(shù)(個(gè));N是總的軌跡點(diǎn)個(gè)數(shù)(個(gè))。
根據(jù)上述特征變量計(jì)算公式,對(duì)公交車、小汽車軌跡點(diǎn)數(shù)量占比進(jìn)行分析,得到的結(jié)果見(jiàn)圖2和圖3。研究對(duì)象,剔除步行、自行車的干擾。引入軌跡點(diǎn)數(shù)量占比作為特征變量,其計(jì)算公式如下:
圖2 速度大于15m/s的軌跡點(diǎn)數(shù)量占比分布曲線圖
由圖2和圖3可以發(fā)現(xiàn),小汽車與公交車的區(qū)分閾值為12%的軌跡點(diǎn)數(shù)量占比。當(dāng)閾值大于12%是為小汽車,反之則為公交車。
(4)出行距離
依據(jù)城市居民出行畫像描述[16],居民出行因距離不同,出行方式的偏好也不同。不同出行方式的出行距離分布見(jiàn)圖4,步行的出行距離為1~2km;自行車的出行距離為6km以內(nèi);出行距離在20km以上的為小汽車。
(5)停止率
在城市居民公交車與小汽車出行畫像的描述中[17],其停車率具有明顯的不同。由于公交車的營(yíng)運(yùn)特征,在道路暢通的情況下,其停車率會(huì)明顯高于小汽車。提取軌跡點(diǎn)中停車的軌跡點(diǎn),作為停車點(diǎn)集合P:
圖4 不同出行方式的出行距離分布圖
并定義停止率Stoprate為單位距離中停止點(diǎn)的個(gè)數(shù):
式(2)~式(3)中:A為軌跡點(diǎn)的集合;V為軌跡點(diǎn)的速度(m/s);為一次出行中停止段的個(gè)數(shù)(個(gè));|ps|是速度為0的停止段的集合;dis是一段出行中出行距離(km)。
根據(jù)以上公式,計(jì)算公交車和小汽車的停止率的區(qū)域分布情況,如圖5所示。
圖5 停止率柱狀分布圖
移動(dòng)數(shù)據(jù)與以往的GPS、傳感器等方式采集到的出行數(shù)據(jù)相比存在很大差異,具體表現(xiàn)為蜂窩分布、數(shù)據(jù)采集頻率不固定、乒乓切換等特征。這些特征的存在導(dǎo)致采集的數(shù)據(jù)不能直接被使用,需要對(duì)其進(jìn)行預(yù)處理。先將每一段數(shù)據(jù)按照采集時(shí)間排序,剔除移動(dòng)終端位置信息錯(cuò)誤、時(shí)間信息錯(cuò)誤和基站位置錯(cuò)誤的數(shù)據(jù),提高數(shù)據(jù)的質(zhì)量,為后續(xù)的地圖匹配提供可靠且有效的數(shù)據(jù)。
移動(dòng)終端利用扇形定位所采集到的定位數(shù)據(jù)主要由確定終端唯一標(biāo)識(shí)的編號(hào)、經(jīng)度、緯度和定位時(shí)間4類條目組成。本文主要對(duì)兩種異常數(shù)據(jù)進(jìn)行處理,包括經(jīng)緯度越界數(shù)據(jù)和重復(fù)冗余數(shù)據(jù)。首先,通過(guò)在地圖上標(biāo)注區(qū)域邊界,得到所在區(qū)域的經(jīng)緯度范圍,將經(jīng)緯度坐標(biāo)在此范圍之外的移動(dòng)定位數(shù)據(jù)點(diǎn)全部剔除。然后,剔除重復(fù)數(shù)據(jù)。接著,對(duì)處理完成的數(shù)據(jù)進(jìn)行坐標(biāo)變換以便進(jìn)行地圖匹配,需要調(diào)用坐標(biāo)轉(zhuǎn)換應(yīng)用程序編程接口(Application Programming Interface,API)將原始移動(dòng)定位坐標(biāo)轉(zhuǎn)換成電子地圖中的坐標(biāo)。
為了減少數(shù)據(jù)偏差,保證移動(dòng)終端用戶出行軌跡的可靠性和準(zhǔn)確性,需要把預(yù)處理過(guò)的數(shù)據(jù)與數(shù)據(jù)地圖進(jìn)行匹配和對(duì)比。地圖匹配技術(shù)建立在模式識(shí)別理論之上,其目標(biāo)是完成定位點(diǎn)和道路網(wǎng)絡(luò)之間的精準(zhǔn)匹配。常用的地圖匹配的方法有:定位點(diǎn)與道路匹配,軌跡線與路網(wǎng)匹配。
本文選取定位點(diǎn)與道路匹配的方法。具體如下:提取路網(wǎng)節(jié)點(diǎn)、道路線路等地理信息系統(tǒng)(Geographic Information System,GIS)路網(wǎng)數(shù)據(jù),通過(guò)垂線投影法(原理見(jiàn)圖6),尋找定位點(diǎn)與其距離最近的路段,以定位點(diǎn)向路段做垂線,垂足點(diǎn)為匹配點(diǎn),與定位點(diǎn)距離最小的路段即為匹配路段。
圖6 垂線投影法原理圖
在圖6中,I表示定位點(diǎn),R1與R2表示定位點(diǎn)附近的道路,計(jì)算車輛與附近所有道路的距離以及與各個(gè)道路方向的夾角[16]。根據(jù)式(4)計(jì)算車輛位置點(diǎn)與附近所有道路的權(quán)值θi:
式(4)中:qi為定位點(diǎn)與道路的距離(m);wi為方向的夾角(rad);λq為距離的權(quán)重;λw為方向的權(quán)重。在R1與R2中選取權(quán)重較小的道路為匹配道路,該道路的垂足點(diǎn)為匹配點(diǎn)。
從移動(dòng)終端用戶軌跡中判別交通方式是一個(gè)典型的模式識(shí)別問(wèn)題,需根據(jù)軌跡對(duì)象的統(tǒng)計(jì)特征尋找合適的統(tǒng)計(jì)量,并使用機(jī)器學(xué)習(xí)算法建立判別規(guī)則。本文的交通方式判別工作包括出行段分割、統(tǒng)計(jì)量選取、機(jī)器學(xué)習(xí)3個(gè)步驟。首先根據(jù)出行軌跡信息識(shí)別停駐,并根據(jù)停駐將出行軌跡分割成多個(gè)出行;然后根據(jù)換乘點(diǎn)將出行分割成只含一種交通方式的出行段;最后基于出行段運(yùn)用機(jī)器學(xué)習(xí)算法識(shí)別出行方式。
出行鏈?zhǔn)侵赣梢幌盗邢噜徆?jié)點(diǎn)間連續(xù)的出行而形成的鏈?zhǔn)浇Y(jié)構(gòu),往往以空間上有向位移的方式體現(xiàn)。獲取用戶的出行鏈對(duì)出行者出行方式的識(shí)別有著至關(guān)重要的作用。但在獲取用戶出行軌跡后,考慮到存在的誤差和基站分布的影響還需對(duì)異常漂移的軌跡點(diǎn)進(jìn)行修正,進(jìn)而提取用戶出行鏈。
3.1.1 異常漂移修正
本文利用設(shè)定速度閾值的方式對(duì)出行軌跡鏈中出現(xiàn)的異常飄移的軌跡點(diǎn)進(jìn)行修正。具體篩選與檢驗(yàn)流程是,首先計(jì)算位置點(diǎn)間的時(shí)間:
其次,計(jì)算位置點(diǎn)間距離:
最后,計(jì)算位置點(diǎn)之間的移動(dòng)速度,并判斷位置點(diǎn)之間的移動(dòng)速度是否符合閾值要求:
式(5)~式(8)中:ti為時(shí)間序列中第i個(gè)點(diǎn)的時(shí)刻信息;Δt為點(diǎn)間時(shí)間差(s);(LonA,LatA)為第i個(gè)位置點(diǎn)的經(jīng)緯度坐標(biāo);(LonB,LatB)為第i+1個(gè)點(diǎn)的經(jīng)緯度坐標(biāo);C為軌跡點(diǎn)與地球球心的夾角(rad);R為地球半徑,取6 371km;Y為圓周率,取3.1416;vi為此終端用戶出行時(shí)間序列上第i點(diǎn)的速度(m/s)。
3.1.2 用戶出行鏈獲取算法
根據(jù)以往經(jīng)驗(yàn)設(shè)定距離閾值和時(shí)間閾值,將出行分割成多個(gè)出行片段,再應(yīng)用算法逐段識(shí)別出行方式。個(gè)人出行鏈獲取流程如圖7所示。
圖7 基于手機(jī)定位信息的出行鏈獲取流程圖
圖7中個(gè)人出行鏈獲取流程包含點(diǎn)向速度控制模塊和出行鏈獲取算法兩部分,而出行鏈獲取算法作為出行鏈獲取的主要部分,包含停靠點(diǎn)的判定和起訖(Origin-Destination,OD)點(diǎn)的判定兩個(gè)環(huán)節(jié)。
首先是停靠點(diǎn)的判定。出行者在出行時(shí)總會(huì)呈現(xiàn)出靜止(或者在一定閾值內(nèi)移動(dòng))的狀態(tài),因此可以設(shè)定距離閾值Distance為判定條件。當(dāng)相鄰兩點(diǎn)間的距離大于該閾值,說(shuō)明出行者處于出行過(guò)程中;當(dāng)相鄰兩點(diǎn)間距離小于該閾值時(shí),則表示出行者處于活動(dòng)或靜止?fàn)顟B(tài)。
其次是OD點(diǎn)的判定,以距離閾值Distance和時(shí)間閾值T為判定條件。判定的邏輯流程為:OD點(diǎn)可分為兩種狀態(tài),當(dāng)兩點(diǎn)之間的距離大于閾值Distance時(shí),此時(shí)狀態(tài)稱為移動(dòng);當(dāng)兩點(diǎn)之間的距離小于閾值Distance時(shí),此時(shí)狀態(tài)稱為駐留。在OD點(diǎn)狀態(tài)判定的基礎(chǔ)上,根據(jù)時(shí)間數(shù)據(jù)計(jì)算駐留狀態(tài)下的持續(xù)時(shí)間t。如果駐留狀態(tài)所持續(xù)時(shí)間t大于時(shí)間閾值T,則該段時(shí)間內(nèi)的第一個(gè)坐標(biāo)點(diǎn)判定為上一次出行行為的D點(diǎn),最后一個(gè)坐標(biāo)點(diǎn)判定為下次出行行為的O點(diǎn)。
決策樹是一種機(jī)器學(xué)習(xí)的算法。本文選用決策樹中的C4.5算法進(jìn)行出行方式的識(shí)別,主要考慮到以下幾個(gè)方面:①C4.5算法具有計(jì)算量小、準(zhǔn)確率高、易于提取規(guī)則的特點(diǎn);②用信息增益率而非信息增益值來(lái)選擇分裂屬性,對(duì)樣本數(shù)據(jù)量的依賴程度變低;③由于本文中的數(shù)據(jù)為數(shù)值型的連續(xù)數(shù)據(jù),而決策樹C4.5算法中加入了連續(xù)屬性的處理算法,對(duì)非離散型的數(shù)據(jù)也能處理。在分裂屬性選擇完畢后,可以通過(guò)計(jì)算不同的閾值確定劃分方案,從而計(jì)算各方案中的信息增益率,在其中選擇最大的信息增益率所對(duì)應(yīng)的閾值用作最優(yōu)分裂謂詞。
第一步:分裂屬性選取。首先計(jì)算總的數(shù)據(jù)集S關(guān)于屬性A(速度的75分位數(shù)、最大速度、出行距離、速度大于16m/s的概率、失真率、停止率等)統(tǒng)計(jì)量的熵,再依次分別計(jì)算統(tǒng)計(jì)量的增益率,根據(jù)增益率從大到小依次建立子節(jié)點(diǎn),從中選取信息增益率最大的屬性作為該決策樹的根節(jié)點(diǎn)。其中選取分裂屬性的關(guān)鍵公式如下。
數(shù)據(jù)集S的熵I(S)衡量數(shù)據(jù)集的無(wú)序程度,其計(jì)算公式為:
式(9)中:數(shù)據(jù)集S包含類別C1,C2,…,Cm;Pi為類別Ci在數(shù)據(jù)集S中出現(xiàn)的概率;|S|為S中的樣本總和。
此外今年順豐還打出“飛機(jī)+高鐵”組合,累計(jì)增加近250噸運(yùn)能。除高鐵外,日前投入使用的波音747全貨機(jī)也加入“雙11”運(yùn)力儲(chǔ)備軍,順豐航空運(yùn)力提升112.7噸。截至目前,順豐航空機(jī)隊(duì)已擁有48架全貨機(jī)。
信息增益Gain(S,A)用來(lái)度量序數(shù)改進(jìn)的結(jié)果,其計(jì)算公式為:
式(10)中:屬性A具有6個(gè)不同的值(速度的75分位數(shù)、最大速度、出行距離、速度大于16m/s的概率、失真率、停止率等),可以用屬性A將S劃分為v個(gè)子集 {S1,S2,???,Sv},|Sv|為子集v中各個(gè)類別樣本數(shù)的和。
計(jì)算信息增益比例:
數(shù)據(jù)集S關(guān)于屬性A的熵:
增益中包含把數(shù)據(jù)集劃分為更小有序子集的屬性A的偏差。要減少這個(gè)偏差,采用Split來(lái)計(jì)算每個(gè)變量相對(duì)于它的m個(gè)變量值的熵。
第二步:確定分裂謂詞。C4.5算法中引入了信息增益率來(lái)確定分裂屬性,針對(duì)某一個(gè)分裂屬性,會(huì)有n個(gè)不同的數(shù)值,n個(gè)不同的數(shù)值對(duì)應(yīng)了k種不同的分裂方案,計(jì)算每種方案下的信息增益比例,選取最大的信息增益比例所對(duì)應(yīng)的數(shù)值作為最后的分裂謂詞。
本文以某地區(qū)移動(dòng)終端位置數(shù)據(jù)分布圖(見(jiàn)圖8)為例,對(duì)用戶出行方式進(jìn)行研究,數(shù)據(jù)中包含了約7 000部移動(dòng)終端的位置信息,共約30萬(wàn)條數(shù)據(jù)。
圖8 研究區(qū)域空間結(jié)構(gòu)圖
4.1.1 數(shù)據(jù)的標(biāo)準(zhǔn)化處理
本節(jié)運(yùn)用2.1節(jié)中數(shù)據(jù)預(yù)處理的方法,為確定出行用戶的定位點(diǎn)在數(shù)字地圖中的具體位置,在剔除移動(dòng)終端定位的異常數(shù)據(jù)后,將所得的出行數(shù)據(jù)映射到所研究的交通區(qū)域中,定位數(shù)據(jù)的屬性示例如圖9所示。其中,USERID為終端編號(hào),是識(shí)別移動(dòng)終端設(shè)備的唯一標(biāo)識(shí);TIME表示終端設(shè)備上傳定位信息的時(shí)刻;LAT和LON分別為終端設(shè)備所在位置的緯、經(jīng)度坐標(biāo);TYPE為觸發(fā)定位信令的事件類型(001表示主叫,002表示被叫,003表示位置更新,004表示短信,005表示位置區(qū)切換)。
圖9 移動(dòng)終端定位數(shù)據(jù)的屬性示例
4.1.2 地圖匹配
同時(shí)考慮到定位數(shù)據(jù)存在一定誤差以及為使計(jì)算簡(jiǎn)化,本文對(duì)道路寬度值的設(shè)定比實(shí)際情況有所擴(kuò)展。以2016年2月10日的晚高峰時(shí)段為例,數(shù)字地圖匹配前后對(duì)比見(jiàn)圖10。
圖10 地圖匹配前后示意圖
根據(jù)3.1節(jié)中給出的獲取用戶出行軌跡的方法,篩檢出移動(dòng)終端用戶的出行軌跡;具體過(guò)程為:獲取用戶USERID的所有記錄,按照TIME字段排序后輸出該用戶出行軌跡;在輸出用戶軌跡鏈基礎(chǔ)之上,利用電子地圖的API將單用戶的軌跡鏈在地圖上表現(xiàn)出來(lái),如圖11所示。
根據(jù)3.2節(jié)中給出的基于決策樹法的出行方式判別模型,建立決策樹如圖12所示。
圖11 單用戶手機(jī)定位點(diǎn)記錄圖
圖12 C4.5決策樹示意圖
利用建好的決策樹對(duì)用戶的出行方式進(jìn)行分析,得到的最終結(jié)果如表1所示。
表1 判別結(jié)果與實(shí)際對(duì)比
從表1可以看出,根據(jù)C4.5決策樹算法得到的結(jié)果在判別步行或者自行車方式方面具有明顯的優(yōu)勢(shì),實(shí)際中出行方式是自行車的,會(huì)有可能被判別為步行和自行車,但可能性較低。在判別公交車和自行車方面此算法也有較好的表現(xiàn),實(shí)際中出行方式是公交車的,會(huì)有可能被判別為小汽車;實(shí)際中出行方式是小汽車的,也有可能判別為小汽車,但均不會(huì)出現(xiàn)判別為自行車或者步行的判別結(jié)果。
本文提出了一種基于移動(dòng)定位數(shù)據(jù)的用戶出行方式識(shí)別算法,通過(guò)將定位數(shù)據(jù)與現(xiàn)有路網(wǎng)進(jìn)行匹配,識(shí)別出了個(gè)人出行鏈;對(duì)用戶的出行選擇行為進(jìn)行了分析,確定了用戶的起始位置、移動(dòng)速度和選擇的出行方式等。經(jīng)實(shí)例驗(yàn)證,本文提出的識(shí)別步行、自行車、公交車、小汽車的方法是可行的,能夠有效、準(zhǔn)確地區(qū)分機(jī)動(dòng)車和非機(jī)動(dòng)車。該研究成果有利于更好地推廣移動(dòng)定位技術(shù)在交通領(lǐng)域的應(yīng)用,對(duì)于提高居民交通出行調(diào)查效率、合理布局交通設(shè)施、優(yōu)化交通系統(tǒng)具有重要意義。
在今后的研究中,以下兩方面有待深入:(1)在提取用戶出行鏈時(shí),本文采用的地圖匹配方法是定位點(diǎn)與道路匹配,這種方法的優(yōu)勢(shì)是方便、快捷、高效,但適用性和延展性不高,對(duì)于復(fù)雜路網(wǎng)的地圖匹配需要尋找更合適的辦法;(2)識(shí)別的出行方式類別需要進(jìn)一步豐富,本文只是針對(duì)4種出行方式進(jìn)行識(shí)別,但日常生活中人們的交通出行方式遠(yuǎn)多于4種。隨著出行方式類別的多樣化,識(shí)別難度將進(jìn)一步增加,提升識(shí)別效率的方法有待探究。