左 微,凌世壽,黃 犀
(1.柳州職業(yè)技術(shù)學院,廣西 柳州 545006;2.柳州鐵道職業(yè)技術(shù)學院,廣西 柳州 545616)
受幾千年傳統(tǒng)風俗習慣及地區(qū)經(jīng)濟發(fā)展不平衡影響,我國產(chǎn)生了春運時期的全國人口大遷徙現(xiàn)象,并由此帶來交通秩序混亂及交通安全問題[1],引發(fā)學者與決策者的高度重視。隨著高鐵網(wǎng)絡的不斷完善,有效緩解了春運鐵路運能不足等問題,但由于不同旅客群體的出行行為模式差異顯著,公路客運組織仍面臨嚴峻考驗。統(tǒng)計數(shù)據(jù)顯示,2016—2018年春運期間,公路旅客發(fā)送量占全國旅客發(fā)送總量的比例均高達80%以上,是我國春運發(fā)送旅客的主力。由于公路班線客運覆蓋范圍廣、可達性高、運輸組織靈活,且能為高鐵集疏客流,在春運中有著不可替代的地位。因此,亟須探索春運時期公路旅客群體的出行模式及其異質(zhì)性,為大規(guī)模客流組織與應急管理提供理論依據(jù)。
隨著大數(shù)據(jù)的應用,春運問題再度成為研究熱點,春運大數(shù)據(jù)的使用能夠保證研究的宏觀性和科學性[2-3],當前相關(guān)研究主要集中在旅客運輸組織、城市間客流流動特征與空間格局兩方面。如柳樹國[4]基于抽樣調(diào)查數(shù)據(jù)對春運高峰期鐵路客運站的運輸組織進行分析,包括車站能力與設(shè)施能力的協(xié)調(diào)、票務管理及安全管理等;LAI等[5]發(fā)現(xiàn)春運期間中國城市客流集散中心主要集中于京津冀、長三角、珠三角及成渝四大城市群,且客流流動規(guī)模與城市等級有較強的一致性;魏冶等[6]通過春運人口流動透視中國城市網(wǎng)絡結(jié)構(gòu),指出應加強核心城市的對外疏散功能以緩解城市發(fā)展受限問題;趙梓渝等[7]基于百度遷徙大數(shù)據(jù),發(fā)現(xiàn)節(jié)后返工流與節(jié)前返鄉(xiāng)流的各省客流凈流入規(guī)模排序恰好相反,這一現(xiàn)象與該省流動人口的職業(yè)構(gòu)成密切相關(guān);然而,馮章獻等[8]發(fā)現(xiàn),相關(guān)大數(shù)據(jù)研究在較好地表征春運時期客流集散規(guī)律的同時,也存在缺乏個體屬性的固有缺陷,如無法獲知個體的移動目的和逗留時間,無法界定旅游、商務、通勤等行為模式等;隨著相關(guān)研究的不斷深入,CHENG、戢曉峰等[9-10]發(fā)現(xiàn)出行者存在顯著的異質(zhì)性,不能將所有旅客當作同一類群體進行分析,亟須針對旅客群體出行模式及其異質(zhì)性開展更為細致的研究。
顯然,現(xiàn)有研究多從宏觀視角對春運時期的客流集散規(guī)律進行探討,在一定程度上為大范圍內(nèi)春運高峰期旅客運輸組織奠定了理論基礎(chǔ)。相關(guān)數(shù)據(jù)由傳統(tǒng)的靜態(tài)統(tǒng)計數(shù)據(jù),如抽樣調(diào)查數(shù)據(jù)過渡到含有位置信息的社交網(wǎng)絡數(shù)據(jù)、移動通信數(shù)據(jù),對應研究從靜態(tài)空間跨越到“流空間”。同時,這些地理行為大數(shù)據(jù)由于具有規(guī)模大、時間序列長、時空精細度高等特點,能很好地彌補常規(guī)調(diào)查手段(如問卷、抽樣、普查等)的缺陷[11]。然而,春運人口的大規(guī)模遷移不僅是地理過程之一,還是重要的出行過程之一[12],還需廣泛融合聯(lián)網(wǎng)購票數(shù)據(jù)、公交刷卡數(shù)據(jù)、地鐵刷卡數(shù)據(jù)等更為精細的旅客出行行為大數(shù)據(jù),實現(xiàn)春運宏觀客流規(guī)律向微觀出行模式的研究范式轉(zhuǎn)變。
根據(jù)以上分析,本文通過采集2018年云南省春運公路客運聯(lián)網(wǎng)購票全樣本數(shù)據(jù),識別春運高峰期大規(guī)模務工出行群體和日常通勤出行群體,獲取群體出行模式異質(zhì)性特征,以期為春運時期大規(guī)模組織及應急管理提供依據(jù)。
本文通過云南省某公路客運聯(lián)網(wǎng)購票系統(tǒng)采集了2018年春運期間(2-1—3-12)旅客出行數(shù)據(jù)。數(shù)據(jù)經(jīng)清洗后共計212 018條,其中,節(jié)前數(shù)據(jù)為53 227條,平均每日出行3 549人次;節(jié)后數(shù)據(jù)為158 791條,平均每日出行6 617人次。根據(jù)兩類群體出行特征,篩選出出行次數(shù)≥2次的旅客共計8.14萬人次(約4.62萬名旅客),作為潛在的公路通勤和務工出行旅客數(shù)據(jù),用于群體出行模式識別分析。數(shù)據(jù)主要字段如表1所示。
表1 公路客運數(shù)據(jù)字段信息表
為重點針對春運時期外出務工群體及本地通勤群體進行出行模式異質(zhì)性分析,基于務工、通勤旅客數(shù)據(jù),采用K-means聚類算法首先識別通勤出行和務工出行兩類典型群體。
2.1.1 K-means聚類算法
聚類算法可分為層析聚類算法、劃分聚類算法、密度聚類算法、模型聚類算法等[13],其中K-means聚類算法為應用最廣泛的一種迭代求解聚類分析算法。
K-means采用距離作為相似性的評價指標,該模型假設(shè)數(shù)據(jù)之間的相似度與其歐式距離成反比[14]。算法實現(xiàn)步驟如下:
步驟1:對于給定的待聚類數(shù)據(jù)集X=[x1,x2,…,xF]∈RD×F,隨機選取M個對象作為初始聚類中心C=[c1,c2,…,cM]∈RD×M,其中D為數(shù)據(jù)的特征維度。
步驟2:計算xa(a=1,2,…,F(xiàn))與M個聚類中心cb(b=1,2,…,M)的距離dab,如式(1)所示:
(1)
并把xa分配至距離其最小的聚類中心,形成一個聚類。每分配一個樣本,聚類中心cb根據(jù)該聚類現(xiàn)有對象被重新計算,如式(2)所示:
(2)
式中:W——所有標記為聚類中心cb的數(shù)據(jù)之和。
步驟3:不斷迭代步驟1、步驟2直至xa分配完畢或聚類中心不再發(fā)生變化[15]。假設(shè)聚類后每個數(shù)據(jù)所屬類別為vq(vq=b),則損失函數(shù)L的值最小,如式(3)所示:
(3)
2.1.2 聚類變量
采用公路客運通勤出行的旅客具有與城市居民通勤相類似的出行行為特征,主要包括3種類型:(1)出行地點相對穩(wěn)定,均為跨縣(區(qū))出行;(2)春運期間出行總次數(shù)較多,基本每天都有出行;(3)節(jié)前、春節(jié)期間、節(jié)后出行的次數(shù)較為穩(wěn)定。外出務工出行旅客主要包括3種類型:(1)出行地點穩(wěn)定性差;(2)春運期間出行強度低,但節(jié)前和節(jié)后均有出行;(3)首次出行和末次出行的時間跨度大。
結(jié)合通勤、務工的出行特征與公路客運購票數(shù)據(jù)分析,提出識別春運時期公路旅客群體出行模式的特征變量,如表2所示。
表2 春運時期公路旅客群體出行模式聚類特征變量表
對每一位潛在的公路客運通勤和務工出行旅客(春運時期公路出行次數(shù)超過2次,即X1≥2)生成相應的特征向量Ft=[X1,X2,X3,X4,X5,X6],采用K-means聚類算法對潛在旅客的特征矩陣進行聚類分析。根據(jù)Calinski-Harabasz(CH)指標評估類內(nèi)離差矩陣緊密度及類內(nèi)離差矩陣分離度(如圖1所示)。結(jié)果顯示,當聚類中心數(shù)K=6時,類簇自身最緊密,并且類與類之間最分散,即聚類效果最優(yōu)。為了將聚類結(jié)果進行可視化,采用t-SNE(t-Distributed Stochastic Neighbor Embedding)機器學習算法進行降維處理,聚類中心和聚類特征分布如下頁表3和圖2所示。
圖1 K-means聚類有效性判定曲線圖
表3 K-means聚類中心與聚類結(jié)果表
圖2 六類旅客的X1、X3、X6特征值箱線圖
(1)春運時期公路旅客中存在高頻通勤出行群體和低頻通勤出行群體,分別占樣本旅客總數(shù)的0.65%和48.87%。
從圖2和表3可以看出,在第3類旅客中,所有旅客的X1(春運出行強度)均>90次,其中有75%的旅客春運期間出行總次數(shù)>125.5次;75%旅客的X3(出行時間跨度)均>37.5 d,并且旅客以最常出行路線平均出行次數(shù)達76次,出行地點形成穩(wěn)定規(guī)律性。上述特征表明,第3類旅客具有明顯的通勤特征,約占樣本總數(shù)的0.07%。此外,在第4類旅客中,所有旅客的X1均>15次,其中有75%的旅客出行總次數(shù)>28次;75%的旅客X3>28 d,并且最常出行路線出行次數(shù)達18次。此類旅客也呈現(xiàn)一定的通勤出行特征,約占樣本總數(shù)的0.58%。相比之下,第5類旅客的X1均>2 d,75%的旅客X3僅>1 d,旅客最常出行路線平均出行次數(shù)為1.5次。相比于第3類、第4類旅客,第5類旅客呈現(xiàn)不常使用公路客運通勤出行的特征,該類旅客約占樣本總數(shù)的48.87%。
(2)春運時期務工出行群體約占樣本旅客總數(shù)的50.48%。
由圖2和表3可知,88.15%的第1類旅客、75%的第2類旅客以及82.57%的第6類旅客在春運期間的出行總次數(shù)≤3次,并且無穩(wěn)定的出行線路特征。從出行時間跨度上看,有75%的第1類旅客末次出行與首次出行的時間間隔為9 d,有75%的第2類旅客出行時間跨度為29 d,有75%的第6類旅客出行時間跨度為19 d。這三類旅客具有極強的務工往返公路客運出行特征,分別占公路出行總量的22.67%、11.89%、15.92%。
(1)春運時期,務工出行群體總體上呈現(xiàn)節(jié)前客流分散,節(jié)后客流集中的規(guī)律。
從各類務工出行群體每日出行量分布來看(圖3),節(jié)前務工出行群體客流較小,節(jié)后出行量較為集中。從客流產(chǎn)生的具體時間分布上看,主要有3種差異顯著的出行群體類型,即“節(jié)后高度集中型”“節(jié)后前緊后松型”“節(jié)后前松后緊型”。第1類務工出行旅客客流在春節(jié)后迅速增加,在正月初六和正月十六達到最高峰,為節(jié)后高度集中的出行群體;第6類務工出行旅客在正月初一至正月初十的客流較為集中,正月十一及以后出行客流平緩并逐漸下降,為節(jié)后“前緊后松”的出行群體;相比之下,第2類務工出行旅客在春節(jié)后至元宵節(jié)的客流較為平緩,正月十六的出行量明顯增長,為春節(jié)后“前松后緊”的出行群體。
(2)春運時期,高頻通勤出行旅客較為穩(wěn)定,低頻通勤出行旅客在節(jié)后出行量劇增。
由圖3可以發(fā)現(xiàn),頻繁使用公路客運通勤出行的旅客占比極小,節(jié)前出行量無明顯變化,節(jié)后出現(xiàn)小幅增長,但總體較為穩(wěn)定。相比之下,將公路客運作為通勤方式之一的低頻通勤出行旅客占比更大,與節(jié)前出行量相比,節(jié)后低頻通勤出行旅客出行量顯著增長,尤為活躍。
圖3 春運時期六類旅客每日出行量分布曲線圖
由于出行屬性不同,使用公路客運通勤的旅客以中短途出行為主,約70.4%的通勤旅客出行里程<200 km;公路客運務工出行的旅客以中長途出行為主,約75.95%的務工出行旅客出行里程>100 km。如圖4所示。
對識別出的務工出行群體和通勤出行群體在春運時期客流的空間流動性進行統(tǒng)計分析,如圖5所示。
經(jīng)對比分析發(fā)現(xiàn),通勤出行在春運時期具有明顯的時間均衡性,節(jié)前和節(jié)后出行差別不大,具有較強的穩(wěn)定性;相比之下,務工出行受春運的影響較大,出行集中與分散性規(guī)律明顯。臘月二十二開始出現(xiàn)務工人員集中返鄉(xiāng)現(xiàn)象,至臘月二十四達返鄉(xiāng)高潮,此后隨著春節(jié)來臨,返鄉(xiāng)量逐漸降低至臘月二十八再次出現(xiàn)小高潮。春節(jié)過后,正月初三開始出現(xiàn)務工人員返工出行活動,至正月初六、正月初九和正月初十達返工出行高潮,有60.9%的務工人員完成返工,正月十六左右再次出現(xiàn)返工小高潮,有84.1%的務工人員完成返工,之后返工流逐漸降至最低。
(a) 通勤旅客
(b) 務工旅客
(a) 節(jié)前
(b) 節(jié)后
由于務工出行群體在春運時期具有顯著的時間不均衡性,造成特殊時期客流空間高度集中,對群體出行效率、出行體驗和幸福感帶來嚴重負面效應。為客觀評價春運時期務工出行旅客的出行效率,采用候車時間指數(shù)、中轉(zhuǎn)時間指數(shù)及出行時間指數(shù)作為評估區(qū)域公路客運運營效率的關(guān)鍵指標。各指標計算公式如式(4)~(6)所示。
(4)
式中:BIWait——旅客候車時間指數(shù),表示候車時長(取票至發(fā)車時間長度)占總出行時長的比例;
T發(fā)j——第j程發(fā)車時間;
T取j——第j程旅客取票時間(j=1,…,k);
i——統(tǒng)計旅客人數(shù)(i=1,2,…n)。
(5)
式中:BITransit——旅客中轉(zhuǎn)時間指數(shù),表示旅客行程中總中轉(zhuǎn)時長占總出行時長的比例;
T到(j-1)——第(j-1)程到站時間(j=2,…,k)。
(6)
式中:BITravel——旅客出行時間指數(shù),表示旅客單位里程的出行時間;
T到k——第k程(即最后一程)的到站時間;
T發(fā)1——第1程發(fā)車時間;
SCoach——旅客公路出行總里程。
根據(jù)上述外出務工群體的出行量及出行時間分布特征,將春運時期外出務工旅客的出行時段分為返鄉(xiāng)平緩期(臘月十六至臘月廿一)、返鄉(xiāng)上升期(臘月廿二至臘月廿三)、返鄉(xiāng)高峰期(臘月廿四)、返鄉(xiāng)下降期(臘月廿五至臘月廿九)、返工上升期(正月初三至正月初五)、返工高峰期(正月初九至正月初十)、返工次高峰期(正月十六至正月十七)及返工下降期(正月十八至正月廿五),分別計算各時段旅客的出行效率指標,得到如下頁表4所示結(jié)果。
公路旅客出行時間是指出行者通過網(wǎng)絡或到站購票,從到達車站取票開始至最后一程車輛到站時止所歷經(jīng)的總時長,其中候車、中轉(zhuǎn)的時間過長會給旅客出行帶來負效用[16-17]。
由表4可以發(fā)現(xiàn),在返鄉(xiāng)、返工高峰時期,務工出行旅客的候車時長占出行時長的比例明顯升高;節(jié)前中轉(zhuǎn)時長占比及單位里程出行時間與旅客出行需求呈正相關(guān),節(jié)后則出現(xiàn)大幅度降低現(xiàn)象,總體呈現(xiàn)節(jié)前“短時候車長時中轉(zhuǎn)”、節(jié)后“長時候車短時中轉(zhuǎn)”的出行規(guī)律。
表4 春運不同時段外出務工群體出行效率指標計算結(jié)果表
(1)受春運高峰客流影響,務工出行旅客主觀候車時長增加,且節(jié)后返程比節(jié)前返鄉(xiāng)候車時間更長。返鄉(xiāng)高峰時段,務工出行旅客候車時長占總出行時長的18%,返工高峰時段及次高峰時段候車時長占比分別升至22%、29%,旅客出行時間提前,一定程度上反映出春運時期區(qū)域交通擁擠、出行效率整體偏低的現(xiàn)象。
(2)受客觀交通狀況及客運站運營組織影響,務工出行旅客中轉(zhuǎn)時長及單位里程出行時間呈現(xiàn)節(jié)前占比高、節(jié)后大幅下降的趨勢。返鄉(xiāng)高峰時段,務工出行旅客中轉(zhuǎn)時長占總出行時長的23%,每公里出行時間約為3.15 min;返工高峰時段及次高峰時段中轉(zhuǎn)時長占比均降至9%,每公里出行時間分別降至1.82 min、2.10 min,旅客出行換乘更高效,反映出運輸組織的優(yōu)化對提升春運客運運行效率的重要性。
本文基于公路客運聯(lián)網(wǎng)售票大數(shù)據(jù),實現(xiàn)了春運時期外出務工出行群體和本地通勤出行群體的識別及出行模式異質(zhì)性研究,結(jié)果表明:
(1)春運出行群體中,存在超過50%的外出務工出行群體,與本地通勤出行旅客相比,該群體出行時間具有不均衡的復雜性,可分為“節(jié)后高度集中型”“節(jié)后前緊后松型”及“節(jié)后前松后緊型”三種出行類型,是春運時期公路旅客的特殊群體及重點關(guān)注對象。
(2)臘月二十二務工返鄉(xiāng)客流集聚,至臘月二十四出現(xiàn)節(jié)前客流集聚最高峰,期間客流中轉(zhuǎn)滯留時間較長,約占出行總時長的23%,旅客出行滯留的安全風險加大;節(jié)后正月初六返程客流迅速集聚,旅客主觀候車時長大幅度上升,客運站擁堵進一步加劇,此時應重點把握人群集聚特點,進一步完善客運站應急預案。
(3)針對春運時期開展公路出行旅客群體識別及出行模式研究,能夠拓展我國春運時空流動性的地理研究內(nèi)涵,今后還需結(jié)合公交、高鐵等綜合客運聯(lián)網(wǎng)數(shù)據(jù),開展更大范圍、更深入的研究。