王 昌,姜仙童,吳艷平
(交通運輸部科學(xué)研究院,北京 100029)
2020 年以來,受新冠肺炎疫情影響,我國部分地區(qū)地方財政收入減少[1],公交補貼壓力增大。為節(jié)約公交運營成本,提升其服務(wù)質(zhì)量和運營效率,有必要全面了解公交企業(yè)的運營情況,掌握公交客運量的變化特征,科學(xué)劃分公交運營時段,為公交線路發(fā)車班次的確定和運營調(diào)度提供支撐。
公交調(diào)度和排班是城市公交運營的核心工作之一。其主要任務(wù)是合理分配現(xiàn)有的車輛和人員,從而制定科學(xué)的公交運營計劃。目前大部分城市公交的排班都是基于已劃分好的時段進(jìn)行的。管理人員主要依靠經(jīng)驗,將一天劃分為多個時段,如早高峰、晚高峰、平峰等,調(diào)度人員則基于各時段進(jìn)行車輛和人員配置。目前,國內(nèi)外針對公交線路資源配置的研究集中于內(nèi)容、方法兩方面。在公交線路資源配置內(nèi)容研究方面,馮樹民等[2]和劉新民等[3]通過構(gòu)建評價指標(biāo)體系,對公交資源配置進(jìn)行了協(xié)調(diào)度評估;周煒地等[4]以資源配置為基礎(chǔ),界定了公交線路運力合理配置的含義、目標(biāo)及原則;還有研究提出通過優(yōu)化列車時刻表來合理分配有限的資源,有效管理車輛和人員[5-7]。在公交線路資源配置方法方面,國內(nèi)外研究主要集中于公交排班調(diào)度算法與評價:劉繼國[8]、周騫等[9]、丁勇等[10]通過遺傳算法解決公交車輛排班問題;程春陽[11]利用基于模擬退火算法的混合啟發(fā)式算法進(jìn)行電動公交車的排班;陳童等[12]提出不固定時刻表生成技術(shù)和基于不固定時刻表的車輛排班計劃編制技術(shù);李陶然[13]通過蟻群粒子群混合算法來求解公交調(diào)度模型;李文鋒等[14]運用時間牌輪循法進(jìn)行城市公交的智能化排班;Domínguez-Martín等[15]提出加強的混合整數(shù)規(guī)劃模型用于研究車輛路徑調(diào)度問題;Liu 等[16]利用雙目標(biāo)模型制定排班計劃表,使車隊規(guī)模最小;Maro? 等[17]基于線性模型研究電動公交排班問題的解決方法;Ciancio 等[18]利用模擬退火算法研究公交排班需求。
綜上,國內(nèi)外已有研究主要通過對公交運行時間的研究來優(yōu)化公交線路資源配置,缺少基于公交線路客流變化特征的線路資源配置時段劃分研究。實踐中,當(dāng)前的公交企業(yè)主要是按照早高峰、晚高峰、平峰3 個時段來進(jìn)行公交車的調(diào)度排班,缺乏隨客流量變化的精細(xì)化動態(tài)調(diào)整。鑒于此,本文選取煙臺市公交數(shù)據(jù),分析其客流的時段變化特征,引入有序聚類法進(jìn)行公交資源配置時段劃分,解決最優(yōu)時段數(shù)的確定及各時段起終點的劃分問題,并提出各時段對應(yīng)的公交運營調(diào)度措施,以期為公交運營的降本增效提供支撐。
本文以從煙臺市公交集團信息系統(tǒng)中采集的112 條常規(guī)公交線路2019 年客流數(shù)據(jù)為基礎(chǔ),進(jìn)行數(shù)據(jù)處理與挖掘分析,獲取公交客流信息。
公交線路客流數(shù)據(jù)主要來源于公交卡刷卡數(shù)據(jù)、微信支付數(shù)據(jù)和支付寶支付數(shù)據(jù)三方面,主要字段包括:routid(線路編號)、traddate(交易日期)、tradtime(交易時間)等,其中,交易時間為乘客上車時的刷卡時間或通過微信、支付寶支付票款的時間。數(shù)據(jù)示例見表1、表2。
表1 刷卡數(shù)據(jù)(部分)
表2 移動支付數(shù)據(jù)(部分)
本文以上車刷卡及移動支付人數(shù)作為公交客運量的表征。根據(jù)獲取的數(shù)據(jù)信息,刷卡人數(shù)占64.4%,支付寶支付人數(shù)占33.2%,微信支付人數(shù)占2.4%。
由于客流數(shù)據(jù)有3 個來源,因此需按一定時間維度對數(shù)據(jù)進(jìn)行匹配與合并,并填補缺失數(shù)據(jù),修正錯誤值。在處理好原始數(shù)據(jù)后,結(jié)合刷卡率對客流數(shù)據(jù)進(jìn)行全樣本擴樣,為客流數(shù)據(jù)分析和公交線路資源配置方法研究奠定基礎(chǔ)。數(shù)據(jù)處理方法與流程如圖1所示。
圖1 數(shù)據(jù)處理方法與流程
1.2.1 數(shù)據(jù)匹配與融合
由于公交客流數(shù)據(jù)由公交刷卡數(shù)據(jù)、移動支付數(shù)據(jù)(微信、支付寶)組成,因此有必要對數(shù)據(jù)進(jìn)行匹配融合。在對各數(shù)據(jù)進(jìn)行錯誤篩選和清洗后,為減少誤差、提高計算效率,以公交線路ID 為基礎(chǔ),以半小時(0.5h)為時間維度(刷卡或移動支付時間在某0.5h 內(nèi)的人數(shù)為該0.5h 的客運量),匹配同一日期和時間維度的公交客流數(shù)據(jù),匹配規(guī)則如下。
將刷卡數(shù)據(jù)中的公交線路編號、日期和時間分別與移動支付數(shù)據(jù)的公交線路編號、日期和時間匹配,并合并統(tǒng)計0.5h的客流量。
(1)routid(刷卡數(shù)據(jù)公交線路編號)=routid(移動支付數(shù)據(jù)公交線路編號)
(2)traddate(刷卡數(shù)據(jù)日期)=traddate(移動支付數(shù)據(jù)日期)
(3)tradtime(上車刷卡時間)=tradtime(上車移動支付時間),表示刷卡或移動支付時刻同在某0.5h內(nèi)。
0.5h公交客運量計算公式為:
式(1)中:yh為0.5h 總客運量(人次);為0.5h 刷卡客運量(人次);為0.5h 移動支付客運量(人次)。
最后匹配融合的結(jié)果如表3所示。
表3 匹配融合數(shù)據(jù)表(部分)
1.2.2 填補缺失值
公交客流數(shù)據(jù)在記錄或上傳過程中可能會丟失,在檢測到缺失客流數(shù)據(jù)時,可根據(jù)客流數(shù)據(jù)的時間連續(xù)性或歷史規(guī)律填補缺失值,具體方法如下:
(1)根據(jù)時間連續(xù)性,采用相鄰時段客流量的平均值作為缺失值的補充值,計算方法如下:
式(2)中:ys為上一時段客運量(人次);yx為下一時段客運量(人次);yq為缺失時段客運量(人次)。
(2)相鄰上、下時間段數(shù)據(jù)仍然缺失的,利用上周或下周同時間段的歷史客流量數(shù)據(jù)填補缺失數(shù)據(jù)。
本文中,缺失值以上周同一時間數(shù)據(jù)為主要補充,上周同一時間數(shù)據(jù)異?;蛉笔У膭t采用下周同一時間數(shù)據(jù)進(jìn)行補充。
1.2.3 修正錯誤值
在數(shù)據(jù)匹配過程中,若出現(xiàn)線路編號紊亂、時間日期格式不對、客流量異常等問題,會導(dǎo)致數(shù)據(jù)不匹配或匹配錯誤,因此,有必要對線路編號和時間格式等進(jìn)行修正。通過篩選、人工糾正后進(jìn)行匹配融合,無法修正的則刪除。客流量異常問題則根據(jù)客流量數(shù)據(jù)的時間連續(xù)性或歷史規(guī)律進(jìn)行修正,與缺失值填補方法類似。
1.2.4 客流數(shù)據(jù)擴樣
由于本研究只獲取到了刷卡和移動支付數(shù)據(jù),沒有投幣數(shù)據(jù),為實現(xiàn)對全樣本的分析,利用該城市的總體公交客運量與總體公交刷卡量(含移動支付)計算刷卡率,基于0.5h 總客運量yh反推出0.5h內(nèi)全樣本yhk情況。
式(3)中:Ys為總體公交客運量(人次);Yz為總體公交刷卡量(含移動支付)(人次);yh為0.5h 總客運量(人次);yhk為0.5h 內(nèi)全樣本客運量(人次)。
基于已處理的公交線路客流數(shù)據(jù),分析公交線路的客流時變特征,為公交資源配置時段劃分奠定基礎(chǔ)。
將煙臺市常規(guī)公交各線路每天每半小時的客運量數(shù)據(jù)按日期、線路和時間進(jìn)行匯總,從而獲取所有線路每天的總客運量,再將日期對應(yīng)到周中的每天,并求全年的均值,獲取如圖2 所示數(shù)據(jù)(圖2中工作日為星期一~星期五;節(jié)假日為元旦、春節(jié)、國慶、五一等法定節(jié)假日,周末指星期六及星期日)。由圖2可知,煙臺常規(guī)公交線路在工作日各天的客運量變化不大,而節(jié)假日的日均客運量不足40萬人次,周末較工作日日均客運量低8%以上,尤其是周日客運量更低。因此,在進(jìn)行公交線路資源配置時,需區(qū)分工作日、周末和節(jié)假日的時段劃分并采取對應(yīng)的調(diào)度方法。
圖2 煙臺常規(guī)公交線路日均客運量統(tǒng)計
以4:30—23:30 作為公交的運營時段進(jìn)行分析,煙臺常規(guī)公交線路全年日均一天內(nèi)不同時段客流變化情況如圖3所示。煙臺市工作日設(shè)置的早高峰時段為7:00—8:30,晚高峰時間段為16:30—18:30,在高峰時段客運量達(dá)到峰值。早上6:30—9:00,每0.5h 客運量超過了2 萬人次,晚高峰每0.5h客運量超過了1.8萬人次。周末客流變化也呈現(xiàn)早晚高峰形態(tài),節(jié)假日則不明顯。由此可知,煙臺市公交資源配置的高峰時段設(shè)置相對不合理,線路排班和人員安排等方案有待優(yōu)化。另外,從分析結(jié)果可看出,工作日、周末和節(jié)假日的公交客流特征相差較大,不同時段的客運量也相差較大,因此,在進(jìn)行公交資源配置時段劃分時,有必要將三類日期分開分析。
圖3 煙臺常規(guī)公交線路全年日均一天內(nèi)不同時段客運量變化情況
公交發(fā)車車次體現(xiàn)了公交運營效率,在有限的公交乘坐需求下,為公交線路設(shè)置合理的發(fā)車車次能節(jié)約公交車輛和工作人員等資源,獲得最大的旅客運送效率。不同時段的公交客運量具有不同的特征,因此,發(fā)車車次也需在不同時段合理配置。下文將利用公交客運數(shù)據(jù),基于聚類分析法對公交線路車輛配置時段進(jìn)行劃分。
有序聚類法的特點是將按順序排列的樣本看作一類,然后依據(jù)分類的誤差函數(shù)逐漸增加分類數(shù),但樣本的順序不變[19]。公交客流數(shù)據(jù)具有按時間順序有序、連續(xù)排列的特征,因此,適合用有序聚類法劃分公交資源配置時段:將按時間排列的公交線路客運量視為一組有序樣本,以公交資源配置時段劃分為聚類目標(biāo),找到公交線路客流時段劃分的解決方法。
記按時間順序排序的客流量有序樣本X={x(1),x(2),…,x(n)}(x(i)為m維向量,i=1,2,…,n),將其分割為k段,根據(jù)排列組合原理,有種分割方法,其中有一種或多種是最優(yōu)分割。
用W(n,k)代表把n個有序樣本分成k類的某種分法,各類分割計為:
式(4)中:Gk為第k類的分割;ik為k類的分割點;1=i1 (1)計算類直徑 類直徑表示各分段內(nèi)部的差異程度,各分段內(nèi)部差異越小,直徑就越短。某種分類G包含的樣本為X={x(1),x(2),…,x(j)},記為分類G={i,i+1,…,j}(j為G類中的元素),該類的均值向量(X(t)為第t個樣本),用D(i,j)代表這一類的直徑,有: (2)計算損失函數(shù) 損失函數(shù)L[W(n,k)]為: 損失函數(shù)越小,代表分段內(nèi)的差異越小,也代表各分段間的差異越大。當(dāng)參數(shù)n,k為已知數(shù)時,L[W(n,k)]越小,代表各分類的離差平方和越小,聚類結(jié)果就越合理[20],因此,要尋找使L值最小的W(n,k),即最優(yōu)分割L[P(n,k)]: (3)L[P(n,k)]的遞推公式 有序聚類最核心的部分是利用以下兩個遞推公式: 以上兩公式由定義即可證明。其中由式(8)遞推出的式(9)表明,將n個樣本分為k類的最優(yōu)分割,是建立在將各樣本分為k-1 類的最優(yōu)分割基礎(chǔ)上的(這里j=2,3,…,n)。 (4)最優(yōu)分段數(shù)k的確定 有序聚類法是在給定分段數(shù)的情況下進(jìn)行的,因此需提前確定好最優(yōu)分段數(shù),最優(yōu)分段數(shù)確定的方法有以下幾種: ①在最小損失函數(shù)L[W(n,k)]隨分段數(shù)k變化的曲線中,發(fā)生突變處的分段數(shù)為最優(yōu)分段數(shù)k。 ②β值(貝塔系數(shù))法:β=,β值越大,說明分段越優(yōu),當(dāng)β值接近1 時則為最優(yōu)分段數(shù)。 ③根據(jù)判斷先提出可能的分段數(shù)進(jìn)行聚類,再對分段結(jié)果進(jìn)行F檢驗,接受假設(shè)檢驗且F值最大的則為最優(yōu)分段數(shù)。 基于有序聚類法劃分公交資源配置時段,前提是確定最優(yōu)分段數(shù)。在以上的最優(yōu)分段數(shù)確定方法中,曲線法需要人為判斷,存在人工誤差,F(xiàn)檢驗法需經(jīng)多次試錯才能找到最優(yōu)分段數(shù)。因此,本文利用不需要人工干預(yù)的β值法確定公交資源配置時段最優(yōu)分段數(shù)。由公交客流時變特征分析結(jié)果可知,工作日、周末和節(jié)假日的客運量變化規(guī)律相差較大,因此,在聚類時需將這3 種日期分開研究,以3 種日期各自的0.5h 客運量(見表4)為聚類基礎(chǔ),3 者的最優(yōu)分割段數(shù)也不一樣。 表4 各日期類型的0.5h客運量(部分) 單位:人次 采用β值法確定3 種日期類型的公交資源配置時段最優(yōu)分段數(shù),結(jié)果見表5。 表5 各日期類型有序聚類的公交資源配置時段最優(yōu)分段數(shù) 在最優(yōu)分段數(shù)的基礎(chǔ)上,基于有序聚類法,對公交資源配置時段進(jìn)行劃分: (1)工作日:4:30—6:30,6:30—9:30,9:30—16:30,16:30—18:30,18:30—23:30; (2)周末:4:30—7:00,7:00—9:30,9:30—18:30,18:30—23:30; (3)節(jié)假日:4:30—7:00,7:00—19:00,19:00—23:30。 為證明有序聚類結(jié)果的有效性,對有序聚類結(jié)果進(jìn)行F檢驗。以工作日為例,檢驗結(jié)果如表6 所示。由表6 可知,工作日的5 類時段劃分的樣本標(biāo)準(zhǔn)偏差大于基準(zhǔn)值,F(xiàn)檢驗顯著,說明各分段結(jié)果具有顯著差異。表7 所示為工作日各時段多重比較結(jié)果,早晚高峰(第2、4 類)與平峰(第1、3、5類)差異性較明顯,但早晚高峰(第2、4類)與早高峰之前時段(第1類)和晚高峰之后時段(第5 類)無顯著性差異(顯著性水平p>0.05),這也符合一天內(nèi)的公交客運量變化曲線圖(見圖3)揭示的規(guī)律。因此,有序聚類方法有效,煙臺市公交早高峰時間應(yīng)該調(diào)整為6:30—9:30。 表6 工作日聚類結(jié)果F檢驗 基于煙臺市公交配置時段劃分結(jié)果,充分考慮線路的時空不均勻性,確定不同時段內(nèi)的公交發(fā)車形式及每種形式的車輛數(shù)。結(jié)合具體線路和站點的情況,建議各時段公交運營調(diào)度措施如下: (1)工作日6:30—9:30 和16:30—18:30 客流量較大,可采取區(qū)間車、加密發(fā)車間隔、大站快車、直達(dá)車、日勤車(高峰時段加入線路)等調(diào)度措施; (2)周末7:00—9:30 客運量相對較大,可采取局部加密發(fā)車間隔、大站快車、直達(dá)車等調(diào)度措施; (3)工作日的4:30—6:30、18:30—23:30,周末的4:30—7:00、9:30—18:30、18:30—23:30 及節(jié)假日全部3 個時段,客運量均相對較小,以“人多車密,人少車稀”為原則,可采取局部加密發(fā)車間隔、加大行車間隔、延長單程行駛時間、局部加大間隔增發(fā)區(qū)間車等調(diào)度措施。 本文基于煙臺市常規(guī)公交線路客流數(shù)據(jù),利用有序聚類法劃分公交資源配置時段,得出煙臺市工作日、周末和節(jié)假日的公交線路資源配置時段最優(yōu)分段數(shù)為5 個、4 個和3 個,并給出了具體的時段區(qū)間,劃分結(jié)果符合顯著性檢驗要求和客流變化規(guī)律,證明了該方法有效。研究成果可為公交運營調(diào)度提供參考,對排班計劃的制定和早晚高峰時段的劃分具有現(xiàn)實意義,相關(guān)部門可利用劃分好的時段,結(jié)合運營實際安排線路班次。由于數(shù)據(jù)資源有限,本文只獲取了煙臺市的公交數(shù)據(jù),對其他城市尚未展開研究。在未來的研究中,可基于本文研究成果,對不同城市的公交線路資源配置時段進(jìn)行劃分,并研究公交排班方法,從而為各城市公交運營降本增效提供支撐。3.3 有序聚類法的步驟
3.4 基于有序聚類的公交資源配置時段劃分
3.5 基于時段劃分的公交運營調(diào)度方法
4 結(jié)語