• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于SVM-KNN的降雨條件下短時(shí)公交客流預(yù)測(cè)*

      2018-12-14 10:09:42劉欣彤黃小龍謝秉磊
      交通信息與安全 2018年5期
      關(guān)鍵詞:客流降雨公交

      劉欣彤 黃小龍 謝秉磊

      (哈爾濱工業(yè)大學(xué)(深圳)研究生院 廣東 深圳 518055)

      0 引 言

      隨著城市的不斷發(fā)展,公交優(yōu)先及公交都市等理念越來(lái)越深入人心,而更加高效及更具前瞻性的公交調(diào)度策略是公交優(yōu)先戰(zhàn)略的保障。短時(shí)公交客流作為公交資源配置及公交網(wǎng)絡(luò)規(guī)劃的重要依據(jù),其精確程度關(guān)乎公交運(yùn)營(yíng)調(diào)度策略的成敗[1-3]。研究表明,居民出行行為受降雨等不利天氣條件的影響較大,從而影響公交客流的變化規(guī)律。據(jù)統(tǒng)計(jì),北上廣深四大一線城市的降雨天數(shù)占全年的占比都超過(guò)了20%,可見(jiàn)降雨是生活中最為常見(jiàn)的不利天氣。因此,研究雨天短時(shí)公交客流的變化規(guī)律,進(jìn)而提高短時(shí)公交客流的預(yù)測(cè)精度,是提高公共交通系統(tǒng)運(yùn)力和服務(wù)水平,滿足居民精細(xì)化多樣化交通需求的有效方式。

      國(guó)外相關(guān)學(xué)者對(duì)于天氣對(duì)公交影響及短時(shí)公交客流預(yù)測(cè)等方面都開(kāi)展了比較深入的研究,取得了較為豐碩的理論成果。部分學(xué)者從不同角度探究不利天氣與居民出行需求的聯(lián)系,如Cools等[4]從描述性分析和獨(dú)立性測(cè)試2個(gè)方面研究了天氣對(duì)出行需求的影響,結(jié)果表明不利天氣對(duì)居民的非剛性出行需求影響較大;Khattak等[5]研究了不利天氣條件對(duì)出行行為的影響,得出了出行者遇到不利天氣會(huì)改變其原有出行方式的結(jié)論;短時(shí)客流預(yù)測(cè)方面,Xue等[6]及Ma等[7]都提出了多模式深度融合的預(yù)測(cè)模型,事實(shí)證明混合預(yù)測(cè)模型預(yù)測(cè)精度優(yōu)于單個(gè)預(yù)測(cè)模型;Bai等[8]提出多模式深度融合的(MPDF)方法,將AP聚類分析與DBN相結(jié)合,提高了短時(shí)公交客流預(yù)測(cè)的精度,Teng等[9]分別用ARIMA模型和RBF模型預(yù)測(cè)短時(shí)公交客流的線性與非線性部分,實(shí)驗(yàn)證明此種方法比單一的預(yù)測(cè)模型具有更高的準(zhǔn)確率。

      反之國(guó)內(nèi)學(xué)者尚未將天氣因素與短時(shí)客流預(yù)測(cè)統(tǒng)籌考慮,研究也不成體系。天氣對(duì)出行行為影響方面,張本森[10]及王健等[11]研究了冰雪條件下居民的出行行為,指出冰雪天氣會(huì)影響居民的出行行為。短時(shí)公交客流預(yù)測(cè)方面,薛紅軍等[12]提出一種基于決策樹(shù)的非參數(shù)預(yù)測(cè)模型,具有較高的準(zhǔn)確性和穩(wěn)定性;鄧滸楠等[13]和鄒巍等[14]分別用最小二乘、遺傳算法與小波神經(jīng)網(wǎng)絡(luò)結(jié)合的方法預(yù)測(cè)短時(shí)公交客流,具有良好的預(yù)測(cè)效果;袁堅(jiān)[15]用貝葉斯模型從時(shí)間和空間2個(gè)不同角度進(jìn)行預(yù)測(cè),實(shí)用性較強(qiáng)。

      短時(shí)公交客流預(yù)測(cè)作為客流預(yù)測(cè)的重要組成部分[16],近年來(lái)越來(lái)越受到國(guó)內(nèi)外專家學(xué)者的重視,并取得了一系列研究成果。國(guó)內(nèi)外學(xué)者的研究主要集中在公交客流的日變化規(guī)律,尚未考慮更短時(shí)間間隔的變化規(guī)律;對(duì)于不利天氣對(duì)公交客流的影響研究較少,且主要集中在交通流方向?,F(xiàn)有的研究都撇開(kāi)具體影響因素而僅對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單非參數(shù)回歸,時(shí)效性和準(zhǔn)確性都有待提高。筆者提出了一種適用性強(qiáng)且時(shí)效性高的SVM-KNN預(yù)測(cè)模型,并用深圳市公交客流數(shù)據(jù)進(jìn)行了效果驗(yàn)證。

      1 數(shù)據(jù)的處理及分析

      1.1 數(shù)據(jù)來(lái)源

      筆者以2014年深圳市南山區(qū)的部分公交線路前10個(gè)月公交IC卡數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),通過(guò)對(duì)數(shù)據(jù)的預(yù)分析處理建立初始數(shù)據(jù)庫(kù),其中日類型用“0”,“1”分別表示工作日及周末;天氣類型則記為無(wú)雨(“0”)及有雨(“1”);以0,1,2,3,…表示不同線路名稱;降雨等級(jí)記為w(1),w(2),…,w(n),時(shí)間間隔為15 min,分別用0,1,2,3,4,5代表6個(gè)等級(jí)代表雨量的大小,從0到5雨量依次增大;相應(yīng)時(shí)段的客流量記為V(1),V(2),…,V(n),得到的分類標(biāo)簽見(jiàn)表1。

      表1 公交客流歷史數(shù)據(jù)庫(kù)

      1.2 相關(guān)性分析

      通過(guò)計(jì)算Pearson系數(shù)來(lái)探究降雨天氣對(duì)公交客流的影響,計(jì)算見(jiàn)式(1)。

      (1)

      其中,r>0,r<0及r=0分別表示正相關(guān),負(fù)相關(guān)及不相關(guān)。為了消除時(shí)變性引起的差異,采用Kalkstein等[17]及Singha等[18]提出的“小時(shí)客流偏差率”eth為客流量。具體計(jì)算見(jiàn)式(2)。

      (2)

      按上述方法對(duì)數(shù)據(jù)進(jìn)行分析,得表2。

      表2 降雨天氣與客流量的相關(guān)性分析

      由上表可知,工作日降雨天氣與公交客流存在較強(qiáng)的負(fù)相關(guān)關(guān)系,周末存在極強(qiáng)的負(fù)相關(guān)關(guān)系。對(duì)比r可知,不同日類型中,降雨對(duì)非工作日公交客流影響較大,這是因?yàn)楣ぷ魅粘鲂卸酁橐怨ぷ鳛槟康膭傂酝ㄇ谛枨?,剛性需求幾乎不受外界因素影響;而周末出行主要為旅游、?gòu)物等彈性需求,一旦出現(xiàn)降雨等不利天氣情況,居民大多會(huì)改變出行方式或者取消出行。

      1.3 降雨天氣對(duì)公交客流的影響

      采用控制變量的方法從不同方面分析不同降雨量對(duì)公交總體客流的影響,并用平均差及顯著性進(jìn)行檢驗(yàn),其中自變量為降雨強(qiáng)度,因變量為客流偏差率,此外,列出了m299及m369兩路公交車進(jìn)行對(duì)比,見(jiàn)表3~4。

      表3 不同日類型公交線路偏差客流量與各降雨等級(jí)的多重比較結(jié)果

      表4 不同降雨量對(duì)公交客流的影響分析

      由以上表3~4可以看出:在總體上,降雨天氣會(huì)減少居民的出行需求,隨著雨量的增大,對(duì)客流的不利影響也越大。從不同日類型分析,周末客流受降雨的影響較大,這是由于居民周末出行多為彈性出行,較易更換或取消;從不同出行時(shí)段分析,非高峰時(shí)段客流受降雨的影響較大;從不同公交線路分析,不同性質(zhì)及重要程度的公交線路的客流受到降雨天氣的影響程度不同。

      2 SVM-KNN算法

      (支持向量機(jī))SVM是一種基于統(tǒng)計(jì)理論基礎(chǔ)上的有監(jiān)督機(jī)器學(xué)習(xí)算法,其具有良好的分類效果,能將大量的數(shù)據(jù)進(jìn)行快速有效的分類,但由于其在分界面上的分類具有易錯(cuò)性,所以不能單獨(dú)用于預(yù)測(cè)短時(shí)公交客流;(K近鄰算法)KNN是一種較為成熟也容易實(shí)現(xiàn)的非參數(shù)回歸算法,其不僅可分類也可用于回歸預(yù)測(cè),且預(yù)測(cè)精度高,無(wú)需參數(shù)標(biāo)定,在各領(lǐng)域的非線性參數(shù)回歸分析中有廣泛的應(yīng)用,但其需尋遍整個(gè)空間尋找K個(gè)最近鄰,計(jì)算量大且效率低下,在大數(shù)據(jù)樣本上的預(yù)測(cè)上效果不佳。

      因此,本文采用SVM與KNN二者相融合的算法,將兩者的優(yōu)點(diǎn)相結(jié)合,既降地了錯(cuò)誤率,提高了預(yù)測(cè)精度,又大大提高其計(jì)算效率。具體步驟如下。

      1)子數(shù)據(jù)庫(kù)的生成。選用LibSVM對(duì)上文建立的歷史數(shù)據(jù)庫(kù)進(jìn)行分類,其中核函數(shù)選取RBF核函數(shù),在訓(xùn)練過(guò)程中采用GirdSearch尋找最佳的罰系數(shù)c和參數(shù)γ,將相同標(biāo)簽的數(shù)據(jù)定義為一個(gè)子數(shù)據(jù)庫(kù),并用SVM算法來(lái)識(shí)別搜索子數(shù)據(jù)庫(kù),RBF核函數(shù)見(jiàn)式(3)。

      (3)

      2)基于KNN的模式識(shí)別。

      (1)定義狀態(tài)向量。狀態(tài)向量一般指影響預(yù)測(cè)客流的相關(guān)影響因素,選取預(yù)測(cè)時(shí)段t的前m個(gè)時(shí)段的客流量為狀態(tài)向量1,用X1(t)表示,m的取值由自相關(guān)系數(shù)得出;由于本文考慮天氣因素,選取與客流關(guān)系較為密切的天氣變量定為狀態(tài)向量2,用X2(t)表示見(jiàn)式(4)~(5)。

      X1(t)=[V(t-m+1)V(t-m+2) …V(t) ]

      (4)

      X2(t)=[w(t)w(t+1)…w(t+n-1) ]

      (5)

      (2)定義距離準(zhǔn)則。采用加權(quán)歐氏距離,狀態(tài)向量1與狀態(tài)向量2的加權(quán)歐氏距離見(jiàn)式(6),其中d為總狀態(tài)向量的加權(quán)歐式距離。

      (6)

      3)客流預(yù)測(cè)。

      (1)近鄰搜索。采用基于聚類分析的變K近鄰搜索算法,尋找K個(gè)最近鄰值;

      (2)客流預(yù)測(cè)。各近鄰的權(quán)重大小取決于其對(duì)預(yù)測(cè)值的貢獻(xiàn)的大小,各近鄰權(quán)重見(jiàn)式(7)。

      (7)

      式中:di為第i個(gè)近鄰與狀態(tài)向量之間的歐式距離;d為各加權(quán)距離倒數(shù)之和。

      (8)

      依據(jù)上述算法原理及算法的基本步驟,在結(jié)合前人算法設(shè)計(jì)的基礎(chǔ)上,得出本算法流程圖,見(jiàn)圖1。

      圖1 SVM-KNN預(yù)測(cè)算法流程示意圖Fig.1 Flow diagram about SVM-KNN prediction algorithm

      3 短時(shí)公交客流預(yù)測(cè)

      3.1 預(yù)測(cè)結(jié)果分析

      據(jù)深圳市南山區(qū)氣象統(tǒng)計(jì)資料,選取降雨時(shí)長(zhǎng)均超過(guò)8 h的7月18日、8月19日、8月20日和9月16日的長(zhǎng)時(shí)間降雨天氣作為研究日期。同時(shí)為了避免片面性,除了選取m299路為主要研究對(duì)象之外,另外選取深圳市南山區(qū)36路、74路及m369路進(jìn)行對(duì)比研究。

      短時(shí)公交客流預(yù)測(cè)的目是優(yōu)化公交發(fā)車間隔,提高服務(wù)水平及居民出行的幸福感,因此需確保短時(shí)公交客流預(yù)測(cè)的時(shí)效性及準(zhǔn)確性?;谝陨峡紤]本文采用平均絕對(duì)誤差(MAE)、平均相對(duì)誤差(MAPE)、均方誤差(MSE)及均方相對(duì)誤差(MSPE)大誤差指標(biāo)來(lái)評(píng)價(jià)預(yù)測(cè)結(jié)果的可靠度。

      為了分析預(yù)測(cè)結(jié)果,本文選取的預(yù)測(cè)時(shí)段為06:30—22:30,時(shí)間間隔為15 min。按照上述預(yù)測(cè)步驟,分別進(jìn)行了實(shí)時(shí)預(yù)測(cè)。圖2為m299路公交車預(yù)測(cè)客流量與實(shí)際值對(duì)比結(jié)果圖,圖中橫坐標(biāo)為6:00-22:30中每隔15 min的預(yù)測(cè)次數(shù)(橫坐標(biāo)為1時(shí)代表6:15,依此類推),縱坐標(biāo)為客流量;表5是根據(jù)預(yù)測(cè)各線路在不同日期的評(píng)價(jià)指標(biāo)值對(duì)比結(jié)果。

      圖2 m299路公交車預(yù)測(cè)客流量與實(shí)際值對(duì)比示意圖Fig.2 A schematic diagram of the comparison between the forecast passenger flow and the actual value of m299

      公交線路MAEMSEMAPEMSPE7月18日366.2218.0360.0980.132748.72610.3710.0810.103m2996.0087.1640.0860.106m36911.74814.0260.1150.152平均8.1769.8980.0950.1238月19日368.74411.1190.1050.129748.75410.7170.0640.083m2996.5788.2120.0860.111m36912.07615.2320.1020.126平均9.03711.3210.0890.1138月20日366.9148.3380.0850.098749.44310.9740.0670.076 7m2997.2759.1150.0880.103m36912.82220.0670.0950.119平均9.11312.1240.0840.0989月16日366.2588.0810.0980.152747.7069.4690.0670.096m2994.1856.3510.0520.065m36911.54914.3270.1190.148平均7.4259.5570.0850.114 9

      由表5可以看出,預(yù)測(cè)數(shù)據(jù)的MAE和MAPE都相對(duì)較小,結(jié)果具有較高的可靠度,可用于預(yù)測(cè)降雨條件下的短時(shí)公交客流預(yù)測(cè)。

      3.2 與其他預(yù)測(cè)模型的對(duì)比分析

      (自回歸積分滑動(dòng)平均模型ARIMA)及(徑向基函數(shù)RBF)也常用于短時(shí)客流預(yù)測(cè),為分析SVM-KNN預(yù)測(cè)方法的優(yōu)劣,需要與以上2種方法進(jìn)行橫向?qū)Ρ?。本文選取m299路短時(shí)公交客流進(jìn)行ARIMA及RBF預(yù)測(cè),將預(yù)測(cè)結(jié)果與SVM-KNN算法進(jìn)行對(duì)比,圖3和圖4分別為基于ARIMA和RBF對(duì)m299路短時(shí)公交客流預(yù)測(cè)的結(jié)果,表6為3種預(yù)測(cè)模型評(píng)價(jià)指標(biāo)的對(duì)比。

      圖3 ARIMA模型預(yù)測(cè)m299路 公交線路客流結(jié)果示意圖Fig.3 The result of passenger flow prediction about m299 by ARIMA model

      圖4 RBF模型預(yù)測(cè)m299路 公交線路客流結(jié)果示意圖Fig.5 The result of passenger flow prediction about m299 by RBF model

      預(yù)測(cè)方法MAEMSEMAPEMSPEARIMA(不考慮降雨因素)Min17.61920.7080.1830.220Max19.02424.9260.2290.292平均18.53823.1450.2110.268ARIMA(考慮降雨因素)Min12.63314.9040.1380.180Max14.44517.7690.1580.197平均13.36216.1530.1510.187RBFMin12.02113.8430.1240.157Max12.20814.8380.1440.185平均12.08314.3560.1340.168SVM-KNNMin7.4259.5570.0840.098Max9.11412.1240.0950.123平均8.43710.7250.0880.113

      由以上分析,并結(jié)合3種預(yù)測(cè)模型的特點(diǎn),可以得出結(jié)論如下。

      1)在降雨天氣天氣條件下,考慮降雨因素的ARIMA模型由于引進(jìn)合理的折減系數(shù),其各項(xiàng)評(píng)價(jià)指標(biāo)明顯比不考慮降雨因素的ARIMA預(yù)測(cè)模型低,可見(jiàn)要提高客流預(yù)測(cè)的準(zhǔn)確性就必須考慮降雨天氣。

      2)從評(píng)價(jià)指標(biāo)對(duì)比分析RBF和AMIMA 2種模型,RBF模型的預(yù)測(cè)結(jié)果的可靠度要高于AMIMA預(yù)測(cè)模型,可見(jiàn)RBF模型在精度上要優(yōu)于AMIMA模型。

      3)SVM-KNN預(yù)測(cè)算法的MAE,MSE,MAPE及MSPE值均小于其他2種模型,可見(jiàn)基于多模式深度融合的SVM-KNN的預(yù)測(cè)精度比單一預(yù)測(cè)模型的預(yù)測(cè)精度高。

      4 結(jié) 語(yǔ)

      將SVM與KNN算法的優(yōu)點(diǎn)有機(jī)結(jié)合,分析了降雨與公交客流相關(guān)關(guān)系及不同降雨強(qiáng)度對(duì)公交客流的影響程度,提出了基于SVM-KNN的降雨天氣下短時(shí)公交客流預(yù)測(cè)模型,最后依據(jù)實(shí)際數(shù)據(jù)對(duì)模型的預(yù)測(cè)效果進(jìn)行了驗(yàn)證,結(jié)果表明,此算法具有較高的準(zhǔn)確率,可以預(yù)測(cè)多條線路,且與其它預(yù)測(cè)模型(如ARIMA與RBF模型)相比具有更好的擬合效果。

      由于空間上短時(shí)公交客流變化規(guī)律不盡相同,所以未來(lái)的研究可以結(jié)合公交GPS數(shù)據(jù)研究各個(gè)不同站點(diǎn)公交客流變化,進(jìn)一步加強(qiáng)短時(shí)公交客流預(yù)測(cè)的模型的普適性。

      猜你喜歡
      客流降雨公交
      客流增多
      一元公交開(kāi)進(jìn)太行深處
      等公交
      等公交
      滄州市2016年“7.19~7.22”與“8.24~8.25”降雨對(duì)比研究
      紅黏土降雨入滲的定量分析
      基于自學(xué)習(xí)補(bǔ)償?shù)氖覂?nèi)定位及在客流分析中的應(yīng)用
      人工免疫算法在電梯客流時(shí)段劃分的應(yīng)用
      南方降雨不斷主因厄爾尼諾
      江埡水庫(kù)降雨徑流相關(guān)圖的建立
      绥中县| 安仁县| 宁海县| 满城县| 瑞昌市| 聂拉木县| 扎鲁特旗| 长汀县| 桃江县| 电白县| 介休市| 罗田县| 承德市| 正定县| 阳城县| 北辰区| 叶城县| 溆浦县| 驻马店市| 广丰县| 龙泉市| 乐业县| 汕尾市| 青龙| 措勤县| 六盘水市| 涡阳县| 青冈县| 泗洪县| 长泰县| 金溪县| 牙克石市| 正阳县| 邛崃市| 南江县| 德安县| 大邑县| 黔西县| 宁海县| 沁水县| 永丰县|