李林波,李 楊
(同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,上海201804)
汽車產(chǎn)業(yè)的快速發(fā)展與城市空間資源的有限構(gòu)成嚴(yán)重沖突,供需矛盾日益尖銳,停車難問題成為了各大城市的挑戰(zhàn)。為緩解停車設(shè)施停車難現(xiàn)象、提高停車設(shè)施的利用率,精細(xì)化停車管理的理念在近些年來逐漸被大眾所接受[1-2]。作為精細(xì)化停車管理中的一部分,停車誘導(dǎo)系統(tǒng)(parking guidance system)[3-4]能夠緩解交通擁堵的有效辦法,但停車需求短時(shí)的精準(zhǔn)預(yù)測作為空余車位發(fā)布的關(guān)鍵技術(shù)并沒有得到有效解決。
停車需求預(yù)測可分為宏觀停車需求預(yù)測與微觀停車需求預(yù)測,宏觀需求預(yù)測方法主要有停車生成率模型、出行吸引量模型、交通量停車需求模型與多元回歸分析模型等[1],一般屬于長時(shí)預(yù)測;微觀需求預(yù)測則是針對某一設(shè)施,對某一時(shí)間內(nèi)的停車需求進(jìn)行預(yù)測,屬于短時(shí)預(yù)測,由于環(huán)境條件基本穩(wěn)定,預(yù)測精度相對較為準(zhǔn)確,這一方面的研究主要分為單一預(yù)測模型[1,5-12],以及組合預(yù)測模型[13-16],較多采用的模型主要有ARIMA預(yù)測模型[5-6]、考慮時(shí)空相關(guān)性的多元自回歸預(yù)測模型[7]、馬爾科夫模型[8]、卡爾曼濾波模型[9]、傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型[10-12]、基于Cox比例風(fēng)險(xiǎn)回歸模型[1]、模糊神經(jīng)網(wǎng)絡(luò)預(yù)測方法[17]、結(jié)合小波分析以及馬爾科夫鏈有效的泊位占有率短時(shí)預(yù)測方法[16]、基于混沌和BP神經(jīng)網(wǎng)絡(luò)的復(fù)合預(yù)測方法[13]、基于小波變換的神經(jīng)網(wǎng)絡(luò)改進(jìn)方法[15]、基于相空間重構(gòu)及Elman網(wǎng)絡(luò)的短時(shí)停車泊位預(yù)測方法[14]、基于BP神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈融合的組合預(yù)測方法[18]等。上述研究雖取得了一定的成果,但依然存在著一些不足。首先,大多數(shù)研究僅僅只是將泊位占有率的歷史數(shù)據(jù)導(dǎo)入模型中進(jìn)行計(jì)算,而未曾深究停車需求在不同月份以及不同工作日間的差異性,而對于停車需求差異性的研究正是精細(xì)化停車管理所需要的,忽略數(shù)據(jù)間差異性的處理必然會導(dǎo)致預(yù)測誤差偏高。其次,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)難以對時(shí)間序列數(shù)據(jù)內(nèi)在的關(guān)聯(lián)性進(jìn)行準(zhǔn)確建模,其假設(shè)相鄰的輸入樣本在時(shí)間維度上的獨(dú)立性,事實(shí)上停車需求數(shù)據(jù)在時(shí)間維度上存在著較強(qiáng)的相關(guān)性,如何有效對于存在較強(qiáng)非線性與時(shí)間依賴性的停車需求數(shù)據(jù)進(jìn)行有效建模尚待解決。本研究旨在解決現(xiàn)有研究所存在的上述兩個不足,針對第一點(diǎn),研究將深入挖掘停車需求數(shù)據(jù)中的差異性,試圖將這種差異性的研究融入至停車需求的短時(shí)精準(zhǔn)預(yù)測中。針對上述的第二點(diǎn),本研究將嘗試將GRU(Gated Recurrent Unit)[19]模型首次引入至停車需求預(yù)測中,作為近年普遍使用的循環(huán)神經(jīng)網(wǎng)絡(luò)之一[20-22],GRU模型在保持了LSTM(Long Short-term Memory)效果的同時(shí)又使模型結(jié)構(gòu)簡單[19]。
選取2015.01—2015.12新華醫(yī)院停車設(shè)施(三級綜合醫(yī)院,數(shù)據(jù)量約67.8萬條,泊位數(shù)為425個)自動采集的停車數(shù)據(jù)進(jìn)行分析,原始數(shù)據(jù)信息包含了以下四個方面的信息:車輛識別信息、停車記錄信息、停車收費(fèi)信息以及停車管理信息。停車場原始數(shù)據(jù)每條記錄包含每輛車駛?cè)?、駛離停車場的具體時(shí)間點(diǎn),以30min為間隔獲得各時(shí)間范圍內(nèi)的出入場流量數(shù)據(jù),再加上一時(shí)間點(diǎn)的在場車輛數(shù),則可獲得各時(shí)間點(diǎn)上的停車需求量。由于停車需求的矛盾主要產(chǎn)生在工作日,因此剔除非工作日以及節(jié)假日等數(shù)據(jù),最終得到244d的正常工作日數(shù)據(jù),每月有效的數(shù)據(jù)樣本數(shù)如表1所示。
表1 新華醫(yī)院每月有效工作日天數(shù)Tab.1 Sample data of parking demand in each month of Xinhua Hospital
新華醫(yī)院全年工作日時(shí)變曲線如圖1所示,其各月實(shí)際泊位占用量每天時(shí)變趨勢大致相似,呈現(xiàn)出上午、下午的停車需求高峰活躍期及晚間19:30左右的小高峰活躍期;在不同工作日間,停車需求的時(shí)變曲線線型非常相似,并且每日停車需求時(shí)變曲線重合度很高,呈現(xiàn)出穩(wěn)定性的特征[2]。為研究停車需求在不同月份之間的差異性,采用聚類分析將12個月的停車需求劃分四類(1—3月/7—8月/4—6月,9—11月/12月),其中1—3月的停車需求高于全年其余月份,接著為7—8月,其次為4—6月和9—11月,12月的停車需求要略低于全年其余月份。
圖1 新華醫(yī)院全年間停車需求時(shí)變擬合曲線Fig.1 Time-varying curves of parking demand grouping by months of Xinhua hospital.
為研究新華醫(yī)院停車需求在不同工作日間的差異性,選取4—6月份每天6:00—22:00的數(shù)據(jù),按周內(nèi)各工作日(每周一、周二、周三、周四、周五)對泊位占有率時(shí)變曲線進(jìn)行分組,得到五組的擬合曲線如圖2所示。
圖2 新華醫(yī)院周內(nèi)工作日間停車需求時(shí)變擬合曲線1Fig.2 Time-varying curves of parking demand grouping by different working days.
可以發(fā)現(xiàn):①每周一的擬合曲線振幅要高于其它工作日的擬合曲線;②每周五的擬合曲線在14:00之后出現(xiàn)逐漸下降的趨勢,且振幅最低;③每周二、周三及周四的擬合曲線基本重合,停車需求特征非常穩(wěn)定,可劃分為一組。在此基礎(chǔ)上進(jìn)行組間歸并,最終劃分為三組:周一為需求較高的一組;周二、周三、周四為需求較為穩(wěn)定的一組;周五為需求在午后出現(xiàn)下降的一組,三組擬合曲線如圖3所示,顯然,停車需求在不同工作日間也存在著一定的顯著差異性,因此,在面向精細(xì)化停車管理過程中,對停車需求的精準(zhǔn)預(yù)測,有必要依據(jù)周內(nèi)工作日的差異性對停車需求數(shù)據(jù)進(jìn)行分組建模,以進(jìn)一步提高模型預(yù)測的精度。
圖3 新華醫(yī)院周內(nèi)工作日間停車需求時(shí)變擬合曲線2Fig.3 Time-varying curves of parking demand after regrouping by different working days
LSTM模型[23]是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN(recurrent neural network)的一種特殊形式,有著與RNN類似的鏈?zhǔn)叫问?,不僅能記憶之前時(shí)刻隱藏層的計(jì)算結(jié)果,對于時(shí)間序列有著很強(qiáng)的學(xué)習(xí)能力,并解決了RNN存在著的梯度消失和面臨長期依賴的挑戰(zhàn)等問題[23]。GRU[24]作為LSTM的變形,其內(nèi)部單元與LSTM內(nèi)部單元相似,但GRU模型將忘記門和輸入門合成了一個單一的更新門,在保持了LSTM效果的同時(shí)又使模型結(jié)構(gòu)簡單[24],其細(xì)胞結(jié)構(gòu)如圖4所示。
圖4 RNN及其變形細(xì)胞單元結(jié)構(gòu)Fig.4 Structure of RNN,LSTM,GRU cells
相比于長短期記憶神經(jīng)網(wǎng)絡(luò),門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)的循環(huán)結(jié)構(gòu)只有兩處,由決定保留多少當(dāng)前輸入信息xt的更新門以及控制前一時(shí)刻的輸出ht-1對當(dāng)前輸入xt的影響的復(fù)位門組成。門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)具體的計(jì)算步驟如下:
(1)當(dāng)前輸入信息xt與前一時(shí)刻的輸出ht-1經(jīng)由更新門輸出得一個0~1之間的數(shù)值,其中0表示完全舍棄輸入信息,1表示完全保留輸入信息,計(jì)算如下:
(2)當(dāng)前輸入信息xt與前一時(shí)刻的輸出ht-1經(jīng)由復(fù)位門輸出得一個0~1之間的數(shù)值,同時(shí)tanh層會創(chuàng)建的新的候選值向量h?t,計(jì)算如下:
(3)由更新門輸出作為權(quán)重向量,前一時(shí)刻的輸出ht-1與候選向量h?t通過加權(quán)平均得到此時(shí)刻的輸出值ht,計(jì)算如下:
式中:[?]表示兩個向量相連;?表示矩陣的乘積;zt代表更新門的輸出向量;rt代表復(fù)位門輸出向量;h?t代表此時(shí)刻的候選向量;ht代表此時(shí)刻輸出向量;xt代表此時(shí)刻輸入向量;W代表權(quán)重向量。
采用新華醫(yī)院停車場2015年4月1日至2015年6月12日中工作日數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,采用2015年6月15日至2015年6月19日的數(shù)據(jù)作為測試集(共165個數(shù)據(jù)點(diǎn)),泊位占有率數(shù)據(jù)的時(shí)間段為工作日早上6:00至晚上22:00。同時(shí)根據(jù)第一節(jié)中周內(nèi)各工作日時(shí)變曲線存在的差異性,將新華醫(yī)院的訓(xùn)練數(shù)據(jù)劃分為3組(周一;周二、三、四;周五),利用每一組的歷史數(shù)據(jù)預(yù)測下一周這一組相對應(yīng)的一天或者幾天的泊位占有率數(shù)據(jù),從而得到周內(nèi)各日分時(shí)刻的泊位占有率預(yù)測值。除上節(jié)中所提及的參數(shù),在對停車需求進(jìn)行短時(shí)預(yù)測中,還需設(shè)定另一個重要參數(shù)“時(shí)間窗口”,是指將過去一段時(shí)間內(nèi)的觀測值作為下一個時(shí)刻觀測值的特征,時(shí)間窗口的長度稱為Lookback,即用多個過去的觀測值去作為模型下一時(shí)刻輸入的特征。在訓(xùn)練數(shù)據(jù)時(shí),可以調(diào)整不同的Lookback以獲得最優(yōu)的Lookback值。
為便于估計(jì)模型擬合數(shù)據(jù)以及預(yù)測數(shù)據(jù)的精確度,引入平均絕對誤差(MAE)、標(biāo)準(zhǔn)誤差(RMSE)以及平均絕對百分誤差(MAPE)等三個指標(biāo)衡量模型的預(yù)測精度。MAE指標(biāo)能很好地反映預(yù)測值誤差的實(shí)際情況;RMSE指標(biāo)可以用來衡量觀測值同真值之間的偏差;MAPE指標(biāo)可以很好地反映預(yù)測誤差偏離實(shí)際的程度。
以新華醫(yī)院每周一的歷史數(shù)據(jù)為例(共10日,330個數(shù)據(jù)點(diǎn)),以2015年6月15日數(shù)據(jù)作為測試集,為防止模型產(chǎn)生過擬合和欠擬合,以2015年6月8日數(shù)據(jù)作為驗(yàn)證集。設(shè)定GRU模型只含有一個隱藏層,調(diào)整這一隱藏層中不同神經(jīng)元的個數(shù)。由于1日中的泊位占有率的數(shù)據(jù)點(diǎn)共有33個,所以Lookback選取范圍定為1~33,通過調(diào)整不同的神經(jīng)元個數(shù)以及不同的Lookback來得到最優(yōu)的模型參數(shù)。
模型訓(xùn)練的散點(diǎn)圖如圖5所示,橫坐標(biāo)為不同Lookback的取值,縱坐標(biāo)為不同Lookback大小以及不同神經(jīng)元個數(shù)對應(yīng)下的MAPE值,可以發(fā)現(xiàn):隨著Lookback逐漸增大,MAPE值呈現(xiàn)出逐漸下降的趨勢。當(dāng)Lookback在1~10之間時(shí),模型在不同神經(jīng)元下的MAPE值均較大。這主要是由于Lookback過小,模型輸入數(shù)據(jù)的特征過少,模型能學(xué)習(xí)到的信息過少,從而預(yù)測誤差最大。而隨著Lookback逐漸增加時(shí),模型的預(yù)測精度逐漸增加,當(dāng)Lookback在11~13之間,模型在不同神經(jīng)元下均能保持較低的MAPE值。這說明隨著數(shù)據(jù)特征的逐漸增加,模型很好地學(xué)習(xí)了時(shí)間序列數(shù)據(jù),最終標(biāo)定第1組數(shù)據(jù)的Lookback為12,神經(jīng)元個數(shù)為70。
圖5 GRU訓(xùn)練MAPE散點(diǎn)圖Fig.5 MAPES of training results of GRU model
按照上述方法標(biāo)定第2組、第3組的歷史數(shù)據(jù)所對應(yīng)的模型并獲得其相應(yīng)在測試集上的誤差。最終得到3組數(shù)據(jù)相應(yīng)所標(biāo)定的模型以及3組歷史數(shù)據(jù)分別在其測試集上的誤差,如表2所示??梢园l(fā)現(xiàn):模型在3組測試集上的MAE值分別為11.11、13.51、14,41;RMSE值分別為13.76、18.30、17.77;MAPE值分別為5.13%、6.06%和8.63%。
表2 GRU模型不同分組預(yù)測結(jié)果Tab.2 Results of different groups using GRU model
為評估提出的預(yù)測方法,比較未分組情形下采用ARIMA模型、傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)以及GRU模型的預(yù)測精度,模型定階過程如下所示:①在ARIMA模型中,對二階差分后的停車泊位占有率數(shù)據(jù)進(jìn)行ADF(augmented Dickey-Fuller Test)檢 驗(yàn),得 到ADF值為-21.618,均小于1%,5%,10%所對應(yīng)的值(-3.434,-2.863,-2.567)。之后,觀測序列自相關(guān)系數(shù)和偏自相關(guān)系數(shù),根據(jù)AIC(akaike information criterion)信息最小原則,模型定為ARIMA(8,4,2),此時(shí)AIC值為14 562.86。最后,對模型的殘差進(jìn)行Durbin-Watson檢驗(yàn),所得到的值為2.039,同時(shí),殘差序列通過Ljung-Box檢驗(yàn)。②在傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型中,同樣設(shè)定一層隱藏層,學(xué)習(xí)率為0.01,交叉驗(yàn)證比例為0.33,Dropout(隨機(jī)失活)參數(shù)值設(shè)置為0.3,優(yōu)化函數(shù)選用Adam,輸入維度為17,隱藏層神經(jīng)元個數(shù)為150。③在GRU模型中,同樣設(shè)定一層隱藏層,學(xué)習(xí)率為0.05,交叉驗(yàn)證比例為0.33,Dropout同樣設(shè)為0.3,優(yōu)化函數(shù)選取為RMsprop,Lookback參數(shù)為15,神經(jīng)元個數(shù)為80。
綜上,共對比分析4組情形,預(yù)測結(jié)果如表3以及圖6所示,其中3組為不同模型未分組情形下的預(yù)測結(jié)果,最后1組為考慮了停車需求在周內(nèi)日間差異性并對數(shù)據(jù)進(jìn)行分組預(yù)測后的預(yù)測結(jié)果,可以發(fā)現(xiàn):①在未分組情形下,ARIMA模型的預(yù)測精度最低,其MAPE達(dá)到了13.48%,而GRU模型的MAPE值僅為7.95%。②按停車需求的差異性對數(shù)據(jù)進(jìn)行分組后,GRU模型的預(yù)測精度進(jìn)一步提升,MAPE從7.95%降至6.45%。研究表明:①相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)以及ARIMA模型,GRU模型能夠提供更好的預(yù)測精度。②在考慮了停車需求在周內(nèi)日間的差異性并對數(shù)據(jù)進(jìn)行分組預(yù)測后,GRU預(yù)測精度得到進(jìn)一步的提升。
表3 不同模型預(yù)測結(jié)果Tab.3 Results of different prediction models
圖6 實(shí)際停車需求值與本研究所采用的預(yù)測方法比較Fig.6 Comparison between actual parking demand and prediction value
停車需求短時(shí)精準(zhǔn)預(yù)測是精細(xì)化停車管理中的重要組成部分,特別是在停車誘導(dǎo)過程中,停車需求的精準(zhǔn)預(yù)測可以極大地提升了信息發(fā)布的有效性,解決了停車誘導(dǎo)發(fā)布信息與車輛到達(dá)停車場后的實(shí)際信息不一致的困境。本研究在精細(xì)化停車管理的理念下,對停車需求在月內(nèi)以及周內(nèi)不同工作日的差異性進(jìn)行了深入研究,研究表明停車需求在不同月份以及不同工作日間存在著顯著的差異性,結(jié)果表明:周一為需求較高的一組;周二、周三、周四為需求較為穩(wěn)定的一組;周五為需求在午后出現(xiàn)下降的一組。在此基礎(chǔ)上,按照停車需求在周內(nèi)日間的差異性對數(shù)據(jù)進(jìn)行分組,并利用更簡潔的GRU模型進(jìn)行分組預(yù)測,研究表明在對停車需求進(jìn)行分組預(yù)測后,模型的預(yù)測精度能夠進(jìn)一步提升。本研究可為停車誘導(dǎo)系統(tǒng)提供更為先進(jìn)、更為精細(xì)化的預(yù)測方法。由于篇幅的限制,本文只針對工作日停車數(shù)據(jù)進(jìn)行了闡述,實(shí)際上對于非工作日的預(yù)測有著同樣的效果。值得注意的是,本文并未將天氣因素考慮進(jìn)來,同時(shí)可以考慮采用[20,25]深度學(xué)習(xí)中的其他預(yù)測方法進(jìn)行交叉對比分析,構(gòu)建組合預(yù)測模型來提高預(yù)測精度。
作者貢獻(xiàn)說明:
李林波:相關(guān)概念及方案討論,論文語言組織;
李楊:數(shù)據(jù)處理及分析,實(shí)驗(yàn)設(shè)計(jì)及初稿撰寫。