郭羽含,田 寧
(遼寧工程技術(shù)大學(xué) 軟件學(xué)院,遼寧 葫蘆島 125105)
隨著移動(dòng)設(shè)備的普及和互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)預(yù)約出租汽車(簡稱網(wǎng)約車)已成為城鎮(zhèn)居民的主要出行方式之一。選擇網(wǎng)約車出行有利于緩解城市交通擁堵,對(duì)提高交通資源的利用、減少環(huán)境污染具有積極意義。截至2020 年,滴滴出行、神州專車、首汽約車等大型網(wǎng)約車平臺(tái)的用戶規(guī)模已達(dá)4 億。隨著用戶出行需求的逐年增長,依托上述平臺(tái)從事網(wǎng)約車經(jīng)營活動(dòng)的汽車駕駛員數(shù)量也快速增加。面對(duì)數(shù)量巨大的服務(wù)提供者與用戶需求,平衡供需分布成為網(wǎng)約車平臺(tái)亟待解決的問題。若服務(wù)車輛分布與乘客分布差異較大,不但會(huì)導(dǎo)致乘客候車時(shí)間長、對(duì)平臺(tái)的服務(wù)滿意度降低,還會(huì)使服務(wù)車輛空駛距離增加、運(yùn)營效率低下、運(yùn)營利潤減少;若可用服務(wù)車輛被提前調(diào)配至需求熱度較高區(qū)域,則平臺(tái)的資源利用率和服務(wù)質(zhì)量可得到顯著提升。
引導(dǎo)服務(wù)車輛的前提為預(yù)測(cè)不同空間位置在不同時(shí)間范圍的需求熱度,但需求熱度與時(shí)間、空間、環(huán)境等多種影響因素相關(guān)且動(dòng)態(tài)變化,因此預(yù)測(cè)難度較高。針對(duì)以往的交通問題的預(yù)測(cè),現(xiàn)有的研究模型或方法可分為以下四類:
1)基于歷史數(shù)據(jù)或時(shí)間序列的預(yù)測(cè)模型。
基于歷史數(shù)據(jù)的預(yù)測(cè)模型由于維度單一,無法準(zhǔn)確反映多維影響因素,故預(yù)測(cè)準(zhǔn)確率較低?;跁r(shí)間序列的統(tǒng)計(jì)模型只能用于數(shù)據(jù)相對(duì)穩(wěn)定、呈規(guī)律性變化的情況,如肖強(qiáng)等[1]利用泊松分布計(jì)算出租車的合乘概率和等待時(shí)間;Jamil等[2]使用差分自回歸移動(dòng)平均進(jìn)行時(shí)間序列的分析,預(yù)測(cè)需求的熱點(diǎn)區(qū)域;Moreira-Matias 等[3]把加權(quán)時(shí)變泊松模型與出租車傳感器數(shù)據(jù)結(jié)合用于預(yù)測(cè)短期范圍內(nèi)出租車乘客的空間分布。然而,隨著我國城市建設(shè)速度的加快,需求熱點(diǎn)區(qū)域的頻繁變化也導(dǎo)致僅憑歷史同期訂單數(shù)量無法準(zhǔn)確預(yù)測(cè)當(dāng)前時(shí)空點(diǎn)的需求熱度。
2)基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型。
隨著人工智能技術(shù)的發(fā)展,基于數(shù)據(jù)的機(jī)器學(xué)習(xí)方法逐漸成為解決短時(shí)交通需求預(yù)測(cè)的主要方法。傳統(tǒng)機(jī)器學(xué)習(xí)方法[4-6]可對(duì)更復(fù)雜的數(shù)據(jù)進(jìn)行建模,捕捉交通信息中更深層次的特征,因此預(yù)測(cè)準(zhǔn)確度也相對(duì)較高,如:Zhang等[7]考慮到出租車的需求和供應(yīng),提出二次集成梯度提升決策樹方法來預(yù)測(cè)二者的差距,避免了在不同的數(shù)據(jù)稀疏條件下帶來的預(yù)測(cè)結(jié)果變差的問題;Jiang等[8]以網(wǎng)約車短期需求預(yù)測(cè)為目標(biāo),提出了一種基于最小二乘基于向量機(jī)(Least Squares Support Vector Machine,LS-SVM)的預(yù)測(cè)方法,并與Lasso 線性回歸、最近鄰回歸、決策樹回歸等算法對(duì)比,驗(yàn)證了其性能的高效性;郭憲等[9]提出基于多源數(shù)據(jù)的梯度決策回歸樹需求預(yù)測(cè)方法,基于多元?dú)v史數(shù)據(jù),可實(shí)時(shí)預(yù)測(cè)當(dāng)天的下一時(shí)間片段內(nèi)各個(gè)城市區(qū)域的實(shí)時(shí)需求。雖然上述三者都考慮了多維影響因素,但仍然較難準(zhǔn)確反映復(fù)雜多維數(shù)據(jù)的非線性相關(guān)性。
3)基于深度學(xué)習(xí)的預(yù)測(cè)方法。
深度神經(jīng)網(wǎng)絡(luò)[10-15]被廣泛應(yīng)用于需求預(yù)測(cè)領(lǐng)域且收效良好。Hou 等[16]利用深度神經(jīng)網(wǎng)絡(luò)對(duì)不同路段的行駛時(shí)間進(jìn)行了預(yù)測(cè),使用單模型結(jié)構(gòu)對(duì)交通網(wǎng)絡(luò)中的所有路段進(jìn)行準(zhǔn)確的預(yù)測(cè),不必為每個(gè)路段分別構(gòu)建自定義模型,從而降低了建模的復(fù)雜度;Zhan 等[17]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的交通流預(yù)測(cè)方法,使用浮動(dòng)車的GPS 軌跡數(shù)據(jù)來估算全市的交通量;Yu 等[18]提出了時(shí)空?qǐng)D卷積網(wǎng)絡(luò)框架,使用門控循環(huán)單元和圖卷積進(jìn)行了長期交通流量預(yù)測(cè);Ma 等[19]提出了一種大規(guī)模交通網(wǎng)絡(luò)速度預(yù)測(cè)的深度卷積神經(jīng)網(wǎng)絡(luò),將時(shí)空矩陣轉(zhuǎn)換為圖像作為CNN 的輸入。后三者都改進(jìn)了傳統(tǒng)方法中長期預(yù)測(cè)任務(wù)經(jīng)常忽略時(shí)空依賴性的缺點(diǎn)。
4)基于多模型的組合預(yù)測(cè)模型。
通過將不同的子模型組合,可以發(fā)揮每個(gè)模型對(duì)于不同特征提取的優(yōu)勢(shì),如段宗濤等[20]使用CNN-LSTM-ResNet(Convolutional Neural Network &Long Short-Term Memory &Residual Network)組合模型對(duì)出租車需求進(jìn)行了預(yù)測(cè),采用殘差神經(jīng)網(wǎng)絡(luò)的CNN 框架來分別模擬人群流量的臨近性、周期性和趨勢(shì)特征,使用長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)學(xué)習(xí)交通流變化的時(shí)空特征,為解決時(shí)空序列問題提供了新的思路;Ke 等[21]利用LSTM 神經(jīng)網(wǎng)絡(luò)對(duì)天氣等具有時(shí)間序列信息的特征進(jìn)行了提取,再結(jié)合卷積LSTM 網(wǎng)絡(luò)對(duì)時(shí)空特征進(jìn)行了提取,對(duì)比其他單個(gè)模型實(shí)驗(yàn),驗(yàn)證了融合模型的有效性。
綜上可知,將時(shí)空數(shù)據(jù)應(yīng)用于網(wǎng)約車需求預(yù)測(cè)中可取得較好成效,但由于不同類別的時(shí)空數(shù)據(jù)存在結(jié)構(gòu)差異性,使用單一結(jié)構(gòu)的模型較難完整捕捉不同結(jié)構(gòu)、不同城市、不同規(guī)模時(shí)空數(shù)據(jù)的隱含特征,因此其預(yù)測(cè)準(zhǔn)確度和魯棒性仍有提升空間。此外,由于需求預(yù)測(cè)還存在空間關(guān)聯(lián)性和環(huán)境關(guān)聯(lián)性等其他復(fù)雜因素,全面完整地利用多維時(shí)空數(shù)據(jù)和深度學(xué)習(xí)技術(shù)對(duì)網(wǎng)約車需求進(jìn)行準(zhǔn)確預(yù)測(cè)仍然非常具有挑戰(zhàn)性。針對(duì)上述問題,本文對(duì)網(wǎng)約車出行的時(shí)空需求進(jìn)行了形式化定義,提出了一種深度聚合神經(jīng)網(wǎng)絡(luò)(Deep Aggregated Neural Network,DANN)模型以預(yù)測(cè)不同時(shí)空下的需求熱度。通過多個(gè)子模型分別學(xué)習(xí)環(huán)境變量、時(shí)空變量和空間變量的隱含特征,并將子模型的輸出進(jìn)行多層次聚合得到最終的預(yù)測(cè)結(jié)果。
本文以時(shí)空需求熱度表示一個(gè)空間區(qū)域在一段時(shí)間范圍內(nèi)的網(wǎng)約車乘客出行需求熱度,其詳細(xì)定義如下。
定義1空間網(wǎng)格。設(shè)有給定地理空間區(qū)域S,其緯度最大和最小值分別為latmax和latmin,經(jīng)度最大和最小值分別為lngmax和lngmin,則該空間區(qū)域S可被分割為p×q個(gè)二維網(wǎng)格,每個(gè)網(wǎng)格稱為一個(gè)空間網(wǎng)格Si,j,其中i∈[1,p]?N 且j∈[1,q]?N。Si,j的長度hlat=(latmax-latmin)/p,寬 度hlng=lngmax-lngmin。
定義2需求。需求rk=(ek,latk,lngk)為乘客k的網(wǎng)約車出行訂單,其中ek為乘客需要服務(wù)的時(shí)間(如實(shí)時(shí)出行則ek為當(dāng)前時(shí)間),latk和lngk為乘客出發(fā)地緯度和經(jīng)度。若latmin+hlat(i-1) ≤latk≤latmin+hlati且lngmin+hlng(j-1) ≤lngk≤lngmin+hlng j,則需求rk屬于空間網(wǎng)格Si,j。
定義3時(shí)空需求熱度。將一天的24 h 分割為等長的δ段,每個(gè)時(shí)段tl(l∈[1,δ] ?N)的長度為24/δh。對(duì)于每個(gè)空間網(wǎng)格Si,j和時(shí)段tl,其相應(yīng)的時(shí)空需求熱度Pij,l可以定義為空間網(wǎng)格Si,j中在時(shí)段tl范圍內(nèi)的需求數(shù)量。
受時(shí)間、區(qū)域和天氣條件等多種外部因素影響,城市不同區(qū)域需求熱度變化規(guī)律復(fù)雜;因此,使用單一變量作為模型輸入很難準(zhǔn)確預(yù)測(cè)求密度變化。本文將影響需求熱度變化的變量分為外部環(huán)境變量、時(shí)空變量和空間變量。在外部環(huán)境變量方面,月份、日期、星期、時(shí)段、是否為節(jié)假日、溫度條件、氣象條件、空氣質(zhì)量均對(duì)出行需求有顯著影響,故上述類別的12 種因子被選為環(huán)境變量。相鄰時(shí)段、前天同時(shí)段、上周同時(shí)段的需求熱度被選為時(shí)間變量特征。大量不同類別的興趣點(diǎn)(Point Of Interest,POI)信息可從不同層面反映一個(gè)空間區(qū)域的繁榮程度;因此,本文以12 種POI 的數(shù)量作為空間變量。上述特征的定義及其量化取值范圍見表1。
表1 時(shí)空需求熱度預(yù)測(cè)特征Tab.1 Features for spatio-temporal demand heat prediction
基于上述特征,時(shí)空需求熱度的預(yù)測(cè)問題定義如下。
問題1 時(shí)空需求熱度預(yù)測(cè)。根據(jù)給定的特征值Xe、Xg和Xs預(yù)測(cè)tl時(shí)刻Si,j區(qū)域的時(shí)空需求熱度Pij,l,其中Xe=(xmo,xda,xtl,xho,xwe,xtt,xht,xwt,xra,xsn,xfl,xap),Xg=(xms,xjd,xyy,xsc,xly,xjs,xyl,xxq,xxx,xcz,xqy,xzf),Xs=(xlp,xlt,xlw)。
本文提出的深度聚合神經(jīng)網(wǎng)絡(luò)(DANN)由3 個(gè)子單元結(jié)構(gòu)組成,分別為外部環(huán)境學(xué)習(xí)單元的長短期記憶(LSTM)模型、時(shí)空特征學(xué)習(xí)單元的卷積長短期記憶(Convolutional LSTM,ConvLSTM)模型和空間特征學(xué)習(xí)單元的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,其總體結(jié)構(gòu)如圖1 所示。3 個(gè)子網(wǎng)絡(luò)模型分別處理相應(yīng)類別的時(shí)空數(shù)據(jù),并將其輸出經(jīng)多層聚合獲得最終預(yù)測(cè)結(jié)果。
圖1 DANN結(jié)構(gòu)Fig.1 Structure of DANN
設(shè)Xe為外部環(huán)境因素的特征向量,由問題1 可知Xe=(xmo,xda,xtl,xho,xwe,xtt,xht,xwt,xra,xsn,xfl,xap)。由于外部環(huán)境變量,如日期、節(jié)假日、天氣、空氣污染指數(shù)等,都具有時(shí)間上下文相關(guān)性;因此本文采用長短期記憶(LSTM)網(wǎng)絡(luò)單元結(jié)構(gòu)來捕捉其在時(shí)間維度的依賴關(guān)系。LSTM 在處理與時(shí)間序列相關(guān)的數(shù)據(jù)時(shí)表現(xiàn)優(yōu)異,可較好處理長距依賴問題,且通過引入3 個(gè)門控神經(jīng)元可有效緩解梯度爆炸和梯度彌散[22]。
LSTM 單元結(jié)構(gòu)如圖2 所示,其內(nèi)部結(jié)構(gòu)主要由遺忘門、輸入門和輸出門組成。假定當(dāng)前時(shí)刻為t,xt為輸入的外部環(huán)境變量向量Xe,yt為輸出狀態(tài)值,為記憶單元,pt為輸入門狀態(tài)值,dt為遺忘門狀態(tài)值,qt為輸出門狀態(tài)值。遺忘門根據(jù)前一時(shí)刻的隱層信息yt-1以及當(dāng)前時(shí)刻的輸入xt,通過激活函數(shù)輸出遺忘元素的比率,以及在原始記憶單元中丟失部分信息。輸入門pt通過類似的結(jié)構(gòu)篩選出輸入數(shù)據(jù)中需保存至記憶單元的數(shù)據(jù),并將其與通過遺忘門之后的記憶單元數(shù)據(jù)相加作為記憶單元的輸出st。最后,隱藏層的數(shù)據(jù)通過輸出門數(shù)據(jù)與新記憶單元數(shù)據(jù)進(jìn)行逐點(diǎn)相乘計(jì)算得到y(tǒng)t。記憶單元的狀態(tài)值由輸入門和輸出門共同控制。對(duì)于每個(gè)時(shí)間步長t,迭代計(jì)算過程如下:
圖2 LSTM單元結(jié)構(gòu)Fig.2 Structure of LSTM unit
其中:Wx、Wy分別為各單元xt、yt-1對(duì)應(yīng)權(quán)重,b為相應(yīng)偏置。σ(x)和tanh(x)為非線性主動(dòng)函數(shù),計(jì)算方法如式(7)(8)所示:
時(shí)空需求熱度在每日相同時(shí)段、每月相同星期存在周期性,因此具有時(shí)間自相關(guān)性;此外,其空間網(wǎng)格間也具有空間相關(guān)性,因此本文采用卷積長短期記憶(ConvLSTM)單元結(jié)構(gòu)[23]來捕捉其在時(shí)間和空間維度的依賴關(guān)系。ConvLSTM 將LSTM 單元中所有向量轉(zhuǎn)換為張量,使得LSTM 單元可通過卷積操作進(jìn)行連接,因此該單元結(jié)構(gòu)既可捕捉時(shí)間依賴關(guān)系,又可提取空間特征,其結(jié)構(gòu)如圖3 所示。
圖3 ConvLSTM單元結(jié)構(gòu)Fig.3 Structure of ConvLSTM unit
如圖3 所示,ConvLSTM 通過在狀態(tài)到狀態(tài)和輸入到狀態(tài)轉(zhuǎn)換中實(shí)現(xiàn)卷積算子來計(jì)算某個(gè)網(wǎng)格單元的時(shí)空需求熱度。通過t次迭代,每個(gè)ConvLSTM 層都可以映射一個(gè)輸入的需求熱度張量X=(X1,X2,…,Xt)到一個(gè)隱藏層張量H=(H1,H2,…,Ht)。同樣地,堆疊形式的多個(gè)ConvLSTM 層會(huì)更好地發(fā)現(xiàn)需求熱度的時(shí)空特征,提高本文模型的預(yù)測(cè)精度。
由定義3可得tl時(shí)段不同區(qū)域Si,j的時(shí)空熱度Pij,l,令
假定當(dāng)前時(shí)刻為t,Xt表示時(shí)空需求熱度輸入張量,Ht表示輸出張量,Ct表示記憶向量,It表示輸入門張量,F(xiàn)t表示遺忘門張量,Ot表示輸出門張量;?表示Hadamard 乘法;*表示卷積操作;W為卷積核,可提供權(quán)重共享。
本文以區(qū)域內(nèi)POI 數(shù)量表述空間特征。需求熱度與區(qū)域及其周邊土地利用模式密切相關(guān),POI 涵蓋城市各類設(shè)施位置與屬性信息,通過多個(gè)卷積層可有效捕捉空間隱含特征,如圖4 所示。由于高層特征圖中的單個(gè)節(jié)點(diǎn)依賴于中層的多個(gè)節(jié)點(diǎn)特征映射,依賴于底層(即輸入)中所有節(jié)點(diǎn)的特征映射,即多層卷積可捕捉較大范圍內(nèi)的POI 與需求熱度之間的依賴關(guān)系。
圖4 CNN結(jié)構(gòu)Fig.4 Structure of CNN
為緩解卷積過程中損失需求細(xì)節(jié),本文設(shè)計(jì)了一種三通道模式,將原始POI 熱度圖劃分為3 個(gè)通道分別進(jìn)行卷積處理,包括:低密度子圖(只保留POI 數(shù)量小于θ的值)、原密度子圖(原始值全部保留)和高密度子圖(只保留POI數(shù)量大于θ的值),如圖5 所示。由于不同通道的網(wǎng)絡(luò)參數(shù)相互獨(dú)立,此結(jié)構(gòu)可有效降低密度差異性對(duì)預(yù)測(cè)效果的影響。
圖5 需求熱度圖的通道劃分Fig.5 Channel partition of demand heat map
圖6 展示了不同日期和不同時(shí)段需求總數(shù)量的變化情況,可以觀察到該值存在周期性波動(dòng):在月范圍內(nèi)呈多峰狀態(tài),在日范圍內(nèi)呈現(xiàn)單峰狀態(tài)。這表明時(shí)空熱度受到近周期片段、日周期片段和周周期片段的影響,但影響程度存在著差異;同樣地,對(duì)于空間變量,劃分的不同通道對(duì)時(shí)空熱度也存在著不同影響,因此本文采取了基于參數(shù)矩陣的融合方式來調(diào)整時(shí)空熱度受不同因素的影響程度。
圖6 乘客總數(shù)量變化示例Fig.6 Examples of total passenger number change
分別將時(shí)間特征學(xué)習(xí)模型的輸出和空間特征學(xué)習(xí)模型的輸出以基于參數(shù)矩陣的方式融合,如式(15)(16):
其中we、ws、wg為融合權(quán)重。
模型訓(xùn)練的目標(biāo)為使預(yù)測(cè)值與真實(shí)值Pt的均方誤差(Mean Squared Error,MSE)最小化,從而獲得上述全部權(quán)值w的最優(yōu)取值。目標(biāo)函數(shù)如式(18)所示,其中加入L2 范式正則化項(xiàng)以避免過度擬合,α為平衡參數(shù)。模型訓(xùn)練流程如算法1 所示。
算法1 模型訓(xùn)練流程。
本文基于真實(shí)數(shù)據(jù)進(jìn)行了實(shí)驗(yàn),對(duì)算法的預(yù)測(cè)精度和參數(shù)靈敏度進(jìn)行了驗(yàn)證,實(shí)驗(yàn)環(huán)境見表2。
表2 實(shí)驗(yàn)環(huán)境Tab.2 Experimental environment
實(shí)驗(yàn)數(shù)據(jù)源基于滴滴蓋亞數(shù)據(jù)開放計(jì)劃,采用成都市、西安市和海口市城市區(qū)域網(wǎng)約車訂單數(shù)據(jù),POI 數(shù)據(jù)通過百度地圖應(yīng)用程序編程接口(Application Programming Interface,API)獲取,時(shí)空網(wǎng)格劃分及乘客分布如圖7 所示,數(shù)據(jù)集具體參數(shù)如表3 所示。
圖7 區(qū)域劃分及乘客分布示例Fig.7 Example of region division and passenger distribution
表3 數(shù)據(jù)集參數(shù)Tab.3 Dataset parameters
利用Keras 深度學(xué)習(xí)框架實(shí)驗(yàn),優(yōu)化器為Adadelta,DANN 訓(xùn)練參數(shù)設(shè)置標(biāo)準(zhǔn)為最優(yōu)預(yù)測(cè)精度,模型主要結(jié)構(gòu)具體如表4 所示。
表4 中Conv3D 為3D 卷積層,Conv 為2D 卷積層,Maxpool為最大池化層,激活函數(shù)如式(19)所示:
表4 DANN訓(xùn)練參數(shù)Tab.4 DANN training parameters
本文將DANN 與下述8 種模型進(jìn)行對(duì)比,各算法參數(shù)設(shè)置標(biāo)準(zhǔn)為最優(yōu)預(yù)測(cè)精度,其具體值如下。
由于對(duì)比模型與本文中使用的特征及數(shù)據(jù)存在差異,為保證對(duì)比的公平性,對(duì)比模型進(jìn)行了部分修改以保證與本文模型的對(duì)比條件一致。實(shí)驗(yàn)采用均方誤差(MSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)、R-平方(R2)和可釋方差(Explained Variance Score,EVS)作為評(píng)價(jià)標(biāo)準(zhǔn),對(duì)比實(shí)驗(yàn)結(jié)果見表5。
由表5 可見,本文模型在上述3 個(gè)數(shù)據(jù)集的4 種指標(biāo)中均取得最高精度。從整體上來看,由于傳統(tǒng)的機(jī)器學(xué)習(xí)算法(即前4 個(gè)模型)建模能力有限,考慮的影響因子較少,因此誤差較大,3 個(gè)數(shù)據(jù)集的R2平均誤差分別為22.83%、21.77%和27.01%;而深度學(xué)習(xí)算法(即后5 個(gè)模型)相較機(jī)器學(xué)習(xí)算法在3 個(gè)數(shù)據(jù)集上的預(yù)測(cè)結(jié)果上有著較大提升,R2平均誤差分別為12.69%、9.43%和13.80%。相較于LSTM,ConvLSTM 在建模時(shí)加入了空間特征的提取,因此表現(xiàn)優(yōu)于前者,R2在3 個(gè)數(shù)據(jù)集上分別提升0.030 7、0.026 3和0.059 2。與FCL-Net模型和HDLN-Net 模型相比,DANN 在加入了空間維度POI 后,可較大幅度提升模型的預(yù)測(cè)能力,因此準(zhǔn)確度優(yōu)于前面兩種方法。與區(qū)域預(yù)測(cè)模型相比,DANN 的優(yōu)勢(shì)在于空間特征提取時(shí)采取了3 個(gè)子模型分別卷積再融合的方式,緩解了卷積過程帶來的細(xì)節(jié)損失,提升了預(yù)測(cè)的準(zhǔn)確度。此外,在時(shí)空特征的提取上,本文采取了子模型再融合的方式分別處理了近周期時(shí)空?qǐng)D、日周期時(shí)空?qǐng)D和周周期時(shí)空?qǐng)D,因此DANN 在利用環(huán)境變量、時(shí)空變量建模的情況下提取到更多有效隱含特 征,其預(yù)測(cè)精度優(yōu)于其他對(duì)比模型。
表5 實(shí)驗(yàn)結(jié)果對(duì)比Tab.5 Comparison of experimental results
圖8 展示了真實(shí)時(shí)空需求熱度(T)與DANN 預(yù)測(cè)值(P)的對(duì)比結(jié)果。圖中以灰度表示時(shí)間需求熱度的差異,較深的顏色代表較高的熱度。從圖中可以觀察到,預(yù)測(cè)熱度與真實(shí)熱度高度一致。此外,由圖8 可知,午高峰時(shí)段的需求強(qiáng)度顯著高于睡眠時(shí)間的需求強(qiáng)度,且需求強(qiáng)度在空間上不平衡,部分網(wǎng)格的需求強(qiáng)度顯著高于其他網(wǎng)格的需求強(qiáng)度。隨著時(shí)間的推移,需求強(qiáng)度在不同的網(wǎng)格變化較明顯,使得需求強(qiáng)度預(yù)測(cè)難度增加,而本文模型結(jié)合不同的變量捕獲時(shí)空特征可以有效解決這個(gè)問題。
圖8 真實(shí)值與預(yù)測(cè)值的對(duì)比Fig.8 Comparison between predicted and real values
為更加直觀觀察不同子模型以及單子模型和多子模型融合后對(duì)預(yù)測(cè)結(jié)果帶來的影響,以成都數(shù)據(jù)集為例,在本節(jié)對(duì)不同的子模型預(yù)測(cè)結(jié)果進(jìn)行了分析,評(píng)價(jià)方式同3.2 節(jié),結(jié)果如表6 所示。
表6 不同子模型對(duì)比實(shí)驗(yàn)結(jié)果Tab.6 Experimental results comparison of different sub-models
由表6 可見,聚合模型DANN 的R2分別比時(shí)空特征學(xué)習(xí)單元(多模型)、空間特征學(xué)習(xí)單元(多模型)和外部環(huán)境特征學(xué)習(xí)單元這3 個(gè)子模型提高2.63%、12.78%和6.22%,說明聚合模型在預(yù)測(cè)結(jié)果準(zhǔn)確度上優(yōu)于單個(gè)子模型。由于聚合模型利用了不同子模型對(duì)不同特征提取的優(yōu)勢(shì),因此達(dá)到了更好的預(yù)測(cè)效果;此外,多子模型融合的結(jié)果也優(yōu)于單子模型,說明基于周期的時(shí)空變量和基于圖像點(diǎn)值的空間變量劃分方法也提高了預(yù)測(cè)的準(zhǔn)確性。
為探究不同天氣下DANN 的預(yù)測(cè)結(jié)果,將測(cè)試樣本分別按照天氣類型和空氣污染指數(shù)等級(jí)進(jìn)行分類,計(jì)算各類別預(yù)測(cè)結(jié)果的評(píng)價(jià)值(R2、EVS、MAE 和MSE),得出不同天氣條件下的預(yù)測(cè)精度,其中,空氣污染指數(shù)分為5 個(gè)等級(jí):優(yōu)、良、輕度污染、中度污染和重度污染,評(píng)價(jià)結(jié)果如表7、8 所示。
表7 不同天氣類型下的預(yù)測(cè)結(jié)果Tab.7 Prediction results under different types of weather
由表7 可見,DANN 在大雨天氣條件下的誤差較大,而在其他天氣條件下的波動(dòng)較小,這說明時(shí)空需求在極端天氣條件下的變化規(guī)律更為復(fù)雜。由表8 可見,DANN 在各個(gè)空氣質(zhì)量等級(jí)的條件下預(yù)測(cè)結(jié)果都較為穩(wěn)定,誤差未出現(xiàn)大波動(dòng)。綜上所述,DANN 在不同的天氣類型和空氣質(zhì)量等級(jí)下的預(yù)測(cè)效果均較為穩(wěn)定且精度較高,因此可用于不同天氣條件下的時(shí)空需求預(yù)測(cè)。
表8 不同空氣質(zhì)量等級(jí)下的預(yù)測(cè)結(jié)果Tab.8 Prediction results under different air quality classes
以成都數(shù)據(jù)集為例,對(duì)本文模型的結(jié)構(gòu)和參數(shù)進(jìn)行了分析。圖9(a)顯示了迭代次數(shù)對(duì)實(shí)驗(yàn)精度的影響。如圖9(a)所示,R2在初期顯著增加,然后趨于平緩,說明該網(wǎng)絡(luò)最開始有較高的收斂速度,隨著訓(xùn)練次數(shù)的增加達(dá)到平穩(wěn)狀態(tài),而訓(xùn)練40~80 次的效果差異性較小。
圖9(b)展示了網(wǎng)絡(luò)層數(shù)的影響:隨著網(wǎng)絡(luò)層數(shù)增大,模型的R2 先增大后減小,說明網(wǎng)絡(luò)層數(shù)越深預(yù)測(cè)效果也會(huì)越好;但當(dāng)網(wǎng)絡(luò)層數(shù)過深時(shí),模型會(huì)變得很復(fù)雜,這時(shí)往往容易出現(xiàn)欠擬合現(xiàn)象,因此預(yù)測(cè)效果逐漸變差。卷積視野的范圍由所使用的卷積核大小決定的。在這里改變卷積核的大小從2×2 到5×5,從圖9(c)可以看到,3×3 的卷積核具有較高的R2,表明其具有更好的空間依賴建模能力。從圖9(d)中可以看出卷積核數(shù)量為128 時(shí)得到的結(jié)果更好。
圖9 參數(shù)調(diào)整與靈敏度分析Fig.9 Parameter adjustment and sensitivity analysis
最后,對(duì)多步預(yù)測(cè)進(jìn)行了敏感度分析,圖10 表明,R2的最小值高于0.86,優(yōu)于其他對(duì)比模型。同時(shí),R2的值緩慢下降,沒有出現(xiàn)較大波動(dòng),表明該方法可以較好地適應(yīng)多步預(yù)測(cè)任務(wù)。
圖10 多步預(yù)測(cè)敏感度分析Fig.10 Sensitivity analysis of multi-step prediction
本文為準(zhǔn)確預(yù)測(cè)網(wǎng)約車需求,針對(duì)差異化結(jié)構(gòu)的多維數(shù)據(jù),提出了一種深度聚合神經(jīng)網(wǎng)絡(luò)模型。該模型綜合考慮了環(huán)境變量、時(shí)空變量等多維影響因素,提出了基于周期的時(shí)空變量和基于圖像點(diǎn)值的空間變量劃分方法;依據(jù)數(shù)據(jù)特點(diǎn)構(gòu)建了不同的子神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)并提出了多種異類子神經(jīng)網(wǎng)絡(luò)的聚合方法及聚合權(quán)重的設(shè)置方法。本文模型可作為網(wǎng)約車需求預(yù)測(cè)的有效手段,預(yù)測(cè)結(jié)果可有效解決服務(wù)車輛與乘客間的供需不平衡問題,提升服務(wù)車輛的運(yùn)營效率和利潤,同時(shí)降低乘客等待時(shí)間并改善其對(duì)服務(wù)平臺(tái)的滿意度;但需要指出,深度學(xué)習(xí)模型對(duì)訓(xùn)練數(shù)據(jù)量要求較高,且其預(yù)測(cè)結(jié)果的因果可解釋性存在一定限制。未來研究將通過優(yōu)化模型網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)一步提升預(yù)測(cè)能力,并探索具有更好可解釋性的機(jī)器學(xué)習(xí)方法。