• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于時(shí)空注意力機(jī)制的加油站級(jí)客流量預(yù)測(cè)

      2021-04-29 03:21:50包恒彬馬玉鵬楊奉毅韓云飛
      計(jì)算機(jī)工程 2021年4期
      關(guān)鍵詞:客流量時(shí)序客流

      包恒彬,馬玉鵬,楊奉毅,韓云飛

      (1.中國(guó)科學(xué)院新疆理化技術(shù)研究所新疆民族語(yǔ)音語(yǔ)言信息處理實(shí)驗(yàn)室,烏魯木齊 830011;2.中國(guó)科學(xué)院大學(xué),北京 100049)

      0 概述

      加油站流量可反映城市的能源消耗及經(jīng)濟(jì)水平,對(duì)加油站的客流量進(jìn)行準(zhǔn)確預(yù)測(cè)可幫助相關(guān)部門及企業(yè)制定更符合各站點(diǎn)實(shí)際需求的選址、運(yùn)營(yíng)以及調(diào)配策略,還可為需要加油的顧客提供推薦信息,以幫助其尋找排隊(duì)時(shí)間最短的加油站[1]。

      目前,針對(duì)加油站短時(shí)客流量預(yù)測(cè)的研究尚少,而加油站客流數(shù)據(jù)是一種典型的時(shí)空數(shù)據(jù),這種時(shí)空特性使得加油站客流量預(yù)測(cè)問(wèn)題與交通領(lǐng)域的其他問(wèn)題具有概念上的相似性。早期研究通常采用如差分自回歸移動(dòng)平均(Autoregressive Integrated Moving Average,ARIMA)模型[2]及其改進(jìn)方法來(lái)解決該類預(yù)測(cè)問(wèn)題,而后期結(jié)合復(fù)雜特征工程與傳統(tǒng)機(jī)器學(xué)習(xí)模型的方法被應(yīng)用到該領(lǐng)域。然而,這些傳統(tǒng)的時(shí)間序列模型或機(jī)器學(xué)習(xí)模型具有較大局限性,不能有效捕捉復(fù)雜的非線性時(shí)間與空間依賴的關(guān)系。

      近年來(lái),由于深度學(xué)習(xí)憑其優(yōu)異的端到端學(xué)習(xí)能力而在解決自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等領(lǐng)域任務(wù)時(shí)取得顯著效果[3],因此研究人員逐漸將循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[4]和卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)[5]應(yīng)用到交通領(lǐng)域預(yù)測(cè)問(wèn)題中。RNN 可對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行復(fù)雜建模并提取數(shù)據(jù)中的時(shí)間依賴關(guān)系,CNN 通過(guò)在像素級(jí)矩陣中不斷進(jìn)行卷積操作來(lái)捕捉數(shù)據(jù)間的空間相關(guān)性。同時(shí),結(jié)合RNN 與CNN 構(gòu)成一個(gè)復(fù)雜深度神經(jīng)網(wǎng)絡(luò)模型以克服傳統(tǒng)方法的局限性,使得整個(gè)模型具有強(qiáng)大的時(shí)空數(shù)據(jù)多維非線性關(guān)聯(lián)處理能力。將CNN 應(yīng)用于大規(guī)模時(shí)空數(shù)據(jù)時(shí)需要進(jìn)行特殊的預(yù)處理操作,目前主流的處理方法是將使用網(wǎng)格矩陣表示的時(shí)空數(shù)據(jù)轉(zhuǎn)換為圖像,以學(xué)習(xí)數(shù)據(jù)中的空間依賴關(guān)系。但該方法不適用于站點(diǎn)級(jí)的預(yù)測(cè)問(wèn)題,且當(dāng)網(wǎng)格設(shè)置較大時(shí),同一網(wǎng)格會(huì)覆蓋多個(gè)站點(diǎn),無(wú)法滿足所需的預(yù)測(cè)粒度。反之,如果網(wǎng)格尺寸小到只包含一個(gè)站點(diǎn),則構(gòu)成的巨大圖像矩陣與冗余零元素將大幅增加計(jì)算量。

      因?yàn)榧佑驼究土鲾?shù)據(jù)在時(shí)間維度上具有以天為單位的周期性,所以結(jié)合最近幾小時(shí)內(nèi)的短期序列與過(guò)去幾天的周期性序列,可以更準(zhǔn)確地對(duì)數(shù)據(jù)時(shí)序依賴進(jìn)行建模。然而,實(shí)際中加油站客流數(shù)據(jù)并不具有嚴(yán)格意義上的周期性,例如雖然每日的周期趨勢(shì)大致相同,但是客流高峰出現(xiàn)的時(shí)段并不固定,且在一定范圍內(nèi)發(fā)生漂移,這種現(xiàn)象被稱為周期性數(shù)據(jù)中的時(shí)間漂移。因此,僅對(duì)過(guò)去幾天相同時(shí)段的周期性序列進(jìn)行建模顯然忽略了時(shí)間漂移所帶來(lái)的影響。

      受交通預(yù)測(cè)領(lǐng)域研究的啟發(fā),本文結(jié)合加油站客流數(shù)據(jù)特征,提出利用路網(wǎng)矩陣對(duì)站級(jí)客流數(shù)據(jù)進(jìn)行建模,并使用基于注意力機(jī)制的時(shí)空網(wǎng)絡(luò)(Attention Mechanism-based Spatial Temporal Network,AMSTN)模型同時(shí)捕獲數(shù)據(jù)的空間與時(shí)間維度依賴關(guān)系,從而對(duì)加油站客流量進(jìn)行預(yù)測(cè)。采用該模型對(duì)數(shù)據(jù)內(nèi)空間與時(shí)間維度的關(guān)聯(lián)關(guān)系分別進(jìn)行建模,利用局部CNN捕獲站點(diǎn)間的空間依賴關(guān)系,再采用多個(gè)長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)[6]建模短期與長(zhǎng)期時(shí)間依賴性,并引入注意力機(jī)制修正時(shí)間漂移問(wèn)題對(duì)長(zhǎng)期預(yù)測(cè)結(jié)果的影響,以提高預(yù)測(cè)結(jié)果的準(zhǔn)確性。

      1 相關(guān)工作

      加油站客流量預(yù)測(cè)問(wèn)題與交通領(lǐng)域的相關(guān)預(yù)測(cè)問(wèn)題具有相似性。本質(zhì)上,交通預(yù)測(cè)的目標(biāo)是預(yù)測(cè)某時(shí)間某位置的相關(guān)指標(biāo)值,例如出租車需求量、區(qū)域客流量等,而這些指標(biāo)的形成過(guò)程是相似的。因此,交通預(yù)測(cè)領(lǐng)域的相關(guān)研究工作可為加油站客流預(yù)測(cè)問(wèn)題提供參考。交通預(yù)測(cè)領(lǐng)域中的現(xiàn)有模型大致可以分為基于傳統(tǒng)機(jī)器學(xué)習(xí)方法的預(yù)測(cè)模型和基于深度學(xué)習(xí)的預(yù)測(cè)模型。

      1.1 基于傳統(tǒng)機(jī)器學(xué)習(xí)的預(yù)測(cè)模型

      交通預(yù)測(cè)問(wèn)題的主要研究對(duì)象是時(shí)空序列數(shù)據(jù),它是一種特殊的時(shí)間序列數(shù)據(jù),早期研究主要根據(jù)數(shù)據(jù)的時(shí)間維度進(jìn)行預(yù)測(cè),采用經(jīng)典的時(shí)間序列預(yù)測(cè)方法依賴于特征工程和特征選擇來(lái)獲得較好的預(yù)測(cè)特征。傳統(tǒng)的交通客流預(yù)測(cè)方法可以分為參數(shù)方法與非參數(shù)方法。其中,參數(shù)方法包括基于ARIMA 及其改進(jìn)方法[7-9],非參數(shù)方法包括K-近鄰(K-Nearest Neighbor,KNN)非參數(shù)回歸法[10]、歷史平均法(Historical Average,HA)與向量自回歸法(Vector Autoregressive,VAR)[11]等。然而,基于ARIMA及其改進(jìn)方法的模型依賴于不間斷的輸入序列,不適用于分析缺少數(shù)據(jù)的時(shí)間序列。HA 方法不能有效捕捉交通數(shù)據(jù)的動(dòng)態(tài)變化(如周期性特征)。VAR方法可以捕捉相關(guān)時(shí)間序列之間的線性相關(guān)性,但忽略了預(yù)測(cè)值之間的相關(guān)性。由于上述方法僅考慮了時(shí)序特征,因此不能捕捉到數(shù)據(jù)間復(fù)雜的非線性時(shí)空依賴關(guān)系。

      1.2 基于深度學(xué)習(xí)的預(yù)測(cè)模型

      受圖像識(shí)別領(lǐng)域的研究啟發(fā),現(xiàn)有的深度學(xué)習(xí)預(yù)測(cè)模型多數(shù)將同時(shí)段的預(yù)測(cè)量按空間位置建模為類似于圖像的數(shù)據(jù)矩陣,并按時(shí)間順序組織各時(shí)段的數(shù)據(jù)矩陣,為預(yù)測(cè)模型保留數(shù)據(jù)中豐富的空間與時(shí)間維度信息。文獻(xiàn)[12]利用基于CNN 的網(wǎng)絡(luò)模型捕捉空間依賴,并采用殘差神經(jīng)網(wǎng)絡(luò)對(duì)城市人群流動(dòng)進(jìn)行預(yù)測(cè)。文獻(xiàn)[13-14]使用基于RNN 的模型來(lái)建模時(shí)序依賴關(guān)系。雖然上述研究均明確對(duì)空間依賴或時(shí)序依賴進(jìn)行建模,但它們都沒(méi)有同時(shí)考慮空間與時(shí)間兩種維度間的依賴關(guān)系。因此,文獻(xiàn)[15-17]嘗試結(jié)合CNN 與LSTM 的優(yōu)勢(shì)同時(shí)建模交通數(shù)據(jù)的空間和時(shí)間依賴性。文獻(xiàn)[16]通過(guò)將卷積LSTM 單元與注意力機(jī)制相結(jié)合來(lái)增強(qiáng)代表性數(shù)據(jù)對(duì)每一步預(yù)測(cè)的影響權(quán)重。文獻(xiàn)[17]采用局部CNN、LSTM 和語(yǔ)義圖嵌入分別集成空間、時(shí)間和語(yǔ)義多個(gè)角度進(jìn)行區(qū)域級(jí)出租車需求量預(yù)測(cè)。文獻(xiàn)[18]提出門控機(jī)制和周期注意機(jī)制,使模型具有同時(shí)捕獲靜態(tài)與動(dòng)態(tài)時(shí)空依賴的能力。

      針對(duì)加油站領(lǐng)域預(yù)測(cè)的相關(guān)工作較少,文獻(xiàn)[19]利用出租車GPS 數(shù)據(jù),通過(guò)出租車在加油站的等待時(shí)間來(lái)估計(jì)加油站內(nèi)的排隊(duì)長(zhǎng)度,并預(yù)測(cè)此時(shí)加油站內(nèi)的客流量及銷量。文獻(xiàn)[20]將城市劃分為網(wǎng)格空間,并結(jié)合多種深度學(xué)習(xí)網(wǎng)絡(luò)建模區(qū)域內(nèi)的時(shí)間、空間與語(yǔ)義三種維度的相關(guān)性,從而對(duì)區(qū)域級(jí)的油品銷量進(jìn)行預(yù)測(cè)。然而在加油站級(jí)客流量預(yù)測(cè)問(wèn)題中,客流數(shù)據(jù)間的站級(jí)復(fù)雜非線性空間與時(shí)間依賴關(guān)系也是影響預(yù)測(cè)結(jié)果準(zhǔn)確性的重要因素,而以上研究都沒(méi)有進(jìn)行相關(guān)的分析建模。因此,本文提出使用路網(wǎng)矩陣建模站級(jí)客流數(shù)據(jù),并通過(guò)AMSTN 模型處理數(shù)據(jù)間復(fù)雜空間與時(shí)間維度依賴關(guān)系,實(shí)現(xiàn)對(duì)加油站級(jí)客流量的準(zhǔn)確預(yù)測(cè)。

      2 問(wèn)題定義

      將加油站站點(diǎn)集合定義為S={s1,s2,…,sM},時(shí)間間隔集合為T={t1,t2,…,tn},每個(gè)時(shí)間間隔t的長(zhǎng)度為30 min。本文對(duì)客流記錄、客流量及路網(wǎng)矩陣進(jìn)行定義,并在此基礎(chǔ)上對(duì)加油站級(jí)客流量預(yù)測(cè)問(wèn)題進(jìn)行形式化定義與描述。

      定義1(客流記錄)用三元組(o.t,o.s,o.uid)表示一條客流記錄,其中,o.t、o.s和o.uid 分別為記錄時(shí)間戳、加油站唯一編碼與顧客唯一編碼。

      定義2(客流量)用表示站點(diǎn)s在時(shí)間間隔t內(nèi)的客流量,=|{o:o.t∈T?o.s∈S}|,|o|表示集合的基數(shù)。

      定義3(路網(wǎng)矩陣)用Bt表示時(shí)間間隔t內(nèi)所有站點(diǎn)客流量構(gòu)成的路網(wǎng)矩陣。

      路網(wǎng)矩陣大小為a×b,a、b分別為包含加油站的橫向街道數(shù)與縱向街道數(shù),將站點(diǎn)根據(jù)空間分布對(duì)應(yīng)到路網(wǎng)矩陣的相近節(jié)點(diǎn),節(jié)點(diǎn)值為一個(gè)站點(diǎn)在該時(shí)間間隔內(nèi)的客流量(s∈S),無(wú)對(duì)應(yīng)站點(diǎn)的節(jié)點(diǎn)值始終為0。

      定義4(加油站級(jí)客流量預(yù)測(cè)問(wèn)題)以路網(wǎng)矩陣的形式給定各加油站歷史客流量{Bt|t∈T},并預(yù)測(cè)t+1 時(shí)刻各站點(diǎn)的客流量(s∈S)。

      3 基于時(shí)空注意力機(jī)制的預(yù)測(cè)模型

      本節(jié)將詳細(xì)介紹本文提出的AMSTN 模型,該模型結(jié)合CNN、LSTM 與注意力機(jī)制同時(shí)捕獲加油站客流數(shù)據(jù)中存在的空間與時(shí)間維度相關(guān)性。圖1展示了AMSTN 模型的總體架構(gòu),時(shí)空數(shù)據(jù)首先輸入到用于處理站點(diǎn)間空間依賴的CNN,CNN 提取出空間關(guān)聯(lián)后,將輸出分別輸入到提供短期時(shí)序預(yù)測(cè)的短期LSTM 網(wǎng)絡(luò),以及引入了注意力機(jī)制修正時(shí)間漂移影響后提供長(zhǎng)周期時(shí)序預(yù)測(cè)的長(zhǎng)期LSTM 網(wǎng)絡(luò),結(jié)合2 個(gè)時(shí)序網(wǎng)絡(luò)的輸出得到網(wǎng)絡(luò)的最終預(yù)測(cè)結(jié)果。

      圖1 AMSTN 模型架構(gòu)Fig.1 Architecture of AMSTN model

      3.1 局部CNN

      CNN 通過(guò)持續(xù)的卷積操作可有效提取像素矩陣內(nèi)的空間相關(guān)性,受此啟發(fā),本文使用CNN 提取站點(diǎn)間的空間依賴關(guān)系。采用路網(wǎng)矩陣對(duì)一個(gè)時(shí)間間隔內(nèi)所有站點(diǎn)的客流記錄進(jìn)行建模,然后將該矩陣作為一維灰度圖像輸入到AMSTN 模型的CNN 組件中進(jìn)行學(xué)習(xí)。但對(duì)整個(gè)矩陣直接應(yīng)用CNN 會(huì)考慮大量的距離較遠(yuǎn)且相關(guān)性較弱的站點(diǎn),削弱了CNN 對(duì)站點(diǎn)間強(qiáng)相關(guān)性的學(xué)習(xí)能力,從而影響整體預(yù)測(cè)性能。因此,本文使用局部CNN[18]僅對(duì)當(dāng)前預(yù)測(cè)站點(diǎn)臨近的局部范圍采用CNN 網(wǎng)絡(luò)提取站點(diǎn)間空間維度的依賴關(guān)系。

      在一個(gè)時(shí)間間隔t內(nèi),以路網(wǎng)矩陣中一個(gè)節(jié)點(diǎn)i為中心,提取其周圍D×D范圍內(nèi)所有節(jié)點(diǎn)的流量值,得到D×D大小的一維圖像,并將其作為該節(jié)點(diǎn)的輸入樣本∈?D×D×1。圖2 以路網(wǎng)矩陣中數(shù)值為6的節(jié)點(diǎn)為中心,取D=3 構(gòu)造樣本,位于矩陣邊界的節(jié)點(diǎn)周圍使用0 補(bǔ)全。

      圖2 D=3 時(shí)構(gòu)造的樣本Fig.2 Sample constructed when D=3

      局部CNN 將提取出的原始輸入作為輸入到K層卷積層,使用二維卷積提取空間依賴,且每一層卷積公式為:

      其中,k(k∈K)為卷積層數(shù),*為卷積操作,使用ReLU作為激活函數(shù),Wk和bk是需要學(xué)習(xí)的參數(shù)。在卷積操作后使用全連接網(wǎng)絡(luò)將提取到的空間關(guān)聯(lián)信息處理為L(zhǎng)STM 網(wǎng)絡(luò)輸入。

      3.2 短期LSTM 網(wǎng)絡(luò)

      LSTM 網(wǎng)絡(luò)對(duì)輸入的隱狀態(tài)向量,采用轉(zhuǎn)移函數(shù)來(lái)解決RNN 網(wǎng)絡(luò)在處理長(zhǎng)序列時(shí)可能出現(xiàn)的梯度消失和梯度爆炸問(wèn)題,從而達(dá)到在時(shí)序數(shù)據(jù)建模中具有更好的性能。本文使用一個(gè)LSTM 網(wǎng)絡(luò)學(xué)習(xí)短期時(shí)序依賴,根據(jù)預(yù)測(cè)時(shí)間點(diǎn)前L個(gè)時(shí)間間隔的短期時(shí)序數(shù)據(jù)給出短期預(yù)測(cè)結(jié)果,網(wǎng)絡(luò)輸入的短期序列及LSTM 網(wǎng)絡(luò)的簡(jiǎn)化轉(zhuǎn)移公式可表示為:

      3.3 基于注意力機(jī)制的長(zhǎng)期LSTM 網(wǎng)絡(luò)

      短期LSTM 網(wǎng)絡(luò)僅處理預(yù)測(cè)時(shí)間點(diǎn)前幾個(gè)時(shí)間間隔的短期時(shí)序依賴,忽略了以天為周期的長(zhǎng)期時(shí)序依賴。然而僅增加序列輸入長(zhǎng)度會(huì)增大梯度消失的風(fēng)險(xiǎn),削弱模型直接捕獲長(zhǎng)期時(shí)序依賴的能力。因此,本文使用與預(yù)測(cè)時(shí)間點(diǎn)相同時(shí)間的過(guò)去連續(xù)P日的數(shù)據(jù)構(gòu)成長(zhǎng)期序列(如P=2,代表昨天和前天的同一時(shí)間),將其作為長(zhǎng)期LSTM 網(wǎng)絡(luò)輸入來(lái)捕獲長(zhǎng)期依賴進(jìn)行預(yù)測(cè),輸入序列可表示為:

      僅提取如式(5)所示的過(guò)去相同時(shí)間點(diǎn)序列進(jìn)行長(zhǎng)期時(shí)序依賴學(xué)習(xí),忽略了周期性數(shù)據(jù)中的時(shí)間漂移問(wèn)題。加油站客流數(shù)據(jù)雖然每日的趨勢(shì)大致相同但并不具有嚴(yán)格意義上的周期性。圖3 以某站點(diǎn)連續(xù)5 天的客流數(shù)據(jù)及客流高峰出現(xiàn)時(shí)間為例,展示了站點(diǎn)客流高峰出現(xiàn)時(shí)間會(huì)在一定時(shí)間范圍內(nèi)漂移的現(xiàn)象,這種時(shí)間漂移現(xiàn)象在加油站客流量時(shí)序數(shù)據(jù)中普遍存在。其中,圖3 中的每個(gè)時(shí)間間隔為30 min。

      圖3 時(shí)間漂移現(xiàn)象示例Fig.3 Example of time drift phenomenon

      本文通過(guò)引入注意力機(jī)制來(lái)修正時(shí)間漂移的影響,并得到最終的長(zhǎng)期LSTM網(wǎng)絡(luò)輸入序列。如圖1所示,采樣過(guò)去P天中預(yù)測(cè)時(shí)間點(diǎn)前后共有Q個(gè)時(shí)間間隔的歷史數(shù)據(jù)作為長(zhǎng)期網(wǎng)絡(luò)的輸入樣本。例如,如果預(yù)測(cè)的時(shí)間間隔是上午10:00—10:30,則需提取預(yù)測(cè)時(shí)間的前后1小時(shí)范圍數(shù)據(jù)作為輸入(即上午9:00—11:30,此時(shí)Q=5),使用LSTM提取每天的時(shí)序信息用于學(xué)習(xí)不同時(shí)刻對(duì)當(dāng)天最終向量表示的貢獻(xiàn)權(quán)重,應(yīng)用的注意力機(jī)制及權(quán)重分配公式如下所示:

      其中,為站點(diǎn)i在第p日預(yù)測(cè)時(shí)間點(diǎn)t的最終向量,為注意力貢獻(xiàn)權(quán)重,s為貢獻(xiàn)評(píng)分函數(shù),vT、WH、WX與bX為學(xué)習(xí)的參數(shù),表示站點(diǎn)i在第p日q時(shí)段的向量,為站點(diǎn)i在第p日q時(shí)段的CNN 網(wǎng)絡(luò)輸出?;谧⒁饬C(jī)制的LSTM 網(wǎng)絡(luò)組件的輸入序列及預(yù)測(cè)網(wǎng)絡(luò)可表示為:

      其中,為網(wǎng)絡(luò)修正時(shí)間漂移現(xiàn)象影響后給出的長(zhǎng)期預(yù)測(cè)。

      3.4 融合訓(xùn)練

      其中,Wf、bf為學(xué)習(xí)的參數(shù),輸出結(jié)果在[?1,1]內(nèi),將結(jié)果反歸一化得到站點(diǎn)i在t+1 時(shí)刻的預(yù)測(cè)值。

      4 實(shí)驗(yàn)與結(jié)果分析

      4.1 數(shù)據(jù)集與預(yù)處理

      本文以某市屬行政區(qū)內(nèi)所有加油站從2019-02-12—2019-04-02 共50 天的客流量數(shù)據(jù)作為數(shù)據(jù)集。數(shù)據(jù)集的前40 天用于訓(xùn)練與驗(yàn)證模型,后10 天用于評(píng)估模型性能。

      將該行政區(qū)域構(gòu)造成大小為11×11 的路網(wǎng)矩陣作為輸入,并將站點(diǎn)按照在路網(wǎng)中的空間分布對(duì)應(yīng)到路網(wǎng)矩陣的近似節(jié)點(diǎn)。使用30 min 作為數(shù)據(jù)處理的時(shí)間間隔得到各站點(diǎn)客流量數(shù)據(jù),并對(duì)所有客流量數(shù)據(jù)進(jìn)行最大-最小(Max-Min)歸一化處理,處理后的數(shù)據(jù)分布在[0,1]。訓(xùn)練數(shù)據(jù)集的80%用于訓(xùn)練,20%用于驗(yàn)證。根據(jù)學(xué)術(shù)界及工業(yè)界經(jīng)驗(yàn),在測(cè)試模型性能時(shí)過(guò)濾客流量等于0 的樣本不參與評(píng)估[18]。

      4.2 實(shí)驗(yàn)參數(shù)設(shè)置

      本文提出的 AMSTN 模型使用 Python、TensorFlow1.14.0 和Keras2.3.1 實(shí)現(xiàn),并在真實(shí)加油站客流數(shù)據(jù)集上驗(yàn)證了該模型的預(yù)測(cè)能力。實(shí)驗(yàn)中AMSTN 模型具體超參數(shù)設(shè)置如表1 所示。

      表1 AMSTN 模型的超參數(shù)設(shè)置Table 1 Hyper-parameter setting of AMSTN model

      4.3 評(píng)價(jià)指標(biāo)

      實(shí)驗(yàn)使用均方誤差(Root Mean Square Error,RMSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)與平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)3 個(gè)標(biāo)準(zhǔn)評(píng)價(jià)指標(biāo)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià)。3 個(gè)評(píng)價(jià)指標(biāo)的計(jì)算方法如式(13)~式(15)所示:

      4.4 結(jié)果分析

      HA 模型使用各時(shí)段的歷史客流平均值作為預(yù)測(cè),LSTM 網(wǎng)絡(luò)是一種改進(jìn)的RNN 模型,其可以處理時(shí)間序列數(shù)據(jù)中的順序依賴性,雙向長(zhǎng)短期記憶(Bi-LSTM)網(wǎng)絡(luò)由前向LSTM 與后向LSTM 組合而成,其可同時(shí)從前后兩個(gè)方向?qū)r(shí)間序列進(jìn)行建模。實(shí)驗(yàn)對(duì)HA、LSTM、Bi-LSTM 與本文模型的預(yù)測(cè)效果進(jìn)行對(duì)比,結(jié)果如表2 所示,表中的數(shù)據(jù)是10 次實(shí)驗(yàn)結(jié)果的平均值。從表2 可以看出:在本文選擇的數(shù)據(jù)集上,LSTM 與Bi-LSTM 模型的預(yù)測(cè)能力一般,雖然相比HA 模型在RMSE 與MAE 指標(biāo)上有一定提升,但MAPE 結(jié)果表現(xiàn)略差,這是因?yàn)镸APE 指標(biāo)對(duì)數(shù)據(jù)中的較低值更敏感,而僅考慮時(shí)序特征的方法更傾向于擬合數(shù)據(jù)中的較高值,所以出現(xiàn)RMSE 與MAE 指標(biāo)提升而MAPE 下降的現(xiàn)象;3 個(gè)評(píng)價(jià)指標(biāo)均驗(yàn)證了本文所提AMSTN 模型預(yù)測(cè)能力均優(yōu)于其他3 種對(duì)比模型,與HA 模型相比,本文模型在RMSE 與MAE 指標(biāo)上分別提高了22.89% 與21.39%。

      表2 4 種模型的評(píng)價(jià)指標(biāo)結(jié)果對(duì)比Table 2 Comparison of evaluation index results of four models

      HA、LSTM 與本文模型對(duì)同一個(gè)站點(diǎn)連續(xù)兩天的預(yù)測(cè)結(jié)果如圖4 所示。其中,Ground Truth 為該站點(diǎn)兩天內(nèi)的實(shí)際客流量,且經(jīng)過(guò)Max-Min 歸一化處理,每個(gè)時(shí)間間隔為30 min。從圖4 可以看出,本文模型相較于其他模型更貼近實(shí)際結(jié)果,且具有最佳的預(yù)測(cè)能力。

      圖4 本文模型與其他模型的預(yù)測(cè)結(jié)果對(duì)比Fig.4 Comparison of prediction results between the proposed model and other models

      移除AMSTN 模型中部分組件的消融實(shí)驗(yàn)結(jié)果如表3 所示。其中:表3 中的AMSTN-S 模型是在本文模型的基礎(chǔ)上移除注意力機(jī)制的長(zhǎng)期LSTM 組件,僅使用局部CNN 組件與短期LSTM 組件提取數(shù)據(jù)中的空間依賴與短期時(shí)序依賴關(guān)系;AMSTN-L 模型是在本文模型的基礎(chǔ)上移除短期LSTM 組件,僅使用局部CNN 組件與基于注意力機(jī)制的長(zhǎng)期LSTM組件提取數(shù)據(jù)的空間依賴、長(zhǎng)期時(shí)序依賴以及長(zhǎng)期時(shí)序依賴中的時(shí)間漂移。

      表3 消融實(shí)驗(yàn)結(jié)果對(duì)比Table 3 Comparison of ablation experiment results

      從表3 可以看出:AMSTN-S 與AMSTN-L 模型的預(yù)測(cè)性能相比本文模型均有一定程度的下降,這是因?yàn)閿?shù)據(jù)中的短期時(shí)序依賴、長(zhǎng)期時(shí)序依賴和時(shí)間漂移因素共同提升了本文模型的預(yù)測(cè)準(zhǔn)確性,而AMSTN-S 與AMSTN-L 模型在預(yù)測(cè)時(shí)分別遺失了部分時(shí)間維度依賴關(guān)系;AMSTN-S 模型的預(yù)測(cè)能力優(yōu)于AMSTN-L 模型,這說(shuō)明在預(yù)測(cè)時(shí)數(shù)據(jù)中的短期時(shí)序依賴相較于長(zhǎng)期時(shí)序依賴和時(shí)間漂移對(duì)最終預(yù)測(cè)結(jié)果的影響更大。

      為了考察空間CNN 輸入樣本大小與短期LSTM網(wǎng)絡(luò)輸入時(shí)序長(zhǎng)度2 個(gè)重要超參數(shù)對(duì)AMSTN 模型的性能影響,本文進(jìn)行不同超參數(shù)設(shè)置的對(duì)比實(shí)驗(yàn),結(jié)果如圖5 所示。從圖5(a)可以看出:隨著D值的增大,本文模型的預(yù)測(cè)性能呈下降趨勢(shì),當(dāng)D=3 時(shí)輸入樣本大小為3×3,此時(shí)本文模型的預(yù)測(cè)性能最佳;當(dāng)空間輸入大小接近整個(gè)矩陣大小時(shí),模型預(yù)測(cè)能力顯著降低,這可能是因?yàn)檫^(guò)多弱關(guān)聯(lián)數(shù)據(jù)削弱了本文模型中CNN 組件捕獲與保存空間強(qiáng)關(guān)聯(lián)關(guān)系的能力。從圖5(b)可以看出:不同輸入長(zhǎng)度對(duì)預(yù)測(cè)性能的影響較大,當(dāng)輸入序列長(zhǎng)度為6 時(shí),AMSTN模型的預(yù)測(cè)性能最佳;隨著輸入序列長(zhǎng)度的增大,模型預(yù)測(cè)能力逐漸穩(wěn)定,但整個(gè)模型的訓(xùn)練時(shí)間明顯增加。

      圖5 不同超參數(shù)對(duì)本文模型預(yù)測(cè)性能的影響Fig.5 Effect of different hyper-parameters on the prediction performance of the proposed model

      5 結(jié)束語(yǔ)

      針對(duì)加油站級(jí)客流量預(yù)測(cè)問(wèn)題,本文提出一種基于時(shí)空注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。該模型通過(guò)路網(wǎng)矩陣對(duì)站級(jí)時(shí)空數(shù)據(jù)進(jìn)行建模,并采用結(jié)合多個(gè)深度網(wǎng)絡(luò)組件的模型處理站點(diǎn)間復(fù)雜的時(shí)空依賴關(guān)系。實(shí)驗(yàn)結(jié)果表明,該模型可對(duì)各站點(diǎn)的客流量進(jìn)行準(zhǔn)確預(yù)測(cè)。本文模型通過(guò)舍棄空間距離較遠(yuǎn)的數(shù)據(jù)輸入來(lái)保障其預(yù)測(cè)性能,然而少量空間距離較遠(yuǎn)的站點(diǎn)間也可能存在強(qiáng)關(guān)聯(lián)性。因此,下一步將從多源數(shù)據(jù)中提取少量的遠(yuǎn)距離強(qiáng)關(guān)聯(lián)性站點(diǎn)關(guān)系,并將其與本文模型相融合,以進(jìn)一步提升模型預(yù)測(cè)準(zhǔn)確性。

      猜你喜歡
      客流量時(shí)序客流
      基于時(shí)序Sentinel-2數(shù)據(jù)的馬鈴薯遙感識(shí)別研究
      客流增多
      基于Sentinel-2時(shí)序NDVI的麥冬識(shí)別研究
      基于嵌入式系統(tǒng)的商場(chǎng)客流量統(tǒng)計(jì)算法
      一種毫米波放大器時(shí)序直流電源的設(shè)計(jì)
      電子制作(2016年15期)2017-01-15 13:39:08
      基于自學(xué)習(xí)補(bǔ)償?shù)氖覂?nèi)定位及在客流分析中的應(yīng)用
      基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測(cè)
      人工免疫算法在電梯客流時(shí)段劃分的應(yīng)用
      DPBUS時(shí)序及其設(shè)定方法
      河南科技(2014年15期)2014-02-27 14:12:36
      城市軌道交通運(yùn)營(yíng)客流數(shù)據(jù)分析缺陷及應(yīng)對(duì)
      汨罗市| 双辽市| 湘潭市| 会同县| 城固县| 贵港市| 遂川县| 旅游| 潜山县| 股票| 沭阳县| 乳山市| 南通市| 白玉县| 中江县| 高青县| 永修县| 汾西县| 金堂县| 顺义区| 克什克腾旗| 安徽省| 巫溪县| 观塘区| 景宁| 德兴市| 辛集市| 布尔津县| 肥乡县| 金寨县| 怀集县| 资兴市| 乾安县| 巴楚县| 阿拉善左旗| 宁远县| 宜兰市| 达拉特旗| 大田县| 玉林市| 新竹市|