劉 釗, 崔瓏獻(xiàn), 李 巖, 劉 文*, 1b, 劉敬賢, 1b
(1.武漢理工大學(xué) a.航運(yùn)學(xué)院; b.內(nèi)河航運(yùn)技術(shù)湖北省重點(diǎn)實(shí)驗(yàn)室, 湖北 武漢 430063;2.國(guó)家水運(yùn)安全工程技術(shù)研究中心, 湖北 武漢 430063)
船舶交通流預(yù)測(cè)在優(yōu)化船舶交通組織、緩解交通擁堵、提升通過(guò)能力和支撐水上交通基礎(chǔ)設(shè)施規(guī)劃建設(shè)等方面發(fā)揮著重要作用。但是,由于船舶交通流的影響因素的復(fù)雜性、變化性和不確定性,船舶交通流變化具有非線性和非平穩(wěn)性特點(diǎn)[1],給船舶交通流的有效預(yù)測(cè)帶來(lái)了很大的困難。
傳統(tǒng)的船舶交通流預(yù)測(cè)主要以年為尺度預(yù)測(cè)船舶交通流量的變化,以支撐港口規(guī)劃布局。常用的交通流預(yù)測(cè)方法主要包括回歸分析法、灰色分析法、馬爾科夫法、模糊預(yù)測(cè)法、神經(jīng)網(wǎng)絡(luò)法、基于誤差絕對(duì)值之加權(quán)和最小預(yù)測(cè)組合法等,但是單一的預(yù)測(cè)方法具有明顯缺陷[2]。為了解決單一模型預(yù)測(cè)精度不高和穩(wěn)定性較差的問(wèn)題,劉敬賢等[3]綜合運(yùn)用多元線性回歸和灰色系統(tǒng)預(yù)測(cè)方法建立了一種改進(jìn)的船舶交通流變權(quán)組合預(yù)測(cè)模型,白響恩等[4]通過(guò)篩選影響交通流量變化的關(guān)鍵影響因素,提出一種結(jié)合粗糙集和支持向量回歸智能算法的交通流量預(yù)測(cè)模型,組合預(yù)測(cè)模型較好地提升了以年度為單位的船舶交通流預(yù)測(cè)精度。
隨著船舶交通流數(shù)據(jù)的積累和影響因素復(fù)雜作用機(jī)理的揭示,越來(lái)越多的學(xué)者開(kāi)始關(guān)注船舶交通流變化的周期性、非線性和非穩(wěn)定性特征。針對(duì)船舶交通流序列的非線性和非平穩(wěn)性特性,肖進(jìn)麗和Li等[5-6]建立了集成集合經(jīng)驗(yàn)?zāi)B(tài)分解和神經(jīng)網(wǎng)絡(luò)的船舶交通流預(yù)測(cè)模型,基于歷史數(shù)據(jù)實(shí)現(xiàn)了船舶交通流的月度預(yù)測(cè);針對(duì)船舶交通流的周期性變化規(guī)律,Liu等[7]提出先運(yùn)用低秩稀疏分析方法將船舶交通流序列數(shù)據(jù)處理為年×月的數(shù)據(jù)矩陣,再通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)船舶交通流進(jìn)行預(yù)測(cè)。數(shù)據(jù)分解的方法體現(xiàn)了對(duì)影響因素作用機(jī)理的考量,提升了交通流預(yù)測(cè)的精度,并實(shí)現(xiàn)了船舶交通流的月度預(yù)測(cè)。
為了更好地支撐船舶交通組織和擁擠度預(yù)測(cè),部分學(xué)者開(kāi)始探索更精細(xì)化的船舶交通流預(yù)測(cè)?;葑觿偟萚8]提出了一種基于模糊C均值聚類自適應(yīng)神經(jīng)模糊推理系統(tǒng)的船舶海上交通流預(yù)測(cè)模型,實(shí)現(xiàn)了以天為單位的船舶交通流預(yù)測(cè);吳康等[9]將單斷面船舶交通流預(yù)測(cè)方法向多斷面進(jìn)行改進(jìn)和推廣,提出了基于狀態(tài)空間和卡爾曼濾波的多斷面交通流預(yù)測(cè)模型,實(shí)現(xiàn)了以小時(shí)為單位的船舶交通流預(yù)測(cè);王小華等[10]基于福姜沙水道船舶交通流觀測(cè)結(jié)果,探究船舶交通流與潮汐特征之間的關(guān)系,為福姜沙水道船舶航行安全保障及航道疏浚施工方案提供參考。
但是,由于船舶交通流的影響因素既包括具有穩(wěn)定性的航道、錨地、泊位等要素,又包括具有周期性的自然環(huán)境要素,還包括具有突發(fā)性的事故、施工等要素。因此,每個(gè)時(shí)間段之間船舶交通流量數(shù)據(jù)會(huì)有很強(qiáng)的時(shí)序相關(guān)性、周期性和不穩(wěn)定性?,F(xiàn)有的船舶交通流預(yù)測(cè)模型較少能夠綜合考慮這些要素的影響,存在預(yù)測(cè)精度較低的缺陷。并且,由于水路交通存在交通數(shù)據(jù)量較小、船舶行為活動(dòng)自由空間大等特點(diǎn),航道和水道的船舶調(diào)度及交通組織管理常以小時(shí)為單位進(jìn)行。因此,本文針對(duì)時(shí)段船舶交通流量提出一種基于二維經(jīng)驗(yàn)?zāi)J椒纸?Bidimensional Empirical Mode Decomposition, BEMD)和時(shí)序正則化矩陣分解(Temporal regularized matrix factorization, TRMF)的交通流預(yù)測(cè)模型。在原始船舶交通流量矩陣化的基礎(chǔ)上,利用BEMD對(duì)交通流量數(shù)據(jù)矩陣分解,運(yùn)用引入時(shí)序正則化矩陣的TRMF構(gòu)建船舶交通流組合預(yù)測(cè)模型框架,實(shí)現(xiàn)時(shí)段船舶交通流預(yù)測(cè)。
二維經(jīng)驗(yàn)?zāi)J椒纸?BEMD)[11]是一種能有效處理非平穩(wěn)和非線性序列數(shù)據(jù)的時(shí)空分析方法,可以將船舶交通流時(shí)序矩陣分解為二維固有模態(tài)函數(shù)(Bidimensional Intrinsic Mode Function, BIMF)分量和殘差分量。BIMF為高頻矩陣,對(duì)應(yīng)突發(fā)性的要素引起的船舶交通流量的不穩(wěn)定變化;殘差分量為低頻矩陣,對(duì)應(yīng)穩(wěn)定性和周期性的要素引起的船舶交通流量的變化。BEMD算法對(duì)二維船舶交通流時(shí)序矩陣篩分BIMF分量過(guò)程如下。
2) 分別對(duì)局部極大值點(diǎn)集和局部極小值點(diǎn)集進(jìn)行包絡(luò)擬合,得到二維上包絡(luò)eμ(x,y)和下包絡(luò)eλ(x,y);
3) 基于二維矩陣上包絡(luò)eμ(x,y)和下包絡(luò)eλ(x,y)計(jì)算包絡(luò)均值em(x,y);
(1)
4) 從原始二維矩陣中減去包絡(luò)均值;
(2)
其中,篩分約束條件SD為:
(3)
6) 計(jì)算殘余量
(4)
如果R1(x,y)中含有不少于兩個(gè)極值點(diǎn),將其作為新的輸入矩陣返回步驟(1)繼續(xù)進(jìn)行分解,直到最后分解出來(lái)的殘余分量RL(x,y)中沒(méi)有極值點(diǎn)時(shí),BEMD分解結(jié)束,原始矩陣M(x,y)可以表示為:
(5)
式中:Bq(x,y)為第q個(gè)BIMF;RL(x,y)為殘余分量。
時(shí)序正則化矩陣分解(TRMF)預(yù)測(cè)模型,在矩陣分解(Matrix Factorization,MF)方法[12]的基礎(chǔ)上引入時(shí)序正則項(xiàng),支持?jǐn)?shù)據(jù)驅(qū)動(dòng)的時(shí)間依賴性學(xué)習(xí),TRMF繼承了MF方法的計(jì)算復(fù)雜度較低等特性,可以很容易地處理大規(guī)模時(shí)間序列數(shù)據(jù)。TRMF根據(jù)BEMD算法分解出的高頻矩陣及低頻矩陣學(xué)習(xí)交通流的變化規(guī)律,實(shí)現(xiàn)船舶交通流的預(yù)測(cè),具體過(guò)程如圖1,預(yù)測(cè)步驟描述如下。
圖1 基于TRMF的船舶交通流預(yù)測(cè)示意圖
1) 交通流時(shí)序矩陣Y∈RN×T可由維度特性矩陣W=[…,wi,…]T∈RN×r與時(shí)間特性矩陣X=[…,xt,…]∈Rr×T表示為:
Y≈WX
(6)
時(shí)間特性矩陣X∈Rr×T中列的關(guān)系為:
(7)
式中:I為滯后集,用于存儲(chǔ)時(shí)間特性矩陣X中列與列之間的關(guān)聯(lián)距離;θl為xt-l的時(shí)序系數(shù)向量,所有θl組合為列之間的時(shí)序系數(shù)矩陣Θ。
3) TRMF求解方法是通過(guò)交叉迭代時(shí)序系數(shù)矩陣Θ、維度特性矩陣W以及時(shí)間特性矩陣X使得公式(9)最小化的過(guò)程。
BEMD算法可將船舶交通流數(shù)據(jù)分解為反映突變因素影響下船舶交通流量不穩(wěn)定變化的高頻矩陣以及刻畫(huà)周期性要素引起的船舶交通流量穩(wěn)定變化的低頻矩陣,有效降低了船舶交通流非線性和非平穩(wěn)性對(duì)預(yù)測(cè)精度的影響,同時(shí)TRMF預(yù)測(cè)方法通過(guò)自學(xué)習(xí)習(xí)得船舶交通流時(shí)序變化規(guī)律,進(jìn)一步提升了船舶交通流的預(yù)測(cè)精度。
BEMD-TRMF船舶交通流組合預(yù)測(cè)模型框架如圖2。具體步驟如下:
(8)
λxRAR(X|Ι,Θ,η)+λθRθ(Θ)
(9)
(10)
(11)
1) 數(shù)據(jù)預(yù)處理:采集整理歷史船舶交通流數(shù)據(jù),將歷史船舶交通流數(shù)據(jù)處理為二維時(shí)間序列矩陣M(x,y)。
2) 利用BEMD算法將M(x,y)分解成n個(gè)二維固有模態(tài)分量BIMF和一個(gè)二維殘余分量RL,即:
M(x,y)=BIMF1+BIMF2+…+BIMFn+RL(x,y)
(12)
3) 針對(duì)分解出的各個(gè)BIMF和殘余分量RL,分別建立TRMF預(yù)測(cè)模型進(jìn)行學(xué)習(xí)與預(yù)測(cè),得到各二維固有模態(tài)分量和殘余分量的預(yù)測(cè)值。
4) 最后將各二維固有模態(tài)分量和殘余分量的預(yù)測(cè)值進(jìn)行疊加,得到船舶交通流預(yù)測(cè)結(jié)果矩陣,如公式(13)??筛鶕?jù)需要,將預(yù)測(cè)結(jié)果矩陣轉(zhuǎn)化為時(shí)間序列預(yù)測(cè)結(jié)果,也可直接調(diào)用矩陣中對(duì)應(yīng)的時(shí)段預(yù)測(cè)值用于船舶交通組織管理。
F(x,y)=FBIMF1+FBIMF2+…+FBIMFn+FRL(x,y)
(13)
采集武漢長(zhǎng)江大橋附近水域(如圖3)2017年6月AIS數(shù)據(jù),分別統(tǒng)計(jì)上、下行船舶交通流量。統(tǒng)計(jì)過(guò)程中,將1 d 24 h分成12個(gè)時(shí)間段,每隔2 h計(jì)算一次上行及下行通過(guò)武漢長(zhǎng)江大橋的船舶數(shù)量,得到船舶交通流時(shí)間序列數(shù)據(jù)(如圖4)共720個(gè)。
圖3 基于AIS數(shù)據(jù)統(tǒng)計(jì)的武漢長(zhǎng)江大橋上下行船舶軌跡
a) 上行船舶交通流時(shí)間序列
b) 下行船舶交通流時(shí)間序列
另外,論文采用的訓(xùn)練數(shù)據(jù)為2019年6月1號(hào)~29號(hào)的船舶交通流數(shù)據(jù),測(cè)試數(shù)據(jù)為同年6月30號(hào)的船舶交通流數(shù)據(jù),采用的數(shù)據(jù)為同一研究對(duì)象的同一數(shù)據(jù)樣本,即訓(xùn)練和測(cè)試數(shù)據(jù)總是來(lái)源于同一個(gè)樣本集,能夠保證模型取得穩(wěn)定的預(yù)測(cè)結(jié)果。
為驗(yàn)證實(shí)驗(yàn)數(shù)據(jù)具有非平穩(wěn)性,利用ADF(Augmented Dickey-Fuller)對(duì)每一天的上、下行實(shí)驗(yàn)數(shù)據(jù)分別做非平穩(wěn)性檢驗(yàn)(如表1),檢驗(yàn)結(jié)果表明,上、下行數(shù)據(jù)t統(tǒng)計(jì)值的絕對(duì)值均大于顯著性水平1%、5%、10%的試驗(yàn)臨界值(Test Critical Value),即實(shí)驗(yàn)數(shù)據(jù)具有非平穩(wěn)性;隨后并將其處理為二維(d×2 h)交通流時(shí)序矩陣,運(yùn)用BEMD算法進(jìn)行分解得到高頻矩陣和低頻矩陣(如圖5)。
表1 原始船舶交通流時(shí)序數(shù)據(jù)ADF檢驗(yàn)
a) 武漢長(zhǎng)江大橋上行水域船舶交通流矩陣分解圖
為說(shuō)明BEMD-TRMF組合預(yù)測(cè)模型的預(yù)測(cè)精度和適用性,將其預(yù)測(cè)結(jié)果與GM(1,1)、ARIMA、BPNN、WNN、LSTM及TRMF預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行比較。實(shí)驗(yàn)結(jié)果如圖6~7。
運(yùn)用平均相對(duì)誤差(MRE)和相對(duì)誤差標(biāo)準(zhǔn)差(SDRE)、均方根誤差(RMSE)和平均絕對(duì)百分差(MAPE)對(duì)各預(yù)測(cè)模型的計(jì)算精度進(jìn)行綜合評(píng)價(jià)。各模型預(yù)測(cè)誤差及對(duì)比如圖8~9及表2。
表2 各模型預(yù)測(cè)結(jié)果評(píng)價(jià)表
(14)
(15)
(16)
(17)
由預(yù)測(cè)數(shù)據(jù)的誤差對(duì)比可知,GM(1,1)和ARIMA的預(yù)測(cè)精度較差,平均預(yù)測(cè)誤差在10%以上,BPNN、WNN、LSTM預(yù)測(cè)模型降低了船舶交通流非線性特征對(duì)預(yù)測(cè)結(jié)果的影響,預(yù)測(cè)精度較好,平均預(yù)測(cè)誤差在5%~9%以上;單一TRMF預(yù)測(cè)模型學(xué)習(xí)了船舶交通流間的時(shí)序特性,預(yù)測(cè)精度進(jìn)一步提高,平均預(yù)測(cè)誤差在4%~5%;而本文提出的BEMD-TRMF組合預(yù)測(cè)模型,在TRMF模型進(jìn)行預(yù)測(cè)前利用BEMD算法對(duì)二維船舶交通流時(shí)序矩陣進(jìn)行處理,降低了船舶交通流非線性和非平穩(wěn)性對(duì)預(yù)測(cè)精度的影響,有效提升了預(yù)測(cè)精度,平均預(yù)測(cè)誤差在3%左右。
船舶交通流數(shù)據(jù)受航道中突發(fā)的碰撞、失控、火災(zāi)等應(yīng)急事故影響會(huì)產(chǎn)生波動(dòng)而加大預(yù)測(cè)難度,為進(jìn)一步驗(yàn)證文章預(yù)測(cè)模型在非平穩(wěn)和非線性序列數(shù)據(jù)中的預(yù)測(cè)精度,在船舶交通流數(shù)據(jù)中加入噪聲產(chǎn)生波動(dòng)(如圖10)以模擬航道中發(fā)生應(yīng)急突發(fā)事件后船舶交通流的變化特征,并對(duì)每一天的上、下行實(shí)驗(yàn)數(shù)據(jù)進(jìn)行非平穩(wěn)性檢驗(yàn)(如表3),檢驗(yàn)結(jié)果表明,上、下行數(shù)據(jù)t統(tǒng)計(jì)值的絕對(duì)值均大于顯著性水平1%、5%、10%的臨界值,波動(dòng)實(shí)驗(yàn)數(shù)據(jù)具有非平穩(wěn)性。
表3 波動(dòng)船舶交通流時(shí)序數(shù)據(jù)ADF檢驗(yàn)
a) 上行船舶交通流時(shí)間序列
對(duì)上述加入噪聲后一維船舶交通流數(shù)據(jù)進(jìn)行處理得到二維船舶交通流時(shí)序矩陣,分別利用單一TRMF預(yù)測(cè)模型和BEMD-TRMF組合預(yù)測(cè)模型對(duì)船舶交通流進(jìn)行預(yù)測(cè),其預(yù)測(cè)精度評(píng)價(jià)如表4,表5。
表4 基于TRMF的波動(dòng)數(shù)據(jù)預(yù)測(cè)結(jié)果評(píng)價(jià)表
表5 基于BEMD-TRMF的波動(dòng)數(shù)據(jù)預(yù)測(cè)結(jié)果評(píng)價(jià)表
由波動(dòng)數(shù)據(jù)與原始數(shù)據(jù)的預(yù)測(cè)誤差對(duì)比來(lái)看,BEMD-TRMF預(yù)測(cè)模型使用波動(dòng)數(shù)據(jù)的預(yù)測(cè)精度要比使用原始數(shù)據(jù)的預(yù)測(cè)精度稍低一些,絕大多數(shù)情況下預(yù)測(cè)精度相差在1%以下;在波動(dòng)數(shù)據(jù)預(yù)測(cè)精度方面,文章采用的BEMD-TRMF組合預(yù)測(cè)模型仍比使用原始數(shù)據(jù)的單一TRMF預(yù)測(cè)模型效果要好,多數(shù)情況下預(yù)測(cè)精度相差約為2%,由此可以證明BEMD將二維船舶交通流時(shí)序矩陣分解為高頻矩陣和低頻矩陣在降低數(shù)據(jù)非線性和非平穩(wěn)性影響方面是有效的和必要的,BEMD-TRMF預(yù)測(cè)模型在使用波動(dòng)數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí)仍具有適用性,且預(yù)測(cè)精度較高。
針對(duì)船舶交通流的非線性和不穩(wěn)定性造成的船舶交通流預(yù)測(cè)精度不高的問(wèn)題,本文提出了一種適用于水道的融合BEMD-TRMF模型的船舶交通流組合預(yù)測(cè)方法。模型利用BEMD算法將二維船舶交通流時(shí)序矩陣分解成若干高頻矩陣和低頻矩陣,有效處理了船舶交通流時(shí)序矩陣的非線性和非平穩(wěn)性特征;運(yùn)用TRMF預(yù)測(cè)模型對(duì)分解的高頻矩陣和低頻矩陣進(jìn)行學(xué)習(xí)和預(yù)測(cè),考慮了船舶交通流數(shù)據(jù)中時(shí)序關(guān)聯(lián)性。實(shí)驗(yàn)表明,BEMD-TRMF預(yù)測(cè)模型在預(yù)測(cè)精度和穩(wěn)定性上要優(yōu)于GM(1,1)、ARIMA、BPNN、WNN、LSTM及TRMF預(yù)測(cè)模型,在因發(fā)生應(yīng)急突發(fā)事故而引起的波動(dòng)船舶交通流數(shù)據(jù)預(yù)測(cè)方面也達(dá)到了較好的預(yù)測(cè)精度,能夠?yàn)榫徑馑来皳頂D度和優(yōu)化船舶交通組織等提供基礎(chǔ)支撐。