張曉雷,黃洪瓊
(上海海事大學 信息工程學院,上海 201306)
近年來,隨著社會經濟和對外貿易的迅速發(fā)展,各種水域的船舶流量也在不斷增加,從而導致先進的航行技術和落后的港口運輸管理之間的矛盾已經成為現(xiàn)階段中國水路運輸發(fā)展的突出矛盾。因此,提升航行水域船舶流量預測的準確性和高效性變得尤為重要[1]。
同時,現(xiàn)實中的多種因素,如季節(jié)、氣候、經濟、地域文化甚至行業(yè)的周期性變化等,都會對船舶流量帶來直接或間接的影響,所以擁有一種高效、準確的預測模型是十分必要的。
目前,用于船舶流預測的方法主要包括灰色預測模型[2]、線性回歸分析[3]、灰色神經網絡[4]、極大似然估計[5]、支持向量機[6]等。這些預測方法具有各自的特點,但有個共同的特點就是要求預測的歷史數(shù)據(jù)有較好的光滑度[7]。故文中采用一種新型的預測方法,即基于季節(jié)指數(shù)的灰色-馬爾可夫預測模型。
在同一年時間內船舶流量的變化存在明顯的季節(jié)變化,故引入季節(jié)指數(shù)來對季節(jié)變化進行修正。將修正后的數(shù)據(jù)作為灰色預測模型的原始數(shù)據(jù)用于建模預測,然后引入Markov模型來修正和彌補灰色模型的預測誤差。通過構建實際值與灰色模型預測殘差的時間序列,研究誤差的變化規(guī)律與趨勢。
為了進一步尋找船舶流量在一定時間跨度上的變化規(guī)律,在模型中引入功率譜。功率譜即功率密度譜,表征了單位頻帶內的功率大小,通過功率譜分析可以提取出各個頻率分量。以各個月的船舶總流量為采樣點,由于一年有12個月,因此采樣間隔為12 Hz,得到離散序列{x(n)}。然后,對序列{x(n)}去均值消除零頻道影響[8]。同時,采用帶阻濾波的方法過濾去1 Hz左右的頻率分量,根據(jù)濾波后的船舶數(shù)據(jù)序列功率譜研究確定船舶的年際變化周期。
季節(jié)指數(shù)是反映事物季節(jié)性變動規(guī)律的一套指數(shù),表示每年反復出現(xiàn)有規(guī)律的周期性變動,且每年上下變動的幅度大體相似。船舶的月流量季節(jié)指數(shù)可以用來描述一個年度內各個月的船舶流量特征,反映各月的船舶流量占全年的船舶平均數(shù)值大小。文中采用平均法[9]測定各月船舶流季節(jié)指數(shù),計算步驟如下:
(1)將原始序列{x(n)}按周期分組,劃分為N年,每年M=12個數(shù)據(jù),即xNM。
(1)
(2)
(4)計算各月季節(jié)指數(shù)τi:
(3)
(5)測定季節(jié)指數(shù)后,利用τi對原始數(shù)據(jù)進行修正。為了滿足灰色模型對歷史數(shù)據(jù)的要求,將原始數(shù)據(jù)進行取對數(shù)處理。
灰色理論是基于數(shù)學理論的系統(tǒng)工程科學,通過少量的、不完全的信息,建立灰色微分預測模型[10],故可以運用灰色理論的方法解決船舶流的預測問題,而GM(1,1)模型是最常用的灰色模型。
設經過季節(jié)指數(shù)修正和對數(shù)變換后的數(shù)據(jù)列為:
x(0)={x(0)(1),x(0)(2),…,x(0)(n)}
(4)
其中,n為序列長度。
將式4進行累加,得:
x(1)={x(1)(1),x(1)(2),…,x(1)(n)}
(5)
其中:
(6)
(7)
其中,α為參數(shù),記為A=[ab]T,并用最小二乘法確定參數(shù):
A=(BTB)(-1)BTXN-1=[ab]T
(8)
其中:
(9)
xN-1=[x(0)(2)x(0)(3)…x(0)(n)](T)
(10)
得到微分方程:
(11)
經過累減還原得到:
(12)
模型誤差分析時,常用相對誤差進行檢驗,即:
(13)
平均相對誤差為:
(14)
灰色預測依舊存在一定誤差[12],故引入馬爾可夫模型進行修正。馬爾可夫模型的預測原理是根據(jù)某些變量的顯著狀態(tài)及其變化趨勢,預測其在未來某一特定期間內可能出現(xiàn)的狀態(tài)[13],步驟為:
(1)計算波動指數(shù)序列:由式13可得δk。
(2)劃分Markov狀態(tài)。
δk∈[α1i,α2i],i=1,2,…,s
(15)
上式表示第k對象的波動指數(shù)處于第i種狀態(tài)Ei,α1i、α2i分別表示Ei的上、下界。因此,總的狀態(tài)集合表示為E=(E1,E2,…,En)。
(16)
(4)構造未來狀態(tài)矩陣pij。
根據(jù)相對于預測目標的距離選取s個預測對象,按照從近到遠的順序排序,分別以各個對象所對應的狀態(tài)為矩陣的初始狀態(tài),在n步轉移概率矩陣p中選取各自所對應的行向量[14],構造出新的概率矩陣:
(17)
k=1,2,…,n
(18)
以MATLAB為實驗平臺,測試數(shù)據(jù)選取武漢大橋斷面2007年1月—2016年12月的船舶交通流量,其中以2007年1月—2015年12月的108個數(shù)據(jù)作為學習樣本來建立模型,以2016年12個月的船舶流量數(shù)據(jù)作為測試樣本來檢測模型。模型原始數(shù)據(jù)x(0)為:
(19)
2007年—2015年的船舶交通流量數(shù)據(jù)序列經過過濾以后的功率譜如圖1所示。
圖1 濾去1 Hz分量后的月船舶流量功率譜
由圖1可知,功率譜中有2個比較明顯的峰值:
(1)頻率為2 Hz時,對應0.5年的周期分量,其功率譜強度和一年中季節(jié)和生活規(guī)律的升降規(guī)律一致;
(2)頻率為0.5 Hz時,對應2年的周期分量,表明船舶流的年際變化以2年為周期,因此,文中確定武漢大橋的船舶流量的季節(jié)性變化周期為2年。
綜上,用GM(1,1)預測模型進行逐年預測,得出了2007年—2015年各月船舶流量的誤差計算結果,如表1所示。
表1 2007年—2015年各月的船舶誤差表
通過用上述方法對數(shù)據(jù)進行處理后,分別用GM(1,1)模型和馬氏修正后的GM(1,1)模型對2016年各個月的船舶流進行預測,并與實際值進行對比。同時,為了更好地對實驗結果進行對比,用BP神經網絡[15]對同一時間段的船舶流量進行了預測,結果分別如圖2~4所示。
(20)
(21)
(22)
將三種模型的MAE、MAPE、RMSE進行計算比較,其結果如表2所示。
圖2 BP神經網絡模型預測結果
圖3 GM(1,1)模型預測結果
圖4 馬氏修正后的預測結果
性能指數(shù)BPGM(1,1)Markov-GM(1,1)MAE878.42473.43188.67MAPE8.14%4.43%2.11%RMSE896.92499.15249.64
由表2可知,Markov-GM(1,1)預測模型的MAE、MAPE、RMSE都明顯小于BP模型和GM(1,1)模型。因此,Markov-GM(1,1)模型比BP神經網絡模型和GM(1,1)模型在船舶預測的準確性和高效性等方面優(yōu)勢顯著。
在實際生活中,船舶交通流量會受到季節(jié)、氣候、人為活動等因素的影響而形成季節(jié)性周期波動。文中利用周期波動性因素,在傳統(tǒng)灰色預測模型的基礎上,引入馬爾可夫模型對其進行修正,構建了一種新型的船舶預測模型。實驗結果表明,改進的預測模型可以更好地反映出船舶流量的總體變化趨勢和數(shù)據(jù)波動特征,并且與傳統(tǒng)的預測模型相比,Markov-GM(1,1)模型的預測精度更高,穩(wěn)定性更好。研究表明,該方法適用于中長期船舶交通流量的預測。