徐東星, 尹 勇, 張秀鳳, 孫 珽, 葉 進(jìn), 付昭斌
(1.廣東海洋大學(xué) 海運(yùn)學(xué)院, 廣東 湛江 524088; 2.大連海事大學(xué) a.航海學(xué)院;b.航海動(dòng)態(tài)仿真和控制交通行業(yè)重點(diǎn)實(shí)驗(yàn)室, 遼寧 大連 116026)
海上船舶交通事故(包括碰撞、擱淺、觸礁、觸損、浪損、火災(zāi)/爆炸、自沉和其他)的預(yù)測(cè)和控制是海上交通管理的重要內(nèi)容,其預(yù)測(cè)的準(zhǔn)確性將直接影響海上通航能力和海洋環(huán)境,關(guān)系到海上航行安全。目前,國(guó)內(nèi)外水上交通事故常用的預(yù)測(cè)方法有時(shí)間序列預(yù)測(cè)模型、自回歸預(yù)測(cè)模型、神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)和馬爾科夫模型等。[1-2]受諸多因素的影響,水上交通事故的發(fā)生具有隨機(jī)性和不確定性,而灰色預(yù)測(cè)模型對(duì)解決 “部分信息已知、部分信息未知”的海上船舶交通事故預(yù)測(cè)具有很好的適用性。
目前,學(xué)者們利用不同的灰色系統(tǒng)方法對(duì)不同海域的海上船舶交通事故進(jìn)行預(yù)測(cè)和分析,不同的灰色理論方法預(yù)測(cè)水上交通事故的結(jié)果與實(shí)際情況會(huì)存在不同程度的差異。郝慶龍等[3]和牛佳偉等[4]分別采用加權(quán)灰色關(guān)聯(lián)理論、改進(jìn)關(guān)聯(lián)系數(shù)的加權(quán)灰色關(guān)聯(lián)理論和加權(quán)灰色預(yù)測(cè)模型對(duì)寧波水域和遼寧水域的海上交通事故的主要致因和事故數(shù)量進(jìn)行分析和預(yù)測(cè),取得滿意結(jié)果,但是加權(quán)灰色預(yù)測(cè)模型在確定模型參數(shù)時(shí)需要人為選取合適的權(quán)值矩陣。甘浪雄等[5]采用擺動(dòng)灰色模型對(duì)某港口的海上交通事故進(jìn)行定量計(jì)算,并結(jié)合定性分析來預(yù)測(cè)未來該港口海上交通事故數(shù)量和事故種類的比例,該模型對(duì)擺動(dòng)幅度較大的原始數(shù)據(jù)具有較好的預(yù)測(cè)精度。陳海山等[6]對(duì)海上交通事故數(shù)呈現(xiàn)非單調(diào)的擺動(dòng)發(fā)展趨勢(shì)的序列采用灰色Verhulst模型對(duì)其預(yù)測(cè),擬合效果良好。王祺等[7]采用馬爾科夫鏈對(duì)系統(tǒng)云灰色模型的海上交通事故預(yù)測(cè)值進(jìn)行修正,并采用等維遞補(bǔ)法和滑動(dòng)轉(zhuǎn)移概率法對(duì)組合模型進(jìn)行改進(jìn),結(jié)果令人滿意。李鈴鈴等[8]基于誤差補(bǔ)償思想,采用BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)對(duì)灰色預(yù)測(cè)模型進(jìn)行殘差修正,建立灰色神經(jīng)網(wǎng)絡(luò)模型對(duì)海上交通事故進(jìn)行預(yù)測(cè)。王當(dāng)利等[9]引入誘導(dǎo)有序加權(quán)平均(Induced Ordered Weighted Averaging,IOWA)算子對(duì)灰色模型和支持向量機(jī)的回歸模型進(jìn)行組合,對(duì)全國(guó)和長(zhǎng)江某流域的水上交通事故進(jìn)行預(yù)測(cè)。陳昌源等[10]通過引入弱化緩沖算子降低原始數(shù)據(jù)的隨機(jī)性對(duì)傳統(tǒng)的灰色預(yù)測(cè)模型進(jìn)行改進(jìn),對(duì)我國(guó)海上交通事故進(jìn)行預(yù)測(cè)并取得良好的效果。但文獻(xiàn)[7]~文獻(xiàn)[10]所采用的海上交通事故灰色預(yù)測(cè)模型僅對(duì)數(shù)據(jù)進(jìn)行預(yù)處理或基于誤差補(bǔ)償思想對(duì)預(yù)測(cè)結(jié)果進(jìn)行殘差修正等措施來提高模擬精度和預(yù)測(cè)精度,忽略灰色預(yù)測(cè)模型結(jié)構(gòu)固有的局限性。因此,本文針對(duì)基于非齊次指數(shù)離散函數(shù)的灰色模型NHGM(1,1,k)在海上交通事故預(yù)測(cè)中存在的不足,提出一種優(yōu)化背景值和殘差綜合修正的三參數(shù)灰色預(yù)測(cè)模型INHGM(1,1,λ,k),通過改進(jìn)的自適應(yīng)粒子群優(yōu)化(Adaptive Particle Swarm Optimization,APSO)算法對(duì)模型中的初始值和背景值進(jìn)行優(yōu)化計(jì)算,并用優(yōu)化模型對(duì)我國(guó)海上交通事故數(shù)進(jìn)行模擬和預(yù)測(cè)。結(jié)果表明:改進(jìn)的INHGM(1,1,λ,k)模型模擬和預(yù)測(cè)的平均相對(duì)誤差比NHGM(1,1,k)模型更小,并且預(yù)測(cè)精度較傳統(tǒng)GM(1,1)模型有所提高,減少原模型的由于參數(shù)近似替代所導(dǎo)致的模擬誤差,為海上交通事故預(yù)測(cè)提供新的理論基礎(chǔ)和方法。
設(shè)非負(fù)序列X(0)=(x(0)(0),x(0)(1),…,x(0)(n))為原始序列,X(1)=(x(1)(0),x(1)(1),…,x(1)(n))為X(0)的一階累加序列,[11-12]Z(1)為X(1)緊鄰均值生成序列,有
(1)
式(1)為NHGM(1,1,k)的基本形式(以下簡(jiǎn)稱三參數(shù)灰色預(yù)測(cè)模型)。將一階微分方程求導(dǎo)為
(2)
式(2)為三參數(shù)灰色預(yù)測(cè)模型NHGM(1,1,k)的白化微分方程。
(3)
則NHGM(1,1,k)模型為
(4)
最小二乘參數(shù)估計(jì)需滿足:
(5)
(6)
還原值為
k=1,2,…,n-1
(7)
3) 在三參數(shù)灰色預(yù)測(cè)模型模擬誤差平方和最小的前提下,模型的最優(yōu)初始條件為
(8)
在系統(tǒng)學(xué)習(xí)NHGM(1,1,k)模型建模機(jī)理的基礎(chǔ)上,發(fā)現(xiàn)影響模型的模擬和預(yù)測(cè)精度與背景值的構(gòu)造形式有關(guān)。當(dāng)原始序列波動(dòng)較大時(shí),背景值的構(gòu)造采用緊鄰均值生成的形式為
z(1)(k)=0.5[x(1)(k)+x(1)(k-1)]
(9)
式(9)會(huì)引起較大的滯后誤差,存在一定的缺陷。為此,引入一種背景值優(yōu)化方法為
z(1)(k)=λx(1)(k)+(1-λ)x(1)(k-1)
(10)
式(10)中:0≤λ≤1。
設(shè):
(11)
(12)
根據(jù)灰色建模理論可知:式(11)與式(12)需同時(shí)成立,聯(lián)立式(10)、式(11)與式(12)可得
(13)
在式(10)中,如果λ僅取值0.5,會(huì)導(dǎo)致模擬與預(yù)測(cè)精度變差。對(duì)背景值重構(gòu)的灰色模型簡(jiǎn)稱為NHGM(1,1,λ,k)。
根據(jù)灰色系統(tǒng)理論建模的思想可知:對(duì)原始序列進(jìn)行平移和殘差修正可提高灰色模型的模擬與預(yù)測(cè)精度。[13-14]在綜合考慮優(yōu)化初始值與背景值的基礎(chǔ)上,首先對(duì)原始序列進(jìn)行平移變換,再建立NHGM(1,1,λ,k)模型;根據(jù)灰色模型的預(yù)測(cè)值與原始序列求取殘差序列,然后對(duì)殘差序列建立NHGM(1,1,λ,k)模型;對(duì)灰色模型的模擬值進(jìn)行殘差修正即可得到校正后的預(yù)測(cè)值。具體建模步驟如下:
設(shè)原始序列為
X(0)={x(0)(k)},k=1,2,…,n
(14)
3) 模型預(yù)測(cè)值為
(15)
4) 殘差序列為
(16)
5) 對(duì)殘差序列進(jìn)行平移變換得到新殘差序列(a1為平移量)為
(17)
7) 對(duì)NHGM(1,1,λ,k)模型進(jìn)行殘差修正的預(yù)測(cè)值為
(18)
實(shí)際使用過程需要對(duì)以上模型中的未知參數(shù)(平移值、背景值系數(shù)、初始值修正量)進(jìn)行計(jì)算。采用改進(jìn)的APSO算法,以均方根誤差(Root-Mean-Square Error, RMSE)最小為約束條件,進(jìn)行函數(shù)尋優(yōu)計(jì)算,得到最優(yōu)的模型參數(shù)值。對(duì)背景值進(jìn)行優(yōu)化和殘差綜合修正的模型稱為改進(jìn)的三參數(shù)灰色模型(簡(jiǎn)稱INHGM(1,1,λ,k))。
KENNEDY等[15]提出一種群體智能尋優(yōu)算法即粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法。該算法的基本思想如下:
1) 假設(shè)在一個(gè)D維的搜索空間中,由n個(gè)粒子組成的種群X=(X1,X2,…,Xn),其中第i個(gè)粒子表示為一個(gè)D維的向量Xi=(xi1,xi2,…,xiD)T,代表第i個(gè)粒子在D維搜索空間中的位置,即問題的潛在解。
2) 根據(jù)適應(yīng)度函數(shù)即可計(jì)算出每個(gè)粒子位置Xi對(duì)應(yīng)的適應(yīng)度值。第i個(gè)粒子的速度為vi=(vi1,vi2,…,viD)T,其個(gè)體極值為Pi=(Pi1,Pi2,…,PiD)T,種群的群體極值為Pg=(Pg1,Pg2,…,PgD)T。
3) 粒子通過個(gè)體極值和群體極值更新自身的速度和位置,直到達(dá)到終止條件時(shí)停止搜索,即
(19)
(20)
式(19)和式(20)中:w為慣性權(quán)重;d=1,2,…,D;i=1,2,…,n;k為當(dāng)前迭代次數(shù);vid為粒子速度;c1和c2為自適應(yīng)學(xué)習(xí)因子,屬于非負(fù)的常數(shù);r1和r2屬于[0,1]的隨機(jī)數(shù)。
為提高粒子群算法的尋優(yōu)能力,避免在尋優(yōu)過程中出現(xiàn)早熟收斂現(xiàn)象,引入自適應(yīng)調(diào)整慣性權(quán)重和學(xué)習(xí)因子的APSO。自適應(yīng)慣性權(quán)重為
(21)
自適應(yīng)學(xué)習(xí)因子[16]為
(22)
式(21)和式(22)中:k為當(dāng)前迭代次數(shù);Iter為最大迭代次數(shù);wstart為慣性權(quán)重初始值;wend為最終慣性權(quán)重。通常取wstart=0.9,wend=0.4。
采用改進(jìn)的APSO算法對(duì)INHGM(1,1,λ,k)模型的參數(shù)(平移值、背景值、初始值修正量)進(jìn)行尋優(yōu),以RMSE為適應(yīng)度函數(shù),得到最優(yōu)的模型參數(shù)值。具體優(yōu)化步驟如下:
1) 參數(shù)初始化即隨機(jī)初始化粒子的位置和速度,粒子維數(shù)為6維:
Pi=(a0i,λ1i,η1i,a1i,λ2i,η2i)
Vi=(vi1,vi2,vi3,vi4,vi5,vi6)
(23)
式(23)中:0≤λ1i,λ2i≤1。
2) 以RMSE為目標(biāo)函數(shù)計(jì)算粒子的適應(yīng)度值(目標(biāo)函數(shù)值),再根據(jù)目標(biāo)函數(shù)值確定個(gè)體和群體極值。目標(biāo)函數(shù)為
(24)
3) 根據(jù)粒子位置和速度更新公式,對(duì)粒子速度和位置進(jìn)行更新,計(jì)算粒子的適應(yīng)度值,并與個(gè)體和群體極值進(jìn)行比較,取粒子的適應(yīng)度值、個(gè)體極值與群體極值中的較小者為當(dāng)前粒子的位置。
4) 當(dāng)粒子的適應(yīng)度值達(dá)到預(yù)設(shè)的精度或迭代次數(shù)超過預(yù)設(shè)的迭代次數(shù)即停止搜索,輸出全局最優(yōu)模型參數(shù)即粒子的最優(yōu)位置。
以2004—2018年我國(guó)海上交通事故數(shù)據(jù)(摘自《交通運(yùn)輸行業(yè)發(fā)展統(tǒng)計(jì)公報(bào)》){562 532 440 420 342 358 331 298 270 262 260 212 196 196 176}(單位:起)為研究樣本,分別建立NHGM(1,1,k)模型和本文提出的優(yōu)化模型INHGM(1,1,λ,k),驗(yàn)證所提出的灰色預(yù)測(cè)模型的準(zhǔn)確性和預(yù)測(cè)精度。
1) 選取2004—2012年的部分歷史數(shù)據(jù)為建模樣本,然后對(duì)2013—2014年我國(guó)海上船舶交通事故進(jìn)行預(yù)測(cè)并與文獻(xiàn)[10]預(yù)測(cè)結(jié)果相比較,驗(yàn)證模型的準(zhǔn)確性。在MATLAB語(yǔ)言環(huán)境下分別建立NHGM(1,1,k)模型和本文提出的優(yōu)化模型INHGM(1,1,λ,k), 其中:APSO的粒子總數(shù)為80;最大迭代次數(shù)為200。兩種模型的模擬值和預(yù)測(cè)值及其相對(duì)誤差,見表1~表4。
表3 NHGM(1,1, k)模型預(yù)測(cè)值
表4 INHGM(1,1,λ,k)模型預(yù)測(cè)值
由表1和表2可知:基于INHGM(1,1,λ,k)模型的平均相對(duì)誤差3.172 2%比原始NHGM(1,1,k)模型的平均相對(duì)誤差4.076 6%小0.905 4%。為驗(yàn)證改進(jìn)模型的預(yù)測(cè)精度,分別對(duì)2013—2014年的我國(guó)海上船舶交通事故進(jìn)行預(yù)測(cè)。原始NHGM(1,1,k)模型預(yù)測(cè)值分別為2013年286起、2014年277起,如表3所示。INHGM(1,1,λ,k)模型預(yù)測(cè)值分別為2013年268起、2014年258起,如表4所示。2013年與2014年實(shí)際海上交通事故分別為262起、260起,結(jié)果表明:本文提出的INHGM(1,1,λ,k)模型比NHGM(1,1,k)模型的預(yù)測(cè)精度高,預(yù)測(cè)精度為0.76%~2.29%,與文獻(xiàn)[10]預(yù)測(cè)結(jié)果相近,可為海上交通事故預(yù)測(cè)與控制提供新的理論依據(jù)。
2) 為比較優(yōu)化模型與其他灰色模型的預(yù)測(cè)精度,選取2004—2016年的部分歷史數(shù)據(jù)為建模樣本,然后對(duì)2017—2018年我國(guó)海上船舶交通事故進(jìn)行預(yù)測(cè)并與NHGM(1,1,k)模型、傳統(tǒng)GM(1,1)模型預(yù)測(cè)結(jié)果進(jìn)行比較,見表5~表8。由表5~表8可知:本文提出的模型的模擬精度優(yōu)于原始NHGM(1,1,k)模型,低于傳統(tǒng)GM(1,1)模型,但優(yōu)化模型的預(yù)測(cè)精度高于GM(1,1)模型與NHGM(1,1,k)模型。本文采用優(yōu)化模型對(duì)2019年我國(guó)水上交通事故進(jìn)行預(yù)測(cè),預(yù)測(cè)值為176起。從預(yù)測(cè)結(jié)果來看,我國(guó)水上交通事故趨勢(shì)平穩(wěn)。
表5 GM(1,1)模型模擬值
表6 NHGM(1,1, k)模型模擬值
表7 INHGM(1,1,λ, k)模型模擬值
表8 模型預(yù)測(cè)值比較 起
3) 為驗(yàn)證優(yōu)化模型在長(zhǎng)期預(yù)測(cè)中的預(yù)測(cè)精度問題,選取2004—2011年的部分歷史數(shù)據(jù)為建模樣本,對(duì)2018年我國(guó)海上船舶交通事故進(jìn)行預(yù)測(cè)。優(yōu)化模型預(yù)測(cè)結(jié)果為273起 ,而實(shí)際值為176起,相差97起。綜上可知:本文提出的模型對(duì)海上交通事故短期預(yù)測(cè)具有較高的預(yù)測(cè)精度,長(zhǎng)期預(yù)測(cè)的可信度較低。
針對(duì)基于非齊次指數(shù)離散函數(shù)的三參數(shù)灰色預(yù)測(cè)模NHGM(1,1,k)模型存在的不足,提出一種優(yōu)化背景值和殘差綜合修正的INHGM(1,1,λ,k)模型,并通過改進(jìn)的APSO對(duì)參數(shù)進(jìn)行優(yōu)化。通過對(duì)2004—2018年我國(guó)海上船舶交通事故的模擬值與預(yù)測(cè)值的分析,可得出以下結(jié)論:
1) 改進(jìn)灰色模型適用于海上交通事故的短期預(yù)測(cè),長(zhǎng)期預(yù)測(cè)精度較低。
2) 改進(jìn)灰色模型與原模型的模擬與預(yù)測(cè)精度相比較好,并且預(yù)測(cè)精度高于傳統(tǒng)的灰色GM(1,1)模型,在誤差允許的范圍內(nèi),能夠較好地反映水上交通事故的發(fā)展趨勢(shì),具有一定的擬合度和外推性。