(蘭州財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)學(xué)院,甘肅 蘭州 730020)
隨著港口和海運(yùn)的快速發(fā)展,集裝箱吞吐量成為反映港口生產(chǎn)經(jīng)營活動成果的重要指標(biāo)。作為當(dāng)今社會國際運(yùn)輸?shù)闹饕绞街?,長期監(jiān)測港口集裝箱吞吐量并對其未來趨勢進(jìn)行相關(guān)的預(yù)測研究,是確定港口發(fā)展規(guī)模、規(guī)劃港口總體布局、劃分港區(qū)功能的重要依據(jù)之一,對于港口基礎(chǔ)設(shè)施建設(shè)、區(qū)域經(jīng)濟(jì)的發(fā)展以及國家戰(zhàn)略布局等方面都具有深遠(yuǎn)的影響。如果對港口集裝箱吞吐量的預(yù)測出現(xiàn)重大偏差,可能會給港口的發(fā)展帶來無法估量的經(jīng)濟(jì)損失,甚至?xí)绊懭珖?jīng)濟(jì)的發(fā)展。因此,對我國重要港口的集裝箱吞吐量進(jìn)行精準(zhǔn)預(yù)測分析和研判,可以為政府和相關(guān)企業(yè)提供準(zhǔn)確的決策參考,這對國家的長期發(fā)展也具有重大意義?;谏鲜鲈?,近年來,有關(guān)集裝箱吞吐量的預(yù)測受到眾多學(xué)者的關(guān)注,已成為當(dāng)前預(yù)測領(lǐng)域的一個(gè)研究熱點(diǎn)。
目前,關(guān)于港口貨物吞吐量預(yù)測的方法較多,主要分為三大類:傳統(tǒng)的時(shí)序預(yù)測方法、智能預(yù)測方法、分解-集成框架下的預(yù)測方法。關(guān)于傳統(tǒng)時(shí)間序列預(yù)測方法的運(yùn)用,最早是將單一的回歸模型[1-2]、指數(shù)平滑法(Exponential Smoothing,ES)[3-5]、灰色理論[6-8]以及差分整合自回歸移動平均模型(ARIMA)[9-10]運(yùn)用于集裝箱吞吐量的預(yù)測中,發(fā)現(xiàn)預(yù)測精度并不高。為了改進(jìn)單一預(yù)測方法的局限性,柳艷嬌,等[11]將港口集裝箱吞吐量數(shù)據(jù)分別用指數(shù)平滑法和灰色模型進(jìn)行預(yù)測,再通過誤差修正權(quán)值,將兩種方法得到的預(yù)測值進(jìn)行加權(quán)平均即為最后預(yù)測值,得到了比單一預(yù)測方法更高的精度。趙尚威,等[12]、蔣惠園,等[13]也通過將不同的單一預(yù)測方法進(jìn)行組合,同時(shí)采用不同方法確定權(quán)重,得到了更好的預(yù)測精度。近年來,隨著人工神經(jīng)網(wǎng)絡(luò)的興起,有學(xué)者將BP 神經(jīng)網(wǎng)絡(luò)[14-16]、RBF神經(jīng)網(wǎng)絡(luò)[17-18]、Elman 神經(jīng)網(wǎng)絡(luò)[19]、支持向量回歸(Support Vector Regression,SVR)[20]等應(yīng)用到了港口集裝箱吞吐量預(yù)測的研究中,由于人神經(jīng)網(wǎng)絡(luò)中各層的連接權(quán)重、SVR 方法中相關(guān)參數(shù)的不同取值決定了最終的預(yù)測精度,故而通過粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法[21]、遺傳算法(GA)[22]等啟發(fā)式算法來得到最優(yōu)的連接權(quán)值或相關(guān)參數(shù),使得預(yù)測精度得到進(jìn)一步提高。上述這些方法雖然都取得了一定的預(yù)測效果,但對于非線性程度和波動程度較高的數(shù)據(jù),預(yù)測效果不理想。因此,基于分解-集成框架下的預(yù)測方法,是近年來較為新穎、運(yùn)用廣泛的預(yù)測方法。該方法旨在運(yùn)用某種分解方法,將原始時(shí)間序列分解為若干子序列,對每個(gè)子序列分別進(jìn)行預(yù)測,最后將各子序列預(yù)測的數(shù)據(jù)進(jìn)行某種線性或非線性集成,從而得到最終的預(yù)測值。譬如,Niu,等[23]提出VMD-ARIMA-HGWOSVR 模型,該模型用變分模態(tài)分解(VMD)將原始序列分解為數(shù)個(gè)子模態(tài),根據(jù)數(shù)據(jù)的不同特征,分別對低頻的子模態(tài)用ARIMA 模型進(jìn)行預(yù)測,高頻的子模態(tài)用灰狼優(yōu)化算法(HGWO)優(yōu)化的SVR模型來進(jìn)行預(yù)測,最后集成得到最終的預(yù)測結(jié)果。馮宏祥,等[24]也提出EMD-SVR模型來預(yù)測上海港集裝箱吞吐量,該模型用經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)方法將原始數(shù)據(jù)分為數(shù)個(gè)頻率不同的子列,對各子列用SVR進(jìn)行預(yù)測,最后將各子列的預(yù)測結(jié)果進(jìn)行集成,得到最終預(yù)測結(jié)果。分解-集成框架下對港口集裝箱吞吐量預(yù)測[25-27]的方法還有很多,將不同分解方法與預(yù)測方法相結(jié)合,形成各種新的組合模型。本文同樣在分解-集成預(yù)測框架下,提出了一種新的組合預(yù)測模型,即用EEMD(Ensemble Empirical Mode Decomposition,EEMD)算法將原始序列分解為若干子序列后,將不同頻率的序列用PSOLSSVR來預(yù)測,而對殘差趨勢項(xiàng)用多項(xiàng)式回歸(Polynomial Regression,PR)來擬合,接著用感知機(jī)模型對不同頻率序列的預(yù)測值進(jìn)行非線性集成,與對應(yīng)殘差項(xiàng)的預(yù)測值進(jìn)行加總,從而得到最終預(yù)測結(jié)果。
支持向量機(jī)(Support Vector Machines,SVM)是由Vapnik[28]提出的一種用于分類的算法,當(dāng)其用于數(shù)值預(yù)測時(shí),稱為支持向量回歸。
支持向量機(jī)對于非線性數(shù)據(jù)有很強(qiáng)的處理能力,其基本原理是找到一個(gè)非線性映射函數(shù)φ(x),將線性不可分的數(shù)據(jù)x從低維特征空間投影至高維特征空間,使得原本的非線性問題轉(zhuǎn)化為線性問題。即在高維空間中,建立超平面:
式(1)中,m為空間維度,ω為權(quán)向量,b為偏差。該函數(shù)近似問題與下面函數(shù)的最小化問題等價(jià):
其中,yi是樣本的實(shí)際輸出,而f(xi)是預(yù)期的輸出值。l是樣本數(shù)。‖ω‖是加權(quán)向量范數(shù),用于約束模型的結(jié)構(gòu)容量,從而獲得更好的泛化能力。C是確定性經(jīng)驗(yàn)誤差和正則項(xiàng)之間權(quán)衡的正則化常數(shù)。
通過支持向量機(jī)最小化目標(biāo)函數(shù)來確定回歸函數(shù),引入如下目標(biāo)函數(shù):
通過引入拉格朗日乘數(shù)αi、將支持向量回歸函數(shù)轉(zhuǎn)化為對偶問題進(jìn)行解決,式(4)的解即為最優(yōu)的判別函數(shù):
其中K(Xi,X)稱為核函數(shù),核函數(shù)的類型很多,常用的有兩種核函數(shù):線性核函數(shù)與RBF核函數(shù)。
線性核函數(shù):
RBF核函數(shù):
本文中所用到的核函數(shù)為RBF 核函數(shù),σ2是RBF 內(nèi)核函數(shù)參數(shù),而線性內(nèi)核函數(shù)沒有參數(shù)。總之,懲罰參數(shù)C、RBF 內(nèi)核函數(shù)參數(shù)σ2的不同取值直接影響著最終的預(yù)測效果,本文引入了粒子群優(yōu)化算法(PSO)來優(yōu)化參數(shù)C和σ2。
本文對于分解之后的殘差序列,將采用傳統(tǒng)的一元多項(xiàng)式回歸方法進(jìn)行預(yù)測。一元多項(xiàng)式回歸就是用某條光滑的曲線來擬合原始數(shù)據(jù),該方法也稱為一元多項(xiàng)式的最小二乘曲線擬合,其基本形式為[29]:
實(shí)際在運(yùn)用LSSVR時(shí)往往難以達(dá)到我們對精度的要求,因?yàn)閼土P參數(shù)C和核參數(shù)σ2的不確定性都會導(dǎo)致無法得到最優(yōu)的預(yù)測值,故而找到最適合模型的參數(shù)C和σ2是提高預(yù)測精度的關(guān)鍵。本文利用粒子群算法對最小二乘支持向量機(jī)的懲罰參數(shù)C和核參數(shù)σ2進(jìn)行優(yōu)化,盡可能尋找到全局最優(yōu)解。
PSO算法最初由Kennedy和Eberhart[30]在1995年提出,是一種基于鳥類覓食行為的搜索算法。鳥類在捕食過程中,每只鳥只需搜尋此時(shí)距離食物較近的鳥的周圍,就可以用較短的時(shí)間獲取到食物,人們從鳥類行為特征中得到啟發(fā)并用于求解優(yōu)化問題。
本文采用PSO 算法優(yōu)化懲罰C和核參數(shù)σ2的步驟如下:
步驟1 初始化一群粒子。本文中種群規(guī)模n=20,包括初始化粒子的速度與位置,再設(shè)定學(xué)習(xí)因子C1=1.5,C2=1.7,最大迭代次數(shù)k=50,慣性因子設(shè)置為w=1.9。
步驟2 計(jì)算粒子適應(yīng)度值。本文先用5折交叉驗(yàn)證對訓(xùn)練樣本進(jìn)行隨機(jī)劃分,將5次均方根誤差的平均值定義為適應(yīng)度函數(shù),其值的好壞表示粒子的優(yōu)劣。
步驟3 迭代更新。在每次迭代中,粒子每更新一次位置,就計(jì)算一次適應(yīng)度值,據(jù)此來進(jìn)行粒子的更新,粒子都通過兩個(gè)位置進(jìn)行更新:第一,更新實(shí)現(xiàn)個(gè)體歷史最佳位置Pbest;第二,更新種群中找到全局的最佳位置Gbest。
步驟4 更新粒子的位置與速度。更新公式為:
其中,w是慣性因子,i=1,2,…,N,N是種群中粒子的總數(shù);j=1,2,…,K,K是搜索空間的維數(shù);為粒子當(dāng)前速度;為粒子當(dāng)前位置;c1、c2是學(xué)習(xí)因子。
步驟5 確定最優(yōu)解。當(dāng)?shù)螖?shù)達(dá)到最大設(shè)定次數(shù)或當(dāng)誤差小于預(yù)設(shè)的誤差精度,即停止迭代,輸出結(jié)果。
本文中所用的基于“分解-集成”框架下的組合預(yù)測模型,主要包括分解、各模態(tài)預(yù)測和綜合集成三部分。其中,分解的主要目的是簡化預(yù)測的任務(wù),將其劃分成易于預(yù)測的各個(gè)子任務(wù);集成主要是為了形成原始數(shù)據(jù)的最終預(yù)測結(jié)果,而且集成學(xué)習(xí)對最終預(yù)測的結(jié)果非常重要。本文使用分解-集成框架下的預(yù)測模型,該方法相比傳統(tǒng)的預(yù)測方法,可以獲得比較好的性能。在這里,首先使用EEMD 算法將原始集裝箱吞吐量數(shù)據(jù)進(jìn)行分解;其次,將帶有趨勢項(xiàng)的殘差序列進(jìn)行傳統(tǒng)多項(xiàng)式回歸預(yù)測,對其余模態(tài)進(jìn)行PSO-LSSVR預(yù)測;最后,對各個(gè)預(yù)測結(jié)果進(jìn)行非線性集成。圖1為該方法的總體框架預(yù)測流程圖。
圖1 分解-集成的總體框架預(yù)測流程
經(jīng)驗(yàn)?zāi)B(tài)分解是由Huang,等[32]于1998年提出的一種信號分析方法,它是一種自適應(yīng)的數(shù)據(jù)處理或挖掘方法,適用于非線性、非平穩(wěn)時(shí)間序列處理。它能將原始信號分解成具有不同頻率的本征模態(tài)函數(shù)(IMF)和一個(gè)殘差分量的總和。此過程可降低每個(gè)數(shù)據(jù)分量的復(fù)雜性,并便于分析和預(yù)測IMF。但是,EMD 有模態(tài)混疊的問題,為了克服這個(gè)問題,Wu,等[33]于2009年創(chuàng)建了集合經(jīng)驗(yàn)?zāi)B(tài)分解,EEMD是在待分解信號中加入白噪聲進(jìn)行輔助分析,利用均勻分布的白噪聲頻譜,補(bǔ)償原始信號分解后所得IMF丟失的尺度,由于零均值噪聲的特性,經(jīng)過多次平均后,噪聲將相互抵消,集成均值的結(jié)果可作為最終結(jié)果。
本文中使用EEMD 時(shí)將白噪聲標(biāo)準(zhǔn)差確定為0.2,添加白噪聲的次數(shù)確定為100,根據(jù)數(shù)據(jù)自身特性,分解為若干個(gè)子列,逐一進(jìn)行分析與預(yù)測。
具體的預(yù)測過程包括以下三個(gè)步驟:
步驟1 分解。使用EEMD 算法將原始數(shù)據(jù)分解為N個(gè)相對簡單且有意義的本征模態(tài)函數(shù)IMF1、IMF2、IMFN和殘差序列Res。
步驟2 模態(tài)預(yù)測。不同頻率的IMF 用PSOLSSVR 進(jìn)行預(yù)測,具體根據(jù)原始數(shù)據(jù)的特征確定相應(yīng)的滯后期數(shù),將其作為PSO-LSSVR的輸入,后一期作為輸出,根據(jù)滾動預(yù)測的原則得出相應(yīng)測試集IMF的預(yù)測值。對帶有趨勢的殘差項(xiàng)用PR進(jìn)行預(yù)測,根據(jù)訓(xùn)練集確定PR的回歸系數(shù),用其得到的一元多項(xiàng)式預(yù)測殘差項(xiàng)。
步驟3 集成預(yù)測。將PSO-LSSVR 預(yù)測的各子模態(tài)的結(jié)果用感知機(jī)模型(PM)進(jìn)行非線性集成,將集成預(yù)測的結(jié)果與對應(yīng)殘差項(xiàng)的預(yù)測值相加,形成最終的預(yù)測結(jié)果。
為使所選的數(shù)據(jù)具有代表性,本文以2019 年國家交通運(yùn)輸部發(fā)布的全國港口集裝箱吞吐量數(shù)據(jù)前十的港口,即廣州、青島、大連、天津、廈門、蘇州、營口、上海、寧波-舟山以及深圳的港口集裝箱吞吐量數(shù)據(jù)(數(shù)據(jù)來源于Wind 數(shù)據(jù)庫及中華人民共和國交通運(yùn)輸部)為研究對象,其中廣州港、青島港、大連港、天津港、廈門港、上海港、深圳港的數(shù)據(jù)涵蓋了2001年1月至2019年12月期間共計(jì)228個(gè)觀測值,寧波-舟山港的數(shù)據(jù)涵蓋了2006 年1 月至2019 年12 月共計(jì)168個(gè)觀測值,蘇州港的數(shù)據(jù)涵蓋了2011年1月至2019 年12 月共計(jì)108 個(gè)觀測值,營口港的數(shù)據(jù)涵蓋2009年1月至2019年12月共計(jì)132個(gè)觀測值。
圖2(a)為十大港口集裝箱吞吐量的變化曲線,各個(gè)數(shù)據(jù)的趨勢變動、波動幅度都略有不同。為了捕捉不同數(shù)據(jù)的差異性以及找出有顯著性特征差異的代表性港口,本文運(yùn)用K-Means 聚類將數(shù)據(jù)進(jìn)行分類,每一類中選出最具有代表性的港口數(shù)據(jù)進(jìn)行模型檢驗(yàn),用不同特征的港口數(shù)據(jù)來檢驗(yàn)本文所建模型的穩(wěn)健性。在進(jìn)行K-Means 聚類之前,為克服不同港口集裝箱數(shù)據(jù)長度不同的問題,用零值將具有較少樣本點(diǎn)的寧波-舟山港、蘇州港、營口港的數(shù)據(jù)補(bǔ)齊至與廣州港、上海港的樣本數(shù)相同,再通過計(jì)算比較各港口集裝箱吞吐量數(shù)據(jù)間歐式距離的大小,將距離較近的數(shù)據(jù)歸為一類,可將數(shù)據(jù)分為3 類,選出每一類中距離類中心最近的港口數(shù)據(jù)作為代表進(jìn)行預(yù)測。
圖2 港口集裝箱吞吐量
圖2(b)分別給出了三類中最具有代表性的廣州、營口、上海港口集裝箱吞吐量的時(shí)序圖,觀察發(fā)現(xiàn)廣州、營口、上海的特征差異明顯,分別代表了不同頻率及不同波動大小的三類數(shù)據(jù)。將廣州港、營口港、上海港的數(shù)據(jù)集分為訓(xùn)練集和測試集,將上海港和廣州港2001 年1 月至2018 年12 月共216 個(gè)觀測值、營口港2009年1月至2018年12月共120個(gè)觀測值分別作為訓(xùn)練集,此數(shù)據(jù)用來模型訓(xùn)練。以上海港、廣州港和營口港2019 年1 月至2019 年12 月共12 個(gè)數(shù)據(jù)作為測試集。本文根據(jù)原始序列的自相關(guān)程度大小選取了滯后6期的吞吐量數(shù)據(jù)作為輸入,預(yù)測下一月的數(shù)據(jù)。
通常有多種誤差測量標(biāo)準(zhǔn)可用于評估模型的預(yù)測性能。但是,相關(guān)研究表明,沒有通用的標(biāo)準(zhǔn)公式可以評估預(yù)測方法的有效性。本文采用四種主要的評估標(biāo)準(zhǔn)來評估預(yù)測性能:平均絕對百分比誤差(MAPE),均方根誤差(RMSE),平均絕對誤差(MAE)和方向統(tǒng)計(jì)量Dstat。較低的MAPE、RMSE、MAE表示較好的水平預(yù)測性能,較高的Dstat表示較好的方向預(yù)測性能。MAPE、RMSE、MAE、Dstat的計(jì)算公式分別如下:
根據(jù)表1的ADF檢驗(yàn)結(jié)果可知,在1%、2%和5%的顯著性水平下,上海、廣州、營口的集裝箱吞吐量數(shù)據(jù)的p 值大于0.05,故接受單位根原假設(shè),認(rèn)為原始數(shù)據(jù)是不平穩(wěn)的。因此,本文研究的集裝箱吞吐量數(shù)據(jù)具有典型的非平穩(wěn)性特征。
表1 數(shù)據(jù)的ADF單位根檢驗(yàn)
在本文的分析中,為了比較各個(gè)模型的預(yù)測性能與精度,提出了ES、LSSVR、PSO-LSSVR 作為單一的基準(zhǔn)模型,而EMD-LSSVR-PM、EMD-PSO-LSSVRPM、EMD-PSO-LSSVR/PR-PM、EEMD-LSSVR-PM、EEMD-PSO-LSSVR-PM 作為分解-集成框架下的基準(zhǔn)模型來預(yù)測上海、廣州、營口港的數(shù)據(jù),與本文提出的EEMD-PSO-LSSVR/PR-PM模型進(jìn)行比較。
(1)首先,用EEMD 將上海、廣州、營口港口集裝箱吞吐量數(shù)據(jù)進(jìn)行分解,將上海、廣州、營口港口集裝箱吞吐量數(shù)據(jù)分別分解為6 個(gè)本征模態(tài)分量與1個(gè)殘差趨勢分量,如圖3(a)、圖4(a)、圖5(a)所示。
(2)接著,分別利用PSO-LSSVR和PR對EEMD算法分解后的6個(gè)IMFs分量和1個(gè)殘差分量進(jìn)行預(yù)測。
(3)然后,將各IMF 分量和殘差分量的預(yù)測結(jié)果進(jìn)行集成匯總。集成匯總采用PM模型集成,然后用簡單相加的集成方式得到最終的預(yù)測結(jié)果,即將各模態(tài)的預(yù)測分量用PM 進(jìn)行非線性集成,具體將6 個(gè)IMFs預(yù)測得到的值作為PM的輸入,而用原始數(shù)據(jù)減去EEMD 算法分解所得趨勢殘差項(xiàng)Res 的值作為輸出來訓(xùn)練模型,如此將各IMF 預(yù)測的數(shù)據(jù)進(jìn)行非線性集成,得到6 個(gè)IMFs 的非線性集成預(yù)測值。然后再將每期各IMF 的總預(yù)測值與對應(yīng)殘差分量的預(yù)測值進(jìn)行加總,得到最終的預(yù)測結(jié)果。圖3(b)、圖4(b)、圖5(b)分別展示了模型對上海、廣州、營口2019 年1月至2019 年12 月集裝箱吞吐量數(shù)據(jù)預(yù)測結(jié)果的對比圖。
圖3 上海港口集裝箱吞吐量EEMD算法分解與模型預(yù)測結(jié)果對比圖
圖4 廣州港口集裝箱吞吐量EEMD算法分解與模型預(yù)測結(jié)果對比圖
圖5 營口港港口集裝箱吞吐量EEMD分解與模型預(yù)測結(jié)果對比圖
(4)為了驗(yàn)證本文提到的分解-集成預(yù)測方法的有效性,本文將一個(gè)單一模型ES、LSSVR、PSO-LSSVR 與數(shù)個(gè)組合模型EMD-LSSVR-PM、EMD-PSOLSSVR-PM、EMD-PSO-LSSVR/PR-PM、EEMD-LSSVR-PM、EEMD-PSO-LSSVR-PM 與本文提出的模型進(jìn)行比較,利用MAPE、RMSE、MAE、Dstat將模型預(yù)測結(jié)果計(jì)算出的誤差指標(biāo)進(jìn)行對比,具體見表2。
根據(jù)表2 中各模型的預(yù)測效果可以得到以下結(jié)論:
表2 不同模型的預(yù)測效果比較
(1)與單一傳統(tǒng)預(yù)測方法ES 相比,不論是上海港、廣州港還是營口港的預(yù)測結(jié)果,智能預(yù)測方法、基于分解-集成框架下的預(yù)測方法都具有更小的MAPE、RMSE、MAE,即這些模型的預(yù)測精度更高。說明對于非平穩(wěn)數(shù)據(jù),智能預(yù)測方法、分解-集成框架下的預(yù)測方法更具可行性。
(2)比較單一智能預(yù)測方法LSSVR 與通過啟發(fā)式算法對參數(shù)進(jìn)行優(yōu)化后的智能預(yù)測方法PSOLSSVR,模型的預(yù)測精度得到了不同幅度的提高(除廣州港),即PSO對LSSVR模型中懲罰參數(shù)C與核參數(shù)σ2優(yōu)化選擇的結(jié)果較為顯著,進(jìn)一步說明啟發(fā)式算法在模型中參數(shù)選擇的有效性。
(3)從EMD-LSSVR、EMD-PSO-LSSVR-PM、EMD-PSO-LSSVR/PR-PM 和EEMD-LSSVR-PM、EEMD-PSO-LSSVR-PM、EEMD-PSO-LSSVR/PRPM不同分解-集成的組合模型預(yù)測結(jié)果來看,首先,由于EEMD算法克服了EMD算法分解過程中模態(tài)混疊的問題,故基于EEMD 算法下組合模型得到了更高的預(yù)測精度。其次,對于EEMD 算法分解后得到的不同頻率的六個(gè)IMFs 與殘差項(xiàng)Res,各IMF 采用PSO-LSSVR 進(jìn)行預(yù)測,帶有趨勢的殘差項(xiàng)采用多項(xiàng)式回歸進(jìn)行擬合。這是因?yàn)椋厔輾埐铐?xiàng)的非線性程度不高,波動性也不高,采用傳統(tǒng)的趨勢預(yù)測方法反而比智能預(yù)測方法更優(yōu)。事實(shí)證明,針對不同的數(shù)據(jù)特征,應(yīng)選取相適應(yīng)的預(yù)測方法,“分而治之”策略下能進(jìn)一步提高模型的預(yù)測精度。最后,對于不同頻率子序列的預(yù)測值采用PM進(jìn)行非線性集成,最終得到EMD-PSO-LSSVR/PR-PM為最優(yōu)模型。
本文主要利用“分解-集成”的思想,對我國主要港口的集裝箱吞吐量進(jìn)行非線性預(yù)測。首先,從預(yù)測效果上來看,采用分解-集成框架下的組合預(yù)測模型要比單一傳統(tǒng)時(shí)序預(yù)測、智能預(yù)測模型具有更好的預(yù)測效果。主要原因在于,對于非線性、高波動的復(fù)雜數(shù)據(jù)而言,利用EEMD 算法分解,得到了不同頻率的子序列,能夠更好地捕捉原始數(shù)據(jù)的特征,從而提高預(yù)測精度。其次,EEMD算法分解后得到的子序列中,對不同頻率的子序列采用智能預(yù)測方法,帶有趨勢的殘差項(xiàng)采用傳統(tǒng)時(shí)間序列預(yù)測方法。最后,用感知機(jī)模型對智能方法得到的預(yù)測值進(jìn)行非線性集成,進(jìn)一步提高了模型的預(yù)測精度。因此,基于分解-集成框架下的組合預(yù)測模型對于復(fù)雜非線性數(shù)據(jù)的預(yù)測具有更好的通用性,預(yù)測時(shí)對具有不同特征的數(shù)據(jù)采用“分而治之”的策略,且在集成時(shí)選擇非線性集成能得到更高的預(yù)測精度。