湯斯敏, 蘭培真, 朱經君
(1.集美大學海上交通安全研究所,福建 廈門 361021;2.交通安全應急信息技術國家工程實驗室集美大學分實驗室,福建 廈門 361021;3.安徽中澳科技職業(yè)學院國際商務系,合肥 230000)
近年來我國港口發(fā)展迅猛,隨著國家政策和戰(zhàn)略計劃的進一步推進,影響港口吞吐量發(fā)展的因素越來越多。[1]為進一步支持港口發(fā)展規(guī)劃與決策制定,很有必要研究一種既能充分考慮眾多因素的影響又能適當簡化預測模型的港口吞吐量預測方法。為此,迫切需要研究合適的港口吞吐量影響因素分析方法,以建立科學有效的港口吞吐量預測模型。
現(xiàn)今常用的港口吞吐量預測方法主要有時間序列法、趨勢外推法、回歸分析法、灰色預測法、神經網絡法、支持向量機法、馬爾科夫法等。程文忠等[2]提出了基于支持向量機理論的港口吞吐量預測模型;戴霖等[3]應用馬爾科夫模型對港口吞吐量進行了預測;范瑩瑩等[4]將由主成分分析法得到的GDP作為參數引進帶外加輸入的非線性自回歸模型(nonlinear autoregressive exogenous model,NARX 模型),建立了上海港集裝箱吞吐量預測模型;朱小檬等[5]提出了時間序列-因果關系組合法預測國內海港中長期集裝箱吞吐量;XIE等[6]在最小二乘支持向量回歸(least square support vector regression,LSSVR)模型的基礎上提出了3種組合預測方法;GENG等[7]提出了一種港口吞吐量預測模型,該模型應用混沌有效遺傳算法(chaotic efficient genetic algorithm,CEGA)優(yōu)化參數,克服了參數投影尋蹤回歸(parameter projection pursuit regression,PPPR)中參數測定的難題;HUANG等[8]提出了投影尋蹤回歸-遺傳編程(projection pursuit regression - genetic programming,PPR-GP)方法對青島港集裝箱吞吐量進行預測。
針對港口吞吐量影響因素越來越多的實際情況,目前對港口吞吐量預測的研究成果中還沒有既能綜合考慮眾多因素的影響又能控制預測模型中自變量個數的有效預測方法。為此本文應用系統(tǒng)聚類法確定影響港口吞吐量的典型因素,再應用多元線性回歸分析法,以典型因素作為自變量,建立港口吞吐量的典型因素預測模型。這樣既能綜合考慮眾多因素的影響,又能結合實際情況和預測需求對影響因素類別進行調整,以控制預測模型的自變量個數,使預測模型難度適中可控。通過對廈門港集裝箱吞吐量的實例分析,驗證模型的有效性,為港口未來吞吐量預測和規(guī)劃提供參考。
港口吞吐量的預測受眾多因素的影響,這些影響因素的特征有些相近,有些卻完全不相關。在進行港口吞吐量預測時,如何兼顧眾多因素的影響又不因影響因素過多而增加預測難度從而影響預測精度,一直是港口吞吐量預測的難點。系統(tǒng)聚類法正適用于解決這類型難題。根據港口吞吐量預測的目標和影響因素的特征,定義影響因素間的相似程度度量標準,將各影響因素按照相似程度大小逐一歸類,相似度越大則越優(yōu)先聚合,直到所有的影響因素都聚合完畢,形成一個表示影響因素間親疏關系的系統(tǒng)聚類圖。根據系統(tǒng)聚類圖可得到彼此獨立且具有代表性的影響因素作為典型因素。系統(tǒng)聚類過程如下:
(1)數據準備。假設港口吞吐量的影響因素有m個,X=(x1,x2,…,xm)T,各影響因素取n年的觀測值,Xi=(xi1,xi2,…,xin),i=1,2,…,m,xij表示第i個影響因素第j年的觀測值。為避免各影響因素值對度量單位的依賴,需對觀測值進行Z-Score標準化處理[9]。
(1)
(2)確定影響因素間的相似度。各影響因素間相似度的度量標準為歐氏距離[9]。
(2)
(3)類間相似度的確定。設Gp和Gq為已聚類合并的兩類影響因素,則定義類間相似度[9]:
xi∈Gp,xk∈Gq, 1≤hp,hq≤m
(3)
式中:Dpq2為Gp和Gq兩個類別中兩兩因素之間的平均平方距離;hp和hq分別為類Gp和類Gq中的影響因素個數。
(4)影響因素的聚類。應用系統(tǒng)聚類法中的組內聯(lián)接法進行聚類。由式(2)計算各影響因素之間的距離,將距離最小的兩個影響因素合并成一個新類,其余各影響因素獨自成類;根據式(3)計算類與類之間的距離,并將距離最小的兩類進行合并,形成一個新類;重復進行類間距離的計算及類的合并,直到所有影響因素合并成一個大類為止;最后根據系統(tǒng)聚類過程生成表示影響因素間親疏關系的系統(tǒng)聚類圖。
(5)典型因素的確定。根據實際需要并結合系統(tǒng)聚類圖來確定影響因素的分類數,得到彼此獨立且具有代表性的影響因素類別。在各影響因素類別中分別選取一個總相似距離L值最小的影響因素作為典型因素代替其余影響因素。
與xi為同類影響因素
(4)
式中:Lxi為影響因素xi的總相似距離;h為該類中影響因素的個數,1≤h≤m。
多元線性回歸分析法能考慮到多個因素對港口吞吐量的影響,與系統(tǒng)聚類法結合能有效地對港口吞吐量進行預測,提高港口吞吐量的預測精度。設定影響港口吞吐量的典型因素為x1,x2,…,xl,應用多元線性回歸分析法建立典型因素預測模型為
y=β0+β1x1+β2x2+…+βlxl+ε
(5)
式中:y為港口吞吐量;βi為待定參數,i=0,1,…,l;ε為隨機干擾項,服從正態(tài)分布。
廈門港集裝箱吞吐量的影響因素可分為宏觀因素和微觀因素:宏觀因素包含世界經濟發(fā)展趨勢及政策、海峽西岸經濟區(qū)的建設、經濟發(fā)展水平、對外貿易規(guī)模、城市需求能力等;微觀因素包含港口體制改革、管理模式改革、管理因素、生產力布局、集裝箱機械設備、集裝箱運作模式、集疏運能力、基礎設施、腹地經濟水平、港口競爭力等[10]??紤]到廈門港在兩岸三通、海峽西岸經濟區(qū)、東南國際航運中心、自由貿易區(qū)、21世紀海上絲綢之路核心區(qū)等規(guī)劃和建設進程中的優(yōu)勢和發(fā)展,廈門港腹地經濟發(fā)展水平會不斷提高,對外貿易規(guī)模會不斷擴大,海鐵聯(lián)運量會逐年提高,集疏運能力會不斷加強。綜上考慮,選取對廈門港集裝箱吞吐量有較大影響的因素,見表1。
表1 廈門港集裝箱吞吐量的重要影響因素
通過查閱歷年廈門經濟特區(qū)統(tǒng)計年鑒及相關統(tǒng)計資料,收集了表1中影響因素2005—2016年的統(tǒng)計數據。原始數據過多,故不在文中一一列舉。
為消除各原始數據量綱差異的影響,根據式(1)進行數據標準化處理,得
(6)
由式(2)和(3),通過影響因素與影響因素、類與類之間的相似度計算和類的合并,得到影響因素的系統(tǒng)聚類圖,見圖1。結合廈門港集裝箱吞吐量的實際情況和預測需求,以縱向直線在圖1上左右平移,將直線停在橫坐標17時,可確定3類影響因素,此時與直線有交點的每根橫線所對應的影響因素就是一類,即其橫線左端包含的各個影響因素就是此類的成員。具體分類結果見表2。
圖1 廈門港集裝箱吞吐量影響因素的系統(tǒng)聚類圖表2 廈門港集裝箱吞吐量影響因素的分類結果
類別劃分第1類第2類第3類影響因素x5x10x1,x2,x3,x4,x6,x7,x8,x9,x11,x12,x13
根據式(4)計算第3類影響因素中各因素的L值, 得到Lx1=1.803,Lx2=5.745,Lx3=1.810,Lx4=2.136,Lx6=1.914,Lx7=5.008,Lx8=2.495,Lx9=2.026,Lx11=3.171,Lx12=7.850,Lx13=1.919。經比較可知,影響因素x1的L值最小,因此確定第3類影響因素中的典型因素為腹地GDP值。因為該類中各因素的特征有較大相似性,對預測對象的貢獻率基本一致,所以經計算選出的腹地GDP值能充分代表該類中其余因素對港口吞吐量的影響。
綜上所述,可確定影響廈門港集裝箱吞吐量的典型因素為港口固定資產投資總額、海鐵聯(lián)運量和腹地GDP值。經系統(tǒng)聚類分析后得到的這3個典型因素彼此獨立且具有代表性,能綜合代表其余因素對廈門港集裝箱吞吐量的影響。
2005—2016年廈門港集裝箱吞吐量、腹地GDP值、港口固定資產投資總額和海鐵聯(lián)運量4個方面的統(tǒng)計數據見表3。
表3 2005—2016年廈門港4個方面的統(tǒng)計數據
根據式(5),將腹地GDP值、港口固定資產投資總額和海鐵聯(lián)運量這3個典型因素作為自變量,應用多元線性回歸分析法[9]建立廈門港集裝箱吞吐量的典型因素預測模型:
(7)
根據多元線性回歸統(tǒng)計檢驗,模型(7)的調整R2(調整決定系數)為0.998,且F統(tǒng)計量的P值(概率值)小于0.01。這表明該預測模型的擬合度較好,并通過了F檢驗,因變量與自變量之間存在真正的線性關系,因此該預測模型具有較高的有效性。其檢驗數據見表4。
表4 預測模型相關檢驗數據
模型(7)的誤差分析結果見表5。由表3可以看出2009—2012年廈門港的港口固定資產投資總額和海鐵聯(lián)運量出現(xiàn)突變,這種突變導致了2009—2012年廈門港集裝箱吞吐量預測值出現(xiàn)較大誤差。但預測模型計算得到的平均相對誤差為5%,這表明該預測模型具有較高的預測精度。
為預測2017—2019年廈門港集裝箱吞吐量,先應用GM(1,1)預測模型[11]預測典型因素在2017—2019年的數值,再將相關預測值代入模型(7),經計算可得2017—2019年廈門港集裝箱吞吐量的預測值,見表6。
表5 廈門港集裝箱吞吐量預測結果誤差分析
表6 2017—2019年廈門港集裝箱吞吐量預測值 萬TEU
從表6預測結果可得到,2017年廈門港集裝箱吞吐量將達到1 031萬TEU,突破全年千萬標箱的關口,未來3年的集裝箱吞吐量將以7%的增速平穩(wěn)增長。近年來廈門市投入大量資金重點扶持內貿集裝箱航線、國內國際中轉樞紐等,并進一步完善中歐班列和開展海鐵聯(lián)運,海鐵聯(lián)運量持續(xù)增加,保證了廈門港集裝箱吞吐量穩(wěn)定增長的勢頭。
通過系統(tǒng)聚類法將特征相似的影響因素放在同一類,將特征不同的影響因素放在不同的類,可得到彼此獨立且具有代表性的港口吞吐量典型影響因素。這樣既減少了影響因素的個數,簡化了預測模型,又不丟失對港口吞吐量有重要影響的因素,保證了預測結果的有效性,克服了傳統(tǒng)單一因素預測模型的弊端。通過對廈門港集裝箱吞吐量進行實例應用,驗證了港口吞吐量典型因素預測模型具有較高的有效性和預測精度,準確反映了廈門港集裝箱吞吐量變化的實際情況。腹地GDP值、港口固定資產投資總額和海鐵聯(lián)運量等3個典型因素與廈門港集裝箱吞吐量的發(fā)展密切相關,今后可作為廈門港集
裝箱吞吐量預測和規(guī)劃建設的一個重要參考,但仍需進一步對這三個典型因素的預測方法進行細化研究。
參考文獻:
[1] 張麗君, 劉佳駿. 中國沿海港口吞吐量內在影響因素研究[J]. 中國水運, 2008, 8(10): 18-19.
[2] 程文忠, 任鳳香, 周宣赤. SVM在九江港吞吐量預測中的應用研究[J]. 物流工程與管理, 2012, 34(9): 61-64. DOI: 10.3969/j.issn.1674-4993.2012.09.026.
[3] 戴霖, 黃浩, 黃倩盈, 等. 基于馬爾科夫模型的港口吞吐量預測[J]. 水運管理, 2014, 36(3): 18-22. DOI: 10.13340/j.jsm.2014.03.005.
[4] 范瑩瑩, 余思勤. 基于NARX神經網絡的港口集裝箱吞吐量預測[J]. 上海海事大學學報, 2015, 36(4): 1-5. DOI: 10.13340/j.jsmu.2015.04.001.
[5] 朱小檬, 欒維新, 朱義勝. 基于時間序列-因果關系結合法的中國海港集裝箱吞吐量中長期預測[J]. 大連海事大學學報(社會科學版), 2014, 13(5): 1-5.
[6] XIE Gang, WANG Shouyang, ZHAO Yingxue,etal. Hybrid approaches based on LSSVR model for container throughput forecasting: a comparative study[J]. Applied Soft Computing, 2013, 13(5): 2232-2241.
[7] GENG Jing, LI Mingwei, HONG Weichiang,etal. Port throughput forecasting by using PPPR with chaotic efficient genetic algorithms and CMA[C]//2015 IEEE International Conference on Systems, Man, and Cybernetics. Kowloon, China, 9-12 Oct 2015. IEEE, 2015: 1633-1638. DOI: 10.1109/SMC.2015.288.
[8] HUANG Anqiang, LAI Kinkeung, LI Yinhua,etal. Forecasting container throughput of Qingdao Port with a hybrid model[J]. Journal of Systems Science & Complexity, 2015, 28(1): 105-121. DOI: 10.1007/s11424-014-3188-4.
[9] 韓明. 應用多元統(tǒng)計分析[M]. 上海: 同濟大學出版社, 2013.
[10] 林連. 廈門港集裝箱吞吐量預測研究[D]. 武漢: 武漢理工大學, 2009.
[11] 姚天祥, 鞏在武. 灰色預測理論及其應用[M]. 北京: 科學出版社, 2014.