郭楊莉
摘 要:以福建省物流需求為研究對(duì)象,選取福建省1996—2015年貨物吞吐量、全社會(huì)固定資產(chǎn)投資總額、農(nóng)林牧漁總產(chǎn)值、進(jìn)出口商品總額、居民消費(fèi)水平、地區(qū)生產(chǎn)總值等統(tǒng)計(jì)數(shù)據(jù),基于多元線性回歸思路,診斷多重共線性。采用逐步回歸法,以SPSS軟件為工具, 建立貨物吞吐量與全社會(huì)固定資產(chǎn)投資總額以及進(jìn)出口商品總額的二元線性回歸模型。通過統(tǒng)計(jì)分析檢驗(yàn)?zāi)P偷挠行?,運(yùn)用貨物吞吐量觀測(cè)值與預(yù)測(cè)值的殘差及相對(duì)誤差檢驗(yàn)?zāi)P偷膶?shí)踐性。
關(guān)鍵詞:多元線性回歸 物流需求預(yù)測(cè) 逐步回歸 多重共線性 異方差
一、緒論
(一)研究背景及意義
區(qū)域物流是經(jīng)濟(jì)活動(dòng)的動(dòng)脈,是聯(lián)系生產(chǎn)和消費(fèi)的紐帶,是社會(huì)發(fā)展和人民生活水平提高的基礎(chǔ)條件,也是衡量一個(gè)國家現(xiàn)代化程度的重要標(biāo)準(zhǔn)之一。
早在2009年國務(wù)院就宣布了我國的十大產(chǎn)業(yè)振興規(guī)劃,其中就有物流產(chǎn)業(yè)。2011年3月,我國“十二五”規(guī)劃綱要中仍然將發(fā)展現(xiàn)代物流納入其中。可見,我國非常關(guān)注物流業(yè)。隨著地方政府紛紛采取促進(jìn)物流發(fā)展的相關(guān)措施,物流業(yè)得到了飛速發(fā)展。發(fā)展物流業(yè)是優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)和轉(zhuǎn)變發(fā)展方式的必要條件??梢蕴嵘?jīng)濟(jì)水平,壯大現(xiàn)代服務(wù)業(yè)的規(guī)模;可以降低企業(yè)成本,改善企業(yè)組織方式。由此可見,研究區(qū)域物流有著重大意義。
(二)貨運(yùn)量預(yù)測(cè)的國內(nèi)外研究現(xiàn)狀
在貨運(yùn)量預(yù)測(cè)方面,目前國內(nèi)外應(yīng)用的各種定性以及定量的方法已達(dá)上百種。主要的基本模型集中在時(shí)間序列法、回歸分析法、指數(shù)平滑法、神經(jīng)網(wǎng)絡(luò)法、灰色模型法、ARIMA法等方法上。
國外對(duì)貨運(yùn)預(yù)測(cè)方面的研究開展較早,所以國外關(guān)于貨運(yùn)量預(yù)測(cè)模型方面的研究比較多,其理論及實(shí)際經(jīng)驗(yàn)要遠(yuǎn)比國內(nèi)成熟.Gregory A.Godfrey和Warren B.Powell(2000)以指數(shù)平滑法為基礎(chǔ),提出了一系列預(yù)測(cè)方法,與ARIMA方法相比,這一系列的預(yù)測(cè)方法操作更為簡(jiǎn)單、易行,并且在預(yù)測(cè)方面有著更高的精確度。
國內(nèi)學(xué)者在貨運(yùn)量預(yù)測(cè)方面的研究相對(duì)較晚,但國內(nèi)關(guān)于貨運(yùn)量預(yù)測(cè)的研究成果也不少,如:郭玉華等人(2010)對(duì)經(jīng)濟(jì)周期階段參數(shù)的內(nèi)涵進(jìn)行闡述,并將經(jīng)濟(jì)周期進(jìn)行量化,作為一個(gè)輸入因素,建立基于經(jīng)濟(jì)周期的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,以我國1992-2008年鐵路貨運(yùn)量為實(shí)例,對(duì)預(yù)測(cè)模型進(jìn)行檢驗(yàn)。
二、實(shí)證分析
(一)模型指標(biāo)的選取
物流需求是指一定物流需求是指一定時(shí)期內(nèi)社會(huì)經(jīng)濟(jì)活動(dòng)對(duì)生產(chǎn)、流通、消費(fèi)領(lǐng)域的原材料、成品和半成品、商品以及廢舊物品、廢舊材料等的配置作用而產(chǎn)生的對(duì)物流在空間、時(shí)間和費(fèi)用方面的要求,涉及運(yùn)輸、庫存、包裝、裝卸搬運(yùn)、流通加工以及與之相關(guān)的信息需求等[16]。考慮到運(yùn)輸是現(xiàn)代物流體系的中心環(huán)節(jié), 以及獲取數(shù)據(jù)的完整性、一致性和時(shí)效性等方面因素,本文選取1996-2016年福建省統(tǒng)計(jì)年鑒上的數(shù)據(jù)作為樣本數(shù)據(jù),選取物流貨運(yùn)量(萬噸)為物流需求指標(biāo)Y,選取全社會(huì)固定資產(chǎn)投資總額X1(億元)、農(nóng)林牧漁總產(chǎn)值X2(億元)、進(jìn)出口商品總額X3(千萬美元)、居民消費(fèi)水平X4(元/人)、地區(qū)生產(chǎn)總值(億元)X5等5個(gè)因素為物流需求預(yù)測(cè)的經(jīng)濟(jì)指標(biāo)[17]。
(二)多重共線性診斷
多重共線性是指線性回歸模型中的解釋變量之間由于存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系而使模型估計(jì)失真或難以估計(jì)準(zhǔn)確。一般來說,由于數(shù)據(jù)的限制使得模型設(shè)計(jì)不當(dāng),導(dǎo)致設(shè)計(jì)矩陣中解釋變量間存在普遍的相關(guān)關(guān)系。完全共線性的情況并不多見,一般出現(xiàn)的是在一定程度上的共線性,即近似共線性。
在多元線性回歸模型中,自變量之間可能存在線性相關(guān)的關(guān)系,會(huì)使得系數(shù)估計(jì)的標(biāo)準(zhǔn)誤差增大,從而使得模型的預(yù)測(cè)精度大大降低。使用SPSS軟件全回歸法對(duì)所選取的指標(biāo)建立模型,結(jié)果顯示如下:
S=(7950.893) (0.878)(12.823)(0.736)(1.936)(2.945)
t=(2.051) (3.873)(0.597)(2.778)(1.342)(-1.186)
p=(0.058) (0.002) (0.560)(0.014)(0.200)(0.254)
F=(814.603) P=(0.000)
R2=0.996
n=21 (df=15)
結(jié)果發(fā)現(xiàn)模型整體是顯著的,但是對(duì)模型系數(shù)的檢驗(yàn)表明很多變量對(duì)“貨運(yùn)量”的影響并不顯著。由以上結(jié)果可知,t統(tǒng)計(jì)量與Sig值均不顯著。自變量之間很可能存在共線性的問題。計(jì)算各解釋變量的相關(guān)關(guān)系并進(jìn)行共線性診斷,從下表可以看出VIF遠(yuǎn)大于10,各解釋變量間存在嚴(yán)重的多重共線性,因此考慮改用多元逐步回歸法對(duì)物流需求與各經(jīng)濟(jì)指標(biāo)建立模型, 減少多重共線性對(duì)模型參數(shù)估計(jì)、模型誤差以及穩(wěn)定性等的影響。
(三) 多元逐步回歸
多元逐步回歸的基本思想是:對(duì)全部因子根據(jù)其對(duì)因變量Y影響程度的大?。雌貧w平方和R2值的大小),從大到小逐個(gè)地引入回歸方程,同時(shí)對(duì)回歸方程當(dāng)時(shí)所含的全部變量進(jìn)行統(tǒng)計(jì)檢驗(yàn),觀察其是否仍然顯著,如果不顯著就將其移出模型,直到回歸方程中所有的變量對(duì)因變量Y的作用都是顯著的,再考慮引入新的變量。再在剩余的未選因子中,選出對(duì)因變量Y的作用最大者,檢驗(yàn)其顯著性,若顯著則引入方程,若不顯著則不引入,直到最后再也沒有可以引入的顯著因子,也沒有不顯著的變量需要移除為止。 多元逐步回歸分析本質(zhì)上沒有新的理論,只是在多元線性回歸內(nèi)部運(yùn)用一些計(jì)算技巧獲得最優(yōu)的多元線性回歸方程,是實(shí)用且被廣泛應(yīng)用的統(tǒng)計(jì)分析方法。
在逐步回歸中,變量X5、X1、X3被逐個(gè)引入,在第三個(gè)模型中X5被移除,最終得到模型4。模型4解釋變量為X1、X3,模型整體顯著(R2=0.996,F(xiàn)=2085.824,Sig=0.000),模型系數(shù)檢驗(yàn)顯著。t1=15.973,Sig1=0.000;t2=7.324,Sig2=0.000,比較理想,同DW=1.976,模型不存在自相關(guān)性問題。解釋變量X1、X3的方差膨脹因子VIF=7.909,多重共線性問題已經(jīng)消除。
(四)物流需求預(yù)測(cè)模型
由表3中的模型4可得物流需求預(yù)測(cè)回歸模型為:
Y=24544.827+2.951x1+1.650x3
其中X1為社會(huì)固定資產(chǎn)投資總額,X3為進(jìn)出口商品總額(千萬美元)。模型整體檢驗(yàn)顯著、模型系數(shù)檢驗(yàn)顯著,具有一定的分析價(jià)值。由該模型計(jì)算得出1996-2016年物流貨運(yùn)量預(yù)測(cè)值,由表4可知少數(shù)年份殘差較大。標(biāo)準(zhǔn)化殘差正態(tài)曲線直方圖如圖1所示, 標(biāo)準(zhǔn)化殘差概率圖如圖2所示??梢钥闯鰳?biāo)準(zhǔn)化殘差呈正態(tài)分布,散點(diǎn)在直線上或下靠近直線,回歸方程滿足線性以及方差齊次的檢驗(yàn),物流需求預(yù)測(cè)模型通過了實(shí)踐檢驗(yàn)。
三、結(jié)論
基于1996-2016年福建省貨運(yùn)量及相關(guān)統(tǒng)計(jì)數(shù)據(jù)建立的多元線性回歸模型, 表明福建省貨運(yùn)量與全社會(huì)固定資產(chǎn)投資總額、進(jìn)出口商品總額表現(xiàn)出高度的相關(guān)性。農(nóng)林牧副漁總產(chǎn)值、居民消費(fèi)水平、地區(qū)生產(chǎn)總值等經(jīng)濟(jì)指標(biāo)與貨運(yùn)量也存在很強(qiáng)的相關(guān)關(guān)系, 但由于各變量間存在較強(qiáng)的多重共線性,在逐步回歸中被剔除。由偏邊際經(jīng)濟(jì)理論可知,在進(jìn)出口商品總額不變的情況下,全社會(huì)固定資產(chǎn)投資總額每增加1個(gè)單位,物流需求平均增長(zhǎng)2.95個(gè)單位;社會(huì)固定資產(chǎn)投資總額不變的情況下,進(jìn)出口商品總額每增加1個(gè)單位,物流需求平均增長(zhǎng)1.650個(gè)單位。從模型可以看出,全社會(huì)固定資產(chǎn)資對(duì)物流需求的影響較大。
參考文獻(xiàn)
[1].Gregory A. Godfrey, Warren B. Powell. Adaptive estimation of daily demands with complex calendar effects for freight transportation[J]. Transportation Research Part B, 2000, 34(6):451-469.
[2].郭玉華, 陳治亞, 馮芬玲,等. 基于經(jīng)濟(jì)周期的鐵路貨運(yùn)量神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)研究[J]. 鐵道學(xué)報(bào), 2010, 32(5):1-6.
[3]王治. 基于遺傳算法-支持向量機(jī)的鐵路貨運(yùn)量預(yù)測(cè)[J]. 計(jì)算機(jī)仿真, 2010,