喻勝華 龔尚花
摘 要 :首先利用Lasso方法在影響糧食價(jià)格波動(dòng)的眾多因素中選出了糧食儲(chǔ)備、糧食生產(chǎn)成本、糧食產(chǎn)量、糧食政策、生產(chǎn)需求、貿(mào)易需求、心理預(yù)期等7個(gè)主要影響因素;然后在Lasso變量選擇的基礎(chǔ)上利用支持向量機(jī)進(jìn)行糧食價(jià)格的回歸與預(yù)測(cè),同時(shí),把Lasso、支持向量機(jī)、Lasso-支持向量機(jī)及ARIMA方法的擬合預(yù)測(cè)效果進(jìn)行比較,實(shí)證結(jié)果表明,Lasso-支持向量機(jī)組合方法的擬合預(yù)測(cè)效果要優(yōu)于另外三種方法。
關(guān)鍵詞:糧食價(jià)格預(yù)測(cè);影響因素;Lasso;支持向量機(jī)
中圖分類號(hào):F069
一、引言及文獻(xiàn)綜述
糧食作為一種基礎(chǔ)產(chǎn)品,其價(jià)格的波動(dòng)會(huì)對(duì)我國(guó)糧食生產(chǎn)、糧食相關(guān)產(chǎn)品的進(jìn)出口以及國(guó)家宏觀經(jīng)濟(jì)調(diào)控產(chǎn)生深遠(yuǎn)影響,關(guān)系到消費(fèi)者和生產(chǎn)者的切身利益。深刻了解和剖析影響糧食價(jià)格波動(dòng)的各種因素,在此基礎(chǔ)上建立相關(guān)的預(yù)測(cè)模型分析和預(yù)測(cè)糧食價(jià)格的變化趨勢(shì),有助于有關(guān)職能部門調(diào)控糧食價(jià)格并制定相應(yīng)的措施,從而正確引導(dǎo)糧食市場(chǎng)的健康運(yùn)行、保障糧食產(chǎn)品的供求平衡。
目前,國(guó)內(nèi)外關(guān)于糧食價(jià)格預(yù)測(cè)研究的方法主要有定性和定量?jī)纱箢?,在定性分析方面,朱險(xiǎn)峰 [1]所做的系列價(jià)格預(yù)測(cè)研究比較有代表性,他通過(guò)分析庫(kù)存、產(chǎn)量、國(guó)際市場(chǎng)上糧食價(jià)格的變動(dòng)等一些影響因素,研究我國(guó)糧食價(jià)格的波動(dòng)趨勢(shì),進(jìn)而預(yù)測(cè)糧食的現(xiàn)貨價(jià)格和期貨價(jià)格。在定量分析方面,主要采用的是普通時(shí)間序列分析方法,其中最具代表性的是ARIMA方法,姚霞等[2]利用ARIMA模型并以青椒價(jià)格為例預(yù)測(cè)了時(shí)鮮農(nóng)產(chǎn)品價(jià)格的動(dòng)態(tài)變化;桂文林等[3]采用X-12-ARIMA模型分解我國(guó)糧食消費(fèi)價(jià)格月度定基指數(shù),得到了趨勢(shì)循環(huán)、季節(jié)和不規(guī)則因素,進(jìn)而分析了糧食價(jià)格的季節(jié)特征及其深層成因;陳兆榮等[4]利用ARIMA-SVM組合模型并結(jié)合1999-2011年我國(guó)農(nóng)產(chǎn)品價(jià)格指數(shù)月度數(shù)據(jù)對(duì)我國(guó)農(nóng)產(chǎn)品價(jià)格進(jìn)行了預(yù)測(cè)。其他時(shí)間序列方法也有所應(yīng)用,如苗開(kāi)超[5]運(yùn)用指數(shù)平滑模型對(duì)農(nóng)產(chǎn)品價(jià)格進(jìn)行了預(yù)測(cè);劉家富等[6]利用向量自回歸模型分析了國(guó)內(nèi)大豆以及豆油市場(chǎng)的價(jià)格傳導(dǎo)機(jī)制。除此之外,神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等方法也得到了不同程度的應(yīng)用,如彭琳[7]利用NARX神經(jīng)網(wǎng)絡(luò)方法對(duì)云南省的農(nóng)產(chǎn)品價(jià)格進(jìn)行了預(yù)測(cè);孫超等[8]分析了我國(guó)糧食價(jià)格波動(dòng)的主要影響因素,并利用支持向量機(jī)(SVM)方法建立了我國(guó)糧食價(jià)格的預(yù)測(cè)模型。支持向量機(jī)是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則提出來(lái)的一種統(tǒng)計(jì)學(xué)習(xí)方法,該方法一改傳統(tǒng)方法的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,從而使其有更好的泛化能力,尤其是較好地解決了小樣本、非線性、過(guò)擬合和局部極小等幾類常見(jiàn)的問(wèn)題。我們知道,糧食價(jià)格數(shù)據(jù)是典型的小樣本數(shù)據(jù),而且,影響糧食價(jià)格的眾多因素之間也存在著不確定性和非線性的關(guān)系,所以可以采用支持向量機(jī)方法進(jìn)行預(yù)測(cè),但是影響糧食價(jià)格的因素很多,各個(gè)影響因素之間可能會(huì)存在嚴(yán)重的多重共線性,如果不加選擇地引入眾多影響因素來(lái)進(jìn)行糧食價(jià)格的預(yù)測(cè),往往不能取得良好的預(yù)測(cè)效果。一個(gè)理想的模型應(yīng)該是既不遺漏重要的自變量,也不包含沒(méi)有影響或影響很小的自變量,過(guò)多地引入變量不僅會(huì)大大增加計(jì)算量,也會(huì)降低估計(jì)和預(yù)測(cè)精度。
雖然支持向量機(jī)方法比較適合處理具有非線性關(guān)系的小樣本數(shù)據(jù),但是不能進(jìn)行變量選擇,而Lasso方法可以同時(shí)進(jìn)行參數(shù)估計(jì)和變量選擇,Lasso方法本質(zhì)上還是線性回歸方法,它不適合處理非線性問(wèn)題,所以,本文提出了基于Lasso與支持向量機(jī)的糧食價(jià)格組合預(yù)測(cè)方法。首先利用Lasso方法對(duì)糧食價(jià)格波動(dòng)的影響因素進(jìn)行選擇,剔除與糧食價(jià)格不相關(guān)或相關(guān)性很小的變量數(shù)據(jù),以達(dá)到降低數(shù)據(jù)維數(shù)的目的;然后利用支持向量機(jī)的非線性運(yùn)算能力,逼近歷史數(shù)據(jù)所隱含的函數(shù)關(guān)系,完成對(duì)糧食價(jià)格的擬合和預(yù)測(cè),同時(shí),把Lasso、SVM、Lasso-SVM及ARIMA方法的擬合預(yù)測(cè)效果進(jìn)行比較。
二、Lasso及支持向量機(jī)方法
1. Lasso方法
Lasso方法(最小絕對(duì)值壓縮與選擇方法)是Tibshirani.R[9]在1996年提出來(lái)的一種的有偏估計(jì)方法,其本質(zhì)是通過(guò)添加約束條件對(duì)模型系數(shù)進(jìn)行壓縮,將沒(méi)有影響或影響較小的自變量的回歸系數(shù)自動(dòng)壓縮到零,這不僅在一定程度上能消除多重共線性的影響,而且在對(duì)參數(shù)進(jìn)行估計(jì)的同時(shí)也實(shí)現(xiàn)了對(duì)變量的選擇。
三、建模與實(shí)證分析
1. 數(shù)據(jù)來(lái)源及變量選擇
根據(jù)經(jīng)濟(jì)學(xué)理論及已有的研究結(jié)論,我們從糧食儲(chǔ)備、糧食生產(chǎn)成本、糧食產(chǎn)量、糧食政策、生活需求、生產(chǎn)需求、貿(mào)易需求、心理預(yù)期以及外部沖擊等9個(gè)方面共選取了21個(gè)變量[13-16]。具體如下:用糧食類零售價(jià)格指數(shù)代表糧食價(jià)格;用糧食庫(kù)存量x1、期末庫(kù)存消費(fèi)比x2反映糧食儲(chǔ)備;用糧食生產(chǎn)價(jià)格指數(shù)x3反映糧食生產(chǎn)成本;用總產(chǎn)量x4、 糧食作物播種面積x5、成災(zāi)面積x6反映糧食產(chǎn)量;用農(nóng)業(yè)支出x7、農(nóng)業(yè)支出占財(cái)政支出的比重x8反映糧食政策;用城鎮(zhèn)居民人均可支配收入x9、農(nóng)村居民家庭人均純收入x10、城鎮(zhèn)居民人均糧食消費(fèi)x11、農(nóng)村居民人均糧食消費(fèi)x12反映生活需求;用農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)x13、國(guó)內(nèi)生產(chǎn)總值指數(shù)x14、世界能源價(jià)格指數(shù)x15反映生產(chǎn)需求;用糧食凈進(jìn)口x16、人民幣對(duì)美元匯率x17反映貿(mào)易需求;用上一期真實(shí)糧價(jià)增長(zhǎng)率x18、貨幣和準(zhǔn)貨幣(M2)供應(yīng)量x19反映心理預(yù)期;用同期通貨膨脹率x20、世界谷物價(jià)格指數(shù)x21反映外部沖擊。
本文選取的數(shù)據(jù)區(qū)間是1978-2013年,糧食庫(kù)存量、期末庫(kù)存消費(fèi)比數(shù)據(jù)根據(jù)美國(guó)農(nóng)業(yè)部信息網(wǎng)數(shù)據(jù)計(jì)算得出;糧食生產(chǎn)成本數(shù)據(jù)來(lái)自《全國(guó)農(nóng)產(chǎn)品成本收益匯編》;世界谷物價(jià)格指數(shù)、世界能源價(jià)格指數(shù)數(shù)據(jù)來(lái)自世界銀行數(shù)據(jù)庫(kù);農(nóng)業(yè)支出、農(nóng)業(yè)支出占財(cái)政支出的比重、城鎮(zhèn)居民人均糧食消費(fèi)、農(nóng)村居民人均糧食消費(fèi)數(shù)據(jù)來(lái)自中國(guó)農(nóng)村統(tǒng)計(jì)年鑒;其他數(shù)據(jù)均來(lái)自《中國(guó)統(tǒng)計(jì)年鑒》。
2. 基于Lasso回歸的變量選擇
首先把數(shù)據(jù)進(jìn)行中心標(biāo)準(zhǔn)化處理,以消除不同指標(biāo)量綱的影響,接下來(lái)運(yùn)用lasso方法對(duì)選取的21個(gè)指標(biāo)進(jìn)行參數(shù)估計(jì)與變量選擇,只需要29步,就可以得到全部的lasso解。從圖1可以看出,當(dāng)參數(shù)s很小時(shí),變量均未被選入模型中,隨著s的不斷增大,變量依次進(jìn)入模型,當(dāng)s=1時(shí),變量全部進(jìn)入模型。
湖南大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2016年1期