姚冠新等
摘要:針對農(nóng)產(chǎn)品價格序列非平穩(wěn)、非線性的特征,提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和支持向量機(jī)的短期農(nóng)產(chǎn)品價格組合預(yù)測方法。以全國蘋果批發(fā)價格的周度價格序列為研究對象,首先對價格序列進(jìn)行非平穩(wěn)、非線性檢驗(yàn);然后將價格序列分解成一系列具有不同特征尺度的分量;最后針對各分量的特點(diǎn)分別構(gòu)建支持向量機(jī)模型進(jìn)行預(yù)測,得到蘋果批發(fā)價格的預(yù)測值。研究結(jié)果表明,該預(yù)測模型能夠更好地追蹤農(nóng)產(chǎn)品價格的變化,其預(yù)測精度與BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型相比有顯著提高。
關(guān)鍵詞:農(nóng)產(chǎn)品;價格;經(jīng)驗(yàn)?zāi)B(tài)分解;支持向量機(jī);短期預(yù)測
中圖分類號: S11+4;F304.2文獻(xiàn)標(biāo)志碼: A文章編號:1002-1302(2014)09-0402-04
收稿日期:2013-12-13
基金項目:江蘇省社會科學(xué)重點(diǎn)項目(編號:13EYA003)。
作者簡介:姚冠新(1961—),男,江蘇啟東人,教授,博士生導(dǎo)師,研究方向?yàn)檗r(nóng)產(chǎn)品物流。E-mail:yaogx@ycit.cn。
通信作者:顧晴,碩士研究生,研究方向?yàn)檗r(nóng)產(chǎn)品價格預(yù)測。E-mail:guqing.ujs@foxmail.com。我國農(nóng)產(chǎn)品價格由于受供求變化、生產(chǎn)資料價格、勞動力成本、流通成本、自然氣候以及國際農(nóng)產(chǎn)品價格等多種因素影響,表現(xiàn)出短期波動大、非平穩(wěn)、非線性等特點(diǎn)[1]。來自物價部門的信息表明,2004—2012年,國際市場糧價年均波動幅度在20%左右,其中2008年、2012年出現(xiàn)過2次大幅度震蕩,全年的波動幅度在40%以上。農(nóng)產(chǎn)品價格的波動,不僅會影響農(nóng)業(yè)生產(chǎn)的發(fā)展、農(nóng)產(chǎn)品的流通、消費(fèi)和農(nóng)民的收入水平,而且會對整個社會經(jīng)濟(jì)生活的安定產(chǎn)生重大影響。2013年3月5日,溫家寶總理在十二屆全國人大一次會議上所作的《政府工作報告》中指出,保持物價總水平基本穩(wěn)定始終是宏觀調(diào)控的重要目標(biāo)。因此,開展農(nóng)產(chǎn)品價格短期預(yù)測,對有效指導(dǎo)農(nóng)民及時調(diào)整生產(chǎn)和規(guī)避市場風(fēng)險,提高政府部門對農(nóng)產(chǎn)品市場的調(diào)控效率、保障農(nóng)產(chǎn)品市場的有序穩(wěn)定具有重要意義[2]。
從國內(nèi)外研究動態(tài)來看,學(xué)者們在農(nóng)產(chǎn)品價格短期預(yù)測領(lǐng)域提出了多種有效預(yù)測方法,如回歸分析、指數(shù)平滑、自回歸移動平均模型(autoregressive integrated moving average,ARIMA)、條件異方差模型(autoregressive conditional heteroskedasticity,ARCH)、神經(jīng)網(wǎng)絡(luò)、模糊理論、組合模型等。
劉海清等建立了海南省芒果的價格指數(shù)平滑模型,結(jié)果表明該模型能夠有效地對價格曲線進(jìn)行擬合和預(yù)測[3]。李干瓊等基于價格序列數(shù)據(jù)的ADF檢驗(yàn)和ARCH效應(yīng)檢驗(yàn),結(jié)合2008—2009年間的731 d日價格數(shù)據(jù)分析,利用ARIMA、ARCH、廣義條件異方差模型(generalized auotregressive conditional heteroskedasticity,GARCH)等現(xiàn)代時間序列法,分別建立了西紅柿日批發(fā)價格預(yù)測模型,其中GARCH模型在預(yù)測中具有更高的精度[4]。董曉霞等通過平穩(wěn)性、季節(jié)性、趨勢性以及異方差等一系列檢驗(yàn)后,最終選擇了3種模型對我國鮮奶零售價格短期預(yù)測進(jìn)行了應(yīng)用模擬,結(jié)果顯示ARCH模型預(yù)測結(jié)果精確度最好,Holt-Winters無季節(jié)性模型穩(wěn)定性最好[5]。李哲敏等根據(jù)2000年3月至2009年9月的月度數(shù)據(jù),選出4個能夠及時、全面獲取數(shù)據(jù)的相關(guān)因子作為自變量因子,構(gòu)建了禽蛋市場價格短期預(yù)測模型,并對模型的有效性進(jìn)行相關(guān)檢驗(yàn)[6]。羅長壽采用蔬菜市場價格數(shù)據(jù)分別建立了BP神經(jīng)網(wǎng)絡(luò)模型、基于遺傳算法的神經(jīng)網(wǎng)絡(luò)模型、RBF神經(jīng)網(wǎng)絡(luò)模型,結(jié)果表明,集成預(yù)測模型效果優(yōu)于單一預(yù)測模型[7]。韓延杰提出了一種基于模糊信息粒化和遺傳算法的支持向量機(jī)(genetic algorithm-support vector machine,GA-SVM)農(nóng)產(chǎn)品價格預(yù)測模型,為提高預(yù)測精度,利用遺傳算法對支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化,實(shí)證分析表明該方法能對農(nóng)產(chǎn)品價格的變化范圍進(jìn)行有效地預(yù)測[8]。劉慧等根據(jù)HP和BP濾波方法分析價格波動的特征,利用ARIMA模型預(yù)測綠豆價格的短期走勢[9]。
綜上所述,農(nóng)產(chǎn)品價格短期預(yù)測的研究主要采用計量經(jīng)濟(jì)模型,但計量經(jīng)濟(jì)模型對于非線性時間序列的預(yù)測具有局限性,同時對于數(shù)據(jù)本身的條件限制較多,造成模型預(yù)測結(jié)果或多或少存在一些缺憾。由于人工神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性逼近能力,因此被廣泛應(yīng)用到價格短期預(yù)測中,但是人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度慢、容易陷入局部最小點(diǎn)、存在過擬合現(xiàn)象以及泛化能力較差等局限性使其難以達(dá)到預(yù)期精度[10]。經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)是一種處理非平穩(wěn)、非線性數(shù)據(jù)序列的新方法,能夠分解出研究對象在不同尺度上的波動信息。該方法從數(shù)據(jù)自身出發(fā),通過分析本征模態(tài)函數(shù)(intrinsic mode function,IMF)來揭示數(shù)據(jù)序列的內(nèi)在特征。相關(guān)研究表明,經(jīng)驗(yàn)?zāi)B(tài)分解可以很好地處理非平穩(wěn)、非線性序列,是提取數(shù)據(jù)序列趨勢的有效方法[11]。
經(jīng)驗(yàn)?zāi)B(tài)分解目前已經(jīng)在地球物理學(xué)、生物醫(yī)學(xué)、結(jié)構(gòu)分析、設(shè)備診斷等眾多自然科學(xué)領(lǐng)域得到了應(yīng)用;經(jīng)驗(yàn)?zāi)B(tài)分解在社科領(lǐng)域僅涉及原油價格和股票價格的預(yù)測[12]。本研究將經(jīng)驗(yàn)?zāi)B(tài)分解方法引入到農(nóng)產(chǎn)品價格短期預(yù)測中,旨在突破農(nóng)產(chǎn)品價格預(yù)測技術(shù),提高預(yù)測精度。
1材料與方法
1.1經(jīng)驗(yàn)?zāi)B(tài)分解方法
經(jīng)驗(yàn)?zāi)B(tài)分解方法的優(yōu)點(diǎn)是能夠?qū)Ψ蔷€性、非平穩(wěn)過程的數(shù)據(jù)進(jìn)行線性化和平穩(wěn)化處理,分解的最終函數(shù)彼此之間是正交的,從而在分解的過程中盡可能地保留了數(shù)據(jù)本身的特性[13]。其基本思路是用波動上、下包絡(luò)的平均值去確定“瞬時平衡位置”,進(jìn)而提取出內(nèi)在模函數(shù)(intrinsic mode function,IMF)[14]。內(nèi)在模函數(shù),記為I(t),其計算過程主要有以下3個步驟。endprint
(1)找出原序列Y(t)的各個局部極大值,為更好保留原序列的特性,局部極大值定義為時間序列中的某個時刻的值,其前一時刻的值不比它大,后一時刻的值也不比它大。然后用三階樣條函數(shù)進(jìn)行插值,得到原序列Y(t)的上包絡(luò)序列值Ymax(t)。同理,可以得到下包絡(luò)序列值Ymin(t)。
對于不同的數(shù)據(jù)序列,h(t)可能是內(nèi)在模函數(shù),也可能不是。若h(t)中極值點(diǎn)的數(shù)目和跨零點(diǎn)的數(shù)目相等或至多只差1個,并且各個瞬時平均值m(t)都等于零,則它就是內(nèi)在模函數(shù);反之,把h(t)當(dāng)作原序列,重復(fù)以上步驟,直至滿足內(nèi)在模函數(shù)的定義,求出內(nèi)在模函數(shù)為止。求出了第一個內(nèi)在模函數(shù)I1(t),即從原序列中分解出第1個分量。然后,用原序列減去I1(t),得到剩余值序列r1(t):
r1(t)=Y(t)-I1(t)。(3)
至此,提取第1個內(nèi)在模函數(shù)的過程全部完成。然后,把r1(t)作為一個新的原序列,按照以上步驟,依次提取第 2、第 3,…,直至第N個內(nèi)在模函數(shù)IN(t)。之后,由于rN(t)變成一個單調(diào)序列,再也沒有內(nèi)在模函數(shù)能被提取出來。如果把分解后的各分量合并起來,就得到原序列Y(t):
1.2支持向量機(jī)方法
支持向量機(jī)(support vector machine,SVM)是Cortes和Vapnik于1995年首先提出的,它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中。支持向量機(jī)的基本思想是通過用內(nèi)積函數(shù)定義的非線性變換將輸入空間變換到一個高維空間,在這個高維空間中尋找輸入變量和輸出變量之間的一種非線性關(guān)系。SVM有嚴(yán)格的理論基礎(chǔ),是基于結(jié)構(gòu)風(fēng)險最小化原則的方法,明顯優(yōu)于傳統(tǒng)的基于經(jīng)驗(yàn)風(fēng)險最小化原則的常規(guī)神經(jīng)網(wǎng)絡(luò)方法。
給定一數(shù)據(jù)集G={(xi,di)}ni=1,其中xi是輸入向量,di是期望值,n是訓(xùn)練樣本個數(shù),需要求解的回歸函數(shù)如下形式:
1.3EMD-SVM農(nóng)產(chǎn)品價格預(yù)測方法
農(nóng)產(chǎn)品價格序列具有較強(qiáng)的非線性、非平穩(wěn)的特點(diǎn),而常規(guī)預(yù)測方法在非線性序列上難以取得較好的效果,鑒于EMD分解方法在處理非線性、非平穩(wěn)數(shù)據(jù)具有突出優(yōu)勢,因此提出了一種基于EMD-SVM的農(nóng)產(chǎn)品價格短期預(yù)測方法,具體方法如下:
(1)利用EMD方法對農(nóng)產(chǎn)品價格原始序列進(jìn)行分解,得到若干個IMF分量Ii(t)和殘差項;
(2)分別對歸一化處理后的各IMF分量Ii(t)和殘差項rN(t) 建立SVM回歸模型,選取最佳參數(shù)和核函數(shù)進(jìn)行預(yù)測;
(3)對預(yù)測結(jié)果進(jìn)行反歸一化處理,得到各分解序列的預(yù)測值;
(4)將各分解序列預(yù)測值疊加得到農(nóng)產(chǎn)品價格的預(yù)測值;
(5)與實(shí)際值比較,確定誤差指標(biāo)并進(jìn)行誤差分析。
2結(jié)果與分析
2.1數(shù)據(jù)來源說明
本研究選取蘋果批發(fā)市場價格數(shù)據(jù)為分析對象,數(shù)據(jù)來源于商務(wù)部的商務(wù)預(yù)報網(wǎng)站(http://cif.mofcom.gov.cn/),數(shù)據(jù)類型為周數(shù)據(jù)。數(shù)據(jù)周期為2006年7月7日至 2013 年 5月 31 日,共360個樣本數(shù)據(jù)。描述性統(tǒng)計情況見表1,數(shù)據(jù)分布見圖1。
2.2非平穩(wěn)、非線性檢驗(yàn)
由表2可知,t統(tǒng)計量>10% 水平,不能拒絕原假設(shè),即認(rèn)為蘋果批發(fā)價格時間序列是非平穩(wěn)的,進(jìn)一步驗(yàn)證該序列一階單整。對一階差分后的序列作自相關(guān)、偏自相關(guān)分析,發(fā)現(xiàn)自相關(guān)系數(shù)4階截尾,偏自相關(guān)系數(shù)3階截尾,建立 ARIMA(3,1,4) 模型。剔除不顯著變量,得到方程:endprint
(1)找出原序列Y(t)的各個局部極大值,為更好保留原序列的特性,局部極大值定義為時間序列中的某個時刻的值,其前一時刻的值不比它大,后一時刻的值也不比它大。然后用三階樣條函數(shù)進(jìn)行插值,得到原序列Y(t)的上包絡(luò)序列值Ymax(t)。同理,可以得到下包絡(luò)序列值Ymin(t)。
對于不同的數(shù)據(jù)序列,h(t)可能是內(nèi)在模函數(shù),也可能不是。若h(t)中極值點(diǎn)的數(shù)目和跨零點(diǎn)的數(shù)目相等或至多只差1個,并且各個瞬時平均值m(t)都等于零,則它就是內(nèi)在模函數(shù);反之,把h(t)當(dāng)作原序列,重復(fù)以上步驟,直至滿足內(nèi)在模函數(shù)的定義,求出內(nèi)在模函數(shù)為止。求出了第一個內(nèi)在模函數(shù)I1(t),即從原序列中分解出第1個分量。然后,用原序列減去I1(t),得到剩余值序列r1(t):
r1(t)=Y(t)-I1(t)。(3)
至此,提取第1個內(nèi)在模函數(shù)的過程全部完成。然后,把r1(t)作為一個新的原序列,按照以上步驟,依次提取第 2、第 3,…,直至第N個內(nèi)在模函數(shù)IN(t)。之后,由于rN(t)變成一個單調(diào)序列,再也沒有內(nèi)在模函數(shù)能被提取出來。如果把分解后的各分量合并起來,就得到原序列Y(t):
1.2支持向量機(jī)方法
支持向量機(jī)(support vector machine,SVM)是Cortes和Vapnik于1995年首先提出的,它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中。支持向量機(jī)的基本思想是通過用內(nèi)積函數(shù)定義的非線性變換將輸入空間變換到一個高維空間,在這個高維空間中尋找輸入變量和輸出變量之間的一種非線性關(guān)系。SVM有嚴(yán)格的理論基礎(chǔ),是基于結(jié)構(gòu)風(fēng)險最小化原則的方法,明顯優(yōu)于傳統(tǒng)的基于經(jīng)驗(yàn)風(fēng)險最小化原則的常規(guī)神經(jīng)網(wǎng)絡(luò)方法。
給定一數(shù)據(jù)集G={(xi,di)}ni=1,其中xi是輸入向量,di是期望值,n是訓(xùn)練樣本個數(shù),需要求解的回歸函數(shù)如下形式:
1.3EMD-SVM農(nóng)產(chǎn)品價格預(yù)測方法
農(nóng)產(chǎn)品價格序列具有較強(qiáng)的非線性、非平穩(wěn)的特點(diǎn),而常規(guī)預(yù)測方法在非線性序列上難以取得較好的效果,鑒于EMD分解方法在處理非線性、非平穩(wěn)數(shù)據(jù)具有突出優(yōu)勢,因此提出了一種基于EMD-SVM的農(nóng)產(chǎn)品價格短期預(yù)測方法,具體方法如下:
(1)利用EMD方法對農(nóng)產(chǎn)品價格原始序列進(jìn)行分解,得到若干個IMF分量Ii(t)和殘差項;
(2)分別對歸一化處理后的各IMF分量Ii(t)和殘差項rN(t) 建立SVM回歸模型,選取最佳參數(shù)和核函數(shù)進(jìn)行預(yù)測;
(3)對預(yù)測結(jié)果進(jìn)行反歸一化處理,得到各分解序列的預(yù)測值;
(4)將各分解序列預(yù)測值疊加得到農(nóng)產(chǎn)品價格的預(yù)測值;
(5)與實(shí)際值比較,確定誤差指標(biāo)并進(jìn)行誤差分析。
2結(jié)果與分析
2.1數(shù)據(jù)來源說明
本研究選取蘋果批發(fā)市場價格數(shù)據(jù)為分析對象,數(shù)據(jù)來源于商務(wù)部的商務(wù)預(yù)報網(wǎng)站(http://cif.mofcom.gov.cn/),數(shù)據(jù)類型為周數(shù)據(jù)。數(shù)據(jù)周期為2006年7月7日至 2013 年 5月 31 日,共360個樣本數(shù)據(jù)。描述性統(tǒng)計情況見表1,數(shù)據(jù)分布見圖1。
2.2非平穩(wěn)、非線性檢驗(yàn)
由表2可知,t統(tǒng)計量>10% 水平,不能拒絕原假設(shè),即認(rèn)為蘋果批發(fā)價格時間序列是非平穩(wěn)的,進(jìn)一步驗(yàn)證該序列一階單整。對一階差分后的序列作自相關(guān)、偏自相關(guān)分析,發(fā)現(xiàn)自相關(guān)系數(shù)4階截尾,偏自相關(guān)系數(shù)3階截尾,建立 ARIMA(3,1,4) 模型。剔除不顯著變量,得到方程:endprint
(1)找出原序列Y(t)的各個局部極大值,為更好保留原序列的特性,局部極大值定義為時間序列中的某個時刻的值,其前一時刻的值不比它大,后一時刻的值也不比它大。然后用三階樣條函數(shù)進(jìn)行插值,得到原序列Y(t)的上包絡(luò)序列值Ymax(t)。同理,可以得到下包絡(luò)序列值Ymin(t)。
對于不同的數(shù)據(jù)序列,h(t)可能是內(nèi)在模函數(shù),也可能不是。若h(t)中極值點(diǎn)的數(shù)目和跨零點(diǎn)的數(shù)目相等或至多只差1個,并且各個瞬時平均值m(t)都等于零,則它就是內(nèi)在模函數(shù);反之,把h(t)當(dāng)作原序列,重復(fù)以上步驟,直至滿足內(nèi)在模函數(shù)的定義,求出內(nèi)在模函數(shù)為止。求出了第一個內(nèi)在模函數(shù)I1(t),即從原序列中分解出第1個分量。然后,用原序列減去I1(t),得到剩余值序列r1(t):
r1(t)=Y(t)-I1(t)。(3)
至此,提取第1個內(nèi)在模函數(shù)的過程全部完成。然后,把r1(t)作為一個新的原序列,按照以上步驟,依次提取第 2、第 3,…,直至第N個內(nèi)在模函數(shù)IN(t)。之后,由于rN(t)變成一個單調(diào)序列,再也沒有內(nèi)在模函數(shù)能被提取出來。如果把分解后的各分量合并起來,就得到原序列Y(t):
1.2支持向量機(jī)方法
支持向量機(jī)(support vector machine,SVM)是Cortes和Vapnik于1995年首先提出的,它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中。支持向量機(jī)的基本思想是通過用內(nèi)積函數(shù)定義的非線性變換將輸入空間變換到一個高維空間,在這個高維空間中尋找輸入變量和輸出變量之間的一種非線性關(guān)系。SVM有嚴(yán)格的理論基礎(chǔ),是基于結(jié)構(gòu)風(fēng)險最小化原則的方法,明顯優(yōu)于傳統(tǒng)的基于經(jīng)驗(yàn)風(fēng)險最小化原則的常規(guī)神經(jīng)網(wǎng)絡(luò)方法。
給定一數(shù)據(jù)集G={(xi,di)}ni=1,其中xi是輸入向量,di是期望值,n是訓(xùn)練樣本個數(shù),需要求解的回歸函數(shù)如下形式:
1.3EMD-SVM農(nóng)產(chǎn)品價格預(yù)測方法
農(nóng)產(chǎn)品價格序列具有較強(qiáng)的非線性、非平穩(wěn)的特點(diǎn),而常規(guī)預(yù)測方法在非線性序列上難以取得較好的效果,鑒于EMD分解方法在處理非線性、非平穩(wěn)數(shù)據(jù)具有突出優(yōu)勢,因此提出了一種基于EMD-SVM的農(nóng)產(chǎn)品價格短期預(yù)測方法,具體方法如下:
(1)利用EMD方法對農(nóng)產(chǎn)品價格原始序列進(jìn)行分解,得到若干個IMF分量Ii(t)和殘差項;
(2)分別對歸一化處理后的各IMF分量Ii(t)和殘差項rN(t) 建立SVM回歸模型,選取最佳參數(shù)和核函數(shù)進(jìn)行預(yù)測;
(3)對預(yù)測結(jié)果進(jìn)行反歸一化處理,得到各分解序列的預(yù)測值;
(4)將各分解序列預(yù)測值疊加得到農(nóng)產(chǎn)品價格的預(yù)測值;
(5)與實(shí)際值比較,確定誤差指標(biāo)并進(jìn)行誤差分析。
2結(jié)果與分析
2.1數(shù)據(jù)來源說明
本研究選取蘋果批發(fā)市場價格數(shù)據(jù)為分析對象,數(shù)據(jù)來源于商務(wù)部的商務(wù)預(yù)報網(wǎng)站(http://cif.mofcom.gov.cn/),數(shù)據(jù)類型為周數(shù)據(jù)。數(shù)據(jù)周期為2006年7月7日至 2013 年 5月 31 日,共360個樣本數(shù)據(jù)。描述性統(tǒng)計情況見表1,數(shù)據(jù)分布見圖1。
2.2非平穩(wěn)、非線性檢驗(yàn)
由表2可知,t統(tǒng)計量>10% 水平,不能拒絕原假設(shè),即認(rèn)為蘋果批發(fā)價格時間序列是非平穩(wěn)的,進(jìn)一步驗(yàn)證該序列一階單整。對一階差分后的序列作自相關(guān)、偏自相關(guān)分析,發(fā)現(xiàn)自相關(guān)系數(shù)4階截尾,偏自相關(guān)系數(shù)3階截尾,建立 ARIMA(3,1,4) 模型。剔除不顯著變量,得到方程:endprint