姜百臣,馮凱杰,彭思喜
(華南農(nóng)業(yè)大學經(jīng)濟管理學院,廣東 廣州 510642)
中國是豬肉消費大國,豬肉占消費肉類的年均消費量(2000—2015年)為64.70%,是居民攝取動物蛋白的最重要來源,在中國始終具有不可替代性;但是,隨著城市與農(nóng)村消費結(jié)構(gòu)的劇烈變化,“價高傷民,價賤傷農(nóng)”的“豬周期”現(xiàn)象頻現(xiàn),對穩(wěn)定社會經(jīng)濟和人民生活產(chǎn)生較大的不利影響。因此,在“豬周期”中做出準確的價格預(yù)測,對于豬肉產(chǎn)業(yè)合理安排生產(chǎn)、銷售等前端生產(chǎn)活動和居民進行合理消費決策具有重要的指導(dǎo)意義和參考價值。
國內(nèi)外對豬肉和其他農(nóng)畜產(chǎn)品價格波動及常用的研究主要有兩類:一是價格波動機制研究。孫紅英等[1]以改進的投入產(chǎn)出價格影響模型測算發(fā)現(xiàn)豬肉價格波動對CPI籃子商品具有很強的帶動性。李俊青[2]運用Minot福利模型研究生豬養(yǎng)殖的糧食投入通過影響生豬供給量從而影響散養(yǎng)戶的生產(chǎn)福利。郭利京等[3]應(yīng)用市場微觀結(jié)構(gòu)理論分析生豬價格波動的原因,證實信息缺失和從眾行為是造成生豬周期性供求失衡的主要原因。王俊能等[4]采用EMD 和FFT 方法對中國的生豬產(chǎn)量波動周期進行分析,發(fā)現(xiàn)我國生豬產(chǎn)量變化率存在多尺度波動周期,但EMD方法對數(shù)據(jù)樣本長度要求高,容易產(chǎn)生模糊結(jié)果。梁俊芬等[5]運用CensusX12季節(jié)調(diào)整法和H-P濾波法研究生豬價格波動,顯示生豬價格長期呈非線性緩慢上升趨勢,受外部隨機因素沖擊較大。
二是價格預(yù)測研究方法。(1)計量統(tǒng)計和單一預(yù)測模型。Qu Hongquan等[6]通過M2與生豬產(chǎn)量的年增率對豬肉價格進行簡單的線性回歸預(yù)測;邱俊杰等[7]利用2009年4~5月豬肉價格日度數(shù)據(jù)構(gòu)建自回歸移動平均(ARMA)模型對中國豬肉價格進行短期預(yù)測;谷國玲等[8]通過改GM( 1,1)模型的背景值和運用M次累加的方法進行殘差校正,結(jié)果表明改進后GM( 1,1)的預(yù)測值精度更高。Zhang等[9]、羅軍等[10]從豬肉市場長期供求關(guān)系、周期性波動及外界因素等方面預(yù)測價格波動。周伍陽等[11]運用二次指數(shù)平滑法分析生豬價格波動周期及趨勢預(yù)測。(2)智能預(yù)測模型。張維宏[12]分析了廣東生豬養(yǎng)殖現(xiàn)狀,并利用灰色預(yù)測模型對廣東生豬出欄數(shù)量進行預(yù)測,結(jié)果顯示模型預(yù)測精度合格可信,但該模型還存在對歷史數(shù)據(jù)依賴的局限。平平等[13]將ANN、GM(1,1)和三次指數(shù)平滑等預(yù)測模型進行混合,并對吉林省生豬價格進行預(yù)測,結(jié)果表明組合預(yù)測比單項預(yù)測有明顯的精度改進。屠星月等[14]基于農(nóng)產(chǎn)品價格時間序列組合預(yù)測方法與RBF神經(jīng)網(wǎng)絡(luò)的集成預(yù)測模型,實現(xiàn)計量經(jīng)濟模型與智能模型方法在線性與非線性數(shù)據(jù)處理的互補效果,但RBF神經(jīng)網(wǎng)絡(luò)預(yù)測中的滯后期數(shù)會對預(yù)測結(jié)果產(chǎn)生影響。丁琳琳等[15]通過構(gòu)建支持向量機模型對生豬價格進行預(yù)測,較好地反映生豬價格及其影響因素之間的復(fù)雜的非線性關(guān)系。Li Zhe-min等[16]提出了一種基于遺傳算法的混沌神經(jīng)網(wǎng)絡(luò)模型豬肉價格的短期預(yù)測。
綜合國內(nèi)外研究,豬肉行情研究主要是價格波動機制及高精確預(yù)測工具兩個方向,但預(yù)測模型在研究中強調(diào)樣本統(tǒng)計特征,并沒有很好地體現(xiàn)出價格波動內(nèi)在的經(jīng)濟原理,加上現(xiàn)階段的預(yù)測模型存在一定缺陷,導(dǎo)致一般預(yù)測的結(jié)果與實際有較大偏差,以目前預(yù)測性能較好的支持向量機SVM為例,則會在預(yù)測過程中容易出現(xiàn)拐點及滯后問題。為此,本研究引入EEMD分解方法剖析“豬周期”價格波動原理,并結(jié)合遺傳算法(GA)優(yōu)化的支持向量機(SVM)預(yù)測模型EEMD-GA-SVM,為生產(chǎn)者與消費者提供理論依據(jù)和具有價值參考的實用預(yù)測工具,有助于防范豬價波動的周期風險。
采用2002年1月至2017年12月中華人民共和國農(nóng)業(yè)部畜牧業(yè)司官網(wǎng)(http://www.xmys.moa.gov.cn/)豬肉數(shù)據(jù)作為樣本數(shù)據(jù)建模。
EEMD的一般步驟:(1)在原始信號中加入均值為0,標準差0.1~0.4倍的白噪聲。(2)找出原信號x(t)的所有極值點,然后通過三次樣條函數(shù)擬合出極大值包絡(luò)線 e+(t)和極小值包絡(luò)線 e-(t)構(gòu)成一條均值包絡(luò)線m1(t):
將原信號序列減去m1(t)得到一個去掉低頻的新信號(t):
用原信號x(t)減去c1(t),得到一個去掉高頻成分的新信號r1(t):
(4)對r1(t)重復(fù)上述得到c1(t)的過程,得到第二個IMF分量c2(t),如此反復(fù),直到第n階IMF分量cn(t)或其余量rn(t)小于預(yù)設(shè)值,EMD分解過程終止。最后:
式中,rn(t)為趨勢項,x(t)為n個頻率從高到低的本征模態(tài)函數(shù) IMF。
(5)分別對原始信號加入不同的白噪聲,重復(fù)步驟(2)至步驟(4)。
(6)不斷重復(fù)以上流程N次,對次分解結(jié)果進行集成平均,視作最后的分解結(jié)果。利用統(tǒng)計方法控制加入的白噪聲:
SVM回歸思路:首先從最優(yōu)超平面出發(fā),給定訓練集樣本 {(x1,y1),…(xn,yn)},xiR,yi(+1,-1),在線性可分條件下得到:
式中,ω為超平面的權(quán)值向量;b為偏置項。
在線性不可分條件下,需要引入松弛變量ζi,加入松弛變量后的線性規(guī)劃問題表現(xiàn)形式為:
尋求目標函數(shù)變?yōu)椋?/p>
其中C為懲罰因子,用于權(quán)衡式(2.13)中的ζi值,避免因太大而降低解的質(zhì)量。
利用拉格朗日乘子將上式轉(zhuǎn)化為對偶形式并求解,得到SVM決策函數(shù):
式中,ai為拉格朗日乘子。
如果核函數(shù)k(xi,xj)能夠滿足Mercer條件,那么空間內(nèi)積高維運算非線性問題就可以解決。對應(yīng)的分類決策函數(shù)表示為:
式中,核函數(shù)k(xi,xj)為徑向基函數(shù)(RBF),是較常用的核函數(shù):
式中,g為核參數(shù)且g>0。
一般在基于RBF核函數(shù)的SVM算法中,懲罰系數(shù)C和核函數(shù)參數(shù)g分別刻畫的是對錯分樣本懲罰程度、支持向量之間的相關(guān)程度,前者決定了算法的魯棒,后者決定了算法的泛化能力;損失函數(shù)P的選取對SVM模型計算精度有很大影響,為進一步提升SVM的預(yù)測性能,本研究的參數(shù)尋優(yōu)組合為(C,g,p)。
遺傳算法(GA)是Holland 教授于1975年提出的一種優(yōu)化方法。本研究選用謝菲爾德大學Matlab遺傳工具箱,該工具箱編程相對靈活,功能齊全,應(yīng)用遺傳算法優(yōu)化支持向量機的主要步驟如下:
(1)編碼:將問題的解以適合于遺傳算法的表示,在交叉、變異等操作之前需進行,本研究選用最簡單的二進制編碼。
(2)初始化種群:按照設(shè)定規(guī)則生成一定數(shù)量的個體作為初始種群,由隨機生成的(C,g,p)組成。
(3)選定目標函數(shù)對初始種群進行回歸訓練,將訓練結(jié)果的均方誤差作為目標函數(shù)值,并計算每個個體的適應(yīng)度值。
(4)根據(jù)設(shè)定概率,在二進制編碼的條件下,對初始種群進行選擇、交叉、變異操作分別為輪盤賭選擇、單點交叉及二進制變異,進而得到新一代種群(C,g,p),并對新一代種群進行SVM回歸訓練。
(5)如果種群滿足終止規(guī)則,輸出適應(yīng)值最優(yōu)的個體作為最優(yōu)參數(shù)參與建模,進行回歸預(yù)測;則返回步驟(3),增加進化代數(shù)或減小適應(yīng)度精度繼續(xù)參與運算,直到滿足條件,運算終止。
有效分析豬肉價格的波動規(guī)律和捕捉到有用的價格信息是進行有效預(yù)測的重要前提,本研究構(gòu)建基于改進支持向量機預(yù)測主要包括3個流程(圖1):(1)通過EEMD方法分解出總數(shù)為T豬肉價格的樣本,獲得分量的平均周期作為“豬周期”L的參考依據(jù)。(2)前T-L個樣本豬肉價格作為輸出變量,前T-L玉米、豆粕和仔豬價格等作為訓練樣本輸入,獲得最優(yōu)的(C,g,p)參數(shù)組合,進行下一步預(yù)測。(3)以改進的SVM對輸入最后的L個玉米、豆粕和仔豬價格進行預(yù)測,得出最終L個豬肉價格預(yù)測值。
圖1 豬肉價格預(yù)測流程
采用學術(shù)研究中常用的3個綜合性預(yù)測評價指標,描述預(yù)測值與真實值之間平均誤差情況,能夠清晰反映預(yù)測值與真實值擬合度。各評價值結(jié)果越小,表明該預(yù)測模型精度越高。
(1)均方根誤差RMSE(Root Mean Squared Error),表示各數(shù)據(jù)偏離真實值的距離平方和的平均數(shù)開方觀測真實值與預(yù)測值的偏差。
式中,Xobs為真實值,Xmodel為模型預(yù)測值。
(2)絕對誤差平均MAE( Mean Absolute Error),表示所有單個觀測值與算術(shù)平均值的偏差絕對值的平均。
(3)Theil 不等系數(shù),反映預(yù)測值與真實值的擬合程度,當?shù)扔?時,表示完全擬合;當?shù)扔?時,表示完全不能擬合。
首先利用MATLAB的EEMD程序?qū)?80個豬肉價格數(shù)據(jù)樣本進行集成模態(tài)分解,最后獲得本征模函數(shù)IMF1~IMF6及趨勢項res(圖2)。
圖2 豬肉價格EEMD分解的IMF分量
(1)高頻分量IMF1~IMF3:高頻分量反映的是短期供給均衡導(dǎo)致價格波動,具有頻率大、噪聲高的特點,刻畫出短期價格波動的強度與持續(xù)時間,有助于養(yǎng)殖戶。其前段的豬肉價格分量較后段的價格分量平穩(wěn),也印證2008年后期供求失衡的情況出現(xiàn)的頻率較高,反映了豬價一輪下跌下一波暴漲的市場預(yù)期,長期以往對國內(nèi)肉食市場的健康發(fā)展帶來不利影響。
(2)低頻分量IMF4~IMF6:低頻分量反映了“豬周期”重大事件的影響,國內(nèi)的政策變化、疫病等都對豬肉價格產(chǎn)生較大的影響,也是推動豬肉價格趨勢成形的主因。由于政策變化、人工成本、飼料價格對整個養(yǎng)殖產(chǎn)業(yè)鏈持續(xù)且深刻的影響,直接影響生豬產(chǎn)量的起伏變化,例如,2006年的“藍耳病”、2014年中美關(guān)于豬肉的貿(mào)易摩擦,都對豬價產(chǎn)生較大的沖擊。
(3)趨勢項RES:長期價格趨勢是上漲的,豬肉是CPI上漲的原動力,反映出近幾年國內(nèi)高通脹的勢頭與豬價是同步發(fā)生的。隨著未來發(fā)展規(guī)?;c家庭養(yǎng)殖精致化,整個肉豬產(chǎn)業(yè)鏈將會完善,養(yǎng)殖業(yè)高質(zhì)量的發(fā)展是未來的大趨勢,也是保證豬肉價格合理性的關(guān)鍵。
透過EEMD分解的豬肉價格分量,以及豬肉價格的時間多尺度信息,包含“豬周期”的空間結(jié)構(gòu),基本反映了“母豬懷孕-產(chǎn)仔-育肥-市場銷售”的價格周期。
通過對EEMD分解結(jié)果進行分析,可以看到EEMD的IMF分量能較好地對應(yīng)時間多尺度特征,既豬肉價格在不同運動周期的細致規(guī)律。對同頻率的分量取其波動的平均周期對應(yīng)出“豬周期”,即高頻分量IMF1~IMF3的平均波動周期,以及低頻分量IMF4~IMF6的平均波動周期(圖3),由于趨勢項是一個完整的趨勢,是平滑的上升曲線,并不具有周期性。因此,本研究選擇高低分量與低頻分量的平均波動周期作為預(yù)測長度的標準。
圖3 高頻分量與低頻分量的平均波動周期
通過對頻率分量的谷峰、谷底的進行統(tǒng)計,分別獲得的波動周期分別是6個月的短“豬周期”L1,以及 20個月的長“豬周期”L2。明顯地,6個月的波動周期L1符合一般的生豬養(yǎng)殖到成品銷售的完整流程;而20個月表示的是考慮到政策變化、疫病的一個價格波動周期。因此,本研究的預(yù)測周期從短“豬周期”L1和長“豬周期”L2的基礎(chǔ)上進行價格預(yù)測。
利用MATLAB軟件的LIBSVM支持向量機回歸模型結(jié)合遺傳算法GA進行訓練和預(yù)測,利用EEMD分解獲得的高頻分量、低頻分量、res趨勢項輸入數(shù)據(jù)進行模型訓練,構(gòu)建出一個EEMD-GA-SVM模型。同時,為更精準反映出EEMD-GA-SVM模型的精準性和適用性,與GS-AVM、PSO-SVM、BP神經(jīng)網(wǎng)絡(luò)和ARIMA等常用預(yù)測模型進行橫向?qū)Ρ?,分別預(yù)測6個月度(2017年7~12月)的價格走勢,以及在長 “豬周期”20個月度(2016年4月~2017年12月)的價格走勢。
對2017年1~12月的價格進行預(yù)測,通過預(yù)測值和實際值之間平均絕對百分比誤差和均方根誤差等指標比較,結(jié)果顯示:
(1)EEMD-GA-SVM的預(yù)測性能表現(xiàn)最佳。從表1可以看出,神經(jīng)網(wǎng)絡(luò)BP-ANN在預(yù)測周期6個月時RMSE為1.99,在預(yù)測周期20個月時RMSE為2.97,其他兩個指標對比有明顯差異,說明BP-ANN訓練過程中出現(xiàn)了過學習的問題,無法很好地還原不同“豬”周期的運動規(guī)律;ARIMA模型RMSE和Theil系數(shù)偏差較大,對處理非線性的豬肉價格欠缺敏銳性,局限性明顯;而SVM的3個預(yù)測指標與BPANN的誤差偏離度差距不大,也印證過往農(nóng)產(chǎn)品價格研究中SVM模型存在拐點滯后的問題。
而EEMD-GA-SVM很好地克服其他模型的局限,整體預(yù)測精度較原生SVM和神經(jīng)網(wǎng)絡(luò)BP-ANN精度有較大提升,預(yù)測周期無論是6個月或20個月,其預(yù)測結(jié)果均達到較高置信水平,整體預(yù)測效果明顯優(yōu)于BP-ANN和ARIMA,反映出其泛化能力增強,預(yù)測誤差小,魯棒性強。因此,印證GA優(yōu)化的SVM模型結(jié)合EEMD方法預(yù)測生豬價格更可靠及適用性。
表1 豬肉集貿(mào)市場價格預(yù)測效果評價指標比較
(2)EEMD-GA-SVM能夠更清晰還原豬肉價格內(nèi)在波動規(guī)律。如圖4和圖5所示,6個月的短“豬周期”預(yù)測精度更精確,貼合豬肉真實的波動規(guī)律。短“豬”周期主要體現(xiàn)當養(yǎng)殖戶發(fā)現(xiàn)短期意外事件所導(dǎo)致的生豬行情轉(zhuǎn)變的反應(yīng),樣本數(shù)據(jù)表現(xiàn)出更強的非線性 ,而EEMD-GA-SVM模型能更為靈敏地捕捉到豬價短期波動特征?!伴L”豬周期為多個“短”豬周期編織而成的“價格蛛網(wǎng)”,響應(yīng)的時間跨度相對滯后,導(dǎo)致預(yù)測精度相對下沉,從以上4個預(yù)測模型的預(yù)測指標結(jié)果——長期預(yù)測精度遜于短期預(yù)期精度,反映的是經(jīng)濟效應(yīng)在時間與市場反應(yīng)之間的錯配,而與訓練樣本的數(shù)據(jù)量并不直接預(yù)測精度。
圖4 各個模型預(yù)測結(jié)果與真實值對比(預(yù)測周期6個月)
圖5 各個模型預(yù)測結(jié)果與真實值對比(預(yù)測周期20個月)
本研究嘗試引入EEMD方法對“豬周期”進行剖析理解,并運用GA方法全方位優(yōu)化SVM以提升預(yù)測結(jié)果的穩(wěn)定性和實用性,依據(jù)實證結(jié)果得到以下結(jié)論及啟示:
(1)根據(jù)EEMD方法挖掘出的“豬周期”具有實際經(jīng)濟意義,能挖掘出“豬周期”真實的內(nèi)在波動特征,并結(jié)合遺傳算法改進的支持向量模型對豬肉價格預(yù)測更為精準,深刻還原出豬肉價格波動的動態(tài)演變機制,具有較高的參考指導(dǎo)價值。
(2)生豬價格的影響因素眾多,且具有動態(tài)性,隨著時間的變化,這些影響因素的貢獻率可能發(fā)生變化,還可能出現(xiàn)新的影響因素。根據(jù)本研究結(jié)論,對于6個月的短“豬周期”的判斷及價格預(yù)測,相關(guān)部門在信息監(jiān)控預(yù)警調(diào)控調(diào)配更多資源,提高與養(yǎng)殖戶的合作力度,適時指導(dǎo)養(yǎng)殖戶調(diào)整生豬育肥周期。
(3)應(yīng)對20個月的長“豬周期”,由于歷史價格對未來價格有一定滯后性影響,建議政府部門將生豬價格指數(shù)保險融入政策性農(nóng)業(yè)保險巨災(zāi)風險準備金體系,從而分散和轉(zhuǎn)移由宏觀經(jīng)濟波動引起的長期性風險。
(4)通過運用GA方法全方位優(yōu)化SVM的EEMD方法為基礎(chǔ),可以建立足夠靈敏和穩(wěn)定的預(yù)警機制,有助于相關(guān)政府部門做出相關(guān)調(diào)控決策。