劉合兵,韓晶晶,2,莊晨輝,2,鄭光,2,席磊,2,張紅陽(yáng)
(1.河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院,河南 鄭州 450046;2.農(nóng)田監(jiān)測(cè)與控制河南省工程實(shí)驗(yàn)室,河南 鄭州 450046)
農(nóng)業(yè)是關(guān)乎國(guó)計(jì)民生的基礎(chǔ)性產(chǎn)業(yè),農(nóng)產(chǎn)品價(jià)格的穩(wěn)定對(duì)中國(guó)國(guó)民經(jīng)濟(jì)具有重要影響。當(dāng)前,相關(guān)價(jià)格調(diào)控政策主要針對(duì)耐存儲(chǔ)的大米、小麥、棉花等大宗農(nóng)產(chǎn)品,涉及具有高度易腐蝕的鮮瓜果蔬菜卻少之甚少[1]?,F(xiàn)實(shí)生活中,蔬菜價(jià)格受到市場(chǎng)供需不平衡、種植運(yùn)輸成本、天氣變化以及特殊節(jié)假日等諸多因素影響,其價(jià)格序列表現(xiàn)出頻繁的波動(dòng)性,也為蔬菜價(jià)格的預(yù)測(cè)帶來(lái)挑戰(zhàn)。本研究通過(guò)對(duì)蔬菜價(jià)格進(jìn)行波動(dòng)特征分析,開(kāi)展價(jià)格預(yù)測(cè)研究,可為經(jīng)營(yíng)者提供前瞻性信息,調(diào)整生產(chǎn)銷售思路,也為相關(guān)部門(mén)提高市場(chǎng)風(fēng)險(xiǎn)規(guī)避能力[2]。
圍繞農(nóng)產(chǎn)品價(jià)格,國(guó)內(nèi)外開(kāi)展了廣泛研究,目前主要涉及價(jià)格的波動(dòng)特征及其規(guī)律的研究、影響因素的研究和價(jià)格預(yù)測(cè)方面的研究。首先,關(guān)于價(jià)格波動(dòng)特征及其規(guī)律的研究,學(xué)者們分別提出關(guān)于生產(chǎn)和商品價(jià)格的波動(dòng),形成蛛網(wǎng)理論的雛形,為農(nóng)產(chǎn)品價(jià)格的研究奠定基礎(chǔ)。其次,關(guān)于影響因素的研究,供給和需求是影響農(nóng)產(chǎn)品價(jià)格變動(dòng)的根本原因,其他市場(chǎng)因素、國(guó)家政策等均是通過(guò)影響供求進(jìn)而影響農(nóng)產(chǎn)品價(jià)格的波動(dòng)[3]。最后,普遍關(guān)注的就是農(nóng)產(chǎn)品價(jià)格的預(yù)測(cè)研究,農(nóng)產(chǎn)品種植受氣候限制和影響,再加上特殊節(jié)日(如春節(jié)、中秋節(jié))等因素,其價(jià)格波動(dòng)具有季節(jié)性、趨勢(shì)性及隨機(jī)波動(dòng)性。
目前,主要有計(jì)量經(jīng)濟(jì)預(yù)測(cè)法、數(shù)理統(tǒng)計(jì)預(yù)測(cè)法、智能模型法和組合預(yù)測(cè)法4種預(yù)測(cè)方法。計(jì)量經(jīng)濟(jì)學(xué)旨在揭示經(jīng)濟(jì)現(xiàn)象中的因果關(guān)系,價(jià)格預(yù)測(cè)中最常用到的就是回歸分析法,根據(jù)影響農(nóng)產(chǎn)品價(jià)格的因素與價(jià)格之間的函數(shù)關(guān)系建立線性或非線性回歸模型[4-5]。由于影響價(jià)格變動(dòng)的因素較多,在預(yù)測(cè)時(shí)并不能一一列舉,也并不能一一量化,且不同的影響因素對(duì)價(jià)格影響的嚴(yán)重程度、持續(xù)時(shí)間也不同,這就對(duì)價(jià)格預(yù)測(cè)工作帶來(lái)很多不便,制約計(jì)量經(jīng)濟(jì)學(xué)對(duì)價(jià)格預(yù)測(cè)的準(zhǔn)確度。數(shù)理統(tǒng)計(jì)預(yù)測(cè)是統(tǒng)計(jì)學(xué)的重要功能,也是預(yù)測(cè)領(lǐng)域最常用到的方法。在農(nóng)產(chǎn)品市場(chǎng)的價(jià)格預(yù)測(cè)中,應(yīng)用最廣泛的是傳統(tǒng)的時(shí)間序列預(yù)測(cè)方法,主要包括季節(jié)指數(shù)法[6]、移動(dòng)平均法[7]、指數(shù)平滑法[8]等。這些方法處理數(shù)據(jù)時(shí)較為理想化,對(duì)于線性特征的時(shí)間序列數(shù)據(jù)預(yù)測(cè)的精度較高。但是,很多方法涉及模型參數(shù)的調(diào)整問(wèn)題,需要研究學(xué)者耗費(fèi)大量時(shí)間精力,積累實(shí)踐經(jīng)驗(yàn)獲取較高的預(yù)測(cè)精度。此方法在進(jìn)行預(yù)測(cè)時(shí),為模型參數(shù)調(diào)整帶來(lái)較大困難,反映出一定的局限性,且這些方法在對(duì)于非線性的農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)的實(shí)際應(yīng)用中結(jié)果并不太理想。
隨著信息技術(shù)的快速發(fā)展,相對(duì)應(yīng)的智能方法也被應(yīng)用于各個(gè)領(lǐng)域,學(xué)者們對(duì)農(nóng)產(chǎn)品價(jià)格也應(yīng)用智能分析方法進(jìn)行預(yù)測(cè),例如神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法[9-11]、灰色預(yù)測(cè)法[12-13]、支持向量機(jī)[14]等。組合模型[15-23]已成為目前預(yù)測(cè)領(lǐng)域的熱門(mén)方向,它可以利用單一模型的預(yù)測(cè)優(yōu)勢(shì),結(jié)合研究對(duì)象的實(shí)際變化規(guī)律,充分挖掘研究對(duì)象的特征信息。通過(guò)將不同的方法所得的結(jié)果進(jìn)行等權(quán)或不等權(quán)的組合,或通過(guò)輔助方法進(jìn)行先處理促進(jìn)后續(xù)預(yù)測(cè)方法預(yù)測(cè)精度的提升。結(jié)果證實(shí)組合預(yù)測(cè)方法充分結(jié)合了單一預(yù)測(cè)方法的優(yōu)勢(shì),表現(xiàn)出更佳的預(yù)測(cè)精度。
關(guān)于價(jià)格預(yù)測(cè)問(wèn)題的研究,雖然成果頗為豐富,但仍然存在一定的不足。首先,國(guó)內(nèi)外學(xué)者大都關(guān)注大宗農(nóng)產(chǎn)品的研究,對(duì)蔬菜價(jià)格的研究極少,且鮮有針對(duì)區(qū)域的研究。第二,對(duì)于蔬菜價(jià)格預(yù)測(cè)的研究,雖然預(yù)測(cè)精度很好,但預(yù)測(cè)方法的應(yīng)用并不能驗(yàn)證其對(duì)多種類的蔬菜預(yù)測(cè)。第三,對(duì)蔬菜價(jià)格預(yù)測(cè)的研究往往跟價(jià)格波動(dòng)特征的分析分割開(kāi)來(lái),造成價(jià)格預(yù)測(cè)的解釋性較差。第四,由于蔬菜價(jià)格是受多種因素的影響,且個(gè)別影響因素并不能以數(shù)據(jù)形式量化出來(lái),不同的影響因素對(duì)價(jià)格的影響時(shí)間長(zhǎng)短、影響程度也不同?;谝陨系乃伎?,本研究對(duì)農(nóng)產(chǎn)品價(jià)格進(jìn)行預(yù)測(cè)的著眼點(diǎn)為價(jià)格數(shù)值的研究,在對(duì)河南省批發(fā)市場(chǎng)的蔬菜進(jìn)行波動(dòng)特征分析的基礎(chǔ)上,提出多尺度特征融合方法(multi-scale feature fusion,MSFF),對(duì)各個(gè)種類的代表性蔬菜分別進(jìn)行預(yù)測(cè)研究,揭示其價(jià)格波動(dòng)規(guī)律,準(zhǔn)確把握未來(lái)價(jià)格走勢(shì)。
1.1.1 數(shù)據(jù)來(lái)源 本研究實(shí)驗(yàn)數(shù)據(jù)來(lái)自河南省農(nóng)產(chǎn)品信息監(jiān)測(cè)系統(tǒng)(http://ncpprice.agridoor.com.cn/login.asp),從中選擇某農(nóng)貿(mào)市場(chǎng)馬鈴薯、蓮藕、番茄、黃瓜、大白菜、油麥菜的月均價(jià)格。參照數(shù)據(jù)可獲得性和連續(xù)性原則,選擇2014年1月至2019年12月的等間隔連續(xù)數(shù)據(jù)為樣本進(jìn)行實(shí)證分析。其中,根莖類蔬菜代表是馬鈴薯和蓮藕。馬鈴薯是最有前景的高產(chǎn)作物,也是熱門(mén)的營(yíng)養(yǎng)食品。蓮藕外表細(xì)嫩光滑味甜而脆,藥用價(jià)值非常高,是一種藥食同源的佳品。茄果類蔬菜的代表番茄和黃瓜。番茄清熱止渴,富含維生素C,可以補(bǔ)充大量人體需要的元素,且在一年四季均消費(fèi)量較大。黃瓜清新可口脆嫩鮮美,是夏季最為活躍的一道涼菜。葉菜類蔬菜選擇大白菜和油麥菜。大白菜價(jià)格相對(duì)較低,消費(fèi)量也大。油麥菜在種植中適應(yīng)環(huán)境的能力比較強(qiáng),是眾多農(nóng)戶種植蔬菜的首要選擇,產(chǎn)量相對(duì)穩(wěn)定。
1.1.2 河南省蔬菜價(jià)格波動(dòng)變化 馬鈴薯、蓮藕、番茄、黃瓜、大白菜、油麥菜2014年1月至2019年12月的月均價(jià)格波動(dòng)特征如圖1所示。不同種類的蔬菜價(jià)格走勢(shì)各不相同,但均表現(xiàn)出不平穩(wěn)、非線性波動(dòng)趨勢(shì)。從圖1中可以看出,蓮藕的整體價(jià)格均比馬鈴薯的價(jià)格高,且2種蔬菜的價(jià)格走勢(shì)并不一致,蓮藕比馬鈴薯表現(xiàn)出較強(qiáng)的周期波動(dòng)性,蓮藕價(jià)格在每年的3月開(kāi)始上漲至6—8月份時(shí)達(dá)到最高值,隨即開(kāi)始下跌至波谷,而馬鈴薯每年的價(jià)格走勢(shì)較為平緩,并未表現(xiàn)出較強(qiáng)的波動(dòng)性。蓮藕在2015年6月的價(jià)格最高為8.84元·kg-1,是2017年11月最低價(jià)格2.17元·kg-1的4.07倍。馬鈴薯在2016年4月的價(jià)格最高為4.36元·kg-1,最低的價(jià)格在2017年7月為1.16元·kg-1,最高價(jià)是最低價(jià)的3.76倍??梢钥闯錾徟旱脑戮鶅r(jià)格差值大于馬鈴薯,且馬鈴薯相比較蓮藕易于儲(chǔ)存,蓮藕表現(xiàn)出較強(qiáng)的周期波動(dòng)性與其在秋天上市緊密相關(guān)。
圖1 蔬菜價(jià)格變化Fig.1 Changes in vegetable prices
從圖1中可以看出,番茄和黃瓜的整體價(jià)格相差不大,且相對(duì)于根莖菜和葉片菜,番茄和黃瓜表現(xiàn)出較為一致的價(jià)格波動(dòng)特征。番茄和黃瓜的價(jià)格從每年的1月份開(kāi)始慢慢下跌,到5—7月份價(jià)格跌落至最小值,接著價(jià)格從波谷慢慢上漲至每年的12月至第2年的2月份,價(jià)格達(dá)到最大值即完成一個(gè)新的周期變化。這6年來(lái)番茄在2019年2月的價(jià)格最高為6.05元·kg-1,是2016年7月最低價(jià)格0.94元·kg-1的6.44倍。黃瓜在2019年12月價(jià)格最高為6.12元·kg-1,最低價(jià)格在2016年6月為0.82元·kg-1,最高價(jià)是最低價(jià)的7.46倍??梢钥闯龇押忘S瓜的月均價(jià)格最高值和最低值相差較大,且其表現(xiàn)出強(qiáng)烈的周期波動(dòng)性,這跟番茄和黃瓜都是在每年夏天產(chǎn)出,集中上市階段供大于求導(dǎo)致番茄和黃瓜的價(jià)格較低。
從圖1中可以看出,油麥菜的整體價(jià)格比大白菜的高,雖然這2種蔬菜的價(jià)格走勢(shì)并不雷同,但都表現(xiàn)出一定的波動(dòng)頻率和幅度。在這6年時(shí)間內(nèi)油麥菜波動(dòng)次數(shù)比大白菜次數(shù)多,且波動(dòng)幅度也比較大。油麥菜在2017年9月價(jià)格最高為6.67元·kg-1,是2014年4月最低價(jià)格0.93元·kg-1的7.17倍。大白菜在2016年3月價(jià)格最高為2.62元·kg-1,最低價(jià)格在2018年12月為0.49元·kg-1,最高價(jià)是最低價(jià)的5.35倍。可以看出油麥菜的月均價(jià)格差值大于白菜,大白菜的價(jià)格波動(dòng)較小,主要是由于目前大多數(shù)的大白菜屬于大棚作物,一年四季均可種植,受氣候影響較小。
1.2.1 價(jià)格預(yù)測(cè)方法 在預(yù)測(cè)研究中,不論是時(shí)間序列預(yù)測(cè)模型還是智能預(yù)測(cè)模型,都會(huì)涉及模型參數(shù)的反復(fù)調(diào)整問(wèn)題。參數(shù)的設(shè)置需要研究原始序列的波動(dòng)特征,依據(jù)其特征,花費(fèi)大量的時(shí)間精力積累實(shí)踐經(jīng)驗(yàn)進(jìn)行調(diào)整才能獲得較好的預(yù)測(cè)結(jié)果。本研究利用經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)和極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)的優(yōu)勢(shì)進(jìn)行組合預(yù)測(cè)研究。EMD是一種適用于非線性、非平穩(wěn)時(shí)間序列的信號(hào)分解方法。它可以根據(jù)信號(hào)本身的特征對(duì)其自行分解,分解前不需要設(shè)置任何基函數(shù),可以根據(jù)序列特征自行分解出本征模態(tài)函數(shù)(intrinsic mode function,IMF)和余項(xiàng),IMF的數(shù)量是根據(jù)原序列特定產(chǎn)生的。極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)在建立預(yù)測(cè)模型時(shí)只需要設(shè)置好隱含層神經(jīng)元的個(gè)數(shù)即可,該方法克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需要設(shè)置大量參數(shù)的缺點(diǎn),且具有學(xué)習(xí)效率快、預(yù)測(cè)結(jié)果佳的優(yōu)勢(shì)。
本研究提出的多尺度特征融合的預(yù)測(cè)模型具體流程如圖2所示,根據(jù)蔬菜的價(jià)格時(shí)間序列利用EMD進(jìn)行分解,得出若干個(gè)IMF和一個(gè)線性余項(xiàng)分量。其中,對(duì)IMF1進(jìn)行小波變換分解出近似序列和細(xì)節(jié)序列,對(duì)分解出的多尺度分量分別用極限學(xué)習(xí)機(jī)建立預(yù)測(cè)模型,最后將各個(gè)分量的預(yù)測(cè)結(jié)果進(jìn)行累加融合得到最終預(yù)測(cè)值。
多尺度特征融合模型將單一的非線性非平穩(wěn)的時(shí)間序列分解成具有一定周期波動(dòng)規(guī)律的多尺度特征分量,對(duì)這些多尺度特征分量分別建立獨(dú)立的預(yù)測(cè)模型,這些預(yù)測(cè)模型是價(jià)格序列的重要組成部分,但各分量又相互獨(dú)立,結(jié)合不同分量預(yù)測(cè)模型的特征優(yōu)勢(shì)對(duì)其進(jìn)行累加融合得到最終的蔬菜價(jià)格預(yù)測(cè)值。
圖2 蔬菜價(jià)格預(yù)測(cè)流程圖 Fig.2 Vegetable price forecast flow chart
1.2.2 結(jié)果評(píng)價(jià)方法 選擇平均絕對(duì)誤差(MAE)、平均百分比誤差(MAPE)與均方根誤差(RMSE)指標(biāo)來(lái)度量預(yù)測(cè)模型的精度。各指標(biāo)的公式如下:
(1)
(2)
(3)
EMD是一種適用于非線性、非平穩(wěn)時(shí)間序列的信號(hào)分解方法,根據(jù)信號(hào)本身的特征對(duì)其自行分解,分解前不需要設(shè)置任何基函數(shù),這是它從根本上擺脫了傅里葉變換理論的束縛,也是與傅里葉分解和小波分解的本質(zhì)區(qū)別。它將原始序列分解為若干個(gè)本征模態(tài)函數(shù)和一個(gè)剩余分量。
經(jīng)驗(yàn)?zāi)B(tài)分解步驟如下:
(1)取原始序列x(t)的所有極大值和極小值。
(2)分別通過(guò)3次樣條函數(shù)擬合出極大值、極小值的上包絡(luò)線xmax(t)和下包絡(luò)線xmin(t),計(jì)算上下包絡(luò)線的均值m1(t),即
m1(t)=[xmax(t)+xmin(t)]÷2
(4)
(3)計(jì)算x(t)與m1(t)之差,記為h1(t),即h1(t)=x(t)-m1(t),如果h1(t)滿足IMF的條件,則記為c1(t)=h1(t),c1(t)就是第一個(gè)IMF分量;如果h1(t)不是IMF,則將h1(t)視為新的信號(hào)x(t),重復(fù)以上步驟直到h1(t)是一個(gè)IMF,記為c1(t)。
20世紀(jì)80年代,真正意義的小波變換概念被提出。它能夠?qū)π盘?hào)進(jìn)行多尺度分解,在分解過(guò)程中能夠充分突出信號(hào)的細(xì)節(jié)特征,在信號(hào)高頻部分進(jìn)行時(shí)間細(xì)分,在低頻部分進(jìn)行頻率細(xì)分,從而達(dá)到聚焦信號(hào)細(xì)節(jié)特征的作用,實(shí)現(xiàn)對(duì)分析對(duì)象更為細(xì)致的逼近,提高對(duì)信號(hào)細(xì)節(jié)信息的分析處理能力。
小波變換能夠有效地反映信號(hào)的局部信息,是一種處理非平穩(wěn)信號(hào)的好工具。在實(shí)際生活中采集到的數(shù)據(jù)往往是離散的,因此對(duì)于連續(xù)小波變換理論而言,主要應(yīng)用于對(duì)理論層面上的分析,難以直接應(yīng)用于實(shí)際中。小波變換的數(shù)學(xué)表達(dá)式為:
(5)
式中:α為尺度因子,τ為平移量,f(t)為基本小波。在應(yīng)用中,小波分解結(jié)果的好壞依賴于小波函數(shù)的選擇。滿足小波定義要求的函數(shù)均可被稱作為小波函數(shù),這也使得小波函數(shù)的種類多種多樣,選取不同的小波函數(shù)得到的信號(hào)處理結(jié)果不同。
ELM作為一種新型的單隱層神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、輸出層和一個(gè)隱含層。它可以用最簡(jiǎn)單的線性回歸得到滿意的解,大大提高訓(xùn)練速度,解決了傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度慢、網(wǎng)絡(luò)參數(shù)多次迭代更新、易陷入局部最優(yōu)等問(wèn)題。在訓(xùn)練之前,只需要設(shè)置適當(dāng)?shù)碾[含層節(jié)點(diǎn)數(shù),隨機(jī)為輸入權(quán)重和隱含層偏置進(jìn)行賦值,然后通過(guò)最小二乘法得到輸出層權(quán)值。它不需要多次迭代,也不需要在迭代中確定參數(shù),從而大大降低了計(jì)算量和搜索空間。
假設(shè)有N個(gè)任意的樣本(xi,yi),其中xi=[xi1,xi2,…,xin]T∈Rn為輸入向量,yi=[yi1,yi2,…yim]T∈Rm為輸出向量。對(duì)于一個(gè)有L個(gè)隱含層節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò)可以表示為:
(6)
式中:j=1,2,……,N,,Wi=[Wi1,Wi2,…,Win]T是連接第i個(gè)隱含層節(jié)點(diǎn)和輸入節(jié)點(diǎn)的權(quán)重,bi是第i個(gè)隱含層節(jié)點(diǎn)的偏置,βi=[βi1,βi2,…,βim]T是第i個(gè)隱含層節(jié)點(diǎn)和輸出節(jié)點(diǎn)之間的權(quán)重。g(x)是激活函數(shù)。如果該神經(jīng)網(wǎng)絡(luò)能以零誤差逼近訓(xùn)練樣本,則N個(gè)方程的矩陣形式可寫(xiě)為Hβ=Y,其中H是隱含層的輸出矩陣,Y是目標(biāo)輸出矩陣。
ELM在訓(xùn)練過(guò)程中已經(jīng)轉(zhuǎn)化成求解方程最小值的最優(yōu)化問(wèn)題。極限學(xué)習(xí)機(jī)所得解是唯一最優(yōu)解,保證了網(wǎng)絡(luò)泛化能力,且學(xué)習(xí)速度快[24]。在保證較好的預(yù)測(cè)結(jié)果前提下,其優(yōu)異的訓(xùn)練速度為其自身與其他方法結(jié)合提供了便利,越來(lái)越引起各個(gè)領(lǐng)域的高度關(guān)注和深入研究。
蔬菜價(jià)格的變化圖表現(xiàn)出不平穩(wěn)、非線性特征。EMD可以利用MATLAB編寫(xiě)程序?qū)⑿蛄蟹纸鉃槿舾蓚€(gè)IMF和余量,結(jié)果如圖3所示。圖3中第一曲線圖為各個(gè)蔬菜的原始序列圖,中間為IMF分量圖,最后一個(gè)為余量圖??梢园l(fā)現(xiàn),原始的價(jià)格序列通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解后,不同種類的蔬菜呈現(xiàn)出不同的分量波動(dòng)特征,菠菜的IMF分量最多,為5個(gè)。其次是馬鈴薯和蓮藕的IMF分量為4個(gè),番茄、黃瓜和大白菜的IMF數(shù)量最少,為3個(gè)。其中,每種蔬菜的本征模態(tài)函數(shù)分量中IMF1分量跟原始價(jià)格相比,波動(dòng)幅度有明顯的下降,波動(dòng)頻率有所增加。IMF2分量與IMF1分量相比,波動(dòng)頻率明顯減少,波動(dòng)幅度與原始價(jià)格序列的波動(dòng)幅度較為相似。最后幾個(gè)IMF分量波動(dòng)緩慢且有規(guī)律,余量與原序列整體走向一致,反映其線性趨勢(shì)。從整體的分量圖看,IMF1分量依然波動(dòng)劇烈,且其序列的不平穩(wěn)、非線性特征嚴(yán)重影響后續(xù)的預(yù)測(cè)精度。
圖3 蔬菜價(jià)格序列及EMD分量Fig.3 Vegetable price series and EMD components
針對(duì)農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)提出的多尺度特征融合模型中涉及2種不同的分解技術(shù),即經(jīng)驗(yàn)?zāi)B(tài)分解和小波變換。特別是經(jīng)驗(yàn)?zāi)B(tài)分解被選為主要的分解方法,充分利用了它能夠根據(jù)非線性信號(hào)其自身特征自行分解出幾個(gè)IMF和余項(xiàng)。然而,EMD分解產(chǎn)生的IMF1依然具有強(qiáng)烈的非線性和不規(guī)則特征。根據(jù)文獻(xiàn)[25]所述原始序列的非線性越高,IMF1就越不規(guī)則,且IMF1的數(shù)值總是如此之小。雖然它對(duì)模型擬合貢獻(xiàn)不大,但將導(dǎo)致后續(xù)預(yù)測(cè)難度的增加,對(duì)時(shí)間序列的預(yù)測(cè)精度有著很大的干擾。在文獻(xiàn)[26]的記載中證實(shí)將IMF1從本征模態(tài)函數(shù)分量的集合中剔除,預(yù)測(cè)精度略有提升。
針對(duì)IMF1分量分解后依舊波動(dòng)劇烈問(wèn)題提出多尺度分解方法,即利用小波變換對(duì)每個(gè)種類蔬菜的IMF1進(jìn)行再次分解。根據(jù)IMF1分量的具體波動(dòng)特征,采用Daubechies小波基函數(shù)(簡(jiǎn)稱dbN,N為小波的階數(shù)),選擇階數(shù)為5,對(duì)IMF1分量進(jìn)行去噪處理。模型選擇小波變換的分解尺度為2,可以避免分解尺度過(guò)小不利于細(xì)節(jié)特征的突出,分解尺度過(guò)大加重實(shí)踐操作的弊端,即對(duì)IMF1進(jìn)行db5的2尺度分解得到趨勢(shì)低頻部分a2及細(xì)節(jié)高頻部分d1、d2,對(duì)其波動(dòng)的頻率和幅度進(jìn)行更為細(xì)致的透視,分解過(guò)程如圖4所示。
蔬菜價(jià)格經(jīng)過(guò)多尺度分解后得到多個(gè)序列分量,分別MATLAB編寫(xiě)程序運(yùn)用ELM對(duì)其每個(gè)分量建立預(yù)測(cè)模型,將2014年至2018年月均價(jià)格數(shù)據(jù)作為訓(xùn)練集,分解出的2019年的數(shù)據(jù)作為測(cè)試集。在預(yù)測(cè)過(guò)程中為了獲得較高的預(yù)測(cè)精度,預(yù)先對(duì)分量序列進(jìn)行歸一化處理。由于蔬菜價(jià)格具有強(qiáng)烈的季節(jié)波動(dòng)特征,每年對(duì)應(yīng)月份的價(jià)格波動(dòng)具有一定的相似性。因此,設(shè)置神經(jīng)網(wǎng)絡(luò)時(shí)選用當(dāng)前6個(gè)月的價(jià)格和上一年同月份的價(jià)格共7個(gè)數(shù)據(jù)作為輸入層數(shù)據(jù)進(jìn)行提前一步預(yù)測(cè),其輸入輸出的構(gòu)成如圖5所示。在隱含層神經(jīng)元個(gè)數(shù)的設(shè)定時(shí),考慮到研究序列的長(zhǎng)度,構(gòu)建從3至25的預(yù)測(cè)模型,對(duì)每個(gè)模型在預(yù)測(cè)時(shí)重復(fù)訓(xùn)練15次,選取絕對(duì)誤差最小的預(yù)測(cè)模型。隱含層神經(jīng)元的個(gè)數(shù)根據(jù)不同分量的波動(dòng)特征經(jīng)過(guò)實(shí)踐選擇不同的數(shù)值。對(duì)輸出數(shù)據(jù)進(jìn)行反歸一化處理,最后對(duì)各個(gè)分量的預(yù)測(cè)值進(jìn)行累加融合得到預(yù)測(cè)值。
圖4 IMF1小波分解示意圖 Fig.4 IMF1 wavelet decomposition diagram
圖5 ELM的輸入和輸出數(shù)據(jù)構(gòu)成 Fig.5 ELM input and output data composition
為了分析多尺度特征融合模型的預(yù)測(cè)性能,分別對(duì)根莖菜(以馬鈴薯和蓮藕為例)、茄果菜(以番茄和黃瓜為例)以及葉片菜(以大白菜和油麥菜為例)應(yīng)用預(yù)測(cè)模型,與EMD-ELM組合模型進(jìn)行比較,預(yù)測(cè)精度評(píng)價(jià)指標(biāo)分析結(jié)果如表1所示。EMD-ELM組合模型在預(yù)測(cè)時(shí)選擇與多尺度特征融合模型同樣的操作步驟,主要為ELM建模的相關(guān)操作步驟即先對(duì)各序列進(jìn)行歸一化處理,選擇當(dāng)前6個(gè)月的價(jià)格和上一年同月份的價(jià)格共7個(gè)數(shù)據(jù)作為輸入層數(shù)據(jù)進(jìn)行提前一步預(yù)測(cè),最后對(duì)預(yù)測(cè)數(shù)據(jù)進(jìn)行反歸一化處理,進(jìn)行累加得到預(yù)測(cè)值。從表中可以看出,基于多尺度特征融合的預(yù)測(cè)模型的預(yù)測(cè)精度較好。由于對(duì)原始的蔬菜價(jià)格序列用經(jīng)驗(yàn)?zāi)B(tài)分解方法進(jìn)行了分解,并針對(duì)IMF1用小波變換再次分解,分解后的多尺度分量有效降低了后續(xù)預(yù)測(cè)過(guò)程的復(fù)雜度。圖6為6種蔬菜價(jià)格2019年12個(gè)月份經(jīng)過(guò)多尺度特征融合方法得到的預(yù)測(cè)值與實(shí)際值的擬合圖,從圖中可以看出其預(yù)測(cè)值與實(shí)際值的擬合情況基本吻合,整體來(lái)看茄果菜表現(xiàn)最好,預(yù)測(cè)值與實(shí)際值的整體重合度最高。
基于多尺度特征融合的預(yù)測(cè)模型實(shí)際應(yīng)用于河南省馬鈴薯、蓮藕、番茄、黃瓜、大白菜、油麥菜的月均價(jià)格進(jìn)行預(yù)測(cè)。結(jié)果表明,馬鈴薯、蓮藕、番茄、黃瓜、大白菜、油麥菜平均絕對(duì)誤差分別為0.06、0.25、 0.14、0.19、0.04、0.17 元·kg-1,平均百分比誤差為2.70%、4.58%、4.71%、4.76%、3.90%、3.84%,均方根誤差為0.08、0.37、0.17、0.26、0.05、0.21。且其平均絕對(duì)誤差、平均百分比誤差和均方根誤差均比EMD-ELM組合模型的預(yù)測(cè)結(jié)果表現(xiàn)好。綜合對(duì)比可以看出,3個(gè)精度評(píng)價(jià)指標(biāo)中根莖菜中馬鈴薯和葉片菜中大白菜數(shù)值最小,模型預(yù)測(cè)結(jié)果表現(xiàn)最佳。參照蔬菜價(jià)格的走勢(shì)圖可以看出馬鈴薯和大白菜的價(jià)格跟其他4種蔬菜相比,其價(jià)格數(shù)值區(qū)間大部分在0~3元·kg-1的低價(jià)位區(qū)間,且對(duì)比其他種類的蔬菜波動(dòng)情況,馬鈴薯和大白菜的波動(dòng)幅度最小,因此在預(yù)測(cè)模型的應(yīng)用中預(yù)測(cè)評(píng)價(jià)指標(biāo)表現(xiàn)最好。蓮藕的價(jià)格數(shù)值區(qū)間跟其他種類的蔬菜相比最大,具有強(qiáng)烈的波動(dòng)特征,因此平均絕對(duì)誤差和均方根誤差的數(shù)值最大,相對(duì)于其他蔬菜的預(yù)測(cè)精度表現(xiàn)較差。
表1 蔬菜價(jià)格預(yù)測(cè)結(jié)果對(duì)比 Table 1 Comparison of vegetable price forecast results
圖6 蔬菜價(jià)格預(yù)測(cè)擬合Fig.6 Fitting diagram of vegetable price forecast
本研究以河南省為特定區(qū)域,在分析根莖類、茄果類和葉菜類的代表性蔬菜的價(jià)格波動(dòng)趨勢(shì)的基礎(chǔ)上,針對(duì)蔬菜價(jià)格的非線性波動(dòng)形態(tài),采用經(jīng)驗(yàn)?zāi)B(tài)分解、小波變換和極限學(xué)習(xí)機(jī),提出一種多尺度特征融合的預(yù)測(cè)模型,并對(duì)根莖類、茄果類及葉菜類的代表性蔬菜進(jìn)行預(yù)測(cè)研究,對(duì)其結(jié)果進(jìn)行預(yù)測(cè)精度的指標(biāo)度量。
1)通過(guò)對(duì)根莖類、茄果類和葉菜類的代表性蔬菜進(jìn)行波動(dòng)特征分析,得出不同種類的蔬菜價(jià)格波動(dòng)特征不同,其中茄果類的代表番茄和黃瓜整體波動(dòng)特征較為一致。蔬菜價(jià)格的波動(dòng)周期基本跟產(chǎn)出時(shí)間節(jié)點(diǎn)相關(guān)。
2)蔬菜的價(jià)格序列通過(guò)EMD分解出不同的IMF分量及剩余分量。IMF分量的數(shù)量與蔬菜價(jià)格的原始序列相關(guān),從各分量的展示圖中得出IMF1分量雖然有效地降低了原始序列的波動(dòng)幅度,但仍存在分量波動(dòng)頻繁的特征。
3)基于IMF1分量仍存在波動(dòng)頻繁特征,提出多尺度特征融合預(yù)測(cè)模型,將其預(yù)測(cè)結(jié)果與EMD-ELM模型進(jìn)行對(duì)比,表明預(yù)測(cè)結(jié)果在MAE、MAPE及RMSE3個(gè)指標(biāo)中均比EMD-ELM的組合模型表現(xiàn)好,說(shuō)明對(duì)IMF1利用小波變換做再次分解能有效降低時(shí)間序列的非平穩(wěn)性,有利于后續(xù)預(yù)測(cè)精度的提高。實(shí)驗(yàn)證實(shí)蔬菜價(jià)格的波動(dòng)幅度和頻率影響價(jià)格的預(yù)測(cè)精度。
本研究提出的多尺度特征融合的預(yù)測(cè)模型,結(jié)果表明經(jīng)驗(yàn)?zāi)B(tài)分解和小波變換對(duì)原序列做分解可以兼顧序列的時(shí)序性和非線性特點(diǎn),極限學(xué)習(xí)機(jī)又能深入挖掘序列隱含的某些特征,得出較好的預(yù)測(cè)精度。該方法能夠?yàn)榉蔷€性復(fù)雜的價(jià)格短期精準(zhǔn)預(yù)測(cè)提供一種新的思路,為未來(lái)價(jià)格走勢(shì)做出模擬。但是本研究在進(jìn)行分析和預(yù)測(cè)時(shí),選取蔬菜為代表,為進(jìn)一步驗(yàn)證方法的普適性,還需對(duì)其他地域、其他種類的農(nóng)產(chǎn)品做進(jìn)一步嘗試。