王新武 ,靳佩蕓
(甘肅醫(yī)學(xué)院 a.公共課教學(xué)部;b.藥學(xué)系,甘肅 平?jīng)?744000)
農(nóng)業(yè)、農(nóng)村、農(nóng)民問題的解決事關(guān)老百姓的切身利益,乃至整個國民經(jīng)濟的持續(xù)穩(wěn)定發(fā)展[1]。伴隨著現(xiàn)代農(nóng)業(yè)發(fā)展和供求態(tài)勢的變化,區(qū)域農(nóng)產(chǎn)品市場競爭日益激烈,農(nóng)產(chǎn)品價格已完全由市場供需關(guān)系決定,而農(nóng)產(chǎn)品市場風(fēng)險的不斷涌現(xiàn)深刻影響著農(nóng)產(chǎn)品的供給,進而影響到農(nóng)產(chǎn)品的市場價格呈現(xiàn)波動變化,有時其變化甚至是躍變的[2]。因此,農(nóng)產(chǎn)品價格的準(zhǔn)確預(yù)測是農(nóng)產(chǎn)品市場風(fēng)險管理和供求宏觀調(diào)控的前提。
由于農(nóng)產(chǎn)品價格時間序列呈現(xiàn)出非線性、隨機性及多重周期性的復(fù)雜特征,傳統(tǒng)的基于時間序列的模型如ARIMA、ARCH、多變量回歸等[3],通常是在時間序列具有線性變化的前提下構(gòu)建模型?,F(xiàn)實中,影響農(nóng)產(chǎn)品市場價格的因素眾多,農(nóng)產(chǎn)品市場價格呈現(xiàn)出非線性的特征,傳統(tǒng)的時間序列模型只能部分的模擬其變化趨勢,且預(yù)測精度不高。
近年來,由于機器學(xué)習(xí)模型能夠通過訓(xùn)練和測試,很好的實現(xiàn)具有復(fù)雜特征的時間序列的準(zhǔn)確擬合[4]。相對于傳統(tǒng)的時間序列模型,機器學(xué)習(xí)模型具有更好的魯棒性和預(yù)測性能。 由于傳統(tǒng)的機器學(xué)習(xí)預(yù)測模型多是基于原始時間序列,沒有充分考慮到時間序列中的高頻噪聲,使得機器學(xué)習(xí)模型在訓(xùn)練過程中難以收斂,因此,選取恰當(dāng)?shù)臄?shù)據(jù)預(yù)處理技術(shù)實現(xiàn)對農(nóng)產(chǎn)品價格時間序列主要特征的提取,進而實現(xiàn)農(nóng)產(chǎn)品價格的準(zhǔn)確模擬就顯得尤為重要。集合經(jīng)驗?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition ,簡稱EEMD)具有穩(wěn)健的自主分解能力,能夠有效地去除時間序列中混合的噪聲,與離散小波變換相比,具有非常明顯的優(yōu)勢[5]。因此,基于已有的農(nóng)產(chǎn)品價格時間序列,構(gòu)建基于數(shù)據(jù)預(yù)處理和神經(jīng)網(wǎng)絡(luò)模型相結(jié)合的混合模型,以期實現(xiàn)農(nóng)產(chǎn)品價格的準(zhǔn)確預(yù)測仍然是一個研究熱點[6]。
基于2020~2021年隴東主要農(nóng)作物小麥的價格時間序列,采用EEMD對收集到的隴東地區(qū)主要農(nóng)產(chǎn)品小麥的價格時間序列進行數(shù)據(jù)預(yù)處理,借助于NAR神經(jīng)網(wǎng)絡(luò)實現(xiàn)農(nóng)產(chǎn)品價格預(yù)測,最后,采用多個評價指標(biāo)對混合預(yù)測模型的精度進行評價。數(shù)值模擬實驗表明,構(gòu)建混預(yù)測模型EEMD-NAR能夠準(zhǔn)確實現(xiàn)隴東基礎(chǔ)農(nóng)作物小麥的價格預(yù)測。
基于EEMD的數(shù)據(jù)預(yù)處理過程如下:
1) 預(yù)先設(shè)定平均次數(shù)以及添加的白噪聲的幅度。
2) 在原始時間序列X(t)中加入幅度為K的白噪聲,即
x(t)=X(t)+w(t).
(1)
3) 將新得到的時間序列x(t)通過EMD分解為若干個本征模函數(shù)gi(t),i=1,2,…,n與一個殘余項Rn(t)的和,即
(2)
4) 重復(fù)步驟2)和3),得到不同頻率的IMF構(gòu)成的集合。
5) 由于IMF1包含了高頻分量,因此將其去除,將其余IMF分量求和得到最終的數(shù)據(jù)預(yù)處理結(jié)果。
NAR神經(jīng)網(wǎng)絡(luò)模型是一種采用靜態(tài)神經(jīng)元和各層網(wǎng)絡(luò)的輸出反饋的動態(tài)網(wǎng)絡(luò),通過其自回歸特性將網(wǎng)絡(luò)的輸出結(jié)果再次輸入到NAR網(wǎng)絡(luò)中實現(xiàn)時間序列的模擬。設(shè)xi代表NAR的輸入,輸入層與隱含層的連接權(quán)重為ωij,閾值為aj,則NAR神經(jīng)網(wǎng)絡(luò)第j個神經(jīng)元的輸出為Hj,即
(3)
式中:i表示輸入數(shù)據(jù)的維數(shù);f是激活函數(shù)。將第j個神經(jīng)元的輸出Hj重新輸入NAR網(wǎng)絡(luò)中,得到整個網(wǎng)絡(luò)輸出值O,即
(4)
式中:wj為隱藏層中第j個神經(jīng)元與輸出層神經(jīng)元相連的權(quán)重;b為閾值。NAR的預(yù)測誤差為
(5)
構(gòu)建的混合預(yù)測模型流程如圖1所示,具體步驟如下:
1) 采用EEMD對收集到的小麥價格時間序列進行分解。
圖1 EEMD-NAR混合預(yù)測模型結(jié)構(gòu)
2) 將EEMD生成的新的時間序列劃分為訓(xùn)練集和測試集,輸入NAR進行預(yù)測。
3) 采用納什效率系數(shù) (NSCE)、相對平均誤差 (MAPE)及均方根誤差(RMSE)對混合模型EEMD-NAR和單個的NAR、BPNN、ELM預(yù)測效果進行評價。
我國隴東地區(qū)以種植業(yè)為主,小麥?zhǔn)请]東地區(qū)的基礎(chǔ)農(nóng)作物,小麥價格時間序列來源于金投網(wǎng)(2020-06-25—2021-05-26共336個數(shù)據(jù))。整體上,小麥價格具有不穩(wěn)定、不規(guī)則波動特征。受新冠疫情的影響,小麥價格在2020-10-26—2020-10-28出現(xiàn)了暴漲,但很快趨于平穩(wěn)。實驗過程中,選擇2020-06-25—2021-04-08的288個樣本作為訓(xùn)練集,2021-04-09—2021-05-26的48個樣本作為測試集,以驗證所構(gòu)建的EEMD-NAR混合預(yù)測模型的預(yù)測效果。
文中采用NSCE、MAPE及RMSE等評價模型的預(yù)測精度,各評價指標(biāo)的計算如式(6)~(8)所示:
(6)
(7)
(8)
從收集到的隴東地區(qū)主要農(nóng)產(chǎn)品小麥的價格時間序列變化圖中可以看出,收集到的時間序列蘊含著隨機性和非線性的變化特征。為了獲得更好的預(yù)測效果,采用EEMD對收集到的小麥價格時間序列進行分解,共得到8個本征模態(tài)函數(shù)分量,結(jié)果如圖2所示。
(a) 小麥價格序列
(b) EEMO分解圖2 小麥價格序列及EEMD分解結(jié)果
從圖2可以看出,IMF1和IMF2具有變化頻繁和短周期的特征,而IMF3至IMF7具有波動周期長和變化比較平緩的特點,殘余量IMF8反映了農(nóng)產(chǎn)品價格時間序列的總體變化趨勢。從IMF8的變化趨勢來看,整體上小麥價格序列具有下降趨勢。
用NAR分別對分解出來的8個IMF序列進行預(yù)測。神經(jīng)網(wǎng)絡(luò)的輸入層為3,即使用當(dāng)前3天的價格數(shù)據(jù)來提前一步預(yù)測,選擇RMSE作為適應(yīng)度函數(shù)。對模型輸出結(jié)果反歸一化處理,并將所有IMF序列的預(yù)測結(jié)果相加,作為最終的預(yù)測結(jié)果。
為了比較所構(gòu)建的混合EEMD-NAR模型的預(yù)測精度,基于原始的觀測數(shù)據(jù),分別采用ELM、NAR、 BPNN等多個神經(jīng)網(wǎng)絡(luò)模型進行預(yù)測。所有模型的預(yù)測結(jié)果如圖3所示,各模型預(yù)測精度評價指標(biāo)結(jié)果如表1所示。
圖3 不同模型預(yù)測結(jié)果比較
表1 不同模型的預(yù)測精度
從圖3和表1可以看出,與單個的BPNN、ELM及NAR相比,EEMD-NAR混合模型的預(yù)測精度有了較大的提高,這是由于原始的農(nóng)產(chǎn)品價格序列經(jīng)過EEMD分解后所得到的各主要IMF分量(IMF2-IMF8)的變化呈現(xiàn)出了強烈的規(guī)律性,從而減少了NAR預(yù)測的復(fù)雜度。從各個模型的預(yù)測精度評價指標(biāo)看,BPNN、ELM及NAR均能夠很好的實現(xiàn)隴東地區(qū)基礎(chǔ)農(nóng)作物小麥價格的準(zhǔn)確預(yù)測,這3個單個的預(yù)測模型中,NAR的預(yù)測精度最高,ELM次之,BPNN的預(yù)測效果最差,但NAR的預(yù)測精度仍然有待提高。EEMD-NAR混合預(yù)測模型的NSCE為0.957 2,RMSE為0.025 6, MAPE 為1.35%,而單一的BPNN、ELM、NAR的NSCE、RMSE、MAPE與EEMO-NAR相比,EEMD-NAR混合預(yù)測模型的正向指標(biāo)NSCE 最大,BPNN的最?。回?fù)向指標(biāo)值RMSE和MAPE顯示,EEMD-NAR的RMSE和MAPE均小于單一的BPNN、ELM及NAR預(yù)測模型。
相對于單一的預(yù)測模型,EEMD-NAR 混合預(yù)測模型有著更為突出的優(yōu)勢,這是由于采用BPNN、ELM及NAR進行預(yù)測時,未對時間序列進行有效的數(shù)據(jù)預(yù)處理,從而導(dǎo)致預(yù)測結(jié)果誤差較大。因此,采用神經(jīng)網(wǎng)絡(luò)模型預(yù)測農(nóng)產(chǎn)品價格時,需要對收集到的時間序列采用必要的數(shù)據(jù)預(yù)處理,從而提取出蘊含在價格時間序列中的波動頻率,降低時間序列的波動幅度,對于獲得準(zhǔn)確的預(yù)測結(jié)果至關(guān)重要。
針對隴東地區(qū)基礎(chǔ)農(nóng)作物小麥價格時間序列的變化特征,采用了先進的數(shù)據(jù)預(yù)處理技術(shù),實現(xiàn)了原始農(nóng)產(chǎn)品價格序列中不同特征分量的提取,并構(gòu)建了EEMD-NAR混合預(yù)測模型,對小麥價格時間序列進行了模擬。模擬數(shù)值結(jié)果表明,構(gòu)建的混合EEMD-NAR模型較之BPNN、ELM及NAR等單個模型具有更高的預(yù)測精度,為基于時間序列建模的農(nóng)產(chǎn)品價格預(yù)測提供了一種新的思路和新的建模方法,為有效實現(xiàn)農(nóng)產(chǎn)品市場的風(fēng)險管理和縮短農(nóng)產(chǎn)品供求宏觀調(diào)控時滯提供了必要的依據(jù)。