白偉 李鳳英
摘要:寧夏西吉縣是國家級貧困縣,特色農(nóng)產(chǎn)品有馬鈴薯、冷涼蔬菜、肉牛、羊、雜糧等,馬鈴薯為支柱產(chǎn)業(yè)享譽(yù)國內(nèi)外。以西吉縣新營鄉(xiāng)馬鈴薯批發(fā)市場2016/10/17-2020/2/2三種馬鈴薯每日交易價格共2894個數(shù)據(jù)樣本為例。利用BP隱層神經(jīng)網(wǎng)絡(luò)理論與Matlab人工神經(jīng)網(wǎng)絡(luò)工具箱構(gòu)建預(yù)測模型,對銷售價格進(jìn)行短期預(yù)測,并利用MAE、MAPE、MASE 評價指標(biāo)檢驗(yàn)顯示結(jié)果良好,能夠?yàn)檎€(wěn)定市場、提高農(nóng)戶收入做出科學(xué)判斷依據(jù),同時為其他農(nóng)產(chǎn)品價格預(yù)測提供理論與實(shí)操可信參考。
Abstract: Xiji County, Ningxia is a national poverty-stricken county. The specialty agricultural products include potatoes, cold vegetables, beef cattle, sheep and miscellaneous grains. Potato is a well-known industry at home and abroad. Taking the potato wholesale market of Xinying Township in Xiji County from 2016/10/17-2020/2/2 with a total of 2894 data samples as an example, this paper uses the theory of hidden layer of BP neural network and Matlab neural network toolbox to build prediction model of short-term prediction on the selling price, and the MAE, MAPE, MASE evaluation index shows good results, which can make scientific judgment for raising the income of farmers and stabilizing market price, and provide credible theoretical and practical reference for other agricultural product price forecast.
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);馬鈴薯;預(yù)測
Key words: BP neural network;potato;forecast
中圖分類號:O212.9 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼:A ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1006-4311(2020)15-0201-03
0 ?引言
中國是農(nóng)業(yè)大國,促進(jìn)農(nóng)業(yè)的可持續(xù)發(fā)展是提高農(nóng)戶收入及生活水平的重要途徑。以寧夏西吉縣為例,國家級貧困縣總?cè)丝?9.6萬[1],農(nóng)業(yè)人口42.5萬占85.69%是寧夏人口、農(nóng)業(yè)第一大縣。在“精準(zhǔn)扶貧”模式下,貧困人口從2015年的27%下降至2019年的1%,脫貧效果顯著,目前鞏固成果中。特色農(nóng)產(chǎn)品有馬鈴薯、冷涼蔬菜、肉牛、羊、雜糧等,尤其馬鈴薯是支柱產(chǎn)業(yè)是該地農(nóng)民精心選留與自然選擇的結(jié)果,被譽(yù)為“金豆豆”、“中國馬鈴薯之鄉(xiāng)“,優(yōu)質(zhì)馬鈴薯種植面積最高可達(dá)到120萬畝,2019年種植81萬畝,平均產(chǎn)量達(dá)1768.2公斤/畝[2]。銷售周期可達(dá)七到八個月時間,從種植、貯藏、加工再到外銷,西吉縣馬鈴薯產(chǎn)業(yè)正在形成一套完整的產(chǎn)業(yè)鏈條。
增加農(nóng)民收入直接反映在農(nóng)產(chǎn)品銷售價格上,確保農(nóng)產(chǎn)品價格平穩(wěn)運(yùn)行一直是中國政府高度關(guān)注的重點(diǎn),也是宏觀調(diào)控的難點(diǎn),由于農(nóng)產(chǎn)品上市周期不同,價格存在較大波動,如何精準(zhǔn)、實(shí)時地進(jìn)行農(nóng)產(chǎn)品價格的短期預(yù)測,更是學(xué)術(shù)界長期不斷探索的研究領(lǐng)域。從已有文獻(xiàn)看,國內(nèi)外學(xué)者對農(nóng)產(chǎn)品短期價格時間序列進(jìn)行預(yù)測的方法有許多。
近幾年的研究有,徐克[3]以統(tǒng)計(jì)學(xué)習(xí)理論、西方經(jīng)濟(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)、農(nóng)業(yè)信息分析學(xué)為基礎(chǔ),采用時間序列分析預(yù)測方法、經(jīng)驗(yàn)?zāi)B(tài)分解方法、希伯特-黃轉(zhuǎn)換法、支持向量回歸模型和組合模型預(yù)測等方法,結(jié)合實(shí)際問題進(jìn)行實(shí)證分析,將農(nóng)產(chǎn)品價格進(jìn)行分解,并對分解后的結(jié)果進(jìn)行深入分析,探究其背后的意義。王文晶[4]借助R工具,通過分析建立時間序列模型、神經(jīng)網(wǎng)絡(luò)模型,選用AR(1)、ARIMA(1,1,1)、ARIMA(2,1,3)、多重季節(jié)MA模型ARIMA(2,1,3)、季節(jié)模型ARMA(2,0,2)等模型進(jìn)行預(yù)測。張榮臻[5]建立Dropout神經(jīng)網(wǎng)絡(luò),進(jìn)行農(nóng)產(chǎn)品價格預(yù)測。賈寧[6]等根據(jù)農(nóng)產(chǎn)品價格特點(diǎn),設(shè)計(jì)了一種LSTM-DA(Long Short-Term Memory-Double Attention,雙重注意力機(jī)制與長短期記憶網(wǎng)絡(luò)融合)神經(jīng)網(wǎng)絡(luò)模型,它將卷積注意力網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)和注意力機(jī)制相結(jié)合,針對不同成分的影響因子通過卷積注意力網(wǎng)絡(luò)進(jìn)行特征提取,進(jìn)行農(nóng)產(chǎn)品價格指數(shù)的短期預(yù)測。
1 ?理論基礎(chǔ)
1.1 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)[7]是目前為止最為成功的神經(jīng)網(wǎng)絡(luò)算法之一,其學(xué)習(xí)方式采用標(biāo)準(zhǔn)梯度下降的誤差逆?zhèn)鞑ィ‥rror Back Propagation)的方式,以下介紹的BP神經(jīng)網(wǎng)絡(luò)為3層前饋神經(jīng)網(wǎng)絡(luò),如圖1所示,定義如下:
給定訓(xùn)練集
即輸入數(shù)據(jù)緯度為d,輸出的數(shù)據(jù)緯度為l。假設(shè)神經(jīng)網(wǎng)絡(luò)有d個輸入節(jié)點(diǎn),l個輸出節(jié)點(diǎn),隱層有q個神經(jīng)元,輸出層第j個神經(jīng)元閾值為?茲j,第h個隱層神經(jīng)元閾值為?酌h。輸入層第i個節(jié)點(diǎn)與隱層第h個節(jié)點(diǎn)之間的權(quán)重為vih,隱層第h個節(jié)點(diǎn)與輸出層第j個節(jié)點(diǎn)的權(quán)重為wih。根據(jù)以上假設(shè)可以有如下公式:
①激活函數(shù)為;
②隱層第h個神經(jīng)元接收到的輸入為;
③隱層第h個神經(jīng)元的輸出為;
④輸出層第j個神經(jīng)元接收到的輸入為;
⑤輸出層第j個神經(jīng)元的輸出。
由以上5個公式可知,神經(jīng)網(wǎng)絡(luò)之中只要(d+l+1)q+l個參數(shù)確定,則就可以由輸入計(jì)算出輸出,這些參數(shù)分別為輸入層到隱層權(quán)重dq個,隱層到輸出層權(quán)重ql個,隱層神經(jīng)元閾值為q個,輸出層神經(jīng)元閾值為l個。
1.2 模型評價標(biāo)準(zhǔn)
人工神經(jīng)網(wǎng)絡(luò)預(yù)測三大評價指標(biāo)分別為MAE、MAPE、RMSE[8],假設(shè)預(yù)測值為,真實(shí)值為,則評價指標(biāo)定義如下:
①M(fèi)AE (Mean Absolute Error),平均絕對誤差,是絕對誤差的平均值,平均絕對誤差能更好地反映預(yù)測值誤差的實(shí)際情況。范圍[0,+∞),當(dāng)預(yù)測值與真實(shí)值完全吻合時等于0,即完美模型;誤差越大,該值越大。
(1)
②MAPE(Mean Absolute Percentage Error),平均絕對百分比誤差,真實(shí)值范圍(0,+∞),MAPE 為0%表示完美模型,MAPE大于100%則表示劣質(zhì)模型。當(dāng)真實(shí)值有數(shù)據(jù)等于0時,存在分母0除問題,該公式不可用。
(2)
③RMSE(Root Mean Square Error),均方根誤差,范圍[0,+∞),當(dāng)預(yù)測值與真實(shí)值完全吻合時等于0,即完美模型;誤差越大,該值越大。
(3)
2 ?實(shí)證分析
2.1 數(shù)據(jù)來源
西吉縣新營鄉(xiāng)馬鈴薯批發(fā)市場是寧夏馬鈴薯最大交易市場,品種主要是以青薯9號、隴薯7號、青薯168三種為主,其中隴薯7號為新引進(jìn)品種2018年10月份上市,每天定時發(fā)布交易價格,數(shù)據(jù)同步上傳在中國馬鈴薯網(wǎng)(http://www.malingshu7.com/)。選取2016/10/17-2020/2/2青薯9號與青薯168交易單價(各1204個),2018/10/18-2020/2/2隴薯7號交易單價(486個),共2894個樣本數(shù)據(jù),每日價格波動如圖2所示(單位元/公斤)。
2.2 預(yù)處理
將樣本數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)、預(yù)測數(shù)據(jù)、驗(yàn)證數(shù)據(jù)三類。訓(xùn)練數(shù)據(jù)主要用于模型構(gòu)建,調(diào)整相關(guān)參數(shù),使得模型達(dá)到預(yù)測要求。預(yù)測數(shù)據(jù)是模型建構(gòu)完成后預(yù)測的數(shù)據(jù),驗(yàn)證數(shù)據(jù)則是真實(shí)數(shù)據(jù)。通過驗(yàn)證數(shù)據(jù)與預(yù)測數(shù)據(jù)的對比分析,做出結(jié)論。
馬鈴薯的價格波動受各種因素合力決定,例如種植面積、季節(jié)、銷售周期等,西吉馬鈴薯已經(jīng)過市場經(jīng)濟(jì)多年檢驗(yàn),樣本數(shù)據(jù)周期單位為天,屬于高頻、高密度數(shù)據(jù),明顯優(yōu)于周期為周、月、年等數(shù)據(jù),更有利于分析與驗(yàn)證,價格本身已包含并體現(xiàn)著這些綜合因素的影響,故樣本數(shù)據(jù)用時間序列預(yù)測模式排列,用前期價格來預(yù)測后期價格,影響因素不再考慮。
2.3 模型構(gòu)建
Matlab中包含神經(jīng)網(wǎng)絡(luò)工具箱,因此使用Matlab(版本R2018b)軟件進(jìn)行BP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建預(yù)測模型。根據(jù)隱層BP神經(jīng)網(wǎng)絡(luò)理論及結(jié)構(gòu),構(gòu)建多隱含層模型,多隱含層泛化能力強(qiáng),預(yù)測精度高。選擇Matlab神經(jīng)網(wǎng)絡(luò)工具箱中的newff函數(shù)可方便構(gòu)建多隱含層預(yù)測模型,通過編寫程序先進(jìn)行數(shù)據(jù)選擇與歸一化處理,接著利用newff函數(shù)進(jìn)行預(yù)測處理輸出,并計(jì)算MAE、MAPE、RMSE進(jìn)行誤差檢驗(yàn)。
2.4 預(yù)測分析
①青薯9號前1104個交易日價格為訓(xùn)練數(shù)據(jù),預(yù)測后100個交易日數(shù)據(jù),預(yù)測值與真實(shí)值對比如圖3所示。
②青薯168前1104個交易日數(shù)據(jù)為訓(xùn)練數(shù)據(jù),預(yù)測后100個交易日數(shù)據(jù)與真實(shí)值對比如圖4所示。
③隴薯7號選擇前450個交易日數(shù)據(jù)為訓(xùn)練數(shù)據(jù),預(yù)測后36個交易數(shù)據(jù),預(yù)測與真實(shí)值對比如圖5所示。
2.5 評價指標(biāo)分析
三個品種的馬鈴薯預(yù)測數(shù)值與真實(shí)值誤差分析MAE、MAPE、RMSE統(tǒng)計(jì)表1所示,結(jié)果都趨于0,預(yù)測效果好。
柱形圖如圖6所示。
3 ?結(jié)論
本文建立了多隱層BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,通過訓(xùn)練、預(yù)測、檢驗(yàn),保證了預(yù)測模型的高效性和可靠性,整體預(yù)測效果優(yōu)異,能夠?yàn)槲骷R鈴薯短期價格預(yù)測提供科學(xué)參考,同時為其他農(nóng)產(chǎn)品價格預(yù)測提供可信參考。
參考文獻(xiàn):
[1]百度百科.西吉縣, https://baike.baidu.com/item/西吉縣/11021369?fr=aladdin.2019-3-25.
[2]今日美麗興平.西吉縣2020年政府工作報(bào)告, https://m.sohu.com/a/364589910_740774,2020-1-3.
[3]徐克.基于價格分解的鮮活農(nóng)產(chǎn)品短期價格預(yù)測模型[D].中國農(nóng)業(yè)科學(xué)院研究生論文,2016-5-1.
[4]王文晶.基于數(shù)據(jù)挖掘的玉米市場價格預(yù)測[D].青島大學(xué)研究生學(xué)位論文,2017-5-26.
[5]張榮臻,胡堅(jiān).基于Dropout神經(jīng)網(wǎng)絡(luò)的農(nóng)產(chǎn)品價格預(yù)測研究[J],數(shù)字技術(shù)與應(yīng)用,2018,36(9):49-51.
[6]賈寧,鄭純軍.基于LSTM-DA神經(jīng)網(wǎng)絡(luò)的農(nóng)產(chǎn)品價格指數(shù)短期預(yù)測模型[J].計(jì)算機(jī)科學(xué),2019,31(s2):62-65,71.
[7]David Runelhart,Geoffrey Hinton. Error Back Propagation Training, The meeting,1986.
[8]阿培丁.機(jī)器學(xué)習(xí)導(dǎo)論[M].機(jī)械工業(yè)出版社,2009.
基金項(xiàng)目:寧夏師范學(xué)院校級科研項(xiàng)目資助(NXSFYB2006)。
作者簡介:白偉(1984-),男,寧夏中寧人,副教授,碩士,研究方向?yàn)橛?jì)算機(jī)技術(shù)。