李銘 方華(上海理工大學(xué)管理學(xué)院)
糧食安全始終是關(guān)系我國國民經(jīng)濟健康發(fā)展、社會穩(wěn)定和國家安全的重大戰(zhàn)略性問題[1]。俗語“民以食為天”同樣提醒人們不可忽視糧食生產(chǎn)的重要性。21世紀(jì)以來,我國糧食產(chǎn)量穩(wěn)步增長,2020年全國糧食產(chǎn)量達到了66949.2萬噸,實現(xiàn)“十七連豐”,體現(xiàn)出我國糧食生產(chǎn)的穩(wěn)定性。然而,也應(yīng)注意到我國仍然存在很多影響糧食生產(chǎn)穩(wěn)定與安全的不利因素。國內(nèi)方面,隨著“二孩”“三孩”政策的全面放開,我國人地矛盾將更加突出,對糧食生產(chǎn)的需求將持續(xù)擴大;城市化進程逐步加快,侵占耕地與農(nóng)業(yè)生態(tài)環(huán)境污染現(xiàn)象一直存在,部分主產(chǎn)區(qū)土地質(zhì)量下降;重大自然災(zāi)害也在威脅著糧食生產(chǎn),如2021年7月河南省鄭州市暴雨災(zāi)情對農(nóng)業(yè)生產(chǎn)產(chǎn)生致命打擊。國際方面,不斷反復(fù)的新冠肺炎疫情增加了更多不確定性因素,國際糧價上升,造成進口難,以至于曾掀起一輪“屯糧潮”,威脅國內(nèi)糧食安全。國內(nèi)國際糧食生產(chǎn)的一系列不利變化進一步加大了保障糧食生產(chǎn)穩(wěn)定發(fā)展與糧食安全的難度。
山東省作為我國糧食的主產(chǎn)區(qū),一直在我國糧食安全中扮演著重要的角色。據(jù)國家統(tǒng)計局?jǐn)?shù)據(jù),近20年來山東省糧食總產(chǎn)一直占全國糧食產(chǎn)量的7%~8%左右,糧食單位面積產(chǎn)量高于全國糧食單位面積產(chǎn)量。自2002年以來,山東省糧食產(chǎn)量已實現(xiàn)“十六連增”;2014年糧食產(chǎn)量破千億斤大關(guān);2020年糧食產(chǎn)量達5446.8萬噸,連續(xù)7年穩(wěn)定在千億斤以上。
然而受耕地面積減少和退化、生態(tài)環(huán)境污染、人口增長等因素的影響,山東省糧食生產(chǎn)同樣面臨著增產(chǎn)增收的巨大挑戰(zhàn)。正確分析山東省糧食產(chǎn)量的影響因素及其影響程度并對糧食產(chǎn)量進行合理預(yù)測研究,對山東省糧食安全乃至全國糧食安全都具有重要意義。
本文通過運用多元線性回歸方法探究近20年來山東省糧食產(chǎn)量的影響因素及各因素影響程度,在此基礎(chǔ)上運用MLP神經(jīng)網(wǎng)絡(luò)建立山東省糧食產(chǎn)量預(yù)測模型,旨在為山東省糧食生產(chǎn)賦能增效,推動糧食產(chǎn)量提升,為全國糧食生產(chǎn)提供指導(dǎo)和借鑒。
對全國和山東省糧食生產(chǎn)影響因素與預(yù)測的許多研究學(xué)者都提出了自己的觀點。姬萌[1]運用主成分分析法將1995-2014年山東省糧食生產(chǎn)數(shù)據(jù)分為三個時期進行了分析,認(rèn)為長期以來農(nóng)業(yè)機械總動力、農(nóng)田有效灌溉面積、農(nóng)用化肥施用折純量等因素對糧食生產(chǎn)發(fā)揮著主導(dǎo)作用;蘇興[2]等選用全國2000-2019年時間序列數(shù)據(jù),采用多元線性回歸與協(xié)整實證分析方法得出我國糧食產(chǎn)量與種植面積、化肥使用量正相關(guān),與第一產(chǎn)業(yè)勞動人口、成災(zāi)面積負(fù)相關(guān),與農(nóng)業(yè)固定資產(chǎn)投資存在長期均衡關(guān)系;謝杰[3]運用逐步回歸和加權(quán)最小二乘法方法得出全國范圍內(nèi)土地和化肥使用是影響糧食生產(chǎn)的最主要因素;高亮亮[4]等比較了線性回歸與BP神經(jīng)網(wǎng)絡(luò)方法對山東省糧食產(chǎn)量預(yù)測的差異,認(rèn)為BP神經(jīng)網(wǎng)絡(luò)短期預(yù)測更為精確;鄒璀[5]等基于1980-2011年山東省糧食生產(chǎn)數(shù)據(jù),運用ARMA和OLS結(jié)合的方法建立了山東省糧食產(chǎn)量預(yù)測模型。
綜上研究,學(xué)者已經(jīng)對糧食生產(chǎn)影響因素及預(yù)測的各方面和各種方法進行了探究。本文在學(xué)者們研究的基礎(chǔ)上加入山東省近些年糧食生產(chǎn)相關(guān)數(shù)據(jù),選取更多自變量,對山東省糧食生產(chǎn)影響因素進行更為全面的探究,并運用更為精確的神經(jīng)網(wǎng)絡(luò)預(yù)測方法對山東省未來幾年糧食產(chǎn)量進行短期預(yù)測。
本文以山東省2000-2019年糧食生產(chǎn)數(shù)據(jù)為研究對象,相關(guān)指標(biāo)體系數(shù)據(jù)均來自國家統(tǒng)計局官網(wǎng)、《山東省統(tǒng)計年鑒2020》和《中國統(tǒng)計年鑒2020》。因數(shù)據(jù)量偏大,受篇幅限制此處不予以展示。
綜合相關(guān)文獻研究成果的基礎(chǔ)上概括發(fā)現(xiàn),學(xué)者們認(rèn)為影響糧食綜合生產(chǎn)能力的因素主要包括自然基礎(chǔ)、物質(zhì)投入、科技支撐、政策保障、災(zāi)害抵御等方面,為本文指標(biāo)選取提供了重要依據(jù)。另外可依據(jù)柯布-道格拉斯生產(chǎn)函數(shù)選取變量:其中Q表示產(chǎn)量,L、K、G分別表示勞動、資本與土地投入,A為全要素生產(chǎn)率。
最終選取的自變量指標(biāo)如下:一是選取糧食播種面積、有效灌溉面積和第一產(chǎn)業(yè)就業(yè)人員三項指標(biāo)作為糧食生產(chǎn)的勞動與土地投入,作為糧食生產(chǎn)的基本條件。二是選取農(nóng)用化肥施用折純量、農(nóng)村用電量、農(nóng)業(yè)機械總動力、農(nóng)用塑料薄膜使用量、農(nóng)用柴油使用量、農(nóng)藥使用量、水庫總庫容量等指標(biāo)作為糧食生產(chǎn)物質(zhì)與科技投入衡量。三是選取受災(zāi)面積和成災(zāi)面積兩項指標(biāo)作為自然災(zāi)害衡量。四是選取除澇面積和水土流失治理面積作為生態(tài)環(huán)境治理保護衡量。五是選取農(nóng)業(yè)生產(chǎn)資料指數(shù)衡量生產(chǎn)成本。共選取15項指標(biāo)作為解釋變量,糧食產(chǎn)量作為被解釋變量,如表1所示。
表1 變量列表
此外,原計劃選取第一產(chǎn)業(yè)固定資產(chǎn)投資指標(biāo)作為糧食生產(chǎn)的資本投入,遺憾的是山東省2017-2019年第一產(chǎn)業(yè)固定資產(chǎn)投資數(shù)據(jù)缺失,為了保證不同時期影響因素的一致性和可比性,故予以剔除。
土壤、溫度、降雨量、光照等自然條件及國家政策補貼、惠農(nóng)措施等社會因素對糧食生產(chǎn)同樣具有重要作用,但由于難以進行量化,無法直觀衡量,不再加入回歸模型中。
多元線性回歸模型主要用于探究一個因變量與多個自變量的因果關(guān)系,研究各自變量對因變量的影響程度,其理論模型結(jié)構(gòu)如下。
其中,β0為常數(shù)項,β1…βn為回歸系數(shù),μ為隨機干擾項,反映遺漏變量與模型誤差對模型的影響。
采用上述數(shù)據(jù),使用Eviews10.0軟件,利用OLS最小二乘法估計模型,得到如下回歸結(jié)果。
由上述回歸結(jié)果可以進行初步統(tǒng)計檢驗和經(jīng)濟意義檢驗。可決系數(shù)與調(diào)整的可決系數(shù)均大于0.99,擬合優(yōu)度較高;模型同樣通過了F檢驗,充分表明15個自變量整體對因變量糧食產(chǎn)量具有很強的解釋能力,但也應(yīng)該注意到x3、x6、x10、x12、x13、x14的t值偏小,并未通過t檢驗,且部分解釋變量經(jīng)濟意義不合理,不能通過經(jīng)濟意義檢驗。故初步認(rèn)為回歸模型解釋變量間存在多重共線性。
通過生成變量相關(guān)系數(shù)矩陣觀察各解釋變量之間的相關(guān)性,如表2所示,可以看到部分解釋變量之間具有較高的相關(guān)系數(shù),如x9與x10的相關(guān)系數(shù)為0.95,x7與x8的相關(guān)系數(shù)為0.89,x12與x14的相關(guān)系數(shù)為-0.89等。
表2 變量相關(guān)系數(shù)表
下面進行多重共線性的修正,選擇逐步回歸法消除多重共線性。首先分別做被解釋變量與每個解釋變量的輔助回歸,選取可決系數(shù)最高的解釋變量構(gòu)建基礎(chǔ)模型。經(jīng)比較,y與x1輔助回歸的可決系數(shù)最高,為0.877716,將其選擇為基礎(chǔ)模型,而后逐步引入其他變量,逐步回歸結(jié)果如表3所示。
表3 逐步回歸結(jié)果
在基礎(chǔ)模型中引入x10,可決系數(shù)明顯提高,且能夠通過顯著性檢驗與經(jīng)濟意義檢驗。在此基礎(chǔ)上繼續(xù)引入其他解釋變量,發(fā)現(xiàn)引入x12能使可決系數(shù)顯著提升,并通過了顯著性檢驗。以此類推,以使可決系數(shù)提高為目的,以變量顯著性與經(jīng)濟意義合理性為限制條件,繼續(xù)引入x15,可決系數(shù)提升至0.9940。準(zhǔn)備引入第5個變量x8時,發(fā)現(xiàn)其P值過大,但若再引進變量x11,即可使x8通過顯著性檢驗,并使可決系數(shù)變大。若繼續(xù)引用其他變量則會對模型產(chǎn)生不利影響,因此模型中不再引入其余變量。最終引入x1、x10、x12、x15、x8、x116個解釋變量。
對逐步回歸后得到的回歸模型如下。
進行經(jīng)濟意義檢驗、異方差檢驗和序列相關(guān)檢驗。
1.經(jīng)濟意義檢驗
多元線性回歸模型顯示,山東省糧食產(chǎn)量與糧食播種面積、水土流失治理面積呈正相關(guān)。糧食播種面積和水土流失治理面積每增加1個單位,糧食產(chǎn)量分別增加0.598125個單位和0.199835個單位。山東省糧食產(chǎn)量與農(nóng)藥使用量、成災(zāi)面積、農(nóng)業(yè)生產(chǎn)資料價格指數(shù)、第一產(chǎn)業(yè)就業(yè)人員呈負(fù)相關(guān)。農(nóng)藥使用量和成災(zāi)面積每增加1個單位,糧食產(chǎn)量分別減少32.82135個單位和0.227053個單位;農(nóng)業(yè)生產(chǎn)資料價格指數(shù)和第一產(chǎn)業(yè)就業(yè)人員每增加1個單位,糧食產(chǎn)量分別減少7.368045個單位和0.325425個單位。6個解釋變量皆通過了經(jīng)濟意義檢驗,與現(xiàn)實經(jīng)濟意義相符。
2.異方差檢驗
選用BP檢驗法,檢驗結(jié)果顯示如下。
故5%的顯著性水平下接受模型隨機干擾項方差相同的假設(shè),可認(rèn)為不存在異方差性。
3.序列相關(guān)檢驗
進一步檢驗自相關(guān)性。模型DW值為2.367445,在5%的顯著性水平下,n=20,k=6,查表得dL=0.691,dU=2.162,DW>dU。故模型不存在一階自相關(guān)。
在分析得到山東省糧食生產(chǎn)的6個主要影響因素后,本文繼續(xù)利用MLP神經(jīng)網(wǎng)絡(luò)方法建立山東省糧食產(chǎn)量預(yù)測模型。
由于采用MLP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,需要對變量做標(biāo)準(zhǔn)化處理,以消除量綱不統(tǒng)一對預(yù)測的不利影響。標(biāo)準(zhǔn)化處理公式如下。
其中xi為各解釋變量的當(dāng)前實際值;minxi、maxxi分別為各解釋變量的最小值與最大值;為標(biāo)準(zhǔn)化后的實際值。
多層感知器(Muti-Layer Perception,MLP)神經(jīng)網(wǎng)絡(luò)模型是最常用的神經(jīng)網(wǎng)絡(luò)模型之一。MLP網(wǎng)絡(luò)包括輸入層、隱藏層和輸出層,上一層的任何一個神經(jīng)元都與下一層的所有神經(jīng)元相連接,以實現(xiàn)全連接。將6個解釋變量數(shù)據(jù)輸入至輸入層,輸出層為糧食產(chǎn)量,兩者之間為隱藏層,設(shè)置限制為1~50個。
MLP神經(jīng)網(wǎng)絡(luò)方法較適合進行短期預(yù)測,且預(yù)測精度普遍高于線性回歸模型。
以2000-2014年6個影響因素數(shù)據(jù)為訓(xùn)練集,以2015-2019年數(shù)據(jù)作為檢驗集。利用SPSS 26.0軟件建立MLP神經(jīng)網(wǎng)絡(luò)模型。選用標(biāo)度共軛梯度優(yōu)化算法,隱藏層函數(shù)為雙曲正切函數(shù),輸出層隱藏函數(shù)為恒等式。
訓(xùn)練集顯示平方和誤差為0.038,相對誤差為0.006;檢驗集顯示平方和誤差為0.031,相對誤差為0.006。如圖1顯示,MLP神經(jīng)網(wǎng)絡(luò)模型預(yù)測值與y實際值的散點圖基本沿45度線呈線性趨勢,表明模型擬合效果良好。
圖1 預(yù)測值與實際值散點圖
下面對檢驗集預(yù)測結(jié)果的精度進行詳細分析,詳情如表4所示??梢?,基于MLP神經(jīng)網(wǎng)絡(luò)的糧食產(chǎn)量預(yù)測精度變化較小,5年的預(yù)測精度都在98.7%以上,2018年的相對誤差僅有0.0633552%,平均相對誤差為0.702147%,體現(xiàn)了模型較強的穩(wěn)定性與準(zhǔn)確性。
表4 檢驗集糧食產(chǎn)量預(yù)測精度
經(jīng)過模型的訓(xùn)練與檢驗可發(fā)現(xiàn)MLP神經(jīng)網(wǎng)絡(luò)模型非常適合對山東省未來幾年內(nèi)糧食產(chǎn)量的預(yù)測。只需獲得6個解釋變量的估計數(shù)據(jù)或?qū)嶋H數(shù)據(jù),就可較精準(zhǔn)地預(yù)測出山東省當(dāng)年的糧食產(chǎn)量。由于本文只研究山東省近20年的數(shù)據(jù),數(shù)據(jù)量偏少,且受制于數(shù)據(jù)的可獲得性(如2000年以前山東省水土流失治理面積數(shù)據(jù)缺失等),無法加入更多數(shù)據(jù)進行訓(xùn)練和檢驗,使模型存在一些問題與不足。
一是基于學(xué)者們對糧食產(chǎn)量影響因素的研究成果,并結(jié)合柯布-道格拉斯生產(chǎn)函數(shù)選取了近20年來可能影響山東省糧食生產(chǎn)的15個影響因素。采用逐步回歸法消除原始模型的多重共線性問題,建立了包含6個解釋變量的多元線性回歸模型。模型顯示,糧食播種面積和水土流失治理面積對山東省糧食產(chǎn)量產(chǎn)生正向影響,體現(xiàn)出生態(tài)治理對糧食生產(chǎn)的重要積極作用;農(nóng)藥使用量、受災(zāi)面積、農(nóng)業(yè)生產(chǎn)資料價格指數(shù)和第一產(chǎn)業(yè)就業(yè)人員對山東省糧食產(chǎn)量產(chǎn)生負(fù)向影響,體現(xiàn)出農(nóng)藥、自然災(zāi)害、農(nóng)業(yè)生產(chǎn)成本上升等對糧食生產(chǎn)產(chǎn)生的不利影響。第一產(chǎn)業(yè)就業(yè)人員與糧食產(chǎn)量呈負(fù)相關(guān)的結(jié)論基本與程名望[6]等學(xué)者的研究結(jié)論相似,即農(nóng)村勞動力轉(zhuǎn)移并不會影響主產(chǎn)區(qū)的糧食產(chǎn)量。目前,針對山東省來看,農(nóng)業(yè)就業(yè)人員已達到飽和狀態(tài),增加農(nóng)業(yè)就業(yè)人員甚至?xí)a(chǎn)生負(fù)向影響。6個影響因素中農(nóng)藥使用量彈性系數(shù)為-32.82135,對山東省糧食產(chǎn)量影響最大,農(nóng)藥的使用對糧食產(chǎn)量的貢獻已處于邊際遞減階段,亟須轉(zhuǎn)變農(nóng)藥使用方式,促進生態(tài)化發(fā)展。
二是在得到影響山東省糧食生產(chǎn)的6個因素后,利用MLP神經(jīng)網(wǎng)絡(luò)模型構(gòu)建山東省糧食產(chǎn)量預(yù)測模型,發(fā)現(xiàn)模型具有較高的預(yù)測精度,具備穩(wěn)定性和準(zhǔn)確性,可用于預(yù)測未來幾年內(nèi)山東省糧食產(chǎn)量。