張文政 孫德山 王玥 張蕾
摘?要?隨著中國(guó)經(jīng)濟(jì)的不斷發(fā)展,城市化進(jìn)程不斷推進(jìn),總?cè)丝谥鹉暝黾?農(nóng)村人口逐年減少,糧食的需求量逐年增加,某些貧困地區(qū)已經(jīng)出現(xiàn)糧食短缺的狀況.本文選取了1986年-2016年遼寧省年糧食總產(chǎn)量、有效灌溉面積、農(nóng)業(yè)化肥施用量、農(nóng)業(yè)機(jī)械總動(dòng)力、播種面積以及受災(zāi)面積等相關(guān)數(shù)據(jù).利用支持向量機(jī)回歸、線性回歸,隨機(jī)森林三種方法,對(duì)遼寧省糧食產(chǎn)量進(jìn)行了預(yù)測(cè),并比較了三種方法預(yù)測(cè)的精準(zhǔn)度.
關(guān)鍵詞?支持向量機(jī);線性回歸;隨機(jī)森林;核函數(shù)
中圖分類號(hào) ?O212.4?文獻(xiàn)標(biāo)識(shí)碼?A
Abstract?With the continuous development of China's economy, the process of urbanization is advancing, and ?the total population is increasing year by year, but the population of rural areas is decreasing year after year. As time goes on ,the demand for grain has increased , and some poor areas have already appeared in the condition of grain shortage. In this paper, the total annual grain output, the effective irrigation area, the amount of agricultural fertilizer application, the total power of agricultural machinery, the sown area and the affected area of ?Liaoning province from 1986 to 2016 were selected. By using three methods of support vector machine regression, linear regression and random forest, the grain yield of Liaoning province was predicted, and the accuracy of the three methods was compared.
Key words?support vector machine; linear regression; random forest; kernel function
1?引?言
糧食問(wèn)題一直以來(lái)都是世界關(guān)注的焦點(diǎn),糧食不僅關(guān)乎國(guó)計(jì)民生的問(wèn)題,也關(guān)乎著社會(huì)安定以及經(jīng)濟(jì)能否持續(xù)發(fā)展.我國(guó)從古至今都非常重視糧食問(wèn)題,一直將糧食的生產(chǎn)放在國(guó)民經(jīng)濟(jì)的首位[1].隨著城市化進(jìn)程不斷推進(jìn),總?cè)丝诓粩嘣黾?,農(nóng)村人口不斷減少的背景下,對(duì)糧食的需求將進(jìn)一步擴(kuò)大.如果糧食的產(chǎn)量得不到提高,糧食的供給與需求的缺口便會(huì)越來(lái)越大.那么如何提高糧食產(chǎn)量,就必須分析影響糧食產(chǎn)量的因素以及糧食產(chǎn)量的變化趨勢(shì).
影響糧食產(chǎn)量的因素千絲萬(wàn)縷,這些因素對(duì)糧食產(chǎn)量作用機(jī)制又很難用數(shù)學(xué)語(yǔ)言來(lái)表示,這就使數(shù)學(xué)預(yù)測(cè)模型難以建立.傳統(tǒng)的預(yù)測(cè)方法有:線性回歸法、時(shí)間序列法、灰色理論法等,后來(lái)也發(fā)展出許多其他預(yù)測(cè)的方法,如神經(jīng)網(wǎng)絡(luò)法、混沌理論法等.國(guó)內(nèi)外專家學(xué)者對(duì)糧食產(chǎn)量的研究眾多,在國(guó)內(nèi)的研究中,由于我國(guó)地域遼闊,氣候多樣,糧食品種繁多,因此我國(guó)專家學(xué)者的研究主要分為全國(guó)糧食的研究和區(qū)域糧食研究?jī)纱箢怺2].在全國(guó)糧食的研究中,劉杰[3]構(gòu)建了一種加權(quán)的馬爾科夫預(yù)測(cè)模型,與傳統(tǒng)的馬爾科夫鏈相比,加權(quán)的馬爾科夫鏈方法的誤差更小精度更高.陳錫康等人[4]探討了農(nóng)業(yè)復(fù)雜巨系統(tǒng)的特點(diǎn),提出了預(yù)測(cè)全國(guó)糧食產(chǎn)量的系統(tǒng)綜合因素預(yù)測(cè)法.在區(qū)域糧食研究中:周永生等人[5]利用多元線性回歸方法對(duì)影響糧食產(chǎn)量的各種因素進(jìn)行分析,構(gòu)建廣西糧食產(chǎn)量預(yù)測(cè)模型.龔波等人[6]運(yùn)用灰色相對(duì)關(guān)聯(lián)分析,以糧食產(chǎn)量作為系統(tǒng)特征序列數(shù)據(jù),構(gòu)建糧食產(chǎn)量的灰色GM(1,N)模型,對(duì)湖南省2015年糧食產(chǎn)量進(jìn)行擬合和預(yù)測(cè).ZHOU等人[7]以單期植被指數(shù)(VIS)和多光譜遙感(MS)和數(shù)字圖像為基礎(chǔ),對(duì)水稻產(chǎn)量進(jìn)行了預(yù)測(cè),并確定了水稻產(chǎn)量預(yù)測(cè)的最佳時(shí)期和最優(yōu)VIS.國(guó)外對(duì)于糧食產(chǎn)量的研究主要依據(jù)氣候,然后基于氣候的影響對(duì)糧食產(chǎn)量作出短期預(yù)測(cè)[2].然而結(jié)合遼寧省氣候多變這一情況,只是基于氣候很難作出精準(zhǔn)預(yù)測(cè),而且短期預(yù)測(cè)也很難對(duì)政府提出有效建議. 本文運(yùn)用了支持向量機(jī)的方法對(duì)遼寧糧食產(chǎn)量進(jìn)行分析,建立了遼寧糧食產(chǎn)量預(yù)測(cè)模型,該模型的優(yōu)勢(shì)在于綜合考慮了遼寧省糧食產(chǎn)量的主要影響因素.支持向量機(jī)的擬合和泛化能力是最好的,這是因?yàn)榧Z食數(shù)據(jù)屬于小樣本數(shù)據(jù),支持向量機(jī)基于結(jié)構(gòu)風(fēng)險(xiǎn)最小,較好地解決了小樣本、非線性、過(guò)擬合,維數(shù)災(zāi)難等問(wèn)題.
遼寧省欲打造振興東北重要增長(zhǎng)極,糧食問(wèn)題在全省經(jīng)濟(jì)社會(huì)發(fā)展中始終處于重要位置.因此提前預(yù)測(cè)遼寧省糧食產(chǎn)量,對(duì)有關(guān)部門(mén)及時(shí)進(jìn)行糧食的調(diào)入調(diào)出和安排庫(kù)存具有重要參考價(jià)值.
由表4可知,利用支持向量模型預(yù)測(cè)遼寧省玉米、稻谷、大豆的產(chǎn)量依然精準(zhǔn),故利用支持向量機(jī)分析遼寧省糧食產(chǎn)量問(wèn)題具有一定的可行性.
4?結(jié)?論
本文在運(yùn)用了支持向量機(jī)的方法對(duì)遼寧糧食產(chǎn)量進(jìn)行分析的基礎(chǔ)上,綜合運(yùn)用了線性回歸,隨機(jī)森林等方法,建立了遼寧糧食產(chǎn)量預(yù)測(cè)模型,該模型的優(yōu)勢(shì)在于綜合考慮了遼寧省糧食產(chǎn)量的主要影響因素. 由表2可知,支持向量回歸的相對(duì)誤差均小于10%,而線性回歸模型的預(yù)測(cè)精度不高,主要是不能捕捉到糧食數(shù)據(jù)的非線性特征.而相比于隨機(jī)森林,支持向量機(jī)的擬合和泛化能力是最好的,這是因?yàn)榧Z食數(shù)據(jù)屬于小樣本數(shù)據(jù),支持向量機(jī)基于結(jié)構(gòu)風(fēng)險(xiǎn)最小,較好地解決了小樣本、非線性、過(guò)擬合和維數(shù)災(zāi)難等問(wèn)題.表明SVR在糧食產(chǎn)量的預(yù)測(cè)中具有一定的可行性.
參考文獻(xiàn)
[1]?田秀芹. 基于多元線性回歸的糧食產(chǎn)量預(yù)測(cè)[J].科技創(chuàng)新與應(yīng)用,2017(16):3-4.
[2]?鄒璀,劉秀麗.山東省糧食產(chǎn)量預(yù)測(cè)研究[J].系統(tǒng)科學(xué)與數(shù)學(xué), 2013,33 (1) :97-109.
[3]?劉杰.基于加權(quán)馬氏鏈的全國(guó)糧食產(chǎn)量預(yù)測(cè)研究[J].廊坊師范學(xué)院學(xué)報(bào):自然科學(xué)版,2015,15 (1) :56-59.
[4]?陳錫康,楊翠紅.農(nóng)業(yè)復(fù)雜巨系統(tǒng)的特點(diǎn)與全國(guó)糧食產(chǎn)量預(yù)測(cè)研究[J].系統(tǒng)工程理論與實(shí)踐 ,2002,22 (6) :108-112.
[5]?周永生,肖玉歡,黃潤(rùn)生.基于多元線性回歸的廣西糧食產(chǎn)量預(yù)測(cè)[J].南方農(nóng)業(yè)學(xué)報(bào),2011,42(9) :1165-1167.
[6]?龔波,肖國(guó)安,張四梅. 基于灰色系統(tǒng)理論的湖南糧食產(chǎn)量預(yù)測(cè)研究[J].湖南科技大學(xué)學(xué)報(bào):社會(huì)科學(xué)版, 2012 , 15 (5) :62-65.
[7]?ZHOU X, ZHENG H B, XU X Q, et ?al.Predicting grain yield in rice using multi-temporal vegetation indices from UAV-based multispectral and digital imagery[J],ISPRS Journal of Photogrammetry& Remote Sensing, 2017 , 130 :246-255.
[8]?鄭建安. 主成分和BP神經(jīng)網(wǎng)絡(luò)在糧食產(chǎn)量預(yù)測(cè)中的組合應(yīng)用[J].計(jì)算機(jī)系統(tǒng)與應(yīng)用, 2016,25 (11) :274-278.
[9]CORTESC,VAPNIKV.Support-vector networks[J].Machine Learning.1995.20(3): 273-297.
[10]向昌盛,周子英,武力娜.糧食產(chǎn)量預(yù)測(cè)的支持向量機(jī)模型研究[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版, 2010 , 11 (1) :6-10.