趙雷,楊波,劉勇,牟少敏,溫孚江
山東農(nóng)業(yè)大學(xué)農(nóng)業(yè)大數(shù)據(jù)研究中心,山東 泰安 271018
基于大數(shù)據(jù)的玉米田四代棉鈴蟲發(fā)生量的預(yù)測(cè)模型
趙雷,楊波,劉勇,牟少敏,溫孚江
山東農(nóng)業(yè)大學(xué)農(nóng)業(yè)大數(shù)據(jù)研究中心,山東 泰安 271018
提出了一種基于支持向量機(jī)的預(yù)測(cè)模型。根據(jù)山東省1999-2013年玉米田第四代棉鈴蟲發(fā)生程度采集的數(shù)據(jù),采用支持向量回歸(SVR)算法,構(gòu)建了玉米田第四代棉鈴蟲發(fā)生程度與其關(guān)聯(lián)因子間的非線性關(guān)系模型,并對(duì)該方法進(jìn)行了測(cè)試與分析。結(jié)果表明,由SVR預(yù)測(cè)模型得到的預(yù)測(cè)發(fā)生量與實(shí)際發(fā)生量基本一致,預(yù)測(cè)的平均絕對(duì)百分比誤差為4.36%,預(yù)測(cè)值與實(shí)際值的相關(guān)系數(shù)為0.960 6,為玉米田第四代棉鈴蟲的有效防控提供了科學(xué)指導(dǎo)。
農(nóng)業(yè)大數(shù)據(jù);棉鈴蟲;支持向量回歸;監(jiān)測(cè)預(yù)警;玉米
隨著云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的迅猛發(fā)展,數(shù)據(jù)正以前所未有的速度不斷地增長(zhǎng)和累積,大數(shù)據(jù)時(shí)代已經(jīng)來臨。依靠數(shù)據(jù)分析獲得洞察力,做出更好的業(yè)務(wù)決策是數(shù)據(jù)分析挖掘的主要目的[1,2]。
預(yù)測(cè)是大數(shù)據(jù)的核心。跳出傳統(tǒng)的因果關(guān)系的思維局限,通過對(duì)大量數(shù)據(jù)的搜集、挖掘和分析,發(fā)現(xiàn)數(shù)據(jù)間隱藏的相關(guān)關(guān)系,從而揭示事物發(fā)生和發(fā)展的內(nèi)在規(guī)律,能做出更快、更符合實(shí)際的預(yù)測(cè)[3,4]。如英國(guó)和美國(guó)科學(xué)家在《Science》發(fā)文指出,全球變暖會(huì)導(dǎo)致非洲和南美洲高原地帶瘧疾的流行[5];基于多年的數(shù)據(jù)挖掘和分析,荷蘭科學(xué)家指明,新煙堿類殺蟲劑吡蟲啉的應(yīng)用是本地食蟲鳥類種群數(shù)量減少的主要原因[6]。因此,借助于大數(shù)據(jù)的研究手段和方法,能夠使已有的農(nóng)業(yè)數(shù)據(jù)“活起來”,認(rèn)識(shí)其內(nèi)在的關(guān)聯(lián)性,預(yù)測(cè)發(fā)展趨勢(shì),使其在指導(dǎo)生產(chǎn)活動(dòng)中產(chǎn)生價(jià)值[7-10]。
棉鈴蟲屬鱗翅目、夜蛾科,是一種重要的農(nóng)業(yè)害蟲,寄主范圍廣。近年來,隨Bt棉的大范圍種植,第四代棉鈴蟲對(duì)玉米葉片和果穗,特別是果穗的危害逐漸加重,造成玉米產(chǎn)量下降,品質(zhì)降低[11]。截至目前,國(guó)內(nèi)外對(duì)棉鈴蟲的監(jiān)測(cè)預(yù)警研究主要是依靠有限的氣象因素,如溫度、降雨和光周期等[12-14],采用線性回歸分析,建立相關(guān)模型,開展對(duì)棉花田棉鈴蟲的預(yù)測(cè)研究。而對(duì)玉米棉鈴蟲的監(jiān)測(cè)預(yù)警未見報(bào)道。本文基于大數(shù)據(jù)理念,依據(jù)已有的數(shù)據(jù)積累,采用支持向量回歸(SVR)算法,建立了預(yù)測(cè)玉米田第四代棉鈴蟲發(fā)生量的支持向量機(jī)模型,為指導(dǎo)玉米田第四代棉鈴蟲的發(fā)生預(yù)測(cè)及科學(xué)防治打下了基礎(chǔ)。
2.1 數(shù)據(jù)來源
本文涉及的變量主要有1999-2013年山東省濱州地區(qū)玉米田第四代棉鈴蟲的發(fā)生量及氣象數(shù)據(jù),主要包括7月中旬到8月上旬的平均氣溫、降水量、最高氣溫(≥35℃)的日數(shù)、降水(≥10 mm)的日數(shù)、極大風(fēng)速、平均本站氣壓、平均風(fēng)速、平均水汽壓、平均相對(duì)濕度、日最低本站氣壓、日最低氣溫、日最高本站氣壓、日最高氣溫、最大風(fēng)速、最大風(fēng)速的風(fēng)向和最小相對(duì)濕度,分別計(jì)算出每年月氣象因子的平均數(shù)。1999-2013年第四代棉鈴蟲的發(fā)生量資料來自山東省濱州地區(qū)植保部門;該時(shí)期的逐日氣象觀測(cè)資料來自國(guó)家氣象信息中心。
2.2 支持向量機(jī)
2.2.1 支持向量機(jī)的基本思想
支持向量機(jī)(support vector machines,SVM)是Vapnik等人根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論提出的機(jī)器學(xué)習(xí)方法[15]?;舅枷胧峭ㄟ^一個(gè)非線性映射把樣本空間映射到一個(gè)高維特征空間中,將尋找最優(yōu)線性回歸超平面的算法歸結(jié)為求解一個(gè)凸約束特性下的凸規(guī)劃問題,并得到全局最優(yōu)解。同時(shí)支持向量機(jī)通過定義核函數(shù)(kernel function),將高維空間中的內(nèi)積運(yùn)算轉(zhuǎn)化為原空間中的核函數(shù)運(yùn)算(如圖1所示)。由于棉鈴蟲的發(fā)生具有非線性、不穩(wěn)定、多變量的特點(diǎn),對(duì)于其蟲害發(fā)生系統(tǒng),很難用確切的公式和解析方法將棉鈴蟲發(fā)生的規(guī)律表達(dá)出來[16]。而這種信息處理方式正是支持向量機(jī)所具備的,因此,將支持向量回歸用于棉鈴蟲發(fā)生量的建模和預(yù)測(cè)分析。
圖1 支持向量機(jī)結(jié)構(gòu)示意
2.2.2 支持向量回歸預(yù)測(cè)方法
支持向量機(jī)的回歸[17]函數(shù)擬合分為線性擬合和非線性擬合,首先考慮線性擬合函數(shù)。假設(shè)有一個(gè)樣本集為:(y1,x1),(y2,x2),…,(yi,xi),y∈R,回歸函數(shù)線性方程表示如下:
跟基礎(chǔ)定義的線性可分原理一樣,通過函數(shù)的最小值找到最佳的回歸函數(shù),得出:
其中,w代表W的維數(shù),ξ和ξ*為松弛變量,ξ為上限,ξ*為下限。Vapnik定義不敏感耗損函數(shù)為:
得到對(duì)偶優(yōu)化方程為:
于是得到支持向量機(jī)的回歸函數(shù):
其中,ai、ai*將只有小部分不為0,它們對(duì)應(yīng)的樣本就是支持向量。
對(duì)于非線性的支持向量機(jī)的回歸,通過一個(gè)非線性映射把數(shù)據(jù)x映射到高維特征空間,然后可以在這個(gè)空間進(jìn)行線性回歸,也就是類似于分類問題。跟支持向量機(jī)定義的線性不可分的原理類似,在它的基礎(chǔ)上進(jìn)行回歸,需用到一個(gè)非敏感性損耗函數(shù),且目標(biāo)函數(shù)為:
其約束條件是跟式(4)的約束條件一樣。可通過求得的ai和ai*,得到回歸函數(shù):
2.2.3 核函數(shù)
核函數(shù)在支持向量回歸中起著重要的作用,它不僅可以解決非線性問題,克服維數(shù)災(zāi)難問題,而且還可以代替高維特征空間中的內(nèi)積運(yùn)算,避免高維度運(yùn)算的復(fù)雜性。
支持向量機(jī)核函數(shù)的回歸預(yù)測(cè)在諸如疾病預(yù)測(cè)、天氣預(yù)測(cè)、市場(chǎng)預(yù)測(cè)、股價(jià)預(yù)測(cè)等很多方面都得到了廣泛應(yīng)用。核函數(shù)主要有4種。本文將徑向基核函數(shù)(RBF)應(yīng)用于支持向量回歸模型中,支持向量回歸對(duì)玉米田第四代棉鈴蟲的發(fā)生量預(yù)測(cè)從線性到非線性轉(zhuǎn)換,是通過徑向基核函數(shù)。徑向基核函數(shù)能夠針對(duì)棉鈴蟲的發(fā)生具有非線性、不穩(wěn)定性和多變量的特點(diǎn)進(jìn)行處理。
徑向基核函數(shù)為:
3.1 數(shù)據(jù)的預(yù)處理
本文是以濱州地區(qū)玉米地1999-2010年玉米田第四代棉鈴蟲的實(shí)際發(fā)生量作為訓(xùn)練樣本(見表1),基于支持向量機(jī)理論,建立支持向量回歸第四代棉鈴蟲發(fā)生量的預(yù)測(cè)模型,以2011-2013年第四代棉鈴蟲發(fā)生量數(shù)據(jù)進(jìn)行預(yù)測(cè)(見表2)。為了提高數(shù)據(jù)之間的可比性和收斂速度、縮短訓(xùn)練時(shí)間,本文在對(duì)數(shù)據(jù)處理時(shí),先對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理。
表1 支持向量回歸擬合結(jié)果與實(shí)際值對(duì)比
表2 支持向量回歸預(yù)測(cè)結(jié)果與實(shí)際值對(duì)比
其中,xi是原始數(shù)據(jù);xi′為歸一化后的數(shù)據(jù);xmin和xmax分別代表數(shù)據(jù)的最小值和最大值。將數(shù)據(jù)壓縮到[0,1]。
3.2 模型參數(shù)的選取
本研究中,采用LIBSVM-3.20軟件包來建立SVR模型。通過對(duì)各種核函數(shù)進(jìn)行測(cè)試,最終確定預(yù)測(cè)模型的核函數(shù)為徑向基核函數(shù)。模型的參數(shù)按照相應(yīng)的標(biāo)準(zhǔn)來選取,本文選定的滑動(dòng)窗口寬度(嵌入維數(shù))為16,用gridregression.py自動(dòng)搜索最佳懲罰參數(shù)、靈敏度及徑向?qū)挾鹊群撕瘮?shù)參數(shù)。
3.3 基于SVR的第四代棉鈴蟲發(fā)生量預(yù)測(cè)模型
根據(jù)式(10)得到實(shí)際值與擬合值之間的相關(guān)系數(shù)[18],得到的數(shù)據(jù)表明實(shí)際值和擬合值之間有高度的相關(guān)性,相關(guān)系數(shù)接近1,擬合效果好。數(shù)據(jù)表明實(shí)際值與預(yù)測(cè)值之間的相關(guān)系數(shù)為0.96,有高度的相關(guān)性,預(yù)測(cè)結(jié)果與實(shí)際值相符合。
通過回歸模型得到的訓(xùn)練集樣本的擬合值與實(shí)際值相符合(如圖2所示),而測(cè)試集樣本的預(yù)測(cè)值與實(shí)際值相匹配(如圖3所示)。
圖2 訓(xùn)練集擬合結(jié)果
圖3 樣本的預(yù)測(cè)結(jié)果
其中,yi為樣本的實(shí)際值,為樣本的預(yù)測(cè)值,n為預(yù)測(cè)樣本數(shù)。
支持向量機(jī)的預(yù)測(cè)準(zhǔn)確率用偏差來表示,主要包括平均絕對(duì)誤差(MAE)、平均相對(duì)誤差(MRE)、均方根誤差(RMSE),表達(dá)式如下:
其中,yi為樣本的實(shí)際值,為樣本的預(yù)測(cè)值,n為預(yù)測(cè)樣本數(shù)。
用式(11)~式(13)來計(jì)算偏差,計(jì)算結(jié)果見表3。結(jié)果表明,擬合誤差水平相當(dāng)?shù)停A(yù)測(cè)誤差水平高于擬合誤差??傮w而言,誤差水平總體較低,MAE低于2,MRE低于5%,RMSE低于4。而由表2可知,除了2013年的相對(duì)誤差達(dá)到8.01%之外,其他樣本的相對(duì)誤差均較小。由此可知,基于SVR的玉米田第四代棉鈴蟲發(fā)生量預(yù)測(cè)模型具有可行性。
表3 預(yù)測(cè)樣本的MAE、MRE、RMSE值
玉米田棉鈴蟲的發(fā)生具有復(fù)雜的非線性變化規(guī)律,要建立精確的數(shù)學(xué)模型相當(dāng)困難,因此,根據(jù)大數(shù)據(jù)的理念,將支持向量機(jī)引入第四代棉鈴蟲發(fā)生量的預(yù)測(cè)中。支持向量機(jī)不需要對(duì)數(shù)據(jù)分布性質(zhì)做任何假設(shè),通用性較強(qiáng),實(shí)驗(yàn)結(jié)果表明,將SVR用于玉米田第四代棉鈴蟲發(fā)生量建模與預(yù)測(cè),能較好地揭示玉米田第四代棉鈴蟲的發(fā)生規(guī)律。傳統(tǒng)的模型主要集中在對(duì)棉田棉鈴蟲的發(fā)生預(yù)測(cè)上。傳統(tǒng)的方法主要有多元線性回歸分析[12]、二級(jí)分辨率模型、Fisher模型、期距法等數(shù)十種。近年來,隨著物聯(lián)網(wǎng)、機(jī)器學(xué)習(xí)等技術(shù)的迅速發(fā)展,出現(xiàn)了更為方便、準(zhǔn)確率更高的預(yù)測(cè)方法。如黃健等人[14]利用人工神經(jīng)網(wǎng)絡(luò)(ANN)模型對(duì)新疆地區(qū)1990-2007年第二代棉鈴蟲的發(fā)生等級(jí)進(jìn)行預(yù)測(cè)的結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型的擬合精度和預(yù)報(bào)精度高于逐步回歸模型。朱軍生等人[19]利用1966-1995年山東惠民縣棉鈴蟲的監(jiān)測(cè)數(shù)據(jù)建立了基于徑向基小波神經(jīng)網(wǎng)絡(luò)的第二代棉鈴蟲卵峰日期預(yù)測(cè)模型,結(jié)果表明,在5年的預(yù)測(cè)數(shù)據(jù)中,4年的預(yù)測(cè)數(shù)據(jù)偏差在3天以內(nèi),另外一年的預(yù)測(cè)數(shù)據(jù)偏差為4天。這對(duì)于卵峰日的預(yù)測(cè)偏差較大。以前對(duì)棉鈴蟲的預(yù)測(cè),大都是對(duì)棉田第二、三代棉鈴蟲發(fā)生期、發(fā)生等級(jí)的預(yù)測(cè),而未見對(duì)玉米田主害代棉鈴蟲進(jìn)行預(yù)測(cè)。雖然基于人工神經(jīng)網(wǎng)絡(luò)的模型比傳統(tǒng)的預(yù)測(cè)模型效果好,但是人工神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)過擬合、維數(shù)災(zāi)難等問題;徑向基小波神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)復(fù)雜。而支持向量機(jī)模型可以很好地解決小樣本、非線性、過擬合、維數(shù)災(zāi)難和局部最優(yōu)的問題,結(jié)構(gòu)簡(jiǎn)單,便于應(yīng)用。因此,首次將SVR應(yīng)用到玉米田第四代棉鈴蟲發(fā)生量的預(yù)測(cè)上。
從理論上講,SVR算法得到全局最優(yōu),可解決其他神經(jīng)網(wǎng)絡(luò)算法無法避免的局部最優(yōu)問題;SVR預(yù)測(cè)是把線性回歸轉(zhuǎn)為非線性,需要將內(nèi)機(jī)核函數(shù)轉(zhuǎn)換為高維空間的非線性映射,計(jì)算的復(fù)雜性取決于支持向量機(jī)的數(shù)目,不是樣本空間的維數(shù),因此,從一定層面上避免了維數(shù)災(zāi)難的問題。
但是,SVR算法是半監(jiān)督式學(xué)習(xí)算法,其模型具有一定的局限性,由表1可知,2011-2013年的預(yù)測(cè)值的相對(duì)誤差逐漸增大,與實(shí)際值相差逐漸偏大,說明預(yù)測(cè)的年份距建立模型的年份越遠(yuǎn),預(yù)測(cè)結(jié)果偏差越大。這需要連續(xù)跟蹤現(xiàn)實(shí)數(shù)據(jù)的采集,不斷優(yōu)化預(yù)測(cè)模型。
氣象因子是影響玉米第四代棉鈴蟲種群發(fā)生和發(fā)展的重要因子。本文通過對(duì)氣象因子進(jìn)行分析,建立基于SVR的玉米第四代棉鈴蟲的預(yù)測(cè)模型,得到較為準(zhǔn)確的結(jié)果。但在2006年,預(yù)測(cè)相對(duì)誤差達(dá)到4.07%,推測(cè)原因主要有以下兩點(diǎn)。
● 歷史數(shù)據(jù)的限制。過去十幾年采集的數(shù)據(jù)量小、數(shù)據(jù)范圍比較窄。2014年以后,擴(kuò)展了數(shù)據(jù)采集面,將農(nóng)田中諸如生物因子(包括自然天敵、周邊生物環(huán)境等)、非生物因子(包括土壤性質(zhì)等以及地塊類型、施肥、澆水等)都列于采集范圍之內(nèi)。隨著數(shù)據(jù)采集的不斷完善以及數(shù)據(jù)分析方法的逐步改進(jìn),將會(huì)使預(yù)測(cè)結(jié)果與實(shí)際情況更加接近。
● SVR本身的不足,如參數(shù)優(yōu)化等。
本研究首次將SVR應(yīng)用到玉米田第四代棉鈴蟲發(fā)生量的預(yù)測(cè)上,根據(jù)1999-2010年第四代棉鈴蟲采集的數(shù)據(jù)構(gòu)建了玉米田第四代棉鈴蟲發(fā)生量的SVR模型,并對(duì)2011-2013年進(jìn)行了測(cè)試,得到的預(yù)測(cè)發(fā)生量與實(shí)際發(fā)生量基本一致,呈現(xiàn)高度相關(guān)性。這一模型的應(yīng)用,能及時(shí)和準(zhǔn)確地發(fā)布第四代棉鈴蟲監(jiān)測(cè)預(yù)警信息,有效地指導(dǎo)玉米田棉鈴蟲的科學(xué)防控。
本文首次將SVR用于第四代棉鈴蟲發(fā)生量建模與預(yù)測(cè)中,回歸精度與泛化能力都較高。以上研究表明,SVR應(yīng)用于玉米田棉鈴蟲發(fā)生量預(yù)測(cè)是可行的。
[1] GANDOMI A, HAIDER M. Beyond the hype: big data concepts, methods, and analytics[J]. International Journal of Information Management, 2015, 35(2): 137-144.
[2] KAMBATLA K, KOLLIAS G, KUMAR V, et al. Trends in big data analytics[J]. Journal ofParallel and Distributed Computing, 2014, 74(7): 2561-2573.
[3] LAZER D, KENNEDY R, KING G, et al. The parable of Google flu: traps in big data analysis[J]. Science, 2014, 343(6176): 1203-1205.
[4] SUNZF, DUKM, ZHENG F X. Perspectives of research and application of big data on smart agriculture[J]. Journal of Agricultural Science and Technology, 2013, 15(6): 63-71.
[5] SIRAJ A S, SANTOS-VEGA M, BOUMA M J, et al. Altitudinal changes in malaria incidence in highlands of ethiopia and colombia[J]. Science, 2014, 343(6175): 1154-1158.
[6] HALLM A N NCA, FOPPENRPB, TURNHOUT C AMV, et al. Declines in insectivorous birds are associated with high neonicotinoid concentrations[J]. Nature, 2014, 511(7509): 341-343.
[7] 宋長(zhǎng)青, 牟少敏, 周虎, 等. 農(nóng)業(yè)大數(shù)據(jù)研究中心的建設(shè)、研究與實(shí)踐[J]. 中國(guó)現(xiàn)代教育裝備, 2015(3): 8-11. SONG C Q, MU S M, ZHOU H, et al. Construction, research and practice of agricultural big data research center[J]. China Modern Educational Equipment, 2015(3): 8-11.
[8] 辛妍. 大數(shù)據(jù)在農(nóng)業(yè)中的應(yīng)用[J]. 新經(jīng)濟(jì)導(dǎo)刊, 2015(4): 46-51. XIN Y. Bigdataapp lications in agriculture[J]. New Economy Weekly, 2015(4): 46-51.
[9] 溫孚江. 農(nóng)業(yè)大數(shù)據(jù)與發(fā)展新機(jī)遇[J]. 中國(guó)農(nóng)村科技, 2013(3): 4-7. WEN F J. Agricultural big data and development of new opportunities[J]. Agricultural Sciences in China, 2013(3): 4-7.
[10] 楊波, 劉勇, 牟少敏, 等. 大數(shù)據(jù)背景下山東省二代玉米螟發(fā)生程度預(yù)測(cè)模型的構(gòu)建[J]. 計(jì)算機(jī)研究與發(fā)展, 2014(S2): 160-165. YA NGB, LIUY, MUSM, etal. Based on big data: the establishment of meteorological forecast model for the occurrence degree of the second generation of corn borer in Shandong[J]. Journal of Computer Research and Development, 2014(S2): 160-165.
[11] 陳廣泉. 河西走廊玉米田棉鈴蟲發(fā)生規(guī)律與藥劑防治技術(shù)研究[D]. 咸陽:西北農(nóng)林科技大學(xué), 2004: 12-16. CHEN G Q. The occurrence regularity and cottrol technology research of cotton bollworm in the hexi corridor cornfield[D]. Xianyang: Northwest A&F University, 2004: 12-16.
[12] CHAN GNOND, SAND STRO MM, ASTOLFI J, et al. Using climatology to predict the first majorsummer corn earworm (lepidoptera: noctuidae) catch in north central Illinois[J]. Meteorological Applications, 2010, 17(3): 321-328.
[13] FENG H, GOULD F, HUANG Y, et al. Modeling the population dynamics of cotton bollworm Helicoverpa armigera (Hübner) (lepidoptera: noctuidae) over a wide area in northern China[J]. Ecological Modelling, 2010, 221(15): 1819-1830.
[14] RAJ K R, KARDAM A, ARORA J K, et al. Artificial neural network (ANN) design for Hg-Se interactions and their effect on reduction of Hg uptake by radish plant[J]. Journal of Radioanalytical and Nuclear Chemistry, 2010, 283(3): 797-801.
[15] VAPNIK V N. The nature of statistical learning theory[J]. IEEE Transactions on Neural Networks, 1995, 10(5): 988-999.
[16] 趙仲華, 沈佐銳. 昆蟲種群動(dòng)態(tài)非線性建模理論與應(yīng)用[J]. 生物數(shù)學(xué)學(xué)報(bào), 2001, 16(4):439-447. ZHAO Z H, SHEN Z R. Insect population dynamics of nonlinear modeling theory and application[J]. Journal of Biomathematics, 2001, 16(4): 439-447.
[17] 李永娜. 基于支持向量機(jī)的回歸預(yù)測(cè)綜述[J].信息通信, 2014(11):32-33. LI Y N. Regression forecast review based on support vector machine[J]. Message Communication, 2014(11): 32-33.
[18] ERDAL H I. Two-level and hybrid ensembles of decision trees for high performance concrete compressive strength prediction[J]. Engineering Applications of Artificial Intelligence, 2013, 26(7): 1689-1697.
[19] 朱軍生, 翟保平, 董保信. 基于徑向基小波網(wǎng)絡(luò)的二代棉鈴蟲卵峰日預(yù)測(cè)模型[J]. 昆蟲學(xué)報(bào),2010, 53(12): 1429-1435. ZHU J S, ZHAI B P, DONG B X. Forecasting model for the oviposition peak day in thesecond generation of helicoverpa armigera (lepidopeter: noctuidae) based on radial basis wavelet network[J]. Acta Entomologica Sinica, 2010, 53(12): 1429-1435.
Forecasting model for the fourth generation of cotton bollworm in corn fi elds based on big data
ZHAO Lei, YANG Bo, LIU Yong, MU Shaomin, WEN Fujiang
Agricultural Big Data Research Center, Shandong Agricultural University, Taian 271018, China
The monitoring and forecasting model was put forward based on support vector machine program. According to the data collection of the fourth generation occurrence degree of the corn bollworm in Shandong province from 1999 to 2013, the support vector regression (SVR) method was adopted to build the nonlinear correlation model between the occurrence degree of the fourth generation bollworm and the associated factors. The method and the model were tested and analyzed. The results showed that the SVR forecasting model for prediction was almost in accord with the actual insect occurrence situation. The mean absolute percentage error was 4.36%, and the actual and estimated value of the correlation coefficient was 0.960 6. It could provide effective and accurate guidance to the cotton bollworm control in corn fields.
agricultural big data, cotton bollworm, support vector regression, monitoring and forecasting, corn
S431.9
A
10.11959/j.issn.2096-0271.2016008
趙雷(1990-),女,山東農(nóng)業(yè)大學(xué)碩士生,主要研究方向?yàn)檗r(nóng)業(yè)科研與大數(shù)據(jù)。
楊波(1988-),女,山東農(nóng)業(yè)大學(xué)碩士生,主要研究方向?yàn)檗r(nóng)業(yè)大數(shù)據(jù)。
劉勇(1968-),男,山東農(nóng)業(yè)大學(xué)教授、博士生導(dǎo)師,主要研究方向?yàn)楹οx綠色防控和農(nóng)業(yè)大數(shù)據(jù)。
牟少敏(1964-),男,博士,山東農(nóng)業(yè)大學(xué)教授,主要研究方向?yàn)榇髷?shù)據(jù)、機(jī)器學(xué)習(xí)和模式識(shí)別。
溫孚江(1955-),男,現(xiàn)任山東農(nóng)業(yè)大學(xué)校長(zhǎng)、教授,農(nóng)業(yè)大數(shù)據(jù)創(chuàng)新戰(zhàn)略聯(lián)盟理事長(zhǎng),全國(guó)人民代表大會(huì)常務(wù)委員會(huì)委員。早年留學(xué)美國(guó),并獲博士學(xué)位。主要從事植物保護(hù)研究和宏觀農(nóng)業(yè)研究工作。發(fā)表論文210余篇,專著5部。最近一部專著《大數(shù)據(jù)農(nóng)業(yè)》由中國(guó)農(nóng)業(yè)出版社于2015年9月出版。目前主要從事農(nóng)業(yè)大數(shù)據(jù)應(yīng)用研究工作,是我國(guó)農(nóng)業(yè)大數(shù)據(jù)研究主要發(fā)起人之一。
2015-10-28
劉勇,liuyong@sdau.edu.cn;溫孚江,fjw@sdau.edu.cn
山東省農(nóng)業(yè)重大應(yīng)用技術(shù)創(chuàng)新課題基金資助項(xiàng)目
Foundation Item: Major Innovation of Applied Technology in Agriculture of Shandong Province