孫孟孜 韓兵 韓海仙 王森
摘要:針對當(dāng)前溫室大棚信息化程度較低,種植經(jīng)驗(yàn)與知識缺乏,導(dǎo)致無法更好地培養(yǎng)種植管理作物,大幅度地降低了作物收成。通過“人工智能+農(nóng)業(yè)”在大棚種植草莓的生長環(huán)境的研究和總結(jié),分析植物生長環(huán)境和果蔬的成熟期之間的關(guān)系,從而保證穩(wěn)定高效的生產(chǎn)經(jīng)濟(jì)農(nóng)作物前提下提升農(nóng)業(yè)經(jīng)濟(jì)的產(chǎn)出。本研究對象為草莓作為標(biāo)本經(jīng)濟(jì)作物,通過人工智能算法,根據(jù)監(jiān)測大棚環(huán)境的數(shù)據(jù),給出環(huán)境調(diào)整的參數(shù)建議,同時實(shí)現(xiàn)預(yù)測草莓種植周期的天數(shù),推測出成熟的日期。實(shí)驗(yàn)證明,通過人工智能算法能夠通過植物生長過程數(shù)據(jù)準(zhǔn)確預(yù)測其成熟期,為大棚種植果蔬提供依據(jù),將新技術(shù)投入到現(xiàn)代化農(nóng)業(yè)中,讓農(nóng)業(yè)真正實(shí)現(xiàn)現(xiàn)代化,智能化,高效化。
關(guān)鍵詞:人工智能;生長周期;線性回歸;訓(xùn)練模型;成熟度
中圖分類號:TP311? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)10-0209-04
鄉(xiāng)村振興戰(zhàn)略是在黨的十九大報告中提出的戰(zhàn)略,十九大報告指出,農(nóng)業(yè)農(nóng)村農(nóng)民問題是關(guān)系國計民生的根本性問題,必須始終把解決好“三農(nóng)”問題作為全黨工作的重中之重,實(shí)施鄉(xiāng)村振興戰(zhàn)略。
然而,我國的農(nóng)業(yè)智能種植技術(shù)使用較晚,直到二十一世紀(jì)初期我國的農(nóng)業(yè)科技人員才開始通過國外進(jìn)口種植大棚設(shè)備選型,培育技術(shù)等領(lǐng)域深入研究探索[1]。依托部署在農(nóng)業(yè)生產(chǎn)現(xiàn)場的各種傳感節(jié)點(diǎn)(環(huán)境溫濕度、土壤水分、二氧化碳、圖像等)和無線通信網(wǎng)絡(luò)實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)環(huán)境的智能感知、智能預(yù)警、智能決策、智能分析、專家在線指導(dǎo),為農(nóng)業(yè)生產(chǎn)提供精準(zhǔn)化種植、可視化管理、智能化決策,提高農(nóng)業(yè)水利化、機(jī)械化和信息化水平,提升農(nóng)業(yè)競爭力。
1大棚種植草莓的分析
草莓消費(fèi)大多集中在春節(jié)前后,尤其是在春節(jié)期間,由于對草莓的大量需求,常常供不應(yīng)求。華北地區(qū)地理和自然資源豐富,具有典型的北溫帶半濕潤大陸性季風(fēng)氣候,夏季高溫多雨,冬季低溫并偶爾帶有降雪,春秋季節(jié)時間短,為了進(jìn)行自然培植就要利用大棚種植技術(shù)來調(diào)整草莓的生長環(huán)境[2]。
人工智能在農(nóng)業(yè)的應(yīng)用,能夠讓農(nóng)業(yè)成為科學(xué)化和現(xiàn)代化農(nóng)業(yè)。溫室大棚經(jīng)過技術(shù)輔助,更加簡單容易控制掌握,提供一個高效穩(wěn)定的控制溫室大棚的草莓良好的種植環(huán)境,讓從業(yè)者擁有穩(wěn)定可觀的經(jīng)濟(jì)收入[3]。因此,通過當(dāng)前最新的人工智能算法建立數(shù)學(xué)模型,對溫室大棚環(huán)境給出調(diào)整,讓溫室大棚種植全面自動化,從而減少人力物力以及技術(shù)的難度,提高產(chǎn)量和收入。
2 草莓生長環(huán)境參數(shù)研究
草莓生長環(huán)境主要包括:二氧化碳濃、度溫度、濕度、光照強(qiáng)度、土壤濕度、土壤酸堿度六個方面。每一項對草莓生長都有一定的影響,需要通過大棚的智能控制單元將其控制在一定的范圍之內(nèi)[4]。
通過查看文獻(xiàn),草莓對環(huán)境的溫度是尤為重要,草莓會分成萌芽期,生長期,開花期,結(jié)果期,旺盛生長期,花芽分化期和休眠期,每個周期對溫度的要求不一樣。例如,發(fā)芽期適宜溫度在15℃~20℃時最適合草莓的生長,生長期適宜溫度為 20℃~26℃,開花期為是 25℃~ 30℃。過高或者過低,都會影響草莓的發(fā)育,幼芽無法發(fā)育或者花粉受精失去活力提高畸形的概率等問題[4]。
此外,光照時長需要在8h~12h,光照的不足會導(dǎo)致花芽的形成,減少養(yǎng)分的獲取降低成活率;二氧化碳濃度和土壤濕度也是影響草莓正常生長的重要因素,經(jīng)驗(yàn)表明:二氧化碳都處于800~1800ppm之間會提高草莓的萌芽期和開花期的長勢;土壤濕度控制在60%~80%之間是保證豐產(chǎn)的關(guān)鍵;酸堿度范圍在pH5.5~6.5之間,同時也適用于草莓生長適宜的土壤酸堿度,因此把大棚土壤的pH值控制在5.5~6.5最適宜[5]。
3 數(shù)學(xué)訓(xùn)練模型研究
圖1是系統(tǒng)使用的數(shù)學(xué)訓(xùn)練模型,開始訓(xùn)練時,從訓(xùn)練集讀取數(shù)據(jù),訓(xùn)練模型初始化模型,根據(jù)線性回歸計算環(huán)境參數(shù)得出一個標(biāo)準(zhǔn)數(shù)值,篩選不符合要求的參數(shù),增減訓(xùn)練項,重新計算模塊做出模型參數(shù)的調(diào)整。
系統(tǒng)首先將清洗好的數(shù)據(jù)輸入到訓(xùn)練集中,數(shù)據(jù)聚類重疊,將同一時刻的不同日期的數(shù)據(jù)疊加一起,通過線性回歸算法計算。線性回歸是利用數(shù)理統(tǒng)計中回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法,運(yùn)用十分廣泛[6]。其表達(dá)形式為y = w'x+e,e為誤差服從均值為0的正態(tài)分布[7]?;貧w分析中,只包括一個自變量和一個因變量,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析[8]。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。通過公式化簡可以擬合方程為最小二乘法。一般來說,線性回歸都可以通過最小二乘法求出其方程,可以計算出對于y=bx+a的直線[9]。將數(shù)據(jù)清洗篩選后,增加或減少聚類項,再次重復(fù)計算,得出新的數(shù)學(xué)模型,多個數(shù)學(xué)模型對比調(diào)整參數(shù),得出一個與真實(shí)情況最為接近,最可以接受的模型,成為標(biāo)準(zhǔn)模型使用。
3.1 回歸算法的研究
課題使用的模型算法為回歸算法,又分為線性回歸算法,和曲線回歸算法(又稱高斯曲線),假設(shè)溫室大棚的環(huán)境參數(shù),二氧化碳為θ1,溫度參數(shù)為θ2,濕度θ3,光照強(qiáng)度θ4,土壤濕度θ5,土壤pH值θ6。再對每一個影響項拆分,就可以通過線性回歸的最小二乘法進(jìn)行推導(dǎo)出直線方程。擬合平面公式為式(1):
最終,公式整合為直線方程式(2):
并不是所有的參數(shù)都可以用直線表示,例如溫度和光照強(qiáng)度屬于曲線,所以線性回歸就不能適用于這兩個參數(shù)。就要使用曲線回歸來完成,曲線回歸又分為指數(shù)函數(shù)曲線,對數(shù),冪函數(shù),雙曲,S型和多項式曲線,符合本次溫度和光照強(qiáng)度的函數(shù)方程是多項式曲線。經(jīng)過試驗(yàn)三次多項式就可以更加接近實(shí)際溫度和光照情況的走勢,無須再使用更多次多項式方式就可以解決實(shí)際問題。三次多項式方程式(3):
3.2成熟度預(yù)測
系統(tǒng)每小時將環(huán)境參數(shù)傳入數(shù)學(xué)模型中,通過引入偏差值概念,可以保證數(shù)據(jù)在一定的范圍內(nèi)波動,同時還有參數(shù)上限與下限約束條件。系統(tǒng)可以根據(jù)采集到的數(shù)據(jù)偏差進(jìn)行計算并做出提示的調(diào)整建議[10]。將環(huán)境監(jiān)測數(shù)據(jù)CO2濃度,溫度,濕度,土壤濕度,土壤pH值,光照強(qiáng)度根據(jù)權(quán)重占比計算,得出一個當(dāng)前環(huán)境分?jǐn)?shù)設(shè)為合格率,大于70%時就可以添加到數(shù)據(jù)集中,把不符合要求的環(huán)境數(shù)據(jù)篩選掉以保證數(shù)據(jù)的準(zhǔn)確性[11]。
系統(tǒng)在每日凌晨2點(diǎn)對此前24小時的樣本數(shù)據(jù)進(jìn)行統(tǒng)計,計算種植草莓的成熟率和預(yù)計成熟日期。c成熟周期,r為成熟率,rd當(dāng)天成熟率,D為待成熟天數(shù)。此時,可推算出成熟率公式為式(4):
同時,也可推算出成熟天數(shù)公式(5):
4系統(tǒng)設(shè)計
系統(tǒng)首先獲得草莓種植的環(huán)境數(shù)據(jù),并對得到的監(jiān)控數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,獲得可以進(jìn)行計算的數(shù)據(jù)格式,當(dāng)符合訓(xùn)練條件的數(shù)據(jù)在規(guī)定的環(huán)境參數(shù)要求的范圍內(nèi),則放入訓(xùn)練數(shù)據(jù)集;不符合直接進(jìn)入計算草莓種植環(huán)境的分?jǐn)?shù)邏輯。根據(jù)模型的標(biāo)準(zhǔn)參數(shù)和偏差值,得出當(dāng)前草莓種植環(huán)境的分?jǐn)?shù),同時給出草莓種植環(huán)境的調(diào)整建議方案,同時預(yù)測草莓的成熟度和成熟日期。
系統(tǒng)由以下四個模塊組成:
(1)環(huán)境監(jiān)測模塊:用于連接傳感器監(jiān)測數(shù)據(jù)的管理,監(jiān)測數(shù)據(jù)是以接口的形式傳入數(shù)據(jù),監(jiān)測數(shù)據(jù)也支持直接寫入數(shù)據(jù)庫中,并且可以直接查看監(jiān)控數(shù)據(jù)功能。
(2)數(shù)據(jù)清洗模塊:監(jiān)控數(shù)據(jù)的格式和單位,可能出現(xiàn)數(shù)據(jù)不符的情況,此時就需要進(jìn)行數(shù)據(jù)清洗,課題將清洗后的監(jiān)測數(shù)據(jù)存入數(shù)據(jù)庫中。
(3)訓(xùn)練模型模塊:當(dāng)系統(tǒng)獲取到準(zhǔn)確的訓(xùn)練數(shù)據(jù),包括CO2濃度,溫度,濕度,光照強(qiáng)度,土壤濕度,土壤PH。根據(jù)環(huán)境的基本訓(xùn)練數(shù)據(jù),對每個參數(shù),計算出一天中每小時的參數(shù)的所處的范圍,使用線性回歸算法進(jìn)行預(yù)測。
(4)周期計算模塊:系統(tǒng)將每次采集的環(huán)境數(shù)據(jù)與標(biāo)準(zhǔn)的大棚環(huán)境的模型對比,給予建議的同時,計算當(dāng)前大棚環(huán)境的分?jǐn)?shù)值。當(dāng)一天結(jié)束時,根據(jù)當(dāng)天每小時的分?jǐn)?shù),計算出當(dāng)天的草莓生長成熟度0~100%,從而實(shí)現(xiàn)對草莓成熟度和成熟期的預(yù)測。
系統(tǒng)流程圖如圖2所示。
5實(shí)驗(yàn)驗(yàn)證
系統(tǒng)運(yùn)用Python中的Numpy科學(xué)計算模塊,把數(shù)據(jù)轉(zhuǎn)化為二維矩陣放入模型中訓(xùn)練[12],利用Pandas來分析結(jié)構(gòu)化數(shù)據(jù),使用Matplotlib生成出版質(zhì)量級別的圖形展現(xiàn)[13]。
5.1數(shù)據(jù)的清洗
數(shù)據(jù)通過格式化后,并不是可以直接拿來使用,因?yàn)閿?shù)據(jù)存在部分的異常情況,不符合人們的認(rèn)知或者真實(shí)的情況,例如:夜晚有光照,光照強(qiáng)度都比白天中午的強(qiáng)度都高,或者夜晚溫度高,白天溫度低,土壤pH值出現(xiàn)強(qiáng)酸強(qiáng)堿情況等等,都不是真實(shí)的正常情況,很有可能是監(jiān)測設(shè)備異常。因此,將不符合真實(shí)情況的數(shù)據(jù)導(dǎo)入模型中,必然影響模型的訓(xùn)練效果,需要提前將有問題的數(shù)據(jù)篩選清洗出去。
圖 3 中的0-5時刻和18-23時刻都屬于夜晚,存在光照強(qiáng)度數(shù)值存在異常情況,尤其0-5時刻的數(shù)值,都達(dá)到200 lx必然存在問題,還有過高的數(shù)值都是需要清洗掉的數(shù)據(jù),會存在對模型整體的影響。通過策略將光照強(qiáng)度的數(shù)據(jù)集清洗,呈現(xiàn)出圖4的效果。溫度,濕度,二氧化碳濃度,土壤濕度,土壤pH值同理,使用符合每一項的篩選策略,清洗出符合預(yù)期效果的數(shù)據(jù)。
5.2線性回歸
以光照強(qiáng)度為例,在圖5中,發(fā)現(xiàn)曲線回歸的常量值處在一個負(fù)值,不符合實(shí)際情況,所以再次對數(shù)據(jù)進(jìn)行截?。?-18時的數(shù)據(jù)即為有效曲線,0-6時和6-23時的數(shù)據(jù)無效, 對圖5樣本走勢圖截取,得出圖6為參考曲線回歸圖。
5.3模型訓(xùn)練
通過創(chuàng)建CropModels類中的init_model函數(shù)為初始化數(shù)學(xué)模塊,并且執(zhí)行CO2,濕度,土壤濕度,土壤pH值,溫度以及光照強(qiáng)度等六項的函數(shù),獲取到相應(yīng)的線性回歸的k,b參數(shù)和曲線回歸的三項式公式[14]。執(zhí)行init_model初始化模塊后,本對象就擁有6個環(huán)境參數(shù)的數(shù)學(xué)模塊,等待傳入某時刻的數(shù)據(jù)進(jìn)行計算。調(diào)用calc函數(shù),并且傳入7個參數(shù)數(shù)值,并可返回溫室大棚的環(huán)境建議和當(dāng)前環(huán)境種植的分?jǐn)?shù)情況。
當(dāng)傳入的草莓種植環(huán)境符合模型給出的標(biāo)準(zhǔn)參數(shù),并計算與標(biāo)準(zhǔn)參數(shù)相似率達(dá)到70%以上,就會把本次傳入的環(huán)境參數(shù)放入到訓(xùn)練集中,當(dāng)成符合要求的訓(xùn)練數(shù)據(jù),對模型再次矯正。
5.4 成熟期預(yù)測
根據(jù)每小時傳入溫室大棚的環(huán)境參數(shù),經(jīng)過一天的數(shù)據(jù)收集,第二天凌晨2點(diǎn)會對前天的24小時的樣本數(shù)據(jù)進(jìn)行統(tǒng)計,計算種植草莓的成熟率和預(yù)計成熟日期。通過使用線性回歸算法構(gòu)建數(shù)學(xué)模型,預(yù)測溫室大棚環(huán)境的標(biāo)準(zhǔn)曲線[15],并且監(jiān)控大棚環(huán)境在某一時刻是否能符合一定的范圍之內(nèi),根據(jù)每天的環(huán)境監(jiān)測情況,計算出當(dāng)天的成熟率,并且累計以往的數(shù)據(jù),推測出草莓的成熟日期。
6 結(jié)束語
課題通過線性回歸算法,對草莓生長過程環(huán)境參數(shù)進(jìn)行跟蹤,利用擬合函數(shù)和最小二乘法進(jìn)行線性曲線的多項式統(tǒng)計預(yù)測,將人工智能運(yùn)用在實(shí)際的項目之中,預(yù)測溫室大棚草莓的種植環(huán)境的標(biāo)準(zhǔn)曲線,并且監(jiān)控種植環(huán)境在某一時刻是否能符合一定的范圍之內(nèi),根據(jù)每天的環(huán)境監(jiān)測情況,計算出當(dāng)天的成熟率,并且累計以往的數(shù)據(jù),推測出草莓的成熟日期。實(shí)驗(yàn)證實(shí),該方法能夠有效地預(yù)測草莓的成熟期,對草莓的種植有很大的幫助。
參考文獻(xiàn):
[1] 尹娟.物聯(lián)網(wǎng)驅(qū)動的智慧農(nóng)業(yè)精細(xì)種植系統(tǒng)的設(shè)計與開發(fā)[J].金陵科技學(xué)院學(xué)報,2020,36(1):88-92.
[2] 楊會苗,毛清云,劉蘭英.北京和保定地區(qū)草莓產(chǎn)業(yè)基本情況調(diào)研報告[J].北方園藝,2019(6):170-174.
[3] 潘小紅,楊志勇.基于物聯(lián)網(wǎng)技術(shù)的溫室大棚種植園環(huán)境監(jiān)測系統(tǒng)[J].現(xiàn)代電子技術(shù),2019,42(14):127-130.
[4] 孫亞玲,劉少軍,許念芳,等.山東省草莓產(chǎn)業(yè)現(xiàn)狀及發(fā)展對策[J].中國果菜,2018,38(9):44-47.
[5] 王艷芳,蘇婉玉,張琳,等.土壤改良劑在設(shè)施蔬菜上的應(yīng)用研究進(jìn)展[J].貴州農(nóng)業(yè)科學(xué),2018,46(4):102-105.
[6] 王鋼.基于多元線性回歸法的平潭綜合實(shí)驗(yàn)區(qū)需水量預(yù)測模型研究[J].水利科技,2020(2):48-50.
[7] 冷建飛,高旭,朱嘉平.多元線性回歸統(tǒng)計預(yù)測模型的應(yīng)用[J].統(tǒng)計與決策,2016(7):82-85.
[8] 宋靜,張利益.基于機(jī)器學(xué)習(xí)的線性回歸預(yù)測數(shù)據(jù)庫空間使用情況的應(yīng)用研究[J].電子測試,2020(15):58-59,62.
[9] 羅博煒,洪智勇,王勁屹.多元線性回歸統(tǒng)計模型在房價預(yù)測中的應(yīng)用[J].計算機(jī)時代,2020(6):51-54.
[10] 孫建花.草莓日光溫室種植技術(shù)要點(diǎn)分析探討[J].農(nóng)業(yè)開發(fā)與裝備,2020(6):159-160.
[11] 劉永紅,倪中應(yīng),謝國雄,等.浙西北丘陵區(qū)農(nóng)田土壤微量元素空間變異特征及影響因子[J].植物營養(yǎng)與肥料學(xué)報,2016,22(6):1710-1718.
[12] 姚建盛,李淑梅.Python在科學(xué)計算中的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2016(11):76.
[13] 吳銘.基于多視圖的霧霾數(shù)據(jù)分析方法[D].杭州:浙江大學(xué),2017.
[14] 王俊杰,張宇波.基于線性回歸的圖像邊緣處理算法的研究[J].江西師范大學(xué)學(xué)報(自然科學(xué)版),2013,37(1):46-50.
[15] 魏超,代曉航,郭靈安,等.蠟樣芽孢桿菌在草莓中的生長及預(yù)測模型的建立[J].現(xiàn)代食品科技,2019,35(9):291-296.
【通聯(lián)編輯:光文玲】