張建華,陳申寬,張曉振,韓應(yīng)欣,姜嬌陽
(扎蘭屯職業(yè)學(xué)院,內(nèi)蒙古 呼倫貝爾 162650)
隨著農(nóng)業(yè)生產(chǎn)方式的不斷發(fā)展和進(jìn)步,對于農(nóng)作物種植過程中的病蟲害防治也提出了更高要求。目前,我國已經(jīng)建立了較為完善的植物病理診斷系統(tǒng)以及相關(guān)檢測方法體系,但是由于受到傳統(tǒng)人工操作方式影響,導(dǎo)致部分植物病害難以精準(zhǔn)識別,而通過運(yùn)用智能機(jī)器學(xué)習(xí)算法識別植物葉片病害可以有效提升其應(yīng)用效率。
目前常用于植物病害識別的方法主要有人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(jī)(SVM)等。
人工神經(jīng)網(wǎng)絡(luò)(ANN)是將大量的樣本輸入到一個神經(jīng)網(wǎng)絡(luò)系統(tǒng)中,通過不斷優(yōu)化訓(xùn)練樣本集使模型能更好地適應(yīng)環(huán)境變化。
支持向量機(jī)(SVM)是利用大數(shù)據(jù)挖掘出與目標(biāo)相關(guān)的信息并從中提取出有用特征,然后根據(jù)這些特征建立相應(yīng)的預(yù)測模型,從而實現(xiàn)對病害發(fā)生規(guī)律的分析。由于不同種類的病原菌具有一定差異性,導(dǎo)致其在疾病診斷方面存在較大的差別,因此針對這種情況,相關(guān)學(xué)者開始嘗試使用多種不同的檢測方式來提高檢測結(jié)果的精確度,卷積神經(jīng)網(wǎng)絡(luò)便是其中之一。
該算法需要構(gòu)建一個全新的圖像識別框架,用以處理多個類別的樣本數(shù)據(jù)。而且每一次迭代都會將原始數(shù)據(jù)作為基礎(chǔ)進(jìn)行重新編碼,以保證分類器可以獲得較好的性能,此外還有其他幾種常見的分類方法,如支持向量機(jī)和決策樹等也被廣泛運(yùn)用于植物病害的診斷工作當(dāng)中[1]。
目前常用于圖像處理領(lǐng)域的深度學(xué)習(xí)模型主要有卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等,其中卷積神經(jīng)網(wǎng)是最為常見的方法。該方法通過對大量數(shù)據(jù)進(jìn)行訓(xùn)練來獲得一個高維特征圖[2],然后利用這個特征圖去預(yù)測未知樣本,從而實現(xiàn)對圖像的分類。由于CNN 可以將輸入層和隱含層之間建立起聯(lián)系,所以其能夠更好地處理非線性問題,而RNN 具有很好的泛化能力且不需要預(yù)先知道每一層的輸出值,因此被廣泛應(yīng)用于各種復(fù)雜場景下的機(jī)器學(xué)習(xí)任務(wù)。近年來,隨著計算機(jī)技術(shù)以及互聯(lián)網(wǎng)絡(luò)的發(fā)展,人們開始嘗試使用其他類型的網(wǎng)絡(luò)結(jié)構(gòu)去代替?zhèn)鹘y(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),例如LSTM、SVM 等[3]。然而這些網(wǎng)絡(luò)結(jié)構(gòu)并沒有得到普遍認(rèn)可,因為目前還沒有任何一種網(wǎng)絡(luò)結(jié)構(gòu)能夠達(dá)到完全替代現(xiàn)有的LSTM-ANN-GRU(Long Shortest Memory)網(wǎng)絡(luò)結(jié)構(gòu)的程度。為了解決這一問題,一些專家提出了許多新的方法來提取圖像的深層次信息,其中最常用的是深度學(xué)習(xí)方法,主要通過構(gòu)建多層前饋網(wǎng)絡(luò)從而使得模型具備更強(qiáng)的泛化性能,但是該方法存在著訓(xùn)練速度慢、計算效率低等缺點[4],具體見圖1。
圖1 基于卷積神經(jīng)網(wǎng)絡(luò)的故障預(yù)警過程
隨著計算機(jī)技術(shù)和大數(shù)據(jù)分析技術(shù)的不斷發(fā)展,越來越多的學(xué)者開始將機(jī)器學(xué)習(xí)與其他領(lǐng)域相結(jié)合。其中最典型也是應(yīng)用較廣泛的就是深度學(xué)習(xí)算法,通過對海量的原始數(shù)據(jù)集進(jìn)行訓(xùn)練來實現(xiàn)對大樣本數(shù)據(jù)的高效處理,從而提高預(yù)測精度并且減少人工干預(yù)所帶來的誤差,使得該類方法能夠更好地適應(yīng)于復(fù)雜環(huán)境下多類別、多尺度的特征分析問題[5]。
有些學(xué)者提出了基于遷移學(xué)習(xí)的分類模型,即根據(jù)輸入圖像的空間結(jié)構(gòu)信息構(gòu)建一個包含大量神經(jīng)元的多層感知器網(wǎng)絡(luò),然后利用這個網(wǎng)絡(luò)提取出每一層神經(jīng)元之間的連接關(guān)系,再用這些連接關(guān)系建立一個分類模型用于后續(xù)的分類工作,最后利用該分類模型得到最終的分類結(jié)果[6]。
目前常用于病害檢測的算法主要有2 種。第1 種是傳統(tǒng)的機(jī)器學(xué)習(xí)方法(ANN 和RNN 等),通過對輸入圖像進(jìn)行預(yù)處理后得到一個二維或三維空間上的特征圖;第2 種則是神經(jīng)網(wǎng)絡(luò)模型,可以根據(jù)訓(xùn)練數(shù)據(jù)來預(yù)測出樣本之間相似性的強(qiáng)弱及其分布情況。其中,第1 種算法利用了大量的原始圖像作為基礎(chǔ)特征集對其進(jìn)行處理;而第2 種算法則將所有的圖像都看成一系列由許多卷積核組成的線性組合。這2 種方法均能夠有效地提取出圖像中的信息并且具有較高的泛化性能。但無論哪種分類器都存在著一定的局限性,即不能準(zhǔn)確地描述復(fù)雜的問題,因此文章針對上述2 類網(wǎng)絡(luò)結(jié)構(gòu)分別設(shè)計了相應(yīng)的改進(jìn)策略以提高其應(yīng)用效果。目前有以下幾種機(jī)器學(xué)習(xí)算法:一是支持向量回歸,二是隨機(jī)森林,三是決策樹,四是支持向量機(jī)。其中,支持向量回歸和隨機(jī)森林主要是對原始數(shù)據(jù)集進(jìn)行預(yù)處理;決策樹和支持向量機(jī)則利用分類器來完成分類任務(wù)。通過構(gòu)建一個包含多棵樹和若干個節(jié)點構(gòu)成的分類模型,然后根據(jù)每棵樹的不同屬性以及這些樹之間相互作用、關(guān)系等建立一棵完整的分類樹來實現(xiàn)對樣本數(shù)據(jù)的預(yù)測與分類。
目前,常用的機(jī)器視覺系統(tǒng)有卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)等。卷積神經(jīng)網(wǎng)絡(luò)是一種多層感知器結(jié)構(gòu),具有較好的非線性映射能力,該方法能夠通過對輸入圖像進(jìn)行預(yù)處理來獲取目標(biāo)區(qū)域的局部特征。例如,將輸入圖像進(jìn)行灰度化處理后,再利用高斯濾波器去除噪聲。但是這種預(yù)處理過程會使得輸出圖像出現(xiàn)過擬合現(xiàn)象,從而影響到后續(xù)的預(yù)測精度與準(zhǔn)確性。為了提高模型的泛化性能,通常需要多次重復(fù)迭代訓(xùn)練,并采用多個不同類別的樣本來構(gòu)建模型[7]。
目前,針對上述方法的缺陷,有學(xué)者提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)和支持向量機(jī)(SVM)的植物病害識別系統(tǒng)。該方法通過對輸入圖像進(jìn)行預(yù)處理,提取出特征向量,并將其與疾病診斷相關(guān)聯(lián),再使用訓(xùn)練好的模型來預(yù)測出最終的結(jié)果。同時,還可以利用這個網(wǎng)絡(luò)來對不同類型的病斑進(jìn)行分類。但是文章認(rèn)為由于數(shù)據(jù)集大小以及所需樣本數(shù)量等因素的限制,該系統(tǒng)只能適用于小規(guī)模的病害檢測,而且也只有少數(shù)幾種常見病害能夠被正確地檢測到。此外,該系統(tǒng)對光照條件要求比較嚴(yán)格,因此不能很大程度上提高檢測器的準(zhǔn)確性。另外,該系統(tǒng)需要大量的樣本作為訓(xùn)練樣本,所以很難實現(xiàn)大規(guī)模的物體檢測[8]。
人工神經(jīng)網(wǎng)絡(luò)是一種模擬生物大腦結(jié)構(gòu)和功能的計算機(jī)模型,通過對輸入數(shù)據(jù)的非線性映射,將大量神經(jīng)元連接起來形成復(fù)雜的非線性系統(tǒng)并實現(xiàn)信息傳遞與處理。目前,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)被廣泛應(yīng)用于圖像處理、模式識別等領(lǐng)域。相關(guān)學(xué)者提出了一種新的卷積神經(jīng)網(wǎng)絡(luò)用以提取圖像的紋理特征,該算法先利用深度學(xué)習(xí)方法從原始圖片中獲取每個像素點的灰度值,然后根據(jù)灰度值構(gòu)建一個3 層的多層前饋網(wǎng)絡(luò)結(jié)構(gòu)來預(yù)測目標(biāo)區(qū)域的顏色分布情況,最后使用多尺度融合的方式將3 層網(wǎng)絡(luò)連接成更加精細(xì)的三維結(jié)構(gòu),以便對其進(jìn)行分類或回歸分析。相關(guān)學(xué)者采用CNN 作為分類器對不同類型的植物病害進(jìn)行檢測,先用CNN 對不同種類的植物病原菌進(jìn)行訓(xùn)練,之后再用RNN-SVM 算法對其進(jìn)行分類。結(jié)果表明,所提的模型能夠很好地處理高維和低維數(shù)據(jù)集上的問題,并且具有較高的準(zhǔn)確性和置信度(均方誤差),而且可以有效降低過擬合現(xiàn)象。此外,由于LSTM 是一種無監(jiān)督的循環(huán)神經(jīng)網(wǎng)絡(luò),所以相較于其他傳統(tǒng)的機(jī)器學(xué)習(xí)模型擁有更大的泛化能力以及更好的魯棒性。
卷積神經(jīng)網(wǎng)絡(luò)是一種多層前饋型非線性映射模型,通過將輸入圖像與輸出圖像之間的關(guān)系用二維數(shù)組表示,然后對每個像素點進(jìn)行卷積運(yùn)算來提取其特征向量,最后再利用反向傳播算法,從而實現(xiàn)目標(biāo)函數(shù)最大化。卷積神經(jīng)網(wǎng)絡(luò)可以分為2 類:全連接層和部分連接層。其中全連接層又可進(jìn)一步細(xì)分為3 類:第1 類是無監(jiān)督學(xué)習(xí)方法,第2 類是有監(jiān)督學(xué)習(xí)方法,第3 類是半監(jiān)督學(xué)習(xí)方法。由于不同類型的分類器所需的訓(xùn)練樣本不一樣,因此需要選擇合適的訓(xùn)練集來獲得最佳的分類結(jié)果。目前常用的卷積神經(jīng)網(wǎng)絡(luò)主要包括SVM、KNN 等。其中最為經(jīng)典也被廣泛使用的是Resnet 50,該網(wǎng)絡(luò)能夠有效地處理大樣本數(shù)據(jù),并且具有較好的泛化性能以及魯棒性。
卷積神經(jīng)網(wǎng)絡(luò)是將輸入數(shù)據(jù)映射到一個二維矩陣上并對其做歸一化處理后再進(jìn)行運(yùn)算得到輸出結(jié)果。該方法具有結(jié)構(gòu)簡單且計算速度快等特點。相關(guān)學(xué)者引用了一種新的圖像分割算法來實現(xiàn)對不同種類害蟲的檢測和分類。需要使用卷積神經(jīng)網(wǎng)絡(luò)提取出圖像中的每個像素點所對應(yīng)的顏色信息,然后通過特征提取模塊(FPNs)對這些特征向量進(jìn)行降維操作以獲得更加準(zhǔn)確的類別標(biāo)簽。相關(guān)學(xué)者利用卷積神經(jīng)網(wǎng)絡(luò)建立了一個包含3×3 層的卷積神經(jīng)網(wǎng)絡(luò)模型,用于區(qū)分玉米螟與棉鈴蟲兩種昆蟲的差異。相關(guān)學(xué)者用CNN 作為框架結(jié)構(gòu)來構(gòu)建卷形編碼器。還有其他學(xué)者采用深度學(xué)習(xí)模型來提高模型的泛化能力。
遷移學(xué)習(xí)是一種通過對原始數(shù)據(jù)集中的特征向量進(jìn)行降維處理來提高分類精度的方法。該類方法需要將原始數(shù)據(jù)集轉(zhuǎn)換為低維空間并構(gòu)建相應(yīng)的模型,然后利用這類模型預(yù)測未知樣本的分布情況,從而實現(xiàn)高精度的分類任務(wù)。
遷移學(xué)習(xí)是一種將多個不同來源和處理方式的原始數(shù)據(jù)集通過某種機(jī)制結(jié)合到同一個目標(biāo)上的新一代機(jī)器學(xué)習(xí)方法。該方法主要有以下幾點:一是對輸入樣本進(jìn)行預(yù)處理,二是利用訓(xùn)練好的模型對其分類,三是用測試結(jié)果驗證模型的有效性。其中,前2 點為基礎(chǔ),最后1 點則需要根據(jù)實際情況選擇合適的參數(shù)來實現(xiàn)。由于不同種類的病菌具有差異化特征,因此文章采用了多種不同的網(wǎng)絡(luò)結(jié)構(gòu)來構(gòu)建模型。
隨著科技的進(jìn)步和社會經(jīng)濟(jì)水平的提高,人們越來越重視信息技術(shù)在農(nóng)業(yè)生產(chǎn)過程中的作用。目前,對于人工智能在植物葉片病蟲害識別方面還存在一些不足之處。一方面,主要是受到傳統(tǒng)人工經(jīng)驗和知識的影響,導(dǎo)致其無法準(zhǔn)確地判斷病害類型。另一方面,由于缺少相應(yīng)的理論基礎(chǔ),使得其不能有效預(yù)測未來可能出現(xiàn)的問題,從而造成了一定程度上的誤判。為了解決這些問題,需要進(jìn)一步完善相關(guān)的理論體系,并加強(qiáng)對人工智能技術(shù)應(yīng)用于植物葉片病蟲害識別領(lǐng)域的研究與實踐,以便更好地推動我國農(nóng)業(yè)現(xiàn)代化建設(shè)進(jìn)程。