李華鋒 ,黃永輝 ,梁詩維 ,李岳鑫 ,賴穎茵 ,劉贊松 ,吳娟妹
(廣東茂名農(nóng)林科技職業(yè)學(xué)院,廣東 茂名 525000)
番茄在生長過程中因受到病毒、細(xì)菌等因素的影響[1],容易產(chǎn)生葉霉病、灰葉斑病和早疫病等病害,并在葉片上有一定的表征,不同病害之間染病葉片的病斑特點有所區(qū)別,不同生長時期的病害種類也有所不同。以新疆番茄生長周期為例,在番茄生長前期病蟲害較少,個別病株病害源自往年病株的病瘤遺留,病害將影響到番茄的果實品質(zhì),進(jìn)而對農(nóng)戶造成損失,因此對于番茄的病害預(yù)防具有重要意義。番茄病害多在葉片上有所表征,傳統(tǒng)的侵染性試驗具有周期長、時效性低的特點。目前,常用的番茄病害診斷手段大多來自植物環(huán)境衛(wèi)生專家基于知識的分析與判斷,需要消耗大量的人力、物力。但是,即便是病理學(xué)專家,對于表征相似的番茄病害也難以用定量定性的醫(yī)學(xué)手段記錄分析,這里面存在著較強(qiáng)的人為主觀性與不確定性。種植農(nóng)戶通常憑借經(jīng)驗去判斷病害類別,由于缺乏診斷番茄病害類別的客觀標(biāo)準(zhǔn),所以也很難對其做出準(zhǔn)確判斷,由于病原體類型不同,番茄染病葉片病斑表征也各不相同,憑借經(jīng)驗的人工確診方式主觀性較強(qiáng),且需要耗費(fèi)大量的人力、物力,不具備很好的應(yīng)用價值。當(dāng)下神經(jīng)網(wǎng)絡(luò)在各行各業(yè)均有應(yīng)用,已經(jīng)有了相當(dāng)成熟的理論成果,可以依賴神經(jīng)網(wǎng)絡(luò)的圖像處理技術(shù),構(gòu)建網(wǎng)絡(luò)對番茄葉片進(jìn)行病害識別,這將極大地降低病害診斷成本。同時,對于細(xì)度圖像識別的研究已經(jīng)有了一定的成果,利用深度學(xué)習(xí)進(jìn)行病害識別有助于在病害早期及時發(fā)現(xiàn)病害,盡早做出預(yù)防措施,降低番茄種植戶的損失?;谝陨锨闆r,利用深度學(xué)習(xí)對番茄病害進(jìn)行識別有著很高的應(yīng)用價值。
目前,國內(nèi)外眾多學(xué)者運(yùn)用計算機(jī)視覺與圖像處理等技術(shù)為植物病害識別提供了科學(xué)的理論依據(jù)。早期的植物葉片病害識別依賴于人工設(shè)計特征,利用病斑紋理信息建立特征向量。采用在病害樣本圖片上進(jìn)行多點提取特征采樣的手段,并采用支持向量機(jī)(SVM)等對病斑顏色、大小等特征向量進(jìn)行分類[2-3]。過往研究中采用的特征提取方法大多屬于人工提取,在病害葉片圖像樣本上生成視覺特征單詞,耗費(fèi)時間、人力,且特征不具備代表性,導(dǎo)致識別效果較差,具有一定的局限性。在Agrawal 等的研究中,識別植物葉片病害平均準(zhǔn)確率達(dá)90%[4]。喬虹等利用Faster R-CNN 算法監(jiān)測葡萄葉片,在匹配葉片圖像后通過動態(tài)監(jiān)測識別病害[5]。Adeel 等提出了病害自動分割識別系統(tǒng),實驗表明,經(jīng)分割識別后的平均分類準(zhǔn)確率達(dá)92%[6]。張建華等構(gòu)建了改進(jìn)的病害識別網(wǎng)絡(luò)模型,該卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)結(jié)構(gòu)來自VGG-16,通過采用6 個標(biāo)簽的SoftMax 分類器,代替了原本結(jié)構(gòu)中的分類器,并在此基礎(chǔ)上優(yōu)化了模型網(wǎng)絡(luò)的結(jié)構(gòu)與參數(shù),改進(jìn)了全連接層的層數(shù),通過參數(shù)遷移共享了訓(xùn)練模型卷積和池化層權(quán)重參數(shù),對目標(biāo)網(wǎng)絡(luò)進(jìn)行了預(yù)訓(xùn)練,并構(gòu)建了改進(jìn)模型,平均識別準(zhǔn)確率為89.51%[7]。
以上談到的傳統(tǒng)機(jī)器學(xué)習(xí)方法需要人工設(shè)計、提取特征,在此基礎(chǔ)之上獲得病斑紋理、顏色和病變位置等信息,而不同程度的同種番茄葉片病害在病斑的紋理、顏色等方面具有較強(qiáng)的相似性[8]。傳統(tǒng)方法對于表征相似病害的特征提取能力有限,還存在著識別效果較差、過擬合和網(wǎng)絡(luò)穩(wěn)定性較差等常見問題,因此不具有廣泛的適用性?;诖?,課題組在ResNet網(wǎng)絡(luò)[9]的基礎(chǔ)上,引入基于核函數(shù)的非線性SVM 算法[10],用以提高網(wǎng)絡(luò)的特征提取能力,并構(gòu)建模型實現(xiàn)番茄葉片的病害識別。
本研究所使用的番茄葉片病害數(shù)據(jù)集包含葉霉病、灰葉斑病和早疫病這三類番茄葉片病害的圖像樣本。
現(xiàn)對番茄葉片數(shù)據(jù)集進(jìn)行處理,采用鏡像翻轉(zhuǎn)、平移、隨機(jī)縮放、隨機(jī)裁剪、調(diào)整亮度和旋轉(zhuǎn)(0°、90°、180°、270°)的手段以增加病害樣本數(shù)量,起到擴(kuò)充樣本數(shù)量、提高模型泛化能力的作用。擴(kuò)充后的數(shù)據(jù)集共計926 張病害圖像樣本,其中包含了番茄葉片健康圖像200 張、稻瘟病圖像236 張、稻曲病圖像276 張和白葉枯病圖像214 張。將處理得到的病害圖像按照病害樣本標(biāo)簽以6∶2∶2 的比例劃分為訓(xùn)練集、驗證集、測試集。
在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程中,低頻特征為網(wǎng)絡(luò)訓(xùn)練的有效特征。由于高頻特征而導(dǎo)致的過擬合現(xiàn)象時有發(fā)生,現(xiàn)通過增加噪聲、噪點來消除病害樣本中的高頻特征(高斯噪聲、椒鹽噪聲),以提升模型的魯棒性。
以上簡單介紹了殘差網(wǎng)絡(luò)與支持向量機(jī)的分類原理與優(yōu)良性能,本研究基于核函數(shù)的非線性SVM的分類原理,采用ResNet101 網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建網(wǎng)絡(luò)模型。在去除全連接層后,將ResNet101 輸出的特征向量作為SVM 的輸入向量進(jìn)行分類,構(gòu)建番茄葉片病害圖像識別模型BSC-ResNet。
首先,在處理得到的番茄病害葉片數(shù)據(jù)集上使用ResNet101 網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)集的預(yù)訓(xùn)練,在此后將卷積層輸出的特征向量轉(zhuǎn)換為SVM 輸入特征,經(jīng)過基于核函數(shù)的非線性SVM 分類器進(jìn)行分類并輸出預(yù)測結(jié)果,再根據(jù)預(yù)測結(jié)果的效果來不斷調(diào)整原本預(yù)訓(xùn)練得到的參數(shù),以此來優(yōu)化網(wǎng)絡(luò)。
其次,通常會存在由權(quán)值層造成的梯度色散問題,ResNet101 網(wǎng)絡(luò)通過一種叫做越層連接的結(jié)構(gòu)件來避免這樣的問題,使網(wǎng)絡(luò)性能處于最優(yōu)狀態(tài),達(dá)到識別率不隨網(wǎng)絡(luò)深度的增加而降低的優(yōu)越效果。通過采用1×1 的卷積,先降維后升維,形成一個“Bottleneck”結(jié)構(gòu)。
BSC-ResNet 網(wǎng)絡(luò)是基于ResNet101 網(wǎng)絡(luò)的殘差學(xué)習(xí)塊,假設(shè)將底層映射標(biāo)記為H(x),引入基于核函數(shù)的非線性SVM 進(jìn)行分類。將經(jīng)過堆疊的非線性層擬合的殘差映射標(biāo)記為最終實現(xiàn)的BSC-ResNet 網(wǎng)絡(luò)結(jié)構(gòu),殘差塊可以定義為F(x)+x,關(guān)系式為:
本研究采用ResNet101 網(wǎng)絡(luò)、MobileNet 網(wǎng)絡(luò)、MobileNetV2 網(wǎng)絡(luò)、InceptionV3 網(wǎng)絡(luò)、Xception 網(wǎng)絡(luò)作為實驗對照組,實驗組與對照組分別對含有4 個標(biāo)簽的樣本數(shù)據(jù)集進(jìn)行訓(xùn)練后得到訓(xùn)練結(jié)果。
MobileNetV2 網(wǎng)絡(luò)、Xception 網(wǎng)絡(luò)對于番茄葉片病害的識別準(zhǔn)確率較低。由于在卷積計算的部分,Xception 網(wǎng)絡(luò)會對每個通道內(nèi)的數(shù)據(jù)做單獨(dú)計算,對N 維通道輸出,基數(shù)(Cardinality)等于N。對于番茄葉片褐斑病,由于病斑顏色紋理特征有限,Xception網(wǎng)絡(luò)不能很好地識別,分類效果較差。MobileNetV2網(wǎng)絡(luò)為減少計算量、確保精度損失不顯著的效果,應(yīng)用深度可分離的卷積層。MobileNet 模型在深度卷積層之后引入了非線性激活函數(shù)ReLU,并且深度卷積不具有更改通道數(shù)的能力。提取的特征是單個通道的,而ReLU 激活函數(shù)用于操縱多層輸出會導(dǎo)致信息丟失。對于負(fù)的輸入,ReLU 的輸出為零,這將會壓縮部分特征。因此,MobileNetV2 網(wǎng)絡(luò)在番茄葉片黑腐病相對于健康狀態(tài)與葉枯病這兩類樣本,識別準(zhǔn)確率較低,不具備一定的應(yīng)用普適性。InceptionV3網(wǎng)絡(luò)在識別番茄葉片病害時表現(xiàn)出識別準(zhǔn)確率較低、穩(wěn)定性較差的特點,不適合作為番茄葉片病害的識別模型。
本研究搭建的模型基于ResNet101 網(wǎng)絡(luò),引入基于核函數(shù)的非線性SVM 算法使數(shù)據(jù)樣本可線性劃分,在研究的最開始由于數(shù)據(jù)集中健康番茄葉片的數(shù)量不足,造成識別效果較差。在仔細(xì)分析混淆矩陣表現(xiàn)和精準(zhǔn)率與召回率后發(fā)現(xiàn)問題出現(xiàn)在健康番茄葉片上,隨后對健康葉片數(shù)據(jù)集進(jìn)行了平移與增加噪聲的數(shù)據(jù)樣本擴(kuò)充,將數(shù)量增加到250 張,與其他樣本數(shù)據(jù)量保持統(tǒng)一水平,再將數(shù)據(jù)增強(qiáng)后的數(shù)據(jù)集導(dǎo)入網(wǎng)絡(luò)完成訓(xùn)練,從結(jié)果來看,模型整體性能有較大提升。
對照組中InceptionV3 網(wǎng)絡(luò)一開始的預(yù)訓(xùn)練結(jié)果呈現(xiàn)收斂速度較慢,驗證集loss 值較高,并保持在0.3 處震蕩,表明其在混淆矩陣上識別效果較差。通過查閱資料了解到,InceptionV3 網(wǎng)絡(luò)可以準(zhǔn)確估計某一樣本在所有類別上的邊緣分布,不能用在某一任務(wù)的樣本數(shù)據(jù)集上訓(xùn)練的分類模型來評估另一不同任務(wù)的數(shù)據(jù)集上訓(xùn)練的生成模型。InceptionV3 網(wǎng)絡(luò)對于數(shù)據(jù)增強(qiáng)的預(yù)處理尺寸也提出了要求,屬于值得注意的細(xì)節(jié)問題。通過使用番茄葉片數(shù)據(jù)集對InceptionV3 網(wǎng)絡(luò)進(jìn)行訓(xùn)練后,通過同一類別的驗證集,震蕩問題很好地得到了解決,驗證集loss 值向0.2緩慢收斂。
本文的對照組選取了BSC-ResNet、ResNet101 網(wǎng)絡(luò)、MobileNet 網(wǎng)絡(luò)、MobileNetV2 網(wǎng)絡(luò)、InceptionV3網(wǎng)絡(luò)和Xception 網(wǎng)絡(luò),采用以上網(wǎng)絡(luò)對番茄葉片病害數(shù)據(jù)集進(jìn)行訓(xùn)練并通過測試集測試。MobileNetV2網(wǎng)絡(luò)、Xception 網(wǎng)絡(luò)對于番茄葉片病害的識別準(zhǔn)確率較低;Xception 模型在細(xì)粒度圖像分類上有很好的泛化能力;但對于番茄葉霉病,由于早期病變樣本呈現(xiàn)的病斑顏色單一、特征有限,Xception 模型不能很好地識別番茄灰葉斑病,分類效果較差;MobileNetV2 作為輕量化的網(wǎng)絡(luò),一定程度上減少了參數(shù)與計算量,優(yōu)點是內(nèi)核小,不容易發(fā)生過擬合。