吳云志,劉翱宇,朱小寧,劉晨曦,范國(guó)華,樂 毅,張友華*
一種植物病害圖像識(shí)別卷積網(wǎng)絡(luò)架構(gòu)
吳云志1,2,劉翱宇1,朱小寧3,劉晨曦4,范國(guó)華1,2,樂 毅1,2,張友華1,2*
(1. 安徽農(nóng)業(yè)大學(xué)信息與計(jì)算機(jī)學(xué)院,合肥 230036;2. 安徽省北斗精準(zhǔn)農(nóng)業(yè)信息工程實(shí)驗(yàn)室,合肥 230036; 3. 安徽農(nóng)業(yè)大學(xué)茶與食品科技學(xué)院,合肥 230036;4. 湖南大學(xué)信息科學(xué)與工程學(xué)院,長(zhǎng)沙 410082)
針對(duì)人工提取植物病害圖像特征存在效率低、識(shí)別率低、成本高等問題,提出一種基于DenseNet網(wǎng)絡(luò)的現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)FI-DenseNet,旨在對(duì)多種類的植物病害圖像達(dá)到高精準(zhǔn)的識(shí)別準(zhǔn)確率。引入Focal損失函數(shù)對(duì)DenseNet網(wǎng)絡(luò)進(jìn)行改進(jìn),使得訓(xùn)練模型的注意力集中于難分類的樣本。FI-DenseNet網(wǎng)絡(luò)可以增強(qiáng)特征傳遞、進(jìn)行深層訓(xùn)練或有效改善過擬合問題。采用的數(shù)據(jù)集有87 867張植物病害圖像,圖像包含同種植物的多種病害,并涉及38種植物病害。對(duì)圖像進(jìn)行預(yù)處理、數(shù)據(jù)增強(qiáng)后,將DenseNet169網(wǎng)絡(luò)、ResNet50網(wǎng)絡(luò)和MobileNet網(wǎng)絡(luò)作為參照實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,F(xiàn)I-DenseNet網(wǎng)絡(luò)的收斂速度更快且識(shí)別準(zhǔn)確率最高,測(cè)試集識(shí)別準(zhǔn)確率為98.97%,F(xiàn)I-DenseNet網(wǎng)絡(luò)的魯棒性和泛化能力均優(yōu)于對(duì)照網(wǎng)絡(luò),可為植物病害智能診斷提供參考。
DenseNet;植物病害;卷積神經(jīng)網(wǎng)絡(luò);圖像識(shí)別
植物病害對(duì)當(dāng)今農(nóng)林業(yè)是一個(gè)巨大挑戰(zhàn),它時(shí)刻影響著人類的經(jīng)濟(jì)效益。精準(zhǔn)且快速的診斷植物病害可以及時(shí)減少植物病害對(duì)經(jīng)濟(jì)帶來的損失[1]。然而如今植物病害種類繁多,不同生長(zhǎng)階段的植物存在不同種類的植物病害,這導(dǎo)致非專業(yè)人士對(duì)于植物病害的分辨往往不夠精確、快速[2]。隨著深度學(xué)習(xí)的不斷發(fā)展,圖像識(shí)別在眾多領(lǐng)域得到了廣泛應(yīng)用,相對(duì)于人工識(shí)別植物病害,采用計(jì)算機(jī)視覺技術(shù)識(shí)別不僅成本低而且時(shí)效快[3],同時(shí)還可以減少經(jīng)濟(jì)成本和因?yàn)闀r(shí)延所帶來的損失。
在卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)未廣泛應(yīng)用之前,植物病害圖像的特征提取十分困難。目前很多學(xué)者提出一些效果顯著的模型,例如CNN識(shí)別玉米品種[4]、AlexNet網(wǎng)絡(luò)識(shí)別油茶病害[5]、VGG16網(wǎng)絡(luò)識(shí)別棉花病害[6]和Inception-v3網(wǎng)絡(luò)識(shí)別花生葉部病害[7]等。除了Inception-v3網(wǎng)絡(luò)、CNN之外,其余模型都是基于CNN的傳統(tǒng)卷積架構(gòu)模型,越來越多的學(xué)者將基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別技術(shù)用于病害識(shí)別。然而在植物病害圖像識(shí)別種類上,過去的研究工作進(jìn)行分類識(shí)別的種類數(shù)普遍偏少,采用現(xiàn)代卷積網(wǎng)絡(luò)架構(gòu)的模型偏少,如何進(jìn)行高精度且多種類的植物病害識(shí)別并沒有太多相關(guān)研究。將主要采用改進(jìn)的DenseNet (densely connected convolutional networks)[8]對(duì)87 867張植物病害進(jìn)行識(shí)別分類,其中涉及38種植物病害,并以兩種現(xiàn)代卷積架構(gòu)模型ResNet網(wǎng)絡(luò)[9]和MobileNet[10]網(wǎng)絡(luò)作為參照模型,最終完成植物病害圖像識(shí)別分類。
DenseNet網(wǎng)絡(luò)是現(xiàn)代卷積架構(gòu)模型之一,它是比ResNet網(wǎng)絡(luò)效果更優(yōu)的CNN網(wǎng)絡(luò)。在傳統(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò)中,隨著網(wǎng)絡(luò)深度的加深,會(huì)出現(xiàn)明顯的梯度消失問題,即隨著網(wǎng)絡(luò)層數(shù)的加深,分類的準(zhǔn)確率卻發(fā)生了下降。和很多優(yōu)秀的現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)一樣,DenseNet網(wǎng)絡(luò)有效緩解了梯度消失問題。此外DenseNet網(wǎng)絡(luò)加強(qiáng)了特征傳遞、一定程度上減少了參數(shù)數(shù)量[11]。DenseNet網(wǎng)絡(luò)目前被廣泛應(yīng)用在圖像分類識(shí)別[12]、圖像分割[13]和目標(biāo)檢測(cè)[14]等計(jì)算機(jī)視覺領(lǐng)域。
采用現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)DenseNet網(wǎng)絡(luò)對(duì)38種植物病害圖像進(jìn)行識(shí)別,并在此基礎(chǔ)上提出FI-DenseNet (focal loss improved DenseNet)網(wǎng)絡(luò),以提升其識(shí)別準(zhǔn)確率。最終實(shí)現(xiàn)了對(duì)多種類的植物病害圖像進(jìn)行高精準(zhǔn)識(shí)別,極大減緩了訓(xùn)練中出現(xiàn)的梯度消失問題,加強(qiáng)了植物病害圖像的特征傳遞,最終將識(shí)別準(zhǔn)確率提高到98.97%。
研究采用的植物病害圖像數(shù)據(jù)集來Kaggle數(shù)據(jù)科學(xué)官網(wǎng)的公共數(shù)據(jù)集New plant diseases dataset[15],此數(shù)據(jù)集由87 867張病態(tài)或健康植物葉片的RGB圖像組成,分為38個(gè)種類。植物病害數(shù)據(jù)包含的植物種類為蘋果、藍(lán)莓、櫻桃、玉米、葡萄、柑橘、桃、辣椒、馬鈴薯、大豆、樹莓、南瓜、草莓和番茄。數(shù)據(jù)集中的植物病害圖像圖1所示。
圖1 植物病害圖像
Figure 1 Plant disease images
首先將植物病害RGB圖像數(shù)據(jù)按照標(biāo)簽分為38類,具體類別如表1所示。將重復(fù)數(shù)據(jù)剔除,剔除后的數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,其比例為6∶2∶2。其次對(duì)作為輸入層的圖像進(jìn)行歸一化處理,這有利于后續(xù)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練[16]。隨之進(jìn)行數(shù)據(jù)增強(qiáng),將病害圖像隨機(jī)旋轉(zhuǎn)30°,水平方向和垂直方向隨機(jī)平移20%,隨機(jī)錯(cuò)切變換強(qiáng)度為0.2,圖像隨機(jī)縮放的幅度設(shè)置為0.2,對(duì)圖像進(jìn)行圖像隨機(jī)水平翻轉(zhuǎn)。最后將所有病害圖像調(diào)整為150×150像素,樣本標(biāo)簽數(shù)組采用2D的one-hot編碼標(biāo)簽。
表1 植物病害圖像標(biāo)簽與數(shù)量
隨著卷積神經(jīng)網(wǎng)絡(luò)層數(shù)的增加,會(huì)出現(xiàn)梯度消失問題[17]。為了解決隨著層數(shù)加深帶來的梯度消失,ResNet網(wǎng)絡(luò)將旁路信息進(jìn)行連接,在訓(xùn)練過程中隨機(jī)丟失一些層數(shù)來縮短自身網(wǎng)絡(luò)以獲得更好的訓(xùn)練效果。而為了保證能獲得網(wǎng)絡(luò)層的最大信息,DenseNet網(wǎng)絡(luò)將所有層直接相互連接。DenseNet網(wǎng)絡(luò)為了保留前饋特性,每層都從所有先前的層中獲取其他輸入,并將其自身的特征圖傳遞給所有后續(xù)層,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 4層DenseNet網(wǎng)絡(luò)結(jié)構(gòu)
Figure 2 4-layer DenseNet network structure
圖3 識(shí)別植物病害的DenseNet網(wǎng)絡(luò)
Figure 3 DenseNet network to identify plant diseases
DenseNet網(wǎng)絡(luò)中的池化層可以改變特征圖的尺寸,用來解決當(dāng)特征圖尺寸發(fā)生變化時(shí)公式(1)中連接不可取的問題。植物病害圖像進(jìn)行輸入時(shí),將網(wǎng)絡(luò)劃分為多個(gè)緊密相連的密集塊(dense block)。如圖3所示,塊與塊之間的層稱為過渡層,每個(gè)過渡層包括批量歸一化BN層、1×1卷積層和2×2的平均池化層。
樣本的類別不均衡會(huì)導(dǎo)致分類準(zhǔn)確率的下降。本研究的模型主要是針對(duì)植物病害圖像進(jìn)行識(shí)別,雖然表1中各個(gè)樣本標(biāo)簽數(shù)量皆為2 000多張,但植物類別數(shù)量差異較大,番茄涉及的病害圖像高達(dá)22 930張,而柑橘涉及的病害圖像僅為2 513張,其比例約為9∶1。此外,數(shù)據(jù)中病害樣本和健康樣本也并不均衡,病害樣本數(shù)共計(jì)64 451張、健康樣本數(shù)共計(jì)23 316張,其比例約為3∶1。同種植物類別的病害圖像在進(jìn)行病害特征提取過程中,會(huì)有一定的近似提取過程,相對(duì)于病害圖像少的植物類別,病害圖像多的植物類別往往更容易分類。病害樣本數(shù)量相對(duì)于健康樣本數(shù)量較多,也存在著類別不均衡問題。Focal loss損失函數(shù)[19]在網(wǎng)絡(luò)進(jìn)行特征提取時(shí),能夠有效解決這種類別不均衡問題,從而提升網(wǎng)絡(luò)的平均識(shí)別率。
在此對(duì)DenseNet網(wǎng)絡(luò)進(jìn)行改進(jìn)并將改進(jìn)后的模型稱之為FI-DenseNet,它是基于DenseNet169網(wǎng)絡(luò)的同時(shí),引入了Focal Loss損失函數(shù)加以改進(jìn),使得網(wǎng)絡(luò)在訓(xùn)練時(shí)可以減少易分樣本的權(quán)重,從而使模型在訓(xùn)練的過程中更專注難分類的樣本[20]。
表2 DenseNet169網(wǎng)絡(luò)結(jié)構(gòu)
Focal Loss是在交叉熵?fù)p失函數(shù)的基礎(chǔ)上進(jìn)行修改得到的,在DenseNet網(wǎng)絡(luò)中,經(jīng)softmax函數(shù)
回歸后交叉熵?fù)p失函數(shù)的函數(shù)表達(dá)式如下:
Figure 4 Change ofpand loss under different values of
其中p為樣本屬于某個(gè)類別的概率,成為聚焦參數(shù),其中0≤≤5。(1-p)在此稱為調(diào)制系數(shù),其取值范圍為[0,1],可以減少易分類樣本的權(quán)重,使模型在訓(xùn)練中可以關(guān)注難分類的樣本。當(dāng)p值接近1說明樣本容易訓(xùn)練,p值接近0,樣本難以訓(xùn)練。不同取值,p和loss(損失值)表現(xiàn)如圖4所示。當(dāng)取值為0時(shí)損失函數(shù)即為交叉熵?fù)p失函數(shù)。
經(jīng)實(shí)驗(yàn),取值為2時(shí)效果最好,若此時(shí)預(yù)測(cè)的樣本準(zhǔn)確率高(即p很高),那么(1-p)的值就會(huì)很小,損失函數(shù)變化率變得很小,反之亦然。預(yù)測(cè)病害樣本準(zhǔn)確率分別為0.95和0.5的樣本,最終損失函數(shù)值會(huì)相差100倍,所以模型將會(huì)關(guān)注預(yù)測(cè)準(zhǔn)確率低的病害樣本,進(jìn)而提升模型的平均識(shí)別率。最終FI-DenseNet網(wǎng)絡(luò)的損失函數(shù)可表示為:
改進(jìn)后的FI-DenseNet網(wǎng)絡(luò)增加了損失函數(shù)的非線性度,使得訓(xùn)練模型的注意力集中于難分類的樣本種類上,最終的實(shí)驗(yàn)結(jié)果表明FI-DenseNet魯棒性更好、識(shí)別準(zhǔn)確率更高。
實(shí)驗(yàn)硬件環(huán)境為:CPU: Intel(R) Core(TM)i7-8700 CPU @3.20GHz; GPU: NVIDIA GeForce GTX 1080Ti; 操作系統(tǒng):Windows 10 64bit;軟件環(huán)境:Python 3.6.2;深度學(xué)習(xí)框架:Tensorflow 2.0、Keras 2.3.1。
采用4種網(wǎng)絡(luò)模型對(duì)87 867張植物病害圖像進(jìn)行參照實(shí)驗(yàn),其中訓(xùn)練集、驗(yàn)證集和測(cè)試集比例為6∶2∶2。4種網(wǎng)絡(luò)模型分別為FI-DenseNet網(wǎng)絡(luò)、DenseNet169網(wǎng)絡(luò)、ResNet50網(wǎng)絡(luò)和MobileNet網(wǎng)絡(luò)。
模型的優(yōu)化算法為隨機(jī)梯度下降(stochastic gradient descent,SGD),采用SGD對(duì)梯度進(jìn)行更新,對(duì)于數(shù)據(jù)集較大的數(shù)據(jù)也可以快速收斂。SGD每次迭代會(huì)產(chǎn)生比較大的噪音,容易跳不出局部最優(yōu)解,在此引入動(dòng)量概念(momentum),Momentum在更新方向的同時(shí)會(huì)保留之前的方向,可以增加模型的穩(wěn)定性,并且具有擺脫局部最優(yōu)的能力。SGD優(yōu)化器初始學(xué)習(xí)率設(shè)為0.001,Momentum在此設(shè)為0.9,批量大?。╞atch size)設(shè)為64,每次參數(shù)更新后學(xué)習(xí)率衰減值(decay)設(shè)為0.001,使用 Nesterov 動(dòng)量。除FI-DenseNet網(wǎng)絡(luò)外,訓(xùn)練模型采用交叉熵?fù)p失函數(shù)(cross entropy error function)作為損失函數(shù)[21]。使用ModelCheckpoint方法,在訓(xùn)練過程中保存訓(xùn)練過程中性能最好的模型。最后將epoch設(shè)為10開始進(jìn)行訓(xùn)練。
圖5 不同樣本通過密集塊后輸出的類激活圖
Figure 5 Class activation graph output after different samples pass through dense blocks
(a) 訓(xùn)練集準(zhǔn)確率;(b) 驗(yàn)證集準(zhǔn)確度;(c) 訓(xùn)練集損失;(d) 驗(yàn)證集損失。
Figure 6 Training accuracy and loss function curves under different training networks
表3 不同訓(xùn)練網(wǎng)絡(luò)的評(píng)價(jià)指標(biāo)
注:Ⅰ.FI-DenseNet;Ⅱ.DenseNet169;Ⅲ.ResNet50;Ⅳ.MobileNet。1.蘋果黑星病;2.玉米健康;3.胡椒細(xì)菌性葉斑病;4.馬鈴薯健康;5.馬鈴薯晚疫病;6.番茄瘡痂病;7.番茄早疫病;8.番茄健康;9.番茄晚疫病;10.番茄葉霉病;11.番茄斑枯病;12.番茄紅蜘蛛損傷;13.番茄黃化曲葉病毒病。
在FI-DenseNet網(wǎng)絡(luò)中,選取8張植物病害圖像作為實(shí)驗(yàn)對(duì)象,觀察特征提取的過程。通過觀察FI-DenseNet網(wǎng)絡(luò)中4個(gè)密集塊輸出的類激活圖來觀察FI-DenseNet網(wǎng)絡(luò)特征提取的過程,密集塊輸出的類激活圖如圖5所示。類激活圖(CAM, class activation map)可視化是指對(duì)輸入圖像生成類激活的熱力圖,表示每個(gè)位置對(duì)該類別的重要程度。圖5所示的類激活圖能夠反映網(wǎng)絡(luò)提取每類樣本病害的關(guān)鍵特征,熱力圖顏色越深(即越接近紅色),也就表示該部位對(duì)最終分類決策的影響越大。FI-DenseNet網(wǎng)絡(luò)將病害圖像的特征通過4個(gè)密集塊不斷傳遞,從密集塊1到密集塊4,病害特征部位的熱力圖顏色也不斷加深,顏色較深病害部位對(duì)決策的影響也越大。圖5可以觀察到,圖像經(jīng)FI-DenseNet網(wǎng)絡(luò)的四個(gè)密集層處理后,特征提取不斷的傾向于植物圖像的病害關(guān)鍵部位。
本研究采用FI-DenseNet網(wǎng)絡(luò)、DenseNet169網(wǎng)絡(luò)、ResNet50網(wǎng)絡(luò)和MobileNet網(wǎng)絡(luò)對(duì)植物病害數(shù)據(jù)集進(jìn)行訓(xùn)練,實(shí)驗(yàn)結(jié)果圖5所示。
在訓(xùn)練結(jié)果中,F(xiàn)I-DenseNet網(wǎng)絡(luò)、DenseNet169網(wǎng)絡(luò)、ResNet50網(wǎng)絡(luò)和MobileNet網(wǎng)絡(luò)對(duì)應(yīng)的最優(yōu)訓(xùn)練準(zhǔn)確率分別為99.79%、99.70%、99.60%和99.01%。如圖6(a)和(c),在第6個(gè)epoch時(shí),F(xiàn)I-DenseNet網(wǎng)絡(luò)、DenseNet169網(wǎng)絡(luò)和ResNet50網(wǎng)絡(luò)模型已經(jīng)接近收斂,最終訓(xùn)練準(zhǔn)確率相差不大。圖6(b)為驗(yàn)證集準(zhǔn)確率,提出的FI-DenseNet網(wǎng)絡(luò)的準(zhǔn)確率明顯高于其他模型。圖6(d)為驗(yàn)證集損失率,F(xiàn)I-DenseNet網(wǎng)絡(luò)的損失率低于其他模型,值得注意的是,隨著epoch 不斷增加,F(xiàn)I-DenseNet網(wǎng)絡(luò)驗(yàn)證集損失率減幅相對(duì)于DenseNet169網(wǎng)絡(luò)更加平穩(wěn),驗(yàn)證集損失率也更低。
表4 不同訓(xùn)練網(wǎng)絡(luò)下的評(píng)價(jià)結(jié)果
在此選取38種植物病害中評(píng)價(jià)指標(biāo)差異明顯的樣本,得到如表3所示結(jié)果。Precision、Recall和F1 score的數(shù)值越大說明模型的質(zhì)量越高,可以看出FI-DenseNet網(wǎng)絡(luò)和DenseNet169網(wǎng)絡(luò)的評(píng)價(jià)指標(biāo)明顯高于對(duì)照網(wǎng)絡(luò),F(xiàn)I-DenseNet網(wǎng)絡(luò)達(dá)到比較好的模型效果。
實(shí)驗(yàn)結(jié)果表明FI-DenseNet網(wǎng)絡(luò)相對(duì)于其他網(wǎng)絡(luò)有著更好的魯棒性和泛化性,能更好的提取植物病害特征。最后進(jìn)行植物病害圖像識(shí)別模型的測(cè)試,測(cè)試集含有近17 000多張測(cè)試圖像,其病害種類數(shù)量均勻分布。用上述訓(xùn)練好的4種網(wǎng)絡(luò)對(duì)病害測(cè)試集進(jìn)行驗(yàn)證,結(jié)果如表4所示,F(xiàn)I-DenseNet網(wǎng)絡(luò)的測(cè)試集準(zhǔn)確率最終達(dá)到98.97%。
植物病害圖像識(shí)別是計(jì)算機(jī)視覺在農(nóng)林業(yè)領(lǐng)域較好的應(yīng)用,相對(duì)于人工提取病害特征,采用多分類、高精度的現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)模型可以極大減少識(shí)別時(shí)間、提升識(shí)別準(zhǔn)確率,最終達(dá)到提升經(jīng)濟(jì)效益的目的。本研究設(shè)計(jì)了基于DenseNet網(wǎng)絡(luò)的FI-DenseNet網(wǎng)絡(luò)對(duì)38種植物病害進(jìn)行識(shí)別,設(shè)置其他現(xiàn)代卷積網(wǎng)絡(luò)模型進(jìn)行對(duì)照實(shí)驗(yàn)并建立模型評(píng)價(jià)指標(biāo),最終得出FI-DenseNet網(wǎng)絡(luò)模型平均識(shí)別準(zhǔn)確率高達(dá)98.97%,根據(jù)評(píng)價(jià)指標(biāo)Precision、Recall、F1-score,可以看出其模型效果最好,魯棒性、泛化能力最佳。此模型可以用于其他病害的遷移學(xué)習(xí),可為后續(xù)植物病害圖像識(shí)別研究提供參考。
[1] 邱德文. 我國(guó)植物病害生物防治的現(xiàn)狀及發(fā)展策略[J].植物保護(hù), 2010, 36(4): 15-18.
[2] 任勝男,孫鈺,張海燕,等. 基于one-shot學(xué)習(xí)的小樣本植物病害識(shí)別[J]. 江蘇農(nóng)業(yè)學(xué)報(bào), 2019, 35(5): 1061-1067.
[3] 柴阿麗. 基于計(jì)算機(jī)視覺和光譜分析技術(shù)的蔬菜葉部病害診斷研究[D]. 北京:中國(guó)農(nóng)業(yè)科學(xué)院, 2011.
[4] 徐巖,劉林,李中遠(yuǎn),等. 基于卷積神經(jīng)網(wǎng)絡(luò)的玉米品種識(shí)別[J]. 江蘇農(nóng)業(yè)學(xué)報(bào), 2020,36(1): 18-23.
[5] 龍滿生,歐陽春娟,劉歡,等. 基于卷積神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)的油茶病害圖像識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2018, 34(18): 194-201.
[6] 張建華,孔繁濤,吳建寨,等.基于改進(jìn)VGG卷積神經(jīng)網(wǎng)絡(luò)的棉花病害識(shí)別模型[J].中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào), 2018, 23(11): 161-171.
[7] 蘇婷婷,牟少敏,董萌萍,等. 深度遷移學(xué)習(xí)在花生葉部病害圖像識(shí)別中的應(yīng)用[J]. 山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2019, 50(5): 865-869.
[8] HUANG G, LIU Z, VAN DER MAATEN L, et al. Densely connected convolutional networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, Honolulu,2017: 2261-2269.
[9] HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), IEEE, Las Vegas, 2016: 770-778.
[10] HOWARD A, ZHU M, CHEN B, et al. Mobilenets: Efficient convolutional neural networks for mobile vi-sion applications[J]. Arxiv Preprint Arxiv,2017, 1704.04861 https://arxiv.org/abs/1704.04861.
[11] 匡曉華. 基于深度學(xué)習(xí)與可穿戴傳感器的人體行為識(shí)別[D]. 南京:南京信息工程大學(xué), 2018.
[12] ABAI Z, RAJMALWAR N. Densenet models for tiny ImageNet classification[J]. 2019, http://arxiv.org/abs/ 1904.10429.
[13] JéGOU S, DROZDZAL M, VAZQUEZ D, et al. The one hundred layers tiramisu: fully convolutional DenseNets for semantic segmentation[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). IEEE, Honolulu, 2017: 1175-1183.
[14] 張翔,趙曉麗,張嘉祺,等. 基于3D DenseNet的視頻鏡頭邊界檢測(cè)方法[J]. 光電子·激光, 2019, 30(10): 1103-1109.
[15] KAGGLE. New plant diseases dataset[EB/OL]. https:// www.kaggle.com/vipoooool/new-plant-diseases-dataset, 2014.
[16] BOUT D, MILLER T. Improving the performance ofthe Hopfield-Tank Neural network with normalizationand annealing[J]. Biological Cybernetics, 1989, 62(2): 129- 139.
[17] HOCHREITER S. The vanishing gradient problem during learning recurrent neural nets and problem solutions[J]. Int J Unc Fuzz Knowl Based Syst, 1998, 6(2): 107-116.
[18] 劉華松. 基于深度學(xué)習(xí)的毒株胚蛋圖像分割方法研究[D]. 天津:天津工業(yè)大學(xué), 2019.
[19] LIN T Y, GOYAL P, GIRSHICK R, et al. Focal loss for dense object detection[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, PP(99): 2999- 3007.
[20] 楊其睿. 基于改進(jìn)的DenseNet深度網(wǎng)絡(luò)火災(zāi)圖像識(shí)別算法[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2019, 36(2): 258-263.
[21] 劉楊圣彥, 潘翔, 劉復(fù)昌, 等. 面向三維模型視圖特征提取的殘差卷積網(wǎng)絡(luò)優(yōu)化[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2019, 31(6):936-942.
A convolutional network for plant disease image recognition (FI-DenseNet)
WU Yunzhi1,2, LIU Aoyu1, ZHU Xiaoning3, LIU Chenxi4,FAN Guohua1,2, YUE Yi1,2, ZHANG Youhua1,2
(1. School of Information and Computer Science, Anhui Agricultural University, Hefei 230036;2. Anhui Provincial Engineering Laboratory for Beidou Precision Agriculture Information, Anhui Agricultural University, Hefei 230036;3. School of Tea and Food Technology, Anhui Agricultural University, Hefei 230036;4. College of Information Science and Electronic Engineering, Hunan University, Changsha 410082)
Nowadays, artificially extracting plant disease image features has problems such as low efficiency, low recognition rate, and high cost. In this paper, we propose a modern convolutional neural network architecture FI-DenseNet based on DenseNet, which achieves high-precision recognition accuracy for various types of plant disease images. We introduce the Focal loss function to improve the DenseNet so that the attention of the training model is focused on the types of samples that are difficult to classify. The FI-DenseNet can enhance feature transfer, perform deep training, and effectively improve overfitting problems. The dataset used in this paper has 87 867 plant disease images. The image contains multiple plant diseases of the same species and involves 38 plant diseases. After preprocessing the image and enhancing the data, we used DenseNet169, ResNet50, and MobileNet as reference experiments. The experimental results show that the FI-DenseNet has faster convergence speed and the highest recognition accuracy rate. The test set recognition accuracy rate is 98.97%. The robustness and generalization ability of the FI-DenseNet are better than the baselines, which can provide a reference for the intelligent diagnosis of plant diseases.
DenseNet; plant diseases; convolutional neural network; image recognition
TP391
A
1672-352X (2021)01-0150-07
10.13610/j.cnki.1672-352x.20210319.002
2021-3-23 10:42:32
[URL] https://kns.cnki.net/kcms/detail/34.1162.S.20210319.1503.004.html
2020-04-07
國(guó)家重點(diǎn)研發(fā)計(jì)劃課題(2017YFD0301303),安徽省科技重大專項(xiàng)(18030901029),安徽省高校自然科學(xué)研究項(xiàng)目(KJ2019A0211),2018年安徽省省級(jí)質(zhì)量工程項(xiàng)目(2018JXTD114)和安徽省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(S202010364210)共同資助。
共同第一作者:吳云志,副教授。E-mail:wuyzh@ahau.edu.cn 劉翱宇,本科生。E-mail:liuaoyu@ahau.edu.cn
張友華, 教授,博士生導(dǎo)師。E-mail:zhangyh@ahau.edu.cn
安徽農(nóng)業(yè)大學(xué)學(xué)報(bào)2021年1期