楊晉丹, 楊 濤, 苗 騰, 朱 超, 沈秋采, 彭宇飛, 梅珀彰, 黨雨晴
(沈陽農業(yè)大學信息與電氣工程學院,遼寧 沈陽 110161)
草莓白粉病是草莓栽培期間的主要病害之一,在整個生長期間均可發(fā)生,嚴重時可導致絕產[1]。使用人工方法識別草莓葉部白粉病已不能滿足草莓工廠化栽培的需求。因此,對草莓葉部白粉病的自動識別,是實現草莓工廠化栽培,保證草莓種植者收益的基礎,對草莓生產具有十分重要的意義?;趫D像的植物病害自動識別主要基于傳統(tǒng)圖像處理技術與卷積神經網絡(Convolutional neural network, CNN)技術。
基于傳統(tǒng)圖像處理技術的植物病害識別主要針對植物葉部病害,常見植物病害的研究對象有玉米、黃瓜、水稻、小麥、棉花和草莓等。針對玉米常見的葉部病害,趙玉霞等[2]、王娜等[3]、張善文等[4]、朱景福等[5]分別利用粗糙集理論、遺傳算法、局部判別映射(LDP)和局部線性嵌入(LLE)算法對提取的病害特征進行約簡,正確識別率依次為83.0%、90.0%、94.4%和99.5%。針對黃瓜常見的葉部病害,謝澤奇等[6]、吳娜等[7]分別利用融合多特征圖切割法和最大類間方差閾值法實現了病斑的分割,對黃瓜病害的識別率分別為98.19%、94.26%。針對水稻常見的葉部病害,劉立波等[8]、管澤鑫等[9]利用灰度共生矩陣和逐步判別分析法進行特征提取,再通過BP神經網絡和貝葉斯判別法進行分類識別,正確識別率分別為95.0%和97.2%。針對小麥常見的葉部病害,張飛云等[10]利用K-means硬聚類算法實現了彩色圖像的分割,最后運用向量化神經網絡分類識別,正確識別率可達95.0%以上。針對棉花常見的葉部病害,Patil等[11]利用全局閾值和自適應閾值對圖像進行分割,同時結合支持向量機對提取的特征進行分類識別。針對草莓蛇眼病害,牛沖[12]利用改進的分水嶺圖像分割算法進行圖像分割,并通過支持向量機對提取的紋理特征進行分類識別,識別精度可達92.0%。以上基于傳統(tǒng)圖像處理技術的病害識別方法研究取得了一定的成果,但這些方法分割圖像的操作太繁瑣,魯棒性差,特征提取方法不具有普適性,進而使得整體方法泛化能力較差。
目前,卷積神經網絡技術在圖像分類[13-15]和目標識別領域[16-18]取得巨大進步,使得其在植物病害的識別上也得到了較廣泛的應用。李艷[19]提出了基于Fisher準則的深度卷積神經網絡算法,實現了對馬鈴薯4種病害的識別,識別精度為87.04%。劉闐宇等[20]提出了一種基于卷積神經網絡的葡萄葉片檢測算法,該算法在復雜背景下對葡萄葉片的檢測率為87.2%。Srdjan等[21]利用卷積神經網絡實現了13種植物病害的識別,該模型還具有分辨植物葉片與其周圍環(huán)境的能力,最終模型的正確識別率為96.3%。Mohanty等[22]分別使用AlexNet和GoogLeNet模型訓練,對PlantVillage中14種植物、26種病害以及部分健康植物的圖像進行分類識別,識別精度分別可達到97.82%和99.35%。以上基于卷積神經網絡的植物病害識別方法具有無需對圖像進行分割,識別種類較多,泛化能力較強等優(yōu)點,比基于傳統(tǒng)圖像處理技術的植物病害識別方法具有明顯的優(yōu)勢。因此,本研究提出一種基于卷積神經網絡的草莓葉部白粉病病害的識別方法,以實現對前期與后期2個階段病害的自動識別,為工廠化草莓栽培中白粉病病害識別與防治提供科學方法和依據。
草莓葉片圖像采集自某草莓種植基地,使用移動手持設備在正常光照下采集。圖像采集時將黑紙板直接墊于葉片之下,不采摘葉片。草莓葉部白粉病病害在發(fā)病前期葉片正面特征不明顯,葉片背面特征相對明顯,因此采集圖像時,既需要采集葉片正面圖像,也需要采集葉片背部圖像。白粉病晚期葉片葉緣卷起并伴有暗色污斑,特征較為明顯,故只采集葉片正面圖像。草莓葉片圖像數據庫共包括5類葉片圖像,分別為健康葉片正面、健康葉片背面、白粉病早期葉片正面、白粉病早期葉片背面和白粉病晚期葉片正面(圖1)。
圖1 草莓葉片圖像數據庫部分圖像Fig.1 Example of the strawberry leaf image database
利用Anaconda3將圖像處理為特定的大小(本研究中采用的圖像大小均為 128×128),并對其作標簽,記為“n_m”。其中n代表圖像所屬的類別(1代表健康葉片正面;2代表健康葉片背面;3代表白粉病早期葉片正面;4代表白粉病早期葉片背面;5代表白粉病晚期葉片正面),m為圖像的編號,例如0_000101代表該圖像為健康葉片正面的第101幅。
1.2.1 不同網絡深度與卷積核尺寸的CNN模型 卷積神經網絡結構主要由3部分組成:輸入層、隱層和輸出層。隱層包含卷積層和采樣層,卷積層用于提取特征,采樣層用于特征優(yōu)化選取。本研究從網絡深度設計、卷積核尺寸選擇以及采樣層池化方法選擇入手,設計卷積神經網絡模型,以實現對草莓葉部白粉病病害的識別。
試驗使用的計算機CPU為Intel Core i7-7700k,內存為32 G,操作系統(tǒng)為 Windows 10,采用的框架為Tensorflow。在Tensorflow上搭建卷積神經網絡模型,部分參數設置:學習率0.005、沖量0.9、權值衰減0.000 5、批處理大小64。
采用正確識別率P作為結果的評價標準,計算公式如下:
(1)
重復使用較小的卷積核可以減少參數訓練的數量[23],增加卷積層和池化層層數可以加強對特征值的提取[24]。因此,本研究設計了3種卷積神經網絡深度、3類卷積核尺寸的9個卷積神經網絡模型用于草莓葉部白粉病病害的識別(表1)。
表1 不同結構的卷積神經網絡(CNN)模型
1.2.2 基于CNN的不同采樣層構建方法選擇 采樣層是對特征的第二次提取,它可以大大降低圖像的維度和分辨率,同時可以避免出現過擬合等問題。構建采樣層的方法有均值池化(Average pooling)、最大值池化(Max pooling)、中間值池化(Median pooling)等。為了充分利用均值池化與最大值池化的優(yōu)勢以及卷積神經網絡自身學習的特性,Lee等[25]提出了混合池化(Mixed max-average pooling)。
(2)
最大值池化:gmax(x)=ximax
(3)
(4)
混合池化:gmix(x)=al·gmax(x)+(1-al)·gavg(x)
(5)
式(5)中al∈[0,1],是均值池化與最大值池化混合的比例,下標l是采樣層所在層數,混合池化在每層采樣層的混合比例都不相同。混合比例al可通過反向傳播算法由輸出損失函數E自動學習獲得:
(6)
(7)
(8)
(9)
根據以上池化方法,本研究基于均值池化、最大值池化、中間值池化與混合池化設計了4種卷積神經網絡模型,并通過試驗選擇一種較優(yōu)的池化方法。
試驗中9個卷積神經網絡模型卷積層均采用padding補0方式,使圖像經過卷積層時長寬不變,只是深度加深;采樣層構建方法選擇最常用的最大值池化。草莓葉片圖像數據庫結構為健康葉片正面201幅,健康葉片背面201幅,白粉病早期葉片正面637幅,白粉病早期葉片背面637幅,白粉病晚期葉片891幅,簡記為 201∶201∶637∶637∶891。
在9種卷積神經網絡模型的識別率隨迭代次數的變化曲線(圖2)中,前6種模型初始識別率較低,在前10次迭代時識別率增長較快,之后漸趨平穩(wěn);后3種模型初始識別率較高,在前5次迭代時識別率增長較快,之后漸趨平穩(wěn)。CNN-1、CNN-2與CNN-3的網絡深度最低,識別率曲線在最下方;CNN-4、CNN-5與CNN-6的網絡深度居中,識別率曲線居中;CNN-7、CNN-8與CNN-9的網絡深度最高,識別率曲線在最上方。同時,在曲線相對平穩(wěn)后,CNN-9的識別率曲線在CNN-7和CNN-8的識別率曲線上方,CNN-6的識別率曲線在CNN-5和CNN-4的識別率曲線上方,CNN-3和CNN-1的識別率曲線在CNN-2的識別率曲線上方。
CNN-1、CNN-2、CNN-3、CNN-4、CNN-5、CNN-6、CNN-7、CNN-8、CNN-9見表1。圖2 不同結構卷積神經網絡(CNN)模型的識別率隨迭代次數的變化Fig.2 Variation of the recognition rate of CNN with different structures with the number of iterations
據此,我們可以得到如下結論:(1)隨著迭代次數以及網絡深度的增加,卷積神經網絡的正確識別率也在逐步提高;(2)同一深度的網絡,隨著訓練次數的增加,卷積核為5×5,3×3的網絡模型識別率較高,其次為卷積核為5×5的網絡模型,卷積核為3×3的網絡模型識別率則不及前兩者;(3)網絡深度越深,混合卷積核(5×5,3×3)的網絡模型優(yōu)勢越明顯。經過5次卷積操作,卷積核為5×5,3×3的模型CNN-9表現最好,識別率為93.16%。
為避免草莓樣本數據結構不均衡(特征較明顯的白粉病晚期葉片所占比例較大)對試驗結果的影響,對健康草莓葉片的圖像庫進行了擴充。將草莓葉片圖像庫結構調整為 881∶881∶655∶655∶896,用于測試的圖像庫結構為 176∶176∶131∶131∶179。
由表2可知,最大值池化與均值池化模型的識別效果相近,中間值池化與混合池化的識別效果相近,其中尤以中間值池化的識別效果最佳,為98.36%??紤]到實際應用中無需對健康(或白粉病前期)葉片的正、背面做識別,因此將此類錯誤識別剔除。
表2 不同池化方法對草莓葉部白粉病病害的識別
4種采樣層構建方法建立的模型對健康、白粉病早期和白粉病晚期3類草莓葉片的識別效果不相同(表3)。其中,中間值池化與混合池化的總體識別率較高,分別為98.36%、98.61%。對于健康草莓葉片,均值池化與混合池化的識別效果較好,分別為99.15%、99.43%;對于草莓白粉病早期葉片,中間值池化與混合池化的識別效果較好,分別為98.85%、96.56%;對于草莓白粉病晚期葉片,混合池化的識別效果最好,可達到100.00%。
權衡對各類葉片的識別情況,最終選擇的采樣層構建方法為混合池化。最終選擇的卷積神經網絡模型為基于混合池化、經過5次卷積操作且卷積核為5×5,3×3的CNN-9模型,該模型可較好地識別草莓葉部白粉病病害。
表3 不同池化方法對草莓葉部白粉病病害的識別率
為確定訓練集與測試集的合適比例,分別以 1∶9、2∶8、3∶7、4∶6、5∶5、6∶4、7∶3、8∶2、9∶1的訓練集與測試集比例進行試驗。草莓葉片圖像庫為擴充后的圖像庫,用于測試的草莓葉片圖像庫結構見表4。
表4 不同訓練集與測試集比例對模型識別率的影響
從卷積神經網絡對草莓葉部白粉病的識別試驗結果(表4)中可得到以下結論:隨著訓練集比重的增大,卷積神經網絡模型的正確識別率呈現升高的趨勢,尤以8∶2時的識別效果最佳。
本研究通過變換卷積核尺寸,加深網絡深度以及測試不同采樣層構建方法,進一步優(yōu)化卷積神經網絡模型,實現了對草莓葉部白粉病病害的較好識別。試驗結果表明,在訓練集與測試集比例為8∶2的條件下,選取基于混合池化的CNN-9模型,對草莓健康葉片、白粉病早期葉片和白粉病晚期葉片的正確識別率分為99.43%、96.56%和100.00%,總體正確識別率為98.61%。
由于混合池化額外參數的訓練問題,基于混合池化的卷積神經網絡在訓練過程中,網絡收斂速度慢于采用其他采樣層構建方法的卷積神經網絡。在卷積核尺寸相同、網絡深度一致的前提下,基于混合池化的卷積神經網絡模型訓練時間大約是其他3種池化方法的2~3倍。除此之外,網絡深度也是影響卷積神經網絡訓練時間的主要因素。因此在實際應用中,如何適當地選擇采樣層構建方法和網絡深度等是以后我們需要研究的問題之一。
參考文獻:
[1] 國亞文,婁文生,王曉宇. 草莓白粉病發(fā)生特點及防治技術[J]. 農業(yè)與技術,2005(1):127-132.
[2] 趙玉霞,王克如,白中英,等. 貝葉斯方法在玉米葉部病害圖像識別中的應用[J]. 計算機工程與應用,2007(5):193-195.
[3] 王 娜,王克如,謝瑞芝,等. 基于Fisher判別分析的玉米葉部病害圖像識別[J]. 中國農業(yè)科學,2009,42(11):3836-3842.
[4] 張善文,張傳雷. 基于局部判別映射算法的玉米病害識別方法[J]. 農業(yè)工程學報,2014,30(11):167-172.
[5] 朱景福,李 雪. 玉米葉片病害彩色圖像識別的降維和聚類方法[J]. 江蘇農業(yè)科學,2016,44(7):350-354.
[6] 謝澤奇,張會敏,張善文,等. 基于顏色特征和屬性約簡的黃瓜病害識別方法[J]. 江蘇農業(yè)學報,2015,31(3):526-530.
[7] 吳 娜,李 淼,陳 晟,等. 基于融合多特征圖切割的作物病害圖像自動分割[J]. 農業(yè)工程學報,2014,30(17):212-219.
[8] 劉立波,周國民. 基于多層感知神經網絡的水稻葉瘟病識別方法[J]. 農業(yè)工程學報,2009,25(S2):213-217.
[9] 管澤鑫,唐 健,楊保軍,等. 基于圖像的水稻病害識別方法研究[J]. 中國水稻科學,2010,24(5):497-502.
[10] 張飛云. 基于提升小波和學習向量量化神經網絡的小麥病害圖像識別[J]. 江蘇農業(yè)科學,2013,41(5):103-106.
[11] PATIL S P, ZAMBRE M R S. Classification of cotton leaf spot disease using support vector, machine[J]. International Journal of Engineering Research & Applications, 2014, 4(5):92-77.
[12] 牛 沖. 基于圖像處理的草莓病害識別方法研究[D].太原:太原理工大學,2016.
[13] HAMED H A, ELNAZ J H, DOMENEC P. A practical approach for detection and classification of traffic signs using convolutional neural networks[J]. Robotics and Autonomous Systems,2016,84:97-112.
[14] YU S, JIA S, XU C. Convolutional neural networks for hyperspectral image classification[J]. Neurocomputing, 2017, 219: 88-98.
[15] BAI X, SHI B, ZHANG C, et al. Text/non-text image classification in the wild with convolutional neural networks[J]. Pattern Recognition, 2017, 66: 437-446.
[16] SUN J, XIAO Z, XIE Y. Automatic multi-fault recognition in TFDS based on convolutional neural network[J]. Neurocomputing, 2017, 222: 127-136.
[17] 周云成,許童羽,鄭 偉,等.基于深度卷積神經網絡的番茄主要器官分類識別方法[J].農業(yè)工程學報,2017,33(15):219-226.
[18] 王 璨,武新慧,李志偉.基于卷積神經網絡提取多尺度分層特征識別玉米雜草[J].農業(yè)工程學報,2018,34(5):144-151.
[19] 李 艷. 基于改進CNN的馬鈴薯病害識別算法[J]. 信息通信,2017(6):46-48.
[20] 劉闐宇,馮 全. 基于卷積神經網絡的葡萄葉片檢測[J]. 西北大學學報(自然科學版), 2017, 47 (4):505-512.
[21] SRDJAN S, MARKO A, ANDRAS A, et al. Deep neural networks based recognition of plant diseases by leaf image classification[J]. Computational Intelligence and Neuroscience,2016,6:1-11.
[22] MOHANTY S P, HUGHES D P, SALATHé M. Using deep learning for image-based plant disease detection[J]. Frontiers in Plant Science, 2016,7:1-10.
[23] 王 振,高茂庭. 基于卷積神經網絡的圖像識別算法設計與實現[J]. 現代計算機(專業(yè)版), 2015(20):61-66.
[24] 常 祥,楊 明. 基于改進的卷積神經網絡的圖像分類性能[J]. 重慶理工大學學報(自然科學),2017,31(3):110-115.
[25] LEE C Y, GALLAGHER P, TU Z. Generalizing pooling functions in CNNs: mixed, gated, and tree[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 40(4): 863-875.