基于改進(jìn)輕量化YOLO v5n的番茄葉片病害識(shí)別方法

2024-06-03 02:04:03王娜陳勇崔艷榮胡蓉華

江蘇農(nóng)業(yè)科學(xué) 2024年8期

王娜陳勇崔艷榮胡蓉華

摘要：針對(duì)現(xiàn)有番茄葉片病害識(shí)別存在背景復(fù)雜、識(shí)別準(zhǔn)確率低、模型參數(shù)量大、計(jì)算量大以及難以部署至移動(dòng)設(shè)備或嵌入式設(shè)備等問(wèn)題，提出一種改進(jìn)的輕量化YOLO v5n的番茄葉片病害識(shí)別方法。首先收集細(xì)菌性斑疹病、早疫病、晚疫病、葉霉病、斑枯病、褐斑病等6種常見(jiàn)番茄葉片病害圖像以及番茄健康葉片圖像，對(duì)圖像進(jìn)行鏡像翻轉(zhuǎn)、高斯模糊等數(shù)據(jù)增強(qiáng)方式增加樣本多樣性，提升模型識(shí)別和泛化能力。接著在YOLO v5n網(wǎng)絡(luò)基礎(chǔ)上，選擇采用輕量化的C3Ghost模塊替換C3模塊以壓縮卷積過(guò)程中的計(jì)算量、模型權(quán)重和大小，同時(shí)在頸部網(wǎng)絡(luò)中融合輕量級(jí)卷積技術(shù)GSConv和VOV-GSCSP模塊，在增強(qiáng)特征提取能力的同時(shí)降低模型參數(shù)量。最后引入PAGCP算法對(duì)改進(jìn)后的模型進(jìn)行全局通道剪枝壓縮參數(shù)量并減少訓(xùn)練開(kāi)銷(xiāo)。試驗(yàn)結(jié)果表明，改進(jìn)后的YOLO v5n平均精度均值達(dá)到99.0%，參數(shù)量減少66.67%，計(jì)算量降低了2.6 G，模型權(quán)重壓縮了2.23 MB。本研究提出的番茄葉片病害識(shí)別方法在降低了模型大小、參數(shù)量、計(jì)算量的同時(shí)仍保持較高的識(shí)別精度，為移動(dòng)設(shè)備上實(shí)現(xiàn)番茄葉片病害識(shí)別提供技術(shù)參考。

關(guān)鍵詞：YOLO v5n；番茄病害識(shí)別；輕量化；C3Ghost；GSConv；VOV-GSCSP；PAGCP

中圖分類(lèi)號(hào)：S436.412；TP391.41? 文獻(xiàn)標(biāo)志碼：A

文章編號(hào)：1002-1302（2024）08-0192-08

收稿日期：2023-10-24

基金項(xiàng)目：國(guó)家自然科學(xué)基金面上項(xiàng)目（編號(hào)：62077018）。

作者簡(jiǎn)介：王娜（2000—），女，河北張家口人，碩士研究生，從事機(jī)器學(xué)習(xí)與人工智能研究。E-mail：2022710629@yangtzeu.edu.cn。

通信作者：陳勇，碩士生導(dǎo)師，高級(jí)工程師，從事WEB信息處理、人工智能應(yīng)用研究。E-mail：285527563@qq.com。

番茄原產(chǎn)于南美洲的安第斯山地帶，是世界上價(jià)值最高的蔬果兼用作物［1］。目前，番茄的栽培面積不斷擴(kuò)大，已經(jīng)成為全球蔬菜生產(chǎn)中年產(chǎn)量最高的作物，食用量居蔬菜之首［2］。番茄作為我國(guó)非常重要的經(jīng)濟(jì)作物，其生產(chǎn)已成為農(nóng)民增收的主導(dǎo)產(chǎn)業(yè)，對(duì)實(shí)現(xiàn)農(nóng)業(yè)增效作出了突出貢獻(xiàn)［3］。然而，番茄病害現(xiàn)在是影響番茄產(chǎn)量和品質(zhì)的主要因素，在各個(gè)地區(qū)都有不同程度的發(fā)生，其種類(lèi)繁多且復(fù)雜，包括細(xì)菌性斑疹病、早疫病、晚疫病、葉霉病、斑枯病、褐斑病、花葉病、黃化曲葉病、白粉病等。若能快速準(zhǔn)確地識(shí)別番茄病害，及時(shí)防治，便能減少經(jīng)濟(jì)損失保證番茄產(chǎn)業(yè)可持續(xù)健康發(fā)展。因此，對(duì)番茄病害的研究和防治就顯得十分重要。

傳統(tǒng)的番茄葉片病害檢測(cè)和診斷方法主要依賴(lài)于人工觀(guān)測(cè)和經(jīng)驗(yàn)判斷，由于葉片病害數(shù)量多且難以區(qū)分，基于人工的識(shí)別方法存在成本高、主觀(guān)性強(qiáng)、準(zhǔn)確率低等問(wèn)題［4］。隨著機(jī)器學(xué)習(xí)的快速發(fā)展壯大，機(jī)器學(xué)習(xí)不斷應(yīng)用于農(nóng)作物采摘、病害識(shí)別等方面。根據(jù)不同的網(wǎng)絡(luò)結(jié)構(gòu)，孟莉莎等在EfficientNet v2模型上引入CA注意力機(jī)制，在基于Imagenet數(shù)據(jù)集的遷移學(xué)習(xí)中初始化基礎(chǔ)模型并修改全連接層，去除網(wǎng)絡(luò)中重復(fù)的模塊，在蘑菇數(shù)據(jù)集上的分類(lèi)準(zhǔn)確率達(dá)96.8%［5］。嚴(yán)陳慧子等在YOLO v4模型上采用MobileNet v3網(wǎng)絡(luò)替換原始主干網(wǎng)絡(luò)CSPDarknet-53，并在頸部網(wǎng)絡(luò)添加坐標(biāo)注意力模塊（CAM），在水稻葉片病害檢測(cè)上平均精度提升1.32百分點(diǎn)，模型總參數(shù)量為39.35 M［6］。武魁等在EfficientNet v2模型上采用DeepViT算法修改網(wǎng)絡(luò)通道，并引入特征融合網(wǎng)絡(luò)提高模型的分類(lèi)精度，在玉米病蟲(chóng)害數(shù)據(jù)集上平均識(shí)別精度達(dá)到97.72%［7］。針對(duì)番茄葉片病害識(shí)別問(wèn)題，張寧等在Inception v3模型上結(jié)合卷積注意力機(jī)制模塊（CBAM）和多尺度卷積，并引入遷移學(xué)習(xí)，在番茄葉片病害識(shí)別中的準(zhǔn)確率達(dá)到98.4%［8］。方晨晨等通過(guò)使用多尺度卷積來(lái)代替單一尺度的卷積，同時(shí)，他們還采用深度可分離卷積來(lái)替換部分標(biāo)準(zhǔn)卷積，以降低模型的參數(shù)，最終訓(xùn)練后的模型平均測(cè)試識(shí)別準(zhǔn)確率達(dá)到了98.58%，模型大小為19 MB，可以有效識(shí)別出番茄病害圖像［9］。胡玲艷等提出一種輕量級(jí)網(wǎng)絡(luò)自適應(yīng)特征提取方法，基于SqueezeNet模型構(gòu)建輕量級(jí)網(wǎng)絡(luò)模型GKFENet，包含全局特征提取和關(guān)鍵特征提取2個(gè)模塊，對(duì)8種番茄病害的識(shí)別準(zhǔn)確率均超過(guò)96%［10］。王哲豪等提出將輕量化網(wǎng)絡(luò)MobileNet? v2和遷移學(xué)習(xí)方式相結(jié)合，采用凍結(jié)部分卷積層的方式，在模型最后加上2層全連接層，并用Dropout層防止過(guò)擬合，通過(guò)Softmax層輸出實(shí)現(xiàn)對(duì)番茄病害圖像分類(lèi)識(shí)別，準(zhǔn)確率達(dá)93.67%［11］。

上述方法均可較為準(zhǔn)確地識(shí)別研究目標(biāo)，但是很少考慮所提出的方法能否兼顧準(zhǔn)確率、參數(shù)量以及計(jì)算量3個(gè)方面。為解決此類(lèi)問(wèn)題，本研究提出了1種改進(jìn)的輕量化YOLO v5n網(wǎng)絡(luò)，改進(jìn)后的網(wǎng)絡(luò)可以在保證高識(shí)別準(zhǔn)確率的同時(shí)減少存儲(chǔ)空間的占用，使其能部署于移動(dòng)端，從而實(shí)現(xiàn)對(duì)番茄葉片病害的實(shí)時(shí)識(shí)別，便于果農(nóng)及時(shí)采取措施，減少經(jīng)濟(jì)損失。

1 試驗(yàn)材料與方法

1.1 數(shù)據(jù)來(lái)源

本研究的數(shù)據(jù)集選自開(kāi)放式數(shù)據(jù)庫(kù)Plant-Village，該數(shù)據(jù)庫(kù)共收錄了14種植物的健康及病害葉片圖像，并分為38種類(lèi)別標(biāo)簽。本研究從9種番茄葉片病害圖像中隨機(jī)選取6種病害圖像及番茄健康圖像作為試驗(yàn)所需的番茄病害圖像數(shù)據(jù)集，分別是細(xì)菌性斑疹病葉、早疫病葉、晚疫病葉、葉霉病葉、斑枯病葉、褐斑病葉以及番茄健康葉。圖像大小為256像素×256像素，具體見(jiàn)圖1。

1.2 數(shù)據(jù)預(yù)處理

在Plant-Village數(shù)據(jù)集的番茄葉片病害數(shù)據(jù)集中，存在某一類(lèi)別樣本數(shù)量過(guò)多或過(guò)少的情況，導(dǎo)致各類(lèi)樣本的數(shù)量分布不均衡。因此，為平衡各類(lèi)別樣本間的分布，提高模型的泛化能力，減少過(guò)擬合，對(duì)圖像樣本數(shù)量較少的類(lèi)別采用數(shù)據(jù)擴(kuò)充策略，本研究主要通過(guò)水平鏡像、提高亮度、增加高斯噪聲以及旋轉(zhuǎn)等數(shù)據(jù)增強(qiáng)方式進(jìn)行樣本擴(kuò)充，具體見(jiàn)圖2；而對(duì)于樣本數(shù)量明顯過(guò)多的類(lèi)別，隨機(jī)剔除一部分樣本，保證數(shù)據(jù)的平衡性，最終共獲取10 500幅番茄葉片病害圖像，通過(guò)編寫(xiě)程序?qū)?shù)據(jù)集進(jìn)行隨機(jī)抽樣，按照8 ∶2的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集（具體見(jiàn)表1）。

本研究訓(xùn)練的模型為YOLO系列格式的數(shù)據(jù)集，因此，采用LabelImg圖像工具標(biāo)記出葉片位置和類(lèi)別，生成xml類(lèi)型的標(biāo)注文件，標(biāo)注示例見(jiàn)圖3。

1.3 試驗(yàn)方法

1.3.1 YOLO v5n網(wǎng)絡(luò)模型

YOLO v5網(wǎng)絡(luò)模型是在YOLO v4［12］的基礎(chǔ)上改進(jìn)的單階段目標(biāo)檢測(cè)算法，其檢測(cè)速度和精度都得到了極大的提升。YOLO v5網(wǎng)絡(luò)由輸入端、主干網(wǎng)絡(luò)、頸部以及頭部4個(gè)部分組成，其中輸入端包含Mosaic數(shù)據(jù)增強(qiáng)、自適應(yīng)錨框計(jì)算和自適應(yīng)圖片縮放，主干網(wǎng)絡(luò)包含CBS、CSP1_X和SPPF，頸部包含CSP2_X、Upsampling和Concat，最后在頭部進(jìn)行預(yù)測(cè)并輸出結(jié)果，結(jié)構(gòu)見(jiàn)圖4。

YOLO v5相對(duì)于YOLO v4主要有以下改進(jìn)：第一是提出1種自適應(yīng)錨框算法，將YOLO v4中用于獲得初始錨點(diǎn)框的外部程序嵌入到代碼中，每次訓(xùn)練時(shí)，根據(jù)數(shù)據(jù)集的名稱(chēng)能夠自適應(yīng)地計(jì)算出最合適的錨點(diǎn)框；第二是提出自適應(yīng)圖片縮放方法；第三是在YOLO v4的CSP結(jié)構(gòu)基礎(chǔ)上設(shè)計(jì)2種CSP結(jié)構(gòu)，CSP1_X結(jié)構(gòu)應(yīng)用于主干網(wǎng)絡(luò)，CSP2_X應(yīng)用于頸部替代部分普通卷積；第四是提出SPPF替代SPP，將輸入串行通過(guò)多個(gè)大小相同的MaxPool層，減少模型計(jì)算量的同時(shí)提升模型檢測(cè)速度。

YOLO v5主要包含多個(gè)版本，其中YOLO v5n是最小的版本，其模型具有網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單、計(jì)算量少以及檢測(cè)速度快的優(yōu)勢(shì)，符合本研究的實(shí)際需求，因此選用YOLO v5n版本作為基礎(chǔ)模型，改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)見(jiàn)圖5。

1.3.2 C3Ghost模塊

GhostNet［13］是華為諾亞方舟實(shí)驗(yàn)室提出的、新型輕量級(jí)深度神經(jīng)網(wǎng)絡(luò)架構(gòu)，其構(gòu)建方式不同于ShuffleNet［14］、MobileNet［15］等輕量化卷積網(wǎng)絡(luò)。通常情況下，卷積生成的大量冗余特征圖在實(shí)際檢測(cè)任務(wù)中對(duì)主要特征圖的補(bǔ)充作用很小，對(duì)網(wǎng)絡(luò)提升檢測(cè)精度沒(méi)有太大幫助，但是生成這些冗余特征圖卻要消耗大量算力。因此，GhostNet構(gòu)建了Ghost模塊，利用Ghost模塊更快、更節(jié)省算力地生成冗余特征圖。傳統(tǒng)卷積與GhostNet卷積過(guò)程見(jiàn)圖6。

假設(shè)輸入特征圖的尺寸大小為h×w×c，輸出特征圖尺寸大小為h′×w′×n，采用的卷積核尺寸大小為k×k，線(xiàn)性操作核為d×d，經(jīng)過(guò)φk操作得到的特征圖為s個(gè)，則傳統(tǒng)卷積與GhostNet卷積所需參數(shù)量分別為

Pconv=n×h′×w′×c×k×k；（1）

PGhost=ns×h′×w′×c×k×k+（s-1）×ns×h′×w′×d×d。（2）

因此，GhostNet卷積與傳統(tǒng)卷積的理論加速比（Rp）和參數(shù)壓縮比（Rc）分別為

Rp=PconvPGhost=c×k×k1s×c×k×k+s-1s×d×d≈s×cs+c-1≈s；（3）

Rc=n×c×k×kns×c×k×k+（s-1）×ns×d×d≈s×cs+c-1≈scc=s。（4）

從上述公式可知，GhostNet卷積的計(jì)算量和參數(shù)量可近似等于傳統(tǒng)卷積的1s，大幅降低了模型的計(jì)算和存儲(chǔ)開(kāi)銷(xiāo)。而YOLO v5n主干網(wǎng)絡(luò)采用C3結(jié)構(gòu)，參數(shù)量較大，檢測(cè)速度較慢。因此，本研究將新的C3Ghost模塊替換C3模塊，以達(dá)到輕量化的效果，具體結(jié)構(gòu)見(jiàn)圖7。GhostBottleneck模塊以Ghost模塊為構(gòu)建基礎(chǔ)，主要由2個(gè)GhostConv模塊和1個(gè)殘差塊組成，第1個(gè)GhostConv模塊被用作擴(kuò)展層，其目的是增加輸入特征圖的通道數(shù)，以便進(jìn)行更多的特征提取和信息融合。第2個(gè)GhostConv模塊的作用是降維，減少輸出特征圖的通道數(shù)，使其與網(wǎng)絡(luò)中的直徑結(jié)構(gòu)相匹配。最后與經(jīng)過(guò)深度卷積的殘差邊相加融合特征，引入DWConv的作用主要是為了減少參數(shù)量。C3Ghost模塊是在C3模塊的基礎(chǔ)上將殘差組件Resunit替換成可復(fù)用的GhostBottleneck模塊，減少了原結(jié)構(gòu)中大多數(shù)的傳統(tǒng)卷積，壓縮了模型并減少了計(jì)算量。

1.3.3 GSConv和VOV-GSCSP

在目標(biāo)檢測(cè)過(guò)程中，一些優(yōu)秀的輕量級(jí)網(wǎng)絡(luò)主要由大量深度可分離卷積（DSC）［16］構(gòu)建，以此來(lái)減少參數(shù)和計(jì)算量。但是DSC在計(jì)算的過(guò)程中會(huì)拆分處理每個(gè)通道的信息，丟失了大量的隱藏連接，因此其特征提取和融合能力遠(yuǎn)低于標(biāo)準(zhǔn)卷積，為了使DSC的輸出盡可能接近標(biāo)準(zhǔn)卷積，Li等提出了GSConv模塊［17］，具體結(jié)構(gòu)見(jiàn)圖8。GSConv模塊由標(biāo)準(zhǔn)卷積、深度可分離卷積和Shuffle等3個(gè)部分卷積組成，通過(guò)Shuffle操作將標(biāo)準(zhǔn)卷積生成的信息滲透到深度可分離卷積內(nèi)部，保持通道間的隱藏連接，提高特征的豐富度。在網(wǎng)絡(luò)的頸部，特征圖的空間維度已經(jīng)達(dá)到了最小，而通道維度達(dá)到了最大，不再需要進(jìn)行通道轉(zhuǎn)換，此時(shí)使用GSConv卷積方式不僅冗余信息少，還降低了模型的參數(shù)量，達(dá)到了輕量化網(wǎng)絡(luò)的效果。故本研究將GSConv模塊部署到網(wǎng)絡(luò)中用于特征提取的頸部，代替標(biāo)準(zhǔn)卷積來(lái)進(jìn)行上采樣和下采樣，最大程度地保證采樣效果。

由于YOLO v5n在頸部采用的CSP模塊在空間特征融合方面具有一定的局限性，同時(shí)為了加快模型推理時(shí)間并保持精度，本研究添加VOV-GSCSP模塊代替頸部的CSP模塊，將不同尺度的特征圖按照順序連接起來(lái)形成一個(gè)更長(zhǎng)的特征向量，以增加模型的多樣性，提取更豐富的語(yǔ)義信息。圖9-a為VOV-GSCSP的瓶頸單元結(jié)構(gòu)GSBottleneck，圖9-b為采用單次聚合方法設(shè)計(jì)的跨階段的VOV-GSCSP模塊。該模塊降低了網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性和計(jì)算量，推理速度快，適合部署到計(jì)算量有限的移動(dòng)目標(biāo)平臺(tái)。

1.3.4 PAGCP全局通道剪枝

目前，基于卷積神經(jīng)網(wǎng)絡(luò)的模型在大規(guī)模多任務(wù)預(yù)測(cè)領(lǐng)域快速發(fā)展，但大多數(shù)模型仍面臨著巨大的計(jì)算和存儲(chǔ)開(kāi)銷(xiāo)問(wèn)題，使得它們?cè)谧詣?dòng)駕駛系統(tǒng)和邊緣計(jì)算設(shè)備等實(shí)際應(yīng)用中難以部署。而模型壓縮作為緩解這一問(wèn)題的有效技術(shù)，可以將一個(gè)復(fù)雜的預(yù)訓(xùn)練模型簡(jiǎn)化為1個(gè)輕量級(jí)模型，從而減少對(duì)硬件的存儲(chǔ)、帶寬和計(jì)算需求。在近年的模型壓縮方法中，模型剪枝已經(jīng)成為主流的壓縮技術(shù)，過(guò)去的多任務(wù)模型剪枝算

法主要集中在模型遷移或算法遷移上，這2種方式忽略了模型不同層中的卷積核的聯(lián)合影響以及任務(wù)之間的特征不匹配問(wèn)題。為此，Ye等提出了一個(gè)性能感知的全局通道剪枝PAGCP框架［18］，從基于顯著性指標(biāo)的剪枝優(yōu)化問(wèn)題切入，分析得出傳統(tǒng)引入正則懲罰項(xiàng)的方式中存在梯度競(jìng)爭(zhēng)的問(wèn)題，從而在優(yōu)化中使得模型參數(shù)偏離了原本的最優(yōu)點(diǎn)，改變了原始最優(yōu)點(diǎn)上每個(gè)通道的重要程度?；诖?，將優(yōu)化目標(biāo)調(diào)整為僅對(duì)顯著性指標(biāo)進(jìn)行帶約束最小化搜索，保證模型參數(shù)權(quán)重不變，其中約束項(xiàng)調(diào)整為對(duì)模型剪枝后的性能損失約束以及計(jì)算量約束，這保證了模型參數(shù)處于最優(yōu)點(diǎn)并有更準(zhǔn)確的重要度評(píng)估。

單次剪枝迭代中不同剪枝策略之間的區(qū)別見(jiàn)圖10，紅色虛線(xiàn)圓圈表示在每次迭代中要修剪的過(guò)濾器集合。圖10-a是通用的多任務(wù)模型，其中每個(gè)過(guò)濾器對(duì)不同的任務(wù)具有不同的敏感度。圖10-b 是分層通道剪枝，其在單層中評(píng)估和修剪過(guò)濾器，并在每次迭代中微調(diào)模型，在當(dāng)前剪枝迭代中不考慮灰色區(qū)域的過(guò)濾器。圖10-c是先前的全局通道剪枝，其在每次剪枝迭代中基于靜態(tài)過(guò)濾器的關(guān)系評(píng)估和修剪所有層上的過(guò)濾器（用過(guò)濾器顏色不變來(lái)表示）。圖10-d是PAGCP剪枝，其基于先前修剪的結(jié)構(gòu)動(dòng)態(tài)地評(píng)估和修剪單層中的過(guò)濾器，并且針對(duì)多任務(wù)模型的壓縮性能全局考慮層內(nèi)和層間過(guò)濾器的關(guān)系（用過(guò)濾器顏色變化來(lái)表示）。層修剪順序由每層對(duì)總FLOPs減少量的貢獻(xiàn)決定。與以前將分類(lèi)模型的過(guò)濾器顯著性準(zhǔn)則適應(yīng)多任務(wù)分類(lèi)模型的方法相比，PAGCP剪枝的方法以貪婪的方式動(dòng)態(tài)地計(jì)算每個(gè)過(guò)濾器的顯著性，以近似最優(yōu)全局通道剪枝（GCP），并通過(guò)性能感知的預(yù)言準(zhǔn)則自動(dòng)控制剪枝的性能下降。

Ye等通過(guò)大量試驗(yàn)證明PAGCP算法框架在將多個(gè)模型計(jì)算量或參數(shù)量壓縮比例超過(guò)60%的情況下，僅有略微的性能損失，超越了同等計(jì)算規(guī)模和模型結(jié)構(gòu)下的現(xiàn)有高性能模型，同時(shí)大幅提升原模型的推理速度［18］。本研究引入PAGCP算法對(duì)模型進(jìn)行全局通道剪枝，在保持精度的同時(shí)有效減少了模型參數(shù)量和計(jì)算量。

2 試驗(yàn)結(jié)果與分析

2.1 試驗(yàn)環(huán)境

本研究使用環(huán)境為Python 3.9、Pytorch 2.0.1、Cuda 12.2、cuDNN 8.7.0，試驗(yàn)計(jì)算機(jī)CPU為Intel Core i5-12600KF，GPU為NVIDIA RTX3080Ti，顯存32 GB，設(shè)置迭代次數(shù)為300次。試驗(yàn)時(shí)間為2023年6—10月，試驗(yàn)地點(diǎn)為長(zhǎng)江大學(xué)東校區(qū)。

2.2 評(píng)估指標(biāo)

本研究采用IoU閾值設(shè)置為0.5的平均精度均值、參數(shù)量、浮點(diǎn)運(yùn)算數(shù)以及模型大小作為評(píng)價(jià)指標(biāo)。

精確率、召回率計(jì)算公式如下：

P=TPTP+FP；（5）

R=TPTP+FN。（6）

平均精度、平均精度均值計(jì)算公式如下：

AP=∫10P（R）dR；（7）

mAP=∑Ki=1APiK。（8）

其中：TP表示預(yù)測(cè)正確的正類(lèi)樣本數(shù)量；FP表示預(yù)測(cè)錯(cuò)誤的正類(lèi)樣本數(shù)量；FN表示預(yù)測(cè)錯(cuò)誤的負(fù)類(lèi)樣本數(shù)量；P和R所圍成的面積定義為AP；取所有的檢測(cè)類(lèi)別AP的均值為mAP。

參數(shù)量和浮點(diǎn)計(jì)算量作為網(wǎng)絡(luò)模型復(fù)雜度的評(píng)價(jià)指標(biāo)，其計(jì)算公式如下：

Params=Cin×Cout×K×K；（9）

FLOPs=W×H×K×K×Cin×Cout。（10）

其中：Cin、Cout分別為輸入和輸出特征通道數(shù)；K為卷積核大小；W、H分別是輸入特征圖的寬度和高度。

2.3 試驗(yàn)結(jié)果與分析

2.3.1 輕量化主干網(wǎng)絡(luò)對(duì)比試驗(yàn)

為了進(jìn)一步驗(yàn)證改進(jìn)后的YOLO v5n的輕量化效果，本研究選取常見(jiàn)的輕量化網(wǎng)絡(luò)GhostNet、MobileNet v3-s［19］以及EfficientNet［20］來(lái)優(yōu)化YOLO v5n的主干網(wǎng)絡(luò)與改進(jìn)的YOLO v5n網(wǎng)絡(luò)進(jìn)行對(duì)比試驗(yàn)，結(jié)果見(jiàn)表2。

由表2可以看出，改進(jìn)的YOLO v5n網(wǎng)絡(luò)平均精度均值達(dá)到99%，參數(shù)量為0.59 M，計(jì)算量為 1.6 G，模型權(quán)重大小為1.51 MB。與原模型相比，在平均精度均值僅下降0.5百分點(diǎn)的同時(shí)，參數(shù)量減少了66.67%，計(jì)算量減少了2.6 G，模型權(quán)重大小壓縮了2.23 MB。與其他3種輕量化網(wǎng)絡(luò)相比綜合性能最優(yōu)，所以改進(jìn)后的YOLO v5n在保持識(shí)別精度的同時(shí)大大減少了參數(shù)量，證明了本研究輕量化改進(jìn)的有效性，能夠滿(mǎn)足番茄葉片病害識(shí)別的實(shí)際需求。

3.3.2 消融試驗(yàn)

為了評(píng)估PAGCP剪枝算法、C3Ghost模塊、GSConv模塊以及VOV-GSCSP模塊對(duì)YOLO v5n網(wǎng)絡(luò)模型性能所帶來(lái)的影響，進(jìn)行消融試驗(yàn)，并與原始YOLO v5n網(wǎng)絡(luò)模型進(jìn)行對(duì)比，結(jié)果見(jiàn)表3。

從表3可知，與原始算法相比，試驗(yàn)2引入PAGCP對(duì)模型進(jìn)行剪枝改進(jìn)后模型平均精度均值幾乎不變，同時(shí)計(jì)算量減少了50%，參數(shù)量減少了48.59%，模型權(quán)重大小壓縮了1.64 MB，滿(mǎn)足本研究輕量化的要求。然后在此基礎(chǔ)上試驗(yàn)3采用GSConv替代標(biāo)準(zhǔn)卷積，減少冗余信息，并且參數(shù)量、計(jì)算量及模型權(quán)重大小都有小幅降低，但是模型的平均精度均值下降嚴(yán)重。所以，試驗(yàn)4引入C3Ghost取代C3模塊，實(shí)現(xiàn)了用更少的參數(shù)生成更多的特征圖，提高了模型的特征表達(dá)能力，平均精度均值提高了28.5百分點(diǎn)，同時(shí)證明在主干網(wǎng)絡(luò)中引入C3Ghost模塊的有效性。雖然試驗(yàn)4的平均精度均值已經(jīng)達(dá)到98.9%，但是與原模型相比仍然有所下降，并且模型權(quán)重大小相對(duì)于移動(dòng)設(shè)備的存儲(chǔ)空間還不理想，為了減少模型對(duì)硬件條件的依賴(lài)，試驗(yàn)5引入VOV-GSCSP模塊替代頸部的CSP結(jié)構(gòu)，可以提取更豐富的語(yǔ)義信息，使平均精度均值達(dá)到99.0%，計(jì)算量達(dá)到1.6 G，參數(shù)量達(dá)到0.59 M，模型權(quán)重大小達(dá)到1.51 MB。通過(guò)上述消融試驗(yàn)的全面評(píng)估，驗(yàn)證了在原模型中改進(jìn)的不同網(wǎng)絡(luò)模塊都表現(xiàn)出優(yōu)異的性能。

3 結(jié)論

本研究聚焦于番茄葉片病害識(shí)別問(wèn)題，通過(guò)融合輕量級(jí)GhostNet網(wǎng)絡(luò)改進(jìn)C3模塊，引入GSConv和VOV-GSCSP模塊，采用全局通道剪枝PAGCP算法，提出一種改進(jìn)的輕量化YOLO v5n的番茄葉片病害識(shí)別方法，試驗(yàn)結(jié)果表明，改進(jìn)的YOLO v5n模型在識(shí)別番茄葉片病害方面有更好的效果，完成了對(duì)6類(lèi)常見(jiàn)番茄葉片病害及番茄健康葉片的識(shí)別研究。改進(jìn)后的模型更加適應(yīng)真實(shí)環(huán)境，特征學(xué)習(xí)能力有所增強(qiáng)，與YOLO v5n相比，平均精度均值只降低了0.5百分點(diǎn)，但參數(shù)量減少了66.67%，計(jì)算量減少了2.6 G，模型權(quán)重大小壓縮了2.23 MB，驗(yàn)證了改進(jìn)的有效性，并且該方法可以推廣到其他植物葉片病害的識(shí)別問(wèn)題上。

后續(xù)會(huì)收集更多復(fù)雜環(huán)境下的番茄葉片病害圖像以及更多種類(lèi)的病害圖像豐富數(shù)據(jù)集，并采用不同數(shù)據(jù)預(yù)處理方法來(lái)提取不同環(huán)境下的圖片特征，達(dá)到更好的模型泛化性能與精確度。

參考文獻(xiàn)：

［1］李洪磊，王曉敏，鄭福順，等. 基于主成分和隸屬函數(shù)分析的不同果色番茄品種引種初步評(píng)價(jià)［J］. 云南大學(xué)學(xué)報(bào)（自然科學(xué)版），2021，43（2）：402-411.

［2］李君明，項(xiàng)朝陽(yáng)，王孝宣，等. “十三五” 我國(guó)番茄產(chǎn)業(yè)現(xiàn)狀及展望［J］. 中國(guó)蔬菜，2021（2）：13-20.

［3］霍建勇. 中國(guó)番茄產(chǎn)業(yè)現(xiàn)狀及安全防范［J］. 蔬菜，2016（6）：1-4.

［4］馬宇，單玉剛，袁杰. 基于三通道注意力網(wǎng)絡(luò)的番茄葉部病害識(shí)別［J］. 科學(xué)技術(shù)與工程，2021，21（25）：10789-10795.

［5］孟莉莎，楊賢昭，劉惠康. 基于CA-EfficientNet v2的蘑菇圖像分類(lèi)算法研究［J］. 激光與光電子學(xué)進(jìn)展，2022，59（24）：2410005.

［6］嚴(yán)陳慧子，田芳明，譚峰，等. 基于改進(jìn)YOLO v4的水稻病害快速檢測(cè)方法［J］. 江蘇農(nóng)業(yè)科學(xué)，2023，51（6）：187-194.

［7］武魁，高丙朋. 改進(jìn)EfficientNet v2的玉米病蟲(chóng)害識(shí)別與分級(jí)研究［J］. 現(xiàn)代電子技術(shù)，2023，46（14）：68-74.

［8］張寧，吳華瑞，韓笑，等. 基于多尺度和注意力機(jī)制的番茄病害識(shí)別方法［J］. 浙江農(nóng)業(yè)學(xué)報(bào)，2021，33（7）：1329-1338.

［9］方晨晨，石繁槐. 基于改進(jìn)深度殘差網(wǎng)絡(luò)的番茄病害圖像識(shí)別［J］. 計(jì)算機(jī)應(yīng)用，2020，40（增刊1）：203-208.

［10］胡玲艷，周婷，劉艷，等. 基于輕量級(jí)網(wǎng)絡(luò)自適應(yīng)特征提取的番茄病害識(shí)別［J］. 江蘇農(nóng)業(yè)學(xué)報(bào)，2022，38（3）：696-705.

［11］王哲豪，范麗麗，何前. 基于MobileNet v2和遷移學(xué)習(xí)的番茄病害識(shí)別［J］. 江蘇農(nóng)業(yè)科學(xué)，2023，51（9）：215-221.

［12］Bochkovskiy A，Wang C Y，Liao H Y M. YOLO v4：optimal speed and accuracy of object detection［EB/OL］. （2020-04-23）［2023-08-20］. https：//arxiv.org/abs/2004.10934.

［13］Han K，Wang Y H，Tian Q，et al. GhostNet：more features from cheap operations［C］//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattl：IEEE，2020：1577-1586.

［14］Zhang X Y，Zhou X Y，Lin M X，et al. ShuffleNet：an extremely efficient convolutional neural network for mobile devices［C］//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City：IEEE，2018：6848-6856.

［15］Howard A G，Zhu M L，Chen B，et al. MobileNets：efficient convolutional neural networks for mobile vision applications［EB/OL］. （2017-04-17）［2023-08-20］. https：//arxiv.org/pdf/1704.04861.pdf.

［16］SIfre L，Mallat S. Rigid-motion scattering for texture classification［EB/OL］. （2014-03-07）［2023-08-20］. https：//arxiv.org/pdf/1403.1687.pdf.

［17］Li H L，Li J，Wei H B，et al. Slim-neck by GSConv：a better design paradigm of detector architectures for autonomous vehicles［EB/OL］. （2022-08-17）［2023-08-24］. https：//arxiv.org/abs/2206.02424.

［18］Ye H C，Zhang B，Chen T，et al. Performance-aware approximation of global channel pruning for multitask CNNs［J］. IEEE Transactions on Pattern Analysis and Machine Intelligence，2023，45（8）：10267-10284.

［19］Howard A，Sandler M，Chen B，et al. Searching for MobileNet v3［C］//2019 IEEE/CVF International Conference on Computer Vision. Seoul：IEEE，2019：1314-1324.

［20］Tan M X，Le Q V. Efficientnet：rethinking model scaling for convolutional neural networks［EB/OL］. （2020-09-11）［2023-08-20］. https：//www.researchgate.net/publication/333444574_EfficientNet_Rethinking_Model_Scaling_for_Convolutional_Neural_Networks.

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

基于改進(jìn)輕量化YOLO v5n的番茄葉片病害識(shí)別方法