基于YOLO v5模型的缺鈣草莓葉片識(shí)別方法

2024-12-31 00:00:00李炳鑫宋濤高婕李冬高鵬李仁杰趙德傲

江蘇農(nóng)業(yè)科學(xué) 2024年20期

doi：10.15889/j.issn.1002-1302.2024.20.010

摘要：針對(duì)缺鈣草莓葉片病害特征較小、病害尺度特征變換較大、傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)小目標(biāo)的檢測(cè)效果不佳等問(wèn)題，提出一種基于YOLO v5模型的缺鈣草莓葉片識(shí)別方法。該方法首先以YOLO v5模型為基礎(chǔ)從其Backbone、Neck、損失函數(shù)等方面進(jìn)行優(yōu)化，提高其對(duì)缺鈣草莓葉片病害特征的檢測(cè)能力，并將優(yōu)化后的網(wǎng)絡(luò)模型命名為YOLO v5-Smix，再采用多種數(shù)據(jù)增強(qiáng)手段對(duì)已有數(shù)據(jù)集進(jìn)行擴(kuò)充，以保障后續(xù)卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練。該方法將原有Backbone骨骼中的CSPDarknet53主干網(wǎng)絡(luò)替換為以C2F模塊為核心的Darknet-53網(wǎng)絡(luò)，保留缺鈣草莓葉片的小目標(biāo)特征；在Neck特征融合層添加BiFPN結(jié)構(gòu)，有效解決缺鈣草莓葉片圖像尺度特征變換較大的問(wèn)題，同時(shí)增強(qiáng)網(wǎng)絡(luò)多尺度特征融合能力；更換原本的損失函數(shù)CIoU為WIoU，進(jìn)一步提高模型的檢測(cè)效率及檢測(cè)能力。依據(jù)模型評(píng)價(jià)指標(biāo)，通過(guò)試驗(yàn)將YOLO v5-Smix網(wǎng)絡(luò)與經(jīng)典的Faster-RCNN、YOLO v3、YOLO v4、YOLO v5等4種卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比。結(jié)果表明，YOLO v5-Smix的識(shí)別精確度達(dá)89.1%，召回率達(dá)81.0%，平均精確度達(dá)78.8%，與Faster RCNN、YOLO v3、YOLO v4、YOLO v5相比，識(shí)別精確度均有提高，能夠較精確地識(shí)別缺鈣草莓葉片病害特征，完成小目標(biāo)病害特征的檢測(cè)任務(wù)。

關(guān)鍵詞：YOLO v5；小目標(biāo)；目標(biāo)檢測(cè)；輕量化模型；缺鈣；草莓

中圖分類(lèi)號(hào)：TP391.41" 文獻(xiàn)標(biāo)志碼：A

文章編號(hào)：1002-1302（2024）20-0074-09

收稿日期：2023-10-10

基金項(xiàng)目：河北省科技計(jì)劃（編號(hào)：22370701D）。

作者簡(jiǎn)介：李炳鑫（1999—），男，河北唐山人，碩士研究生，主要從事人工智能與機(jī)器學(xué)習(xí)研究。E-mail：291750154@qq.com。

通信作者：宋" 濤，博士，高級(jí)實(shí)驗(yàn)師，碩士生導(dǎo)師，主要從事智能傳感器與物聯(lián)網(wǎng)技術(shù)研究。E-mail：songtao@hebut.edu.cn。

作為我國(guó)農(nóng)業(yè)溫室培育水果中的典型代表，能否受到良好培育的前提在于草莓的生長(zhǎng)狀態(tài)是否正常。草莓在生長(zhǎng)的過(guò)程中生長(zhǎng)狀態(tài)大多表現(xiàn)在葉片上，且極易受到鈣元素的影響，所以如何根據(jù)草莓葉片特征對(duì)生長(zhǎng)狀態(tài)進(jìn)行判斷具有著十分重要的研究?jī)r(jià)值。對(duì)草莓葉片狀態(tài)的監(jiān)測(cè)和判別，目前農(nóng)業(yè)上采用依靠機(jī)電化設(shè)備檢測(cè)環(huán)境參數(shù)與人工檢測(cè)草莓葉片相互配合的方法來(lái)實(shí)現(xiàn)，這種方法雖然能從宏觀上對(duì)草莓的狀態(tài)進(jìn)行判別，但效率極低且花費(fèi)大量人力物力，只適合小面積的溫室培育，無(wú)法滿足大面積的農(nóng)作物種植需求［1］。

近年來(lái)，隨著機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展，部分學(xué)者已經(jīng)開(kāi)始將計(jì)算機(jī)視覺(jué)技術(shù)運(yùn)用到農(nóng)作物生長(zhǎng)狀態(tài)上。例如，孫圓龍等通過(guò)設(shè)計(jì)高效運(yùn)算網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)黃瓜葉部病害的判別［2］，劉慶飛等通過(guò)設(shè)計(jì)基于深度可分離卷積的網(wǎng)絡(luò)實(shí)現(xiàn)了田間自然環(huán)境下雜草和甜菜的識(shí)別［3］，丁常宏等通過(guò)基于SSD-MobileNet v1的網(wǎng)絡(luò)實(shí)現(xiàn)了藥用植物的識(shí)別［4］。這些方法雖然可在一定程度上促進(jìn)機(jī)器學(xué)習(xí)在農(nóng)業(yè)智能化領(lǐng)域的研究發(fā)展，擺脫機(jī)電化設(shè)備限制，并通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)農(nóng)作物生長(zhǎng)狀態(tài)的監(jiān)測(cè)，但它們目前都還聚焦于整體目標(biāo)或者大目標(biāo)的監(jiān)測(cè)上，對(duì)小目標(biāo)物體的監(jiān)測(cè)效果還無(wú)法達(dá)到非常好的水準(zhǔn)。對(duì)于小目標(biāo)物體的界定，Hariri等通過(guò)提出一個(gè)針對(duì)小目標(biāo)的數(shù)據(jù)集，對(duì)小目標(biāo)進(jìn)行界定，在同一類(lèi)別中，所有目標(biāo)實(shí)例的相對(duì)面積，即邊界框面積與圖像面積之比的中位數(shù)在0.08%～0.58%之間則視為小目標(biāo)，如在640像素×480像素的圖像中，16像素×16像素到42像素×42像素的目標(biāo)應(yīng)考慮為小目標(biāo)［5-6］。草莓缺鈣時(shí)，葉片會(huì)產(chǎn)生邊緣焦枯現(xiàn)象，該特征在整幅圖片中非常微小且尺度不固定，在檢測(cè)過(guò)程中很難達(dá)到非常好的識(shí)別效果。在缺鈣草莓葉片檢測(cè)研究中，多數(shù)學(xué)者采用單階段目標(biāo)檢測(cè)算法YOLO來(lái)實(shí)現(xiàn)，YOLO算法具有檢測(cè)速度快、效果好等特點(diǎn)，可以完成多種復(fù)雜背景下的檢測(cè)任務(wù)。YOLO算法因具有獨(dú)特的算法模塊化結(jié)構(gòu)，便于研究人員進(jìn)行優(yōu)化發(fā)展，在YOLO系列中，YOLO v5因算法的穩(wěn)定性和兼容性好而受到研究人員的青睞，與YOLO v8等高版本相比，YOLO v5更加適合作為改進(jìn)的基礎(chǔ)算法。

為解決在實(shí)際農(nóng)作物培育中的小目標(biāo)物體識(shí)別難點(diǎn)，以YOLO v5網(wǎng)絡(luò)為基礎(chǔ)研究一種更加適合小目標(biāo)物體的卷積神經(jīng)網(wǎng)絡(luò)模型YOLO v5-Smix，該模型使用以C2F模塊為核心的Darknet-53網(wǎng)絡(luò)進(jìn)行小目標(biāo)物體識(shí)別，并使用BiFPN特征融合網(wǎng)絡(luò)來(lái)增強(qiáng)模型對(duì)小目標(biāo)物體的泛化能力，同時(shí)通過(guò)更換上采樣方式、損失函數(shù)來(lái)增強(qiáng)模型的檢測(cè)能力與檢測(cè)速度。

1" 研究方法

1.1" 基本的YOLO v5算法

在目標(biāo)檢測(cè)算法中，YOLO v5網(wǎng)絡(luò)因具有檢測(cè)速度快、檢測(cè)效果好等優(yōu)點(diǎn)，應(yīng)用范圍十分廣泛。YOLO v5的網(wǎng)絡(luò)組成包括特征提取網(wǎng)絡(luò)、特征融合和檢測(cè)頭等3個(gè)部分，具體結(jié)構(gòu)如圖1所示。

首先，將輸入進(jìn)網(wǎng)絡(luò)的圖像數(shù)據(jù)調(diào)整為網(wǎng)絡(luò)適應(yīng)的分辨率，本研究采用640像素×640像素，然后通過(guò)多層卷積和跨階段局部（CSP）殘差模塊進(jìn)入到特征金字塔（SPPF）模塊，將底層信息輸入至neck層進(jìn)行融合，Backbone部分主要包含完全邊界分離（CBS）卷積結(jié)構(gòu)和CSP殘差結(jié)構(gòu)，其中CBS結(jié)構(gòu)主要由卷積層、批量歸一化（BN）層、激活函數(shù)組成，在卷起層中主要使用1×1卷積和3×3卷積完成圖像特征的提取；再由殘差模塊得到2個(gè)分支，即通過(guò)對(duì)子特征圖進(jìn)行加和得到新的特征輸出，隨著網(wǎng)絡(luò)深度的加深，模型的優(yōu)化難度增大，而殘差模塊的引入能讓深層次的網(wǎng)絡(luò)模型達(dá)到更好的訓(xùn)練效果，本研究在殘差網(wǎng)絡(luò)中提出殘差映射，替換以往的基礎(chǔ)映射殘差模塊結(jié)構(gòu)，如圖2所示［7-8］。

最后，在SPPF模塊中將經(jīng)過(guò)CBS的輸入、1次池化后的結(jié)果、2次池化后的結(jié)果和3次池化后的結(jié)果進(jìn)行拼接，然后再通過(guò)CBS進(jìn)行特征提取。仔細(xì)觀察不難發(fā)現(xiàn)，雖然SPPF對(duì)特征圖進(jìn)行了多次池化，但特征圖尺寸并未發(fā)生變化，通道數(shù)更不會(huì)變化，所以后續(xù)的4個(gè)輸出能夠在channel維度進(jìn)行融合。這一模塊的主要作用是對(duì)高層特征進(jìn)行提取并融合，在融合過(guò)程中筆者多次運(yùn)用最大池化盡可能多地提取高層次的語(yǔ)義特征［9］。SPPF模塊結(jié)構(gòu)如圖3所示。

在Neck層中，YOLO v5使用不同尺度來(lái)預(yù)測(cè)并用特征金字塔結(jié)合像素聚合網(wǎng)絡(luò)結(jié)構(gòu)對(duì)特征進(jìn)行多尺度融合。YOLO v5 Neck層原本使用的是PANet網(wǎng)絡(luò)，是一種包含了自頂向下傳遞特征信息和自底向上傳遞位置信息的特征融合網(wǎng)絡(luò)，該網(wǎng)絡(luò)雖然可以減輕網(wǎng)絡(luò)層次加深帶來(lái)的位置信息不明確問(wèn)題，但得到的模型過(guò)于復(fù)雜且檢測(cè)效果依然不佳［10］。PANet網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。

Head層中Bounding box的損失函數(shù)為CIoU，它在以往損失函數(shù)的基礎(chǔ)上將長(zhǎng)寬比考慮進(jìn)去，使得模型的檢測(cè)更加穩(wěn)定，不容易發(fā)散。

YOLO v5原本的損失函數(shù)為完全交并比（CIoU），其公式如下：

CIoU=IoU-ρ2（b，bgt）c2-αv。

式中：ρ2（b，bgt）代表預(yù)測(cè)框和真實(shí)框的中心點(diǎn)歐氏距離；c代表能夠同時(shí)包含預(yù)測(cè)框和真實(shí)框的最小閉包區(qū)域的對(duì)角線距離。邊界框的準(zhǔn)確度一般用IoU表示，IoU等于計(jì)算的2個(gè)邊界框的交集和并集比；一般閾值設(shè)為0.5，所以一般約定，在檢測(cè)中，IoUgt;0.5，則認(rèn)為檢測(cè)正確。權(quán)重因子α和寬高比懲罰項(xiàng)v的公式如下：

α=v1-IoU+v；

v=4π2arctanwgthgt-arctanwh2。

式中：w、wgt分別為預(yù)測(cè)框、真實(shí)框?qū)挾?；h、hgt分別為預(yù)測(cè)框、真實(shí)框高度。

基礎(chǔ)的YOLO v5模型更適合完成中、大型目標(biāo)的檢測(cè)任務(wù)，但是在農(nóng)業(yè)復(fù)雜環(huán)境中，尤其是在小目標(biāo)物體形態(tài)發(fā)生較大變化的情況下，檢測(cè)效果尚未達(dá)到預(yù)期水平。為在復(fù)雜的背景中正確識(shí)別小目標(biāo)物體，需要對(duì)YOLO v5進(jìn)行進(jìn)一步改進(jìn)，本研究設(shè)計(jì)一個(gè)名為YOLO v5-Smix的新型模型，它采用最新的Darknet-53網(wǎng)絡(luò)替代YOLO v5原本的CSPDarknet53主干網(wǎng)絡(luò)，以解決CSPDarknet53網(wǎng)絡(luò)在提取小目標(biāo)特征方面的不足。同時(shí)，對(duì)Neck層中的特征融合部分進(jìn)行修改，引入具有雙向融合特征的網(wǎng)絡(luò)BiFPN，以實(shí)現(xiàn)目標(biāo)的多尺度特征融合。最后，對(duì)損失函數(shù)進(jìn)行更換，將原本的CIoU損失函數(shù)換成WIoU損失函數(shù)。通過(guò)以上改進(jìn)解決現(xiàn)有YOLO v5模型對(duì)復(fù)雜背景下的小目標(biāo)檢測(cè)能力不足的問(wèn)題［11］。

1.2" 改進(jìn)后的YOLO v5-Simx算法

1.2.1" Backbone部分改進(jìn)

草莓在缺鈣時(shí)葉片表現(xiàn)出的癥狀屬于小目標(biāo)，在進(jìn)行特征提取時(shí)，YOLO v5 原本網(wǎng)絡(luò)的下采樣方式會(huì)丟失掉部分小目標(biāo)信息。為解決小目標(biāo)物體特征信息訓(xùn)練不全面的問(wèn)題，本研究改進(jìn)模型 YOLO v5-Smix 采用最新的Darknet-53網(wǎng)絡(luò)（圖5）。

Darknet-53與CSPDarknet53的主要區(qū)別在于前者用更為先進(jìn)的C2F模塊更換了C3（跨階段殘差瓶頸）模塊即圖5中的CBS模塊。C2F模塊的優(yōu)勢(shì)在于它是整合了C3模塊以及ELAN思想進(jìn)行的設(shè)計(jì)，可以讓網(wǎng)絡(luò)在保證輕量化的同時(shí)，獲得更加豐富的梯度流信息，C2F模塊中的卷積核參數(shù)數(shù)量比C3模塊少，因此，C2F模塊所需要的計(jì)算資源更少，會(huì)有更快的計(jì)算速度，且C2F模塊可以適應(yīng)不

同大小的輸入，這使得C2F模塊在處理不同大小的圖像時(shí)更加靈活，對(duì)小目標(biāo)也更加敏感。C2F模塊結(jié)構(gòu)如圖6所示。

1.2.2" Neck部分改進(jìn)

在網(wǎng)絡(luò)的訓(xùn)練過(guò)程中，隨著網(wǎng)絡(luò)層次的加深，獲得的特征信息越來(lái)越高級(jí)，而層次的加深讓網(wǎng)絡(luò)無(wú)法獲得明確的位置信息，以至于使小目標(biāo)物體的位置信息損失增大。因此，在提取到缺鈣草莓葉片的特征信息后，需要對(duì)從特征提取層輸送過(guò)來(lái)的目標(biāo)特征信息進(jìn)行特征融合，以提高檢測(cè)頭Head對(duì)缺鈣葉片位置和特征信息預(yù)測(cè)的準(zhǔn)確度［12-14］。

本研究中的YOLO v5-Smix采用BiFPN網(wǎng)絡(luò)結(jié)構(gòu)，刪除原本的PANet網(wǎng)絡(luò)中只有1條輸入邊的節(jié)點(diǎn)，這些節(jié)點(diǎn)的刪除不僅不會(huì)對(duì)網(wǎng)絡(luò)產(chǎn)生影響，同時(shí)還能將雙向網(wǎng)絡(luò)簡(jiǎn)化。為了能夠在不增加過(guò)多成本的情況下融合更多的目標(biāo)信息，BiFPN網(wǎng)絡(luò)在原始輸入節(jié)點(diǎn)和輸出節(jié)點(diǎn)之間添加1條額外的邊，與原本的PANet網(wǎng)絡(luò)不同，BiFPN網(wǎng)絡(luò)在處理每個(gè)雙向路徑時(shí)都作為一個(gè)特征網(wǎng)絡(luò)層，并重復(fù)同一層多次，以實(shí)現(xiàn)更高層次的特征融合［15］。BiFPN網(wǎng)絡(luò)結(jié)構(gòu)示意如圖7所示，在網(wǎng)絡(luò)中的結(jié)構(gòu)如圖8所示。

BiFPN結(jié)構(gòu)使網(wǎng)絡(luò)學(xué)習(xí)不同分辨率特征圖在特征融合中的重要程度，并反復(fù)進(jìn)行多尺度特征融合。BiFPN帶權(quán)融合公式為

O=∑iwie+∑jwj·Ii。

式中：Ii表示輸入特征；wi、wj為權(quán)值，用于度量不同分辨率特征在特征融合中的貢獻(xiàn)值；e表示數(shù)值極小的學(xué)習(xí)率，用來(lái)約束數(shù)值的振蕩；O為輸出加權(quán)特征融合的值。

BiFPN網(wǎng)絡(luò)在融合不同尺度的特征圖時(shí)，因其獨(dú)有的雙向交叉尺度融合連接結(jié)構(gòu)，使得模型在訓(xùn)練時(shí)的特征融合效率有了極大的提高，可高效地融合多分辨率下缺鈣草莓葉片的目標(biāo)特征；同時(shí)運(yùn)用加權(quán)融合的方式得到處于不同尺度時(shí)輸入特征與輸出特征的貢獻(xiàn)情況，從而解決缺鈣草莓葉片尺度變換過(guò)大的問(wèn)題，提高模型的檢測(cè)能力。

1.2.3" Head部分改進(jìn)

通過(guò)以上對(duì)YOLO v5網(wǎng)絡(luò)模型特征提取層Backbone骨骼模塊的更換、特征融合Neck層的優(yōu)化，理論上提高了模型對(duì)小目標(biāo)特征信息的運(yùn)用能力，再對(duì)模型損失函數(shù)進(jìn)行一系列優(yōu)化和比較試驗(yàn)，可得出優(yōu)化后的小目標(biāo)檢測(cè)模型，進(jìn)一步提高模型在小目標(biāo)物體上的檢測(cè)能力。

對(duì)于目標(biāo)檢測(cè)模型，都會(huì)有3個(gè)主要的檢測(cè)任務(wù)，首先需要檢測(cè)出圖像中若干目標(biāo)的位置、目標(biāo)的大小，然后再對(duì)檢測(cè)到的目標(biāo)進(jìn)行分類(lèi)。在訓(xùn)練時(shí)模型檢測(cè)效果的不斷優(yōu)化需要損失函數(shù)來(lái)發(fā)揮作用［16-18］。

損失函數(shù)的發(fā)展經(jīng)歷了很長(zhǎng)一段時(shí)間，在這段時(shí)間有無(wú)數(shù)優(yōu)秀的損失函數(shù)被學(xué)者所提出，其中包括擴(kuò)展交并比/焦點(diǎn)擴(kuò)展交并比（EIoU/Focal EIoU）、平滑交并比（SIoU）、廣義交并比（GIoU）等，本研究采用WIoU損失函數(shù)來(lái)更換CIoU函數(shù)，加權(quán)交并比（WIoU）函數(shù)因具有動(dòng)態(tài)非單調(diào)聚焦機(jī)制，獲得優(yōu)越的性能［19］。WIoU函數(shù)定義如下：

LWIoUv1=RWIoULIoU；

RWIoU=exp（x-xgt）2+（y-ygt）2（W2g+H2g）*

式中：Wg、Hg分別表示最小包圍框的寬和高；x、y代表中心坐標(biāo)值；gt代表真實(shí)值。為防止Rwiou產(chǎn)生，阻礙收斂的梯度，將Wg和Hg從計(jì)算圖中分離出來(lái)（上標(biāo)*表示此操作）。WIoU有效地消除了阻礙收斂的因素，沒(méi)有引入新的度量，例如縱橫比［20-21］。

將更換WIoU損失函數(shù)的YOLO v5算法分別與更換EIoU、SIoU、CIoU的算法進(jìn)行試驗(yàn)比較，結(jié)果如圖9所示。

由圖9可見(jiàn)，WIoU在效果上不輸CIoU等損失函數(shù)，同時(shí)還具有非常可觀的收斂速度，這對(duì)模型檢測(cè)效果的提升意義巨大。

2" 圖像數(shù)據(jù)集與預(yù)處理

2.1" 試驗(yàn)數(shù)據(jù)

本研究使用的試驗(yàn)數(shù)據(jù)集來(lái)源于Mendeley數(shù)據(jù)網(wǎng)站，并從國(guó)外開(kāi)源網(wǎng)站Kaggle上下載壓縮圖像數(shù)據(jù)包。數(shù)據(jù)包中包括健康的草莓葉片和出現(xiàn)缺鈣癥狀的草莓葉片圖像總計(jì)1 431張，其中出現(xiàn)缺鈣癥狀的圖像為891張，正常狀態(tài)的圖像為540張，本研究只使用出現(xiàn)缺鈣癥狀的草莓葉片圖像作為數(shù)據(jù)集，數(shù)據(jù)集樣例如圖10所示。

2.2" 數(shù)據(jù)增強(qiáng)

為提高試驗(yàn)數(shù)據(jù)集的豐富性和網(wǎng)絡(luò)識(shí)別的準(zhǔn)確性，同時(shí)防止訓(xùn)練過(guò)程中產(chǎn)生過(guò)擬合現(xiàn)象，采用多種數(shù)據(jù)增強(qiáng)方式對(duì)數(shù)據(jù)樣本進(jìn)行擴(kuò)充，以保障網(wǎng)絡(luò)模型的訓(xùn)練。具體方式為使用亮度線性變換、隨機(jī)旋轉(zhuǎn)、水平垂直翻轉(zhuǎn)、隨機(jī)裁剪等方式對(duì)原始圖像進(jìn)行數(shù)據(jù)增強(qiáng)，原始圖像如圖11所示，數(shù)據(jù)增強(qiáng)后的對(duì)比結(jié)果如圖12所示。圖12中按照九宮格排序依次為原圖、線性亮度降低25%、線性亮度上升25%、隨機(jī)左旋轉(zhuǎn)、隨機(jī)右旋轉(zhuǎn)、隨機(jī)中心點(diǎn)縮放、上下翻轉(zhuǎn)、左右翻轉(zhuǎn)、隨機(jī)裁剪。最終得到缺鈣草莓葉片圖像8 000張，將8 000張圖像按照訓(xùn)練集（6 400張）、驗(yàn)證集（800張）、測(cè)試集（800張）的順序分成8 ∶1 ∶1 3個(gè)部分。

2.3" 數(shù)據(jù)標(biāo)注

為使網(wǎng)絡(luò)模型能更好地學(xué)習(xí)草莓缺鈣時(shí)葉片的特征信息，對(duì)圖像中出現(xiàn)鈣元素缺失的草莓葉片

部位進(jìn)行標(biāo)注。本研究使用標(biāo)注軟件LabelImg對(duì)圖像中的缺鈣草莓葉片進(jìn)行標(biāo)記，標(biāo)記時(shí)盡可能使邊界框最小，以減少背景對(duì)模型識(shí)別的影響。標(biāo)注效果如圖13所示。

標(biāo)注完成后，得到記錄草莓缺鈣葉片位置信息和特征信息的Label文件，將其放入標(biāo)簽文件夾中保障后續(xù)模型訓(xùn)練，Label文件記錄目標(biāo)檢測(cè)框的位

置、類(lèi)別等信息。

2.4" 試驗(yàn)環(huán)境

試驗(yàn)時(shí)間為2022年6月，地點(diǎn)位于河北工業(yè)大學(xué)北辰校區(qū)電子信息學(xué)院樓，模型的訓(xùn)練在服務(wù)器主機(jī)上進(jìn)行，服務(wù)器的硬件環(huán)境配置：CPU采用英特爾處理器，具體型號(hào)為i7-11700KF，GPU采用NVIDIA GeForce RTX 3090。軟件環(huán)境使用3.8版本下Python實(shí)現(xiàn)，深度學(xué)習(xí)框架使用Pytroch 1.8.0，數(shù)據(jù)集尺寸為1 024像素×768像素，試驗(yàn)相關(guān)參數(shù)設(shè)置如表1所示。

2.5" 評(píng)估指標(biāo)

為了客觀評(píng)估模型性能，本研究采用精確度、召回率、平均精度和0.5比率下的平均精度均值來(lái)評(píng)價(jià)模型的識(shí)別效果。各指標(biāo)計(jì)算公式如下：

P=TPTP+FP×100%；

R=TPTP+FN×100%；

AP=∫10PdR；

mAP=1N∑Ni=1APi。

式中：TP為正樣本被正確識(shí)別為正樣本的數(shù)量；FP為負(fù)樣本被錯(cuò)誤識(shí)別為正樣本的數(shù)量；FN為正樣本被錯(cuò)誤識(shí)別為負(fù)樣本的數(shù)量；N為目標(biāo)的類(lèi)別數(shù)；P為精確度；R為召回率；AP為平均精度；mAP為0.5比率下的平均精度均值。本研究的檢測(cè)目標(biāo)只有缺鈣草莓葉片這一個(gè)目標(biāo)類(lèi)別，所以mAP數(shù)值和AP數(shù)值完全一致，mAP數(shù)值越大，網(wǎng)絡(luò)效果越好［22］。

3" 試驗(yàn)結(jié)果

3.1" YOLO v5-Smix模型訓(xùn)練結(jié)果

采用本研究中的YOLO v5-Smix對(duì)缺鈣草莓葉片進(jìn)行檢測(cè)和識(shí)別，由訓(xùn)練結(jié)果（圖14）可觀察到，YOLO v5-Smix網(wǎng)絡(luò)訓(xùn)練時(shí)的收斂速度和損失回歸曲線都比較平穩(wěn)，且沒(méi)有出現(xiàn)過(guò)多的過(guò)擬合現(xiàn)象。

3.2" 不同網(wǎng)絡(luò)模型對(duì)缺鈣葉片檢測(cè)性能指標(biāo)比較

將Faster-RCNN、YOLO v3、YOLO v4、YOLO v5和本研究中改進(jìn)模型YOLO v5-Smix的精確率、召回率、0.5比率下的平均精度均值進(jìn)行對(duì)比，結(jié)果如表2所示。

由表2可見(jiàn)，在對(duì)草莓缺鈣部位進(jìn)行識(shí)別時(shí)，YOLO v3、YOLO v4的檢測(cè)效果相比Faster RCNN有了極大的改善，但還是略低于YOLO v5。YOLO v5-Smix 的檢測(cè)效果在YOLO v5的基礎(chǔ)上得到進(jìn)一步提高，其精確度、召回率、0.5比率下的平均精度均值和綜合評(píng)價(jià)指標(biāo)均有所提升。其中，精確度比Faster RCNN高17.2百分點(diǎn)，比YOLO v3高10.7百分點(diǎn)，比YOLO v4高12.4百分點(diǎn)，比YOLO v5高6.9百分點(diǎn)。YOLO v5和YOLO v5-Smix的識(shí)別精度對(duì)比曲線對(duì)比圖如圖15所示。

3.3" YOLO v5-Simx消融試驗(yàn)

為驗(yàn)證改進(jìn)試驗(yàn)的有效性，采取消融試驗(yàn)的方式來(lái)進(jìn)行模型效果的對(duì)比分析，結(jié)果如表3所示。

模型1是YOLO v5網(wǎng)絡(luò)模型，模型2是更換了Darknet-53后得到的網(wǎng)絡(luò)模型，模型3是將 YOLO v5 的特征融合網(wǎng)絡(luò)替換為BiFPN得到的網(wǎng)絡(luò)模型，模型4是只更換WIoU損失函數(shù)的網(wǎng)絡(luò)模型，模型5是本研究改進(jìn)網(wǎng)絡(luò)模型YOLO v5-Smix。試驗(yàn)時(shí)，各網(wǎng)絡(luò)模型訓(xùn)練輪次、學(xué)習(xí)率等參數(shù)均相同。

由表3可見(jiàn)，模型2、模型3、模型4、模型5的0.5比率下的平均精度均值相較于模型1均有不同程度的提高，這說(shuō)明Darknet-53網(wǎng)絡(luò)和BiFPN網(wǎng)絡(luò)的替換均可提升模型的檢測(cè)效果。損失函數(shù)的更換雖然在精確度上的提高效果不佳，但其召回率

卻得到增強(qiáng)；而模型5的提高效果最明顯，其中精確度比模型1提高6.9百分點(diǎn)，召回率提升5.2百分點(diǎn)，平均精度均值提高7.7百分點(diǎn)。

4" 結(jié)論

針對(duì)缺鈣草莓葉片目標(biāo)特征過(guò)小且存在尺度大小不一以及目標(biāo)易受環(huán)境背景影響等識(shí)別難題，提出一種適用于缺鈣草莓葉片的小目標(biāo)物體檢測(cè)識(shí)別模型YOLO v5-Smix，通過(guò)多種數(shù)據(jù)增強(qiáng)方式擴(kuò)充數(shù)據(jù)集，使用以C2F模塊為核心的Darknet-53網(wǎng)絡(luò)提取特征，結(jié)合BiFPN結(jié)構(gòu)進(jìn)行特征融合，更換WIoU損失函數(shù)，構(gòu)建復(fù)雜環(huán)境背景下的缺鈣草莓葉片檢測(cè)模型，并采用對(duì)比試驗(yàn)和消融試驗(yàn)對(duì)模型的性能進(jìn)行評(píng)估與分析。

在缺鈣草莓葉片的檢測(cè)中，本研究構(gòu)建的YOLO v5-Smix模型識(shí)別準(zhǔn)確度為89.1%，召回率為81.0%，0.5比率下的平均精度均值為78.8%，與其他目標(biāo)檢測(cè)網(wǎng)絡(luò)模型相比，本研究?jī)?yōu)化的YOLO v5-Smix模型具有更好的小目標(biāo)檢測(cè)效果，結(jié)果可為精準(zhǔn)農(nóng)業(yè)、智慧農(nóng)業(yè)的發(fā)展提供技術(shù)支持。

參考文獻(xiàn)：

［1］成玉波，包成友，成玉富. 草莓缺素癥及其防治方法［J］. 現(xiàn)代農(nóng)業(yè)科技，2007（3）：34.

［2］孫圓龍，徐曉輝，宋" 濤，等. 高效運(yùn)算網(wǎng)絡(luò)在作物葉部病害識(shí)別中的研究［J］. 中國(guó)農(nóng)機(jī)化學(xué)報(bào)，2021，42（7）：156-161.

［3］劉慶飛，張宏立，王艷玲. 基于深度可分離卷積的實(shí)時(shí)農(nóng)業(yè)圖像逐像素分類(lèi)研究［J］. 中國(guó)農(nóng)業(yè)科學(xué)，2018，51（19）：3673-3682.

［4］丁常宏，王守宇，高" 鵬. 基于SSD－MobileNet v1深度學(xué)習(xí)算法的藥用植物葉片識(shí)別方法［J］. 江蘇農(nóng)業(yè)科學(xué)，2020，48（22）：222-228.

［5］Hariri M，Avar E. Tipburn disorder detection in strawberry leaves using convolutional neural networks and particle swarm optimization［J］. Multimedia Tools and Applications，2022，81（8）：11795-11822.

［6］林銘捷. 基于深度學(xué)習(xí)的春石斛生長(zhǎng)狀態(tài)識(shí)別的研究［D］. 廣州：華南理工大學(xué)，2021.

［7］袁" 磊，唐" 海，陳彥蓉，等. 改進(jìn)YOLO v5的復(fù)雜環(huán)境道路目標(biāo)檢測(cè)方法［J］. 計(jì)算機(jī)工程與應(yīng)用，2023，59（16）：212-222.

［8］許璧麒，馬志強(qiáng)，寶財(cái)吉拉呼，等. 基于YOLO v5的高速公路小目標(biāo)車(chē)輛逆行檢測(cè)模型［J］. 國(guó)外電子測(cè)量技術(shù)，2022，41（11）：146-153.

［9］王寅凱，曹" 磊，錢(qián)佳晨，等. 一種改進(jìn)YOLO v5的多尺度像素林火識(shí)別算法［J］. 林業(yè)工程學(xué)報(bào)，2023，8（2）：159-165.

［10］張利紅，蔡敬菊. 基于輕量化YOLO v5算法的目標(biāo)檢測(cè)系統(tǒng)［J］. 計(jì)算機(jī)技術(shù)與發(fā)展，2022，32（11）：134-139.

［11］楊文姬，胡文超，趙應(yīng)丁，等. 基于改進(jìn)YOLO v5植物病害檢測(cè)算法研究［J］. 中國(guó)農(nóng)機(jī)化學(xué)報(bào)，2023，44（1）：108-115.

［12］朱香元，聶" 轟，周" 旭. 基于TPH-YOLO v5和小樣本學(xué)習(xí)的害蟲(chóng)識(shí)別方法［J］. 計(jì)算機(jī)科學(xué)，2022，49（12）：257-263.

［13］劉思誠(chéng)，李嘉琛，鄧" 皓，等. 基于YOLO v5改進(jìn)的小目標(biāo)檢測(cè)算法［J］. 兵工自動(dòng)化，2022，41（12）：78-82，94.

［14］馬宏興，張" 淼，董凱兵，等. 基于改進(jìn)YOLO v5的寧夏草原蝗蟲(chóng)識(shí)別模型研究［J］. 農(nóng)業(yè)機(jī)械學(xué)報(bào)，2022，53（11）：270-279.

［15］Zhu P C，Chen B L，Liu B S，et al. Object detection for hazardous material vehicles based on improved YOLO v5 algorithm［J］. Electronics，2023，12（5）：1257.

［16］Li J F，Lian X Q. Research on forest fire detection algorithm based on improved YOLO v5［J］. Machine Learning and Knowledge Extraction，2023，5（3）：725-745.

［17］Jiang T Y，Li C，Yang M，et al. An improved YOLO v5s algorithm for object detection with an attention mechanism［J］. Electronics，2022，11（16）：2494.

［18］周紹發(fā)，肖小玲，劉忠意，等. 改進(jìn)的基于YOLO v5s蘋(píng)果樹(shù)葉病害檢測(cè)［J］. 江蘇農(nóng)業(yè)科學(xué)，2023，51（13）：212-220.

［19］Sun C，Zhang S W，Qu P Q，et al. MCA-YOLO v5-light：a faster，stronger and lighter algorithm for helmet-wearing detection［J］. Applied Sciences，2022，12（19）：9697.

［20］Guo G G，Zhang Z Y. Road damage detection algorithm for improved YOLO v5［J］. Scientific Reports，2022，12（1）：15523.

［21］Sun Z J，Yang H，Zhang Z F，et al. An improved YOLO v5-based tapping trajectory detection method for natural rubber trees［J］. Agriculture，2022，12（9）：1309.

［22］豐玉華，魏" 怡，劉力手，等. 面向跌倒行人的MP-YOLO v5檢測(cè)模型［J］. 重慶郵電大學(xué)學(xué)報(bào)（自然科學(xué)版），2023，35（5）：960-970.