關(guān)鍵詞:果蠅識(shí)別;YOLOv8n;GhostNetV2;BiFPN;C2fMBC
中圖分類(lèi)號(hào):S126:S436.63 文獻(xiàn)標(biāo)識(shí)號(hào):A 文章編號(hào):1001-4942(2025)02-0172-09
果蠅是一種體型微小的雙翅目昆蟲(chóng),是全球最重要的農(nóng)業(yè)害蟲(chóng)之一。其寄主植物廣泛,喜食各類(lèi)漿果,常造成漿果腐爛和落果。劉曼、張小玲、陳哲等研究揭示,藍(lán)莓和樹(shù)莓主要受到黑腹果蠅的危害,常造成嚴(yán)重的經(jīng)濟(jì)損失。然而,果蠅的防治以預(yù)防為主,即在適宜的時(shí)間段內(nèi)對(duì)果蠅進(jìn)行識(shí)別和計(jì)數(shù),預(yù)測(cè)其暴發(fā)期,再采取措施及時(shí)誘殺。目前,果蠅識(shí)別仍主要依賴(lài)于人工肉眼識(shí)別,由專(zhuān)家在屏幕上手動(dòng)計(jì)數(shù),存在主觀性強(qiáng)及準(zhǔn)確性和工作效率低等問(wèn)題。因此,探索更為高效的果蠅識(shí)別技術(shù)成為該領(lǐng)域迫切需要解決的問(wèn)題。
隨著圖像處理和機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,利用這些技術(shù)進(jìn)行蟲(chóng)害識(shí)別的方法日臻成熟,相比于人工肉眼識(shí)別,在精度和效率方面都有顯著提升。然而,實(shí)際應(yīng)用中存在多種因素影響其識(shí)別效果的問(wèn)題,如顏色和形狀特征差異不明顯、背景復(fù)雜易誤報(bào)以及手動(dòng)提取特征繁瑣等,因此需要進(jìn)一步研究和改進(jìn),以提高準(zhǔn)確性和效率。
與傳統(tǒng)的圖像處理和機(jī)器學(xué)習(xí)技術(shù)相比,基于深度學(xué)習(xí)的目標(biāo)識(shí)別技術(shù)有自動(dòng)提取特征及泛化能力強(qiáng)等優(yōu)勢(shì)。其中,F(xiàn)aster R-CNN是兩階段算法,在蟲(chóng)害識(shí)別任務(wù)上具有良好的識(shí)別效果。Uzun等使用Faster R-CNN成功識(shí)別了地中海果蠅,成功率達(dá)到約94%。但該算法需要的計(jì)算代價(jià)高且推理速度較慢,限制了其實(shí)際應(yīng)用。YOLO系列算法作為一階段算法,速度和精度相較兩階段算法更加平衡,在蟲(chóng)害識(shí)別任務(wù)上應(yīng)用更加廣泛。郭小燕等通過(guò)集成輕量級(jí)神經(jīng)網(wǎng)絡(luò)架構(gòu)GhostNetV1中的Ghost模塊,用兩個(gè)Ghost模塊組合成的復(fù)合模塊替換YOLOv5s主干網(wǎng)絡(luò)中Focus模塊和SPP模塊之間的7個(gè)現(xiàn)有模塊,對(duì)YOLOv5s模型進(jìn)行改進(jìn),實(shí)現(xiàn)了模型的輕量化并同時(shí)保持或提升其識(shí)別性能,在包括5種農(nóng)作物12類(lèi)蟲(chóng)害的數(shù)據(jù)集上的平均精確率均值(mAP)相較于原始YOLOv5s提升了2.5%。
由上可知,YOLO系列算法在蟲(chóng)害識(shí)別領(lǐng)域展現(xiàn)出良好的性能。然而,在面對(duì)體型較小以及密度較高的果蠅識(shí)別任務(wù)時(shí)仍存在一定的局限性。此外,需要在移動(dòng)設(shè)備上部署的應(yīng)用場(chǎng)景對(duì)該算法的性能優(yōu)化和模型壓縮也提出了更高的要求。為此,本研究提出一種基于改進(jìn)YOLOv8n算法的漿果園內(nèi)果蠅識(shí)別方法,以期在提高識(shí)別精度的同時(shí)降低算法復(fù)雜度,以滿足在移動(dòng)端部署的需求,實(shí)現(xiàn)對(duì)漿果園果蠅的識(shí)別與防治。
1材料與方法
1.1數(shù)據(jù)采集及原始數(shù)據(jù)集構(gòu)建
數(shù)據(jù)于2023年4月1日至8月31日在貴州省植物園中的漿果園果蠅研究示范基地進(jìn)行采集。以黑腹果蠅和殘翅果蠅為待識(shí)別目標(biāo),采用粘性的黃色誘蟲(chóng)板捕獲,誘蟲(chóng)板每4~5天更換一次并用不透明亞克力板固定,防止光照不均勻影響圖片質(zhì)量。圖像采集系統(tǒng)包括電源供應(yīng)模塊、支撐結(jié)構(gòu)、邊緣計(jì)算設(shè)備以及攝像頭,安裝于基地的中心位置。在每天8時(shí)—17時(shí)期間,每隔半小時(shí)自動(dòng)拍攝誘蟲(chóng)板圖像,圖像的分辨率為3472×3472像素,存儲(chǔ)在工控機(jī)內(nèi)。圖1為數(shù)據(jù)集中的代表性圖像,其中綠色框標(biāo)注的是黑腹果蠅,藍(lán)色框標(biāo)注的是殘翅果蠅。
對(duì)采集的圖像進(jìn)行篩選,去除不清晰和不含待測(cè)目標(biāo)的圖像,最終獲得1325張包含兩類(lèi)果蠅的圖像,用Labelimg軟件對(duì)其進(jìn)行手工標(biāo)注后構(gòu)建數(shù)據(jù)集,然后按照8:1:1的比例劃分為訓(xùn)練集、驗(yàn)證集及測(cè)試集。數(shù)據(jù)集具體信息如表1所示。
1.2數(shù)據(jù)增強(qiáng)及最終數(shù)據(jù)集信息
原始數(shù)據(jù)是高分辨率的,直接下采樣不僅會(huì)造成數(shù)據(jù)的丟失,還會(huì)增大訓(xùn)練負(fù)擔(dān),而直接re-size到640×640像素又會(huì)漏檢許多目標(biāo)。因此,我們將原始圖像均勻分割成4塊,并設(shè)置20%的重疊率,以減少處于分界處的目標(biāo)被截?cái)噙M(jìn)而導(dǎo)致漏檢的情況:考慮到果蠅屬于微小目標(biāo)且大小不一,在誘蟲(chóng)板上的分布及密集情況也不同,為了提升果蠅識(shí)別算法的魯棒性,采用多種數(shù)據(jù)增強(qiáng)技術(shù)對(duì)圖像數(shù)據(jù)集進(jìn)行擴(kuò)充,包括隨機(jī)亮度變換、隨機(jī)填充、隨機(jī)縮放以及隨機(jī)翻轉(zhuǎn)等;然后再將圖片resize到640×640像素。所得最終數(shù)據(jù)集的具體信息如表2所示。通過(guò)上述操作,模型訓(xùn)練過(guò)程中數(shù)據(jù)的多樣性得以增加,從而有助于提高算法對(duì)不同條件下果蠅圖像的識(shí)別能力,并有效防止模型在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合現(xiàn)象,確保模型的泛化性能。
1.3改進(jìn)YOLOv8n算法
YOLOv8是新提出的Anchor-Free算法,借鑒YOLOv5的C3模塊和YOLOv7的ELAN的思想,設(shè)計(jì)了輕量化的C2f模塊,用該模塊替代YOLOv5的所有C3模塊,并將第三個(gè)模塊的重復(fù)次數(shù)由9降到6:頸部仍然采用FPN結(jié)合PAN的結(jié)構(gòu),但去除了1×1卷積,將主干不同階段輸出的特征直接送人上采樣操作,使模型更加精簡(jiǎn)且高效:頭部設(shè)計(jì)采用YOLOX的解耦策略,分別獨(dú)立處理分類(lèi)和定位任務(wù):回歸頭則引入分布焦點(diǎn)損失(DFL)的思想,分類(lèi)損失使用BCELoss:最后采用TOOD標(biāo)簽分配策略替代IOU匹配方式,更好地解決正負(fù)樣本分配問(wèn)題,進(jìn)一步提高算法的性能。根據(jù)網(wǎng)絡(luò)深度和寬度的不同,YOLOv8算法分為n、s、m、l、x五種類(lèi)型,其中YOLOv8n是最小的算法,推理速度快,適合漿果園場(chǎng)景下的蟲(chóng)害識(shí)別任務(wù)。然而,原始的YOLOv8n算法在識(shí)別果蠅時(shí),會(huì)出現(xiàn)誤識(shí)別和漏識(shí)別的情況,而且仍有超過(guò)三百萬(wàn)的參數(shù),仍具有輕量化的空間。針對(duì)上述問(wèn)題,本研究在YOLOv8n的基礎(chǔ)上進(jìn)行改進(jìn),改進(jìn)后算法的整體框架如圖2所示。
1.3.1構(gòu)建C2fGhostV2模塊 GhostNetV2是一種輕量級(jí)端側(cè)架構(gòu),由華為諾亞方舟實(shí)驗(yàn)室于2022年提出。該架構(gòu)在GhostNet的基礎(chǔ)上重新考慮了注意力機(jī)制對(duì)算法的影響,并設(shè)計(jì)了一種適用于移動(dòng)端的解耦全連接注意力機(jī)制(DFC-Attention)。通過(guò)同時(shí)使用DFC注意力和Ghost-Conv模塊,GhostNetV2能夠有效捕獲長(zhǎng)距離空間信息。其核心模塊是GhostNetV2 bottleneck(GV2BN),如圖3所示,它類(lèi)似于由兩個(gè)堆疊的GhostConv組成的殘差塊,遵循逆瓶頸先升維再降維的設(shè)計(jì)理念。此外,與普通卷積相比,Ghost-Conv能夠用更少的參數(shù)提取更多的特征。
YOLOv8n采用CSPDarkNet53作為主干,以實(shí)現(xiàn)性能和速度的平衡。然而,隨著網(wǎng)絡(luò)層數(shù)的增加,參數(shù)量和計(jì)算量逐漸增加,導(dǎo)致冗余問(wèn)題的出現(xiàn)。此外,由于多次卷積操作,果蠅的特征會(huì)逐漸被忽略。因此,本研究使用GV2BN模塊替代主干部分所有C2f模塊的殘差塊,構(gòu)建了C2fGhostV2模塊,如圖4所示。利用GhostConv可以減少計(jì)算代價(jià)的特點(diǎn),并結(jié)合DFC注意力機(jī)制,實(shí)現(xiàn)了主干的輕量化和更準(zhǔn)確的圖像特征提取,因此能更精確地識(shí)別微小果蠅。
1.3.2設(shè)計(jì)L-BiFPN結(jié)構(gòu)并替換Neck部分的FPN+PAN結(jié)構(gòu) BiFPN,即加權(quán)雙向特征金字塔網(wǎng)絡(luò),是在谷歌的EfficientDet架構(gòu)中提出的一種改進(jìn)網(wǎng)絡(luò)。它保留了FPN+PAN自頂向下傳遞強(qiáng)語(yǔ)義信息和自底向上傳遞強(qiáng)位置信息的能力,并能夠通過(guò)刪除單輸入節(jié)點(diǎn)和引入跳躍連接機(jī)制精簡(jiǎn)網(wǎng)絡(luò),在降低計(jì)算量的同時(shí)保持特征圖的分辨率不變,減少了信息丟失,有利于梯度傳播。另外,BiFPN對(duì)每個(gè)輸入特征設(shè)置權(quán)重以區(qū)分重要性,而且其網(wǎng)絡(luò)結(jié)構(gòu)靈活,大小可調(diào)節(jié)。FPN+PAN及BiFPN的結(jié)構(gòu)見(jiàn)圖5。
原始的YOLOv8n在Neck部分采用FPN+PAN結(jié)構(gòu),通過(guò)路徑聚合進(jìn)行特征融合以提高網(wǎng)絡(luò)的特征提取能力。但該結(jié)構(gòu)存在參數(shù)冗余和原始特征丟失的問(wèn)題,影響識(shí)別性能。為了解決該問(wèn)題,本研究基于BiFPN常規(guī)用法(圖6a),設(shè)計(jì)了更高效的L-BiFPN結(jié)構(gòu)(圖6b)來(lái)替代FPN+PAN結(jié)構(gòu)。具體而言,在P3、P4和P5層各增加一個(gè)1×1卷積層,將通道數(shù)統(tǒng)一調(diào)整為256以輕量化算法并進(jìn)行更豐富的特征融合和處理;此外,在P3層增加一個(gè)跳躍連接,但仍然保持YOLOv8n的3個(gè)識(shí)別頭。L-BiFPN延續(xù)了BiF-PN的雙向特征傳播機(jī)制和多級(jí)特征融合機(jī)制,能提高特征融合效率并增強(qiáng)網(wǎng)絡(luò)的特征表達(dá)能力,同時(shí)還能更好地保留和傳遞特征信息,因此在果蠅識(shí)別任務(wù)中能取得更好的效果。此外,這種高效且靈活的設(shè)計(jì)使得L-BiFPN在保持高性能的同時(shí)實(shí)現(xiàn)了一定程度的輕量化。
1.3.3 C2fMBC模塊 MBCoriv,即移動(dòng)翻轉(zhuǎn)瓶頸卷積,是一種深度可分離卷積的倒置線性瓶頸層,采用深度可分離卷積(DWConv)和SENet相結(jié)合的設(shè)計(jì)思想。該結(jié)構(gòu)的目標(biāo)在于通過(guò)整合DWConv和SENet構(gòu)建一種高效的卷積結(jié)構(gòu)。
YOLOv8n頸部的C2f模塊有3個(gè)殘差塊,每個(gè)殘差塊由1個(gè)1×1 Conv和1個(gè)3×3 Conv構(gòu)成,不使用殘差連接,與主干部分的C2f模塊結(jié)構(gòu)不同。由于果蠅體型較小且數(shù)量眾多,容易出現(xiàn)目標(biāo)難以捕捉以及特征信息難以充分利用的情況,從而影響果蠅識(shí)別的準(zhǔn)確性和魯棒性。針對(duì)該問(wèn)題,本研究使用MBConv替代頸部所有C2f模塊的殘差塊,設(shè)計(jì)了新的C2fMBC模塊(圖8),以提高識(shí)別任務(wù)的準(zhǔn)確性和處理速度。由于深度可分離卷積的特性,C2fMBC可以更高效地處理特征圖,且相比于1×1 Conv和3×3 Conv,參數(shù)量顯著降低。得益于SENet的特性,C2fMBC模塊能夠更為有效地聚焦于關(guān)鍵特征,優(yōu)化了網(wǎng)絡(luò)對(duì)信息通道的重視程度,從而顯著提升了模型在特征提取和表達(dá)方面的性能。因此,使得改進(jìn)算法能在保持高精度的同時(shí)實(shí)現(xiàn)果蠅識(shí)別任務(wù)的高效MBConv的結(jié)構(gòu)如圖7所示。首先,輸入數(shù)據(jù)經(jīng)過(guò)1×1 Conv進(jìn)行升維,隨后利用DWConv對(duì)每個(gè)通道執(zhí)行卷積操作;接著,通過(guò)SENet增強(qiáng)有效特征的權(quán)重,抑制無(wú)效特征;在SENet處理完成后,再通過(guò)1×1 Conv的降維操作,將數(shù)據(jù)的通道數(shù)還原到原始狀態(tài),最終輸出為降維后的數(shù)據(jù)。與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)不同,MBConv采用殘差連接的思想,并在短連接部分引入SE層??傮w而言,MBConv的設(shè)計(jì)不僅提高了計(jì)算效率,還增強(qiáng)了模型對(duì)特征的有效利用,使得模型在保持精度的同時(shí)具有更小的模型規(guī)模和更快的運(yùn)行速度。
1.4實(shí)驗(yàn)環(huán)境和參數(shù)配置
實(shí)驗(yàn)環(huán)境配置如表3所示。算法保持從頭開(kāi)始訓(xùn)練。在模型訓(xùn)練階段,初始學(xué)習(xí)率被設(shè)定為0.01,為了優(yōu)化學(xué)習(xí)過(guò)程,采用余弦退火策略逐步減小學(xué)習(xí)率的值。使用SGD優(yōu)化器。訓(xùn)練輪次(epoch)的數(shù)量和batch size分別設(shè)置為100和32。為了防止算法的訓(xùn)練過(guò)程受到由大學(xué)習(xí)率引起的過(guò)擬合的影響,使用預(yù)熱學(xué)習(xí)率,并且將預(yù)熱時(shí)期設(shè)置為3。在訓(xùn)練的最后10個(gè)epoch提前關(guān)閉Mosaic增強(qiáng),使識(shí)別器更好地適應(yīng)真實(shí)數(shù)據(jù)分布,從而促進(jìn)模型在真實(shí)場(chǎng)景下的最終收斂。
1.5評(píng)價(jià)指標(biāo)
為了在漿果園場(chǎng)景下對(duì)果蠅進(jìn)行有效識(shí)別,本研究采用一系列性能評(píng)價(jià)指標(biāo)全面評(píng)估所提改進(jìn)YOLOv8n算法的有效性與實(shí)用性,包括參數(shù)量(Parameters)、權(quán)重(Weights)、浮點(diǎn)運(yùn)算次數(shù)(FLOPs)、平均精確率均值(mAP)、精確率(Pre-cision)以及召回率(Recall),計(jì)算公式如下。
2結(jié)果與分析
2.1消融實(shí)驗(yàn)
為了驗(yàn)證本研究提出的改進(jìn)策略的有效性,深入分析各改進(jìn)模塊對(duì)模型最終性能的貢獻(xiàn)程度,在相同實(shí)驗(yàn)環(huán)境和參數(shù)配置下進(jìn)行了一系列的消融實(shí)驗(yàn)。根據(jù)改進(jìn)策略,共進(jìn)行8組實(shí)驗(yàn),如表4所示。其中,a組代表原始YOLOv8n算法;b、c、d組分別展示了3種改進(jìn)策略單獨(dú)應(yīng)用時(shí)的效果;e、f、g組分別呈現(xiàn)了任意兩種改進(jìn)策略組合使用的效果:h組即本研究提出的改進(jìn)算法,反映了3種改進(jìn)策略的綜合效果。由表5可以看出,a組精確率、召回率和mAP都在96%以上,表明原始YOLOv8n算法擁有良好性能,適合作為基線算法。b、c、d三組的方法都在不同程度上優(yōu)化了模型性能,其中b和c組通過(guò)顯著降低參數(shù)量、權(quán)重大小和FLOPs實(shí)現(xiàn)了更高的效率;而d組雖然增加了算法規(guī)模,但降低了FLOPs,模型的準(zhǔn)確率和召回率也都有所提高。值得注意的是,c組的mAP高達(dá)98.17%,同時(shí)參數(shù)量、權(quán)重、FLOPs相對(duì)于a組分別降低33.89%、31.94%、12.35%,表明用L-BiFPN結(jié)構(gòu)替換Neck部分的FPN+PAN結(jié)構(gòu)的策略更為高效。上述結(jié)果表明,本研究提出的改進(jìn)策略對(duì)于提升模型性能和計(jì)算效率都是有效的。
e、f、g三組的方法都提升了模型的精確率、召回率和mAP,并且降低了模型的參數(shù)量、權(quán)重大小和FLOPs。其中,e組的mAP高達(dá)98.28%,同時(shí)參數(shù)量、權(quán)重、FLOPs相對(duì)于a組分別降低49.83%、45.65%、28.40%,表明C2fGhostV2和L-BiFPN兩種改進(jìn)策略共同作用更高效。h組參數(shù)量、權(quán)重、FLOPs相比a組分別降低48.50%、43.98%、32.10%,mAP達(dá)到最高,精確率和召回率也均較高。表明三種改進(jìn)共同作用可以進(jìn)一步提高模型的效率和識(shí)別精度。總體而言,在果蠅識(shí)別任務(wù)中,無(wú)論是單獨(dú)應(yīng)用還是組合使用,本研究提出的改進(jìn)策略對(duì)原始YOLOv8n算法的輕量化和精度提升都做出了積極的貢獻(xiàn),可以在輕量化的同時(shí)實(shí)現(xiàn)漿果園果蠅的高效識(shí)別。
為了進(jìn)一步展示改進(jìn)YOLOv8n算法相對(duì)于原始YOLOv8n的優(yōu)越性,對(duì)訓(xùn)練過(guò)程中的總損失和mAP隨epoch變化的趨勢(shì)進(jìn)行了對(duì)比分析,結(jié)果如圖9所示。整體而言,兩種算法展現(xiàn)出相似的變化趨勢(shì),即總損失隨著epoch的增加而逐漸減少,而mAP則隨著訓(xùn)練的深入逐步提高。但改進(jìn)后的算法在整個(gè)訓(xùn)練過(guò)程中擁有更低的總損失值而mAP略有提升,這意味著本研究提出的模型在擬合訓(xùn)練數(shù)據(jù)方面具有更優(yōu)的表現(xiàn),在果蠅識(shí)別這一特定任務(wù)上的性能得到的一定程度的增強(qiáng),不僅能夠更有效地學(xué)習(xí)訓(xùn)練集中的數(shù)據(jù)特征,而且在目標(biāo)識(shí)別的準(zhǔn)確性方面也取得了較為明顯的改善。
2.2對(duì)比實(shí)驗(yàn)
為了驗(yàn)證改進(jìn)YOLOv8n算法在果蠅識(shí)別任務(wù)上的競(jìng)爭(zhēng)力和優(yōu)越性,并為算法的實(shí)際應(yīng)用提供指導(dǎo)和支持,本研究在一致的實(shí)驗(yàn)環(huán)境和參數(shù)設(shè)置條件下,將改進(jìn)YOLOv8n算法與其他優(yōu)秀的YOLO系列算法,包括YOLOv3-Tiny、YOLOv4-Tiny、YOLOv5n、YOLOv5s、YOLOv7-Tiny和YOLOv8n,進(jìn)行對(duì)比分析,由表6可見(jiàn),所有算法的mAP均在97%以上,性能良好,但是不同算法的整體性能存在明顯差異。其中,YOLOv4-Tiny雖然擁有最多的參數(shù)、最大的權(quán)重和最高的FLOPs,但精確率、召回率以及mAP卻最低,這表明其性能整體較差,主要是由于其復(fù)雜度高而精度不足。改進(jìn)后的YOLOv8n算法的參數(shù)量?jī)H為1.55 M,權(quán)重大小為3.35 MB,F(xiàn)LOPs為5.50G,遠(yuǎn)低于其他算法,這使它非常適合在資源受限的設(shè)備上執(zhí)行實(shí)時(shí)推理任務(wù);同時(shí),改進(jìn)YOLOv8n算法又能保持高水平的識(shí)別性能,精確率和召回率分別高達(dá)97.40%和96.60%,僅次于YOLOv5s和YOLOv7-Tiny,與其他算法相比仍然具有競(jìng)爭(zhēng)力,表明其在識(shí)別過(guò)程中能夠有效捕捉到所有果蠅。此外,改進(jìn)后的YOLOv8n算法的mAP值最高,達(dá)到98.32%,這對(duì)于最小化誤檢至關(guān)重要,進(jìn)一步鞏固了它作為漿果園果蠅識(shí)別任務(wù)的可靠解決方案的地位。
2.3識(shí)別結(jié)果可視化
在保持參數(shù)設(shè)置和環(huán)境配置一致的條件下,本研究比較了原始YOLOv8n算法和改進(jìn)YOLOv8n算法在本研究建立的同一測(cè)試集上的識(shí)別效果,并進(jìn)行了可視化展示,如圖10所示,其中,第一行圖像為原始YOLOv8n算法的識(shí)別結(jié)果,第二行是改進(jìn)YOLOv8n算法的識(shí)別結(jié)果??梢钥吹?,在第二列和第三列圖像中,原始算法錯(cuò)誤地將黑腹果蠅標(biāo)記為殘翅果蠅(紅圈標(biāo)出),而改進(jìn)算法在這些區(qū)域正確地執(zhí)行了識(shí)別任務(wù),識(shí)別準(zhǔn)確性高:進(jìn)一步觀察第四列圖像,兩只距離非常近的黑腹果蠅和殘翅果蠅(黃圈標(biāo)出),原始算法未能成功識(shí)別出殘翅果蠅,而改進(jìn)后的算法能夠準(zhǔn)確識(shí)別出兩者,證明了本研究提出算法在降低漏識(shí)別率方面的有效性。值得注意的是,盡管兩行圖像相同位置的果蠅識(shí)別置信度相近,但從整體上來(lái)看,第二行的置信度普遍高于第一行,這進(jìn)一步證明了改進(jìn)YOLOv8n算法相較于原始YOLOv8n算法的優(yōu)越性。
3討論與結(jié)論
本研究在YOLOv8n算法的基礎(chǔ)上進(jìn)行一系列改進(jìn),以提高對(duì)微小目標(biāo)的識(shí)別精度并實(shí)現(xiàn)算法的輕量化,最終設(shè)計(jì)出一種適用于移動(dòng)端的輕量級(jí)識(shí)別算法,用于識(shí)別誘蟲(chóng)板上的黑腹果蠅和殘翅果蠅。實(shí)驗(yàn)結(jié)果表明,各項(xiàng)改進(jìn)策略無(wú)論單獨(dú)作用還是共同作用都是有效的,為算法的性能提升提供了實(shí)證依據(jù)。此外,改進(jìn)算法在原算法的基礎(chǔ)上實(shí)現(xiàn)了模型效率與識(shí)別精度的協(xié)同優(yōu)化,綜合性能相對(duì)于YOLO系列的其他優(yōu)秀算法也具有一定競(jìng)爭(zhēng)力??梢暬Y(jié)果表明,本研究提出的改進(jìn)算法改善了果蠅錯(cuò)誤識(shí)別和遺漏的問(wèn)題,具有明顯的置信度優(yōu)勢(shì),而且所需的硬件資源較少,屬于硬件友好型算法,這為其實(shí)際應(yīng)用創(chuàng)造了條件。
綜上所述,本研究提出的改進(jìn)YOLOv8n算法在性能和算法復(fù)雜度之間取得了良好的平衡,實(shí)現(xiàn)了對(duì)漿果園果蠅的精準(zhǔn)識(shí)別,符合農(nóng)業(yè)場(chǎng)景下果蠅識(shí)別任務(wù)對(duì)識(shí)別精度和輕量化的需求。未來(lái)的研究工作將根據(jù)實(shí)驗(yàn)需求和場(chǎng)景需求增加蟲(chóng)害類(lèi)別,以進(jìn)一步提高算法的魯棒性和泛化能力,并探索將該算法應(yīng)用于其他領(lǐng)域的可行性。