摘要:葡萄簇目標的精準檢測是實現(xiàn)估產(chǎn)、采摘等作業(yè)的前提,現(xiàn)有方法難以實現(xiàn)多品種葡萄簇的輕量化精準檢測。為提高復(fù)雜自然場景下多品種葡萄簇檢測準確性、魯棒性與泛化性,提出一種基于改進YOLOv8n模型的多品種葡萄簇檢測模型ESIC-YOLOv8n,該模型在YOLOv8n的Backbone和Neck網(wǎng)絡(luò)中分別添加EMA和SA注意力模塊,以加強網(wǎng)絡(luò)的特征提取和多尺度特征融合能力,降低因遮擋或重疊對葡萄簇檢測的干擾,提高檢測精度和召回率;在Head把CIoU替換成Inner-CIoU,利用輔助框提高重疊目標檢測的準確性,從而提升模型整體的檢測準確性和泛化性。ESIC-YOLOv8n模型的檢測精度為87.00%,召回率為81.60%,mAP為88.90%,F(xiàn)1值為84.21%,較原YOLOv8n模型分別提高1.05%、2.90%、1.48%和2.00%。結(jié)果表明,ESIC-YOLOv8n模型具有準確率高、泛化性好、輕量化等優(yōu)點,可為葡萄產(chǎn)量估計、采摘等研究提供技術(shù)支持。
關(guān)鍵詞:葡萄簇檢測;目標檢測;YOLOv8n;注意力機制
中圖分類號:TP391.41; S225" " " 文獻標識碼:A" " " 文章編號:2095?5553 (2024) 09?0220?07
Detection method of multi variety grape cluster based on improved YOLOv8n
deep learning algorithm
Zhang Chuandong, Qi Lu, Ding Huali
(School of Mathematics and Computer Application Technology, Jining University, Qufu, 273100, China)
Abstract: The precise detection of grape clusters is a prerequisite for achieving yield estimation, picking and other operations, but existing methods are still difficult to achieve lightweight and accurate detection of multi?variety grape clusters. To enhance the accuracy, robustness, and generalization of multi?variety grape cluster detection in complex natural scenes, a model named ESIC-YOLOv8n is proposed based on the improved YOLOv8n model. In this model, EMA and SA attention modules are respectively added to the Backbone and Neck networks of YOLOv8n to strengthen the network's feature extraction and multi?scale feature fusion capabilities, meanwhile, to reduce the interference from occlusion or overlap in grape cluster detection and to improve the detection accuracy and recall. In addition, by replacing CIoU with Inner CIoU in the head and using auxiliary boxes to improve the accuracy of overlapping object detection, the overall detection accuracy and generalization of the model was enhanced. As a result, the ESIC-YOLOv8n model achieves a detection accuracy of 87.00%, a recall rate of 81.60%, mAP of 88.90%, and F1 score of 84.21%, representing improvements of 1.05%, 2.90%, 1.48% and 2.00%, respectively, compared to the original YOLOv8n model. The results indicate that the ESIC-YOLOv8n model possesses high accuracy, good generalization, and lightweight characteristics, providing technical support for research on grape yield estimation and harvesting.
Keywords: grape cluster detection; object detection; YOLOv8n; attention mechanism
0 引言
葡萄產(chǎn)量估計是規(guī)?;咸逊N植企業(yè)科學(xué)管理和調(diào)度的關(guān)鍵[1],傳統(tǒng)依靠經(jīng)驗的估產(chǎn)方法準確率較低,無法作為規(guī)模化葡萄種植企業(yè)科學(xué)管理的依據(jù)。目前,智能化估產(chǎn)技術(shù)代替?zhèn)鹘y(tǒng)的經(jīng)驗估產(chǎn)是當前種植企業(yè)科學(xué)管理的趨勢,實現(xiàn)葡萄簇的智能檢測是準確估產(chǎn)的關(guān)鍵,對于提高估產(chǎn)效率和準確率具有重要意義。
近年來,由于深度學(xué)習具有特征提取能力強,泛化性好等特點,已被廣泛應(yīng)用于葡萄簇目標識別研究領(lǐng)域。Aguiar等[2]在預(yù)先訓(xùn)練的SSD MobileNet-V1模型上進行微調(diào),對圖像中不同生長階段的葡萄簇進行目標檢測,其mAP值為66.96%。Ghiani等[3]提出了一種基于Mask R-CNN框架的葡萄簇檢測方法,其mAP值為91.00%。Li等[4]提出了一種高效的葡萄檢測模型YOLO grape,結(jié)果表明,YOLO grape的F1得分為90.47%,mAP為91.08%,檢測速度為81 fps,解決了由于復(fù)雜的生長環(huán)境、樹枝和樹葉的陰影以及葡萄的重疊而導(dǎo)致的無法識別或識別精度下降的問題。Wang等[5]用SwinGD對紅、綠葡萄簇進行檢測,獲得了紅葡萄簇94%的mAP值,綠葡萄簇mAP值較低。Wei等[6]為了提高青葡萄簇的檢測精度,提出了一種基于改進YOLOv3的成熟期葡萄檢測模型S-MGDM,AP值為96.73%和F1值為91.00%。李國進等[7]為提高田間葡萄圖像中小目標葡萄檢測的速度和精度,提出了一種基于輕量級網(wǎng)絡(luò)的釀酒葡萄檢測模型WGDM,在公開的釀酒葡萄圖像數(shù)據(jù)集WGISD測試集上的平均精度為81.20%,F(xiàn)1分數(shù)為85.63%。Lu等[8]提出了Swin-T-YOLOv5模型用于葡萄簇檢測,精度為97.90%,召回率為94.70%,mAP為97.40%,F(xiàn)1得分為96.0%,但未成熟青色葡萄的檢測結(jié)果低于成熟葡萄的檢測結(jié)果,其mAP為90.31%,F(xiàn)1得分為82.00%。Zhao等[9]為減少葡萄簇檢測模型的參數(shù),提出了一種輕量級端到端模型YOLO-GP,mAP為93.27%,參數(shù)數(shù)量減少了10.00%以上。為了解決密集葡萄果實因為遮擋導(dǎo)致難以識別的問題,Liu等[10]提出了一種葡萄檢測模型YOLOX-RA,mAP值為88.75%,檢測速度為84.88 fps,模型大小為17.53 MB。上述葡萄簇目標檢測研究已經(jīng)取得較好的成果,但其準確性與泛化性尚需提高。
葡萄簇由小目標漿果聚集組成,多個品種的葡萄簇之間在形狀、顏色、大小和致密度等方面有巨大差異[11],其生長密集,復(fù)雜場景下容易受到遮擋、重疊、與背景顏色一致等因素的影響,葡萄簇準確檢測相對蘋果[12]、平菇[13]等農(nóng)作物果實檢測更具有挑戰(zhàn)性。為了提高葡萄簇檢測網(wǎng)絡(luò)的精度,則不斷增加網(wǎng)絡(luò)深度和寬度,這不利于網(wǎng)絡(luò)模型在移動終端的部署。宋懷波等[14]提出了一種基于YOLOv4-SENL模型的蘋果幼果目標檢測方法,在網(wǎng)絡(luò)模型中引入注意力機制,在不明顯加深網(wǎng)絡(luò)結(jié)構(gòu)的前提下加強網(wǎng)絡(luò)性能,為本研究提供了思路。針對多品種葡萄簇檢測準確性和泛化性不高的問題,本研究改進YOLOv8n模型,在YOLOv8n的Backbone和Neck中分別添加Efficient Multi?Scale Attention (EMA)和Shuffle Attention (SA)注意力模塊,以加強網(wǎng)絡(luò)的特征提取和多尺度特征融合能力,把CIoU替換成Inner-CIoU,利用輔助框提高重疊目標檢測的準確性,從而提升模型整體的檢測準確性和泛化性。
1 試驗數(shù)據(jù)
1.1 WGISD數(shù)據(jù)集
本研究采用的數(shù)據(jù)集來源于Santos等[11]公開的釀酒葡萄實例分割數(shù)據(jù)集WGISD(Wine Grape Instance Segmentation Dataset),包含300幅采集自巴西圣保羅的瓜斯帕里酒莊的葡萄園的葡萄簇圖像,分別采用佳能EOS REBEL T3i數(shù)碼單反相機和摩托羅拉Z2 Play智能手機拍攝,攝像機位于葡萄藤線之間,面向葡萄藤,距離約1~2 m。REBEL相機拍攝240幅圖像,包括所有西拉照片,Z2 Play智能手機拍攝60幅圖像。將REBEL圖像縮放到2 048像素×1 365像素,將Z2 Play所拍攝圖像縮放到2 048像素×1 536像素,使用LabelImg工具進行標注,形成包含4 432個矩形邊界框的標注文件。
WGISD數(shù)據(jù)集有霞多麗、品麗珠、赤霞珠、長相思和西拉5個在形狀、顏色和緊湊度等方面有明顯差異的葡萄品種,有利于檢測模型的泛化性研究,部分圖像如圖1所示。WGISD數(shù)據(jù)集信息如表1所示。
1.2 本地數(shù)據(jù)集
本地葡萄數(shù)據(jù)集圖像包含50幅巨峰葡萄圖像,采集自中國山東省曲阜市的一個葡萄果園,采用OPPO (Find X2 Pro)智能相機采集,分辨率為3 840像素×2 160像素,采集時間為2022年9月17日,天氣晴朗,用以驗證所提網(wǎng)絡(luò)的泛化性。
2 研究方法
2.1 YOLOv8n網(wǎng)絡(luò)
YOLOv8網(wǎng)絡(luò)是一種快速的單階段目標檢測方法,在YOLOv5的基礎(chǔ)上引入并改進了其他YOLO版本的SOTA 技術(shù)而成,進一步提高了性能和靈活性,其結(jié)構(gòu)與YOLOv5相似,包括主干(Backbone)、頸部(Neck)和檢測頭(Head)三個主要部分。Backbone網(wǎng)絡(luò)和Neck網(wǎng)絡(luò)構(gòu)成了YOLOv8的中心結(jié)構(gòu),Backbone網(wǎng)絡(luò)進行特征提取,Neck網(wǎng)絡(luò)進行特征融合,Head進行結(jié)果預(yù)測,被廣泛用于目標檢測、實例分割、圖像分類等計算機視覺任務(wù)當中。YOLOv8有5個模型,其中YOLOv8n網(wǎng)絡(luò)深度和特征圖較小,體積更小,檢測速度更快,可在保證檢測精度的同時達到更快的檢測速度,因此,本研究優(yōu)選使用YOLOv8n開展研究并對其進行改進。
2.2 改進YOLOv8n網(wǎng)絡(luò)
葡萄簇漿果微小,生長環(huán)境復(fù)雜,葡萄簇檢測容易受到遮擋、重疊和近背景色等因素的干擾,為提高Backbone網(wǎng)絡(luò)和Neck網(wǎng)絡(luò)的特征提取和融合能力,本研究提出ESIC-YOLOv8n模型,其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
在YOLOv8n模型的Backbone網(wǎng)絡(luò)和Neck網(wǎng)絡(luò)分別添加EMA和SA注意力模型,通過通道空間并行的結(jié)構(gòu),使模型更加聚焦于不同維度的特征,從而獲取更豐富更全面的葡萄簇有效特征,增強網(wǎng)絡(luò)特征提取和多尺度特征融合能力,從而提高模型檢測的準確性。在Head部分使用Inner-CIoU代替原網(wǎng)絡(luò)的CIoU作為損失函數(shù),使網(wǎng)絡(luò)關(guān)注邊界框的核心部分,利用輔助框的尺度調(diào)整提高目標檢測任務(wù)的精確度和效率。
2.2.1 EMA注意力機制
EMA注意力[15]是一種使用分組結(jié)構(gòu)無需降維的高效多尺度注意力機制,為了保留每個通道的信息并減少計算開銷,EMA注意力設(shè)計了一個用于建立短期和長期依賴關(guān)系的多尺度并行子網(wǎng)絡(luò),將通道維度分組為多個子特征,在沒有通道降維的情況下在每個并行子網(wǎng)絡(luò)中建立局部跨通道交互,通過跨空間學(xué)習方法融合兩個并行子網(wǎng)絡(luò)的輸出特征圖,以學(xué)習不同的語義,實現(xiàn)更豐富的特征聚合。EMA注意力機制結(jié)構(gòu)如圖3所示。
EMA注意力使用并行子結(jié)構(gòu),可在多個處理器之間有效地并行化處理,提高了特征提取的效率,同時保持了小深度和低延遲。對于任何給定的輸入特征圖[X∈RC×H×W],EMA在通道維度方向上將X劃分為G個子特征[X=X0,X1,…,XG-1],[X∈RC//G×H×W],取[G?C],使用學(xué)習的注意力權(quán)重用于增強每個子特征中的感興趣區(qū)域的特征表示。由圖3可知,EMA注意力機制用3條并行路線來提取分組特征圖的注意力權(quán)重,其中兩條并行路由位于1×1分支中,第三條路由位于3×3分支中。在1×1分支中,有兩個1D全局平均池化操作分別沿著兩個空間方向?qū)π诺肋M行編碼,在3×3分支中僅堆疊單個3×3內(nèi)核用于捕獲多尺度特征表示,通過跨空間信息聚合方法把三條路線的輸出特征計算為兩個空間注意力權(quán)重值的總和,由 Sigmoid激活函數(shù)突出顯示所有像素的全局上下文像素,最終的輸出與輸入特征圖[X∈RC//G×H×W]的維度大小相同。
EMA注意力機制對長程依賴關(guān)系進行建模,在信道中保存精確的空間結(jié)構(gòu)信息,實現(xiàn)了不同的跨通道交互特征,擴大了特征空間,加快了響應(yīng)速度,適合葡萄漿果這種小目標識別,把EMA注意力放在YOLOv8網(wǎng)絡(luò)Backbone結(jié)構(gòu)中,有利于提升網(wǎng)絡(luò)對葡萄簇目標的特征提取能力。
2.2.2 SA注意力機制
SA注意力機制和EMA注意力機制一樣,都是使用并行子結(jié)構(gòu)融合空間和通道特征信息的多尺度注意力機制,把SA注意力機制放入YOLOv8n的Neck結(jié)構(gòu)中,可以增強網(wǎng)絡(luò)多尺度特征融合能力,提升檢測目標的特征信息表示,提高檢測網(wǎng)絡(luò)的精度。
2.2.3 Inner-IoU
Inner-IoU是一種基于輔助邊框的邊框回歸損失,使用尺度因子ratio控制生成不同尺度的輔助邊框用于計算損失,在模型訓(xùn)練過程中,使用較小尺度的輔助邊框計算IoU損失將有助于高IoU樣本回歸,達到加速收斂的效果。使用較大尺度的輔助邊框計算IoU損失能夠加速低IoU樣本回歸過程。與傳統(tǒng)的IoU計算方法不同,Inner-IoU專注于邊界框內(nèi)部的重疊部分,改進目標檢測中邊界框回歸的準確性,特別是在處理高度重疊的目標時。將Inner-IoU應(yīng)用至現(xiàn)有基于IoU的邊框回歸損失函數(shù)中達到SOTA,如Inner-CIoU、Inner-DIoU、Inner-EIoU等。本研究使用Inner-CIoU作為損失函數(shù),能夠提高被遮擋或重疊葡萄簇目標等檢測的準確性和效率。Inner-CIoU計算如式(5)所示。
3 試驗與分析
3.1 試驗平臺
試驗使用的機器配置是AMD Ryzen 7-5800H CPU,32 GB RAM,8 GB Nvidia GeForce RTX 3070 GPU。在Win10操作系統(tǒng)下搭建PyTorch深度學(xué)習框架,Cuda 11.6,PyTorch 1.12.0,采用Python 3.8編程。
3.2 評價指標
3.3 模型訓(xùn)練
訓(xùn)練過程中,設(shè)置圖像輸入尺寸為640像素×640像素,批量大小設(shè)置為2,使用隨機梯度下降(Stochastic Gradient Descend,SGD)作為優(yōu)化器,初始學(xué)習率設(shè)置為0.01,動量設(shè)置為0.937,權(quán)重衰退系數(shù)設(shè)為0.000 5,IoU閾值IoU-thres為0.5,置信度閾值Conf-thres為0.001,訓(xùn)練輪數(shù)設(shè)置為300 輪,Inner-CIoU尺度因子ratio設(shè)置為0.75。
改進的ESIC-YOLOv8n模型訓(xùn)練損失圖5所示,損失值在訓(xùn)練前70個Epoch中迅速下降,訓(xùn)練曲線收斂速度較快,在這期間,精度迅速提高,表明模型學(xué)習效率較高。在經(jīng)歷300個Epoch之后,損失值不再減小,精度也不再上升,表示模型達到收斂狀態(tài)。
4 結(jié)果與分析
4.1 檢測模型結(jié)果對比
為了驗證所提方法對葡萄簇檢測的有效性,將改進的ESIC-YOLOv8n模型與YOLOv8n原模型在相同條件進行試驗對比,試驗結(jié)果如表2所示。相對于YOLOv8n模型,ESIC-YOLOv8n模型在P、R、mAP和F1值等指標方面均有明顯提升,分別提升1.05%、2.90%、1.48%和2.00%,模型權(quán)重僅增加0.91 MB。用改進前后的YOLOv8n網(wǎng)絡(luò)對測試集中的5個葡萄品種圖像進行檢測,檢測效果如圖6所示。由圖6可知,當葡萄簇存在被枝干、葉片遮擋或重疊情況時,ESIC-YOLOv8n模型的檢測效果明顯高于YOLOv8n模型,圖6(a)~圖6(e)中YOLOv8n網(wǎng)絡(luò)均有多處誤檢(圖中紅色箭頭處)和漏檢(圖中紫色箭頭處)情況,ESIC-YOLOv8n模型則能正確檢測出上述葡萄簇目標。綜上所述,本研究提出的方法在葡萄簇目標檢測時具有更高的檢測置信度,能減少遮擋或重疊造成的誤檢和漏檢情況,提高葡萄簇目標的檢測性能。
4.2 消融試驗
本研究在YOLOv8n模型的基礎(chǔ)上,分別在Backbone和Neck結(jié)構(gòu)中添加EMA和SA注意力模塊,提高網(wǎng)絡(luò)的特征提取能力和多尺度特征融合能力,加強模型對被遮擋葡萄簇和重疊葡萄簇的特征信息表示;在預(yù)測層使用Inner-CIoU作為損失函數(shù),以加速收斂的效果,提高網(wǎng)絡(luò)的準確性、魯棒性和泛化性。為驗證各種改進的有效性,依次對ESIC-YOLOv8n網(wǎng)絡(luò)進行縮減,分別在測試集上進行消融試驗,表3為消融試驗結(jié)果。
從表3可知,在YOLOv8n模型中單獨添加SA注意力模塊或改變損失函數(shù)后雖然精度有所下降,但R值和F1值都有所提高。同時把EMA和SA注意力分別添加在YOLOv8n模型的Backbone和Neck結(jié)構(gòu)中時,P、R、mAP和F1值分別提升2.56%、1.01%、1.14%和1.74%。在此基礎(chǔ)上修改損失函數(shù)為Inner-CIoU時,R、mAP和F1值又分別增加1.87%、0.34%和0.25%,精度略有降低。相對于YOLOv8n模型,ESIC-YOLOv8n模型在P、R、mAP和F1值等指標方面分別提升1.05%、2.90%、1.48%和2.00%??梢姡狙芯克岬姆椒梢杂行p少誤檢和漏檢情況,提高網(wǎng)絡(luò)的魯棒性。
4.3 不同檢測模型性能對比
為進一步分析驗證本研究所提方法的有效性,將其與YOLOv5s、YOLOv6n、YOLOv7-tiny和WGDM進行了對比,不同檢測模型性能對比如表4所示,檢測效果對比如圖7所示。
由表4可知,ESIC-YOLOv8n模型的精度僅低于YOLOv5s模型1.81%,F(xiàn)1值僅低于WGDM模型1.66%,但模型權(quán)重(Weights)比YOLOv5s和WGDM模型小50.63%和83.84%,可見,ESIC-YOLOv8n模型具有明顯的輕量化優(yōu)勢,易于在移動端設(shè)備進行部署。與YOLOv6n模型相比,ESIC-YOLOv8n模型的P、R、mAP和F1值分別提升4.19%、5.70%、3.13%和5.00%,YOLOv7-tiny模型相比,ESIC-YOLOv8n模型的P、mAP和F1值分別提升2.72%、1.95%和0.50%,R降低了3.80%。對比結(jié)果表明,ESIC-YOLOv8n模型在滿足輕量化的同時綜合表現(xiàn)最好,可以實現(xiàn)葡萄簇目標的快速準確識別。
4.4 泛化性試驗
為了驗證ESIC-YOLOv8n網(wǎng)絡(luò)的泛化性,采用本地葡萄圖像數(shù)據(jù)集進行泛化性試驗。其P、R、mAP和F1值等指標值分別為79.70%、71.60%、75.80%和75.43%,檢測效果如圖8所示。
與公共數(shù)據(jù)集WGISD上檢測結(jié)果相比,ESIC-YOLOv8n網(wǎng)絡(luò)在本地數(shù)據(jù)集上的檢測結(jié)果略低,主要原因在于巨峰葡萄與霞多麗、品麗珠、赤霞珠、長相思和西拉等5個葡萄品種在形狀、顏色、紋理和緊湊度等方面有明顯差異;數(shù)據(jù)集圖像在拍攝角度、拍攝距離、拍攝設(shè)備、成像大小、分辨率及拍攝光線等多方面有明顯差異[17]。這些品種、場景、成像技術(shù)間的差異化對檢測結(jié)果具有較大影響。綜上,雖然ESIC-YOLOv8n網(wǎng)絡(luò)在沒有訓(xùn)練過的本地數(shù)據(jù)集上的檢測精度比公共數(shù)據(jù)集WGISD略低,但反映了網(wǎng)絡(luò)在更為復(fù)雜環(huán)境、差異化品種識別中的引用潛力。
5 結(jié)論
為提高復(fù)雜場景下多品種葡萄簇檢測的準確性、魯棒性和泛化性,本研究提出ESIC-YOLOv8n模型,并在包含5個葡萄品種的WGISD數(shù)據(jù)集上進行訓(xùn)練和測試,取得較好的檢測效果,提高被遮擋或重疊葡萄簇目標的檢測精度。
1) 在原YOLOv8n 模型Backbone和Neck結(jié)構(gòu)中分別添加EMA和SA注意力模塊,通過通道空間并行的結(jié)構(gòu),提取更全面的有效特征,提高網(wǎng)絡(luò)在復(fù)雜場景下的特征提取能力和多尺度特征融合能力,有效地解決遮擋和重疊對葡萄簇檢測的干擾。
2) 在檢測頭層使用Inner-CIoU 代替原網(wǎng)絡(luò)的CIoU作為損失函數(shù),使網(wǎng)絡(luò)關(guān)注邊界框的核心部分而非整體,實現(xiàn)對重疊區(qū)域更加精確的評估,加速收斂的效果,提高網(wǎng)絡(luò)的準確性和泛化性。
3) 本研究葡萄簇檢測的P值為87.00%,R值為81.60%,mAP值為88.90%,F(xiàn)1值為84.21%,相對原YOLOv8n模型,分別提高1.05%、2.90%、1.48%和2.00%,模型權(quán)重僅增加0.91 MB,各項性能指標明顯優(yōu)于原始YOLOv8n網(wǎng)絡(luò)。本研究所提模型的優(yōu)勢主要體現(xiàn)在減少因遮擋或重疊造成的誤報和漏報情況,提升葡萄簇的檢測精度。綜上,ESIC-YOLOv8n模型是一個準確率高、魯棒性、泛化性好的輕量化多品種葡萄簇檢測模型,具有較好的實用價值。
參 考 文 獻
[ 1 ] Torres?Sánchez J, Mesas?Carrascosa F J, Santesteban L G, et al. Grape cluster detection using UAV photogrammetric point clouds as a low?cost tool for yield forecasting in vineyards [J]. Sensors, 2021, 21(9): 3083.
[ 2 ] Aguiar A S, Magalh?es S A, Dos Santos F N, et al. Grape bunch detection at different growth stages using deep learning quantized models [J]. Agronomy, 2021, 11(9): 1890.
[ 3 ] Ghiani L, Sassu A, Palumbo F, et al. In?Field automatic detection of grape bunches under a totally uncontrolled environment [J]. Sensors, 2021, 21(11): 3908.
[ 4 ] Li H, Li C, Li G, et al. A real?time table grape detection method based on improved YOLOv4-tiny network in complex background [J]. Biosystems Engineering, 2021, 212: 347-359.
[ 5 ] Wang J, Zhang Z, Luo L, et al. SwinGD: A robust grape bunch detection model based on Swin Transformer in complex vineyard environment[J]. Horticulturae, 2021, 7(11): 492.
[ 6 ] Wei X, Xie F, Wang K, et al. A study on Shine?Muscat grape detection at maturity based on deep learning[J]. Scientific Reports, 2023, 13(1): 4587.
[ 7 ] 李國進, 黃曉潔, 李修華, 等. 采用輕量級網(wǎng)絡(luò) MobileNetV2 的釀酒葡萄檢測模型[J]. 農(nóng)業(yè)工程學(xué)報, 2021, 37(17): 168-176.
Li Guojin, Huang Xiaojie, Li Xiuhua, et al. Detection model for wine grapes using MobileNetV2 lightweight network [J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(17): 168-176.
[ 8 ] Lu S, Liu X, He Z, et al. Swin?Transformer?YOLOv5 for real?time wine grape bunch detection [J]. Remote Sensing, 2022, 14(22): 5853.
[ 9 ] Zhao R, Zhu Y, Li Y. An end?to?end lightweight model for grape and picking point simultaneous detection [J]. Biosystems Engineering, 2022, 223(Part A): 174-188.
[10] Liu B, Zhang Y, Wang J, et al. An improved lightweight network based on deep learning for grape recognition in unstructured environments [J]. Information Processing in Agriculture, 2024, 11(2): 202-216.
[11] Santos T T, De Souza L L, Dos Santos A A, et al. Grape detection, segmentation, and tracking using deep neural networks and three?dimensional association [J]. Computers and Electronics in Agriculture, 2020, 170: 105247.
[12] 龍燕, 楊智優(yōu), 何夢菲. 基于改進 YOLOv7的疏果期蘋果目標檢測方法[J]. 農(nóng)業(yè)工程學(xué)報, 2023, 39(14): 191-199.
Long Yan, Yang Zhiyou, He Mengfei. Recognizing apple targets before thinning using improved YOLOv7 [J]. Transactions of the Chinese Society of Agricultural Engineering, 2023, 39(14): 191-199.
[13] 王磊磊, 王斌, 李東曉, 等. 基于改進 YOLOv5 的菇房平菇目標檢測與分類研究[J]. 農(nóng)業(yè)工程學(xué)報, 2023, 39(17): 163-171.
Wang Leilei, Wang Bin, Li Dongxiao, et al. Object detection and classification of pleurotus ostreatus using improved YOLOv5 [J]. Transactions of the Chinese Society of Agricultural Engineering, 2023, 39(17): 163-171.
[14] 宋懷波, 江梅, 王云飛, 等. 融合卷積神經(jīng)網(wǎng)絡(luò)與視覺注意機制的蘋果幼果高效檢測方法[J]. 農(nóng)業(yè)工程學(xué)報, 2021, 37(9): 297-303.
Song Huaibo, Jiang Mei, Wang Yunfei, et al. Efficient detection method for young apples based on the fusion of convolutional neural network and visual attention mechanism [J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(9): 297-303.
[15] Ouyang D, He S, Zhang G, et al. Efficient multi?scale attention module with cross?spatial learning [C]. 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, 2023: 1-5.
[16] Zhang Q, Yang Y. SA?Net: Shuffle attention for deep convolutional neural networks [C]. 2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, 2021: 2235-2239.
[17] Zhang C, Ding H, Shi Q, et al. Grape cluster real?time detection in complex natural scenes based on YOLOv5s deep learning network [J]. Agriculture, 2022, 12 (8): 1242.