王娜 陳勇 崔艷榮 胡蓉華
摘要:針對(duì)現(xiàn)有番茄葉片病害識(shí)別存在背景復(fù)雜、識(shí)別準(zhǔn)確率低、模型參數(shù)量大、計(jì)算量大以及難以部署至移動(dòng)設(shè)備或嵌入式設(shè)備等問(wèn)題,提出一種改進(jìn)的輕量化YOLO v5n的番茄葉片病害識(shí)別方法。首先收集細(xì)菌性斑疹病、早疫病、晚疫病、葉霉病、斑枯病、褐斑病等6種常見(jiàn)番茄葉片病害圖像以及番茄健康葉片圖像,對(duì)圖像進(jìn)行鏡像翻轉(zhuǎn)、高斯模糊等數(shù)據(jù)增強(qiáng)方式增加樣本多樣性,提升模型識(shí)別和泛化能力。接著在YOLO v5n網(wǎng)絡(luò)基礎(chǔ)上,選擇采用輕量化的C3Ghost模塊替換C3模塊以壓縮卷積過(guò)程中的計(jì)算量、模型權(quán)重和大小,同時(shí)在頸部網(wǎng)絡(luò)中融合輕量級(jí)卷積技術(shù)GSConv和VOV-GSCSP模塊,在增強(qiáng)特征提取能力的同時(shí)降低模型參數(shù)量。最后引入PAGCP算法對(duì)改進(jìn)后的模型進(jìn)行全局通道剪枝壓縮參數(shù)量并減少訓(xùn)練開(kāi)銷(xiāo)。試驗(yàn)結(jié)果表明,改進(jìn)后的YOLO v5n平均精度均值達(dá)到99.0%,參數(shù)量減少66.67%,計(jì)算量降低了2.6 G,模型權(quán)重壓縮了2.23 MB。本研究提出的番茄葉片病害識(shí)別方法在降低了模型大小、參數(shù)量、計(jì)算量的同時(shí)仍保持較高的識(shí)別精度,為移動(dòng)設(shè)備上實(shí)現(xiàn)番茄葉片病害識(shí)別提供技術(shù)參考。
關(guān)鍵詞:YOLO v5n;番茄病害識(shí)別;輕量化;C3Ghost;GSConv;VOV-GSCSP;PAGCP
中圖分類(lèi)號(hào):S436.412;TP391.41? 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1002-1302(2024)08-0192-08
收稿日期:2023-10-24
基金項(xiàng)目:國(guó)家自然科學(xué)基金面上項(xiàng)目(編號(hào):62077018)。
作者簡(jiǎn)介:王 娜(2000—),女,河北張家口人,碩士研究生,從事機(jī)器學(xué)習(xí)與人工智能研究。E-mail:2022710629@yangtzeu.edu.cn。
通信作者:陳 勇,碩士生導(dǎo)師,高級(jí)工程師,從事WEB信息處理、人工智能應(yīng)用研究。E-mail:285527563@qq.com。
番茄原產(chǎn)于南美洲的安第斯山地帶,是世界上價(jià)值最高的蔬果兼用作物[1]。目前,番茄的栽培面積不斷擴(kuò)大,已經(jīng)成為全球蔬菜生產(chǎn)中年產(chǎn)量最高的作物,食用量居蔬菜之首[2]。番茄作為我國(guó)非常重要的經(jīng)濟(jì)作物,其生產(chǎn)已成為農(nóng)民增收的主導(dǎo)產(chǎn)業(yè),對(duì)實(shí)現(xiàn)農(nóng)業(yè)增效作出了突出貢獻(xiàn)[3]。然而,番茄病害現(xiàn)在是影響番茄產(chǎn)量和品質(zhì)的主要因素,在各個(gè)地區(qū)都有不同程度的發(fā)生,其種類(lèi)繁多且復(fù)雜,包括細(xì)菌性斑疹病、早疫病、晚疫病、葉霉病、斑枯病、褐斑病、花葉病、黃化曲葉病、白粉病等。若能快速準(zhǔn)確地識(shí)別番茄病害,及時(shí)防治,便能減少經(jīng)濟(jì)損失保證番茄產(chǎn)業(yè)可持續(xù)健康發(fā)展。因此,對(duì)番茄病害的研究和防治就顯得十分重要。
傳統(tǒng)的番茄葉片病害檢測(cè)和診斷方法主要依賴(lài)于人工觀(guān)測(cè)和經(jīng)驗(yàn)判斷,由于葉片病害數(shù)量多且難以區(qū)分,基于人工的識(shí)別方法存在成本高、主觀(guān)性強(qiáng)、準(zhǔn)確率低等問(wèn)題[4]。隨著機(jī)器學(xué)習(xí)的快速發(fā)展壯大,機(jī)器學(xué)習(xí)不斷應(yīng)用于農(nóng)作物采摘、病害識(shí)別等方面。根據(jù)不同的網(wǎng)絡(luò)結(jié)構(gòu),孟莉莎等在EfficientNet v2模型上引入CA注意力機(jī)制,在基于Imagenet數(shù)據(jù)集的遷移學(xué)習(xí)中初始化基礎(chǔ)模型并修改全連接層,去除網(wǎng)絡(luò)中重復(fù)的模塊,在蘑菇數(shù)據(jù)集上的分類(lèi)準(zhǔn)確率達(dá)96.8%[5]。嚴(yán)陳慧子等在YOLO v4模型上采用MobileNet v3網(wǎng)絡(luò)替換原始主干網(wǎng)絡(luò)CSPDarknet-53,并在頸部網(wǎng)絡(luò)添加坐標(biāo)注意力模塊(CAM),在水稻葉片病害檢測(cè)上平均精度提升1.32百分點(diǎn),模型總參數(shù)量為39.35 M[6]。武魁等在EfficientNet v2模型上采用DeepViT算法修改網(wǎng)絡(luò)通道,并引入特征融合網(wǎng)絡(luò)提高模型的分類(lèi)精度,在玉米病蟲(chóng)害數(shù)據(jù)集上平均識(shí)別精度達(dá)到97.72%[7]。針對(duì)番茄葉片病害識(shí)別問(wèn)題,張寧等在Inception v3模型上結(jié)合卷積注意力機(jī)制模塊(CBAM)和多尺度卷積,并引入遷移學(xué)習(xí),在番茄葉片病害識(shí)別中的準(zhǔn)確率達(dá)到98.4%[8]。方晨晨等通過(guò)使用多尺度卷積來(lái)代替單一尺度的卷積,同時(shí),他們還采用深度可分離卷積來(lái)替換部分標(biāo)準(zhǔn)卷積,以降低模型的參數(shù),最終訓(xùn)練后的模型平均測(cè)試識(shí)別準(zhǔn)確率達(dá)到了98.58%,模型大小為19 MB,可以有效識(shí)別出番茄病害圖像[9]。胡玲艷等提出一種輕量級(jí)網(wǎng)絡(luò)自適應(yīng)特征提取方法,基于SqueezeNet模型構(gòu)建輕量級(jí)網(wǎng)絡(luò)模型GKFENet,包含全局特征提取和關(guān)鍵特征提取2個(gè)模塊,對(duì)8種番茄病害的識(shí)別準(zhǔn)確率均超過(guò)96%[10]。王哲豪等提出將輕量化網(wǎng)絡(luò)MobileNet? v2和遷移學(xué)習(xí)方式相結(jié)合,采用凍結(jié)部分卷積層的方式,在模型最后加上2層全連接層,并用Dropout層防止過(guò)擬合,通過(guò)Softmax層輸出實(shí)現(xiàn)對(duì)番茄病害圖像分類(lèi)識(shí)別,準(zhǔn)確率達(dá)93.67%[11]。
上述方法均可較為準(zhǔn)確地識(shí)別研究目標(biāo),但是很少考慮所提出的方法能否兼顧準(zhǔn)確率、參數(shù)量以及計(jì)算量3個(gè)方面。為解決此類(lèi)問(wèn)題,本研究提出了1種改進(jìn)的輕量化YOLO v5n網(wǎng)絡(luò),改進(jìn)后的網(wǎng)絡(luò)可以在保證高識(shí)別準(zhǔn)確率的同時(shí)減少存儲(chǔ)空間的占用,使其能部署于移動(dòng)端,從而實(shí)現(xiàn)對(duì)番茄葉片病害的實(shí)時(shí)識(shí)別,便于果農(nóng)及時(shí)采取措施,減少經(jīng)濟(jì)損失。
1 試驗(yàn)材料與方法
1.1 數(shù)據(jù)來(lái)源
本研究的數(shù)據(jù)集選自開(kāi)放式數(shù)據(jù)庫(kù)Plant-Village,該數(shù)據(jù)庫(kù)共收錄了14種植物的健康及病害葉片圖像,并分為38種類(lèi)別標(biāo)簽。本研究從9種番茄葉片病害圖像中隨機(jī)選取6種病害圖像及番茄健康圖像作為試驗(yàn)所需的番茄病害圖像數(shù)據(jù)集,分別是細(xì)菌性斑疹病葉、早疫病葉、晚疫病葉、葉霉病葉、斑枯病葉、褐斑病葉以及番茄健康葉。圖像大小為256像素×256像素,具體見(jiàn)圖1。
1.2 數(shù)據(jù)預(yù)處理
在Plant-Village數(shù)據(jù)集的番茄葉片病害數(shù)據(jù)集中,存在某一類(lèi)別樣本數(shù)量過(guò)多或過(guò)少的情況,導(dǎo)致各類(lèi)樣本的數(shù)量分布不均衡。因此,為平衡各類(lèi)別樣本間的分布,提高模型的泛化能力,減少過(guò)擬合,對(duì)圖像樣本數(shù)量較少的類(lèi)別采用數(shù)據(jù)擴(kuò)充策略,本研究主要通過(guò)水平鏡像、提高亮度、增加高斯噪聲以及旋轉(zhuǎn)等數(shù)據(jù)增強(qiáng)方式進(jìn)行樣本擴(kuò)充,具體見(jiàn)圖2;而對(duì)于樣本數(shù)量明顯過(guò)多的類(lèi)別,隨機(jī)剔除一部分樣本,保證數(shù)據(jù)的平衡性,最終共獲取10 500幅番茄葉片病害圖像,通過(guò)編寫(xiě)程序?qū)?shù)據(jù)集進(jìn)行隨機(jī)抽樣,按照8 ∶2的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集(具體見(jiàn)表1)。
本研究訓(xùn)練的模型為YOLO系列格式的數(shù)據(jù)集,因此,采用LabelImg圖像工具標(biāo)記出葉片位置和類(lèi)別,生成xml類(lèi)型的標(biāo)注文件,標(biāo)注示例見(jiàn)圖3。
1.3 試驗(yàn)方法
1.3.1 YOLO v5n網(wǎng)絡(luò)模型
YOLO v5網(wǎng)絡(luò)模型是在YOLO v4[12]的基礎(chǔ)上改進(jìn)的單階段目標(biāo)檢測(cè)算法,其檢測(cè)速度和精度都得到了極大的提升。YOLO v5網(wǎng)絡(luò)由輸入端、主干網(wǎng)絡(luò)、頸部以及頭部4個(gè)部分組成,其中輸入端包含Mosaic數(shù)據(jù)增強(qiáng)、自適應(yīng)錨框計(jì)算和自適應(yīng)圖片縮放,主干網(wǎng)絡(luò)包含CBS、CSP1_X和SPPF,頸部包含CSP2_X、Upsampling和Concat,最后在頭部進(jìn)行預(yù)測(cè)并輸出結(jié)果,結(jié)構(gòu)見(jiàn)圖4。
YOLO v5相對(duì)于YOLO v4主要有以下改進(jìn):第一是提出1種自適應(yīng)錨框算法,將YOLO v4中用于獲得初始錨點(diǎn)框的外部程序嵌入到代碼中,每次訓(xùn)練時(shí),根據(jù)數(shù)據(jù)集的名稱(chēng)能夠自適應(yīng)地計(jì)算出最合適的錨點(diǎn)框;第二是提出自適應(yīng)圖片縮放方法;第三是在YOLO v4的CSP結(jié)構(gòu)基礎(chǔ)上設(shè)計(jì)2種CSP結(jié)構(gòu),CSP1_X結(jié)構(gòu)應(yīng)用于主干網(wǎng)絡(luò),CSP2_X應(yīng)用于頸部替代部分普通卷積;第四是提出SPPF替代SPP,將輸入串行通過(guò)多個(gè)大小相同的MaxPool層,減少模型計(jì)算量的同時(shí)提升模型檢測(cè)速度。
YOLO v5主要包含多個(gè)版本,其中YOLO v5n是最小的版本,其模型具有網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單、計(jì)算量少以及檢測(cè)速度快的優(yōu)勢(shì),符合本研究的實(shí)際需求,因此選用YOLO v5n版本作為基礎(chǔ)模型,改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)見(jiàn)圖5。
1.3.2 C3Ghost模塊
GhostNet[13]是華為諾亞方舟實(shí)驗(yàn)室提出的、新型輕量級(jí)深度神經(jīng)網(wǎng)絡(luò)架構(gòu),其構(gòu)建方式不同于ShuffleNet[14]、MobileNet[15]等輕量化卷積網(wǎng)絡(luò)。通常情況下,卷積生成的大量冗余特征圖在實(shí)際檢測(cè)任務(wù)中對(duì)主要特征圖的補(bǔ)充作用很小,對(duì)網(wǎng)絡(luò)提升檢測(cè)精度沒(méi)有太大幫助,但是生成這些冗余特征圖卻要消耗大量算力。因此,GhostNet構(gòu)建了Ghost模塊,利用Ghost模塊更快、更節(jié)省算力地生成冗余特征圖。傳統(tǒng)卷積與GhostNet卷積過(guò)程見(jiàn)圖6。
假設(shè)輸入特征圖的尺寸大小為h×w×c,輸出特征圖尺寸大小為h′×w′×n,采用的卷積核尺寸大小為k×k,線(xiàn)性操作核為d×d,經(jīng)過(guò)φk操作得到的特征圖為s個(gè),則傳統(tǒng)卷積與GhostNet卷積所需參數(shù)量分別為
Pconv=n×h′×w′×c×k×k;(1)
PGhost=ns×h′×w′×c×k×k+(s-1)×ns×h′×w′×d×d。(2)
因此,GhostNet卷積與傳統(tǒng)卷積的理論加速比(Rp)和參數(shù)壓縮比(Rc)分別為
Rp=PconvPGhost=c×k×k1s×c×k×k+s-1s×d×d≈s×cs+c-1≈s;(3)
Rc=n×c×k×kns×c×k×k+(s-1)×ns×d×d≈s×cs+c-1≈scc=s。(4)
從上述公式可知,GhostNet卷積的計(jì)算量和參數(shù)量可近似等于傳統(tǒng)卷積的1s,大幅降低了模型的計(jì)算和存儲(chǔ)開(kāi)銷(xiāo)。而YOLO v5n主干網(wǎng)絡(luò)采用C3結(jié)構(gòu),參數(shù)量較大,檢測(cè)速度較慢。因此,本研究將新的C3Ghost模塊替換C3模塊,以達(dá)到輕量化的效果,具體結(jié)構(gòu)見(jiàn)圖7。GhostBottleneck模塊以Ghost模塊為構(gòu)建基礎(chǔ),主要由2個(gè)GhostConv模塊和1個(gè)殘差塊組成,第1個(gè)GhostConv模塊被用作擴(kuò)展層,其目的是增加輸入特征圖的通道數(shù),以便進(jìn)行更多的特征提取和信息融合。第2個(gè)GhostConv模塊的作用是降維,減少輸出特征圖的通道數(shù),使其與網(wǎng)絡(luò)中的直徑結(jié)構(gòu)相匹配。最后與經(jīng)過(guò)深度卷積的殘差邊相加融合特征,引入DWConv的作用主要是為了減少參數(shù)量。C3Ghost模塊是在C3模塊的基礎(chǔ)上將殘差組件Resunit替換成可復(fù)用的GhostBottleneck模塊,減少了原結(jié)構(gòu)中大多數(shù)的傳統(tǒng)卷積,壓縮了模型并減少了計(jì)算量。
1.3.3 GSConv和VOV-GSCSP
在目標(biāo)檢測(cè)過(guò)程中,一些優(yōu)秀的輕量級(jí)網(wǎng)絡(luò)主要由大量深度可分離卷積(DSC)[16]構(gòu)建,以此來(lái)減少參數(shù)和計(jì)算量。但是DSC在計(jì)算的過(guò)程中會(huì)拆分處理每個(gè)通道的信息,丟失了大量的隱藏連接,因此其特征提取和融合能力遠(yuǎn)低于標(biāo)準(zhǔn)卷積,為了使DSC的輸出盡可能接近標(biāo)準(zhǔn)卷積,Li等提出了GSConv模塊[17],具體結(jié)構(gòu)見(jiàn)圖8。GSConv模塊由標(biāo)準(zhǔn)卷積、深度可分離卷積和Shuffle等3個(gè)部分卷積組成,通過(guò)Shuffle操作將標(biāo)準(zhǔn)卷積生成的信息滲透到深度可分離卷積內(nèi)部,保持通道間的隱藏連接,提高特征的豐富度。在網(wǎng)絡(luò)的頸部,特征圖的空間維度已經(jīng)達(dá)到了最小,而通道維度達(dá)到了最大,不再需要進(jìn)行通道轉(zhuǎn)換,此時(shí)使用GSConv卷積方式不僅冗余信息少,還降低了模型的參數(shù)量,達(dá)到了輕量化網(wǎng)絡(luò)的效果。故本研究將GSConv模塊部署到網(wǎng)絡(luò)中用于特征提取的頸部,代替標(biāo)準(zhǔn)卷積來(lái)進(jìn)行上采樣和下采樣,最大程度地保證采樣效果。
由于YOLO v5n在頸部采用的CSP模塊在空間特征融合方面具有一定的局限性,同時(shí)為了加快模型推理時(shí)間并保持精度,本研究添加VOV-GSCSP模塊代替頸部的CSP模塊,將不同尺度的特征圖按照順序連接起來(lái)形成一個(gè)更長(zhǎng)的特征向量,以增加模型的多樣性,提取更豐富的語(yǔ)義信息。圖9-a為VOV-GSCSP的瓶頸單元結(jié)構(gòu)GSBottleneck,圖9-b為采用單次聚合方法設(shè)計(jì)的跨階段的VOV-GSCSP模塊。該模塊降低了網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性和計(jì)算量,推理速度快,適合部署到計(jì)算量有限的移動(dòng)目標(biāo)平臺(tái)。
1.3.4 PAGCP全局通道剪枝
目前,基于卷積神經(jīng)網(wǎng)絡(luò)的模型在大規(guī)模多任務(wù)預(yù)測(cè)領(lǐng)域快速發(fā)展,但大多數(shù)模型仍面臨著巨大的計(jì)算和存儲(chǔ)開(kāi)銷(xiāo)問(wèn)題,使得它們?cè)谧詣?dòng)駕駛系統(tǒng)和邊緣計(jì)算設(shè)備等實(shí)際應(yīng)用中難以部署。而模型壓縮作為緩解這一問(wèn)題的有效技術(shù),可以將一個(gè)復(fù)雜的預(yù)訓(xùn)練模型簡(jiǎn)化為1個(gè)輕量級(jí)模型,從而減少對(duì)硬件的存儲(chǔ)、帶寬和計(jì)算需求。在近年的模型壓縮方法中,模型剪枝已經(jīng)成為主流的壓縮技術(shù),過(guò)去的多任務(wù)模型剪枝算
法主要集中在模型遷移或算法遷移上,這2種方式忽略了模型不同層中的卷積核的聯(lián)合影響以及任務(wù)之間的特征不匹配問(wèn)題。為此,Ye等提出了一個(gè)性能感知的全局通道剪枝PAGCP框架[18],從基于顯著性指標(biāo)的剪枝優(yōu)化問(wèn)題切入,分析得出傳統(tǒng)引入正則懲罰項(xiàng)的方式中存在梯度競(jìng)爭(zhēng)的問(wèn)題,從而在優(yōu)化中使得模型參數(shù)偏離了原本的最優(yōu)點(diǎn),改變了原始最優(yōu)點(diǎn)上每個(gè)通道的重要程度?;诖?,將優(yōu)化目標(biāo)調(diào)整為僅對(duì)顯著性指標(biāo)進(jìn)行帶約束最小化搜索,保證模型參數(shù)權(quán)重不變,其中約束項(xiàng)調(diào)整為對(duì)模型剪枝后的性能損失約束以及計(jì)算量約束,這保證了模型參數(shù)處于最優(yōu)點(diǎn)并有更準(zhǔn)確的重要度評(píng)估。
單次剪枝迭代中不同剪枝策略之間的區(qū)別見(jiàn)圖10,紅色虛線(xiàn)圓圈表示在每次迭代中要修剪的過(guò)濾器集合。圖10-a是通用的多任務(wù)模型,其中每個(gè)過(guò)濾器對(duì)不同的任務(wù)具有不同的敏感度。圖10-b 是分層通道剪枝,其在單層中評(píng)估和修剪過(guò)濾器,并在每次迭代中微調(diào)模型,在當(dāng)前剪枝迭代中不考慮灰色區(qū)域的過(guò)濾器。圖10-c是先前的全局通道剪枝,其在每次剪枝迭代中基于靜態(tài)過(guò)濾器的關(guān)系評(píng)估和修剪所有層上的過(guò)濾器(用過(guò)濾器顏色不變來(lái)表示)。圖10-d是PAGCP剪枝,其基于先前修剪的結(jié)構(gòu)動(dòng)態(tài)地評(píng)估和修剪單層中的過(guò)濾器,并且針對(duì)多任務(wù)模型的壓縮性能全局考慮層內(nèi)和層間過(guò)濾器的關(guān)系(用過(guò)濾器顏色變化來(lái)表示)。層修剪順序由每層對(duì)總FLOPs減少量的貢獻(xiàn)決定。與以前將分類(lèi)模型的過(guò)濾器顯著性準(zhǔn)則適應(yīng)多任務(wù)分類(lèi)模型的方法相比,PAGCP剪枝的方法以貪婪的方式動(dòng)態(tài)地計(jì)算每個(gè)過(guò)濾器的顯著性,以近似最優(yōu)全局通道剪枝(GCP),并通過(guò)性能感知的預(yù)言準(zhǔn)則自動(dòng)控制剪枝的性能下降。
Ye等通過(guò)大量試驗(yàn)證明PAGCP算法框架在將多個(gè)模型計(jì)算量或參數(shù)量壓縮比例超過(guò)60%的情況下,僅有略微的性能損失,超越了同等計(jì)算規(guī)模和模型結(jié)構(gòu)下的現(xiàn)有高性能模型,同時(shí)大幅提升原模型的推理速度[18]。本研究引入PAGCP算法對(duì)模型進(jìn)行全局通道剪枝,在保持精度的同時(shí)有效減少了模型參數(shù)量和計(jì)算量。
2 試驗(yàn)結(jié)果與分析
2.1 試驗(yàn)環(huán)境
本研究使用環(huán)境為Python 3.9、Pytorch 2.0.1、Cuda 12.2、cuDNN 8.7.0,試驗(yàn)計(jì)算機(jī)CPU為Intel Core i5-12600KF,GPU為NVIDIA RTX3080Ti,顯存32 GB,設(shè)置迭代次數(shù)為300次。試驗(yàn)時(shí)間為2023年6—10月,試驗(yàn)地點(diǎn)為長(zhǎng)江大學(xué)東校區(qū)。
2.2 評(píng)估指標(biāo)
本研究采用IoU閾值設(shè)置為0.5的平均精度均值、參數(shù)量、浮點(diǎn)運(yùn)算數(shù)以及模型大小作為評(píng)價(jià)指標(biāo)。
精確率、召回率計(jì)算公式如下:
P=TPTP+FP;(5)
R=TPTP+FN。(6)
平均精度、平均精度均值計(jì)算公式如下:
AP=∫10P(R)dR;(7)
mAP=∑Ki=1APiK。(8)
其中:TP表示預(yù)測(cè)正確的正類(lèi)樣本數(shù)量;FP表示預(yù)測(cè)錯(cuò)誤的正類(lèi)樣本數(shù)量;FN表示預(yù)測(cè)錯(cuò)誤的負(fù)類(lèi)樣本數(shù)量;P和R所圍成的面積定義為AP;取所有的檢測(cè)類(lèi)別AP的均值為mAP。
參數(shù)量和浮點(diǎn)計(jì)算量作為網(wǎng)絡(luò)模型復(fù)雜度的評(píng)價(jià)指標(biāo),其計(jì)算公式如下:
Params=Cin×Cout×K×K;(9)
FLOPs=W×H×K×K×Cin×Cout。(10)
其中:Cin、Cout分別為輸入和輸出特征通道數(shù);K為卷積核大小;W、H分別是輸入特征圖的寬度和高度。
2.3 試驗(yàn)結(jié)果與分析
2.3.1 輕量化主干網(wǎng)絡(luò)對(duì)比試驗(yàn)
為了進(jìn)一步驗(yàn)證改進(jìn)后的YOLO v5n的輕量化效果,本研究選取常見(jiàn)的輕量化網(wǎng)絡(luò)GhostNet、MobileNet v3-s[19]以及EfficientNet[20]來(lái)優(yōu)化YOLO v5n的主干網(wǎng)絡(luò)與改進(jìn)的YOLO v5n網(wǎng)絡(luò)進(jìn)行對(duì)比試驗(yàn),結(jié)果見(jiàn)表2。
由表2可以看出,改進(jìn)的YOLO v5n網(wǎng)絡(luò)平均精度均值達(dá)到99%,參數(shù)量為0.59 M,計(jì)算量為 1.6 G,模型權(quán)重大小為1.51 MB。與原模型相比,在平均精度均值僅下降0.5百分點(diǎn)的同時(shí),參數(shù)量減少了66.67%,計(jì)算量減少了2.6 G,模型權(quán)重大小壓縮了2.23 MB。與其他3種輕量化網(wǎng)絡(luò)相比綜合性能最優(yōu),所以改進(jìn)后的YOLO v5n在保持識(shí)別精度的同時(shí)大大減少了參數(shù)量,證明了本研究輕量化改進(jìn)的有效性,能夠滿(mǎn)足番茄葉片病害識(shí)別的實(shí)際需求。
3.3.2 消融試驗(yàn)
為了評(píng)估PAGCP剪枝算法、C3Ghost模塊、GSConv模塊以及VOV-GSCSP模塊對(duì)YOLO v5n網(wǎng)絡(luò)模型性能所帶來(lái)的影響,進(jìn)行消融試驗(yàn),并與原始YOLO v5n網(wǎng)絡(luò)模型進(jìn)行對(duì)比,結(jié)果見(jiàn)表3。
從表3可知,與原始算法相比,試驗(yàn)2引入PAGCP對(duì)模型進(jìn)行剪枝改進(jìn)后模型平均精度均值幾乎不變,同時(shí)計(jì)算量減少了50%,參數(shù)量減少了48.59%,模型權(quán)重大小壓縮了1.64 MB,滿(mǎn)足本研究輕量化的要求。然后在此基礎(chǔ)上試驗(yàn)3采用GSConv替代標(biāo)準(zhǔn)卷積,減少冗余信息,并且參數(shù)量、計(jì)算量及模型權(quán)重大小都有小幅降低,但是模型的平均精度均值下降嚴(yán)重。所以,試驗(yàn)4引入C3Ghost取代C3模塊,實(shí)現(xiàn)了用更少的參數(shù)生成更多的特征圖,提高了模型的特征表達(dá)能力,平均精度均值提高了28.5百分點(diǎn),同時(shí)證明在主干網(wǎng)絡(luò)中引入C3Ghost模塊的有效性。雖然試驗(yàn)4的平均精度均值已經(jīng)達(dá)到98.9%,但是與原模型相比仍然有所下降,并且模型權(quán)重大小相對(duì)于移動(dòng)設(shè)備的存儲(chǔ)空間還不理想,為了減少模型對(duì)硬件條件的依賴(lài),試驗(yàn)5引入VOV-GSCSP模塊替代頸部的CSP結(jié)構(gòu),可以提取更豐富的語(yǔ)義信息,使平均精度均值達(dá)到99.0%,計(jì)算量達(dá)到1.6 G,參數(shù)量達(dá)到0.59 M,模型權(quán)重大小達(dá)到1.51 MB。通過(guò)上述消融試驗(yàn)的全面評(píng)估,驗(yàn)證了在原模型中改進(jìn)的不同網(wǎng)絡(luò)模塊都表現(xiàn)出優(yōu)異的性能。
3 結(jié)論
本研究聚焦于番茄葉片病害識(shí)別問(wèn)題,通過(guò)融合輕量級(jí)GhostNet網(wǎng)絡(luò)改進(jìn)C3模塊,引入GSConv和VOV-GSCSP模塊,采用全局通道剪枝PAGCP算法,提出一種改進(jìn)的輕量化YOLO v5n的番茄葉片病害識(shí)別方法,試驗(yàn)結(jié)果表明,改進(jìn)的YOLO v5n模型在識(shí)別番茄葉片病害方面有更好的效果,完成了對(duì)6類(lèi)常見(jiàn)番茄葉片病害及番茄健康葉片的識(shí)別研究。改進(jìn)后的模型更加適應(yīng)真實(shí)環(huán)境,特征學(xué)習(xí)能力有所增強(qiáng),與YOLO v5n相比,平均精度均值只降低了0.5百分點(diǎn),但參數(shù)量減少了66.67%,計(jì)算量減少了2.6 G,模型權(quán)重大小壓縮了2.23 MB,驗(yàn)證了改進(jìn)的有效性,并且該方法可以推廣到其他植物葉片病害的識(shí)別問(wèn)題上。
后續(xù)會(huì)收集更多復(fù)雜環(huán)境下的番茄葉片病害圖像以及更多種類(lèi)的病害圖像豐富數(shù)據(jù)集,并采用不同數(shù)據(jù)預(yù)處理方法來(lái)提取不同環(huán)境下的圖片特征,達(dá)到更好的模型泛化性能與精確度。
參考文獻(xiàn):
[1]李洪磊,王曉敏,鄭福順,等. 基于主成分和隸屬函數(shù)分析的不同果色番茄品種引種初步評(píng)價(jià)[J]. 云南大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,43(2):402-411.
[2]李君明,項(xiàng)朝陽(yáng),王孝宣,等. “十三五” 我國(guó)番茄產(chǎn)業(yè)現(xiàn)狀及展望[J]. 中國(guó)蔬菜,2021(2):13-20.
[3]霍建勇. 中國(guó)番茄產(chǎn)業(yè)現(xiàn)狀及安全防范[J]. 蔬菜,2016(6):1-4.
[4]馬 宇,單玉剛,袁 杰. 基于三通道注意力網(wǎng)絡(luò)的番茄葉部病害識(shí)別[J]. 科學(xué)技術(shù)與工程,2021,21(25):10789-10795.
[5]孟莉莎,楊賢昭,劉惠康. 基于CA-EfficientNet v2的蘑菇圖像分類(lèi)算法研究[J]. 激光與光電子學(xué)進(jìn)展,2022,59(24):2410005.
[6]嚴(yán)陳慧子,田芳明,譚 峰,等. 基于改進(jìn)YOLO v4的水稻病害快速檢測(cè)方法[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(6):187-194.
[7]武 魁,高丙朋. 改進(jìn)EfficientNet v2的玉米病蟲(chóng)害識(shí)別與分級(jí)研究[J]. 現(xiàn)代電子技術(shù),2023,46(14):68-74.
[8]張 寧,吳華瑞,韓 笑,等. 基于多尺度和注意力機(jī)制的番茄病害識(shí)別方法[J]. 浙江農(nóng)業(yè)學(xué)報(bào),2021,33(7):1329-1338.
[9]方晨晨,石繁槐. 基于改進(jìn)深度殘差網(wǎng)絡(luò)的番茄病害圖像識(shí)別[J]. 計(jì)算機(jī)應(yīng)用,2020,40(增刊1):203-208.
[10]胡玲艷,周 婷,劉 艷,等. 基于輕量級(jí)網(wǎng)絡(luò)自適應(yīng)特征提取的番茄病害識(shí)別[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2022,38(3):696-705.
[11]王哲豪,范麗麗,何 前. 基于MobileNet v2和遷移學(xué)習(xí)的番茄病害識(shí)別[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(9):215-221.
[12]Bochkovskiy A,Wang C Y,Liao H Y M. YOLO v4:optimal speed and accuracy of object detection[EB/OL]. (2020-04-23)[2023-08-20]. https://arxiv.org/abs/2004.10934.
[13]Han K,Wang Y H,Tian Q,et al. GhostNet:more features from cheap operations[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattl:IEEE,2020:1577-1586.
[14]Zhang X Y,Zhou X Y,Lin M X,et al. ShuffleNet:an extremely efficient convolutional neural network for mobile devices[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City:IEEE,2018:6848-6856.
[15]Howard A G,Zhu M L,Chen B,et al. MobileNets:efficient convolutional neural networks for mobile vision applications[EB/OL]. (2017-04-17)[2023-08-20]. https://arxiv.org/pdf/1704.04861.pdf.
[16]SIfre L,Mallat S. Rigid-motion scattering for texture classification[EB/OL]. (2014-03-07)[2023-08-20]. https://arxiv.org/pdf/1403.1687.pdf.
[17]Li H L,Li J,Wei H B,et al. Slim-neck by GSConv:a better design paradigm of detector architectures for autonomous vehicles[EB/OL]. (2022-08-17)[2023-08-24]. https://arxiv.org/abs/2206.02424.
[18]Ye H C,Zhang B,Chen T,et al. Performance-aware approximation of global channel pruning for multitask CNNs[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2023,45(8):10267-10284.
[19]Howard A,Sandler M,Chen B,et al. Searching for MobileNet v3[C]//2019 IEEE/CVF International Conference on Computer Vision. Seoul:IEEE,2019:1314-1324.
[20]Tan M X,Le Q V. Efficientnet:rethinking model scaling for convolutional neural networks[EB/OL]. (2020-09-11)[2023-08-20]. https://www.researchgate.net/publication/333444574_EfficientNet_Rethinking_Model_Scaling_for_Convolutional_Neural_Networks.