• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于改進(jìn)FixMatch算法的半監(jiān)督番茄病蟲(chóng)害識(shí)別

      2024-12-31 00:00:00嚴(yán)露露朱贊彬馮世杰龔守富程湞湞
      江蘇農(nóng)業(yè)科學(xué) 2024年20期
      關(guān)鍵詞:類別番茄聚類

      doi:10.15889/j.issn.1002-1302.2024.20.029

      摘要:為了快速準(zhǔn)確地識(shí)別番茄葉片病蟲(chóng)害,從而提升番茄產(chǎn)量和品質(zhì),在有限設(shè)備資源條件下實(shí)現(xiàn)番茄病蟲(chóng)害的精準(zhǔn)防治,針對(duì)以往番茄病蟲(chóng)害識(shí)別算法數(shù)據(jù)標(biāo)注成本過(guò)高的問(wèn)題,提出一種基于改進(jìn)FixMatch算法的半監(jiān)督番茄病害圖像識(shí)別方法。首先,對(duì)真實(shí)場(chǎng)景采集的番茄病蟲(chóng)害數(shù)據(jù)進(jìn)行深入分析,挖掘出數(shù)據(jù)集規(guī)模不明、類間數(shù)據(jù)不均衡性較為嚴(yán)重的特性,在原始FixMatch算法的基礎(chǔ)上,引入k-means聚類算法篩選出代表性數(shù)據(jù)進(jìn)行標(biāo)注,以提高標(biāo)注數(shù)據(jù)的性價(jià)比。其次,設(shè)計(jì)一種自適應(yīng)偽標(biāo)簽數(shù)據(jù)補(bǔ)充模塊,使得在半監(jiān)督分類算法迭代過(guò)程中,自適應(yīng)地調(diào)整不同類別的偽標(biāo)簽判定閾值,并且引入Focal Loss,以保證模型免受類別不均衡的影響。試驗(yàn)結(jié)果表明,在kaggle提供的公開(kāi)數(shù)據(jù)集New Plant Diseases Dataset的10種番茄病害上,本研究提出的半監(jiān)督番茄病蟲(chóng)害識(shí)別算法僅使用2 000張(約訓(xùn)練數(shù)據(jù)的10%)的標(biāo)注數(shù)據(jù)進(jìn)行模型訓(xùn)練,在測(cè)試集上的準(zhǔn)確率可達(dá)到98.16%,比原始FixMatch算法提高了1.34百分點(diǎn)。經(jīng)過(guò)對(duì)比試驗(yàn)表明,本研究提出的基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊比隨機(jī)挑選的準(zhǔn)確率提高23.92百分點(diǎn),基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊在困難樣本類別上比原始FixMatch算法高出5.00百分點(diǎn)。綜上所述,本研究所提出的基于改進(jìn)FixMatch算法的半監(jiān)督番茄病蟲(chóng)害識(shí)別算法能夠提高半監(jiān)督圖像識(shí)別任務(wù)的準(zhǔn)確率,對(duì)于真實(shí)場(chǎng)景下如何挑選數(shù)據(jù)標(biāo)注以及如何制定訓(xùn)練過(guò)程中的偽標(biāo)簽監(jiān)督策略都有著積極的參考意義,降低了番茄病蟲(chóng)害識(shí)別模型的數(shù)據(jù)標(biāo)注成本,助力智慧農(nóng)業(yè)發(fā)展。

      關(guān)鍵詞:番茄;病蟲(chóng)害;改進(jìn)FixMatch算法;半監(jiān)督學(xué)習(xí);圖像分類

      中圖分類號(hào):S126;TP391.41" 文獻(xiàn)標(biāo)志碼:A

      文章編號(hào):1002-1302(2024)20-0244-06

      收稿日期:2024-04-24

      基金項(xiàng)目:河南省重點(diǎn)研發(fā)與推廣專項(xiàng)(科技攻關(guān))(編號(hào):232102111118);信陽(yáng)農(nóng)林學(xué)院青年基金(編號(hào):QN2022020、QN2021046);信陽(yáng)農(nóng)林學(xué)院科技創(chuàng)新團(tuán)隊(duì)項(xiàng)目(編號(hào):XNKJTD-011)。

      作者簡(jiǎn)介:嚴(yán)露露(1995—),女,河南信陽(yáng)人,碩士,助教,主要從事溫室智能化栽培與環(huán)境調(diào)控研究。E-mail:2020190001@xyafu.edu.cn。

      通信作者:程湞湞,博士,講師,主要從事圖像處理與模式識(shí)別研究,E-mail:2021190008@xyafu.edu.cn。

      番茄是我國(guó)重要的蔬菜之一,在我國(guó)的栽培面積和總產(chǎn)量均居世界首位[1]。番茄種植過(guò)程中常遭遇多種病害,嚴(yán)重影響番茄的產(chǎn)量,導(dǎo)致番茄品質(zhì)降低,對(duì)病害的防治也大大增加了作物種植成本。針對(duì)番茄的病蟲(chóng)害檢測(cè)可以進(jìn)行早期預(yù)警,基于準(zhǔn)確的病蟲(chóng)害診斷進(jìn)行精準(zhǔn)施藥,是番茄病蟲(chóng)害防控體系中至關(guān)重要的一個(gè)環(huán)節(jié)[2-3]。傳統(tǒng)農(nóng)業(yè)生產(chǎn)中,番茄病蟲(chóng)害識(shí)別主要依靠種植者的經(jīng)驗(yàn)和生物檢驗(yàn)。前者主觀性強(qiáng),容易出現(xiàn)誤判,后者損傷植物組織且呈現(xiàn)滯后性,影響藥劑的及時(shí)噴施[4-5]。因此,提供一種快速、無(wú)損且準(zhǔn)確的番茄病蟲(chóng)害識(shí)別方法十分必要。

      隨著人工智能領(lǐng)域的發(fā)展,圖像處理、神經(jīng)網(wǎng)絡(luò)等技術(shù)廣泛應(yīng)用到農(nóng)業(yè)作物圖像提取與分類中[6-8]。近幾年,基于神經(jīng)網(wǎng)絡(luò)的方法進(jìn)一步應(yīng)用于番茄葉片病蟲(chóng)害識(shí)別。倪智濤等提出了一種將圖像分類技術(shù)與目標(biāo)檢測(cè)技術(shù)協(xié)同融合的細(xì)粒度病蟲(chóng)害識(shí)別方法,提高了番茄細(xì)粒度病蟲(chóng)害識(shí)別的精確度[9]。張俊寧等提出了一種基于注意力機(jī)制與改進(jìn)YOLO v5s的溫室番茄目標(biāo)快速檢測(cè)方法,提高了邊界框回歸速率和果實(shí)目標(biāo)定位精度[10]。郭小燕等在ResNet 50中引入雙層注意力機(jī)制與通道特征提取機(jī)制,設(shè)計(jì)并驗(yàn)證了基于全局特征提取的深度學(xué)習(xí)網(wǎng)絡(luò)的有效性[11]。馬麗等改進(jìn)了MobileNet v3模型用于番茄病害識(shí)別,改進(jìn)后模型平均識(shí)別準(zhǔn)確率可達(dá)97.29%[12]。陳林琳等利用計(jì)算機(jī)視覺(jué)中的圖像識(shí)別與特征提取技術(shù)建立了芋頭病害識(shí)別監(jiān)測(cè)理論模型和識(shí)別系統(tǒng),該系統(tǒng)對(duì)芋頭病害的識(shí)別率平均維持在88%以上[13]。與傳統(tǒng)基于特征分類的病蟲(chóng)害識(shí)別算法相比,深度神經(jīng)網(wǎng)絡(luò)圖像分類算法的識(shí)別精度更高,應(yīng)用場(chǎng)景更廣泛[14-16]。為了充分訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型,提高識(shí)別效果,需要使用大規(guī)模含標(biāo)注信息的數(shù)據(jù)集作為支撐,但在實(shí)際農(nóng)業(yè)生產(chǎn)中,如此高成本的方案難以施行。

      基于以上問(wèn)題,研究者們提出了多項(xiàng)基于半監(jiān)督學(xué)習(xí)的病蟲(chóng)害識(shí)別算法[17-19]。使用半監(jiān)督病蟲(chóng)害識(shí)別算法,僅需要少部分的標(biāo)注數(shù)據(jù),同時(shí)訓(xùn)練標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù),便可實(shí)現(xiàn)較好的識(shí)別效果。本研究基于FixMatch半監(jiān)督圖像分類算法,引入 k-means聚類算法用于篩選代表數(shù)據(jù)進(jìn)行標(biāo)注,聚焦模型前期能力差和類間數(shù)據(jù)不均衡性的問(wèn)題引入了基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷和圖像分類Focal Loss,以改善原模型對(duì)于類別不均衡情況下樣本較少類別識(shí)別率差的缺陷,提升半監(jiān)督模式下番茄病蟲(chóng)害識(shí)別的準(zhǔn)確率[20]。

      1" 材料與方法

      1.1" 數(shù)據(jù)集介紹

      本試驗(yàn)使用的番茄葉片病害數(shù)據(jù)集是Kaggle提供的2個(gè)番茄葉片病害數(shù)據(jù)集New Plant Diseases Dataset(https://www.kaggle.com/datasets/ashishmotwani/tomato/data和https://www.kaggle.com/datasets/noulam/tomato)整理而成,整理后的數(shù)據(jù)共包含19 349張訓(xùn)練集圖片和4 837張驗(yàn)證集圖片,包含10種不同類型的番茄病害葉片圖像和1種類型的番茄健康葉片圖像,是專門用于番茄葉片病害識(shí)別模型訓(xùn)練和驗(yàn)證的數(shù)據(jù)集。具體數(shù)據(jù)詳情見(jiàn)表1。

      從表1可以看出,不同葉片病害的數(shù)據(jù)數(shù)量差異較大,對(duì)于模型訓(xùn)練存在較大干擾,使得模型極易向數(shù)據(jù)多、易于識(shí)別的病害類別上傾斜,而忽視了數(shù)據(jù)少、較難識(shí)別的病害類別。本研究所提出的半監(jiān)督番茄病害識(shí)別算法針對(duì)這種類間數(shù)據(jù)不均衡問(wèn)題有較好的表現(xiàn)。

      1.2" 基于改進(jìn)FixMatch的半監(jiān)督番茄葉片病害識(shí)別算法設(shè)計(jì)

      本研究提出的基于改進(jìn)FixMatch的半監(jiān)督番茄葉片病害識(shí)別模型是基于公認(rèn)有效的半監(jiān)督框架構(gòu)建的,利用一致性正則化和偽標(biāo)簽2種技術(shù)手段來(lái)有效利用未標(biāo)注數(shù)據(jù),使得未標(biāo)注數(shù)據(jù)參與模型訓(xùn)練,提升模型在有限標(biāo)注數(shù)據(jù)下的學(xué)習(xí)效果。原始FixMatch算法的流程分為3步:(1)數(shù)據(jù)增強(qiáng)策略。半監(jiān)督的理論依據(jù)是:對(duì)同一張圖像進(jìn)行不同的數(shù)據(jù)增強(qiáng)后,模型識(shí)別出該圖像所屬的類別應(yīng)該是一致的。算法使用雙路徑數(shù)據(jù)增強(qiáng)方案,弱增強(qiáng)(如隨機(jī)反轉(zhuǎn)、裁剪等基本變換)用于生成偽標(biāo)簽,而強(qiáng)增強(qiáng)(如色彩區(qū)域變換、隨機(jī)空洞等進(jìn)階變換)用于強(qiáng)化模型對(duì)輸入擾動(dòng)的魯棒性。(2)偽標(biāo)簽生成。模型在訓(xùn)練過(guò)程中,對(duì)弱增強(qiáng)后的未標(biāo)注數(shù)據(jù)進(jìn)行預(yù)測(cè),并設(shè)置1個(gè)截?cái)嚅撝祦?lái)篩選具有高度置信度的偽標(biāo)簽,只有當(dāng)模型對(duì)某個(gè)樣本的預(yù)測(cè)概率超出預(yù)設(shè)截?cái)嚅撝禃r(shí),才會(huì)將其作為可靠的偽標(biāo)簽保留下來(lái)參與模型損失計(jì)算。(3)一致性正則化。對(duì)于未標(biāo)注樣本,模型的目標(biāo)是在同一個(gè)樣本強(qiáng)增強(qiáng)后預(yù)測(cè)出的結(jié)果和弱增強(qiáng)后生成的偽標(biāo)簽一致的結(jié)果,從而實(shí)現(xiàn)一致性約束。

      原始FixMatch算法對(duì)于選擇哪些數(shù)據(jù)進(jìn)行標(biāo)注以及類間不均衡問(wèn)題未進(jìn)行深入研究,針對(duì)這些問(wèn)題,本研究提出了改進(jìn)后的FixMatch算法。算法框架如圖1所示。在原始FixMatch框架的基礎(chǔ)上,新增了基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊、基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊和多分類Focal Loss。首先,算法使用k-means的聚類結(jié)果來(lái)預(yù)選更具代表性的數(shù)據(jù)進(jìn)行標(biāo)注,有利于模型迅速、準(zhǔn)確地迭代訓(xùn)練。隨后,使用隨機(jī)數(shù)據(jù)增強(qiáng)策略,對(duì)未標(biāo)注數(shù)據(jù)分別進(jìn)行弱增強(qiáng)和強(qiáng)增強(qiáng)。針對(duì)模型對(duì)這2種增強(qiáng)方式的預(yù)測(cè)結(jié)果,使用基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊來(lái)確定哪些未標(biāo)注數(shù)據(jù)被納入訓(xùn)練過(guò)程,而不是FixMatch算法的固定截?cái)嚅撝?。最后,使用多分類Focal Loss計(jì)算標(biāo)注數(shù)據(jù)的監(jiān)督損失和未標(biāo)注數(shù)據(jù)的一致性損失,聯(lián)合進(jìn)行模型迭代訓(xùn)練。

      1.2.1" 基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模

      塊" 對(duì)于現(xiàn)實(shí)采集的數(shù)據(jù)集,相比于有監(jiān)督數(shù)據(jù)而言,半監(jiān)督數(shù)據(jù)無(wú)法知曉數(shù)據(jù)集的全部信息,僅知道類別的數(shù)量卻不知道各個(gè)類別的數(shù)量等信息。而現(xiàn)有的方案均是假設(shè)已知各類別數(shù)據(jù)數(shù)量的前提下進(jìn)行標(biāo)注數(shù)據(jù)預(yù)選,這是不符合真實(shí)情形的。除此之外,在試驗(yàn)過(guò)程中本研究還發(fā)現(xiàn),選取不同組合的標(biāo)注數(shù)據(jù),對(duì)模型訓(xùn)練結(jié)果影響較大,其影響原因是選取的標(biāo)注數(shù)據(jù)是否能更好的代表此類數(shù)據(jù)的平均特征。經(jīng)過(guò)試驗(yàn)發(fā)現(xiàn),選取更具代表性的數(shù)據(jù)作為半監(jiān)督模型中的標(biāo)注數(shù)據(jù),比隨機(jī)選擇數(shù)據(jù)的方式模型效果更好。針對(duì)這種情況,本研究提出了基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊。首先,設(shè)置數(shù)據(jù)集X的類別種數(shù)N及半監(jiān)督抽樣比例μ,μ為構(gòu)建代表性待標(biāo)注數(shù)據(jù)子集的抽樣比例。隨后,采用經(jīng)過(guò)ImageNet預(yù)訓(xùn)練的ResNet 101卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)原始圖像數(shù)據(jù)進(jìn)行特征提取,生成對(duì)應(yīng)的高維特征向量集合F,此步驟利用了深度學(xué)習(xí)模型強(qiáng)大的特征學(xué)習(xí)能力,將復(fù)雜的圖像信息轉(zhuǎn)化為易于處理的特征表示。接著運(yùn)用k-means聚類算法對(duì)提取出的特征向量F進(jìn)行迭代優(yōu)化,以N個(gè)聚類中心為基礎(chǔ),不斷更新類別劃分直至收斂。最后進(jìn)行代表性樣本選擇,選取原則是距離該類聚類中心越近的數(shù)據(jù),在此類數(shù)據(jù)中的代表性越高。具體過(guò)程為:針對(duì)每個(gè)類別,計(jì)算其余圖像特征與當(dāng)前類別中心的距離,并根據(jù)距離排序;選取距離當(dāng)前類別中心最近的(X×μ)/N個(gè)數(shù)據(jù)為該類別的代表性樣本。最終,可以獲得一個(gè)包含 X×μ 個(gè)樣本的待標(biāo)注數(shù)據(jù)集,其中每個(gè)類別均有 (X×μ)/N 個(gè)最具代表性的樣本,這些數(shù)據(jù)可用于進(jìn)一步的人工標(biāo)注,從而豐富有監(jiān)督信息,更有效地提升后續(xù)分類任務(wù)的性能。圖2為基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊選出的各類前3名代表性數(shù)據(jù)和最不具代表性的數(shù)據(jù)??梢钥闯觯哂写硇缘臄?shù)據(jù)更能代表該類的平均特征,而最不具代表性的數(shù)據(jù)往往與該類其余數(shù)據(jù)特征差異較大。

      1.2.2" 基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊" 在半監(jiān)督訓(xùn)練過(guò)程中,公認(rèn)的難點(diǎn)在于如何判斷未標(biāo)注數(shù)據(jù)經(jīng)過(guò)模型推理得到的偽標(biāo)簽是否可納入無(wú)監(jiān)督訓(xùn)練。先進(jìn)的半監(jiān)督算法一般采用對(duì)預(yù)測(cè)分布進(jìn)行置信度截?cái)嗟姆绞絹?lái)作為判斷標(biāo)準(zhǔn),如FixMatch算法便是將預(yù)測(cè)分布中最大置信度大于0.9的數(shù)據(jù)納入到無(wú)監(jiān)督訓(xùn)練中。但這種方法存在2個(gè)局限性,首先是未考慮到模型前期預(yù)測(cè)能力弱的問(wèn)題,在模型訓(xùn)練前期,由于尚未學(xué)習(xí)到有效分類能力,亂預(yù)測(cè)的結(jié)果參與到訓(xùn)練過(guò)程會(huì)導(dǎo)致模型整體學(xué)偏,產(chǎn)生惡性循環(huán)。其次是未考慮到類別不均衡問(wèn)題,對(duì)于少樣本的類別而言,其參與到訓(xùn)練的未標(biāo)注數(shù)據(jù)自然也比多樣本類別要少,從而導(dǎo)致模型向多樣本類別偏向。針對(duì)以上2個(gè)局限性問(wèn)題,本研究提出了基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊。該模塊的工作流程如下:(1)判斷當(dāng)前訓(xùn)練處于哪個(gè)階段,若當(dāng)前參與進(jìn)訓(xùn)練的未標(biāo)注數(shù)據(jù)比例在50%以下,則處于訓(xùn)練前期,否則處于訓(xùn)練后期。(2)若當(dāng)前處于訓(xùn)練前期,在判斷當(dāng)前樣本是否應(yīng)該被納入訓(xùn)練中時(shí),其截?cái)嚅撝颠€需加入該樣本的k-means聚類結(jié)果來(lái)輔助評(píng)估。若該樣本的模型推理結(jié)果和k-means聚類結(jié)果一致,則截?cái)嚅撝翟O(shè)置為0.80,若不一致,則截?cái)嚅撝翟O(shè)置為0.95。

      (3)若當(dāng)前處于訓(xùn)練后期,僅通過(guò)模擬的推理結(jié)果來(lái)判斷,不再借用k-means的聚類結(jié)果來(lái)輔助評(píng)估。且在判斷過(guò)程中,根據(jù)上一輪各類別已納入訓(xùn)練的非標(biāo)注樣本數(shù)量比例,來(lái)自適應(yīng)地調(diào)整每一類的截?cái)嚅撝怠W赃m應(yīng)截?cái)嚅撝档挠?jì)算準(zhǔn)則為:具有最多納入訓(xùn)練樣本數(shù)量的類別的截?cái)嚅撝翟O(shè)為0.95,最少的類別設(shè)為0.80,其余類別分別按比例在二者之間取值。

      1.2.3" 圖像多分類Focal Loss" 雖然在“1.2.2”節(jié)中針對(duì)類別不均衡問(wèn)題進(jìn)行了優(yōu)化,但由于k-means聚類結(jié)果的不確定性和自適應(yīng)閾值截?cái)喾桨傅臏笮裕贅颖绢悇e在模型訓(xùn)練過(guò)程中的重要程度依然偏弱。為了進(jìn)一步優(yōu)化類別不均衡問(wèn)題,本研究引入了多分類Focal Loss[21]作為損失函數(shù),在損失反向傳播過(guò)程中均衡各類別間的重要性。本研究中用到的多分類Focal Loss見(jiàn)公式(1)。

      FL(pt)=-αt(1-pt)γlg(pt)。(1)

      式中:FL(pt)為第t類數(shù)據(jù)計(jì)算得到的損失值;αt是第t類的加權(quán)因子,類別樣本數(shù)越少的加權(quán)因子越大;γ為常數(shù),用于提高困難樣本的權(quán)重;pt為該樣本被預(yù)測(cè)為真值類的估計(jì)概率。

      1.3 "評(píng)價(jià)指標(biāo)

      為了評(píng)估所提出算法在番茄葉片病害識(shí)別任務(wù)上的有效性,本研究使用平均識(shí)別準(zhǔn)確率和各類識(shí)別準(zhǔn)確率來(lái)進(jìn)行模型效果評(píng)估。除此之外,為了評(píng)估模型篩選健康番茄和患病番茄的能力,本研究還采用了健康樣本識(shí)別精確率(health precision,HP,所有健康樣本被正確識(shí)別為健康的比例)和病害樣本識(shí)別精確率(disease precision,DP,所有病害樣本被正確識(shí)別為病害的比例)2個(gè)指標(biāo)來(lái)進(jìn)行算法效果評(píng)估。本研究中平均識(shí)別準(zhǔn)確率是所有樣本被正確識(shí)別的比例。

      2" 結(jié)果與分析

      2.1" 試驗(yàn)平臺(tái)和參數(shù)設(shè)置

      試驗(yàn)平臺(tái)設(shè)置:試驗(yàn)所涉及到的全部模型均在CPU為18 vCPU AMD EPYC 9754 128-Core Processor、GPU為NVIDIA GeForce RTX 4090D、顯存為24 GB的臺(tái)式計(jì)算機(jī)上進(jìn)行訓(xùn)練和測(cè)試。該計(jì)算機(jī)的操作系統(tǒng)為Unbutu 20.04,CUDA庫(kù)版本為11.3,深度學(xué)習(xí)框架為Python 3.8、Pytorch 1.10.0。

      訓(xùn)練參數(shù)設(shè)置:整體訓(xùn)練分為2個(gè)階段,訓(xùn)練前期和后期,通過(guò)判斷當(dāng)前參與訓(xùn)練的未標(biāo)注數(shù)據(jù)比例是否大于50%來(lái)區(qū)分。在訓(xùn)練前期,對(duì)模型推理結(jié)果與k-means聚類結(jié)果一致的樣本,其置信度截?cái)嘀翟O(shè)置為0.80,不一致的樣本設(shè)置為0.95。在訓(xùn)練后期,根據(jù)該類別被納入訓(xùn)練樣本的數(shù)量,置信度最大截?cái)嘀倒潭ㄔO(shè)置為0.95,而最小截?cái)嘀翟O(shè)定為0.80。模型共訓(xùn)練100輪,樣本批量大?。╞atchsize)設(shè)置為4,每次迭代均使用batchsize個(gè)標(biāo)注樣本和batchsize×7個(gè)未標(biāo)注樣本。初始學(xué)習(xí)率設(shè)置為0.03,學(xué)習(xí)率衰減策略為余弦退火衰減,優(yōu)化器為SGD、nesterov動(dòng)量系數(shù)為0.9。損失函數(shù)中,F(xiàn)ocal Loss的值設(shè)置為2.0。半監(jiān)督訓(xùn)練數(shù)據(jù)抽取比例μ為10%(2 000張)。

      試驗(yàn)使用的模型為WideResNet(wide residual networks),是ResNet的變種網(wǎng)絡(luò)模型。在本研究中,使用了深度為28層、寬度為2的WideResNet模型。本研究中使用到的所有數(shù)據(jù)增廣方式均與FixMatch算法一致。

      2.2" 消融試驗(yàn)

      2.2.1" 基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊消融試驗(yàn)" 為了判斷基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊的有效性,本研究設(shè)置了3組試驗(yàn),第1組為從全部數(shù)據(jù)中隨機(jī)挑選X×μ個(gè)數(shù)據(jù)作為標(biāo)注數(shù)據(jù),第2組為從k-means聚類結(jié)果中在各類別數(shù)據(jù)中隨機(jī)挑選X×μ/N個(gè)樣本組成訓(xùn)練數(shù)據(jù),第3組為本研究實(shí)際應(yīng)用的方案,即從k-means聚類結(jié)果中抽取距離各聚類中心最近的X×μ/N個(gè)數(shù)據(jù)作為標(biāo)注數(shù)據(jù)。基于這3種方案選取的數(shù)據(jù),本研究分別使用相同的試驗(yàn)設(shè)置進(jìn)行模型訓(xùn)練和測(cè)試,測(cè)試結(jié)果如表2所示。

      表2" 代表數(shù)據(jù)預(yù)選模塊消融試驗(yàn)結(jié)果

      方案精度最差類別準(zhǔn)確率(%)病害樣本識(shí)別精確率(%)健康樣本識(shí)別精確率(%)平均識(shí)別準(zhǔn)確率(%)

      第1組:隨機(jī)挑選30.6096.7695.8473.39

      第2組:類間隨機(jī)挑選87.5099.2098.5496.82

      第3組:本研究方案90.6299.8299.8997.31

      從表2可以看出,本研究實(shí)際使用方案的平均識(shí)別準(zhǔn)確率最高,超出第2組方案0.49百分點(diǎn),超出第1組方案23.92百分點(diǎn)。在精度最差類別上以及健康/病害樣本識(shí)別任務(wù)上,本研究方案的識(shí)別精度同樣大幅領(lǐng)先。這充分說(shuō)明了本研究提出的基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊在半監(jiān)督圖像分類任務(wù)中發(fā)揮了正向作用。試驗(yàn)中發(fā)現(xiàn),使用第1組隨機(jī)挑選方案的試驗(yàn)出現(xiàn)多次無(wú)法收斂的情況,這是由于抽取到的數(shù)據(jù)過(guò)于偏向于某一類或極其不具備代表性導(dǎo)致的。

      2.2.2" 基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊消融試驗(yàn)" 為了優(yōu)化半監(jiān)督圖像分類任務(wù)中模型訓(xùn)練前期亂預(yù)測(cè)和類別不均衡的問(wèn)題,本研究提出了基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊,為驗(yàn)證此模塊的有效性,本研究設(shè)計(jì)了2組試驗(yàn),第1組是將原始FixMatch的偽標(biāo)簽判斷模塊替換到本研究提出的方案中,第2組是本研究提出的方案,其他試驗(yàn)設(shè)置均相同,測(cè)試結(jié)果如表3所示。從表3可以看出,使用自適應(yīng)閾值截?cái)鄠螛?biāo)簽判斷模塊的第2組模型在番茄葉片病害識(shí)別任務(wù)上比第1組表現(xiàn)更優(yōu)異,平均識(shí)別準(zhǔn)確率超出0.81百分點(diǎn)。除此之外,第2組模型在少樣本類別(白粉?。┥系淖R(shí)別準(zhǔn)確率比第1組模型更是超出2.27百分點(diǎn),在困難類別(早疫?。┥铣?.00百分點(diǎn)。這充分說(shuō)明了本研究所提出的偽標(biāo)簽判斷模塊的有效性。

      2.2.3" 圖像多分類Focal Loss" 在其他試驗(yàn)設(shè)置均使用最優(yōu)方案的基礎(chǔ)上,本研究還設(shè)置了2組對(duì)比試驗(yàn)用于驗(yàn)證引入的圖像多分類Focal Loss的有效性,分別使用原始交叉熵?fù)p失和使用多分類Focal Loss作為模型損失函數(shù)。從表4可以看出,使用Focal

      Loss使得困難類別早疫病識(shí)別準(zhǔn)確率提升1.67百分點(diǎn),少樣本類別葉霉病識(shí)別準(zhǔn)確率提升0.55百分點(diǎn),平均識(shí)別準(zhǔn)確率超出0.52百分點(diǎn),由此可見(jiàn),在數(shù)據(jù)均衡度較嚴(yán)重的數(shù)據(jù)上,F(xiàn)ocal Loss一定程度上可以提升半監(jiān)督圖像分類模型識(shí)別番茄葉片病害的準(zhǔn)確率。

      2.3" 算法性能分析

      為了驗(yàn)證改進(jìn)后的FixMatch算法相比于原始FixMatch算法的優(yōu)越性,將二者在番茄葉片病害識(shí)別任務(wù)上進(jìn)行對(duì)比測(cè)試,除本研究所提出的3個(gè)創(chuàng)新點(diǎn)外,其余的試驗(yàn)設(shè)置均一致,以保證試驗(yàn)結(jié)果對(duì)比的公平性。除此之外,使用同一個(gè)網(wǎng)絡(luò)模型和訓(xùn)練設(shè)置,使用挑選出來(lái)的數(shù)據(jù)進(jìn)行有監(jiān)督訓(xùn)練,和半監(jiān)督結(jié)果進(jìn)行對(duì)比測(cè)試。

      本研究提出的改進(jìn)后FixMatch和原始FixMatch算法在番茄葉片病害識(shí)別任務(wù)上的最終結(jié)果對(duì)比結(jié)果(表5)顯示,在抽樣比例為10%的情況下,改進(jìn)后的FixMatch算法在番茄葉片病害識(shí)別任務(wù)上均表現(xiàn)的更好,平均識(shí)別準(zhǔn)確率達(dá)到了98.16%,相比于原始FixMatch算法提升了1.34百分點(diǎn),相比于部分標(biāo)注數(shù)據(jù)進(jìn)行有監(jiān)督訓(xùn)練的方案提升了3.92百分點(diǎn)。除此之外,改進(jìn)后FixMatch算法在健康樣本識(shí)別和病害樣本識(shí)別任務(wù)上的識(shí)別精確率也超出原始FixMatch算法。圖3為原始FixMatch方法和本研究方法在測(cè)試集上的準(zhǔn)確率迭代曲線圖,可以看出,本研究方法相比于原始FixMatch方法而言迭代流程更穩(wěn)定,收斂的更快。

      3" 討論與結(jié)論

      本研究提出的改進(jìn)后的FixMatch算法經(jīng)過(guò)試驗(yàn)驗(yàn)證,在番茄葉片病害識(shí)別半監(jiān)督任務(wù)上表現(xiàn)優(yōu)異。改進(jìn)后的FixMatch算法在原始FixMatch算法的基礎(chǔ)上做了3個(gè)方面的改進(jìn):(1)提出了基于k-means聚類算法的代表數(shù)據(jù)預(yù)選模塊。通過(guò)預(yù)先使用k-means聚類算法,挑選出各類的代表性數(shù)據(jù)進(jìn)行標(biāo)注,保證半監(jiān)督模型向著收斂更快、更精確的方向迭代訓(xùn)練。(2)提出了基于自適應(yīng)閾值截?cái)嗟膫螛?biāo)簽判斷模塊,優(yōu)化了原始FixMatch算法未考慮到模型前期預(yù)測(cè)能力弱以及類別不均衡的問(wèn)題。(3)通過(guò)將k-means算法的聚類結(jié)果作為訓(xùn)練前期的參考值來(lái)彌補(bǔ)模型前期預(yù)測(cè)置信度較低的情況,并且使用自適應(yīng)閾值截?cái)嗟姆桨竵?lái)使得各類別參與無(wú)監(jiān)督訓(xùn)練的樣本數(shù)量盡可能維持均衡,以使得模型更好的迭代訓(xùn)練。與原始FixMatch算法相比,本研究提出的改進(jìn)后的FixMatch算法在番茄葉片病害識(shí)別任務(wù)上僅用10%的標(biāo)注數(shù)據(jù)便取得了98.16%的平均識(shí)別準(zhǔn)確率,相比原始FixMatch算法有較大提升,且訓(xùn)練過(guò)程收斂更快、迭代更平穩(wěn),這表明本文提出的改進(jìn)后FixMatch算法可以很好地解決現(xiàn)實(shí)場(chǎng)景中的番茄葉片病害識(shí)別任務(wù)。

      本研究所提出的改進(jìn)后FixMatch半監(jiān)督算法目前僅在公開(kāi)數(shù)據(jù)集上進(jìn)行真實(shí)采集情況模擬,后續(xù)將進(jìn)行番茄葉片病害數(shù)據(jù)集的真實(shí)采集,并且將此算法推廣到其他半監(jiān)督植物病害識(shí)別任務(wù)上去。

      參考文獻(xiàn):

      [1]高艷娜,牛華琳,李" 營(yíng),等. 基于主成分分析和聚類分析對(duì)不同番茄品種的綜合評(píng)價(jià)[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(12):106-113.

      [2]張領(lǐng)先,景嘉平,李淑菲,等. 基于圖像自動(dòng)標(biāo)注與改進(jìn)YOLO v5的番茄病害識(shí)別系統(tǒng)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(11):198-207.

      [3]儲(chǔ) "鑫,李" 祥,羅" 斌,等. 基于改進(jìn)YOLO v4算法的番茄葉部病害識(shí)別方法[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2023,39(5):1199-1208.

      [4]柴" 帥,李壯舉. 基于遷移學(xué)習(xí)的番茄病蟲(chóng)害檢測(cè)[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2019,40(6):1701-1705.

      [5]李大華,仲" 婷,王" 筍,等. 基于改進(jìn)ShuffleNet v2的輕量化番茄葉片病害識(shí)別[J]. 江蘇農(nóng)業(yè)科學(xué),2024,52(3):220-228.

      [6]王哲豪,范麗麗,何" 前. 基于MobileNet v2和遷移學(xué)習(xí)的番茄病害識(shí)別[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(9):215-221.

      [7]程湞湞,祁力鈞,程一帆,等. 基于M-LP特征加權(quán)聚類的果樹(shù)冠層圖像分割方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2020,51(4):191-198,260.

      [8]馮世杰,王艷平. 基于機(jī)器視覺(jué)的溫室作物行間雜草的識(shí)別[J]. 信陽(yáng)農(nóng)林學(xué)院學(xué)報(bào),2012,22(2):115-117.

      [9]倪智濤,胡偉健,李寶山,等. 一種基于圖像分類與目標(biāo)檢測(cè)協(xié)同的番茄細(xì)粒度病害識(shí)別方法[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(22):221-228.

      [10]張俊寧,畢澤洋,閆" 英,等. 基于注意力機(jī)制與改進(jìn)YOLO的溫室番茄快速識(shí)別[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(5):236-243.

      [11]郭小燕,于帥卿,沈航馳,等. 基于全局特征提取的農(nóng)作物病害識(shí)別模型[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(12):301-307.

      [12]馬" 麗,周巧黎,趙麗亞,等. 基于深度學(xué)習(xí)的番茄葉片病害分類識(shí)別研究[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào),2023,44(7):187-193.

      [13]陳林琳,姜大慶,蔡銀杰,等. 基于計(jì)算機(jī)視覺(jué)的芋頭病害監(jiān)測(cè)與識(shí)別[J]. 農(nóng)機(jī)化研究,2020,42(6):224-229.

      [14]姜晟久,鐘國(guó)韻. 基于可分離擴(kuò)張卷積和通道剪枝的番茄病害分類方法[J]. 江蘇農(nóng)業(yè)科學(xué),2024,52(2):182-189.

      [15]胡文藝,王洪坤,杜育佳. 基于SE模塊和ResNet的番茄病蟲(chóng)害識(shí)別方法[J]. 農(nóng)業(yè)工程,2022,12(9):33-40.

      [16]楊英茹,吳華瑞,張" 燕,等. 基于復(fù)雜環(huán)境的番茄葉部圖像病蟲(chóng)害識(shí)別[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào),2021,42(9):177-186.

      [17]孔江波,朱" 賀,張延文,等. 基于實(shí)例置信度推斷的半監(jiān)督小樣本植物病害圖像識(shí)別[J]. 江蘇農(nóng)業(yè)科學(xué),2022,50(12):229-237.

      [18]賈俊杰,李" 捷. 基于半監(jiān)督生成對(duì)抗網(wǎng)絡(luò)的病蟲(chóng)害圖像識(shí)別算法[J]. 武漢輕工大學(xué)學(xué)報(bào),2019,38(4):45-52.

      [19]江侯濤,馬善農(nóng). 基于半監(jiān)督的植物病害智能檢測(cè)研究[J]. 機(jī)電工程技術(shù),2024,53(2):221-224,290.

      [20]Sohn K,Berthelot D,Li C L,et al. FixMatch:simplifying semi-supervised learning with consistency and confidence[C]//Advantes in Neural lnformation Processing Systems,2020,33:596-608.

      [21]Lin T Y,Goyal P,Girshick R,et al. Focal loss for dense object detection[C]. 2017 IEEE International Conference on Computer Vision (ICCV),2017:2980-2988.

      猜你喜歡
      類別番茄聚類
      番茄炒蛋
      秋茬番茄“疑難雜癥”如何挽救
      番茄果實(shí)“起棱”怎么辦
      基于DBSACN聚類算法的XML文檔聚類
      服務(wù)類別
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      論類別股東會(huì)
      商事法論集(2014年1期)2014-06-27 01:20:42
      中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
      自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
      江北区| 北票市| 沂南县| 通榆县| 喜德县| 灵山县| 万荣县| 宝兴县| 磴口县| 平果县| 兴城市| 台东县| 陇川县| 聊城市| 黄陵县| 黑龙江省| 包头市| 新邵县| 阳信县| 阿鲁科尔沁旗| 赞皇县| 灵寿县| 麻城市| 阿坝| 泾阳县| 贵德县| 扶风县| 兴山县| 康保县| 邵阳县| 锡林郭勒盟| 延长县| 布尔津县| 探索| 曲周县| 绵竹市| 论坛| 保山市| 鹤山市| 正阳县| 苍南县|