孔江波 朱賀 張延文 黃建平
摘要:植物病害影響農(nóng)業(yè)生產(chǎn)的產(chǎn)量和質(zhì)量。針對現(xiàn)有小樣本植物病害識別方法大多數(shù)都是基于監(jiān)督式學(xué)習(xí)模型以及少數(shù)半監(jiān)督學(xué)習(xí)方法未判別偽標(biāo)注樣本的可信度的問題,提出一種基于實例置信度推斷的半監(jiān)督學(xué)習(xí)小樣本植物病害圖像識別方法。首先構(gòu)建ResNet-12網(wǎng)絡(luò)提取有標(biāo)注樣本和無標(biāo)注樣本的特征;其次利用極少數(shù)有標(biāo)簽的植物病害樣本訓(xùn)練SVM分類器,用分類器推斷無標(biāo)注樣本的類別并賦予偽標(biāo)簽;然后采用實例置信度推斷(ICI)算法獲取偽標(biāo)注樣本的置信度,迭代選擇可信的偽標(biāo)簽樣本加入訓(xùn)練拓展支持集;最后應(yīng)用訓(xùn)練后的網(wǎng)絡(luò)模型對植物病害圖像進(jìn)行識別。該方法能夠反映無標(biāo)注病害樣本的真實分布,迭代選擇最可信的偽標(biāo)注樣本進(jìn)行模型訓(xùn)練,從而提高模型的識別性能。試驗采用Plant Village公開數(shù)據(jù)集進(jìn)行10-way-5-shot試驗。結(jié)果顯示:在unlabel= 50的情況下識別準(zhǔn)確率為89.34%,病害的各項評價指標(biāo)均隨著無標(biāo)注樣本數(shù)量的增加而增加。結(jié)果表明本研究提出的方法從無標(biāo)注樣本中獲取到的信息是魯棒的,且識別準(zhǔn)確率優(yōu)于傳統(tǒng)遷移學(xué)習(xí),能有效提升小樣本條件下植物病害圖像的識別效果。
關(guān)鍵詞:植物病害;半監(jiān)督學(xué)習(xí);識別;小樣本學(xué)習(xí);深度學(xué)習(xí);置信度推斷
中圖分類號: TP391.41;S126文獻(xiàn)標(biāo)志碼: A
文章編號:1002-1302(2022)12-0229-09
收稿日期:2021-11-16
基金項目:中央高校基本科研業(yè)務(wù)費專項(編號:2572019CP19);黑龍江省自然科學(xué)基金(編號:TD2020C001)。
作者簡介:孔江波(1997—),男,甘肅永靖人,碩士研究生,主要從事模式識別研究。E-mail:kjb1206612461@163.com。
通信作者:黃建平,博士,副教授,博士生導(dǎo)師,主要從事目標(biāo)檢測、圖像處理相關(guān)研究。E-mail:jphuang@nefu.edu.cn。
植物病害是影響農(nóng)業(yè)生產(chǎn)安全和生態(tài)環(huán)境安全的嚴(yán)重生物災(zāi)害,因此及時且準(zhǔn)確地發(fā)現(xiàn)并識別出病害的種類,針對各個病害的特點采取相應(yīng)措施便能夠有效地減少病害帶來的危害[1-3]。
傳統(tǒng)的植物病害識別主要包括人工和儀器輔助的半自動識別方法,但在識別效率和識別準(zhǔn)確率方面難以滿足科學(xué)研究和實際生產(chǎn)中的大面積、快速檢測植物病蟲害的需要[4-5]。近年來,深度學(xué)習(xí)技術(shù)取得了長足進(jìn)步,深度學(xué)習(xí)技術(shù)在植物物種分類、林木圖像分割、植物病蟲害圖像識別等方面得到了廣泛的應(yīng)用[6-9]。Srdjan等將深度卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于植物病害圖像的識別領(lǐng)域,對健康葉片圖像及13類病害葉片圖像的識別準(zhǔn)確率為96.3%[10];黃建平等提出一種能夠依據(jù)特定數(shù)據(jù)集自動搜索出合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的植物病害圖像識別方法[11]。
訓(xùn)練深度學(xué)習(xí)模型需要大量的帶有標(biāo)簽的數(shù)據(jù)集來學(xué)習(xí)植物病害圖像的視覺特征以及不同植物間的視覺差異[12]。然而在現(xiàn)實中,標(biāo)注大規(guī)模植物病害樣本成本高昂,并且某些植物病害較為罕見,甚至很難采集到病害樣本。使用過少的標(biāo)注樣本訓(xùn)練深度學(xué)習(xí)模型很容易導(dǎo)致模型過擬合和泛化性能力差[13]。
近年來,基于小樣本學(xué)習(xí)(few-shot learning,F(xiàn)SL)[14-15] 的圖像識別方法得到了廣泛的關(guān)注。基于小樣本學(xué)習(xí)的圖像識別方法[16-17]主要包括數(shù)據(jù)增強(如半監(jiān)督學(xué)習(xí)[18]、GAN[19])、遷移學(xué)習(xí)[20](如基于特征[21]、基于共享參數(shù)[22])、度量學(xué)習(xí)(如匹配網(wǎng)絡(luò)[14]、原型網(wǎng)絡(luò)[15])、元學(xué)習(xí)(如MAML[23]、Meta-SGD[24]、Reptile[25])等方式。Wang等[26]與Argüeso等[12]采用Siamese網(wǎng)絡(luò)框架解決小樣本植物病害圖像分類問題;Yu等提出一種特征分割子網(wǎng)絡(luò)和斑點感知子網(wǎng)絡(luò)相結(jié)合的注意力機制[27];Hu等利用C-DCGAN網(wǎng)絡(luò)對茶葉病害樣本進(jìn)行擴充[28];謝軍等提出了基于2次遷移深度學(xué)習(xí)模型的小樣本茶樹病害識別方法[29];Li等首次將半監(jiān)督學(xué)習(xí)模型應(yīng)用于小樣本植物病害識別問題,但僅僅通過fine-tuning來迭代選擇偽標(biāo)注樣本更新模型,并沒有對偽標(biāo)注的置信度進(jìn)行判別[13]?;谛颖緦W(xué)習(xí)的植物病害識別方法在模型的泛化能力和準(zhǔn)確率方面取得了較好的性能,但依然存在以下2個問題:一方面,現(xiàn)階段小樣本植物病害圖像識別的研究大多數(shù)都是基于監(jiān)督式學(xué)習(xí)模型,未充分挖掘無標(biāo)注樣本的有用信息。另一方面,少數(shù)方法僅通過Fine-tuning來迭代賦予無標(biāo)注病害樣本偽標(biāo)注,并未判別偽標(biāo)注植物病害樣本的可信度,錯誤的偽標(biāo)注樣本加入訓(xùn)練會導(dǎo)致模型性能降低。
針對現(xiàn)有小樣本植物病害識別方法存在的問題,本研究提出一種基于實例置信度推斷的半監(jiān)督學(xué)習(xí)小樣本植物病害圖像識別方法。該方法利用實例置信度推斷(ICI)算法獲取偽標(biāo)注樣本的置信度,選擇可信的偽標(biāo)簽樣本加入訓(xùn)練拓展支持集,通過迭代選擇最可信的偽標(biāo)注樣本進(jìn)行模型訓(xùn)練,實現(xiàn)少量樣本下植物病害圖像的準(zhǔn)確識別。
1 植物病害識別方法
1.1 實例置信度推斷(ICI)算法
半監(jiān)督學(xué)習(xí)(semi-supervised learning,SSL)[18,30]是一種常見的機器學(xué)習(xí)范式,能夠在有標(biāo)注數(shù)據(jù)昂貴或稀缺的情況下,自動地利用現(xiàn)成的無標(biāo)注數(shù)據(jù)來改進(jìn)監(jiān)督式學(xué)習(xí)任務(wù),從而提升學(xué)習(xí)性能,適用于含有少數(shù)的標(biāo)注數(shù)據(jù)及多數(shù)的未標(biāo)注數(shù)據(jù)的學(xué)習(xí)問題,半監(jiān)督學(xué)習(xí)過程示意圖如圖1所示。半監(jiān)督學(xué)習(xí)模型通常是用有標(biāo)注的訓(xùn)練樣本來訓(xùn)練分類器,然后由訓(xùn)練好的分類器預(yù)測無標(biāo)注樣本的類別標(biāo)簽,并選擇這些有偽標(biāo)簽的無標(biāo)注樣本加入訓(xùn)練來更新分類器,起到數(shù)據(jù)增強的作用。但是倘若分類器僅由極少數(shù)的標(biāo)注樣本來訓(xùn)練,此時分類器對于無標(biāo)注樣本類別的預(yù)測準(zhǔn)確率很低,若將預(yù)測錯誤的偽標(biāo)注樣本加入訓(xùn)練將會降低分類器的分類性能。因此研究分類器賦予每個無標(biāo)簽樣本的偽標(biāo)簽置信度將有助于提高最終分類器的預(yù)測效果。D498D58D-9934-4195-8966-D0B98489D122
針對偽標(biāo)簽樣本置信度問題,Wang等提出了一種基于統(tǒng)計學(xué)的實例置信度推斷的方案(instance credibility inference,ICI)[31],該方案能夠反映無標(biāo)注樣本的真實分布,并且從無標(biāo)注樣本中獲得的信息是魯棒的。本研究使用該方法來推斷賦予無標(biāo)注植物病害圖像樣本偽標(biāo)簽的置信度。
針對N個類、每類n個樣本構(gòu)建的線性回歸模型如下:
yi=xTiβ+γi+i。(1)
式中:β∈Ed×N,為回歸系數(shù)矩陣;γi為與樣本有關(guān)的偶發(fā)參數(shù);xi∈Rd× 為樣本i對應(yīng)的特征向量;yi為樣本i的類別標(biāo)簽。
傳統(tǒng)方法對回歸系數(shù)β進(jìn)行優(yōu)化,以獲得最佳的線性回歸模型來預(yù)測樣本i的類別。受偶發(fā)參數(shù)問題相關(guān)研究[32]的啟發(fā),ICI算法假設(shè)當(dāng)對β的估計β^較弱時,γi的估計γi^可反映該樣本點的擬合程度,可將γi視為對線性回歸模型的修正,即‖γi‖越大,回歸模型對該樣本點的擬合程度越差,將樣本i歸屬為類別yi的可能性越低,若該樣本為偽標(biāo)注樣本時,能反映該偽標(biāo)注樣本的可信程度?;谏鲜鏊枷霕?gòu)建含偶發(fā)參數(shù)的標(biāo)簽樣本和偽標(biāo)簽樣本的線性回歸模型如下:
(β^,γ^)=argminβ,γ‖Y-Xβ-γ‖2F+λR(γ)。(2)
損失函數(shù)定義為:
L(β,γ)=‖Y-Xβ-γ‖2F+λR(γ)。(3)
式中:‖·‖2F為Frobenius范數(shù);γ=[γi]∈Rn×N,為偶發(fā)參數(shù);Y、X分別指標(biāo)簽和特征輸入;R(γ)=∑ni=1‖γi‖2 為懲罰項;λ為懲罰項系數(shù)。
ICI算法不關(guān)注β^的解,求公式(3)對β的偏導(dǎo)并令其為0,即Lβ=0:
β^=(XTX)+XT(Y-γ)。(4)
式中:(·)+為廣義逆矩陣。
利用γ來衡量每個偽標(biāo)簽樣本沿其正則化路徑的置信度,則可將問題重新定義為:
argminγ‖Y-H(Y-γ)-γ‖2F+λR(γ)。(5)
式中:H=X(XTX)+XT。進(jìn)一步定義X~=(1-H),Y~=X~Y,則公式(5)可化簡為:
argminγ‖Y~-X~γ‖2F+λR(γ)。(6)
由參考文獻(xiàn)[33]的理論值λmax=maxi‖X~TiY~‖2/n保證公式(6)的解全為0[33],得到列表λ∈[0,λmax]。正則化系數(shù)λ從0逐漸增大時,γ逐漸減小,當(dāng)某一項γi率先降為0,說明該樣本偽標(biāo)簽可信程度更高。因此可根據(jù)使γi變?yōu)?對應(yīng)的λ值對偽標(biāo)簽數(shù)據(jù)進(jìn)行排序,將低λ值下使γi變?yōu)?的樣本視為可信的偽標(biāo)簽樣本加入訓(xùn)練來更新分類器。
1.2 病害識別模型
本研究中將數(shù)據(jù)劃分為源域和目標(biāo)域,源域中包含大量有標(biāo)注植物病害樣本,目標(biāo)域包含大量無標(biāo)注植物病害樣本和少量有標(biāo)注植物病害樣本。模型訓(xùn)練過程共包含2個階段,分別是預(yù)訓(xùn)練階段和半監(jiān)督學(xué)習(xí)階段。利用半監(jiān)督學(xué)習(xí)階段最終更新后的分類器在小樣本植物病害目標(biāo)域的查詢集上測試分類效果。
預(yù)訓(xùn)練階段在大量有標(biāo)注的植物病害源域上進(jìn)行,該階段目的是訓(xùn)練特征提取網(wǎng)絡(luò)ResNet-12,獲得最佳預(yù)訓(xùn)練模型,并將其遷移泛化到小樣本植物病害目標(biāo)域中。半監(jiān)督學(xué)習(xí)階段在少量有標(biāo)注及大量無標(biāo)注的植物病害目標(biāo)域上進(jìn)行,該階段采用ICI算法推斷偽標(biāo)簽樣本的置信度,選擇最可信的偽標(biāo)簽樣本加入訓(xùn)練拓展支持集,從而提升分類器的分類性能。半監(jiān)督學(xué)習(xí)階段方法結(jié)構(gòu)示意圖見圖2,模型在包含少量有標(biāo)注樣本的支持集上進(jìn)行學(xué)習(xí),并在查詢集上測試分類效果。按照小樣本學(xué)習(xí)策略采用標(biāo)準(zhǔn)的N-way-m-shot來表示單次識別任務(wù),即支持集共包含N類,每類含有m個標(biāo)注樣本。具體步驟如下:(1)采用ResNet-12主干網(wǎng)絡(luò)提取有標(biāo)注樣本和無標(biāo)注樣本的特征,并用PCA對特征向量進(jìn)行降維;(2)采用PCA降維之后的有標(biāo)注植物病害特征訓(xùn)練SVM分類器,用訓(xùn)練好的SVM分類器推斷無標(biāo)注樣本的類別并賦予偽標(biāo)注;(3)由“1.1”節(jié)所述ICI算法推斷偽標(biāo)注樣本的置信度,迭代選擇可信的偽標(biāo)注樣本加入訓(xùn)練拓展支持集,優(yōu)化SVM分類器的性能;(4)不可信的偽標(biāo)簽樣本被返回并由逐步更新后的分類器重新賦予新的偽標(biāo)注并繼續(xù)由ICI推斷置信度;(5)重復(fù)上述過程,直到所有無標(biāo)簽樣本都被選中,此時所有的無標(biāo)簽樣本的偽標(biāo)簽都已經(jīng)唯一確定;(6)由最終更新后的分類器對查詢集中的測試樣本進(jìn)行預(yù)測。
本研究采用ReNet-12[3 34-35]作為特征提取網(wǎng)絡(luò),該網(wǎng)絡(luò)屬于ResNet[36]的輕量級版本,網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。該網(wǎng)絡(luò)包含4個殘差塊,每個殘差塊含有3個3×3的卷積層,每個卷積層后跟BatchNorm層并采用LeakRelu(0.1)激活函數(shù),每個殘差塊后都跟1個2×2的最大池化層減少模型參數(shù)和計算量。各個block中的過濾器數(shù)量分別為64、128、256和512,最后再經(jīng)過一個自適應(yīng)平均池化層產(chǎn)生輸入特征,經(jīng)全連接層輸出一個512維的特征向量,由PCA方法將512維特征向量縮減至5維,所有輸入圖像的尺寸大小均被調(diào)整為168×168×3。
2 試驗結(jié)果與分析
2.1 數(shù)據(jù)集劃分
本研究利用植物病害研究常用的公共數(shù)據(jù)集PlantVillage中的24類共46 340張健康植物樣本圖像以及病害植物樣本圖像進(jìn)行試驗。其中,源域14類共35 186張植物病害樣本,分別為健康蘋果、健康藍(lán)莓、橘子黃龍病、桃細(xì)菌性斑點病、健康辣椒、健康大豆、南瓜白粉病、番茄細(xì)菌性斑點病、健康番茄、番茄晚疫病、番茄斑枯病、番茄二斑葉螨病、番茄輪斑病、番茄黃曲病;目標(biāo)域10類共11 154張植物病害樣本,分別為櫻桃白粉病、玉米銹病、健康玉米、葡萄黑腐病、葡萄黑痘病、葡萄葉枯病、馬鈴薯早疫病、馬鈴薯晚疫病、草莓葉焦病和番茄早疫病。圖4為目標(biāo)域每一類病害圖像示例。D498D58D-9934-4195-8966-D0B98489D122
2.2 試驗參數(shù)設(shè)置
本研究所有試驗均在ubuntu 14.04平臺下完成,采用python語言及pytorch深度學(xué)習(xí)框架,計算機內(nèi)存16 GB,搭載CPU為ES-2650 v4,2.20 Hz×13;GPU為NVIDIA TITAN Xp,12 GB顯存。
預(yù)訓(xùn)練階段:本研究采用帶動量的SGD優(yōu)化器訓(xùn)練預(yù)訓(xùn)練模型,動量因子設(shè)置為0.9。采用交叉熵?fù)p失函數(shù),L2權(quán)重衰減設(shè)為1×10-4,初始學(xué)習(xí)率為0. 每30個epochs衰減10倍,總共120個epochs。隨機抽取源域中每類10%的樣本構(gòu)建驗證集,取驗證集驗證準(zhǔn)確率最高的epoch對應(yīng)的預(yù)訓(xùn)練模型作為最佳遷移學(xué)習(xí)模型并遷移至目標(biāo)域中。
半監(jiān)督學(xué)習(xí)階段:固定全連接層前的所有卷積層并保留每一層的權(quán)重,僅由支持集訓(xùn)練分類器。所有試驗采用L2范數(shù)歸一化病害圖像特征并采用PCA降維和SVM分類器進(jìn)行分類。本研究通過隨機采樣多個小樣本環(huán)境驗證所提出的基于實例置信度推斷半監(jiān)督學(xué)習(xí)模型的小樣本植物病害圖像的識別效果。單個小樣本環(huán)境下的測試任務(wù)為1個episode,所有試驗均取500個episodes分類效果的平均值來評估模型的性能。在N-ways-m-shot-unlabel-k任務(wù)中,每個episode選取支持集中的10類植物病害,每類5個標(biāo)注樣本及k個未標(biāo)注樣本,并在查詢集中的每類15張樣本上進(jìn)行測試,即每個episode樣本共10×(5+k+15)張植物病害圖像。
2.3 量化評價指標(biāo)
為量化評估本研究提出模型的準(zhǔn)確性和有效性,本研究采用準(zhǔn)確率、查準(zhǔn)率、查全率及F1值4個評價指標(biāo)。評價指標(biāo)中的變量定義如表1所示。
準(zhǔn)確率(accuracy,Acc)表示正確分類的樣本數(shù)量與總樣本數(shù)量的比值,定義如下:
Acc=TP+TNTP+TN+FP+FN×100%。(7)
查準(zhǔn)率(precision,P)表示預(yù)測為正樣本中預(yù)測正確的比值,定義如下:
P=TPTP+FP×100%。(8)
查全率(recall,R)表示正確分類的正樣本數(shù)量與總的正樣本數(shù)量的比值,定義如下:
R=TPTP+FN×100%。(9)
F1值表示查準(zhǔn)率和查全率的調(diào)和平均數(shù),定義如下:
F1=2×R×PR+P。(10)
本研究所有消融試驗和對比試驗采用準(zhǔn)確率作為評價指標(biāo),而對于每類植物病害的分類效果采用查準(zhǔn)率、查全率及F1值這3項評價指標(biāo)。
2.4 試驗結(jié)果與分析
本研究包含10類植物病害(10-way),采用每類僅有的5個有標(biāo)注樣本進(jìn)行試驗(5-shot任務(wù)),測試所提出模型對小樣本植物病害圖像的分類效果。所有試驗采用迭代的方式加入無標(biāo)注樣本,每次迭代為每類選擇5個無標(biāo)注樣本,每個測試任務(wù)無標(biāo)注樣本的數(shù)量分別為15、30、50時的分類結(jié)果如表2所示,其中查全率、查準(zhǔn)率及F1值的測試結(jié)果均為500個episodes測試結(jié)果的平均值。
由表2對10-way-5-shot任務(wù)的分類結(jié)果可知,隨著無標(biāo)注樣本的增加,用于評價本研究模型對10類植物病害分類效果的3項指標(biāo)均取得了不同程度的提高,每類植物病害的無標(biāo)注樣本數(shù)量由15增加至50的過程中,查準(zhǔn)率、查全率及F1值的平均值分別提高了1.03%、1.09%、1.28%。證明本研究所采用的小樣本植物病害識別模型能夠獲得良好的識別效果,同時模型的性能隨著加入的無標(biāo)注樣本數(shù)量的增加而提高。
基于ICI算法的分析,本研究不設(shè)置具體的閾值來劃分可信和不可信的偽標(biāo)簽樣本,而是根據(jù)使γi變?yōu)?對應(yīng)的λ值對偽標(biāo)簽樣本進(jìn)行排序,ICI算法會迭代地選擇在低λ值下使γi變?yōu)?的樣本,這樣能夠以更高的概率得到分類器判斷正確的偽標(biāo)注樣本,將更為可信的偽標(biāo)注樣本加入訓(xùn)練從而增強分類器的分類性能。為驗證這一算法的有效性,本研究通過Sklearn庫可視化γi的正則化路徑如圖5所示。其中,紅線為ICI算法預(yù)測正確的樣本,黑線為預(yù)測錯誤的樣本,可以看出大部分預(yù)測正確的植物病害樣本都集中在曲線下方且γi率先變?yōu)?,為保證以更高的概率將正確的偽標(biāo)注加入訓(xùn)練來拓展支持集,ICI算法會選擇黑線下方的偽標(biāo)注樣本。
2.5 消融試驗
2.5.1 主干網(wǎng)絡(luò)對比
本研究對比了主干網(wǎng)絡(luò)ResNet-12、ConvNet、MobileNet、ResNet-18和DenseNet-121在unlabel=15、30條件下小樣本植物病害的分類準(zhǔn)確率。準(zhǔn)確率和每一個episode的平均測試時間結(jié)果如表3所示。從表3可以看出,對于所有特征提取網(wǎng)絡(luò),隨著為每類隨機選取的無標(biāo)注樣本數(shù)量的增加,模型的分類性能也得到提升。采用DenseNet-121特征提取網(wǎng)絡(luò)獲得了最好的識別效果,但其推斷時間也較長。因此,本研究采用兼顧網(wǎng)絡(luò)結(jié)構(gòu)簡單且分類準(zhǔn)確率較高的ResNet-12作為特征提取網(wǎng)絡(luò)。
2.5.2 episodes數(shù)確定
本研究隨機采樣多個不重復(fù)的episode,每個episode都能輸出1個分類準(zhǔn)確率,取所有episode準(zhǔn)確率的平均值來評估模型的性能。在10-way-5-shot,無標(biāo)注樣本數(shù)分別為15、30、50時每一個episode下的平均準(zhǔn)確率如圖6所示。在500個episode左右時模型的平均準(zhǔn)確率均收斂于一個很小的區(qū)間之內(nèi),此時平均準(zhǔn)確率的值能夠反映模型整體分類性能,因此所有試驗設(shè)置episode數(shù)為500。同時該圖還能直觀地反映出當(dāng)為每類加入的無標(biāo)注樣本數(shù)量增加時,模型每一個episode對植物病害圖像的分類準(zhǔn)確率也在增加。
2.5.3 降維影響
降維后的維數(shù)(dimension,d)在10-way-5-shot-15-unlabel情況下對植物病害測試準(zhǔn)確率的影響結(jié)果如表4所示。表4中顯示了降維到2、5、10、15、30、50、100、200及不降維(d=512)的分類準(zhǔn)確率和每一個episode的平均測試時間。由表4中數(shù)據(jù)可以看出,168×168×3大小的病害樣本經(jīng)主干網(wǎng)絡(luò)提取特征并輸出512維的特征向量中所包含的特征參數(shù)是冗余的,當(dāng)d=100時本研究模型對植物病害樣本分類的準(zhǔn)確率最高,為89.32%。但是隨著維數(shù)的增加,每一個episode測試時間也增加,當(dāng)d=100時每一個episode的平均測試時間為92.43 s,時間成本過高,因此為兼顧每一個episode平均測試時間短且分類準(zhǔn)確率高的特征維數(shù)進(jìn)行試驗,模型中采用d=5。當(dāng)d=5時準(zhǔn)確率為88.25%,每一個episode的測試時間最短,為20.69 s。D498D58D-9934-4195-8966-D0B98489D122
2.5.4 優(yōu)化器影響
本研究對比了深度學(xué)習(xí)中常用的3種優(yōu)化器訓(xùn)練特征提取網(wǎng)絡(luò)分析其對識別結(jié)果的影響,訓(xùn)練樣本為14類植物病害共35 186張。圖7給出了Adam、Amsgrad、帶動量因子的SGD的訓(xùn)練損失以及驗證精度在訓(xùn)練過程中的對比,動量因子設(shè)置為0.9。從圖7中可以看出,帶動量的SGD優(yōu)化器無論是收斂速度還是驗證集的準(zhǔn)確率都表現(xiàn)出了更為優(yōu)秀的性能。因此,本研究選擇了帶動量因子的SGD優(yōu)化器訓(xùn)練遷移學(xué)習(xí)模型。
2.5.5 遷移學(xué)習(xí)對比
本研究方法迭代地選擇可信的偽標(biāo)注樣本來擴充支持集,每次迭代為每類選擇5個無標(biāo)注樣本。當(dāng)加入的無標(biāo)簽樣本數(shù)量分別為15、30、50時迭代次數(shù)與每次迭代的分類準(zhǔn)確率如圖8所示。3條折線的起點準(zhǔn)確率均為86.68%,此時對應(yīng)遷移學(xué)習(xí)的準(zhǔn)確率。無標(biāo)注樣本數(shù)為15時,共經(jīng)歷3次迭代達(dá)到最高分類準(zhǔn)確率88.25%;無標(biāo)注樣本數(shù)為30時經(jīng)歷6次迭代達(dá)到最高分類準(zhǔn)確率88.58%;而無標(biāo)注樣本數(shù)為50時共經(jīng)歷10次迭代達(dá)到最高分類準(zhǔn)確率89.34%。當(dāng)無標(biāo)注樣本數(shù)為50時,隨著迭代次數(shù)增加,本研究模型對植物病害圖像識別準(zhǔn)確率的提升會減慢,這符合邊際效應(yīng)遞減的規(guī)律。
本研究方法與單純采用遷移學(xué)習(xí)方式(transfer learning,TL)的小樣本植物病害圖像的分類準(zhǔn)確率的對比結(jié)果如表5所示。當(dāng)每類植物病害僅有5個有標(biāo)簽樣本參與訓(xùn)練時,單純的采用遷移學(xué)習(xí)方法只能達(dá)到86.68%的分類準(zhǔn)確率,而本研究模型在每類加入無標(biāo)注樣本數(shù)量為15、30和50時,分類準(zhǔn)確率分別提高了1.57%、1.9%、2.66%。本研究提出的基于實例置信度推斷的半監(jiān)督學(xué)習(xí)的小樣本植物病害圖像識別方法優(yōu)于傳統(tǒng)的遷移學(xué)習(xí)方法。
2.5.6 數(shù)據(jù)增強方法對比
本研究方法采用ICI算法選擇可信的偽標(biāo)注病害樣本加入訓(xùn)練,起到數(shù)據(jù)增強的作用。在機器學(xué)習(xí)領(lǐng)域轉(zhuǎn)導(dǎo)推理(transductive inference,TI)[37-38]方法假設(shè)未標(biāo)注樣本就是測試樣本,也可達(dá)到數(shù)據(jù)增強的目的。轉(zhuǎn)導(dǎo)推理即預(yù)先觀察了所有樣本,包括支持集中的樣本(帶標(biāo)簽)以及查詢集中的樣本(不帶標(biāo)簽),從觀察到的樣本中進(jìn)行學(xué)習(xí)后對查詢集樣本進(jìn)行預(yù)測。盡管訓(xùn)練時不知道測試樣本的真實類別,但可以從特征分布中學(xué)習(xí)到知識,取得最佳泛化能力,為模型帶來增益。本研究對比半監(jiān)督學(xué)習(xí)方法與轉(zhuǎn)導(dǎo)學(xué)習(xí)的小樣本植物病害分類準(zhǔn)確率,對比試驗滿足數(shù)據(jù)增強的樣本數(shù)一致,即半監(jiān)督設(shè)置unlabel=15,同時測試樣本為每類15個,將每類的15個測試樣本用于轉(zhuǎn)導(dǎo)學(xué)習(xí)獲取知識,試驗結(jié)果如表6所示。
從表6可以看出,轉(zhuǎn)導(dǎo)學(xué)習(xí)與本研究所采用的半監(jiān)督學(xué)習(xí)方法在小樣本的植物病害圖像識別方面都表現(xiàn)出了較為優(yōu)秀的識別準(zhǔn)確率。由于轉(zhuǎn)導(dǎo)推理直接將測試樣本作為無標(biāo)注樣本幫助訓(xùn)練,效果比相同數(shù)量無標(biāo)注樣本下的半監(jiān)督學(xué)習(xí)模型準(zhǔn)確率高是符合預(yù)期的,但所提出的基于實例置信度推斷的半監(jiān)督學(xué)習(xí)模型用于小樣本植物病害識別性能僅僅略低于轉(zhuǎn)導(dǎo)學(xué)習(xí),這表明模型從無標(biāo)注病害樣本中獲取到的信息是魯棒的。
2.5.7 分類器對比
本研究基于10-way-5-shot-15-unlabel條件下對比了SVM、KNN、隨機森林、邏輯回歸4種常用的分類器對小樣本植物病害圖像的分類準(zhǔn)確率,結(jié)果如表7所示。由表7可得,SVM分類器對小樣本植物病害圖像得識別準(zhǔn)確率最高,因此本研究選擇SVM分類器進(jìn)行試驗。
3 結(jié)論
本研究針對病害標(biāo)注樣本數(shù)量極少的情況下分類準(zhǔn)確率過低及現(xiàn)有研究存在的問題,提出一種基于實例置信度推斷的半監(jiān)督學(xué)習(xí)小樣本植物病害圖像識別方法,該方法能夠充分利用未標(biāo)注樣本為模型帶來增益,采用Plant Village數(shù)據(jù)集構(gòu)建10類小樣本植物病害目標(biāo)域進(jìn)行了試驗,主要結(jié)論如下:
(1)本研究方法能夠?qū)崿F(xiàn)小樣本植物病害較為精確的識別,在無標(biāo)注植物病害樣本數(shù)分別為15、30和50情況下每類植物病害的各項評價指標(biāo)都隨無標(biāo)注樣本數(shù)量的增加而增加。
(2)本研究對半監(jiān)督學(xué)習(xí)模型進(jìn)行了優(yōu)化,通過對比試驗證明該模型優(yōu)于傳統(tǒng)的遷移學(xué)習(xí)方法。且基于實例置信度推斷的半監(jiān)督學(xué)習(xí)模型能夠反映無標(biāo)注植物病害樣本的真實分布,從無標(biāo)注病害樣本中獲取到的信息是魯棒的,因此本研究方法能夠滿足在現(xiàn)實條件下的小樣本植物病害識別需要。
(3)本研究所提出的小樣本植物病害方法對于任何特征提取網(wǎng)絡(luò)均能體現(xiàn)出模型的有效性。
本研究方法為實現(xiàn)小樣本數(shù)據(jù)下植物病害圖像實時、準(zhǔn)確識別提供了技術(shù)手段。后續(xù)研究可進(jìn)一步擴充遷移學(xué)習(xí)的訓(xùn)練樣本數(shù)量及類別,提高特征提取能力;同時將細(xì)粒度網(wǎng)絡(luò)與半監(jiān)督學(xué)習(xí)模型相結(jié)合,提高植物病害細(xì)粒度圖像的識別效果。
參考文獻(xiàn):
[1]Kaur S,Pandey S,Goel S. Plants disease identification and classification through leaf images:a survey[J]. Archives of Computational Methods in Engineering,2019,26(2):507-530.
[2]翟肇裕,曹益飛,徐煥良,等. 農(nóng)作物病蟲害識別關(guān)鍵技術(shù)研究綜述[J]. 農(nóng)業(yè)機械學(xué)報,202 52(7):1-18.
[3]Strange R N,Scott P R. Plant disease:a threat to global food security[J]. Annual Review of Phytopathology,2005,43:83-116.
[4]Iqbal Z,Khan M A,Sharif M,et al. An automated detection and classification of citrus plant diseases using image processing techniques:a review[J]. Computers and Electronics in Agriculture,2018,153:12-32.D498D58D-9934-4195-8966-D0B98489D122
[5]Mahlein A K. Plant disease detection by imaging sensors-parallels and specific demands for precision agriculture and plant phenotyping[J]. Plant Disease,2016,100(2):241-251.
[6]Liu J,Wang X W. Plant diseases and pests detection based on deep learning:a review[J]. Plant Methods,202 17(1):22.
[7]孫 紅,李 松,李民贊,等. 農(nóng)業(yè)信息成像感知與深度學(xué)習(xí)應(yīng)用研究進(jìn)展[J]. 農(nóng)業(yè)機械學(xué)報,2020,51(5):1-17.
[8]Abade A,F(xiàn)erreira P A,de Barros V F. Plant diseases recognition on images using convolutional neural networks:a systematic review[J]. Computers and Electronics in Agriculture,202 185:106125.
[9]Lu J Z,Tan L J,Jiang H Y. Review on convolutional neural network (CNN) applied to plant leaf disease classification[J]. Agriculture,202 11(8):707.
[10]Sladojevic S,Arsenovic M,Anderla A,et al. Deep neural networks based recognition of plant diseases by leaf image classification[J]. Computational Intelligence and Neuroscience,2016,2016:3289801.
[11]黃建平,陳鏡旭,李克新,等. 基于神經(jīng)結(jié)構(gòu)搜索的多種植物葉片病害識別[J]. 農(nóng)業(yè)工程學(xué)報,2020,36(16):166-173.
[12]Argüeso D,Picon A,Irusta U,et al. Few-shot learning approach for plant disease classification using images taken in the field[J]. Computers and Electronics in Agriculture,2020,175:105542.
[13]Li Y,Chao X W. Semi-supervised few-shot learning approach for plant diseases recognition[J]. Plant Methods,202 17(1):68.
[14]Vinyals O,Blundell C,Lillicrap T P,et al. Matching networks for one shot learning[C]//NeurIPS16:Proceedings of the 30th International Conference on Neural Information Processing Systems. Barcelona,Spain:ACM,2016:3630-3638.
[15]Snell J,Swersky K,Zemel R S. Prototypical networks for few-shot learning[C]//NeurIPS17:Proceedings of the 31st International Conference on Neural Information Processing Systems(NeurIPS). Long Beach:ACM,2017:4077-4087.
[16]劉 穎,雷研博,范九倫,等. 基于小樣本學(xué)習(xí)的圖像分類技術(shù)綜述[J]. 自動化學(xué)報,202 47(2):297-315.
[17]趙凱琳,靳小龍,王元卓. 小樣本學(xué)習(xí)研究綜述[J]. 軟件學(xué)報,202 32(2):349-369.
[18]Zhu X J,Goldberg A B. Introduction to semi-supervised learning[J]. Synthesis Lectures on Artificial Intelligence and Machine Learning,2009,3(1):1-130.
[19]Goodfellow I,Pouget-Abadie J,Mirza M,et al. Generative adversarial networks[J]. Communications of the ACM,2020,63(11):139-144.
[20]Pan S J,Yang Q. A survey on transfer learning[J]. IEEE Transactions on Knowledge and Data Engineering,2010,22(10):1345-1359.
[21]Hariharan B,Girshick R. Low-shot visual recognition by shrinking and hallucinating features[C]//2017 IEEE International Conference on Computer Vision(ICCV).Venice:IEEE,2017:3037-3046.D498D58D-9934-4195-8966-D0B98489D122
[22]Qi H,Brown M,Lowe D G. Low-shot learning with imprinted weights[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City:IEEE,2018:5822-5830.
[23]Finn C,Abbeel P,Levine S. Model-agnostic meta-learning for fast adaptation of deep networks[C]//ICML17:Proceedings of the 34th International Conference on Machine Learning-Volume 70.2017:1126-1135.
[24]Li Z G,Zhou F W,Chen F,et al. Meta-SGD:learning to learn quickly for few-shot learning[EB/OL]. [2021-04-07]. https://arxiv.org/abs/1707.09835.
[25]Nichol A,Achiam J,Schulman J. On first-order meta-learning algorithms[EB/OL]. [2021-04-07]. https://arxiv.org/abs/1803.02999.
[26]Wang B,Wang D. Plant leaves classification:a few-shot learning method based on Siamese network[J]. IEEE Access,2019,7:151754-151763.
[27]Yu H J,Son C H. Leaf spot attention network for apple leaf disease identification[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).Seattle:IEEE,2020:229-237.
[28]Hu G S,Wu H Y,Zhang Y,et al. A low shot learning method for tea leafs disease identification[J]. Computers and Electronics in Agriculture,2019,163:104852.
[29]謝 軍,江朝暉,李 博,等. 基于二次遷移模型的小樣本茶樹病害識別[J]. 江蘇農(nóng)業(yè)科學(xué),202 49(6):176-182.
[30]周志華. 機器學(xué)習(xí) [M]. 北京:清華大學(xué)出版社,2016.
[31]Wang Y K,Xu C M,Liu C,et al. Instance credibility inference for few-shot learning[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle:IEEE,2020:12833-12842.
[32]Fan J Q,Tang R L,Shi X F.Partial consistency with sparse incidental parameters[J]. Statistica Sinica,2018,28:2633-2655.
[33]Simon N,F(xiàn)riedman J,Hastie T. A blockwise descent algorithm for group-penalized multiresponse and multinomial regression[EB/OL]. [2021-04-07]. https://arxiv.org/abs/1311.6529.
[34]Oreshkin B N,Rodriguez P,Lacoste A. Tadam:Task dependent adaptive metric for improved few-shot learning[C]//NeurIPS 18:Proceedings of the 32st International Conference on Neural Information Processing Systems. Montréal:ACM,2018:719-729.
[35]Mishra N,Rohaninejad M,Chen X,et al. A simple neural attentive meta-learner[C]//ICLR 018. Vancouver,2018.
[36]He K M,Zhang X Y,Ren S Q,et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition.Las Vegas:IEEE,2016:770-778.
[37]Joachims T. Transductive inference for text classification using support vector machines[C]//ICML 1999:Proceedings of the 16th International Conference on Machine Learning. Bled,1999:200-209.
[38]Vapnik V. Transductive inference and semi-supervised learning [J]. Semi-Supervised Learning. Cambridge:MIT Press,2006:453-472.D498D58D-9934-4195-8966-D0B98489D122