• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于遷移模型集成的馬鈴薯葉片病害識(shí)別方法

      2023-09-11 08:46:17章廣傳李彤何云高泉葉榮錢曄馬自飛
      江蘇農(nóng)業(yè)科學(xué) 2023年15期
      關(guān)鍵詞:集成學(xué)習(xí)遷移學(xué)習(xí)馬鈴薯

      章廣傳 李彤 何云 高泉 葉榮 錢曄 馬自飛

      摘要:針對(duì)目前馬鈴薯葉片病害識(shí)別工作量大、準(zhǔn)確率低且主觀性強(qiáng)等熱點(diǎn)問題,提出1種通過ResNet34模型結(jié)合不同遷移方式進(jìn)行集成學(xué)習(xí)以快速識(shí)別馬鈴薯葉片病害圖像的方法。首先,利用多種遷移方式(全部參數(shù)遷移、特征提取、微調(diào)及全新訓(xùn)練4種訓(xùn)練方法),通過調(diào)整超參數(shù),使模型快速收斂達(dá)到全局最優(yōu)點(diǎn)。其次,使用混淆矩陣對(duì)多種遷移方式的訓(xùn)練模型結(jié)果進(jìn)行對(duì)比分析,微調(diào)模型識(shí)別準(zhǔn)確率達(dá)到95.45%。最后,利用集成學(xué)習(xí)將3種訓(xùn)練較優(yōu)的模型進(jìn)行集成并與微調(diào)模型進(jìn)行對(duì)比。通過試驗(yàn)建立了1個(gè)馬鈴薯葉片病害圖像數(shù)據(jù)集,結(jié)果表明,相比現(xiàn)有熱門神經(jīng)網(wǎng)絡(luò)模型,該數(shù)據(jù)集無論是識(shí)別準(zhǔn)確率還是識(shí)別效率均有顯著提升,通過對(duì)比發(fā)現(xiàn),試驗(yàn)的總體準(zhǔn)確率提升了3.68百分點(diǎn),達(dá)到99.13%,遷移學(xué)習(xí)能夠更快速地收斂,減少訓(xùn)練時(shí)間,并且集成學(xué)習(xí)能夠大幅提升平均識(shí)別準(zhǔn)確率。本研究提出的針對(duì)馬鈴薯葉片病害的識(shí)別方法成本低、精確率高,能更好地應(yīng)用于日常病害識(shí)別中,為植物葉片病害的智能診斷提供借鑒和參考。

      關(guān)鍵詞:馬鈴薯;病害識(shí)別;遷移學(xué)習(xí);ResNet;集成學(xué)習(xí)

      中圖分類號(hào):TP183;TP391.41 文獻(xiàn)標(biāo)志碼:A

      文章編號(hào):1002-1302(2023)15-0216-09

      基金項(xiàng)目:國(guó)家自然科學(xué)基金(編號(hào):32101611);云南省重大科技專項(xiàng)(編號(hào):202002AE090010);云南省基礎(chǔ)研究計(jì)劃(編號(hào):202101AU070096)。

      作者簡(jiǎn)介:章廣傳(1998—),男,安徽銅陵人,碩士,主要從事智慧農(nóng)業(yè)研究。E-mail:1535797658@qq.com。

      通信作者:李 彤,教授,主要從事智慧農(nóng)業(yè)研究。E-mail:tli@ynu.edu.cn。

      利用計(jì)算機(jī)圖像處理與模式識(shí)別技術(shù)對(duì)農(nóng)作物的病害進(jìn)行自動(dòng)識(shí)別是當(dāng)前研究的熱點(diǎn)。馬鈴薯與小麥、稻谷、玉米、高粱并稱為世界五大作物,中國(guó)是世界馬鈴薯總產(chǎn)量最多的國(guó)家。馬鈴薯病害發(fā)多于葉部,其中早疫病、晚疫病等等會(huì)對(duì)馬鈴薯的生長(zhǎng)造成嚴(yán)重影響。目前,在作物病害識(shí)別研究中,計(jì)算機(jī)視覺技術(shù)已經(jīng)發(fā)揮了舉足輕重的作用,尤其是對(duì)葉部病害的識(shí)別。大多數(shù)農(nóng)作物病害的識(shí)別是通過傳統(tǒng)機(jī)器學(xué)習(xí)的方法進(jìn)行的,包括支持向量機(jī)模型[1-3]等,但是這種方法的識(shí)別率較低、耗時(shí)長(zhǎng)。卷積神經(jīng)網(wǎng)絡(luò)模型[4-6]由可學(xué)習(xí)的權(quán)重和偏置常量的神經(jīng)元組成,每個(gè)神經(jīng)元都接收一些輸入,并做一些點(diǎn)積計(jì)算,輸出的是每個(gè)分類的分?jǐn)?shù),以及局部連接、池化等具體操作指令,使模型具有一點(diǎn)自我識(shí)別能力,從而提升在病害識(shí)別中的準(zhǔn)確率。目前,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)在小麥、煙草及蘋果等病害識(shí)別中取得良好效果[7-9]。在實(shí)際場(chǎng)景的應(yīng)用中,病害識(shí)別需要考慮許多實(shí)際因素,如光照條件、病害種類、病害程度等。直接使用卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練,可能會(huì)因?yàn)閿?shù)據(jù)集過小或不夠多樣化,導(dǎo)致模型的準(zhǔn)確率不夠理想[10]。

      遷移學(xué)習(xí)是將已有的數(shù)據(jù)或模型應(yīng)用在相關(guān)卻不同領(lǐng)域的問題中,通過在其他領(lǐng)域中學(xué)習(xí)到的知識(shí)來解決現(xiàn)有領(lǐng)域中數(shù)據(jù)不足的問題,從而提升學(xué)習(xí)的效率[11-13]。相關(guān)研究結(jié)果表明,遷移學(xué)習(xí)通過提升模型的魯棒性,能夠大幅縮短模型訓(xùn)練時(shí)間。鄭一力等研究發(fā)現(xiàn),將遷移學(xué)習(xí)應(yīng)用在Inception-V3等網(wǎng)絡(luò)訓(xùn)練可以很好地識(shí)別植物葉片病害[14]。張旭等改進(jìn)了ShuffleNetV2模型,其對(duì)蘋果葉片病害的識(shí)別準(zhǔn)確率達(dá)到98.95%[15]。隨著計(jì)算機(jī)圖像處理技術(shù)的發(fā)展,傳統(tǒng)機(jī)器學(xué)習(xí)具有的模型的復(fù)雜度高、難以應(yīng)用于實(shí)際等問題越發(fā)凸顯,不適合移動(dòng)設(shè)備的開發(fā)與應(yīng)用。本研究基于以上研究,收集網(wǎng)絡(luò)上的馬鈴薯葉片病害數(shù)據(jù)集,將ResNet34、遷移學(xué)習(xí)與集成學(xué)習(xí)相結(jié)合,改進(jìn)網(wǎng)絡(luò)的識(shí)別能力,以期為相關(guān)研究人員提供理論基礎(chǔ)與技術(shù)支持。

      集成學(xué)習(xí)使用多個(gè)學(xué)習(xí)機(jī)來解決同一問題,它通過調(diào)用一些簡(jiǎn)單的分類算法,以獲得多個(gè)不同的基學(xué)習(xí)機(jī),然后采用某種方式將這些學(xué)習(xí)機(jī)組合成一個(gè)集成學(xué)習(xí)機(jī)[16-17]。隨著集成學(xué)習(xí)研究隊(duì)伍的不斷壯大,集成學(xué)習(xí)技術(shù)得到了快速發(fā)展,集成學(xué)習(xí)方法已將其范圍擴(kuò)大到各個(gè)領(lǐng)域,包括醫(yī)療保健、金融、保險(xiǎn)、汽車、制造、生物信息學(xué)、航空航天等[16],使用集成學(xué)習(xí)的復(fù)合分類模型在很大程度上優(yōu)于單個(gè)分類模型,而且通過集成多個(gè)分類器模型,可以減少?gòu)V義誤差,提高分類性能[18-19]。近年來,對(duì)集成學(xué)習(xí)的理論和集成學(xué)習(xí)的算法研究在機(jī)器學(xué)習(xí)領(lǐng)域內(nèi)一直是一個(gè)熱點(diǎn),國(guó)際上機(jī)器學(xué)習(xí)界的權(quán)威學(xué)者Dietterich曾在AI Magazine上將集成學(xué)習(xí)列為機(jī)器學(xué)習(xí)領(lǐng)域四大研究方向的第1位。

      1 材料與方法

      1.1 總體框架

      為了提高對(duì)馬鈴薯葉片病害識(shí)別的準(zhǔn)確率,本研究提出基于遷移模型的集成學(xué)習(xí)方法,以期在目標(biāo)數(shù)據(jù)集樣本數(shù)量少的背景下,在不消耗其他資源的情況下提升模型的識(shí)別精度。首先,對(duì)訓(xùn)練樣本數(shù)據(jù)集進(jìn)行預(yù)處理并劃分?jǐn)?shù)據(jù)集,構(gòu)建圖像識(shí)別模型(ResNet34)以訓(xùn)練樣本數(shù)據(jù)集。隨后,利用ImageNet數(shù)據(jù)集訓(xùn)練ResNet34模型獲取模型權(quán)重,將其遷移至本研究搭建的圖像識(shí)別模型中,利用不同遷移方式進(jìn)行訓(xùn)練,得到不同模型,在測(cè)試集上對(duì)不同模型進(jìn)行集成學(xué)習(xí)(投票法)以提升識(shí)別準(zhǔn)確率,詳見圖1。

      1.2 ResNet34網(wǎng)絡(luò)

      隨著計(jì)算機(jī)技術(shù)的發(fā)展,研究者對(duì)圖像分類的要求越來越高,淺層的神經(jīng)網(wǎng)絡(luò)難以滿足圖像分類的需求,優(yōu)秀的深層網(wǎng)絡(luò)模型不斷被人們創(chuàng)造出來。但是,伴隨網(wǎng)絡(luò)的加深,出現(xiàn)了梯度消失、梯度爆炸與網(wǎng)絡(luò)退化等問題[20]。為了解決上述問題,He等提出,ResNet、ResNext可由一系列殘差塊堆疊而成,并且數(shù)量可以達(dá)到成百上千層[21]。本試驗(yàn)選擇的模型為ResNet34,其結(jié)構(gòu)如圖2、表1所示。對(duì)于表1中conv_3x、conv_4x、conv_5x對(duì)應(yīng)的一系列殘差結(jié)構(gòu),第1層殘差結(jié)構(gòu)都是虛線殘差結(jié)構(gòu),因?yàn)檫@一系列殘差結(jié)構(gòu)的第1層都有調(diào)整輸入特征矩陣520的使命(將特征矩陣的高、寬縮減為原來的一半,將深度channel調(diào)整成下一層殘差結(jié)構(gòu)所需要的)[20]。

      由圖3可見,上述提到的殘差結(jié)構(gòu)主要有2個(gè)結(jié)構(gòu),圖3-a的殘差結(jié)構(gòu)針對(duì)層數(shù)較少的網(wǎng)絡(luò),如ResNet18、ResNet34等,圖3-b是針對(duì)網(wǎng)絡(luò)層數(shù)較多的網(wǎng)絡(luò),如ResNet101、ResNet152等。

      1.3 超參數(shù)

      1.3.1 batch size batch_size指1次訓(xùn)練所抓取的數(shù)據(jù)樣本數(shù)量,其大小影響訓(xùn)練速度、模型優(yōu)化[22],其最大的好處在于使中央處理器(CPU)或圖形處理器(GPU)滿載運(yùn)行,提高了訓(xùn)練的速度,其次是使得梯度下降的方向更加準(zhǔn)確。梯度方差的公式如下:

      式中:m為batch_size設(shè)置的大小,本研究后續(xù)一律使用m代替,增大m可以使得梯度方差減小,使梯度更加準(zhǔn)確,而減小m會(huì)使梯度變化波動(dòng)大,網(wǎng)絡(luò)不容易收斂;g()為訓(xùn)練集上學(xué)得模型在x上的預(yù)測(cè)輸出;x為測(cè)試樣本;y為x的真實(shí)標(biāo)記。

      1.3.2 學(xué)習(xí)率 在卷積神經(jīng)網(wǎng)絡(luò)每次迭代時(shí),更新參數(shù)都會(huì)存在一定的誤差。學(xué)習(xí)率是深度學(xué)習(xí)中的重要超參數(shù),合適的學(xué)習(xí)率可以使損失函數(shù)在較短時(shí)間內(nèi)收斂到局部最小值[23]。當(dāng)學(xué)習(xí)率設(shè)置過小時(shí),損失函數(shù)的變化速度就會(huì)變慢,會(huì)大大增加網(wǎng)絡(luò)的收斂復(fù)雜度,如果損失函數(shù)曲線離理論最優(yōu)點(diǎn)較遠(yuǎn),會(huì)增加網(wǎng)絡(luò)達(dá)到極值的時(shí)間,并且很容易被困在局部最小值附近或者鞍點(diǎn)。當(dāng)學(xué)習(xí)率設(shè)置遠(yuǎn)超閾值時(shí),損失函數(shù)可能會(huì)直接跳過全局最優(yōu)點(diǎn),網(wǎng)絡(luò)永遠(yuǎn)無法達(dá)到理想狀態(tài)。

      1.4 遷移學(xué)習(xí)

      遷移學(xué)習(xí)的過程如圖4所示。遷移學(xué)習(xí)可以加快網(wǎng)絡(luò)模型的學(xué)習(xí)進(jìn)度,減少模型的收斂進(jìn)度。利用遷移學(xué)習(xí)可以將在ImageNet中訓(xùn)練好的模型的權(quán)重參數(shù)遷移到預(yù)訓(xùn)練模型中,實(shí)現(xiàn)對(duì)馬鈴薯葉片病害的有效識(shí)別。遷移方式有特征提取、全部參數(shù)遷移及部分遷移3種。

      1.4.1 特征提取 特征提取指在原模型中,除了全連接層外的全部參數(shù)都不更新,將原全連接層更換為隨機(jī)權(quán)重的新的全連接層,并且只更新全連接層的參數(shù)。

      1.4.2 全部參數(shù)遷移 全部參數(shù)遷移又稱模型遷移,源域模型和目標(biāo)域模型共享模型參數(shù),也就是將之前在源域中通過大量數(shù)據(jù)訓(xùn)練好的模型參數(shù)直接應(yīng)用在目標(biāo)域的模型上進(jìn)行預(yù)測(cè)。基于模型的遷移學(xué)習(xí)方法比較直接,該方法的優(yōu)點(diǎn)是可以充分利用模型之間存在的相似性,缺點(diǎn)是模型參數(shù)不易收斂。

      1.4.3 微調(diào) 使用預(yù)訓(xùn)練網(wǎng)絡(luò)初始化網(wǎng)絡(luò),用新數(shù)據(jù)訓(xùn)練部分卷積層。微調(diào)的大致過程如下:在預(yù)先訓(xùn)練過的網(wǎng)絡(luò)上添加新的隨機(jī)初始化層,預(yù)先訓(xùn)練的網(wǎng)絡(luò)參數(shù)也會(huì)被更新,但會(huì)使用較小的學(xué)習(xí)率以防止預(yù)先訓(xùn)練好的參數(shù)發(fā)生較大變化。常用的方法是固定底層的參數(shù)、調(diào)整一些頂層或具體層的參數(shù)。微調(diào)的好處是能夠減少訓(xùn)練參數(shù)的數(shù)量,有助于克服過擬合。

      1.5 集成學(xué)習(xí)

      集成學(xué)習(xí)是一種機(jī)器學(xué)習(xí)的方法,多個(gè)學(xué)習(xí)器被集中到一起來訓(xùn)練、解決同一個(gè)問題,與普通機(jī)器學(xué)習(xí)方法(試圖從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)一個(gè)模型)不同,集成學(xué)習(xí)可以從訓(xùn)練數(shù)據(jù)中的多個(gè)模型集成其優(yōu)點(diǎn),可使識(shí)別準(zhǔn)確率得到提高。目前廣泛使用的集成學(xué)習(xí)方法有Bagging法[19,24]、Boosting法[24-26]。集成學(xué)習(xí)中的投票法是選擇若干模型作為基礎(chǔ)學(xué)習(xí)器,用這些基礎(chǔ)學(xué)習(xí)器分別識(shí)別樣本,通過識(shí)別結(jié)果進(jìn)行投票,根據(jù)少數(shù)服從多數(shù)的原則,通過多個(gè)模型的集成降低方差,從而提高模型的魯棒性。

      在理想情況下,投票法的預(yù)測(cè)效果應(yīng)優(yōu)于任何一個(gè)基模型的預(yù)測(cè)效果。但是,投票法也有其局限性,即它對(duì)于所有模型的處理都是一樣的,也就是所有模型的權(quán)重對(duì)于最后結(jié)果的影響都一樣大。如果某個(gè)模型在特定的表現(xiàn)情況下很好,而在其他情況下的表現(xiàn)很差,這是使用投票法時(shí)需要考慮的一個(gè)問題。集成學(xué)習(xí)的訓(xùn)練策略如圖5所示。

      圖5中,投票機(jī)制是絕對(duì)多數(shù)投票法,以每次批量加載到網(wǎng)絡(luò)中的樣本為例,通過統(tǒng)計(jì)3個(gè)預(yù)測(cè)模型對(duì)病害圖像xi的預(yù)測(cè)結(jié)果y1i、y2i、y3i并進(jìn)行投票,投票法可表示為:

      式中:H(x)為投票結(jié)果;i表示第i個(gè)樣本;k表示第k個(gè)模型;Reject表示投票失??;yki表示第k個(gè)預(yù)測(cè)模型對(duì)第i個(gè)樣本的預(yù)測(cè)結(jié)果。

      2 結(jié)果與分析

      2.1 試驗(yàn)環(huán)境

      本試驗(yàn)采用Pytorch作為小麥病害識(shí)別中模型搭建、訓(xùn)練的平臺(tái),試驗(yàn)地點(diǎn)為云南省作物生產(chǎn)與智慧農(nóng)業(yè)重點(diǎn)實(shí)驗(yàn)室,試驗(yàn)時(shí)間為2022年5—11月。試驗(yàn)?zāi)P驮贕PU環(huán)境下訓(xùn)練,試驗(yàn)的軟件、硬件配置如表2所示。

      2.2 數(shù)據(jù)來源

      本試驗(yàn)以健康馬鈴薯葉片和4種病害馬鈴薯葉片(發(fā)生馬鈴薯早疫病的一般類別葉片、發(fā)生馬鈴薯早疫病較嚴(yán)重的葉片、發(fā)生馬鈴薯晚疫病的一般類別葉片和發(fā)生馬鈴薯晚疫病較嚴(yán)重的葉片)作為試驗(yàn)對(duì)象。試驗(yàn)數(shù)據(jù)來自AI Challenger 2018競(jìng)賽的數(shù)據(jù)集,選取其中的馬鈴薯類別作為本試驗(yàn)對(duì)象,共2 840幅,如圖6所示。

      2.3 數(shù)據(jù)增強(qiáng)與數(shù)據(jù)預(yù)處理

      由于試驗(yàn)中馬鈴薯葉片的病害數(shù)據(jù)集圖片有限且分布不均,因此選擇數(shù)據(jù)增強(qiáng)的方法擴(kuò)大數(shù)據(jù)集,以增強(qiáng)原數(shù)據(jù)集中存儲(chǔ)的病害圖像的多樣性,從而增強(qiáng)模型的泛化能力。數(shù)據(jù)增強(qiáng)技術(shù)包含多種變換方法,包括顏色的數(shù)據(jù)增強(qiáng)(色彩飽和度、對(duì)比度與亮度)、鏡像變換等。試驗(yàn)通過使用Python中的PTL模塊對(duì)所有試驗(yàn)數(shù)據(jù)圖像進(jìn)行水平翻轉(zhuǎn),以增強(qiáng)模型的魯棒性及適應(yīng)性。同時(shí),針對(duì)數(shù)據(jù)集中的某些病害進(jìn)行垂直翻轉(zhuǎn),以達(dá)到各類數(shù)據(jù)樣本相對(duì)平衡。數(shù)據(jù)增強(qiáng)后的所有樣本共計(jì)5 158幅。

      為了使模型訓(xùn)練更有效率,將5 158幅葉片病害圖像統(tǒng)一調(diào)整為224像素×224像素大小,并用0、1、2、3、4作為數(shù)據(jù)集標(biāo)簽分別代表健康馬鈴薯葉片、發(fā)生早疫病的一般馬鈴薯葉片、嚴(yán)重發(fā)生早疫病的馬鈴薯葉片、發(fā)生馬鈴薯晚疫病的一般葉片與嚴(yán)重發(fā)生馬鈴薯晚疫病的葉片。依據(jù)數(shù)據(jù)增強(qiáng)后的圖像劃分?jǐn)?shù)據(jù)集,按照8 ∶2的比例劃分?jǐn)?shù)據(jù)集,將數(shù)據(jù)集分為訓(xùn)練集和驗(yàn)證集,再將訓(xùn)練集按9 ∶1劃分成訓(xùn)練集與測(cè)試集數(shù)據(jù)增強(qiáng)后的圖像數(shù)量,如圖7所示。

      2.4 超參數(shù)的性能評(píng)估

      2.4.1 m對(duì)模型性能的影響 本環(huán)節(jié)探討不同m值(batch_size)對(duì)模型識(shí)別準(zhǔn)確率的影響。將m設(shè)置為4的倍數(shù),分別測(cè)試當(dāng)m=16、32、64時(shí)對(duì)模型準(zhǔn)確率的影響。從圖8可以看出,當(dāng)m=32時(shí),訓(xùn)練效果最為平滑,效果最好。

      2.4.2 學(xué)習(xí)率對(duì)模型性能的影響 本試驗(yàn)對(duì)3種不同的初始學(xué)習(xí)率進(jìn)行測(cè)試訓(xùn)練,如圖9所示,分別設(shè)置初始學(xué)習(xí)率為0.01、0.001、0.000 1、0.000 01,在同樣的m值下測(cè)試試驗(yàn)結(jié)果。當(dāng)初始學(xué)習(xí)率設(shè)置為0.01時(shí),訓(xùn)練測(cè)試效果不是很理想;當(dāng)初始學(xué)習(xí)率設(shè)置為0.001時(shí),準(zhǔn)確率繼續(xù)提升;當(dāng)初始學(xué)習(xí)率設(shè)置為0.000 1時(shí),準(zhǔn)確率仍在提升,達(dá)到85%;當(dāng)初始學(xué)習(xí)率設(shè)置為0.000 01時(shí),模型準(zhǔn)確率變低,模型收斂慢。因此 選擇初始學(xué)習(xí)率為0.000 1作為試驗(yàn)的默認(rèn)準(zhǔn)確率。

      2.5 特征圖的可視化

      對(duì)ResNet34網(wǎng)絡(luò)模型卷積塊進(jìn)行特征可視化,以方便觀察該模型的卷積過程及理解模型識(shí)別病害的總過程。從卷積塊的淺層到深層進(jìn)行選擇性的可視化。分別選取網(wǎng)絡(luò)的conv1層卷積、layer1_conv3卷積、layer1_conv4卷積進(jìn)行對(duì)比,從圖10可以看出,特征圖在第1次卷積時(shí)可以清楚地看到葉片的病害信息。隨著卷積層數(shù)的增加,對(duì)葉片的信息也越來越模糊,可以解釋為卷積神經(jīng)網(wǎng)絡(luò)淺層卷積層的特征提取更多的是對(duì)紋理和一些細(xì)節(jié)信息進(jìn)行提取,而深層卷積層的特征提取更多的是對(duì)抽象特征信息進(jìn)行提取。

      2.6 遷移學(xué)習(xí)方法的性能評(píng)估

      圖11是ResNet34訓(xùn)練模型與不同遷移學(xué)習(xí)方式的混淆矩陣的對(duì)比結(jié)果,混淆矩陣橫軸0、1、2、3、4分別代表真實(shí)類別的馬鈴薯健康葉片、發(fā)生早疫病的一般馬鈴薯葉片、嚴(yán)重發(fā)生馬鈴薯早疫病的葉片、發(fā)生馬鈴薯晚疫病的一般葉片與嚴(yán)重發(fā)生馬鈴薯晚疫病的葉片??v軸0、1、2、3、4分別代表模型預(yù)測(cè)類別的馬鈴薯健康葉片、發(fā)生早疫病的一般馬鈴薯葉片、嚴(yán)重發(fā)生馬鈴薯早疫病的葉片、發(fā)生馬鈴薯晚疫病的一般葉片與嚴(yán)重發(fā)生馬鈴薯晚疫病的葉片。當(dāng)模型預(yù)測(cè)類別與真實(shí)類別一一對(duì)應(yīng)時(shí),即混淆矩陣的藍(lán)色程度越深時(shí),意味著模型的預(yù)測(cè)效果越好。利用混淆矩陣比較容易判別模型的預(yù)測(cè)結(jié)果與真實(shí)結(jié)果之間的誤差。根據(jù)混淆矩陣判斷微調(diào)模型在識(shí)別嚴(yán)重發(fā)生馬鈴薯早疫病、發(fā)生馬鈴薯早疫病的一般情況和發(fā)生馬鈴薯晚疫病的一般情況時(shí)效果較好,全新訓(xùn)練模型在識(shí)別嚴(yán)重發(fā)生馬鈴薯晚疫病時(shí)的效果較好。分析可知,微調(diào)模型的總體識(shí)別效果較好。

      本次微調(diào)試驗(yàn)將ResNet34網(wǎng)絡(luò)的前6個(gè)層凍結(jié),然后對(duì)后面的卷積層及全連接層進(jìn)行重新訓(xùn)練。由于底層網(wǎng)絡(luò)收集的都是圖像的曲線、邊緣等一系列普遍特征,一般的卷積神經(jīng)網(wǎng)絡(luò)的底層網(wǎng)絡(luò)收集的信息都是相通的,因此保持這些權(quán)重不變,對(duì)后面部分網(wǎng)絡(luò)進(jìn)行重新訓(xùn)練,使其更為關(guān)注馬鈴薯病害數(shù)據(jù)集的一些特有特征,直到凍結(jié)所有卷積層,本試驗(yàn)的目的便是為了找到準(zhǔn)確率最高的微調(diào)方法。

      本試驗(yàn)主要研究3種遷移方式(全部遷移、特征提取和微調(diào))與全新訓(xùn)練隊(duì)模型準(zhǔn)確率、模型的精確率、模型的召回率、模型的特異率及迭代1次的時(shí)間,將這5個(gè)參數(shù)進(jìn)行對(duì)比,選擇比較好的3個(gè)模型進(jìn)行集成學(xué)習(xí)。其中,微調(diào)模型的識(shí)別效果最好,在整體準(zhǔn)確率上,微調(diào)模型的準(zhǔn)確率比全部遷移模型高1.51百分點(diǎn),比特征提取模型高9.52百分點(diǎn),比全新訓(xùn)練模型高3.68百分點(diǎn),精確率、召回率與特異率也有明顯的提升。每次迭代的時(shí)間也有大幅減少(除了與特征提取模型相比),特征提取凍結(jié)了除了全連接層之外的全部網(wǎng)絡(luò)的權(quán)重,能夠減少模型對(duì)預(yù)訓(xùn)練的卷積層的重新學(xué)習(xí)的過程,因此每次迭代的時(shí)間最短,而全部遷移模型、全新訓(xùn)練的模型都是每次更新卷積層的權(quán)重,所以每次迭代時(shí)間最長(zhǎng)。微調(diào)模型只凍結(jié)前6個(gè)層,對(duì)后面的卷積層和全連接層的權(quán)重進(jìn)行重新訓(xùn)練,因此每次迭代的時(shí)間相比較于全新訓(xùn)練、全部遷移會(huì)變短。采用準(zhǔn)確率作為模型結(jié)果的主要評(píng)價(jià)指標(biāo),對(duì)模型進(jìn)行進(jìn)一步改進(jìn),采用精確率(P)、召回率(R)和特異度(S)作為模型進(jìn)一步分析的評(píng)價(jià)指標(biāo),每個(gè)指標(biāo)均由混淆矩陣計(jì)算得到,詳見表3。

      準(zhǔn)確率(A):準(zhǔn)確率指模型能夠正確識(shí)別所有樣本中正確樣本的比例,公式如下:

      A=真正例+真反例真正例+假反例+假正例+真反例×100%。

      精確率(P):精確率指某類預(yù)測(cè)正確的樣本中真實(shí)正確樣本的比例,公式如下:

      P=真正例真正例+假正例×100%。

      召回率(R):召回率指某類正確樣本中的被正確預(yù)測(cè)的樣本所占比例,公式如下:

      R=真正例真正例+假反例×100%。

      特異度(S):特異度指某類反例的樣本中被預(yù)測(cè)為反例樣本所占比例,公式如下:

      S=真反例真反例+假正例×100%。

      2.7 集成學(xué)習(xí)對(duì)模型的提升

      從表4中對(duì)4種不同模型的效果對(duì)比可以看出,全部遷移、微調(diào)與全新訓(xùn)練的模型訓(xùn)練效果較好,因此選擇這3種模型進(jìn)行下一步的集成學(xué)習(xí)。由于微調(diào)模型的識(shí)別準(zhǔn)確率最高,因此將3種模型集成學(xué)習(xí)后的效果與微調(diào)模型進(jìn)行對(duì)比。

      本次集成學(xué)習(xí)主要通過全部遷移、全新訓(xùn)練、微調(diào)3種模型完成,首先將3種模型的預(yù)測(cè)結(jié)果分別導(dǎo)入3個(gè)不同的列表(list_a、list_b與list_c)中,再分別對(duì)列表中的類別進(jìn)行投票,選擇最終類別,得到投票預(yù)測(cè)準(zhǔn)確的圖片數(shù)量,繪制混淆矩陣,混淆矩陣如圖12所示。在微調(diào)模型的基礎(chǔ)上進(jìn)一步提高預(yù)測(cè)準(zhǔn)確率,對(duì)比結(jié)果如表5所示。

      馬鈴薯健康葉片經(jīng)過集成學(xué)習(xí)硬投票,沒有將微調(diào)識(shí)別錯(cuò)誤的樣本投票為正確的樣本,發(fā)生早疫病的一般馬鈴薯葉片經(jīng)過集成學(xué)習(xí)硬投票,將微調(diào)識(shí)別錯(cuò)誤的2個(gè)樣本全部轉(zhuǎn)化為正確樣本,嚴(yán)重發(fā)生馬鈴薯早疫病的葉片經(jīng)過集成學(xué)習(xí)硬投票,將微調(diào)識(shí)別錯(cuò)誤的6個(gè)樣本全部轉(zhuǎn)化為正確樣本,發(fā)生馬鈴薯晚疫病的一般葉片經(jīng)過集成學(xué)習(xí)硬投票,沒有將微調(diào)識(shí)別的錯(cuò)誤樣本投票為正確的樣本,嚴(yán)重發(fā)生馬鈴薯晚疫病的葉片經(jīng)過集成學(xué)習(xí)硬投票,將微調(diào)識(shí)別錯(cuò)誤的11個(gè)樣本中的9個(gè)轉(zhuǎn)化為正確樣本。集成學(xué)習(xí)的總體準(zhǔn)確率較微調(diào)模型提高了3.68百分點(diǎn),較全新訓(xùn)練模型提高了7.36百分點(diǎn)。

      3 結(jié)論

      針對(duì)馬鈴薯葉片樣本量少且背景復(fù)雜的病害圖像,本研究提出了一種在ImageNet上完成預(yù)訓(xùn)練的ResNet34網(wǎng)絡(luò),通過遷移學(xué)習(xí)、集成學(xué)習(xí)的方法對(duì)馬鈴薯葉片病害進(jìn)行了分類試驗(yàn),并就m、學(xué)習(xí)率、學(xué)習(xí)方法等因素對(duì)模型性能的影響進(jìn)行了對(duì)比分析,得到如下結(jié)論:ResNet34網(wǎng)絡(luò)可以自動(dòng)從原始數(shù)據(jù)中提取馬鈴薯葉片的病害特征,平均識(shí)別準(zhǔn)確率達(dá)到91.77%;對(duì)于全新訓(xùn)練而言,遷移學(xué)習(xí)可以充分利用在大型數(shù)據(jù)集上學(xué)習(xí)到的知識(shí),可以大幅縮短模型訓(xùn)練時(shí)間,約減少3/5。在同一學(xué)習(xí)率下,集成學(xué)習(xí)的平均識(shí)別準(zhǔn)確率相比全新訓(xùn)練提高了7.36百分點(diǎn);集成學(xué)習(xí)將不同遷移方式得到的模型進(jìn)行集成,最終結(jié)果優(yōu)于任何一種遷移方式得到的模型,相比微調(diào)模型,平均識(shí)別準(zhǔn)確率提高了3.68百分點(diǎn)。

      參考文獻(xiàn):

      [1]魏麗冉,岳 峻,李振波,等. 基于核函數(shù)支持向量機(jī)的植物葉部病害多分類檢測(cè)方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(增刊1):166-171.

      [2]張?jiān)讫?,?浩,張晴晴,等. 基于顏色特征和差直方圖的蘋果葉部病害識(shí)別方法[J]. 江蘇農(nóng)業(yè)科學(xué),2017,45(14):171-174.

      [3]劉 媛,馮 全.葡萄病害的計(jì)算機(jī)識(shí)別方法[J]. 中國(guó)農(nóng)機(jī)化學(xué)報(bào),2017,38(4):99-104.

      [4]郭小燕,于帥卿,沈航馳,等. 基于全局特征提取的農(nóng)作物病害識(shí)別模型[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(12):301-307,379.

      [5]孟 亮,郭小燕,杜佳舉,等. 一種輕量級(jí)CNN農(nóng)作物病害圖像識(shí)別模型[J]. 江蘇農(nóng)業(yè)學(xué)報(bào),2021,37(5):1143-1150.

      [6]曾偉輝,李 淼,李 增,等. 基于高階殘差和參數(shù)共享反饋卷積神經(jīng)網(wǎng)絡(luò)的農(nóng)作物病害識(shí)別[J]. 電子學(xué)報(bào),2019,47(9):1979-1986.

      [7]張紅濤,朱 洋,譚 聯(lián),等. 基于FA-SVM技術(shù)的煙草早期病害識(shí)別[J]. 河南農(nóng)業(yè)科學(xué),2020,49(8):156-161.

      [8]張 航,程 清,武英潔,等. 一種基于卷積神經(jīng)網(wǎng)絡(luò)的小麥病害識(shí)別方法[J]. 山東農(nóng)業(yè)科學(xué),2018,50(3):137-141.

      [9]孫 俊,譚文軍,毛罕平,等. 基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的多種植物葉片病害識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2017,33(19):209-215.

      [10]劉玉耀,彭瓊尹. 基于卷積神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)的甌柑病蟲害識(shí)別研究[J]. 熱帶農(nóng)業(yè)科學(xué),2022,42(9):64-70.

      [11]杜甜甜,南新元,黃家興,等. 改進(jìn)RegNet識(shí)別多種農(nóng)作物病害受害程度[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022,38(15):150-158.

      [12]李 好,邱衛(wèi)根,張立臣.改進(jìn)ShuffleNet V2的輕量級(jí)農(nóng)作物病害識(shí)別方法[J]. 計(jì)算機(jī)工程與應(yīng)用,2022,58(12):260-268.

      [13]孫 俊,朱偉棟,羅元秋,等. 基于改進(jìn)MobileNet-V2的田間農(nóng)作物葉片病害識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(22):161-169.

      [14]鄭一力,鐘剛亮,王 強(qiáng),等. 基于多特征降維的植物葉片識(shí)別方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(3):30-37.

      [15]張 旭,周云成,劉忠穎,等. 基于改進(jìn)ShuffleNetV2模型的蘋果葉部病害識(shí)別及應(yīng)用[J]. 沈陽農(nóng)業(yè)大學(xué)學(xué)報(bào),2022,53(1):110-118.

      [16]張春霞,張講社. 選擇性集成學(xué)習(xí)算法綜述[J]. 計(jì)算機(jī)學(xué)報(bào),2011,34(8):1399-1410.

      [17]楊融澤,柳 毅. 面向異常數(shù)據(jù)流的多分類器選擇集成方法[J]. 計(jì)算機(jī)工程與應(yīng)用,2018,54(2):107-113.

      [18]Tian Y,Zhao C J,Lu S L,et al. SVM-based multiple classifier system for recognition of wheat leaf diseases[C]//2012 World Automation Congress.Puerto Vallarta Mexico,2012.

      [19]車翔玖,于英杰,劉全樂. 增強(qiáng)Bagging集成學(xué)習(xí)及多目標(biāo)檢測(cè)算法[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版),2022,52(12):2916-2923.

      [20]郭玥秀,楊 偉,劉 琦,等. 殘差網(wǎng)絡(luò)研究綜述[J]. 計(jì)算機(jī)應(yīng)用研究,2020,37(5):1292-1297.

      [21]He K M,Zhang X Y,Ren S Q,et al. Deep residual learning for image recognition[C]//Computer vision and pattern recognition.IEEE,2016.

      [22]張忠林,余 煒,閆光輝,等. 基于ACNNC模型的中文分詞方法[J]. 中文信息學(xué)報(bào),2022,36(8):12-19,28.

      [23]王東方,汪 軍. 基于遷移學(xué)習(xí)和殘差網(wǎng)絡(luò)的農(nóng)作物病害分類[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(4):199-207.

      [24]Takemura A,Shimizu A,Hamamoto K. Discrimination of breast tumors in ultrasonic images by classifier ensemble trained with AdaBoost[J]. Electronics & Communications in Japan,2011,94(9):18-29.

      [25]金松林,來純曉,鄭 穎,等. 基于特征選擇和CNN+Bi-RNN模型的小麥抗寒性識(shí)別方法[J]. 江蘇農(nóng)業(yè)科學(xué),2022,50(10):201-207.

      [26]李 凱,崔麗娟. 集成學(xué)習(xí)算法的差異性及性能比較[J]. 計(jì)算機(jī)工程,2008(6):35-37.

      猜你喜歡
      集成學(xué)習(xí)遷移學(xué)習(xí)馬鈴薯
      馬鈴薯有功勞
      基于多特征融合的跨域情感分類模型研究
      奇異值分解與移移學(xué)習(xí)在電機(jī)故障診斷中的應(yīng)用
      基于稀疏編碼器與集成學(xué)習(xí)的文本分類
      基于屬性權(quán)重的Bagging回歸算法研究
      定邊馬鈴薯
      胖胖的馬鈴薯
      基于改進(jìn)的LogitBoost算法的垃圾網(wǎng)頁檢測(cè)研究
      科技視界(2015年27期)2015-10-08 11:01:28
      一種基于遷移極速學(xué)習(xí)機(jī)的人體行為識(shí)別模型
      大數(shù)據(jù)環(huán)境下基于遷移學(xué)習(xí)的人體檢測(cè)性能提升方法
      金塔县| 玉门市| 原阳县| 宝清县| 吴忠市| 邻水| 台北县| 宜丰县| 通海县| 丰镇市| 沙坪坝区| 天津市| 太仓市| 弥渡县| 长子县| 沅江市| 石泉县| 沁水县| 台州市| 黔西县| 黄龙县| 石景山区| 富蕴县| 顺义区| 南江县| 石河子市| 遵义县| 镇远县| 皮山县| 册亨县| 青阳县| 宜兴市| 龙游县| 淳安县| 吴桥县| 甘肃省| 都匀市| 茶陵县| 辉南县| 巴中市| 台东县|