• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于ResNet 神經(jīng)網(wǎng)絡(luò)的花卉圖像分類研究

      2024-12-01 00:00:00趙友山
      電腦知識與技術(shù) 2024年32期

      摘要:本研究基于計算機視覺和深度學(xué)習(xí)技術(shù),提出了一種高效、準(zhǔn)確的花卉圖像識別與分類方法,采用基于殘差網(wǎng)絡(luò)(ResNet)的ResNet50卷積神經(jīng)網(wǎng)絡(luò)模型。相較于傳統(tǒng)的人工識別方式,該方法顯著提高了識別速度與準(zhǔn)確性,同時降低了成本。實驗驗證表明,ResNet50模型在花卉識別和分類任務(wù)中表現(xiàn)出卓越性能:驗證集準(zhǔn)確率達82.771%,Kappa系數(shù)為0.825,表明該方法具有出色的一致性和相對于隨機性的顯著改進。此外,本文對ResNet模型的結(jié)構(gòu)和性能進行了深入分析和討論,為未來在花卉分類領(lǐng)域的研究和應(yīng)用提供了有益的指導(dǎo)。本研究對推動植物學(xué)領(lǐng)域的數(shù)字化、智能化發(fā)展具有重要意義,為相關(guān)研究提供了有益參考。

      關(guān)鍵詞:深度學(xué)習(xí);ResNet;花卉識別;花卉分類

      中圖分類號:TP18 文獻標(biāo)識碼:A

      文章編號:1009-3044(2024)32-0023-03 開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID) :

      0 相關(guān)研究

      隨著計算機視覺和深度學(xué)習(xí)技術(shù)的快速發(fā)展及其廣泛應(yīng)用[1-2],將這些技術(shù)引入植物學(xué)研究領(lǐng)域,尤其是花卉圖像分類任務(wù)中,對推動植物學(xué)研究的智能化和數(shù)字化發(fā)展具有重要意義。本文將重點關(guān)注和探討計算機視覺技術(shù),特別是基于深度學(xué)習(xí)的方法在花卉圖像分類中的應(yīng)用研究。

      植物多樣性是生態(tài)系統(tǒng)中的關(guān)鍵組成部分,對于生態(tài)平衡和生物多樣性的維護至關(guān)重要。而在這個多樣的植物世界中,準(zhǔn)確識別和分類花卉是植物學(xué)研究的基礎(chǔ)。傳統(tǒng)的花卉分類方法通常依賴于人工觀察和專業(yè)知識,這不僅費時費力,而且容易受到主觀因素的影響[3-4]。因此,迫切需要一種高效、準(zhǔn)確且自動化的方法來進行花卉分類,以推動植物學(xué)研究的發(fā)展[5]。

      計算機技術(shù)在花卉分類上的應(yīng)用為這一需求提供了新的解決方案。計算機視覺技術(shù)通過模擬人類視覺系統(tǒng)的工作方式,使計算機能夠自動從圖像或視頻中提取信息。在花卉分類中,這意味著計算機可以學(xué)習(xí)和識別花卉的特征,實現(xiàn)對不同植物的自動分類。這種方法不僅能夠加速花卉分類的過程,還能提高分類的準(zhǔn)確性,減少人為誤差。

      本文將深入分析和討論基于計算機視覺的方法在花卉圖像分類任務(wù)中的應(yīng)用效果,探究其技術(shù)優(yōu)勢和局限,并對未來可能的改進和發(fā)展方向進行展望。通過本研究,有望為植物學(xué)領(lǐng)域提供一種更為高效和精確的花卉分類方法,推動植物學(xué)研究邁向數(shù)字化、智能化的新階段。

      1 材料和方法

      1.1 數(shù)據(jù)收集

      本文使用了Oxford 開源的花卉數(shù)據(jù)集,該數(shù)據(jù)集包含102個來自世界各地的常見花卉類別,涵蓋植物學(xué)中的多樣性,包括小型花朵、中型花卉和大型花卉等不同類型。每個類別的圖像數(shù)量在40到258張不等,均為在不同視角和光線環(huán)境下拍攝。這種設(shè)計使得數(shù)據(jù)集更具挑戰(zhàn)性,更能模擬真實世界中花卉圖像的多樣性。圖1展示了一部分節(jié)選的數(shù)據(jù)。

      1.2 數(shù)據(jù)預(yù)處理

      為了提升神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練過程中的準(zhǔn)確性、魯棒性和泛化能力,以應(yīng)對各種復(fù)雜情況,對花卉數(shù)據(jù)集進行了必要的數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理主要采用了數(shù)據(jù)增強技術(shù),包括以下步驟:

      1) 隨機裁剪。將原始圖像按照其大小的90%進行裁剪,以生成輸入。

      2) 隨機旋轉(zhuǎn)。分別將原始圖像旋轉(zhuǎn)45°、90°和135°。

      3) 高斯模糊。對部分圖像進行高斯模糊處理,生成較模糊的圖像作為輸入。

      通過這些數(shù)據(jù)增強操作,能夠有效提升模型在不同情境下的適應(yīng)性,并增強其在花卉分類任務(wù)上的性能。

      1.3 ResNet 神經(jīng)網(wǎng)絡(luò)

      ResNet(Residual Network) 由Kaiming He 等人于2015年提出,是一種深度神經(jīng)網(wǎng)絡(luò)架構(gòu)[6]。其設(shè)計獨特之處在于引入了殘差學(xué)習(xí)的思想,通過使用殘差塊(Residual Blocks) 使信息在網(wǎng)絡(luò)中更直接地傳遞,有效解決了深度神經(jīng)網(wǎng)絡(luò)中的梯度消失和梯度爆炸問題。這使得ResNet能夠輕松訓(xùn)練數(shù)百層的深度網(wǎng)絡(luò),為圖像分類等任務(wù)提供了強大的表征能力[7]。

      在本研究中,選擇ResNet50作為基礎(chǔ)模型,原因在于其卓越的性能和對深層網(wǎng)絡(luò)的有效訓(xùn)練。ResNet50的網(wǎng)絡(luò)結(jié)構(gòu)包含多個關(guān)鍵組件:

      1) 輸入層。接受大小為224×224像素的RGB圖像,并通過一系列卷積、池化和規(guī)范化操作逐漸提取特征。

      2) 第一卷積層。由7×7的卷積核組成,步幅為2,用于降低圖像分辨率,隨后的3×3最大池化層進一步提取特征。

      3) 殘差塊。每個殘差塊包含兩個卷積層和一個跳躍連接(殘差連接),幫助緩解梯度消失問題,使網(wǎng)絡(luò)更易于訓(xùn)練。整個網(wǎng)絡(luò)被劃分為四個階段,每個階段包含一系列殘差塊,這有助于從低級到高級學(xué)習(xí)不同層次的特征。

      3) 全局平均池化層。通過計算每個特征圖的平均值來降低空間維度,減少參數(shù)數(shù)量,從而幫助防止過擬合。

      4) 全連接層。用于輸出對不同花卉類別的概率分布。

      ResNet通過引入殘差連接,使網(wǎng)絡(luò)可以更深,同時減輕了梯度傳播的問題,這對于花卉分類任務(wù)中處理復(fù)雜特征是至關(guān)重要的。

      1.4 遷移學(xué)習(xí)

      遷移學(xué)習(xí)是一種機器學(xué)習(xí)方法,其核心思想是通過將已學(xué)到的知識遷移到新任務(wù)上,從而提高模型在新任務(wù)上的性能[8]。在計算機視覺領(lǐng)域,遷移學(xué)習(xí)通常使用在大規(guī)模圖像數(shù)據(jù)上預(yù)訓(xùn)練的模型。此方法的優(yōu)勢在于預(yù)訓(xùn)練模型已經(jīng)學(xué)會了通用的圖像特征,可以在新任務(wù)中提供更好的初始化參數(shù),進而縮短模型的訓(xùn)練時間。

      1.5 ResNet 神經(jīng)網(wǎng)絡(luò)在花卉分類任務(wù)中的應(yīng)用

      本文通過使用在大規(guī)模圖像數(shù)據(jù)集(如Ima?geNet) 上預(yù)訓(xùn)練的ResNet模型,充分利用其已學(xué)到的豐富圖像特征,包括邊緣、紋理和高級語義特征。這一選擇的合理性在于,預(yù)訓(xùn)練的ResNet已經(jīng)在各種圖像任務(wù)中表現(xiàn)出卓越性能,通過遷移這些學(xué)到的特征,可以更為有效地訓(xùn)練模型,從而在花卉分類任務(wù)中取得更好的性能表現(xiàn)。

      在花卉分類任務(wù)中,本文采用了遷移學(xué)習(xí)的方法,包括模型微調(diào)、特征提取和遷移多層特征。通過模型微調(diào),本研究調(diào)整了預(yù)訓(xùn)練模型的權(quán)重,使之適應(yīng)花卉分類任務(wù)的特定上下文,同時保留通用特征。通過使用預(yù)訓(xùn)練模型作為特征提取器,本研究凍結(jié)了大部分權(quán)重,提取模型中間層的高級特征以提高分類效率。利用ResNet的深層結(jié)構(gòu),本研究選擇了不同層次的特征進行遷移,以更好地滿足花卉分類任務(wù)的需求。

      2 實驗

      2.1 實驗環(huán)境

      硬件實驗環(huán)境的配置信息如下:CPU為Intel Corei9-12900K;內(nèi)存為32 GB;顯卡為RTX 4090,顯存24GB。軟件實驗環(huán)境的配置信息為:操作系統(tǒng)為Ubuntu 22.04;Python版本為3.9;使用Pycharm 2022.3 進行開發(fā);Pytorch版本為2.1.0,CUDA版本為11.8。

      2.2 評價指標(biāo)

      本研究使用驗證集的準(zhǔn)確率和Kappa 系數(shù)作為模型評估的指標(biāo),以期達到更好的效果。

      準(zhǔn)確率(Accuracy) 是分類正確的樣本占總樣本個數(shù)的比例,其計算公式如方程(1) 所示。

      Accuracy = TP + TN/TP + FP + FN + TN (1)

      Kappa 系數(shù)是一種用于評估分類器在分類任務(wù)中性能的統(tǒng)計指標(biāo)。它通過考慮隨機一致性因素,提供了對準(zhǔn)確度的更全面評估,其計算公式如方程(2) 所示。

      Kappa = Po - Pe /1 - Pe (2)

      Kappa 系數(shù)基于混淆矩陣,通過比較觀察到的準(zhǔn)確率(3) 和由隨機猜測導(dǎo)致的準(zhǔn)確率(4) ,提供了一個在類別分布不均勻時進行修正的方法。Kappa 系數(shù)的取值范圍在?1到1之間,其中正值表示分類器的性能優(yōu)于隨機猜測,負(fù)值表示性能不如隨機猜測,而0表示性能與隨機猜測相當(dāng)。

      Po = TP + TN/TP + TN + FP + FN (3)

      Pe = (TP + FP) ? (TP + FN ) + (TN + FP) ? (TN + FN )/(TP + TN + FP + FN )2 (4)

      2.3 模型訓(xùn)練結(jié)果與分析

      實驗結(jié)果表明,將花卉數(shù)據(jù)集應(yīng)用于ResNet50網(wǎng)絡(luò)模型進行訓(xùn)練與驗證時,經(jīng)過250輪的訓(xùn)練,模型表現(xiàn)出令人矚目的性能。圖2和圖3分別展示了訓(xùn)練集和驗證集的準(zhǔn)確率及損失(loss) 在訓(xùn)練過程中的變化趨勢。

      通過分析準(zhǔn)確率曲線和損失曲線的變化,可以觀察到ResNet50網(wǎng)絡(luò)模型在訓(xùn)練初期實現(xiàn)了快速學(xué)習(xí)和優(yōu)化。盡管在訓(xùn)練后期略有波動,但整體趨于平穩(wěn),這表明模型對訓(xùn)練數(shù)據(jù)具有出色的學(xué)習(xí)能力。

      在ResNet網(wǎng)絡(luò)模型的訓(xùn)練過程中,本研究采用了多種評價指標(biāo),如表1所示。其中,Kappa系數(shù)作為關(guān)鍵的性能評估指標(biāo),全面評估了模型在準(zhǔn)確性方面相對于隨機分類的表現(xiàn)。實驗結(jié)果顯示,當(dāng)訓(xùn)練到第200個Epoch 時,驗證集的準(zhǔn)確率達到了最高,此時損失函數(shù)的值為1.025。ResNet50網(wǎng)絡(luò)模型取得了顯著的0.825的Kappa 系數(shù),突顯其在花卉分類任務(wù)中的卓越表現(xiàn)。較高的Kappa系數(shù)反映了模型在對102種不同花卉類別的準(zhǔn)確分類上,已超越了隨機猜測的水平。

      此外,高Kappa 系數(shù)進一步表明相對于隨機性,模型有顯著的改進。即便在高準(zhǔn)確率下,模型仍然遠遠超越了僅比隨機分類稍好的水平。在穩(wěn)定性方面,Kappa 系數(shù)計算考慮了分類錯誤和正確的概率,表現(xiàn)出模型對不同花卉類別的相對穩(wěn)定的分類能力,不容易受到隨機性的干擾。

      總體而言,實驗所取得的高Kappa 系數(shù)為ResNet50網(wǎng)絡(luò)模型在花卉分類任務(wù)中的可靠性和卓越性能提供了有力支持。驗證集上82.771%的準(zhǔn)確率,以及模型相對較小的規(guī)模(參數(shù)數(shù)量為23.663 M,模型大小為9.296 M) ,進一步強調(diào)了其在實際應(yīng)用中可能具備的廣泛適用性。這一系列實驗結(jié)果為本研究對模型分類結(jié)果的信心提供了堅實的基礎(chǔ)。

      3 討論與總結(jié)

      當(dāng)前,花卉識別主要依賴于人工方法,但人工識別存在識別速度慢和需要專業(yè)知識等問題。為了解決這些問題,本研究應(yīng)用計算機視覺和深度學(xué)習(xí)技術(shù),提出了一種基于ResNet50神經(jīng)網(wǎng)絡(luò)的新方法,旨在識別和分類102 種常見花卉。在實驗過程中,重點分析了ResNet50模型在花卉識別與分類中的表現(xiàn),包括其準(zhǔn)確率、模型大小、參數(shù)量以及Kappa 系數(shù)。實驗結(jié)果表明,ResNet50模型在花卉識別方面具有較高的準(zhǔn)確率,驗證集的準(zhǔn)確率達到82.771%,Kappa系數(shù)為0.825。

      本研究提出的花卉識別方法通過實驗驗證了其可行性。未來的研究將致力于優(yōu)化ResNet 模型的結(jié)構(gòu),以適應(yīng)更多種類的花卉識別任務(wù),并將輕量化的ResNet 模型移植到移動設(shè)備上。這些努力將進一步提升花卉識別技術(shù)的性能和實用性。

      參考文獻:

      [1] 余杭. 基于激光雷達的3D目標(biāo)檢測研究綜述[J]. 汽車文摘,2024(2): 18-27.

      [2] 李濤, 等. 基于深度學(xué)習(xí)的金屬表面缺陷檢測[J]. 高師理科學(xué)刊, 2024, 44(1): 36-42.

      [3] 張永偉. 野生草本花卉在園林中的應(yīng)用:以塞罕壩機械林場為例[J]. 現(xiàn)代園藝, 2022, 45(10): 140-142.

      [4] 牛素華. 露地花卉的分類及生長習(xí)性[J]. 現(xiàn)代農(nóng)村科技,2022(3): 39-40.

      [5] 黎施欣, 范小平. 圖像處理與識別在果蔬成熟度監(jiān)測中的研究及應(yīng)用[J]. 包裝工程, 2024, 45(3): 153-164.

      [6] HE K M, ZHANG X Y, REN S Q, et al. Deep residual learningfor image recognition[C]//Proceedings of the IEEE Conferenceon Computer Vision and Pattern Recognition. Las Vegas:IEEE, 2016: 770-778.

      [7] 劉峻渟,周云成,吳瓊,等. 基于卷積神經(jīng)網(wǎng)絡(luò)的番茄葉部病害識別方法[J].河南農(nóng)業(yè)大學(xué)學(xué)報,58(2):287-297.

      [8] 周曠, 姜名. 基于遷移學(xué)習(xí)的小樣本目標(biāo)識別研究進展與展望[J]. 航空科學(xué)技術(shù), 2023, 34(2): 1-9.

      【通聯(lián)編輯:唐一東】

      汉川市| 昭平县| 雅江县| 太保市| 台南县| 无为县| 汪清县| 莲花县| 清丰县| 深水埗区| 铜陵市| 普安县| 定南县| 琼结县| 卓资县| 阜城县| 黄浦区| 株洲县| 星子县| 常宁市| 江油市| 称多县| 隆化县| 岳普湖县| 大安市| 双鸭山市| 达州市| 茶陵县| 英超| 都兰县| 建水县| 潼南县| 平顶山市| 西丰县| 永寿县| 县级市| 恩平市| 渝北区| 台安县| 舟曲县| 南江县|