• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Squeezenet模型的蛇類圖像識(shí)別

      2021-04-20 12:06:19魯元平羅志聰
      電腦知識(shí)與技術(shù) 2021年7期
      關(guān)鍵詞:蛇類圖像識(shí)別識(shí)別率

      魯元平 羅志聰

      摘要:隨著人類活動(dòng)范圍的不斷擴(kuò)張,生態(tài)環(huán)境的惡化,蛇類的生存環(huán)境受到威脅。為實(shí)現(xiàn)對(duì)蛇類的準(zhǔn)確識(shí)別,輔助蛇類研究者對(duì)蛇類的識(shí)別與保護(hù),通過(guò)對(duì)現(xiàn)有的解決方案進(jìn)行分析,提出采用遷移學(xué)習(xí)方法對(duì)10種蛇類進(jìn)行訓(xùn)練識(shí)別。首先對(duì)現(xiàn)有數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng),從而讓訓(xùn)練模型更好地收斂,采用基于Squeezenet模型具有更好的識(shí)別率,識(shí)別率達(dá)到了85.71%,效果良好。并對(duì)訓(xùn)練好的模型進(jìn)行加載,網(wǎng)絡(luò)模型識(shí)別耗時(shí)2.69s,有著更好實(shí)時(shí)性,同時(shí)還能保證識(shí)別精度,節(jié)省硬件資源,提升了模型的可移植性。

      關(guān)鍵詞: 遷移學(xué)習(xí); Squeezenet模型; 蛇類; 圖像識(shí)別

      中圖分類號(hào):TP391? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

      文章編號(hào):1009-3044(2021)07-0012-03

      Abstract: With the continuous expansion of human activities, the deterioration of the ecological environment, the living environment of snakes is threatened.In order to realize the accurate identification of snakes and assist the snake researchers in the identification and protection of snakes, this paper proposes to adopt the transfer learning method to train and identify 10 kinds of snakes by analyzing the existing solutions.Firstly, the existing data set was enhanced to promote better convergence of the training model. With the adoption of the Squeezenet model, the recognition rate reached 85.71%, with good effect.It takes 2.69s to identify the network model, which ensures better real-time performance, ensures recognition accuracy, saves hardware resources, and improves the portability of the model.

      Key words:transfer learning; squeezenet model; snakes; image recognition

      我國(guó)擁有十分豐富的蛇類資源,有200多種蛇類,其中我國(guó)南方地區(qū)的蛇類占我國(guó)蛇類種數(shù)的88%左右[1]。蛇類作為自然系統(tǒng)中的次級(jí)消費(fèi)者,在生態(tài)系統(tǒng)中發(fā)揮著維系生態(tài)系統(tǒng)的能量流動(dòng)和物質(zhì)循環(huán)的重要作用。目前我國(guó)蛇類研究人員非常匱乏,且尚未有針對(duì)蛇類研究的公開數(shù)據(jù)集,在科研領(lǐng)域,蛇類圖像識(shí)別仍然是一個(gè)比較開放性的問(wèn)題。近年來(lái),隨著人類活動(dòng)范圍的不斷擴(kuò)張,蛇類的生存環(huán)境受到了巨大威脅,蛇類圖像識(shí)別對(duì)保護(hù)物種多樣性和維持生態(tài)平衡更具意義。James Alex對(duì)蛇類特征進(jìn)行手工分類,構(gòu)建了6中印度常見蛇類的特征數(shù)據(jù)庫(kù),并采用貝葉斯網(wǎng)絡(luò)等13種分類器進(jìn)行蛇類識(shí)別,效果良好[2]。Amir Amiza等人對(duì)22種馬來(lái)西亞常見蛇類進(jìn)行顏色和邊緣方向的特征提取,并采用最近鄰分類器取得了89.22%的準(zhǔn)確率[3]。浙江大學(xué)付永欽通過(guò)采集和收集蛇類圖像,建立了包含銀環(huán)蛇、竹葉青蛇、舟山眼鏡蛇、尖吻蝮、王錦蛇、黃金蟒、玉斑麗蛇、紅尾蚺、紅脖頸槽蛇和鉤盲蛇等10種中國(guó)常見蛇類共計(jì)10336幅圖像的CHINESESNAKES蛇類圖像數(shù)據(jù)集,對(duì)蛇類圖像分類問(wèn)題進(jìn)行了研究,設(shè)計(jì)了BRC卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其在CHINESESNAKES蛇類圖像數(shù)據(jù)集上的分類準(zhǔn)確率達(dá)到了89.061%[4]。近年來(lái),深度學(xué)習(xí)和人工智能在圖像識(shí)別領(lǐng)域越來(lái)越受歡迎,而傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)不僅訓(xùn)練時(shí)間長(zhǎng),而且需要大量的訓(xùn)練樣本[5]。因此,在訓(xùn)練樣本較少的情況下,采用遷移學(xué)習(xí)進(jìn)行圖像識(shí)別,可以提高整體的識(shí)別性能。本文基于Squeezenet模型對(duì)10種蛇類進(jìn)行圖像識(shí)別,該模型不僅網(wǎng)絡(luò)參數(shù)量相較Alexnet模型減少50倍左右,而且有著更快的識(shí)別速度,有更好的可移植性,對(duì)于快速識(shí)別蛇類意義重大,有利于蛇類研究者對(duì)蛇類的快速識(shí)別與保護(hù)。

      1 Squeezenet網(wǎng)絡(luò)結(jié)構(gòu)

      1.1 Squeezenet模型

      Squeezenet是由Landola提出的輕量級(jí)網(wǎng)絡(luò)結(jié)構(gòu),與Alexnet相比較而言,其結(jié)構(gòu)內(nèi)的參數(shù)更少,模型也更小,但是卻有著和Alexnet相當(dāng)?shù)淖R(shí)別精確度,且模型縮小50倍左右[6]。Squeezenet模型有2個(gè)卷積層、Fire模塊(Squeezenet的核心)、兩個(gè)最大池化層(max-pooling)和一個(gè)全局平均池化層(GAP,Global Average Pooling)以及最后的softmax函數(shù)[7]。Fire module結(jié)構(gòu)如圖1所示,該結(jié)構(gòu)主要由squeeze層和expand層構(gòu)成。其中squeeze層開創(chuàng)性地將3*3的卷積核替換為1*1的卷積核,減少了特征通道數(shù)。除此之外,squeeze層的輸出是expand層的輸入,且expand層中不僅有1*1的卷積核,還有3*3的卷積,圖像經(jīng)過(guò)兩種卷積后,有concat進(jìn)行操作輸出。特征圖在經(jīng)過(guò)Fire Module結(jié)構(gòu)后,圖片的尺寸不會(huì)改變,但是由于經(jīng)過(guò)了1*1的卷積核后,其參數(shù)量減少了很多,這也是Squeezenet相較Alexnet減少50倍左右的根本原因。Squeezenet模型結(jié)構(gòu)圖如圖1所示。

      1.2 池化層

      池化層又稱下采樣層或欠采樣層,其目的就是對(duì)輸入特征圖進(jìn)行壓縮,降低網(wǎng)絡(luò)模型的計(jì)算復(fù)雜度,在一定程度上能夠抑制過(guò)擬合現(xiàn)象的發(fā)生,提高模型的容錯(cuò)率[8]。輸入的圖像經(jīng)卷積層輸出相應(yīng)的特征圖,由于輸出的特征圖過(guò)大,會(huì)導(dǎo)致后續(xù)的計(jì)算量復(fù)雜,因此根據(jù)圖像的靜態(tài)特征,在卷積神經(jīng)網(wǎng)絡(luò)中引入池化層,降低計(jì)算復(fù)雜度。常見的池化方式有平均池化和最大池化,計(jì)算如下:

      2 蛇類數(shù)據(jù)集

      本文使用的數(shù)據(jù)集包含10種蛇類的圖片信息,所有的圖片統(tǒng)一處理為227*227*3(3為彩色圖片的顏色通道),此次實(shí)驗(yàn)中對(duì)數(shù)據(jù)集以訓(xùn)練集:驗(yàn)證集=8:2的比例進(jìn)行了劃分,最后每種蛇類隨機(jī)挑選100張作為測(cè)試集。由于現(xiàn)有的蛇類數(shù)據(jù)集樣本數(shù)量較少,且不同類別之間還存在數(shù)量不均等的情況,為了防止出現(xiàn)網(wǎng)絡(luò)過(guò)擬合嚴(yán)重和泛化效果差等現(xiàn)象,對(duì)蛇類數(shù)據(jù)集圖像進(jìn)行數(shù)據(jù)增強(qiáng)處理,如對(duì)圖像進(jìn)行旋轉(zhuǎn),從而增加樣本數(shù)量。其中泥蛇的數(shù)據(jù)集原始樣本只有139張,而最多的銀環(huán)蛇數(shù)據(jù)集樣本有836張,樣本的之間數(shù)量差距過(guò)大會(huì)導(dǎo)致所訓(xùn)練出的模型無(wú)法遷移到測(cè)試集進(jìn)行準(zhǔn)確測(cè)試。因此,為了解決該問(wèn)題,數(shù)據(jù)集樣本較少的圖片進(jìn)行數(shù)據(jù)增強(qiáng)處理(此次實(shí)驗(yàn)樣本中的赤鏈蛇、侏儒響尾蛇、泥蛇、烏梢蛇和劍紋帶蛇)。

      3 實(shí)驗(yàn)及結(jié)果分析

      3.1 實(shí)驗(yàn)環(huán)境

      實(shí)驗(yàn)采用的是具有六核AMD Ryzen5 1600x Six-Core的CPU且裝備有8G內(nèi)存的計(jì)算機(jī),軟件平臺(tái)是Windows版的Matlab R2019b。

      3.2 結(jié)果分析

      雖然對(duì)蛇類數(shù)據(jù)集進(jìn)行擴(kuò)充和數(shù)據(jù)增強(qiáng),但是數(shù)據(jù)集樣本仍然是小樣本,不適合從零開始訓(xùn)練樣本,因此本文為了解決樣本數(shù)量過(guò)少的問(wèn)題,采用遷移學(xué)習(xí)的方式訓(xùn)練模型。本文采用的模型為Alexnet模型和Squeezenet模型,對(duì)原始數(shù)據(jù)樣本和擴(kuò)充數(shù)據(jù)樣本進(jìn)行訓(xùn)練和驗(yàn)證,本次實(shí)驗(yàn)數(shù)據(jù)集原始樣本總共為4171張,擴(kuò)充后的數(shù)據(jù)集樣本為5543張,將訓(xùn)練集:驗(yàn)證集=8:2的比例進(jìn)行劃分。訓(xùn)練模型參數(shù)設(shè)置:學(xué)習(xí)率為0.00001,每次輸入模型的批尺寸(Bachisize)為50,驗(yàn)證頻數(shù)為500,訓(xùn)練周期為30個(gè)epoch,并使用隨機(jī)梯度下降動(dòng)量(SGDM)優(yōu)化器作為訓(xùn)練選項(xiàng)。其中批尺寸是Alexnet模型和Squeezenet模型進(jìn)行迭代訓(xùn)練時(shí)處理圖片的數(shù)量,批尺寸越大,整個(gè)網(wǎng)絡(luò)的收斂速度也就越快,其訓(xùn)練的時(shí)間也更短,但是會(huì)占用更多的GPU顯存,因此需要根據(jù)計(jì)算機(jī)的配置來(lái)進(jìn)行相應(yīng)的設(shè)定。學(xué)習(xí)率的設(shè)定也影響著網(wǎng)絡(luò)的收斂,其取值過(guò)大會(huì)導(dǎo)致?lián)p失函數(shù)(Loss)不穩(wěn)定,取值過(guò)小會(huì)導(dǎo)致網(wǎng)絡(luò)收斂速度過(guò)慢或過(guò)擬合現(xiàn)象的發(fā)生。如表是Alexnet和Squeezenet兩種模型在數(shù)據(jù)集擴(kuò)充前后的性能比較:

      從表1和表2中可以看出,擴(kuò)充數(shù)據(jù)集后,雖然訓(xùn)練時(shí)間更長(zhǎng)了,模型也更大了,但是兩種模型的準(zhǔn)確率都得到了提升,其中Alexnet模型擴(kuò)充數(shù)據(jù)集后,識(shí)別率提高了3.72%,Squeezenet模型識(shí)別準(zhǔn)確率提高了6.9%,因此擴(kuò)充數(shù)據(jù)集能夠在一定程度上提高識(shí)別準(zhǔn)確率。除此之外,Squeezenet模型在兩種數(shù)據(jù)集模式下,依然保持著相較Alexnet模型更好的性能,在實(shí)際應(yīng)用中有更好的移植性,對(duì)硬件資源的要求更低,其服務(wù)器可以在同一時(shí)間處理更多的數(shù)據(jù),提高了工作效率。

      本文最終選取Squeezenet模型對(duì)10種蛇類圖像進(jìn)行識(shí)別,此次實(shí)驗(yàn)主要對(duì)比擴(kuò)充數(shù)據(jù)集前后模型的收斂速度,圖中實(shí)線為訓(xùn)練集,虛線為測(cè)試集,橫縱為迭代次數(shù),縱軸為損失函數(shù)。從圖3和圖4中可以看出,數(shù)據(jù)集擴(kuò)充以后,模型的收斂速度更快。原始數(shù)據(jù)在300個(gè)epoch開始收斂,而擴(kuò)充后的數(shù)據(jù)集在200個(gè)epoch就已經(jīng)開始收斂了。

      擴(kuò)充后的數(shù)據(jù)集在Squeezenet模型中訓(xùn)練好后,將訓(xùn)練好的模型進(jìn)行加載,識(shí)別測(cè)試集中的圖片,測(cè)試集中每種蛇類有100張測(cè)試圖片。在加載模型下的識(shí)別速度為2.69s,所得混淆矩陣如圖5:

      圖5中class1-10依次為斑背響尾蛇、赤鏈蛇、侏儒響尾蛇、泥蛇、菜花蛇、銀環(huán)蛇、烏梢蛇、劍紋帶蛇、銀環(huán)蛇和竹葉青,其中橫軸為準(zhǔn)確率,縱軸為召回率。由于竹葉青顏色鮮艷且單一,其識(shí)別率最高,為97%。識(shí)別率較低的有三種蛇類,分別為菜花蛇、銀環(huán)蛇和烏梢蛇,由于這三種蛇類花紋較復(fù)雜,且銀環(huán)蛇和烏梢蛇有著比較相似的特征,導(dǎo)致識(shí)別率偏低。

      4 結(jié)語(yǔ)

      Squeezenet模型和Alexnet模型在同等條件下,Squeezenet始終保持著相對(duì)明顯的優(yōu)勢(shì),訓(xùn)練時(shí)間更短,模型也更小,能夠節(jié)約更多的硬件資源,并提升工作效率,同時(shí)也利于移植到小型硬件中,便于開發(fā)。擴(kuò)充數(shù)據(jù)集能夠在一定程度上促進(jìn)收斂,提高識(shí)別準(zhǔn)確率。加載基礎(chǔ)模型能夠更快地獲得識(shí)別準(zhǔn)確率,且分類效果良好,能夠在實(shí)際應(yīng)用中實(shí)現(xiàn)更快更好地分類,滿足蛇類識(shí)別應(yīng)用中的可靠性和實(shí)用性的要求。與此同時(shí),在不損失數(shù)據(jù)集特征的情況下,如何提高蛇、銀環(huán)蛇和烏梢蛇的識(shí)別率是下一步亟待解決的問(wèn)題。

      參考文獻(xiàn):

      [1] 張樂(lè),陶明寶,陳鴻平,等.常用蛇類藥材鑒別研究進(jìn)展[J].中國(guó)實(shí)驗(yàn)方劑學(xué)雜志,2017,23(4):222-227.

      [2] James A P,Mathews B,Sugathan S,et al.Discriminative histogram taxonomy features for snake species identification[J].Human-Centric Computing and Information Sciences,2014,4(1):1-11.

      [3] Felzenszwalb P F,Girshick R B,McAllester D,et al.Object detection with discriminatively trained part-based models[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(9):1627-1645.

      [4] 付永欽.基于深度學(xué)習(xí)的蛇類圖像分類問(wèn)題研究[D].杭州:浙江大學(xué),2019.

      [5] 謝小紅,李文韜.基于遷移學(xué)習(xí)的圖像分類訓(xùn)練方法研究[J].信息與電腦(理論版),2020,32(7):53-55.

      [6] Iandola F N,Han S,Moskewicz M W,et al.SqueezeNet:AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size[EB/OL].2016.

      [7] 李坤倫,魏澤發(fā),宋煥生.基于SqueezeNet卷積神經(jīng)網(wǎng)絡(luò)的車輛顏色識(shí)別[J].長(zhǎng)安大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,40(4):109-116.

      [8] 張偉. 基于深度卷積神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)特征的地表覆蓋分類研究[D].北京:中國(guó)科學(xué)院大學(xué),2017.

      【通聯(lián)編輯:唐一東】

      猜你喜歡
      蛇類圖像識(shí)別識(shí)別率
      神話傳說(shuō)中的神奇蛇類
      基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測(cè)
      基于Resnet-50的貓狗圖像識(shí)別
      電子制作(2019年16期)2019-09-27 09:34:50
      高速公路圖像識(shí)別技術(shù)應(yīng)用探討
      基于真耳分析的助聽器配戴者言語(yǔ)可懂度指數(shù)與言語(yǔ)識(shí)別率的關(guān)系
      蛇類食性及其對(duì)農(nóng)林生態(tài)系統(tǒng)的影響概述
      圖像識(shí)別在物聯(lián)網(wǎng)上的應(yīng)用
      電子制作(2018年19期)2018-11-14 02:37:04
      圖像識(shí)別在水質(zhì)檢測(cè)中的應(yīng)用
      電子制作(2018年14期)2018-08-21 01:38:16
      提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
      經(jīng)濟(jì)蛇類養(yǎng)殖與開發(fā)利用
      竹北市| 新乡市| 南涧| 福清市| 泽普县| 河北省| 漠河县| 玉龙| 婺源县| 台北县| 车险| 临安市| 宁安市| 原平市| 靖州| 华安县| 五寨县| 基隆市| 巢湖市| 夏河县| 贡觉县| 黔南| 沅陵县| 调兵山市| 长寿区| 泽普县| 北碚区| 聂拉木县| 二连浩特市| 台东县| 洪洞县| 永宁县| 丰都县| 育儿| 马公市| 桐城市| 新安县| 莒南县| 社旗县| 神池县| 无棣县|