• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于卷積神經(jīng)網(wǎng)絡(luò)和熵權(quán)法的胡蜂識(shí)別及危害等級(jí)判別模型的研究

      2021-07-19 00:45李松燁
      理論與創(chuàng)新 2021年6期
      關(guān)鍵詞:熵權(quán)法圖像識(shí)別卷積神經(jīng)網(wǎng)絡(luò)

      【摘? 要】2019年12月,華盛頓州農(nóng)業(yè)部確認(rèn)胡蜂出現(xiàn)在美國本土,這一生物入侵現(xiàn)象對(duì)經(jīng)濟(jì)、社會(huì)、生態(tài)和公共衛(wèi)生等方面都是一場(chǎng)無情的災(zāi)難。本文遵循“觀察規(guī)律-實(shí)踐應(yīng)用-合理預(yù)測(cè)”的框架,收集了關(guān)于該黃蜂的其他各類情報(bào)和詳細(xì)信息,提出了一系列新穎的模型來輔助政府機(jī)構(gòu)把握這種新生物的時(shí)空傳播規(guī)律并應(yīng)對(duì)生物入侵時(shí)繁雜的處理工作。本文致力于解決美國農(nóng)業(yè)部處理混亂而頻繁的目擊報(bào)告時(shí)的兩大困境——人工識(shí)別圖像成本過高和處理工作的隨意性和盲目性大。我們使用bootstrap抽樣方法解決了圖片正負(fù)樣本不均衡的問題,將調(diào)整后的圖像數(shù)據(jù)輸入經(jīng)過特殊調(diào)參的卷積神經(jīng)網(wǎng)絡(luò)中,得到了良好的圖像識(shí)別效果,準(zhǔn)確度達(dá)99%以上。且著眼于評(píng)價(jià)的角度,結(jié)合圖像為正面的概率、距離和活躍時(shí)間段這三個(gè)指標(biāo),使用熵權(quán)法賦予權(quán)重配以模糊綜合評(píng)價(jià),按實(shí)際危機(jī)程度劃分出了四個(gè)目擊報(bào)告處理等級(jí),處理等級(jí)越高,就越優(yōu)先處理。

      【關(guān)鍵詞】生物入侵;圖像識(shí)別;卷積神經(jīng)網(wǎng)絡(luò);熵權(quán)法

      引言

      2019年12月,華盛頓州農(nóng)業(yè)部確認(rèn)胡蜂出現(xiàn)在美國本土,這一生物入侵現(xiàn)象對(duì)社會(huì)各個(gè)層面和職能機(jī)構(gòu)都是一場(chǎng)無情的災(zāi)難。在經(jīng)濟(jì)方面,美國每年投入到生物入侵的成本估計(jì)超過1000億元,近期一些研究表明,單這種亞洲大黃蜂的控制費(fèi)用在美國就高達(dá)3140萬美元。生物入侵的一個(gè)典型后果就是破壞生態(tài)系統(tǒng)正常運(yùn)行和生物多樣性,甚至經(jīng)常成為壓死瀕臨滅絕的物種的最后一根稻草。胡蜂最初被紐約時(shí)報(bào)報(bào)道時(shí)被稱之為“殺人大黃蜂”,這也是因?yàn)榻?jīng)常捕食本地一些重要的經(jīng)濟(jì)物種,比如蜜蜂。胡蜂的強(qiáng)力針刺在高敏感性個(gè)體中會(huì)引起嚴(yán)重過敏反應(yīng),甚至導(dǎo)致死亡。尤其在當(dāng)前新冠疫情大流行的全球困境當(dāng)中,病毒或許會(huì)通過對(duì)種群人口統(tǒng)計(jì)學(xué)和種間相互作用的影響,為生物入侵的成功做出貢獻(xiàn),惡化當(dāng)前狀況。因此,收集關(guān)于該黃蜂的其他各類情報(bào)和詳細(xì)信息,例如準(zhǔn)確識(shí)別、擴(kuò)散分布情況和有效的控制措施等,為政府機(jī)構(gòu)提供參考和建議,及時(shí)遏制生物入侵帶來的連鎖消極后果,是迫在眉睫的。

      1.基于卷積神經(jīng)網(wǎng)絡(luò)的胡蜂識(shí)別模型

      1.1圖像處理

      采集到的positive數(shù)據(jù)僅有14條,并且對(duì)應(yīng)的圖片文件也僅有14張,遠(yuǎn)遠(yuǎn)小于negative的圖片數(shù)量,這意味著我們訓(xùn)練數(shù)據(jù)存在極大不平衡,這使得我們想要分類預(yù)測(cè)出的positive的案例在類中難以具有代表性。因此我們主要通過以下方法對(duì)圖像進(jìn)行預(yù)處理,調(diào)整訓(xùn)練數(shù)據(jù)的數(shù)量。

      Bootstrap抽樣。由于raw圖像只有67張,通過數(shù)據(jù)增強(qiáng)后的樣本數(shù)量也只有1311張,可能會(huì)導(dǎo)致模型對(duì)樣本特征的識(shí)別限制特別緊張,魯棒性變差。因此我們將positive和negative記錄比例規(guī)定為4:6。鑒于negative記錄共有3389條,positive記錄仍稍顯不足。Bootstrap是一種用從給定訓(xùn)練集中有放回的均勻抽樣,十分適合小樣本數(shù)據(jù)集。因此我們進(jìn)一步使用bootstrap抽樣方法,最終得到了2259張positive記錄。

      1.2參數(shù)調(diào)整

      我們遵循Francois Chollet的建議,對(duì)CNN進(jìn)行了一些特殊的改進(jìn),能夠有效提高模型準(zhǔn)確度和效率。

      (1)使用L1正則化,為模型的泛化添加一個(gè)權(quán)值累加項(xiàng),讓權(quán)值變得更小。

      (2)使用Dropout,在每輪訓(xùn)練過程中隨機(jī)放棄一些神經(jīng)元節(jié)點(diǎn),相當(dāng)于減少了權(quán)值數(shù)量。

      (3)使用Sigmoid激活函數(shù)和binary_crossentropy損失函數(shù),可以很好適應(yīng)二分類問題

      (4)使用已在大型數(shù)據(jù)集上預(yù)先訓(xùn)練過的網(wǎng)絡(luò)VGG16架構(gòu),提前掌握大多數(shù)計(jì)算機(jī)視覺問題有用的特征,特別適合于本文中擁有少量數(shù)據(jù)的情況。

      (5)微調(diào)VGG16模型的最后一個(gè)卷積塊,先實(shí)例化VGG16的卷積模型并加載其權(quán)重,再在頂部添加我們自己調(diào)過各類超參數(shù)的全連接層,并加載其權(quán)重,最后凍結(jié)VGG16模型最后一個(gè)卷積塊中的所有層。

      (6)使用SGD優(yōu)化器,確保每次只選擇一個(gè)樣本來更新梯度,使得學(xué)習(xí)速度大大增強(qiáng)。

      隨著訓(xùn)練次數(shù)的增加,剛開始時(shí),測(cè)試集的損失度較大,但隨著訓(xùn)練次數(shù)的增加,逐漸趨于平緩,最后接近于0,訓(xùn)練集的損失度剛開始訓(xùn)練時(shí)也較大,接近0.5,但后面也逐漸接近0。而不管是訓(xùn)練集還是測(cè)試集,在第十輪后,準(zhǔn)確度都逐漸接近1,從這些指標(biāo)上看,模型訓(xùn)練的結(jié)果較為理想。

      為了驗(yàn)證訓(xùn)練的圖像識(shí)別模型的精確度具體如何,我們又從其他網(wǎng)站找到一些已經(jīng)被驗(yàn)證為亞洲大黃蜂的圖片來驗(yàn)證模型的準(zhǔn)確度。我們使用從其他網(wǎng)站中收集來的圖片都可以實(shí)現(xiàn)一個(gè)很好的識(shí)別效果。

      2.模糊綜合評(píng)價(jià)

      根據(jù)公眾提供的目擊報(bào)告中的圖像,我們已經(jīng)可以較準(zhǔn)確的找出正確目擊并排除負(fù)面報(bào)告,但我們?nèi)晕唇鉀Q處理工作的優(yōu)先緩急問題。當(dāng)面對(duì)大量報(bào)告時(shí),若能準(zhǔn)確制定出調(diào)查和處理工作的優(yōu)先順序,就能大大減少工作量。因此我們?cè)诰矸e神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)一步綜合其余指標(biāo),使用模糊綜合評(píng)價(jià)方法得到了一個(gè)總的評(píng)價(jià)模型。

      2.1指標(biāo)選擇

      胡蜂的活動(dòng)明顯的時(shí)間和空間規(guī)律。據(jù)胡蜂相關(guān)的生物研究我們可以很輕松得到它年節(jié)律,但考慮到胡蜂剛出現(xiàn)在華盛頓州,與先前研究中具有不用的地勢(shì)和氣候等環(huán)境特征,因此可能會(huì)出現(xiàn)不同的活躍期。據(jù)此我們根據(jù)每月的舉報(bào)提交數(shù)量來觀察胡蜂的活躍期。如圖2可知,我們可將胡蜂的活動(dòng)周期大概分為4個(gè)階段,其中7-9月為活躍期,其次為5-6月,4月和10月,以及11月-次年3月,我們依次使用“1,2,3,4”來代表這幾個(gè)階段t。

      當(dāng)某個(gè)地點(diǎn)出現(xiàn)一只胡蜂時(shí),意味著它周圍也有極大可能會(huì)有其余同伙。因此我們將每個(gè)被標(biāo)記為unprocessed狀態(tài)的目擊報(bào)告中的地點(diǎn)和已確定為positive狀態(tài)的目擊報(bào)告中的地點(diǎn)計(jì)算距離值,再依次比較,選出最短距離d,并將其也作為一個(gè)重要指標(biāo)。

      此外,我們之前通過卷積神經(jīng)網(wǎng)絡(luò)得到的圖片為正面的概率顯然也是一個(gè)重要的指標(biāo),記為α。

      2.2權(quán)重確定

      在本研究中,由于當(dāng)前經(jīng)驗(yàn)和規(guī)律掌握不足,對(duì)現(xiàn)實(shí)情況的未知性太大,因此難以找到專家評(píng)判或者自行主觀確定權(quán)重,因此我們考慮使用熵權(quán)法計(jì)算三個(gè)指標(biāo)各自的權(quán)重。熵權(quán)法是一種客觀的綜合評(píng)價(jià)方法,得到的權(quán)重依賴于數(shù)據(jù)本身的離散性,即熵。當(dāng)某個(gè)指標(biāo)的離散程度越大,它的熵值越大,也表明該指標(biāo)對(duì)最終評(píng)價(jià)影響的權(quán)重越大。

      通過上述熵權(quán)法計(jì)算權(quán)重,我們?nèi)齻€(gè)指標(biāo)所構(gòu)成的因素集為U={γ,d,t},相對(duì)應(yīng)的權(quán)重向量A=[0.857036,0.008431,0.134533]。我們將官方處理優(yōu)先順序分為四個(gè)等級(jí),等級(jí)越高,越應(yīng)該得到優(yōu)先處理。因此我們的等級(jí)集V={1,2,3,4}。

      2.3模型構(gòu)建與求解

      我們將σ對(duì)各等級(jí)的隸屬度函數(shù)定義為A(σ),將d對(duì)各等級(jí)的隸屬度函數(shù)定義為B(d),將t對(duì)各等級(jí)的隸屬度函數(shù)定義為C(t)。由于σ和d都是連續(xù)變量,可以分段表示,適合使用梯形隸屬度函數(shù),而t是離散表示的,適合用三角形隸屬度函數(shù)。將指標(biāo)σ作為例,根據(jù)表1中的分段規(guī)則,可以得到如下隸屬度函數(shù)的圖形,如圖2。

      最后,我們使用該模型對(duì)全部15個(gè)unprocessed記錄進(jìn)行總評(píng)價(jià),其中不包含圖片、視頻等有效文件的數(shù)據(jù)我們直接打分為0,因?yàn)檫@類數(shù)據(jù)實(shí)驗(yàn)室無法進(jìn)行判斷,只能歸為unverified,我們對(duì)有效數(shù)據(jù)(5)的結(jié)果進(jìn)行排序并輸出,按照加權(quán)平均原則,可以得到每個(gè)等級(jí)中對(duì)應(yīng)的unprocessed記錄,能夠有效幫助到相關(guān)部門做出優(yōu)先處理決策。

      3.結(jié)語

      胡蜂在華盛頓州的出現(xiàn)讓社會(huì)公眾陷入一種迷茫與焦慮狀態(tài)之中,目擊報(bào)告大幅增長,這給美國農(nóng)業(yè)部造成了巨大的處理壓力。他們主要面臨兩個(gè)難點(diǎn):一是人工識(shí)別胡蜂成本太高而尚未找到一種較好的智能識(shí)別方法;二是面對(duì)不停息的頻繁報(bào)告他們難以根據(jù)實(shí)際危機(jī)程度劃定優(yōu)先處理等級(jí)。

      首先,本文利用卷積神經(jīng)網(wǎng)絡(luò)以識(shí)別正確的胡蜂的圖像,可在一定程度上取代人工識(shí)別,準(zhǔn)確度較高。

      接下來,本文利用該圖像正確的概率結(jié)合胡蜂節(jié)律周期和活動(dòng)空間等指標(biāo),并使用熵權(quán)法賦予各個(gè)指標(biāo)權(quán)重,進(jìn)行模糊綜合評(píng)價(jià)得出優(yōu)先處理的等級(jí),最后使用unprocessed狀態(tài)下的目擊報(bào)告作為測(cè)試集進(jìn)行測(cè)試判斷。

      參考文獻(xiàn)

      [1] Meyerson, L. A., Carlton, J. T., Simberlo?, D.,& Lodge, D. M. (2019). The growing peril of biological invasions.

      [2] Barbet-Massin, M., Salles, J. M., & Courchamp, F. (2020). The economic cost of control of the invasive yellow-legged Asian hornet. NeoBiota, 55, 11-25.

      [3] Wilcove, D. S., Rothstein, D., Dubow, J., Phillips, A., & Losos, E. (1998). Quantifying threats to imperiled species in the United States. BioScience, 48(8), 607-615.

      [4] McClenaghan, B., Schlaf, M., Geddes, M., Mazza, J., Pitman, G., McCallum, K., ... & Otis, G. W. (2019). Behavioral responses of honey bees, Apis cerana and Apis mellifera, to Vespa mandarinia marking and alarm pheromones. Journal of Apicultural Research, 58(1), 141-148.

      [5] Stankus, T. (2020). Reviews of Science for Science Librarians:Murder Hornets: Vespa Mandarinia Japonica. Science & Technology Libraries, 39(3), 244-252.

      [6] Torchin, M. E., & Mitchell, C. E. (2004). Parasites, pathogens, and invasions by plants and animals. Frontiers in Ecology and the Environment, 2(4), 183-190.

      [7] Chollet, F. (2016). Building powerful image classi?cation models using very little data.Keras Blog.

      [8] Li, G., Cheng, Y. Q., Dong, L., & Wang, W. (2014). Study of the gini coe?cient objective weights. Manag. Rev, 26, 12-22.

      作者簡介:李松燁(2000.09-),男,漢族,河北邢臺(tái)人,本科在讀,研究方向?yàn)樾畔⒐芾砼c信息系統(tǒng)

      猜你喜歡
      熵權(quán)法圖像識(shí)別卷積神經(jīng)網(wǎng)絡(luò)
      基于計(jì)算機(jī)視覺的圖像識(shí)別技術(shù)研究
      人工智能背景下圖像識(shí)別技術(shù)淺析
      基于字典學(xué)習(xí)的正則化魯棒稀疏表示腫瘤細(xì)胞圖像識(shí)別
      基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
      大學(xué)周邊健身房滿意度調(diào)查報(bào)告
      基于熵權(quán)法的京津冀區(qū)域信息化協(xié)調(diào)發(fā)展規(guī)律模型及其應(yīng)用
      圖像識(shí)別交互系統(tǒng)
      基于熵權(quán)法的西安市外向型經(jīng)濟(jì)發(fā)展綜合評(píng)價(jià)研究
      深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
      基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
      汕尾市| 随州市| 凌源市| 万安县| 五常市| 新郑市| 土默特左旗| 新密市| 靖州| 郴州市| 宜昌市| 淮阳县| 贡嘎县| 罗平县| 启东市| 襄垣县| 陆丰市| 稻城县| 虹口区| 沙坪坝区| 溧水县| 旌德县| 昌邑市| 拜泉县| 通许县| 洛隆县| 洪江市| 紫云| 杭州市| 南川市| 大余县| 镇雄县| 平顶山市| 隆子县| 甘孜县| 龙山县| 仙桃市| 安福县| 友谊县| 凤山县| 神池县|