王琪 孟娟
摘? 要:智慧海洋是智慧農(nóng)業(yè)的基礎(chǔ)性工程。文章針對(duì)傳統(tǒng)方法無(wú)法解決高密度粘連情況下蝦苗計(jì)數(shù)精度較差的問(wèn)題,提出了一種基于改進(jìn)Unet的蝦苗密度估計(jì)算法。鑒于現(xiàn)有蝦苗數(shù)據(jù)集不足,收集并標(biāo)記了一個(gè)針對(duì)蝦苗計(jì)數(shù)的數(shù)據(jù)集(Dlou_Shrimp)。在該數(shù)據(jù)集上對(duì)所提出的算法進(jìn)行了測(cè)試,實(shí)驗(yàn)結(jié)果表明該算法可以解決蝦苗計(jì)數(shù)中的遮擋與粘連問(wèn)題,可為其他領(lǐng)域的密度估計(jì)提供全新的思路。
關(guān)鍵詞:蝦苗計(jì)數(shù);密度估計(jì);神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí)
中圖分類(lèi)號(hào):TP273+.4? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2021)17-0012-06
Abstract: Smart ocean is the basic project of smart agriculture. Aiming at the problem that the traditional methods can not solve the poor counting accuracy of shrimp seedlings in the case of high-density adhesion, an shrimp seedling density estimation algorithm based on improved Unet is proposed in this paper. In view of the shortage of existing shrimp seedling data sets, a data set for shrimp seedling counting (Dlou_ Shrimp) is collected and marked. The proposed algorithm is tested on the data set, the experimental results show that the algorithm can solve the problems of occlusion and adhesion in shrimp seedling counting, and can provide a new idea for density estimation in other fields.
Keywords: shrimp seedling count; density estimation; neural network; deep learning
0? 引? 言
21世紀(jì)以來(lái),我國(guó)邁入高速發(fā)展階段,其中電子商務(wù)、物流運(yùn)輸模式等的迅猛發(fā)展,使得海產(chǎn)品的銷(xiāo)售渠道增多,銷(xiāo)售份額也隨之大幅度提升。隨著市場(chǎng)對(duì)魚(yú)類(lèi)、貝類(lèi)、蝦類(lèi)等海產(chǎn)品的需求日益上升,中國(guó)擁有的自然海域中海產(chǎn)品的產(chǎn)出速度已不能滿(mǎn)足國(guó)內(nèi)蝦苗的購(gòu)買(mǎi)需求,且過(guò)度捕撈會(huì)引起海產(chǎn)類(lèi)漁業(yè)物種的滅絕。根據(jù)《2020年中國(guó)漁業(yè)統(tǒng)計(jì)年鑒》[1],2019年全國(guó)水產(chǎn)養(yǎng)殖總量為5 079.07萬(wàn)噸,同比增長(zhǎng)1.76%。蝦類(lèi)作為海產(chǎn)品的主要分類(lèi)之一,其養(yǎng)殖方法十分重要。精準(zhǔn)高效的養(yǎng)殖方法有助于產(chǎn)出更多更好的蝦產(chǎn)品。準(zhǔn)確地估計(jì)養(yǎng)殖水域內(nèi)的蝦苗數(shù)量對(duì)蝦苗養(yǎng)殖、蝦苗交易以及蝦苗行為分析都有著十分重要的現(xiàn)實(shí)意義。
就蝦產(chǎn)品的養(yǎng)殖流程而言,最為關(guān)鍵的一步是蝦苗的篩選與計(jì)數(shù)。傳統(tǒng)蝦苗篩選與計(jì)數(shù)采用的是直接觀測(cè)的方法,即依賴(lài)專(zhuān)家肉眼觀察蝦苗。傳統(tǒng)的篩選與計(jì)數(shù)方式簡(jiǎn)單,但是采用這種方式所需的時(shí)間成本和人力成本較大且準(zhǔn)確度不高。因此,采用直接觀測(cè)的方法并不能保證長(zhǎng)時(shí)間有效完成蝦苗數(shù)量統(tǒng)計(jì)任務(wù)。
近年來(lái),計(jì)算機(jī)視覺(jué)技術(shù)得到了快速發(fā)展,廣泛應(yīng)用于人臉識(shí)別、魚(yú)類(lèi)計(jì)數(shù)、蝦苗計(jì)數(shù)等,但蝦苗計(jì)數(shù)依然面臨很多挑戰(zhàn),例如蝦苗之間遮擋嚴(yán)重、光照情況復(fù)雜等。此外,以下兩方面因素使蝦苗計(jì)數(shù)變得更加困難:
(1)蝦苗極度擁擠。蝦苗的活動(dòng)有一定規(guī)律,水面的蝦苗往往成群出現(xiàn),相機(jī)所獲得的原始數(shù)據(jù)中蝦苗往往極度密集,互相遮擋嚴(yán)重,這就使得我們用傳統(tǒng)的目標(biāo)提取、圖像分割等方法對(duì)蝦苗進(jìn)行計(jì)數(shù)遇到了極大的挑戰(zhàn),如圖1所示。
(2)相機(jī)透視效應(yīng)嚴(yán)重。由于相機(jī)具有一定的透視效應(yīng),同一相機(jī)在不同位置、不同角度拍攝的同一場(chǎng)景,所得到的數(shù)據(jù)往往不盡相同。圖像中離相機(jī)較近的目標(biāo)偏大,而離相機(jī)較遠(yuǎn)的目標(biāo)較小,這使得所獲得的圖像數(shù)據(jù)存在嚴(yán)重的相機(jī)透視效應(yīng),因此我們很難準(zhǔn)確定位蝦苗。
為了解決上述問(wèn)題,本文在深入研究現(xiàn)有蝦苗計(jì)數(shù)方法的基礎(chǔ)上,提出了一種基于改進(jìn)的Unet蝦苗密度估計(jì)方法。本文所做的工作主要有以下幾點(diǎn):
(1)為了更好地學(xué)習(xí)上下文信息和位置信息,在原有Unet網(wǎng)絡(luò)的特征圖融合階段增加了一個(gè)改進(jìn)的注意機(jī)制模塊。
(2)針對(duì)幾何自適應(yīng)高斯核與固定高斯核所存在的二值矩陣分布不均問(wèn)題,本文采用DM-Count的損失函數(shù)替代原有的損失函數(shù)。
(3)考慮到現(xiàn)有蝦苗數(shù)據(jù)集不足的情況,我們收集并標(biāo)記了一個(gè)針對(duì)蝦苗計(jì)數(shù)的數(shù)據(jù)集(Dlou_Shrimp),該數(shù)據(jù)集中搜集并整理了250幅圖像,并對(duì)約80 000個(gè)圖像中的蝦苗做了準(zhǔn)確的標(biāo)注。
1? 相關(guān)工作
1.1? 卷積神經(jīng)網(wǎng)絡(luò)在計(jì)數(shù)問(wèn)題上的應(yīng)用
隨著大數(shù)據(jù)、5G技術(shù)的廣泛普及,視頻監(jiān)控設(shè)備以及各種特定場(chǎng)景的圖像自動(dòng)分析逐漸成為研究熱點(diǎn)。目前,特定場(chǎng)景的分析主要集中在密集人群的自動(dòng)分析上。在早期,深度學(xué)習(xí)、統(tǒng)計(jì)蝦苗等技術(shù)發(fā)展迅速,人們的研究熱點(diǎn)主要集中在如何利用滑動(dòng)的窗口將圖片中的人探測(cè)出來(lái),但是蝦苗圖片存在遮擋嚴(yán)重的問(wèn)題,采用該方法進(jìn)行蝦苗統(tǒng)計(jì)效果并不理想。
通過(guò)計(jì)數(shù)問(wèn)題和蝦苗密度圖之間建立的映射可以很好地解決該問(wèn)題,有很多專(zhuān)家和學(xué)者使用密度估計(jì)來(lái)解決計(jì)算問(wèn)題。周飛燕[2]等人總結(jié)了深度學(xué)習(xí)在目標(biāo)檢測(cè)和計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識(shí)別和語(yǔ)義分析等領(lǐng)域的成果;Sang[3]等針對(duì)非線(xiàn)性動(dòng)態(tài)系統(tǒng)提出了一種基于改進(jìn)的混沌神經(jīng)網(wǎng)絡(luò)(CNN)的間接自適應(yīng)神經(jīng)控制器;付宇豪[4]等實(shí)現(xiàn)了基于多列卷積神經(jīng)網(wǎng)絡(luò)(MCNN)的蝦苗計(jì)數(shù)算法和基于選擇卷積神經(jīng)網(wǎng)絡(luò)(Switch-CNN)的蝦苗計(jì)數(shù)算法;王金鳳[5]等基于水下魚(yú)類(lèi)的群聚現(xiàn)象,采用基于擁塞場(chǎng)景識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)(CSRNet)技術(shù),將剔除了全連接層的VGG-16與空洞卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,在保持分辨率的同時(shí)擴(kuò)大感知域,從而生成高質(zhì)量的魚(yú)群分布密度圖;汪夢(mèng)婷[6]等依據(jù)蝦苗密度估計(jì)方法創(chuàng)建了魚(yú)群密度估計(jì)數(shù)據(jù)集,并針對(duì)蝦苗密度估計(jì)網(wǎng)絡(luò)中因使用空洞卷積而產(chǎn)生的“網(wǎng)格效應(yīng)”,提出將空洞卷積替換為混合空洞卷積,建立了端到端的魚(yú)群密度估計(jì)網(wǎng)絡(luò);Zhang[7]等受多列卷積神經(jīng)網(wǎng)絡(luò)(MCNN)和上下文金字塔卷積神經(jīng)網(wǎng)絡(luò)(CP-CNN)的啟發(fā),提出了一個(gè)新的深度學(xué)習(xí)框架,用于對(duì)蝦苗進(jìn)行高效而精確的計(jì)數(shù),生成高質(zhì)量的密度圖;劉洋[8]等根據(jù)枚舉法的思想設(shè)計(jì)自動(dòng)訓(xùn)練算法,用于訓(xùn)練遷移學(xué)習(xí)和人工設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)。
1.2? 計(jì)算機(jī)視覺(jué)在蝦苗計(jì)數(shù)中的應(yīng)用
近年來(lái),深度學(xué)習(xí)發(fā)展迅速,被廣泛應(yīng)用于各種場(chǎng)景,有不少實(shí)驗(yàn)人員開(kāi)始利用卷積神經(jīng)網(wǎng)絡(luò)來(lái)提取蝦苗的深層特征,估算蝦苗的密度,傳統(tǒng)的直接觀測(cè)蝦苗計(jì)數(shù)方法被取而代之。范大岳[9]通過(guò)降低孵化池水位來(lái)“濃縮”幼體,再由排出管排入細(xì)網(wǎng)眼塑料籠內(nèi),移入充氣水體里,然后用玻璃杯舀起,慢慢倒入附近的暫養(yǎng)池,邊觀看邊計(jì)數(shù)。黃應(yīng)生[10]等介紹了一種通過(guò)電子稱(chēng)原理而制造的魚(yú)苗計(jì)數(shù)器,其具有計(jì)數(shù)率高、誤差小、魚(yú)苗存活率高、成本低以及便于推廣等優(yōu)點(diǎn),適用于各類(lèi)魚(yú)、蝦苗和其他顆粒狀或帶殼的水產(chǎn)苗種。張康德[11]通過(guò)制作一個(gè)四方盒,將魚(yú)苗連同水倒入盒里,將框格放入盒中。取出兩個(gè)方格里的魚(yú)苗,分別計(jì)數(shù),取平均值,然后乘以方格數(shù),即得出總的魚(yú)苗數(shù);薛志寧[12]等通過(guò)對(duì)日本對(duì)蝦仔在室內(nèi)人工養(yǎng)殖條件下的各種參數(shù)進(jìn)行測(cè)試,得出了回歸方程,為蝦苗購(gòu)買(mǎi)者提供參考;季玉瑤[13]等針對(duì)蝦苗圖像光照不均、圖像粘連等問(wèn)題,對(duì)圖像復(fù)原的TV-L1模型進(jìn)行了改進(jìn),提出了一種新的計(jì)數(shù)法;范松偉[14]等提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)模型的蝦苗自動(dòng)計(jì)數(shù)技術(shù),該方法在均勻背光環(huán)境下能夠?qū)σ欢芏鹊奈r苗數(shù)量進(jìn)行準(zhǔn)確的估計(jì),符合蝦苗養(yǎng)殖業(yè)的計(jì)數(shù)要求。于秋玉[15]提出了一種基于改進(jìn)YOLOv4的蝦苗智能識(shí)別計(jì)數(shù)系統(tǒng),但是該方法對(duì)于中高密度蝦苗圖像的計(jì)數(shù)精度較差。
2? 本文方法
2.1? Unet+SAM
本文提出一種在特征圖融合階段在增強(qiáng)的Unet網(wǎng)絡(luò)中加入改進(jìn)的注意力機(jī)制SAM模塊的方法,本文提出的增強(qiáng)的UNet網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)主要分為跳躍連接、上采樣、縮減采樣和增強(qiáng)注意模塊四個(gè)部分。首先將該網(wǎng)絡(luò)分為左右兩個(gè)部分進(jìn)行分析,左邊是壓縮過(guò)程,即Encoder。輸入任意尺寸的蝦苗圖片,通過(guò)卷積和縮減采樣減少圖像大小并提取一些簡(jiǎn)單的功能。右邊是解碼過(guò)程,即Decoder。通過(guò)卷積和上采樣,可以獲得一些深刻特征。其中,用于卷積的valid的填充方式可得到上下文齊全的結(jié)果,因此每次經(jīng)過(guò)卷積之后,圖像大小都會(huì)減少。通過(guò)中間的concat,將編碼階段獲得的特征圖與改進(jìn)的注意力機(jī)制模塊后解碼階段獲得的特征圖相結(jié)合,將深度和淺度的特征相結(jié)合,細(xì)化圖像,可以有效地觀察蝦苗的細(xì)節(jié)。密度圖預(yù)測(cè)是根據(jù)結(jié)果特征圖進(jìn)行的。請(qǐng)注意,這里兩層的特點(diǎn)是大小不同,需要剪切。最后一層則是通過(guò)1×1的卷積生成最終密度貼圖。
傳統(tǒng)的注意力機(jī)制模塊SAM,是由Woo[16]等人于2018年在ECCV上提出的一種基于數(shù)據(jù)相關(guān)性的模塊,該模塊通常可以放在卷積層的后面。任何的流行網(wǎng)絡(luò)都可以嵌入SAM模塊。在注意力機(jī)制模塊出現(xiàn)之前,Hu[17]等提出了SENet的模型結(jié)構(gòu),該模型可以在特征圖的通道上執(zhí)行attention操作,乘以原來(lái)的特征圖,得到具有注意力機(jī)制的特征圖,但SENet方法的重點(diǎn)是在通道上執(zhí)行attention操作,在空間層面上無(wú)法反映attention。傳統(tǒng)SAM模塊可以在通道和空間層面同時(shí)使用attention,在不顯著增加計(jì)算量和參數(shù)量的情況下提高模型的特征提取能力。但是,傳統(tǒng)的注意力機(jī)制模塊集中在上下文頻道和空間兩個(gè)大維度上,忽視了對(duì)圖片核心點(diǎn)的學(xué)習(xí)。
針對(duì)蝦苗計(jì)數(shù)中蝦苗圖像的個(gè)體都比較小,采用傳統(tǒng)的SAM算法,由于包含平均池化與最大池化兩種操作,從而會(huì)使蝦苗圖像的細(xì)節(jié)信息丟失。針對(duì)這一問(wèn)題,本文在原有SAM的基礎(chǔ)上去除池化模塊,用一個(gè)卷積得到特征圖,直接使用Sigmoid函數(shù)進(jìn)行激活,然后對(duì)應(yīng)點(diǎn)對(duì)點(diǎn)相乘,具體的網(wǎng)絡(luò)圖如圖3所示。本文所提出的Unet+SAM算法,在保持蝦苗計(jì)數(shù)精度的同時(shí)能夠有效地解決蝦苗計(jì)數(shù)中的遮擋與粘連問(wèn)題。
2.2? DM-Count loss
高斯密度估計(jì)方法[18]是將密度估計(jì)視為生成高質(zhì)量的密度圖,在密度估計(jì)過(guò)程中,每個(gè)訓(xùn)練圖像包含多個(gè)蝦苗,每個(gè)蝦苗都用一個(gè)點(diǎn)來(lái)標(biāo)記。然后使用高斯核對(duì)標(biāo)記的點(diǎn)進(jìn)行平滑操作。然而,Wang[19]等人于2020年證明了將幾何自適應(yīng)高斯方法強(qiáng)加于注釋會(huì)損害模型的泛化能力,因此本文采用分布匹配的方法對(duì)蝦苗進(jìn)行計(jì)數(shù),該方法不需要用高斯核來(lái)平滑帶注釋的點(diǎn)。DM-Count的泛化誤差范圍比高斯平滑方法的泛化誤差范圍更嚴(yán)格。
具體來(lái)講,本文用表示用于點(diǎn)注釋的矢量化二進(jìn)制圖, 表示由神經(jīng)網(wǎng)絡(luò)返回的矢量化預(yù)測(cè)密度圖。將z和? 視為未歸一化的密度函數(shù),用以下三項(xiàng)來(lái)表示DM-Count中的損失函數(shù),包含計(jì)數(shù)損失、OT損失和總變量(TV)損失,如式(1)所示。計(jì)數(shù)損失測(cè)量總體密度圖之間的差異,而后兩項(xiàng)則測(cè)量歸一化密度函數(shù)分布之間的差異:
總變化損失?TV:在每次訓(xùn)練迭代中,我們使用Sinkhorn算法來(lái)近似α*和β*。時(shí)間復(fù)雜度為O(n2logn/2),其中是所需的最佳差距,即返回的目標(biāo)與最佳目標(biāo)之間的差異的上限。使用Sinkhorn算法進(jìn)行優(yōu)化時(shí),目標(biāo)在開(kāi)始時(shí)急劇下降,但在以后的迭代中僅緩慢收斂到最佳目標(biāo)。實(shí)際上我們?cè)O(shè)置了最大迭代次數(shù),而Sinkhorn算法僅返回近似解。結(jié)果,當(dāng)使用Sinkhorn算法優(yōu)化OT損耗時(shí),預(yù)測(cè)的密度圖接近于真實(shí)密度圖,但并不完全相同。OT損耗接近蝦苗的密集區(qū)域,但是對(duì)于蝦苗的低密度區(qū)域,近似值可能會(huì)更差。為了解決此問(wèn)題,我們另外使用總變化(TV)損失,定義為:
2.3? Dlou_Shrimp數(shù)據(jù)集
由于沒(méi)有公開(kāi)的數(shù)據(jù)集可供神經(jīng)網(wǎng)絡(luò)對(duì)蝦苗計(jì)數(shù)進(jìn)行訓(xùn)練和測(cè)試,因此我們通過(guò)長(zhǎng)期的搜集和整理,建立了一個(gè)蝦苗計(jì)數(shù)數(shù)據(jù)集(Dlou_Shrimp)。該數(shù)據(jù)集包含250張帶注釋的高密度蝦苗圖像,如圖4所示。我們對(duì)這些高密度的蝦苗圖像進(jìn)行標(biāo)注,標(biāo)記的蝦苗數(shù)量約為80 000條。
蝦苗數(shù)據(jù)集樣本一部分來(lái)自蝦類(lèi)養(yǎng)殖場(chǎng),拍攝設(shè)備是一個(gè)800萬(wàn)像素的攝像機(jī)。每幅圖像的分辨率為3 264×2 448。為豐富數(shù)據(jù)集并保證數(shù)據(jù)樣本的多樣性,在所拍攝的視頻中分別從不同的時(shí)段截取圖像,并保證所截取圖像中的蝦苗具有不同的狀態(tài);實(shí)驗(yàn)樣本中的另一部分圖像是從互聯(lián)網(wǎng)上收集的,共有50張。
3? 實(shí)驗(yàn)及實(shí)驗(yàn)結(jié)果評(píng)估
3.1? 實(shí)驗(yàn)環(huán)境
本次實(shí)驗(yàn)的實(shí)驗(yàn)環(huán)境是搭載Windows10操作系統(tǒng),CPU處理器選擇intel Core i7-6800K,其主頻是3.4 GHz,GPU為GTX2080Ti,實(shí)驗(yàn)平臺(tái)采用PyCharm(2018版),所用的深度學(xué)習(xí)框架為Pytorch。
3.2? 評(píng)價(jià)指標(biāo)
我們采用平均絕對(duì)誤差MAE與均方誤差MSE對(duì)算法的性能進(jìn)行評(píng)價(jià)。其中MAE與MSE都是用于衡量算法性能的標(biāo)準(zhǔn),MAE表征算法估計(jì)的準(zhǔn)確性,MSE表征算法估計(jì)的穩(wěn)定性,定義為:
其中,N表示測(cè)試集中圖像的數(shù)目,zi表示第i張圖像中實(shí)際含有的蝦苗數(shù)量,表示算法估計(jì)的圖像中含有的蝦苗數(shù)量。MAE、MSE的值越小,實(shí)驗(yàn)效果越好。
MAE、MSE誤差相較于其他評(píng)估指標(biāo),優(yōu)點(diǎn)在于執(zhí)行簡(jiǎn)單,較容易理解,比較適用于回歸的場(chǎng)景中,尤其是當(dāng)回歸的值是實(shí)數(shù)值的時(shí)候。
同時(shí),MAE損失對(duì)離群值的魯棒性更強(qiáng),但其導(dǎo)數(shù)的不連續(xù)性使得尋找最優(yōu)解的過(guò)程效率低下;MSE損失對(duì)離群值比較敏感,但在優(yōu)化過(guò)程中更加穩(wěn)定和準(zhǔn)確。
3.3? 實(shí)驗(yàn)結(jié)果
我們將本文所提出的基于改進(jìn)的Unet蝦苗密度估計(jì)算法與近幾年先進(jìn)的密度估計(jì)方法進(jìn)行對(duì)比實(shí)驗(yàn),具體對(duì)比值如表1所示。表中的數(shù)據(jù)表明,無(wú)論是平均絕對(duì)誤差MAE還是均方誤差MSE,本文提出的方法在Dlou_Shrimp數(shù)據(jù)集上所取得的結(jié)果都優(yōu)于其他密度估計(jì)算法。同時(shí),相較于當(dāng)前最先進(jìn)的密度估計(jì)算法,MAE提升了7.87,MSE提升了約9.92。
圖5為Dlou_Shrimp數(shù)據(jù)集部分樣本樣例的可視化結(jié)果,可以看出本文生成的密度圖與標(biāo)簽密度圖十分接近。
為了驗(yàn)證本文所提出框架中各個(gè)構(gòu)建模塊的有效性,以控制變量的形式設(shè)計(jì)了幾組內(nèi)部模型間的對(duì)照實(shí)驗(yàn)。為了更直觀地探明各模塊對(duì)模型性能的貢獻(xiàn)度及其各自的最優(yōu)配置,后續(xù)對(duì)照實(shí)驗(yàn)均采用Dlou_Shrimp數(shù)據(jù)集,下文給出了各對(duì)照實(shí)驗(yàn)設(shè)置及結(jié)果分析。
為了驗(yàn)證改進(jìn)SAM模塊在模型中的有效性,我們進(jìn)行了傳統(tǒng)的UNet網(wǎng)絡(luò)與加入SE模塊、加入SAM模塊和加入改進(jìn)SAM模塊的對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表2所示。當(dāng)模型未使用改進(jìn)SAM模塊時(shí),模型在Dlou_Shrimp數(shù)據(jù)集上的各指標(biāo)均有較大程度的回落。實(shí)驗(yàn)結(jié)果表明,使用改進(jìn)SAM模塊的算法比不使用改進(jìn)SAM模塊的算法相比,雖然前一種算法在計(jì)算量上有所增大,但是在準(zhǔn)確性和魯棒性方面,其計(jì)數(shù)精度最高。
為了找到一個(gè)最適合的下采樣深度,實(shí)驗(yàn)將蝦苗圖片放入深度為3、4、5的改進(jìn)的UNet網(wǎng)絡(luò)深度中進(jìn)行試驗(yàn)。表3是不同深度在Dlou_Shrimp數(shù)據(jù)集上的性能比較結(jié)果,從表中可以看出改進(jìn)的UNet網(wǎng)絡(luò)在深度為4的情況下,MAE與MSE兩個(gè)指標(biāo)上均有較好的效果。
為了驗(yàn)證DMCountloss優(yōu)于傳統(tǒng)幾何高斯核密度估計(jì)方法,在改進(jìn)的Unet模型上進(jìn)行了DMCountloss與幾何高斯核密度估計(jì)的對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,DMCountloss的MAE和MSE均優(yōu)于幾何高斯核密度估計(jì)方法,具體的對(duì)比值如表4所示。
4? 結(jié)? 論
本文提出了一種基于改進(jìn)的Unet蝦苗密度估計(jì)方法,該方法可以通過(guò)神經(jīng)網(wǎng)絡(luò)將一張蝦苗圖像生成蝦苗密度圖,并由密度圖積分求和得到蝦苗總體數(shù)量,最后得出圖像中蝦苗的數(shù)量。本文所提出的算法能夠有效地克服蝦苗計(jì)數(shù)中的遮擋與粘連問(wèn)題,雖然SAM模塊去掉了池化層,導(dǎo)致計(jì)算效率下降,但卻能有效地提高蝦苗計(jì)數(shù)的精度。在未來(lái)的研究工作中,我們將從以下兩個(gè)方面對(duì)本文算法不斷改進(jìn):
(1)由于大規(guī)模蝦苗計(jì)數(shù)數(shù)據(jù)集存在標(biāo)注困難、樣本數(shù)量較少且存在誤標(biāo)現(xiàn)象,因此我們下一步將研究如何引進(jìn)無(wú)監(jiān)督或半監(jiān)督的標(biāo)注方式,進(jìn)一步擴(kuò)大蝦苗計(jì)數(shù)數(shù)據(jù)集的規(guī)模和質(zhì)量。
(2)針對(duì)密度圖估計(jì)方法中對(duì)目標(biāo)較少的蝦苗圖片估計(jì)精度不高的問(wèn)題,計(jì)劃后續(xù)將目標(biāo)檢測(cè)的計(jì)數(shù)方法與密度圖估計(jì)方法相結(jié)合,從而更高效地進(jìn)行蝦苗密度估計(jì)。
參考文獻(xiàn):
[1] 羅茵.《2020中國(guó)漁業(yè)統(tǒng)計(jì)年鑒》出版 廣東水產(chǎn)品總產(chǎn)量首次全國(guó)第一 [J].海洋與漁業(yè),2020(6):12-13.
[2] 周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述 [J].計(jì)算機(jī)學(xué)報(bào),2017,40(6):1229-1251.
[3] KIM S H,AHN H W,WANG H O. A study on the Adaptive Neural Controller with Chaotic Dynamic Neural Networks [J].International Journal of Fuzzy Logic and Intelligent Systems,2007,7(4):236-241.
[4] 付宇豪.基于卷積神經(jīng)網(wǎng)絡(luò)的人群計(jì)數(shù)算法研究與應(yīng)用 [D].北京:北京工業(yè)大學(xué),2019.
[5] 王金鳳,胡凱,江帆,等.基于改進(jìn)深度學(xué)習(xí)模型的魚(yú)群密度檢測(cè)試驗(yàn)研究 [J].漁業(yè)現(xiàn)代化,2021,48(2):77-82.
[6] 汪夢(mèng)婷,袁飛,程恩.魚(yú)類(lèi)目標(biāo)的密度估計(jì)模型 [J].哈爾濱工程大學(xué)學(xué)報(bào),2020,41(10):1545-1552.
[7] ZHANG W,WANG Y J,LIU Y Y. Deep Convolution Network for Dense Crowd Counting [J].IET Image Processing,2020,14(4):621-627.
[8] 劉洋,張勝茂,王斐,等.海洋捕撈魚(yú)類(lèi)BigH神經(jīng)網(wǎng)絡(luò)分類(lèi)模型設(shè)計(jì)與實(shí)現(xiàn) [J].工業(yè)控制計(jì)算機(jī),2021,34(6):18-20.
[9] 范大岳.羅氏沼蝦苗的A型光電計(jì)數(shù)器 [J].漁業(yè)現(xiàn)代化,1986(3):18-20.
[10] 黃應(yīng)生,許斐力,馬應(yīng)森.YJ-2型魚(yú)苗計(jì)數(shù)器 [J].漁業(yè)機(jī)械儀器,1989(3):29-30+20.
[11] 張康德.框格式魚(yú)蝦苗計(jì)數(shù)法 [J].適用技術(shù)市場(chǎng),1997(9):11.
[12] 薛志寧,段吉旺.應(yīng)用重量法計(jì)量出池日本對(duì)蝦蝦苗的研究 [J].河北漁業(yè),2000(5):11-12+15.
[13] 季玉瑤,魏偉波,趙增芳,等.基于改進(jìn)TV-L1模型的蝦苗計(jì)數(shù)方法 [J].青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,31(4):62-68+82.
[14] 范松偉,林翔瑜,周平.基于改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的蝦苗自動(dòng)計(jì)數(shù)研究 [J].漁業(yè)現(xiàn)代化,2020,47(6):35-41.
[15] 于秋玉.基于改進(jìn)YOLOv4的蝦苗智能識(shí)別算法研究 [J].河南科技,2021,40(6):25-28.
[16] WOO S,PARK J,LEE J Y,et al. CBAM: Convolutional Block Attention Module [C]//European Conference on Computer Vision. Cham:Springer,2018:3-19.
[17] HU J,LI S,ALBANIE S,et al. Squeeze-and-Excitation Networks [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2020,42(8):2011-2023.
[18] NUALART E,SARDANYONS L Q. Gaussian estimates for the density of the non-linear stochastic heat equation in any space dimension [J]. Stochastic Processes and their Applications,2011,122(1):418-447.
[19] WANG B Y,LIU H D,SAMARAS D,et al. Distribution Matching for Crowd Counting [J].Computer Science,2020(v2):135-137.
[20] GABRIEL P,MARCO C. Computational Optimal Transport [J].Foundations and trends in machine learning,2019,11(5-6):355+206.
[21] LARADJI I H,ROSTAMZADEH N,PINHEIRO P O,et al. Where are the Blobs: Counting by Localization with Point Supervision [C]// Computer Vision-ECCV 2018.Cham:Springer,2018:560-576.
作者簡(jiǎn)介:王琪(1996—),男,漢族,遼寧瓦房店人,碩士研究生在讀,研究方向:深度學(xué)習(xí);孟娟(1981—)女,漢族,山東龍口人,副教授,博士,研究方向:非線(xiàn)性控制、復(fù)雜網(wǎng)絡(luò)同步。