• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于多尺度特征融合和注意力機(jī)制的水面死魚檢測(cè)方法

      2024-08-13 00:00:00楊帥鵬李賀劉金江付主木張銳賈會(huì)梅

      摘要: 死魚對(duì)于水域生態(tài)和飲水安全存在巨大威脅,由于水面環(huán)境復(fù)雜,導(dǎo)致現(xiàn)有目標(biāo)檢測(cè)算法在死魚檢測(cè)任務(wù)中存在漏檢、誤檢等情況。為此,以單次多邊框檢測(cè)(single shot multibox detector,SSD)為基礎(chǔ)提出一種基于多尺度特征融合和注意力機(jī)制的水面死魚檢測(cè)方法FFA-SSD(SSD with feature fusion and attention)。首先,采用計(jì)算量和參數(shù)量更少且特征提取能力更強(qiáng)的殘差網(wǎng)絡(luò)ResNet50替換VGG16主干網(wǎng)絡(luò);其次,設(shè)計(jì)了多尺度特征融合模塊,增強(qiáng)淺層特征和高層語(yǔ)義信息的融合;然后,引入通道注意力機(jī)制,抑制特征融合帶來(lái)的冗余信息干擾,提升網(wǎng)絡(luò)對(duì)目標(biāo)的關(guān)注度;最后,設(shè)計(jì)了一種適用于小目標(biāo)檢測(cè)的數(shù)據(jù)增強(qiáng)算法,擴(kuò)充訓(xùn)練數(shù)據(jù)中的小目標(biāo)數(shù)量,豐富訓(xùn)練背景。實(shí)驗(yàn)結(jié)果表明,同現(xiàn)有目標(biāo)檢測(cè)算法相比,F(xiàn)FA-SSD算法可以更好地識(shí)別水面死魚,檢測(cè)精度達(dá)到93.5%。

      關(guān)鍵詞: SSD; 目標(biāo)檢測(cè); 特征融合; 注意力機(jī)制; 數(shù)據(jù)增強(qiáng)

      中圖分類號(hào): TP212.9; TN929.5

      文獻(xiàn)標(biāo)志碼: A

      文章編號(hào): 1671-6841(2024)06-0032-07

      DOI: 10.13705/j.issn.1671-6841.2023149

      A Method for Detecting Dead Fish on Water Surfaces Based on

      Multi-scale Feature Fusion and Attention Mechanism

      YANG Shuaipeng1,2, LI He1,2,3, LIU Jinjiang1, FU Zhumu3, ZHANG Rui2, JIA Huimei2

      (1.College of Computer Science and Technology, Nanyang Normal University, Nanyang 473061, China;

      2.Henan Costar Group Co., Ltd, Nanyang 473003, China; 3.College of Information Engineering,

      Henan University of Science and Technology, Luoyang 471000, China)

      Abstract: Dead fish could pose a huge threat to water ecology and safety of drinking water. With complex water surface environment, the existing object detection algorithms had some flaws such as missed and false detections in small target. Therefore, a dead fish detection method on water surface based on the multi-scale feature fusion and attention mechanism, SSD with feature fusion and attention (FFA-SSD) was proposed. Firstly, the residual network ResNet50 with less computation and fewer parameters and better feature extraction ability was used to replace the VGG16 backbone network. Then, a multi-scale feature fusion module was designed to enhance the fusion of shallow features and high-level semantic information. Finally, a channel attention mechanism was introduced to suppress the interference of redundant information brought by feature fusion and to improve the network′s focus on the target. In addition, a data enhancement algorithm applicable for small target detection was designed to increase the number of small targets in the training data and to enrich the training background. The experimental results showed that compared with other target detection algorithms, the recognition function of FFA-SSD algorithm for dead fish on the water surface was better, and the detection accuracy was at 93.5%.

      Key words: SSD; target detection; feature fusion; attention mechanism; data enhancement

      0 引言

      魚類的生存情況往往和生存環(huán)境密切相關(guān),同時(shí)也是水域監(jiān)管體系中的一項(xiàng)重要指標(biāo)。魚類死亡后,若不能及時(shí)打撈,會(huì)對(duì)其他生物、水質(zhì)以及飲水安全造成嚴(yán)重威脅。因此,對(duì)水面死魚進(jìn)行準(zhǔn)確高效的檢測(cè)并及時(shí)控制水域污染風(fēng)險(xiǎn)是十分必要的。

      目前,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)技術(shù)已經(jīng)在眾多領(lǐng)域廣泛應(yīng)用。在水面死魚檢測(cè)研究中,文獻(xiàn)[1]主要考慮了死魚檢測(cè)模型面向部署過(guò)程中的輕量化問(wèn)題。其中,MobileNet網(wǎng)絡(luò)在特征提取方面會(huì)導(dǎo)致信息丟失,非對(duì)稱卷積也會(huì)在某些方面的特征提取能力較弱,需要復(fù)雜的特征融合模塊保證其特征信息流通性。在現(xiàn)有水面漂浮物檢測(cè)研究中,可以分為基于深度學(xué)習(xí)的兩階段檢測(cè)方法[2]、單階段檢測(cè)方法[4]以及基于多模態(tài)數(shù)據(jù)融合處理的檢測(cè)方法。受分段式網(wǎng)絡(luò)結(jié)構(gòu)限制,兩階段檢測(cè)算法的研究主要集中在提升檢測(cè)精度上[4-5]。隨著邊緣計(jì)算[6]和移動(dòng)端等平臺(tái)部署需求增多,更多的研究集中在基于單階段檢測(cè)算法上,以提升檢測(cè)精度和速度的平衡性。文獻(xiàn)[7]基于YOLOv5網(wǎng)絡(luò),采用原始拓?fù)浣Y(jié)構(gòu)增強(qiáng)了對(duì)漂浮物的特征提取能力。文獻(xiàn)[8]通過(guò)增加RefineDet模型深層次特征提取并進(jìn)行特征融合,生成了具有更好表征能力的特征層。文獻(xiàn)[9]面向嵌入式設(shè)備通過(guò)減少檢測(cè)尺度來(lái)提升檢測(cè)速度,采用K-means聚類算法調(diào)整錨框補(bǔ)償精度,該方法更多考慮了對(duì)檢測(cè)速度的提升,忽略了水面小目標(biāo)對(duì)淺層特征的依賴問(wèn)題。此外,將雷達(dá)數(shù)據(jù)與視覺(jué)信息進(jìn)行多模態(tài)數(shù)據(jù)融合的檢測(cè)方法能夠進(jìn)一步提升對(duì)水面漂浮物的檢測(cè)精度。張堡瑞等[10]采用三維激光雷達(dá)點(diǎn)云數(shù)據(jù)與CornerNet-lite目標(biāo)檢測(cè)網(wǎng)絡(luò)得到的視覺(jué)信息進(jìn)行融合,通過(guò)調(diào)整兩者得到的目標(biāo)置信度比例來(lái)獲得新的目標(biāo)判定置信度。Cheng等[11]面向無(wú)人水面車輛將毫米波雷達(dá)點(diǎn)云數(shù)據(jù)與視覺(jué)信息進(jìn)行深層次多尺度融合,利用雷達(dá)數(shù)據(jù)的特性,提升水面目標(biāo)檢測(cè)的精度和魯棒性。基于多模態(tài)數(shù)據(jù)處理的檢測(cè)方法能夠彌補(bǔ)單一方法的缺陷,具有更好的檢測(cè)效果。目標(biāo)檢測(cè)算法是整個(gè)感知系統(tǒng)的重點(diǎn),同時(shí)也提高了對(duì)數(shù)據(jù)處理中心的計(jì)算能力要求,并涉及高成本的專業(yè)設(shè)備,適用性較差。在小目標(biāo)檢測(cè)研究中,特征融合是通過(guò)特征表達(dá)增強(qiáng)小目標(biāo)檢測(cè)的策略之一[12]。文獻(xiàn)[13]利用多尺度空洞卷積進(jìn)行特征融合,為網(wǎng)絡(luò)補(bǔ)充更多的上下文信息。文獻(xiàn)[14]采用融入分組殘差連接的Darknet-53作為SSD的主干網(wǎng)絡(luò),增強(qiáng)特征提取能力,引入基于多尺度空洞卷積的淺層特征增強(qiáng)模塊,豐富淺層特征的特征信息。其中小尺度特征圖在特征融合中效果并不明顯,多尺度空洞卷積能夠降低單個(gè)空洞卷積引起的遠(yuǎn)距離信息不相關(guān)性,但多次疊加的空洞卷積會(huì)損失信息的連續(xù)性。

      本文綜合水面漂浮物檢測(cè)和小目標(biāo)檢測(cè)的特點(diǎn),以SSD為基礎(chǔ)網(wǎng)絡(luò),提出了基于多尺度特征融合和注意力機(jī)制的水面死魚檢測(cè)網(wǎng)絡(luò)模型。設(shè)計(jì)小目標(biāo)數(shù)據(jù)增強(qiáng)算法提升數(shù)據(jù)集中的小目標(biāo)數(shù)量以及豐富訓(xùn)練背景。采用ResNet50作為主干網(wǎng)絡(luò)增強(qiáng)特征提取能力。將高層次特征融合至低層次特征中,豐富低層次特征中的語(yǔ)義信息。引入高效通道注意力機(jī)制來(lái)抑制網(wǎng)絡(luò)中負(fù)面信息帶來(lái)的影響。實(shí)驗(yàn)結(jié)果表明,本文方法能夠在保持實(shí)時(shí)檢測(cè)的同時(shí),具有更高的檢測(cè)精度。

      1 基于多尺度特征融合和注意力機(jī)制的SSD算法

      1.1 SSD目標(biāo)檢測(cè)算法

      SSD是一個(gè)單階多層的目標(biāo)檢測(cè)模型,結(jié)合了YOLO(you only look once)和Fast R-CNN(fast region-based convolutional network)的優(yōu)點(diǎn),在檢測(cè)精度和速度上都有不錯(cuò)的表現(xiàn)。SSD模型采用VGG16(visual geomertry group-16)作為主干網(wǎng)絡(luò),并將VGG16末端的兩個(gè)全連接層替換為卷積層,同時(shí)為了提取包含不同層次語(yǔ)義信息的特征,在VGG16后增加了多個(gè)不同尺度的卷積層作為附加網(wǎng)絡(luò),共設(shè)置了六個(gè)不同尺度的特征提取層,以滿足不同尺寸目標(biāo)的檢測(cè)需求。最后在不同尺度上利用不同比例和數(shù)量的先驗(yàn)框生成候選區(qū)域,采用非極大值抑制方法得到最終預(yù)測(cè)框。

      1.2 改進(jìn)的SSD網(wǎng)絡(luò)結(jié)構(gòu)

      VGG16網(wǎng)絡(luò)層數(shù)較多且結(jié)構(gòu)比較簡(jiǎn)單,不僅需要更多的計(jì)算量和參數(shù)量,還容易出現(xiàn)梯度消失和過(guò)擬合的問(wèn)題。SSD網(wǎng)絡(luò)雖然通過(guò)不同尺度特征圖檢測(cè)不同尺寸目標(biāo),但缺乏高層語(yǔ)義信息和淺層細(xì)節(jié)信息的交互,導(dǎo)致其在小目標(biāo)檢測(cè)方面有所不足。

      在水面死魚檢測(cè)任務(wù)中,數(shù)據(jù)源往往與目標(biāo)之間存在一定距離,導(dǎo)致會(huì)有更多的小目標(biāo)被檢測(cè)。針對(duì)SSD網(wǎng)絡(luò)在小目標(biāo)檢測(cè)任務(wù)中存在的問(wèn)題,提出一種改進(jìn)的SSD算法FFA-SSD,首先調(diào)整ResNet50[15]殘差網(wǎng)絡(luò)并作為主干網(wǎng)絡(luò);設(shè)計(jì)了特征融合模塊,通過(guò)對(duì)不同尺度的特征圖進(jìn)行級(jí)聯(lián)融合,增強(qiáng)高層次語(yǔ)義信息和淺層細(xì)節(jié)信息交互;同時(shí)引入注意力機(jī)制模塊,提升網(wǎng)絡(luò)對(duì)目標(biāo)的關(guān)注度,抑制無(wú)關(guān)噪聲信息。FFA-SSD網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

      1.3 深度殘差網(wǎng)絡(luò)ResNet50

      與VGG16相比,ResNet通過(guò)引入殘差連接可以更好地解決由網(wǎng)絡(luò)加深帶來(lái)的退化問(wèn)題,具有更強(qiáng)的特征提取能力。ResNet根據(jù)不同網(wǎng)絡(luò)深度擁有不同的版本,本文采用ResNet50為主干網(wǎng)絡(luò),ResNet50網(wǎng)絡(luò)結(jié)構(gòu)和殘差結(jié)構(gòu)如圖2所示。

      在殘差結(jié)構(gòu)中,輸入特征x經(jīng)過(guò)通道降維、特征提取和通道升維,得到殘差映射結(jié)構(gòu)F(x),右側(cè)分支通過(guò)恒等映射x直接與殘差映射結(jié)果F(x)逐元素相加得到最終的殘差結(jié)果H(x),學(xué)習(xí)到的殘差特征表示為

      F(x)=H(x)-x。(1)

      本文對(duì)ResNet50網(wǎng)絡(luò)進(jìn)行了調(diào)整和修改,首先,保留殘差結(jié)構(gòu)之前的卷積和最大池化作為第一個(gè)卷積層(Conv_Layer1);其次,只保留前三個(gè)殘差層(Res_Layer2,Res_Layer3,Res_Layer4);然后,修改Res_Layer4的第一個(gè)殘差結(jié)構(gòu)的步長(zhǎng),將其由2調(diào)整為1,增大特征圖尺寸,保留更多淺層特征細(xì)節(jié);最后,由Res_Layer4得到的特征圖尺度為38×38×1 024,并將其作為第一個(gè)有效特征層,其余更深層次、語(yǔ)義信息更加豐富的有效特征層均在本層之后的附加層得到。修改后的ResNet50網(wǎng)絡(luò)作為主干網(wǎng)絡(luò),其參數(shù)如表1所示。

      1.4 多尺度特征融合

      本文通過(guò)設(shè)計(jì)一個(gè)多尺度特征融合模塊,增加深層特征圖中的有效信息與淺層特征的交互融合。特征融合模塊如圖3所示。

      SSD模型通過(guò)采用多尺度特征檢測(cè)不同尺寸物體,但缺乏對(duì)不同尺度特征圖的融合,本文設(shè)計(jì)的特征融合模塊通過(guò)將高層次特征圖(融合層)融合至更低的特征層(優(yōu)化層)中,豐富低層次特征圖中的語(yǔ)義信息。融合層(第二層,第三層)的高層次特征圖采用雙線性插值算法進(jìn)行上采樣統(tǒng)一特征圖尺寸,與低層次的優(yōu)化層(第一層)分別經(jīng)過(guò)常規(guī)卷積模塊后進(jìn)行拼接,最后通過(guò)卷積降維進(jìn)行通道轉(zhuǎn)換。新的特征圖尺寸以及通道數(shù)與第一層相同。在FFA-SSD網(wǎng)絡(luò)中,共進(jìn)行了三次特征融合,前兩次是三個(gè)特征層進(jìn)行融合,最后一次是兩個(gè)特征層進(jìn)行融合,由于 Conv10_2和Conv11_2特征圖尺度太小,包含特征信息較少,本文并未對(duì)這兩個(gè)特征層進(jìn)行融合。

      1.5 高效通道注意力機(jī)制

      不同層次的特征圖通常具有不同的背景噪聲分布,本文采用特征融合來(lái)抑制單個(gè)特征圖的背景噪聲,并生成更有判別力的特征表示,同時(shí)也會(huì)由于特征圖尺度和位置的差異產(chǎn)生冗余信息。為抑制這些負(fù)面信息的干擾,引入一種高效的通道注意力機(jī)制(efficient channel attention,ECA)[16]模塊,降低冗余信息和噪聲對(duì)網(wǎng)絡(luò)的負(fù)面影響,提高網(wǎng)絡(luò)對(duì)目標(biāo)的注意力。

      ECA模塊首先對(duì)上一次的卷積輸出進(jìn)行全局平均池化,采用一維卷積快速捕獲每個(gè)通道和它的近K個(gè)相鄰?fù)ǖ乐g的跨通道信息交互,通過(guò)Sigmoid激活函數(shù)得到每個(gè)通道可學(xué)習(xí)的權(quán)重系數(shù),再將權(quán)重應(yīng)用于每個(gè)原始特征圖的每個(gè)通道上,并生成加權(quán)后的特征圖。用C表示通道維度,K為卷核大小,表示局部跨通道交互覆蓋率,其大小根據(jù)特征圖通道數(shù)自適應(yīng)確定。K和C之間的非線性映射關(guān)系定義以及K的取值分別為

      C=(K)=2(r*k-b),(2)

      K=ψ(C)=log2(C)γ+bγodd,(3)

      其中:本文中γ和b分別為2和1;todd表示最接近t的奇數(shù)。ECA模塊避免了輸入特征映射到低維空間帶來(lái)的信息丟失,同時(shí)能夠采用有效的方式捕獲跨通道交互,更好地捕捉待檢測(cè)目標(biāo)的重要特征信息,整個(gè)模塊涉及少量的參數(shù),具備更有效的通道學(xué)習(xí)注意力,為網(wǎng)絡(luò)帶來(lái)明顯的性能增益。

      1.6 小目標(biāo)數(shù)據(jù)增強(qiáng)

      傳統(tǒng)的數(shù)據(jù)增強(qiáng)方法是通過(guò)對(duì)圖像進(jìn)行鏡像翻轉(zhuǎn)、縮放、增強(qiáng)對(duì)比度等操作豐富數(shù)據(jù)集。針對(duì)SSD網(wǎng)絡(luò)對(duì)小目標(biāo)死魚檢測(cè)能力較弱的問(wèn)題,本文提出一種針對(duì)小目標(biāo)檢測(cè)的數(shù)據(jù)增強(qiáng)方法(small target data augmentation,STDA),通過(guò)該方法擴(kuò)充數(shù)據(jù)集中小目標(biāo)的數(shù)量,提升數(shù)據(jù)背景復(fù)雜度,增強(qiáng)網(wǎng)絡(luò)對(duì)小目標(biāo)的檢測(cè)能力。

      STDA方法如圖4所示,首先隨機(jī)選取四幅原始圖像(邊長(zhǎng)為w)放入集合f{f1,f2,f3,f4},對(duì)f中的圖像分別按照隨機(jī)比例P{P1,P2,P3,P4}縮小,并進(jìn)行傳統(tǒng)數(shù)據(jù)增強(qiáng),得到處理后的圖像集合為F{F1,F(xiàn)2,F(xiàn)3,F(xiàn)4},將F集合中經(jīng)處理的圖像分別與f集合中對(duì)應(yīng)的原圖像進(jìn)行像素區(qū)域替換,并按照?qǐng)D4方式拼接,得到邊長(zhǎng)為2w的圖像Fa。最后采用邊長(zhǎng)為w的新樣本選取框在Fa中框選出新樣本。

      隨機(jī)比例因子P的設(shè)置理論上應(yīng)該在0~1之間,但如果P過(guò)小,會(huì)損失過(guò)多目標(biāo)原始特征信息,P過(guò)大時(shí),圖像縮小程度低,在訓(xùn)練過(guò)程中效果提升較小。不同的網(wǎng)絡(luò)模型輸入尺寸不同,在本文FFA-SSD網(wǎng)絡(luò)中,設(shè)置P的范圍為0.2~0.9。新樣本選取框根據(jù)中心坐標(biāo)、寬度、高度在Fa圖像上框選像素區(qū)域作為新樣本,其中心坐標(biāo)范圍是由組成Fa的四幅圖像的中心點(diǎn)組成的矩形區(qū)域,以此保證新樣本選取框的框選范圍能夠完全覆蓋Fa。此方法會(huì)縮小原始圖像,進(jìn)而也將對(duì)目標(biāo)原始特征產(chǎn)生不同程度的影響,但作為原始數(shù)據(jù)集的擴(kuò)增,可以得到包含更小尺寸目標(biāo)的新樣本數(shù)據(jù)。

      2 實(shí)驗(yàn)結(jié)果與分析

      2.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)集

      為驗(yàn)證本文算法在水面死魚檢測(cè)任務(wù)中的有效性,在相同環(huán)境下將本文改進(jìn)SSD模型同其他主流目標(biāo)檢測(cè)模型進(jìn)行對(duì)比實(shí)驗(yàn),并進(jìn)行了改進(jìn)模塊的消融實(shí)驗(yàn)。本文實(shí)驗(yàn)基于Ubantu18.04系統(tǒng),GPU為GeForce RTX 3090,內(nèi)存16 GB,設(shè)置訓(xùn)練輪次為300。

      本文實(shí)驗(yàn)數(shù)據(jù)集主要來(lái)自網(wǎng)絡(luò)搜集相關(guān)死魚圖像、手動(dòng)拍攝死魚圖像等,共3 200張,通過(guò)LabelImg進(jìn)行目標(biāo)標(biāo)注,按照Pascal VOC2012數(shù)據(jù)集格式建立,其中訓(xùn)練集、驗(yàn)證集、測(cè)試集按照8∶1∶1的比例劃分。

      2.2 評(píng)價(jià)指標(biāo)

      為驗(yàn)證本文改進(jìn)算法的檢測(cè)性能,選取精度(precision,P)和檢測(cè)速度(每秒檢測(cè)圖片的幀數(shù))為評(píng)價(jià)指標(biāo),精度計(jì)算公式為

      P=TP/(TP+FP),(4)

      其中:TP為正樣本中的正例;FP為負(fù)樣本中的正例;FN為負(fù)樣本中的負(fù)例。

      2.3 不同模型性能對(duì)比實(shí)驗(yàn)

      采用Faster R-CNN、YOLOv3、MobileNet-SSD、SSD以及本文改進(jìn)算法FFA-SSD進(jìn)行檢測(cè)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表2所示。FFA-SSD算法比原SSD算法精度提高了7.6%,比Faster R-CNN、YOLOv3和MobileNet-SSD 分別提高了1.4%、5.4%和12.1%,改進(jìn)后的SSD算法更具有精度優(yōu)勢(shì)。在檢測(cè)速度上,F(xiàn)aster R-CNN難以滿足實(shí)時(shí)性的需求,MobileNet-SSD檢測(cè)速度最快。由于FFA-SSD采用更加輕量化的ResNet50作為主干網(wǎng)絡(luò),可以有效減少計(jì)算量和參數(shù)量,加入特征融合網(wǎng)絡(luò)和注意力機(jī)制后,比SSD-VGG16仍具有速度優(yōu)勢(shì),可以達(dá)到48 fps。

      2.4 改進(jìn)模塊的消融實(shí)驗(yàn)

      為驗(yàn)證本文改進(jìn)策略的有效性,在SSD網(wǎng)絡(luò)中分別加入各改進(jìn)模塊進(jìn)行消融實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)集為測(cè)試集。消融實(shí)驗(yàn)結(jié)果如表3所示,“●”表示在對(duì)應(yīng)序號(hào)實(shí)驗(yàn)中添加此改進(jìn)模塊。

      由表3可知,將ResNet50作為主干網(wǎng)絡(luò)后,模型的檢測(cè)精度提升了1.7%,證明ResNet50具有更強(qiáng)的特征提取能力,提取的特征信息更豐富,在此基礎(chǔ)上添加特征融合網(wǎng)絡(luò)、ECA注意力機(jī)制、STDA小目標(biāo)增強(qiáng),模型的檢測(cè)精度分別比前者提升了3.5%,1.2%,1.2%。其中特征融合模塊對(duì)模型檢測(cè)精度提升最大。以上數(shù)據(jù)驗(yàn)證了本文改進(jìn)模塊均能有效提升網(wǎng)絡(luò)模型對(duì)死魚的檢測(cè)效果??傮w來(lái)講,本文提出的FFA-SSD算法比原SSD算法在精度上提高了7.6%,能夠更精準(zhǔn)地識(shí)別水面死魚目標(biāo)。

      2.5 小目標(biāo)檢測(cè)實(shí)驗(yàn)

      為更好地證明本文改進(jìn)算法在小目標(biāo)檢測(cè)中的優(yōu)勢(shì),制作了包含200張圖片、418個(gè)目標(biāo)的測(cè)試數(shù)據(jù)集,其中小目標(biāo)數(shù)量為267個(gè),分別采用改進(jìn)前、后的網(wǎng)絡(luò)模型在該數(shù)據(jù)集上進(jìn)行檢測(cè),采用錯(cuò)檢率為評(píng)價(jià)指標(biāo)。

      在實(shí)驗(yàn)中,原SSD網(wǎng)絡(luò)在小目標(biāo)檢測(cè)中共錯(cuò)檢了39個(gè),錯(cuò)檢率達(dá)到9.3%,其中小目標(biāo)錯(cuò)檢32個(gè),錯(cuò)檢率為12%;本文改進(jìn)算法共錯(cuò)檢了11個(gè)目標(biāo),其中含有小目標(biāo)10個(gè),總錯(cuò)檢率下降了6.7%,小目標(biāo)錯(cuò)檢率下降了8.3%。實(shí)驗(yàn)驗(yàn)證了本文針對(duì)小目標(biāo)的改進(jìn)策略能夠有效提升網(wǎng)絡(luò)對(duì)小目標(biāo)的檢測(cè)能力。

      2.6 檢測(cè)結(jié)果可視化分析

      為了驗(yàn)證本文設(shè)計(jì)的多尺度特征模塊和高效通道注意力機(jī)制對(duì)檢測(cè)性能的提升效果,本文利用Grad-CAM(gradient-weighted class activation mapping)[17]技術(shù),通過(guò)可視化的熱力圖譜進(jìn)行分析。如圖5所示,在圖5(b)中未添加多尺度特征融合和注意力機(jī)制的SSD模型在檢測(cè)過(guò)程中容易受一些噪聲的影響,對(duì)死魚目標(biāo)關(guān)注度不夠,在圖5(c)中, FFA-SSD模型對(duì)小目標(biāo)死魚關(guān)注更加細(xì)致,有效提升了網(wǎng)絡(luò)模型對(duì)感興趣區(qū)域的注意力,對(duì)目標(biāo)覆蓋更加準(zhǔn)確。

      為了更清晰地展現(xiàn)本文改進(jìn)算法在水面死魚檢測(cè)中的效果,本文采用SSD-VGG16算法和FFA-SSD算法對(duì)不同環(huán)境下的死魚圖像進(jìn)行檢測(cè),檢測(cè)效果如圖6所示。

      圖6(a)中,F(xiàn)FA-SSD算法在檢測(cè)精度上具有明顯優(yōu)勢(shì)。圖6(b)中包含多個(gè)小目標(biāo),且分布相對(duì)密集,為更好地觀察目標(biāo)檢出情況,在圖6(b)的檢測(cè)過(guò)程中只保留了檢測(cè)框,SSD-VGG16算法出現(xiàn)了七處漏檢,F(xiàn)FA-SSD算法只有兩處未檢出。圖6(c)和圖6(d)的背景都相對(duì)復(fù)雜,二者均能正確檢出,但FFA-SSD算法更具精度優(yōu)勢(shì)。

      3 總結(jié)

      本文提出了一種基于特征融合和注意力機(jī)制的水面死魚檢測(cè)算法FFA-SSD,比VGG16、ResNet50具有更強(qiáng)的特征提取能力和更小的參數(shù)量。特征融合模塊通過(guò)增強(qiáng)不同尺度特征之間的交互,豐富淺層特征的語(yǔ)義信息,有效提高了特征表征能力。同時(shí)引入高效通道注意力機(jī)制,有效抑制了網(wǎng)絡(luò)中負(fù)面信息帶來(lái)的影響,提升了網(wǎng)絡(luò)對(duì)目標(biāo)的關(guān)注度。小目標(biāo)數(shù)據(jù)增強(qiáng)算法能夠使網(wǎng)絡(luò)學(xué)習(xí)到更多的魯棒性特征,提高模型泛化能力。實(shí)驗(yàn)結(jié)果表明,本文改進(jìn)算法的檢測(cè)精度可以達(dá)到93.5%,比原SSD算法提高了7.6%,檢測(cè)速度能夠保持在48 fps,可以滿足實(shí)時(shí)性的需求。本文的改進(jìn)算法具有較高的檢測(cè)精度,同時(shí)能保持較高的檢測(cè)速度,從而為水面死魚自動(dòng)化檢測(cè)提供參考。

      參考文獻(xiàn):

      [1] YU G Y, WANG L, HOU M X, et al. An adaptive dead fish detection approach using SSD-MobileNet[C]∥2020 Chinese Automation Congress. Piscataway:IEEE Press, 2021: 1973-1979.

      [2] 鄧姍姍, 黃慧, 馬燕. 基于改進(jìn)Faster R-CNN的小目標(biāo)檢測(cè)算法[J]. 計(jì)算機(jī)工程與科學(xué), 2023, 45(5): 869-877.

      DENG S S, HUANG H, MA Y. A small object detection algorithm based on improved Faster R-CNN[J]. Computer engineering & science, 2023, 45(5): 869-877.

      [3] ZHENG J L, LIU Y. A study on small-scale ship detection based on attention mechanism[J]. IEEE access, 2022, 10: 77940-77949.

      [4] 李國(guó)進(jìn), 姚冬宜, 艾矯燕, 等. 基于改進(jìn)Faster R-CNN的水面漂浮物識(shí)別與定位[J]. 信陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版), 2021, 34(2): 292-299.

      LI G J, YAO D Y, AI J Y, et al. Detection and localization of floating objects via improved faster R-CNN[J]. Journal of Xinyang normal university (natural science edition), 2021, 34(2): 292-299.

      [5] DUC MINH T, HOA N T N, LE T H. A model for floating garbage detection and quantification using fixed camera[C]∥2022 9th NAFOSTED Conference on Information and Computer Science. Piscataway:IEEE Press, 2022: 389-393.

      [6] CHENG Q Q, WANG H J, ZHU B, et al. A real-time UAV target detection algorithm based on edge computing[J]. Drones, 2023, 7(2): 95.

      [7] HE X Q, WANG J C, CHEN C B, et al. Detection of the floating objects on the water surface based on improved YOLOv5[C]∥2021 IEEE 2nd International Conference on Information Technology, Big Data and Artificial Intelligence (ICIBA). Piscataway:IEEE Press, 2021:772-777.

      [8] ZHANG L L, WEI Y X, WANG H B, et al. Real-time detection of river surface floating object based on improved RefineDet[J]. IEEE access, 2021, 9: 81147-81160.

      [9] LI X L, TIAN M J, KONG S H, et al. A modified YOLOv3 detection method for vision-based water surface garbage capture robot[J]. International journal of advanced robotic systems, 2020, 17(3): 172988142093271.

      [10]張堡瑞, 肖宇峰, 鄭又能. 基于激光雷達(dá)與視覺(jué)融合的水面漂浮物檢測(cè)[J]. 應(yīng)用激光, 2021, 41(3): 619-628.

      ZHANG B R, XIAO Y F, ZHENG Y N. Detection of floating objects on water surface based on fusion of lidar and vision[J]. Applied laser, 2021, 41(3): 619-628.

      [11]CHENG Y W, XU H, LIU Y M. Robust small object detection on the water surface through fusion of camera and millimeter wave radar[C]∥2021 IEEE/CVF International Conference on Computer Vision. Piscataway:IEEE Press, 2021:15243-15252.

      [12]馬天鳳, 楊震, 羅勇, 等. 基于深度特征融合的紅外弱小目標(biāo)檢測(cè)方法[J]. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版), 2023, 55(3): 65-72.

      MA T F, YANG Z, LUO Y, et al. Infrared dim small target detection method based on depth feature fusion[J]. Journal of Zhengzhou university (natural science edition), 2023, 55(3): 65-72.

      [13]肖進(jìn)勝, 趙陶, 周劍, 等. 基于上下文增強(qiáng)和特征提純的小目標(biāo)檢測(cè)網(wǎng)絡(luò)[J]. 計(jì)算機(jī)研究與發(fā)展, 2023, 60(2): 465-474.

      XIAO J S, ZHAO T, ZHOU J, et al. Small target detection network based on context augmentation and feature refinement[J]. Journal of computer research and development, 2023, 60(2): 465-474.

      [14]陳科圻, 朱志亮, 鄧小明, 等. 多尺度目標(biāo)檢測(cè)的深度學(xué)習(xí)研究綜述[J]. 軟件學(xué)報(bào), 2021, 32(4): 1201-1227.

      CHEN K Q, ZHU Z L, DENG X M, et al. Deep learning for multi-scale object detection: a survey[J]. Journal of software, 2021, 32(4): 1201-1227.

      [15]RAVEENA S, SURENDRAN R. ResNet50-based classification of coffee cherry maturity using deep-CNN[C]∥2023 5th International Conference on Smart Systems and Inventive Technology (ICSSIT). Piscataway:IEEE Press, 2023:1275-1281.

      [16]SONG T N, QIN W W, LIANG Z, et al. Research on CNN for anti-missile object detection algorithm based on improved attention mechanism[C]∥2021 40th Chinese Control Conference.Piscataway:IEEE Press, 2021: 8286-8291.

      [17]HOU Q S, XING J S. SSD object detection algorithm based on KL loss and Grad-CAM[J]. Acta electronica sinica, 2020,48(12):2409-2416.

      无锡市| 黄山市| 鄂伦春自治旗| 林州市| 泰州市| 漯河市| 宁蒗| 南城县| 沂南县| 宝鸡市| 富锦市| 沅陵县| 边坝县| 馆陶县| 平阴县| 石门县| 谢通门县| 太湖县| 仙桃市| 叙永县| 绿春县| 民丰县| 甘德县| 石嘴山市| 泽库县| 阿瓦提县| 湟源县| 福海县| 镇坪县| 大英县| 平顶山市| 漳州市| 石台县| 江阴市| 大理市| 阳信县| 东城区| 康定县| 东平县| 中超| 南溪县|