• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      多尺度特征融合技術(shù)在弱信息圖像分割的運(yùn)用

      2023-10-21 01:53:44殷梓YINZi
      價(jià)值工程 2023年28期
      關(guān)鍵詞:尺度注意力語義

      殷梓YIN Zi

      (南京信息工程大學(xué),南京 210044)

      0 引言

      近年來隨著卷積神經(jīng)網(wǎng)絡(luò)的飛速發(fā)展,基于全信息學(xué)習(xí)的語義分割網(wǎng)絡(luò)在性能上取得了顯著的提升。然而語義分割任務(wù)所需要的數(shù)據(jù)標(biāo)注往往需要耗費(fèi)大量的人力和時(shí)間成本,這成為其技術(shù)發(fā)展最主要的限制因素,弱信息語義分割方法應(yīng)運(yùn)而生,該方法只需類別標(biāo)簽的前提下完成語義分割的任務(wù)。本文設(shè)計(jì)了一個(gè)多尺度類激活圖學(xué)習(xí)機(jī)制,該機(jī)制考慮了類激活圖與特征圖之間的學(xué)習(xí)。其機(jī)制中的多尺度注意力學(xué)習(xí)算法將生成不同尺度特征圖與原尺寸類激活圖學(xué)習(xí)得到的類激活圖。同時(shí),本文還進(jìn)行了一系列的消融對(duì)比研究。實(shí)驗(yàn)結(jié)果表明,該方法在定性和定量上都優(yōu)于許多現(xiàn)有模型。總的來說,本文的主要貢獻(xiàn)可歸納如下:①提出了一種新的多尺度類激活圖學(xué)習(xí)機(jī)制(Multi-scale class activation mapping learning mechanism,MCAM),通過機(jī)制進(jìn)行多尺度類激活圖結(jié)合。②多尺度注意力學(xué)習(xí)算法(Multi-scale attention learning algorithm,MA),來提高類激活圖中對(duì)前景的挖掘能力。

      1 網(wǎng)絡(luò)結(jié)構(gòu)

      本文的網(wǎng)絡(luò)模型如圖1,采用了多尺度圖片輸入,其分別是原尺寸圖片,原尺寸圖片的0.5 倍,原尺寸圖片的1.5 倍,將三種尺寸圖片輸入進(jìn)模塊1,模塊1 將得到對(duì)應(yīng)的一系列類激活圖的輸出,具體的類激活圖生成過程將在本文的下一節(jié)進(jìn)行詳細(xì)說明。

      圖1 模型結(jié)構(gòu)總示意圖

      1.1 多尺度類激活圖學(xué)習(xí)機(jī)制

      特征圖與類激活圖之間存在的特征信息在弱信息語義分割任務(wù)中具有重要意義。本文將進(jìn)一步利用不同尺度下的特征圖與類激活圖的信息,故將該模塊命名為多尺度類激活圖學(xué)習(xí)機(jī)制(Multi-scale class activation mapping learning mechanism,MCAM),結(jié)構(gòu)圖如圖2 所示。Feature map(1.0х)、Feature map(0.5х)、Feature map(1.5х)分別表示原尺寸產(chǎn)生的特征圖、原尺寸0.5 倍產(chǎn)生的特征圖、原尺寸1.5 倍產(chǎn)生的特征圖。接著,利用分類網(wǎng)絡(luò)全連接層的權(quán)重以類激活圖的傳統(tǒng)始生成方式生成各尺寸特征圖對(duì)應(yīng)的類激活圖CAM(1.0х)、CAM(0.5х)、CAM(1.5х),在下分支,如圖2 中虛線框所示。將Feature map(0.5х)、Feature map(1.5х)和CAM(1.0х)作為模塊2 多尺度注意力學(xué)習(xí)算法的輸入來生成強(qiáng)化CAM*all,再將兩者結(jié)合生成CAM*all,最后通過融合算法(下文將對(duì)其算法進(jìn)行詳細(xì)說明)使CAM(1.0х)、CAM(0.5x)、CAM(1.5х)與CAM*all進(jìn)行有效結(jié)合。結(jié)合之后的結(jié)果為最終的輸出。

      圖2 多尺度類激活圖學(xué)習(xí)機(jī)制

      1.2 多尺度注意力學(xué)習(xí)算法

      本文的模塊2 是提出的多尺度注意力學(xué)習(xí)算法(Multi-scale attention learning algorithm,MA),該模塊嵌入在模塊1 的整體框架中,用于進(jìn)行不同尺度之間的特征信息學(xué)習(xí)。如圖3 所示,多尺度注意力學(xué)習(xí)算法模塊(MA)主要是原尺寸的類激活圖結(jié)果與Feature map(1.5х)進(jìn)行結(jié)合,F(xiàn)eature map(1.5х)與CAM(1.0х)通過卷積g 學(xué)習(xí)參數(shù),卷積g為1x1 的卷積,最后經(jīng)過相乘得到CAM*all,該算法利用不同尺寸之間的信息相關(guān)性生成增強(qiáng)類激活圖,能夠更有效地挖掘前景區(qū)域。

      圖3 多尺度注意力學(xué)習(xí)算法模塊結(jié)構(gòu)圖

      2 實(shí)驗(yàn)分析

      本文的方法主要由多尺度類激活圖學(xué)習(xí)機(jī)制(MCAM),多尺度注意力學(xué)習(xí)算法(MA)組成。本文的分割網(wǎng)絡(luò)VGG-16[2]在實(shí)驗(yàn)前已經(jīng)由ImageNe 數(shù)據(jù)集進(jìn)行了預(yù)訓(xùn)練。為了探究各個(gè)模塊和算法的有效性,在本節(jié)將對(duì)模型以不同的設(shè)置條件下進(jìn)行實(shí)驗(yàn)。本節(jié)中的所有模型都是在PASCAL VOC 2012[1]數(shù)據(jù)集上進(jìn)行訓(xùn)練的,本小節(jié)均以數(shù)據(jù)集中訓(xùn)練集產(chǎn)生的類激活圖與真實(shí)標(biāo)簽來進(jìn)行質(zhì)量比較,以平均交并比(mean intersection-over-union,mIoU)指標(biāo)作為判斷準(zhǔn)繩。表1 顯示了多尺度類激活圖學(xué)習(xí)機(jī)制(MCAM)的成類激活圖CAM*all和融合之后的最終輸出在mIOU 指標(biāo)上的表現(xiàn)。從表1 可以看出得到的類激活圖CAM*all要比原始類激活圖CAM 的mIoU 提升約7%,最終輸出結(jié)果要比原始類激活圖CAM 的mIoU 提升約8.4%,這表明MCAM 對(duì)模型性能都具有一定的提升。

      表1 模型各個(gè)模塊在訓(xùn)練上的性能表現(xiàn),最佳結(jié)果以粗體顯示

      2.1 多尺度類激活圖學(xué)習(xí)機(jī)制實(shí)驗(yàn)分析

      上一部分通過指標(biāo)驗(yàn)證了其算法能帶來性能的提升,為了進(jìn)一步證明多尺度類激活圖學(xué)習(xí)機(jī)制的有效性,本部分將針對(duì)該機(jī)制上下分支輸出結(jié)果CAM*all進(jìn)行可視化分析,CAM*all如圖4 所示,第一行是在單類別目標(biāo)圖像,CAM*all相比于CAM 能夠挖掘到更豐富的前景信息,同時(shí)對(duì)目標(biāo)的邊緣也較為敏感。第二行和第三行是相同圖片在不同類別(分別是人和飛機(jī))做出的特征反應(yīng)??梢园l(fā)現(xiàn),CAM*all挖掘到更多背景的同時(shí)把部分背景和其他不屬于此類的信息挖掘了出來,對(duì)結(jié)果帶來了一定干擾。

      圖4

      2.2 不同尺度條件下類激活圖的性能

      本文研究了不同尺度對(duì)多尺度類激活圖學(xué)習(xí)機(jī)制(MCAM)的影響并尋得最為有效的一組尺度輸入。在本文模型結(jié)構(gòu)中,默認(rèn)輸入的多尺度為{0.5,1.0,1.5}這三種尺度。本節(jié)例舉試驗(yàn)的三種配置(即{0.25,0.5,1}、{0.5,1,1.5}、{1,1.5,2}),其結(jié)果在表2 中進(jìn)行了展示。通過表中指標(biāo)可以直觀發(fā)現(xiàn),b 組{0.5,1,1.5}獲得了最好的性能55.54%。a 組組合是全部為縮小尺寸輸入其結(jié)果要比b組低1.4%,c 組是全部為放大尺寸的輸入其結(jié)果要比b 組低1.7%。

      表2 不同尺度組合的性能表現(xiàn),最佳結(jié)果以粗體表示

      2.3 與其他實(shí)驗(yàn)性能對(duì)比

      本文提出的弱信息語義分割方法與其他最先進(jìn)的模型進(jìn)行了比較,如表3 所示包括MCOF[3]、SeeNet[4]、DSRG[5]、FickleNet[6]、CIAN[7]、EME[8]、MCIS[9]、OAA++[10]、ECS-Net[11]。

      表3 與近年先進(jìn)算法的對(duì)比,最佳結(jié)果以粗體表示

      為了與各個(gè)先進(jìn)算法模型進(jìn)行公正的比較,表3 中所有數(shù)據(jù)均來源公開論文的指標(biāo)。從表中可發(fā)現(xiàn),本文的方法取得了驗(yàn)證集67.8%,測(cè)試集67.7%的指標(biāo),在PASCAL VOC2012 數(shù)據(jù)集[1]的驗(yàn)證集和測(cè)試集中都優(yōu)于近年部分最先進(jìn)的方法,意味著本文的方法具有更佳的性能表現(xiàn)。

      3 結(jié)語

      本文提出了一種新的用于弱信息語義分割任務(wù)的多尺度特征融合網(wǎng)絡(luò)算法,其算法具有高性能的判別性區(qū)域挖掘能力,并使得模型在各種情況下都具有一定的有效性。對(duì)于今后的工作,我們將改善在多類別情況下前景挖掘不夠充分的問題,并重點(diǎn)研究如何以一種更加輕量化的網(wǎng)絡(luò)來實(shí)施特征的提取,同時(shí)保持較高的精度。

      猜你喜歡
      尺度注意力語義
      讓注意力“飛”回來
      財(cái)產(chǎn)的五大尺度和五重應(yīng)對(duì)
      語言與語義
      “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
      A Beautiful Way Of Looking At Things
      宇宙的尺度
      太空探索(2016年5期)2016-07-12 15:17:55
      “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
      認(rèn)知范疇模糊與語義模糊
      9
      語義分析與漢俄副名組合
      贵港市| 怀宁县| 关岭| 大丰市| 曲沃县| 马边| 利辛县| 叙永县| 泊头市| 尚志市| 钟祥市| 禄丰县| 仙游县| 资源县| 房山区| 永嘉县| 博罗县| 铜川市| 长兴县| 额济纳旗| 郓城县| 大埔县| 巴青县| 航空| 西安市| 宿州市| 霍林郭勒市| 定远县| 齐齐哈尔市| 黄山市| 吴堡县| 江门市| 清涧县| 千阳县| 福鼎市| 武川县| 维西| 安岳县| 金湖县| 襄樊市| 达拉特旗|