胡永進(jìn), 韓 旭, 高小慧, 胡耀天
(江蘇農(nóng)林職業(yè)技術(shù)學(xué)院,江蘇句容 212400)
林地作為重要的自然資源之一,是國(guó)家可持續(xù)發(fā)展的重要物質(zhì)基礎(chǔ),掌握林地的準(zhǔn)確分布對(duì)于林地調(diào)查管理具有重要作用[1-2]。隨著遙感技術(shù)的發(fā)展,利用衛(wèi)星影像對(duì)林地資源進(jìn)行識(shí)別、變化檢測(cè)表現(xiàn)出了極大的應(yīng)用潛力,這也是當(dāng)前遙感圖像解譯中的重要研究課題[3]。
利用遙感影像進(jìn)行林地解譯方法主要分為2類,包括目視解譯和計(jì)算機(jī)解譯,其中目視解譯即利用人工的方法,通過遙感影像中林地所表達(dá)的光譜、形狀、紋理等差異直接觀察或者借助輔助判讀儀器對(duì)遙感影像中的林地類別進(jìn)行判讀[4-5]。然而,該類方法耗時(shí)耗力、且人工解譯的過程不能疊加,知識(shí)無(wú)法有效積累。此后,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,基于計(jì)算機(jī)技術(shù)的遙感影像解譯方法得到了更多應(yīng)用?;谟?jì)算機(jī)技術(shù)的遙感影像林地提取方法可以分為2類,包括傳統(tǒng)方法和深度學(xué)習(xí)[6]。其中,傳統(tǒng)方法主要是通過分析林地在遙感影像中的特征表達(dá),如光譜、紋理、形態(tài)等特征,并構(gòu)建預(yù)定義模型對(duì)林地進(jìn)行分類。包括基于像元分類的方法、面向?qū)ο蟮姆椒ㄒ约盎跈C(jī)器學(xué)習(xí)的方法。其中,基于像元的林地信息提取方法主要是通過分析林地光譜特征表達(dá)對(duì)不同波段進(jìn)行特征組合,如利用歸一化植被指數(shù)(NDVI)[7]、比值植被指數(shù)(RVI)[8]等植被指數(shù)進(jìn)行林地信息提取。然而單一的色彩空間并不能完整表達(dá)林地特征,且高分辨率遙感影像中地物更加清晰,信息更加豐富,同時(shí)林地的顯示也更加突出和細(xì)碎化,多種特征結(jié)合的方式很難精確地提取出林地信息。在此基礎(chǔ)之上,面向?qū)ο蟮姆椒ㄖ饾u被應(yīng)用,與像元方式不同,面向?qū)ο蟮牧值靥崛》椒ㄊ且酝|(zhì)對(duì)象作為最小分析單元,通過分析遙感影像中林地的光譜、形狀、紋理等多種特征,并借助認(rèn)知機(jī)理來選定這些特征,保證其能夠最大程度地區(qū)分遙感影像上的林地信息[9-12]。雖然這些方法在林地提取方面都取得了一定的效果,但由于光學(xué)遙感影像以非均勻區(qū)域的形式表達(dá)地物信息,且草地、耕地等光譜特性與林地極相似,從而對(duì)林地區(qū)域的識(shí)別產(chǎn)生干擾。此外,較大的類內(nèi)方差和較低的類間方差導(dǎo)致無(wú)法建立預(yù)定義模型,從而實(shí)現(xiàn)高精度的林地提取。此后,基于機(jī)器學(xué)習(xí)的方法被用于林地信息的提取,機(jī)器學(xué)習(xí)的方法是通過設(shè)計(jì)特征提取函數(shù),并利用一定的樣本學(xué)習(xí)進(jìn)行參數(shù)擬合計(jì)算樣本之間的關(guān)聯(lián),包括支持向量機(jī)(support vector machine,簡(jiǎn)稱SVM)、決策樹、隨機(jī)森林等[13-14]。然而,機(jī)器學(xué)習(xí)僅限于淺層特征提取,其非線性表達(dá)能力有限,無(wú)法抽取遙感影像中林地的深層次特征。而通過構(gòu)建深層次神經(jīng)網(wǎng)絡(luò)則可以通過自動(dòng)學(xué)習(xí)的方式有效抽取影像深層次特征,可以進(jìn)一步解決以上問題。
Hinton等提出深度學(xué)習(xí)理論,深度學(xué)習(xí)通過非線性表達(dá)來獲取數(shù)據(jù)中的高級(jí)抽象特征,并構(gòu)建數(shù)學(xué)模型以提高分類精度和檢測(cè)準(zhǔn)確率[15]。其中卷積神經(jīng)網(wǎng)絡(luò) (convolutional neural networks,簡(jiǎn)稱CNN)在圖像分類方面取得了較好的成果,許多學(xué)者在CNN的基礎(chǔ)上進(jìn)一步研究產(chǎn)生了眾多改進(jìn)算法,如FCN[16]、SegNet[17]、UNet[18]、PSPNet[19]等,在此基礎(chǔ)上許多神經(jīng)網(wǎng)絡(luò)算法也被應(yīng)用于遙感影像信息提取。Nataliia則通過一種多層次的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對(duì)衛(wèi)星圖像進(jìn)行土地覆蓋和作物類型分類[20];Liu等提出了基于隨機(jī)尺度拉伸CNN的高光譜高分辨率遙感影像分類方法[21];Felix等利用無(wú)人機(jī)影像,通過UNet卷積神經(jīng)網(wǎng)絡(luò)對(duì)不同類型的林地進(jìn)行了提取[22]。Gui等則利用POI-Net和Deep-UNet對(duì)高分一號(hào)影像進(jìn)行了林地檢測(cè)試驗(yàn)[23]。盡管以上研究相對(duì)于傳統(tǒng)方法取得了明顯的進(jìn)展,然而,林地相對(duì)于普通地物更加特殊。首先,林地在影像中光譜特征表達(dá)差異性大,同物異譜現(xiàn)象更加明顯,且林地與植被、耕地等地物特征相似,同譜異物現(xiàn)象顯著;其次,林地面積差異性較大,既包括大面積森林也包含有小面積林地,尺度差異特征更加明顯;最后,由于深度學(xué)習(xí)需要以大量數(shù)據(jù)為基礎(chǔ),當(dāng)前并沒有可用于林地提取的遙感影像數(shù)據(jù)集。
針對(duì)上述問題,本研究提出一種顧及多尺度上下文特征的高分影像林地提取方法,在編碼階段利用殘差網(wǎng)絡(luò)實(shí)現(xiàn)林地的深層次特征提取,在解碼階段,通過考慮上下文信息的特征融合方法與深度多尺度信息聚合結(jié)構(gòu)進(jìn)一步提高網(wǎng)絡(luò)對(duì)于林地信息的提取能力。為證明方法的有效性,建立了1個(gè)遙感影像林地信息提取數(shù)據(jù)集,并將該方法與多種常用深度神經(jīng)網(wǎng)絡(luò)模型對(duì)比,以驗(yàn)證本方法的有效性。
顧及多尺度上下文信息的卷積神經(jīng)網(wǎng)絡(luò)模型見圖1,該模型是一種端到端的對(duì)稱訓(xùn)練結(jié)構(gòu),包括編碼器網(wǎng)絡(luò)和解碼器網(wǎng)絡(luò)2個(gè)部分,其中編碼部分為殘差網(wǎng)絡(luò),解碼部分則包括顧及上下文信息的特征融合算法與深度多尺度特征聚合。在編碼階段,利用殘差網(wǎng)絡(luò)獲取遙感影像中林地的深層次特征。在此基礎(chǔ)之上,結(jié)合林地在遙感影像中的特征表達(dá),通過顧及上下文信息的特征融合算法提取林地的上下文信息,提高深層網(wǎng)絡(luò)對(duì)目標(biāo)區(qū)域的關(guān)注度,此外,考慮到林地尺度差異性相對(duì)于遙感影像中的一般地物更加明顯,通過建立深度多尺度預(yù)測(cè)結(jié)構(gòu),聚合不同從層次網(wǎng)絡(luò)中所表現(xiàn)出的多尺度特征以獲取更好的結(jié)果。
隨著網(wǎng)絡(luò)層數(shù)的增加,在促進(jìn)網(wǎng)絡(luò)的非線性表達(dá)能力的同時(shí),單一的級(jí)聯(lián)結(jié)構(gòu)也會(huì)導(dǎo)致梯度消失/梯度爆炸,導(dǎo)致在反向傳播的過程中網(wǎng)絡(luò)參數(shù)無(wú)法優(yōu)化。由He等提出的ResNet則避免了這種情況,ResNet通過一種跳躍連接的方式把輸入跨層連接到下一層,使得網(wǎng)絡(luò)的訓(xùn)練更關(guān)注于網(wǎng)絡(luò)之間的變化,相比于原來的映射,殘差映射更容易收斂且容易訓(xùn)練[24]。圖1中①~⑤分別代表ResNet-101從低級(jí)到高級(jí)的5個(gè)不同階段的特征。與之不同的是,在初始階段進(jìn)一步考慮通過改變卷積核的大小來提取局部林地信息。卷積核的大小從1個(gè)7×7變成了3個(gè)3×3,可以在保證感受野相同的情況下減少參數(shù),同時(shí),串聯(lián)多個(gè)小卷積核比單個(gè)大卷積核具有更高的非線性表達(dá)能力,可以進(jìn)一步提高網(wǎng)絡(luò)初始階段對(duì)于局部特征的提取能力。此外,為了避免在下采樣過程中由于池化層造成的信息損失,該模型構(gòu)造為一個(gè)無(wú)池化層的網(wǎng)絡(luò),通過將步長(zhǎng)設(shè)置為2以達(dá)到下采樣的目的。
遙感影像中的上下文信息是指不同類型對(duì)象的位置和特征表達(dá)之間的關(guān)系,它可以直接或間接地影響地物信息提取的結(jié)果[25-26]。因此,如何在神經(jīng)網(wǎng)絡(luò)編碼與解碼過程中設(shè)計(jì)一種適合的上下文信息融合結(jié)構(gòu),對(duì)于林地的提取極為重要。在語(yǔ)義分割過程中常用的連接結(jié)構(gòu)是將編碼與解碼過程中具有相同分辨率的特征進(jìn)行融合,如UNet和SegNet,這種操作方式可以將不同尺度的特征進(jìn)行有效融合,避免特征丟失。然而,這種簡(jiǎn)單通道拼接是基于全局特征信息融合的,缺乏對(duì)目標(biāo)區(qū)域的關(guān)注,特征表達(dá)程度不高,因此,本研究提出一種顧及上下文信息的特征融合算法(圖2),將編碼過程中特征提取結(jié)果與相同尺寸的上采樣結(jié)果進(jìn)行特征融合,以契合不斷上采樣過程中對(duì)于上下文特征的需求,首先,通過內(nèi)積計(jì)算二者的相關(guān)性程度,其次,利用歸一化操作得到注意力評(píng)分,最后,通過層之間的加權(quán)求和獲取上下文信息,實(shí)現(xiàn)顧及上下文信息的特征融合。相對(duì)于傳統(tǒng)的全局信息融合方法,本研究可以充分利用編碼與解碼階段各個(gè)卷積模塊提取的特征圖信息,提高對(duì)深層網(wǎng)絡(luò)中目標(biāo)區(qū)域的關(guān)注度。
對(duì)于卷積神經(jīng)網(wǎng)絡(luò)而言,不同深度對(duì)應(yīng)不同層次的語(yǔ)義特征,淺層網(wǎng)絡(luò)的分辨率高,可以學(xué)習(xí)到更多的細(xì)節(jié)特征,目標(biāo)位置準(zhǔn)確但語(yǔ)義信息較少,而深層網(wǎng)絡(luò)分辨率低,可以學(xué)習(xí)到更多的語(yǔ)義特征,但目標(biāo)位置比較粗略。由于林地在遙感影像中分布面積不同,這也導(dǎo)致了林地相對(duì)于遙感影像中的其他地物具有更明顯的尺度特征,網(wǎng)絡(luò)在解碼過程中通過不斷上采樣可以獲取到多尺度特征,但一般網(wǎng)絡(luò)中,只對(duì)原始特征進(jìn)行單層次加權(quán)輸出預(yù)測(cè),輸出沒有進(jìn)行物理組合,雖然在一定程度上能夠獲取部分多尺度信息,卻無(wú)法充分利用編碼與解碼過程構(gòu)成的特征金字塔結(jié)構(gòu)信息,不能進(jìn)行充分的特征融合。
為解決這一問題,本研究建立了一種深度多尺度聚合結(jié)構(gòu)用于林地特征的提取(圖3)。將上采樣的結(jié)果與不同金字塔層級(jí)的特征圖譜進(jìn)行合并操作,得到新的表征能力更強(qiáng)的多層級(jí)輸出特征圖譜,并通過合并操作得到最終預(yù)測(cè)結(jié)果。通過這樣的連接,每一層預(yù)測(cè)所用的特征圖譜都融合了不同分辨率、不同語(yǔ)義強(qiáng)度的特征,且該方法僅在原網(wǎng)絡(luò)基礎(chǔ)上進(jìn)行特征輸出,幾乎不會(huì)增加額外的計(jì)算量和時(shí)間。
數(shù)據(jù)集是驗(yàn)證深度學(xué)習(xí)模型是否有效的關(guān)鍵,但由于數(shù)據(jù)集的限制使得深度學(xué)習(xí)在該領(lǐng)域并沒有較好的應(yīng)用,因此,筆者構(gòu)建了一個(gè)新的遙感影像數(shù)據(jù)集用于林地提取。林地信息提取數(shù)據(jù)集構(gòu)建過程見圖4。全部數(shù)據(jù)集標(biāo)注大約用了2個(gè)月的時(shí)間,在數(shù)據(jù)集建立過程中主要面臨著2個(gè)方面的挑戰(zhàn)。首先,林地與草地、耕地等植被區(qū)域具有一定的相似性,使得標(biāo)注更加困難;其次,由于地物復(fù)雜度高,尺度變化性大,影像中既包括大面積的林地也包含大量小區(qū)域林地;最后,在完成數(shù)據(jù)集初步標(biāo)注之后,進(jìn)行了多次檢查與完善,最終形成1個(gè)可以用于林地信息提取的數(shù)據(jù)集。由于原始圖像尺寸較大,為便于訓(xùn)練,將影像裁剪為256×256像素圖像,在數(shù)據(jù)集制作過程中采用隨機(jī)裁剪、隨機(jī)旋轉(zhuǎn)、模糊及隨機(jī)噪聲等操作進(jìn)行數(shù)據(jù)增強(qiáng)操作,這可以進(jìn)一步減少過擬合以及提高網(wǎng)絡(luò)的泛化能力,最終可用于訓(xùn)練的數(shù)據(jù)集包括9 048張訓(xùn)練影像、1 296張驗(yàn)證影像和1 460張測(cè)試影像。
2.2.1 參數(shù)設(shè)施 所有訓(xùn)練及測(cè)試都是在TensorFlow的深度學(xué)習(xí)框架Keras上進(jìn)行的,在帶有Win10系統(tǒng),NVIDIA GeForce RTX 3090 24 G的GPU上實(shí)現(xiàn)的,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中需要人工設(shè)置部分超參數(shù)以使其可以獲得較優(yōu)的試驗(yàn)結(jié)果,經(jīng)過反復(fù)的調(diào)試驗(yàn)證,本研究獲取了最優(yōu)的超參數(shù)設(shè)置,迭代次數(shù)為200,訓(xùn)練次數(shù)為8,初始學(xué)習(xí)率為0.005,最小學(xué)習(xí)率為0.000 01,縮減因子為0.9。在訓(xùn)練過程中通過監(jiān)測(cè)損失函數(shù)的值,在連續(xù)5次迭代之后性能依舊沒有改善,即損失函數(shù)沒有降低,則將學(xué)習(xí)率變?yōu)樵瓉淼?.9。
2.2.2 損失函數(shù) 訓(xùn)練過程中損失值是計(jì)算當(dāng)前批次所有樣本的平均損失,它可以在反向傳播時(shí)對(duì)平均損失計(jì)算出的梯度進(jìn)行權(quán)重更新。然而,如果訓(xùn)練數(shù)據(jù)集出現(xiàn)正負(fù)樣本數(shù)量比例不平衡情況,計(jì)算出的平均損失中負(fù)樣本所占比例過大,訓(xùn)練出來的模型會(huì)傾向于只預(yù)測(cè)負(fù)樣本,并且負(fù)樣本的預(yù)測(cè)概率非常高,回傳的梯度也很大,且遙感影像中林地明顯存在樣本不平衡的問題,這樣會(huì)導(dǎo)致模型檢測(cè)性能降低。因此,本研究在二進(jìn)制交叉熵?fù)p失函數(shù)的基礎(chǔ)上引入了類別平衡因子w,如式(1)所示,該損失函數(shù)可以通過減少樣本中負(fù)樣本類別損失函數(shù)權(quán)重,增加樣本中正樣本的類別損失函數(shù)的權(quán)重,以加強(qiáng)模型對(duì)正樣本的關(guān)注度,減小對(duì)負(fù)樣本的關(guān)注度。
(1)
式中:L為平均損失函數(shù)值;yi={0,1},表示像素類別的真實(shí)值;pi∈(0,1),表示像素類別的預(yù)測(cè)概率值,w為平衡因子,設(shè)置為0.6,N代表輸入像素總數(shù)。
為定量評(píng)價(jià)本研究方法并將其與現(xiàn)有網(wǎng)絡(luò)模型進(jìn)行對(duì)比,選用常用的5種評(píng)價(jià)標(biāo)準(zhǔn),包括IOU (Intersection Over Union)(式2)、準(zhǔn)確率 (Accuracy)(式3)、F1評(píng)分(式4)、精確率 (Precision,P)及召回率(Recall,R)(式5)。其中IOU可以兼顧到誤檢和漏檢,已經(jīng)成為了語(yǔ)義分割的標(biāo)準(zhǔn),F(xiàn)1評(píng)分是基于精確率P與召回率R的指標(biāo),能夠計(jì)算模型對(duì)于召回率與精確率的平衡程度,也作為本研究的重要評(píng)價(jià)標(biāo)準(zhǔn)。此外,Accuracy作為全局精度評(píng)價(jià)方法也將其加入其中。為準(zhǔn)確分析提取結(jié)果,通過不同顏色比較提取的林地像素與真實(shí)地面的分類結(jié)果(表1)。
(2)
(3)
(4)
(5)
表1 像素分類結(jié)果說明
2.4.1 定性分析 為了全面呈現(xiàn)本研究方法在不同類型區(qū)域的林地檢測(cè)結(jié)果,本研究從場(chǎng)景密度、林地面積等不同要素影響下的結(jié)果進(jìn)行可視化展示,結(jié)果見圖5,場(chǎng)景類型從上至下趨向復(fù)雜,地物密集程度也不斷增加,林地結(jié)構(gòu)則包括小面積的稀疏林地,也包括大面積的密集林地。
由圖5-a、圖5-b可知,對(duì)于小面積環(huán)境較為復(fù)雜的林地區(qū)域,本研究方法基本可以準(zhǔn)確地檢測(cè)出林地的范圍,且存在較少數(shù)量的誤檢(藍(lán)色)和漏檢(紅色)區(qū)域,而PSP-Net及UNet與本方法的差距主要體現(xiàn)在誤檢方面,且檢測(cè)得到的林地結(jié)果完整性較低,而SegNet和FCN-8s與本方法在可視化效果上差異較為明顯,不僅漏檢較為嚴(yán)重,且存在大面積的誤檢情況。隨著林地面積的不斷增加,各種方法對(duì)于林地的提取結(jié)果也皆有所提高,這是由于林地面積變大之后,其特征更加明顯也更容易被提取,由圖5-c、圖5-d可知,對(duì)于大面積的林地每種方法皆取得了更好的效果,但從可視化結(jié)果中也可以看出,相對(duì)于PSP-Net及UNet,盡管效果差距不大,但本研究方法對(duì)于邊界細(xì)節(jié)方面具有更好的效果,尤其對(duì)于大面積林地內(nèi)部的完整性表達(dá)方面具有較好的效果,而PSP-Net及UNet則存在大量的空洞,此外對(duì)于其中摻雜的部分小面積林地也可以有效提取,如圖5-d的左上角區(qū)域,而SegNet和FCN-8s與本研究方法在大面積林地區(qū)域的可視化效果上差異較為明顯,不僅存在大量的誤檢(圖5-c)且存在大面積漏檢(圖5-d)。通過初步的定性可視化展示,可知本研究方法在對(duì)比的多種方法中可以獲得更好的效果。
2.4.2 定量分析 為了使比較結(jié)果更加可靠,本研究對(duì)各種結(jié)果進(jìn)行了定量分析, 在相同數(shù)據(jù)及電腦性能的條件下林地提取結(jié)果與其他深度學(xué)習(xí)方法的定量評(píng)估結(jié)果見表2。通過比較該值可得出結(jié)論:本研究方法在提取遙感影像中的林地方面具有最佳的性能,與其他算法相比,IOU值提高了2.49~15.32百分點(diǎn),F(xiàn)1評(píng)分提高了4.28~11.83,與此同時(shí),整體精度、正確性、召回率也明顯高于其他網(wǎng)絡(luò),此外,由于Precision和Recall存在著相互制約的關(guān)系,如何平衡二者以獲得更好的提取結(jié)果也是評(píng)判模型好壞的重要因素,從表3可以看出,本研究方法中P值和R值差異為2.80百分點(diǎn),而其他方法差異為4.01~12.61百分點(diǎn),這也進(jìn)一步證明本研究方法對(duì)于二者的平衡具有更好的效果。
表2 不同方法的林地提取結(jié)果精度對(duì)比
為有效提取遙感影像中林地信息,CNN作為一種流行的深度學(xué)習(xí)算法仍在不斷探索之中,本研究所提出網(wǎng)絡(luò)結(jié)構(gòu)中的殘差網(wǎng)絡(luò)、編碼與解碼過程中的上下文信息融合以及最終的深度多尺度聚合在林地提取過程中有著重要的作用。因此,為了進(jìn)一步證明每個(gè)模塊在模型中的作用,在相同數(shù)據(jù)下進(jìn)行了消融試驗(yàn),將本研究中的卷積主干作為基線和先后添加了不同的關(guān)鍵組件進(jìn)行對(duì)比,以檢查每個(gè)組件的貢獻(xiàn),表3分別從5個(gè)指標(biāo)評(píng)價(jià)了各種消融試驗(yàn),其中Accuracy提高了4.26~6.81百分點(diǎn),F(xiàn)1評(píng)分提高了1.88~3.43,IOU提高了1.49~5.12百分點(diǎn),可以清楚地看出,本研究方法中的每個(gè)模塊對(duì)于最終的結(jié)果都是有益的。
2.5.1 殘差網(wǎng)絡(luò) 神經(jīng)網(wǎng)絡(luò)對(duì)于影像深度特征的提取程度決定了最終提取結(jié)果的優(yōu)劣。因此,首先分析了殘差網(wǎng)絡(luò)優(yōu)點(diǎn),為此,訓(xùn)練了一個(gè)不含有殘差的神經(jīng)網(wǎng)絡(luò)模型,直接通過普通卷積作為特征提取的基線結(jié)果,另一個(gè)則是包含有殘差的網(wǎng)絡(luò)結(jié)構(gòu)模型,由表3可知,通過聚類特征約束,Accuracy、F1及IOU分別獲得了6.81百分點(diǎn)、3.43、5.12百分點(diǎn)的明顯提升,通過這種控制變量的方法,說明本研究所利用的殘差網(wǎng)絡(luò)可以有效提取影像的深度特征。
2.5.2 顧及上下文信息的特征融合 在特征融合階段,傳統(tǒng)融合方法缺乏對(duì)于目標(biāo)區(qū)域的關(guān)注,對(duì)于深層次特征表達(dá)程度不高,而本研究通過考慮上下文信息,進(jìn)一步提高了編碼與解碼過程中的信息融合度,提高了網(wǎng)絡(luò)的非線性表達(dá)能力。在該部分中,利用普通的聚合結(jié)構(gòu)對(duì)本研究所提出的方法進(jìn)行替換,從表3可以看出,通過顧及上下文信息的特征聚合,Accuracy、F1及IOU分別獲得了4.26百分點(diǎn)、3.05、1.49百分點(diǎn)的精度提高,顧及上下文信息的特征融合將有助于網(wǎng)絡(luò)特征表達(dá)性能的進(jìn)一步提升。
2.5.3 深度多尺度聚合 如何有效融合多尺度特征一直是遙感影像地物信息提取所需要解決的問題,為避免多層加權(quán)輸出所導(dǎo)致的特征損失,本研究網(wǎng)絡(luò)通過物理聚合的方式保存不同尺度下的所有特征,此外,與一般的3層多尺度輸出不同,著重考慮了影像中林地更多的尺度表達(dá),建立了具有四層的尺度輸出結(jié)果,這種增益效果也是明顯的,如表3所示,Accuracy、F1及IOU分別獲得了5.45百分點(diǎn)、1.88、2.87百分點(diǎn)的精度提升。這也證明該部分的加入是完全必要的。
表3 本方法中不同模塊的消融試驗(yàn)結(jié)果
為了進(jìn)一步證明該方法的抗干擾能力,分析了遙感圖像中的各種干擾。圖6-a紅色框?yàn)楦?,其光譜特征與視覺上的林地相似,圖6-b、圖6-c中紅色框則包含有暗色水體,其光譜相似性表達(dá)與林地具有相似性,此類干擾是林地提取過程中一個(gè)極具挑戰(zhàn)性的問題,然而,該方法可以有效地避免這些特征的干擾。此外,圖6-d中的紅色框中林地內(nèi)部包含有部分裸地,林地內(nèi)部特征表達(dá)復(fù)雜,但本研究方法依舊可以較為完整地提取出完整的林地范圍。此外,圖6中不同區(qū)域的林地光譜特征表達(dá)具有明顯的差異性,這也進(jìn)一步驗(yàn)證了本研究方法對(duì)于林地提取具有較好的抗干擾能力。
近年來隨著深度學(xué)習(xí)的發(fā)展,CNN作為一種有效的方法被用于遙感影像中的地物信息提取。本研究提出了一種顧及多尺度上下文信息的高分影像林地信息提取方法。首先,從遙感影像深層次特征提取入手,利用殘差網(wǎng)絡(luò)提取影像的深層次特征;其次,通過建立顧及上下文信息的特征融合算法進(jìn)一步將編碼與解碼過程中的特征進(jìn)行充分融合,以提高網(wǎng)絡(luò)對(duì)于上下文信息的提取能力,增強(qiáng)網(wǎng)絡(luò)對(duì)于目標(biāo)區(qū)域的關(guān)注度;接著,考慮到林地面積影響導(dǎo)致的更大的尺度差異,建立了深度多尺度聚合預(yù)測(cè)結(jié)構(gòu)。最后,對(duì)于神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中樣本不均衡的問題,在損失函數(shù)中引入了類別平衡因子,以獲取更好的林地檢測(cè)結(jié)果。為證明方法的有效性,建立了一個(gè)新的遙感影像林地提取數(shù)據(jù)集,在建立的數(shù)據(jù)集上進(jìn)行了4種優(yōu)秀的深度學(xué)習(xí)方法用于遙感影像中的林地檢測(cè),包括PSP-Net、UNet、SegNet、FCN-8s,通過定性分析和定量分析證明了本研究方法的優(yōu)越性。另外,最后的消融試驗(yàn)證明了本研究所提出的各個(gè)結(jié)構(gòu)的重要性,并對(duì)影像中林地提取常見的干擾進(jìn)行了分析。
隨著遙感技術(shù)的發(fā)展,高分辨率遙感影像的數(shù)據(jù)量將不斷增大,數(shù)據(jù)獲取也會(huì)更加容易,且應(yīng)用會(huì)更加廣泛,今后的研究將繼續(xù)深入研究利用深度學(xué)習(xí)進(jìn)行林地信息提取,以期進(jìn)一步提高方法的精度。