關(guān)鍵詞:高分辨率遙感影像;深度學習;建筑物提?。籙Net網(wǎng)絡(luò)
中圖法分類號:P237 文獻標識碼:A
高分辨率遙感影像覆蓋范圍大、信息量大、更新速度快,對于地面信息的獲取十分重要。目前對高分辨率遙感影像建筑物的有效提取是城市遙感影像的主要研究方向,一方面,對建筑物的精確提取有利于城市變化監(jiān)測、三維建模、智慧城市建設(shè)等領(lǐng)域的深入應(yīng)用和擴展,以及在城市空間數(shù)據(jù)庫的建設(shè)方面都具有重要價值;另一方面,對高分辨率遙感影像建筑物的提取可以為其他圖像的語義分割和目標檢測方面提供借鑒,具有重要意義和價值。
利用遙感影像進行建筑物提取根據(jù)自動化程度分為人工提取、半自動化提取和自動化提取3個階段。文獻[5]針對高分辨率遙感影像自動化解譯技術(shù)難度大、適用性差等問題,提出人工目視解譯為遙感影像解譯的主要方法,但目視解譯需耗費大量時間和精力,且精度難以達到要求。此后引入半自動化提取方法,如SVM算法、K-means聚類算法等。如今,深度學習成為圖像識別、提取中效果最好的方法。本文以高分辨率遙感影像為數(shù)據(jù)源,提出基于UNet網(wǎng)絡(luò)模型進行建筑物提取,此模型延續(xù)了CNN卷積網(wǎng)絡(luò)的特征,能夠有效把握局部特征信息。采用公開建筑物數(shù)據(jù)集——馬薩諸塞州建筑物數(shù)據(jù)集進行實驗驗證本文方法的適用性。
1方法
1.1 UNet網(wǎng)絡(luò)
UNet網(wǎng)絡(luò)如圖1所示,UNet網(wǎng)絡(luò)結(jié)構(gòu)由編碼器和解碼器2部分組成。編碼器部分采用CNN卷積神經(jīng)網(wǎng)絡(luò),用于圖像的下采樣過程,采用5個池化層,在不斷的下采樣過程中不斷地降低分辨率,以獲得不同尺度的圖像信息,完成特征提取。解碼器部分對應(yīng)的是特征圖上采樣過程,進行目標對象的定位,上采樣過程先進行一次反卷積操作,使特征圖的維數(shù)變?yōu)樵瓉淼?/2,然后通過跳躍連接將下采樣過程中得到的特征圖進行拼接,重新組成新的特征圖,新特征圖是原來的2倍,最后再采用2個卷積層進行對特征圖進行特征提取。
CNN因為受感受野的影響,不能很好地利用全局信息,需要很多層后才能得到抽象的全局信息。因此,將UNet網(wǎng)絡(luò)應(yīng)用于背景復(fù)雜的高分辨率的遙感影像建筑物提取任務(wù)中,可以有效對全局信息和局部的細節(jié)信息進行提取。本文提出把UNet方法用于高分辨率的遙感影像建筑物提取。
2實驗數(shù)據(jù)
2.1數(shù)據(jù)介紹
本文選取的數(shù)據(jù)集為馬薩諸塞州建筑物數(shù)據(jù)集,地面分辨率降采樣為0.3 m,選取的馬薩諸塞州地區(qū)大約有2.2萬棟獨立建筑物。
2.2數(shù)據(jù)處理
對獲取的數(shù)據(jù)集進行數(shù)據(jù)擴充處理,以便提高樣本質(zhì)量,使訓(xùn)練出來的模型效果更好。把擴充后的數(shù)據(jù)集按精度高低篩選最優(yōu)的數(shù)據(jù)集,共4 000幅影像,并劃分為訓(xùn)練集(2800幅)、驗證集(600幅)和測試集(600幅)3個部分。
3實驗與算法評價
3.1硬件配置和參數(shù)設(shè)置
本文UNet模型的建筑物提取實驗基于Pytorch框架進行,硬件配置采用NVIDIA Geforce RTX2060,網(wǎng)絡(luò)優(yōu)化器采用Adam,學習率設(shè)為0.0001,每個網(wǎng)絡(luò)模型訓(xùn)練50次迭代,batch size值設(shè)為16。UNet模型的損失收斂函數(shù)與精度曲線變化如圖2所示??煽闯鲈谀P陀?xùn)練過程中,訓(xùn)練精度和測試精度隨著迭代次數(shù)的增加在逐步上升,約在第15次以后ACC趨于穩(wěn)定,維持在96. 85%左右;Loss值也在不斷下降,最終穩(wěn)定在0.016左右。
3.2評價指標
本文選擇總體精度(OA),F(xiàn)l-score,m,loU,Recall作為分割效果的評估標準。OA在文中為圖像中預(yù)測正確的建筑物和背景像元占所有像元的比例:Fl-score是精確率:mloU在文中計算的是真實建筑物標簽與模型提取的建筑物之間的交并比:Recall計算的是真實建筑物標簽與模型提取的建筑物之間的交并比。各評估標準公式為:
其中,TTP為輸入圖像中含有標簽信息的部分被正確識別為相對應(yīng)的標簽信息,本文指提取到實際建筑物的個數(shù);TTN為輸入圖像中含有背景信息的部分被正確識別為相對應(yīng)的背景信息;FFP為輸入圖像中含有背景信息的部分被錯誤識別為標簽信息;FFN為輸入圖像中含有標簽信息的部分被錯誤識別為背景信息。
4實驗結(jié)果與分析
4.1可視化結(jié)果分析
幾種提取方法在2種建筑物數(shù)據(jù)集上的邊緣提取效果對比如圖3所示。對于SVM算法,其在2種建筑物數(shù)據(jù)集上的提取表現(xiàn)均不理想,提取結(jié)果存在大量噪聲,細碎斑點較多,且對于一些復(fù)雜的地物劃分不明確等問題。FCN和CNN方法在2棟相連建筑物的邊緣部分提取上邊緣未分離,出現(xiàn)了連接,圖3的邊緣提取不夠清晰。而本文方法在圖3中較好地識別了連接部分,對相鄰2棟建筑物較好地完成了分離。圖3中傳統(tǒng)方法在建筑物提取上出現(xiàn)漏檢的問題,而本文方法在小型建筑物提取上表現(xiàn)更出色。
總體來說,UNet方法與傳統(tǒng)提取方法相比,在影像邊緣細節(jié)的分類效果上更優(yōu),對建筑物的邊緣把控得更好,輪廓更清晰。
4.2精度分析
以O(shè)OA,MmIoU,RRecall和FF1值作為評估標準對馬薩諸塞州數(shù)據(jù)集建筑物提取結(jié)果進行定量化分析,結(jié)果如表1所列。結(jié)果表明,SVM決策樹算法在高空間分辨率遙感影像建筑物的提取方面總體精度較低,提取效果不理想。與SVM決策樹算法相比,深度學習方法——FCN和CNN方法的各個指標值遠優(yōu)于SVM決策樹算法,但仍存在部分細微建筑物被忽略的問題。本文方法相較于SVM決策樹算法和FCN,CNN方法在各項指標上均有所提高,其表現(xiàn)在對建筑物邊緣及細小建筑物提取方面的改進,對細小建筑物的提取以及對邊緣細節(jié)處理更加完善。
5結(jié)束語
本文提出一種基于UNet網(wǎng)絡(luò)模型的高分辨率遙感影像建筑自動提取方法,使用數(shù)據(jù)集為馬薩諸塞州建筑物數(shù)據(jù)集,完成數(shù)據(jù)集的擴充和篩選、UNet模型訓(xùn)練、建筑物提取以及精度評估,通過實驗證明了本文方法可以有效地實現(xiàn)高分辨率遙感影像建筑物提取。
本文提出的UNet方法以及FCN和CNN三種分類算法對高分辨率遙感影像進行建筑物分類提取的結(jié)果中,總體準確率超過90%,相比之下本文方法提取的結(jié)果在邊緣細節(jié)的把控上效果更優(yōu),漏檢的小型建筑物也大幅減少。綜上所述,通過對以上4種分類算法所得到的結(jié)果進行定性和定量分析,基于UNet網(wǎng)絡(luò)對建筑物的提取效果更好、精度更高,具有一定的可行性和有效性。目前,基于UNet網(wǎng)絡(luò)建筑物提取方法有時在面對遙感影像建筑物提取時魯棒性不夠強,且模型訓(xùn)練時間較長,后續(xù)研究中將對該處理步驟進行進一步的研究和優(yōu)化。
作者簡介:
屠冉(1981—),碩士,研究方向:電子信息工程。