田茂強羅蓉
(1.自然資源部重慶典型礦區(qū)生態(tài)修復野外科學觀測研究站(重慶地質(zhì)礦產(chǎn)研究院),重慶 401120;2.重慶華地資環(huán)科技有限公司,重慶 401120)
耕地是糧食安全的基礎(chǔ),事關(guān)國家的民生福祉,然而,部分地區(qū)出現(xiàn)耕地“非農(nóng)化”“非糧化”傾向[1],耕地“非糧化”是指將耕地用于種植非糧食作物或者將耕地轉(zhuǎn)為林地、草地、園地等其它農(nóng)用地的行為,耕地“非農(nóng)化”是指耕地轉(zhuǎn)為其它非農(nóng)用地,這些問題如果任其發(fā)展,將影響國家糧食安全,因此,對耕地種糧情況進行動態(tài)監(jiān)測評價極為重要[2]。
遙感技術(shù)具有覆蓋面積廣、高效、實時等監(jiān)測優(yōu)點,可以為耕地保護提供高效實施信息[3]。目前,國內(nèi)開展的基于遙感影像的耕地變化檢測仍以人工目視判別為主,面對全國緊迫、繁重的耕地“非糧化”檢測任務,難以高效完成,開展自動檢測方法研究很有必要。深度學習有效推動遙感影像自動化、智能化解譯的發(fā)展,卷積神經(jīng)網(wǎng)絡(CNN)擁有強大的特征提取能力和模型泛化能力[4],在遙感影像土地分類上已經(jīng)取得了廣泛的應用[5]。FCN采用卷積層代替?zhèn)鹘y(tǒng)CNN中的全連接層[6],真正實現(xiàn)了遙感影像的像素分類。FCN采用下采樣操作增強特征信息,但是相應會降低定位精度。因此,很多學者在FCN的基礎(chǔ)上進行了改進,Unet[7]就是其中一種改進模型,使用跳躍連接融合淺層特征與深度特征,在遙感影像耕地監(jiān)測領(lǐng)域取得了不錯的成效[8,9]。如,師超等將Unet模型與全連接條件隨機場(CRF)結(jié)合[10],基于GF-2數(shù)據(jù)對長春市部分區(qū)域進行土地利用分類。趙子宇等[11]將自注意力機制引入Unet模型,提升農(nóng)作物分類性能。
以上基于深度學習在遙感影像變化檢測領(lǐng)域已經(jīng)取得了良好的效果,但是基于深度學習的檢測模型,常常需要人工標注大量訓練樣本,另外,語義分割模型中常常重復提取低級特征,忽略不同地類之間的全局依賴關(guān)系。因此,本文主要融合變更調(diào)查數(shù)據(jù)獲取訓練樣本減少人工標注成本,同時在Unet網(wǎng)絡模型的基礎(chǔ)上,通過增加注意力機制模型獲取全局與局部特征關(guān)系,提高地類完整識別能力,在后處理階段加入CRF精細化分類邊界。
數(shù)據(jù)源影像為重慶市巫山縣官渡鎮(zhèn)某地獲取的無人機航攝影像,如圖1所示,獲取時間為2023年7月,分辨率為0.2m,該精度能夠滿足實際生產(chǎn)的精度需求。該研究結(jié)合國土變更調(diào)查數(shù)據(jù)制作訓練樣本數(shù)據(jù)庫,先基于三調(diào)成果分類體系以及國土變更調(diào)查數(shù)據(jù)確定主要耕地流向,建立耕地非糧化、非農(nóng)化樣本分類體系。統(tǒng)計發(fā)現(xiàn),耕地轉(zhuǎn)為其它農(nóng)用地主要包含成林、灌叢化、園地、水體以及非農(nóng)化用地(主要包含建筑用地和道路)等類型,再以變更調(diào)查矢量圖斑作為基底圖斑,提取原有相應地類屬性字段并編碼,減少人工勾勒矢量成本,在此基礎(chǔ)上判定影像獲取時期圖斑地類現(xiàn)狀,基于分類樣本體系編碼增加一個地類現(xiàn)狀屬性字段,同時修正地類邊界,保證樣本精度,以現(xiàn)狀屬性作為分類樣本的屬性字段。融合變更調(diào)查數(shù)據(jù)獲取訓練樣本的方法充分應用已有圖斑矢量庫,減少人工大量勾勒矢量的成本,保證精度的前提下滿足深度學習大量樣本的需求,變更調(diào)查分類數(shù)據(jù)庫和三調(diào)體系同為一脈,更為符合實際生產(chǎn)需求。最后基于Arcgis Pro深度學習樣本制作工具生成訓練樣本,設(shè)置樣本大小為256×256,總共包含了696張影像,將樣本隨機進行旋轉(zhuǎn)平移以提高樣本數(shù)據(jù)量,將樣本數(shù)據(jù)隨機分為7.5∶2.5進行訓練和測試。
圖1 研究區(qū)無人機影像圖
Unet模型由編碼器與解碼器構(gòu)成,編碼器通過4次卷積-最大池化-下采樣等操作獲得4層特征圖,解碼器將經(jīng)過反卷積獲得的特征圖與編碼器生成的各層特征圖與通過跳接方式進行特征融合,通過跳接的U形網(wǎng)絡結(jié)構(gòu)以拼接的方式融合淺層特征與深層特征實現(xiàn)語義分割,兼具高性能與輕量化特點。本文基于該網(wǎng)絡,在編碼器和解碼器之間引入空間注意力機制和通道注意力機制[12],將耕地非糧化類別從空間上和通道間建立語義關(guān)系,增強對各個非糧化類別的信息提取,模型結(jié)構(gòu)如圖2所示。
圖2 模型結(jié)構(gòu)
Mc(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
(1)
MsF=σ(F7×7([AvgPool(F);MaxPool(F)]))
(2)
在后處理階段通過采用全連接隨機場(CRF)[13,14]對模型結(jié)果進行精細化分類,CRF解決了全局歸一化問題,考慮到像素之間的關(guān)聯(lián)性,可以較好地應用于像素級圖像分割,使地類分類邊界更為清晰明了。在CRF中,其能量函數(shù)可由一元勢函數(shù)和二元勢函數(shù)構(gòu)成,具體如下:
E(x|I)=∑iφμ(xi)+∑i,jφρ(xi,yi)
(3)
式中,φμ為一元勢能,表示單個像素點判別為所述類別的概率;φρ為成對勢能函數(shù),表現(xiàn)為像素之間的特征相關(guān)性,特征類似的像素劃分為同一類別,特征差異較大的像素歸為不同類別。
將模型得到的分類圖輸入到CRF中,以CRF處理后的結(jié)果作為最終分類成果圖,如圖2所示。
本文實驗環(huán)境為Windows 11操作系統(tǒng),實驗使用的GPU類型為RTX4060 8GB內(nèi)存,模型基于Python、TensorFlow中的Keras框架構(gòu)建,批處理大小設(shè)置為4,初始學習率為0.001,訓練次數(shù)為100輪,使用Adam優(yōu)化器來優(yōu)化模型,損失函數(shù)使用多分類交叉熵損失函數(shù),選取SegNet[15]、Fcn8s、Unet作為對比算法,選取了分類精度(Categorical accuracy)、召回率(Recall)作為非糧化檢測結(jié)果評價指標。模型訓練成果如表1所示。
表1 不同模型間精度評價
從表1可以看出,4種模型都能對各類地物進行高精度區(qū)分,均表現(xiàn)較好。本文模型對地類的分類精度達到93.1%,Recall為93%,3項指標均高于其它模型。尤其是相對于Fcn8s模型,準確度提高了6%,Recall提高了4%。相較于Unet模型,精度提高了1.3%,說明該模型可以提高特征提取能力,能夠很好地對Unet模型進行優(yōu)化,即使在分類樣本不均的情況下,也取得了較好的分類成效。
本模型分類目視效果整體效果較好,如圖3所示,除了Fcn8s,其它模型都能有效區(qū)分地類,F(xiàn)cn8s錯分現(xiàn)象相對較為明顯。相比于其它模型,本文模型通過雙重注意力機制考慮到全局特征,能有效區(qū)分地物類型,分類影像破碎化程度較少,同時結(jié)合CRF,使地類邊界更為清晰明了,形狀更為規(guī)整,如圖3(1)所示,提取的園地更為方正。本文模型能夠獲取豐富的影像邊界語義信息,提取也更為準確,如圖3(4)所示,只有本文模型捕捉到了影像邊界處地類信息。
圖3 分類成果圖
圖4顯示了本模型混淆矩陣。每個類別得到的精度都表現(xiàn)較好,尤其耕地、園地、林地、坑塘精度較高,影像拍攝時間為夏季,該鎮(zhèn)主要種植水稻和玉米,耕地植被覆蓋度較高,訓練樣本中這幾類地物特征較為明顯,容易識別。灌叢化和非農(nóng)用地相對來說較容易誤分為其它地物,本實驗中的非農(nóng)用地主要指建筑物以及道路,訓練樣本中鄉(xiāng)間道路(田坎)色彩紋理特征與周圍的耕地較為相似,易被分為耕地,同時部分道路長草、被樹木遮擋也容易被誤分為周圍的林地。灌叢化總體來說特征較為明顯,但稀疏的灌木叢易誤分為玉米地,林地和灌木叢混種也被誤分為林地??傮w而言,本文模型地類分類表現(xiàn)較為優(yōu)異,可以用于耕地“非糧化”“非農(nóng)化”監(jiān)測工作中。
圖4 本模型混淆矩陣
本文基于重慶市巫山縣官渡鎮(zhèn)某地獲取的無人機影像,參考2023年1月變更調(diào)查土地現(xiàn)狀數(shù)據(jù)來監(jiān)測該區(qū)域2023年7月耕地非糧化非農(nóng)化情況,成果如圖5所示??傮w而言,該區(qū)域耕地非糧化非農(nóng)化程度較重,約1/3的耕地發(fā)生非糧化,耕地非糧化流向主要為園地,其次為灌木叢,即撂荒現(xiàn)象較為明顯。
本文基于無人機航攝影像,利用國土變更調(diào)查數(shù)據(jù)構(gòu)建訓練樣本,在保證樣本精度的前提下大量減少了人工標注樣本成本,同時將雙重注意力模塊引入Unet模型,提高模型的特征學習能力,減少細節(jié)丟失問題,后處理階段引入CRF,精準提取分類目標邊界,分類結(jié)果相比于Segnet、Fcn8s、Unet模型得到了較大的改進,分類成果在精度和目視效果上都表現(xiàn)良好。并在官渡鎮(zhèn)某地無人機數(shù)據(jù)集進行了實驗,本文提出的樣本構(gòu)建以及深度學習分類方法能夠滿足耕地“非糧化”“非農(nóng)化”提取的需求。