周玨,李蒙蒙,汪小欽,吳思穎,金時(shí)來(lái)
(1.福州大學(xué) 空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室,福州 350116;2.福建省水土保持試驗(yàn)站,福州 350003)
南方多山地區(qū)耕地資源相對(duì)不足,特別是在素有“八山一水一分田”的福建地區(qū)。耕作梯田的建造可有效擴(kuò)展農(nóng)耕面積,提高作物種植產(chǎn)量[1]。此外,耕作梯田也是控制水土流失的有效工程措施之一,且對(duì)生態(tài)系統(tǒng)具有良好的促進(jìn)作用[2]。因此,準(zhǔn)確地掌握耕作梯田的空間分布情況對(duì)農(nóng)業(yè)管理和水土保持部門開(kāi)展科學(xué)的決策支持具有重要意義[3-4]。
隨著遙感技術(shù)的發(fā)展,基于遙感影像分類的耕作梯田信息提取備受關(guān)注。近年來(lái),高空間分辨率衛(wèi)星技術(shù)的快速發(fā)展,眾多在軌的高分辨衛(wèi)星,如WorldView、GeoEye、Pleiades等,為耕作梯田的精細(xì)提取提供了海量高分辨率遙感數(shù)據(jù)[5]。南方地區(qū)耕作梯田分布較為破碎和分散,作物種植種類較多、種植結(jié)構(gòu)復(fù)雜,不同作物生長(zhǎng)物候信息差異較大,使得高精度的耕作梯田精細(xì)識(shí)別較為困難[6]。高分辨率遙感影像具有豐富的空間細(xì)節(jié)信息,但光譜波段較少。常規(guī)的高分辨率影像耕作梯田提取多采用面向?qū)ο蠓治龇椒?,通過(guò)提取影像對(duì)象的光譜、紋理、形狀等特征進(jìn)行圖像分類[7-8]。
近年來(lái),基于深度學(xué)習(xí)的遙感圖像分析方法在各種遙感信息提取任務(wù)中獲得了成功應(yīng)用[9-11]。其中以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)模型,由于強(qiáng)大的深層圖像自動(dòng)提取能力,被廣泛應(yīng)用在高分辨率遙感圖像分類任務(wù)中。針對(duì)耕作梯田信息提取,楊亞男等[12]利用無(wú)人機(jī)遙感影像,構(gòu)建深度學(xué)習(xí)模型,使用語(yǔ)義分割的方法在像素級(jí)上提取了黃土高原丘陵區(qū)典型的梯田。Do等[13]利用RapidEye作為數(shù)據(jù)源,利用深層神經(jīng)網(wǎng)絡(luò)模型提取梯田,基于像素和面向?qū)ο筇崛〉目傮w精度均高于85%。
通常,基于卷積神經(jīng)網(wǎng)絡(luò)的影像分類對(duì)目標(biāo)類別的邊界描繪不足,存在邊界鋸齒狀明顯的問(wèn)題。結(jié)合面向?qū)ο蠓治鏊枷?,目前有學(xué)者以圖像對(duì)象為基本分析單元,利用卷積神經(jīng)網(wǎng)絡(luò)提取圖像對(duì)象的深層圖像特征進(jìn)行圖像分類[14-15]。例如Huang等[16]構(gòu)建了一個(gè)面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò)用于高分辨率影像城市土地利用分類,Tang等[17]研究利用面向?qū)ο笊窠?jīng)網(wǎng)絡(luò)進(jìn)行高分辨率影像茶園提取。但目前基于深度學(xué)習(xí)的高分辨率遙感影像梯田空間分布精細(xì)提取研究相對(duì)較少,特別是針對(duì)中國(guó)南方多山的地形區(qū)域。本研究基于國(guó)產(chǎn)高分辨率遙感數(shù)據(jù),通過(guò)構(gòu)建一個(gè)面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò),開(kāi)展福建地區(qū)耕作梯田精細(xì)提取,針對(duì)高分辨率影像耕作梯田訓(xùn)練樣本難獲取的問(wèn)題,利用遷移學(xué)習(xí)對(duì)面向?qū)ο缶矸e神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)優(yōu)化,提高耕作梯田提取精度。
研究區(qū)位于福建省南平市浦城縣和武夷山市交界處(117°12′E~119°12′E,26°14′N~28°02N)。該區(qū)域處于福建省北部,西接江西省,北鄰浙江省,山脈大致呈東北—西南走向,中部與南部以低山丘陵為主,地形以山地丘陵為主,梯田分布廣泛[18]。該區(qū)域具有亞熱帶季風(fēng)氣候,降雨充沛,獨(dú)特的氣候環(huán)境和地形特征造就了該地梯田生態(tài)和梯田農(nóng)業(yè)的發(fā)展,其中具有“萬(wàn)畝梯田”美譽(yù)之稱的楓溪梯田也位于研究區(qū)內(nèi)。
本研究選擇一景2018年4月19日獲取的高分二號(hào)(GF-2)遙感影像和一景2019年11月24日獲取的資源三號(hào)(ZY-3)遙感影像。GF-2衛(wèi)星是我國(guó)自主研制的首顆空間分辨率優(yōu)于1 m的民用光學(xué)遙感衛(wèi)星,搭載有兩臺(tái)高分辨率1 m全色、4 m多光譜相機(jī),具有亞米級(jí)空間分辨率、高定位精度和快速姿態(tài)機(jī)動(dòng)能力的特點(diǎn)[19]。ZY-3衛(wèi)星搭載了3臺(tái)全色和1臺(tái)多光譜相機(jī),其空間分辨率為2.1 m,其光譜分辨率為5.8 m,重訪周期為5 d。利用ENVI軟件對(duì)獲取的GF-2和ZY-3影像進(jìn)行數(shù)據(jù)預(yù)處理,主要操作包括正射校正和Gram-Schmidt影像融合。
本研究結(jié)合面向?qū)ο蠓治龊途矸e神經(jīng)網(wǎng)絡(luò),構(gòu)建一種面向?qū)ο缶矸e神經(jīng)網(wǎng)絡(luò)(object-based convolutional neural networks,OCNN)進(jìn)行高分辨率遙感影像梯田提取,技術(shù)路線如圖1所示。首先,對(duì)高分辨率遙感影像(GF-2和ZY-3影像)進(jìn)行圖像分割獲得圖像對(duì)象;然后,利用OCNN提取影像對(duì)象的深層圖像特征;最后,基于對(duì)象的深層圖像特征,利用機(jī)器學(xué)習(xí)分類器進(jìn)行梯田分類以及精度評(píng)價(jià)。
圖1 技術(shù)路線圖
1)圖像分割。本文利用多分辨率分割算法進(jìn)行影像分割,考慮到耕作梯田有明顯覆蓋物,邊緣模糊不規(guī)則,為了保證較好的對(duì)象內(nèi)部同質(zhì)性和對(duì)象間異質(zhì)性,形狀因子和緊致度因子均設(shè)為0.5。為了獲得耕作梯田的最優(yōu)分割尺度,采用試錯(cuò)法,對(duì)比分割尺度為100、130和150的分割效果,通過(guò)目視解譯確定最優(yōu)分割尺度。
2)深層特征提取。深層次特征主要是提取適用于目標(biāo)域的高層次語(yǔ)義特征,越高層特征包含的高層語(yǔ)義性越強(qiáng)、分辨能力也越強(qiáng),抽取的特征也越來(lái)越全局,也越來(lái)越針對(duì)目標(biāo)域所訓(xùn)練的數(shù)據(jù)集[20]。針對(duì)高分辨率遙感影像訓(xùn)練樣本難獲取的問(wèn)題,可以將經(jīng)過(guò)自然圖像數(shù)據(jù)集訓(xùn)練的卷積模型應(yīng)用于遙感圖像領(lǐng)域進(jìn)行特征提取。本文采用基于卷積神經(jīng)網(wǎng)絡(luò)的模型遷移,將在ImageNet數(shù)據(jù)集上訓(xùn)練至收斂的ResNet50為基礎(chǔ)網(wǎng)絡(luò)進(jìn)行微調(diào),提取分割對(duì)象的深層次特征,具體步驟如下。
步驟1:樣本收集與數(shù)據(jù)增強(qiáng)。通過(guò)目視解譯的方式選取不同類型的樣本對(duì)象,包括耕作梯田樣本301個(gè),非耕作梯田樣本267個(gè),用仿射變換和顏色變換兩種方式對(duì)樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),共擴(kuò)充了11倍,樣本集從原本的568個(gè)擴(kuò)充到6 248個(gè)。
步驟2:基于在ImageNet數(shù)據(jù)集上訓(xùn)練收斂的ResNet50模型,移去作為分類使用的最后一次全連接層,對(duì)ResNet50模型進(jìn)行凍結(jié)和微調(diào)。
步驟3:將裁剪過(guò)后的影像對(duì)象作為模型的輸入,得到各個(gè)對(duì)象的2 048維的深度卷積特征。
3)梯田提取。由于特征維數(shù)大、訓(xùn)練參數(shù)多,在研究區(qū)小樣本的情況下,直接使用用于地物分類的Softmax分類器會(huì)導(dǎo)致模型過(guò)擬合嚴(yán)重,無(wú)法較好地實(shí)現(xiàn)地物分類[21]。機(jī)器學(xué)習(xí)算法具有快速處理高維且大量的數(shù)據(jù),對(duì)過(guò)擬合問(wèn)題不敏感和分類精度高等優(yōu)點(diǎn),被廣泛應(yīng)用于遙感領(lǐng)域?;诟呔S深層圖像特征,本文利用機(jī)器學(xué)習(xí)分類算法進(jìn)行耕作梯田提取,設(shè)置了三組對(duì)比實(shí)驗(yàn)。
(1)對(duì)比OCNN與傳統(tǒng)面向?qū)ο蠓诸惙椒??;趫D像分割結(jié)果,選取40個(gè)常用的光譜、形狀、紋理等低層級(jí)圖像對(duì)象特征(表1),利用隨機(jī)森林進(jìn)行圖像分類。
表1 低層級(jí)圖像特征
(2)基于深層圖像特征,對(duì)比隨機(jī)森林、XG Boost、Ada Boost三種不同機(jī)器學(xué)習(xí)分類器的耕作梯田分類效果。
(3)對(duì)比不同分辨率數(shù)據(jù)源(GF-2和ZY-3影像)對(duì)OCNN梯田提取結(jié)果的影響。
4)精度評(píng)價(jià)。首先基于混淆矩陣,通過(guò)計(jì)算總體精度、誤提率、漏提率以及Kappa系數(shù)等指標(biāo)對(duì)耕作梯田的提取結(jié)果進(jìn)行精度驗(yàn)證。除此之外,為了對(duì)所提取耕作梯田的形狀與屬性的準(zhǔn)確性進(jìn)行評(píng)價(jià),利用Li等[22]提出的基于面向?qū)ο蟮募訖?quán)誤差指數(shù)的精度評(píng)價(jià)方法對(duì)耕作梯田識(shí)別結(jié)果進(jìn)行精度評(píng)價(jià)。其中,GUC為總體欠提取誤差指數(shù),GOC為總體過(guò)提取誤差指數(shù),GTC為全局誤差指數(shù)。
利用eCognition軟件對(duì)預(yù)處理后的遙感影像進(jìn)行分割,不同分割尺度的結(jié)果如圖2所示。圖2表示不同分割尺度下的分割結(jié)果,分割尺度為100時(shí),圖2(a)影像出現(xiàn)明顯過(guò)分割現(xiàn)象,梯田地塊過(guò)于破碎,分割尺度為150時(shí),圖2(c)中影像出現(xiàn)了欠分割現(xiàn)象,單個(gè)分割對(duì)象包含小塊耕作梯田與林地兩種地物類型,容易出現(xiàn)誤分或者漏提的現(xiàn)象。不管過(guò)分割還是欠分割現(xiàn)象的出現(xiàn),都會(huì)對(duì)耕作梯田提取效果產(chǎn)生一定的影響。通過(guò)對(duì)比不同分割尺度下耕作梯田與其他地物的分離情況,確定以130作為耕作梯田提取的最佳分割尺度。在該尺度下,耕作梯田可以有效地與其他地物分離,各地物邊界清晰,同時(shí)又能較好地保持梯田地塊邊界完整,有助于梯田特征的提取。
圖2 不同分割尺度對(duì)比圖
1)深層次特征與低層次特征對(duì)耕作梯田提取結(jié)果的對(duì)比。通過(guò)對(duì)比提取效果差異較大的典型區(qū)域(圖3),利用深層次特征提取結(jié)果能有效減少背景地物(如居住用地、道路、果園等)的干擾,可以較好地還原耕作梯田的邊界范圍和結(jié)構(gòu)特征,而低層特征提取結(jié)果在該地區(qū)出現(xiàn)了大量的誤提,道路、建筑物和部分林地被誤提為耕作梯田。圖3(a)與圖3(b)內(nèi)地物較為復(fù)雜,包含建筑、林地、平地農(nóng)田以及耕作梯田等,低層次特征的提取結(jié)果將大片平地農(nóng)田誤提為耕作梯田,也會(huì)誤提部分與農(nóng)田相連的建筑。圖3(c)包含大量典型耕作梯田,從圖中
圖3 低層次特征與深層次特征提取結(jié)果對(duì)比圖
可以看出,利用深層次特征的提取結(jié)果可以較好還原耕作梯田的邊緣形狀,低層次特征提取效果較差,出現(xiàn)大面積耕作梯田漏提現(xiàn)象。利用深層次特征識(shí)別的總體精度為87.1%,利用低層次特征識(shí)別的耕作梯田精度為76.9%,與深層次特征相比,降低10.2%。由此可見(jiàn),傳統(tǒng)的遙感影像分類方法的特征提取能力有限,無(wú)法充分利用高分辨率遙感影像中豐富的信息。深度卷積特征相比于傳統(tǒng)低層次特征,能夠在小樣本的情況下,避免出現(xiàn)過(guò)擬合,可以達(dá)到較高精度。
2)不同分類器對(duì)耕作梯田提取結(jié)果的對(duì)比。通過(guò)對(duì)比提取效果差異較大的典型區(qū)域可知(圖4),不同分類器結(jié)合提取的耕作梯田結(jié)果相似,都能較好地將梯田提取出來(lái)。但從圖4(a)可知,XG Boost和Ada Boost分類器會(huì)出現(xiàn)小部分耕作梯田漏提現(xiàn)象。從圖4(b)可知,由于茶園梯田與耕作梯田光譜、紋理和輪廓相似,這三種分類器都存在小部分將茶園梯田誤提成耕作梯田的現(xiàn)象。不同機(jī)器學(xué)習(xí)分類器精度相差不超過(guò)2%,說(shuō)明這三類分類器不是影響耕作梯田提取的關(guān)鍵因素。
圖4 不同分類器提取結(jié)果對(duì)比圖
3)不同分辨率數(shù)據(jù)源對(duì)耕作梯田提取結(jié)果的對(duì)比。本文利用同區(qū)域的ZY-3遙感影像數(shù)據(jù)(2.1 m),使用此方法進(jìn)行提取,并與GF-2梯田提取結(jié)果進(jìn)行對(duì)比。ZY-3影像根據(jù)目視解譯發(fā)現(xiàn)梯田雖仍能識(shí)別,但是與GF-2影像對(duì)比,耕作梯田的紋理特征不明顯,形狀指數(shù)不突出。通過(guò)對(duì)比提取效果差異較大的典型區(qū)域可知(圖5),利用ZY-3數(shù)據(jù)可以提取大部分耕作梯田,但是會(huì)誤提小部分與梯田相連的平地農(nóng)田。GF-2影像作為數(shù)據(jù)源提取結(jié)果較ZY-3(2.1 m)精度提高4.6%,Kappa系數(shù)提高5.2%。GF-2影像分辨率高,在圖像識(shí)別上有巨大優(yōu)勢(shì),如果研究區(qū)范圍小、數(shù)據(jù)精度要求高的情況,可以選擇GF-2數(shù)據(jù)進(jìn)行耕作梯田識(shí)別;針對(duì)范圍較大,數(shù)據(jù)精度要求低的研究,可以使用ZY-3數(shù)據(jù)進(jìn)行識(shí)別,精度也能達(dá)到82.5%,再結(jié)合人工目視解譯進(jìn)行修正,也基本滿足一般研究需求。
圖5 不同分辨率數(shù)據(jù)源提取結(jié)果對(duì)比圖
通過(guò)目視解譯和實(shí)地考察選取實(shí)際梯田的驗(yàn)證樣本點(diǎn)作為評(píng)價(jià)樣本。精度驗(yàn)證主要考慮兩個(gè)方面:一方面是利用耕作梯田點(diǎn)位驗(yàn)證提取結(jié)果中正確提取的點(diǎn)位個(gè)數(shù);另一方面是提取結(jié)果中對(duì)非耕作梯田地物的誤提情況。由以上三組對(duì)比實(shí)驗(yàn)可知,基于GF-2數(shù)據(jù)利用面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò)的方法提取深層次特征,再結(jié)合隨機(jī)森林分類器的精度最高,總體精度為87.1%,Kappa系數(shù)為0.76,虛提率為11.9%,漏提率為14.2%。通過(guò)將遙感影像圖、提取結(jié)果和實(shí)地考察照片對(duì)比可知(圖6),此方法能提取出大部分耕作梯田,同時(shí)居住用地、道路、果園等被有效剔除,提取結(jié)果并沒(méi)有受到“異物同譜”和“同物異譜”現(xiàn)象的影響,沒(méi)有明顯的錯(cuò)分和漏分。對(duì)于光譜信息比較相近的地物,如果園、茶園、林地等也能進(jìn)行區(qū)分,有較高的識(shí)別精度,且可以有效地克服模型過(guò)擬合嚴(yán)重的問(wèn)題。
圖6 梯田提取結(jié)果
為了評(píng)估面向?qū)ο蠓指畹木?,本文選取研究區(qū)內(nèi)耕作梯田面積占比較大的小塊區(qū)域用于精度驗(yàn)證,通過(guò)計(jì)算加權(quán)的過(guò)提取和欠提取誤差指數(shù)可以得到基于面向?qū)ο蟮木仍u(píng)價(jià)的欠提取誤差指數(shù)GUC為0.195、過(guò)提取誤差指數(shù)GOC為0.306、全局誤差指數(shù)GTC為0.265。從面向?qū)ο蟮木仍u(píng)價(jià)指數(shù)結(jié)果可以看出,全局誤差指數(shù)較低,雖然耕作梯田形狀不規(guī)則,但整體誤差小于0.3,說(shuō)明此方法可以有效地提取耕作梯田,可以提取大部分的梯田的形狀,邊緣還原較好。
本文基于高分辨率遙感影像利用面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò)提取耕作梯田,并研究對(duì)比低層次特征與深層次特征、不同分類器以及不同分辨率數(shù)據(jù)源對(duì)提取效果的影響,主要結(jié)論如下。
1)基于GF-2遙感影像,構(gòu)建了一個(gè)面向?qū)ο蟮木矸e神經(jīng)網(wǎng)絡(luò)模型對(duì)耕作梯田進(jìn)行提取,總體精度達(dá)到87.1%,Kappa系數(shù)0.76,虛提率為11.9%,漏提率為14.2%,利用面向?qū)ο缶仍u(píng)價(jià)方法得到全局誤差指數(shù)GTC為0.265。所提出方法可以降低目標(biāo)域數(shù)據(jù)集的數(shù)量要求,省時(shí)省力,說(shuō)明該方法在高分辨率提取耕作梯田的分布信息以及形狀完整性方面具有廣闊的應(yīng)用前景。
2)與傳統(tǒng)的低層次視覺(jué)特征相比,深度卷積特征可以有效避免人為因素干擾且提高了提取的精度,且精度提高10.2%,說(shuō)明該方法具有較強(qiáng)的魯棒性,能應(yīng)用于大面積的耕作梯田提取任務(wù)。
3)不同的機(jī)器學(xué)習(xí)分類器對(duì)于耕作梯田提取效果差別不大,隨機(jī)森林算法的精度略高于XG Boost和Ada Boost,但精度相差未超過(guò)2%,說(shuō)明這三個(gè)分類器對(duì)于耕作梯田提取影響不大。
4)本文分別利用GF-2數(shù)據(jù)與ZY-3(2.1 m)數(shù)據(jù)提取耕作梯田并進(jìn)行比較,利用GF-2數(shù)據(jù)提取結(jié)果精度提高4.6%。越高分辨率遙感影像上耕作梯田的尺寸、形狀、結(jié)構(gòu)與鄰域關(guān)系都得到更好的反映,內(nèi)部組成要素豐富的細(xì)節(jié)信息可以更好地得到表征,利用此方法可以很好地挖掘高分辨率遙感影像的特征,分辨率越高,提取效果越好。GF-2影像分辨率高,在圖像識(shí)別上優(yōu)勢(shì)明顯。