張世超,王常穎,李勁華,張志梅
(青島大學(xué) 數(shù)據(jù)科學(xué)與軟件工程學(xué)院,山東 青島 266071)
茶屬于山茶科多年生常綠木本植物。作為一種植物飲料,因其含有多種營養(yǎng)物質(zhì),深受大眾的喜愛與歡迎。改革開放40年來,我國茶產(chǎn)業(yè)發(fā)展取得了巨大的成就,產(chǎn)業(yè)規(guī)模、效益、質(zhì)量均顯著提高[1],因此,茶種植區(qū)的監(jiān)測工作對我國經(jīng)濟(jì)發(fā)展具有重要意義。
茶種植區(qū)廣泛分布于我國長江以南地區(qū),傳統(tǒng)的人工野外勘測方法需要耗費(fèi)大量的人力物力,時(shí)效性差,精度低,不能及時(shí)有效地獲取茶種植區(qū)空間分布信息。遙感技術(shù)具有準(zhǔn)確、及時(shí)地獲取信息的天然優(yōu)勢,故使用遙感監(jiān)測的方法實(shí)現(xiàn)對茶種植區(qū)的自動(dòng)提取是可行的。茶樹屬于灌木,大多數(shù)種植在山區(qū)、丘陵地區(qū),茶樹低矮且呈球形,以小規(guī)模種植為主,由于光譜特征與其他農(nóng)作物種植區(qū)的相似性,茶種植區(qū)的遙感識(shí)別工作具有一定的難度。目前,基于遙感影像的農(nóng)作物提取方法的研究多以常規(guī)作物為主,例如水稻、小麥、棉花、玉米等,對茶種植區(qū)的提取研究較少。鄧媛媛等[2]使用QuickBird遙感影像,采用面向?qū)ο蟮姆诸惣夹g(shù),進(jìn)行農(nóng)用地精細(xì)分類;任傳帥等[3]提出了一種利用單時(shí)相高分二號(hào)高分辨率衛(wèi)星影像和隨機(jī)森林算法的香蕉林信息提取方法;姬旭升等[4]利用高空間分辨率遙感影像對作物進(jìn)行識(shí)別,更加快速、準(zhǔn)確地獲取棗樹和棉花的種植面積及其分布區(qū)域;黃健熙等[5]利用GF-1 WFV數(shù)據(jù)實(shí)現(xiàn)了玉米與大豆的提??;徐偉燕等[6]使用資源三號(hào)影像數(shù)據(jù),結(jié)合光譜特征、NDVI時(shí)相差異以及方向強(qiáng)度紋理特征,實(shí)現(xiàn)了茶種植區(qū)的提?。获R超等[7]提出一種基于中尺度光譜和時(shí)序物候特征的茶園提取方法;Li等[8]引入了集成學(xué)習(xí)策略以在訓(xùn)練過程中改進(jìn)經(jīng)典的支持向量機(jī)和反向傳播神經(jīng)網(wǎng)絡(luò)分類器,有效提高了農(nóng)作物分類精度;Zhou等[9]提出了一種基于深度學(xué)習(xí)的時(shí)間序列分析方法,并應(yīng)用于高分辨率ZY-3圖像和Sentinel-1A SAR數(shù)據(jù)集,對湖南和貴州的農(nóng)作物類型進(jìn)行分類;Sun等[10]提出了一種基于層次感知的方法對VHR圖像中的作物進(jìn)行分類;周靜平等[11]采用面向?qū)ο蠛蜎Q策樹相結(jié)合的方法提取了作物分布信息。以上研究對農(nóng)作物的提取取得了一定的成效。
本研究選取貴州省銅仁市4塊矩形區(qū)域作為研究區(qū),采用的影像數(shù)據(jù)為高分辨率航拍影像。提出了一種基于面向?qū)ο笈c變差函數(shù)的茶種植區(qū)自動(dòng)提取方法。首先,利用eCognition 9.0軟件對原始影像進(jìn)行多尺度分割,采用面向?qū)ο蟮姆椒?gòu)建分類規(guī)則集,去除非植被區(qū)域,包括道路、建筑物、水體;然后,利用茶種植區(qū)與其他植被區(qū)域的變差函數(shù)紋理特征差異構(gòu)建決策樹分類模型,同時(shí)選擇最合適的紋理提取窗口,得到最終的茶種植區(qū)的提取結(jié)果。本研究期望對茶種植區(qū)遙感監(jiān)測提供借鑒,也為作物的種植管理提供幫助。
銅仁市位于貴州省東北部,武陵山區(qū)腹地,處于云貴高原向湘西丘陵過度的斜坡地帶,西北高,東南低。全境以山地為主,占全境總面積的67.8%。銅仁市鏡內(nèi)地形復(fù)雜,氣候立體分布特征明顯,大多數(shù)地域?qū)僦衼啛釒Ъ撅L(fēng)濕潤氣候區(qū)。春溫多變,綿雨較多;夏季炎熱,光照充足;秋季陰雨天較多;冬季低溫寡照,物長季長。年平均氣溫15 ℃到17 ℃。銅仁市境內(nèi)降水充沛,平均降雨量為1 100~1 300 mm,地表河流密度高,地下補(bǔ)給基流多。由于這些外部環(huán)境條件優(yōu)勢,非常適合茶等常綠植物種植,其中銅仁市石阡縣享有“最美茶鄉(xiāng)”的美譽(yù)。貴州的茶樹70%種植于海拔800~2 000 m的高原地區(qū),茶種植區(qū)附近有大量林地、梯田、農(nóng)田等其他植被區(qū),茶樹成排種植,非常適合采用遙感影像對茶種植區(qū)信息進(jìn)行提取。
實(shí)驗(yàn)數(shù)據(jù)為獲取于2014年6月6日的航拍遙感影像,總共包含3個(gè)波段,空間分辨率為0.5 m。本文首先選取了一景位于貴州省銅仁市、大小為25 292像元×19 192像元的影像數(shù)據(jù)作為面向?qū)ο蠓椒ǖ膶?shí)驗(yàn)數(shù)據(jù),經(jīng)緯度范圍為27°29′54″N~27°35′05″N,108°22′26″E~108°30′05″E。裁剪7景局部影像作為選擇提取窗口大小的實(shí)驗(yàn)數(shù)據(jù),之后,選取4塊位于貴州省銅仁市的矩形區(qū)域作為測試數(shù)據(jù),其大小分別為5 561像元×4 479像元、4 421像元×4 857像元、3 821像元×3 569像元、8 001像元×11 501像元。經(jīng)緯度范圍分別為:27°41′05″N~27°42′18″N,108°27′50″E~108°29′32″E;27°50′01″N~27°51′20″N,108°26′41″E~108°28′03″E;27°42′02″N~27°43′01″N,108°36′25″E~108°37′35″E;27°35′05″N~27°38′12″N,108°35′06″E~108°37′31″E。研究區(qū)總面積為37.98 km2。研究區(qū)內(nèi)地物種類多樣,適合做茶提取實(shí)驗(yàn)。
1)影像分割。傳統(tǒng)的基于像元的分類方法單純考慮遙感影像的光譜信息,未利用紋理、形狀等非光譜信息。由于高分辨率遙感影像中存在大量的同物異譜、同譜異物現(xiàn)象,分類精度往往不高,而面向?qū)ο蟮姆椒ㄓ行Ы鉀Q了這個(gè)問題。影像分割是面向?qū)ο蠓诸惙椒ǖ幕A(chǔ)[12-14]。目前最常用的影像分割方法是eCongition軟件中的多尺度分割,即分形網(wǎng)絡(luò)演化法。分形網(wǎng)絡(luò)演化法從像元層次開始,基于保證整體異質(zhì)性最小的原則,采用相鄰影像區(qū)域兩兩合并增長的方法形成更大影像對象,直到在規(guī)定的尺度上不能再進(jìn)行任何對象的合并為止。面向?qū)ο蠓诸惙椒ㄒ杂跋駥ο笞鳛樽钚》诸悊卧?,綜合利用光譜、紋理、形狀等信息,有效提高了分類精度。本研究采用eCongition 9.0中的多尺度分割方法,分割參數(shù)設(shè)置如下:分割尺度為175;3個(gè)波段權(quán)重都為1;形狀因子為0.4;緊湊度因子為0.5。
(1)亮度(brightness)。亮度是影像對象各波段光譜均值的加權(quán)平均值。本文所用遙感數(shù)據(jù)有3個(gè)波段,且設(shè)置各個(gè)波段權(quán)重都為1。
(2)形狀指數(shù)(shape index)。反映了影像對象邊界的平滑度。
(3)灰度共生矩陣標(biāo)準(zhǔn)差(GLCM StdDev)。反映了像元值與均值偏差的度量。
(4)灰度共生矩陣熵(GLCM Entropy)。反映了圖像信息量的度量。
3)分類規(guī)則構(gòu)建。本研究基于不同地物在6種特征上的差異性,實(shí)驗(yàn)了每個(gè)特征的閾值,通過構(gòu)建分類規(guī)則集來對非植被區(qū)進(jìn)行高精度提取。構(gòu)建的分類規(guī)則如表1所示。
表1 分類規(guī)則
4)非植被區(qū)提取結(jié)果。本文選取一景25 292像元×19 192像元大小的影像數(shù)據(jù)作為面向?qū)ο蠓椒ǖ膶?shí)驗(yàn)數(shù)據(jù),圖1展示了原始影像和去除非植被區(qū)后的掩膜結(jié)果。
圖1 原始影像和去除非植被區(qū)后的掩膜結(jié)果
1)變差函數(shù)。地統(tǒng)計(jì)學(xué)中的變差函數(shù)(variogram function,VF)是對區(qū)域化變量結(jié)構(gòu)分析的工具,同時(shí)也是描述對象非均質(zhì)性的手段。從地統(tǒng)計(jì)學(xué)的角度看,遙感影像的像元灰度值可以看作是滿足內(nèi)蘊(yùn)假設(shè)的區(qū)域化變量,它既具有隨機(jī)性,又具有空間相關(guān)性[15-16]。本文采用3個(gè)波段下的像元值計(jì)算影像的變差函數(shù)值。
2)變差函數(shù)紋理分析及決策樹模型構(gòu)建。本文選取了茶種植區(qū)與包括農(nóng)田區(qū)、梯田區(qū)及林地區(qū)在內(nèi)的其他植被區(qū)的7處感興趣區(qū)域,其中包括3處茶種植區(qū)、2處農(nóng)田區(qū)、1處梯田區(qū)及1處林地區(qū)。感興趣區(qū)域如圖2所示。由于滯后距離h具有方向性,本研究計(jì)算了0°、45°、90°和135° 4個(gè)方向上,滯后距離h從1到40之間不同地物的變差函數(shù)值。構(gòu)建的變差函數(shù)曲線如圖3所示,其中水平軸代表滯后距離,垂直軸代表變差函數(shù)值,即VF值。
圖2 感興趣區(qū)域
圖3 茶區(qū)和其他植被區(qū)的VF曲線
從滯后距離4個(gè)方向上茶區(qū)和其他植被區(qū)的VF曲線可以看出,對于茶區(qū)來說,由于茶樹成排種植方式的緣故,在某些滯后距離方向上,變差函數(shù)曲線為波浪狀的曲線;以第2景茶的感興趣區(qū)域?yàn)槔?,茶的種植方向?yàn)?0°方向,當(dāng)滯后距離方向同樣為90°方向時(shí),即當(dāng)茶的種植方向與滯后距離方向平行時(shí),其變差函數(shù)曲線是呈現(xiàn)一個(gè)逐漸上升的趨勢,變差函數(shù)曲線沒有呈現(xiàn)波浪狀,而在滯后距離為其他3個(gè)方向時(shí),變差函數(shù)曲線均呈現(xiàn)波浪狀。對于其他植被區(qū),在任何一個(gè)滯后距離方向上,變差函數(shù)曲線均呈現(xiàn)持續(xù)上升的趨勢,最后趨于一個(gè)較為穩(wěn)定的值。由此得出,至少存在一個(gè)滯后距離方向上,茶區(qū)在滯后距離h在[3,7]范圍內(nèi)變差函數(shù)值取得第一個(gè)極大值,在[8,13]范圍內(nèi)變差函數(shù)值取得第一個(gè)極小值,且從極大值到極小值有較大下降幅度,而其他植被區(qū)在任一滯后距離方向上,此滯后距離大小范圍內(nèi)不存在極大值和極小值。
本文定義了滯后距離在[3,7]范圍內(nèi)變差函數(shù)值取得的最大值A(chǔ),滯后距離在[8,13]范圍內(nèi)變差函數(shù)取得的最小值B,以及滯后距離在[3,7]范圍內(nèi)的取得的最大值A(chǔ)和滯后距離在[8,13]范圍內(nèi)的取得的最小值B之差與滯后距離在[3,7]范圍內(nèi)的取得的最大值A(chǔ)的比值descender 3個(gè)特征變量,表達(dá)如式(1)至式(3)所示。
A=max{γ(3),γ(4),γ(5),γ(6),γ(7)}
(1)
B=min{γ(8),γ(9),γ(10),γ(11),γ(12),γ(13)}
(2)
(3)
式中:γ(x)為當(dāng)滯后距離為x時(shí)的變差函數(shù)值。
以A和descender作為輸入特征,構(gòu)建了茶區(qū)與其他植被區(qū)的決策樹分類模型,如圖4所示。
圖4 決策樹分類模型
本文在采用面向?qū)ο蟮姆椒ㄌ蕹侵脖粎^(qū)的基礎(chǔ)上,利用決策樹中的分類規(guī)則區(qū)分茶區(qū)與其他植被區(qū)。采用滑窗法進(jìn)行茶區(qū)檢測,對于影像中的每一個(gè)像元,在包含這個(gè)像元的所有正方形窗口(邊長為k)中,如果其中超過一半的窗口被判斷為茶區(qū),則將該像元?dú)w為茶區(qū)。提取窗口大小k及窗口滑動(dòng)步長s的選擇直接影響到最終的提取精度。本文選取了7景含有茶的局部影像,采用40×40、50×50、60×60、70×70、80×80、90×90和100×100共7種尺寸窗口,每種尺寸窗口下采用10、15、20、25 4種窗口滑動(dòng)步長來對茶種植區(qū)進(jìn)行提取,并對每種情況下的提取精度進(jìn)行評價(jià)。原始影像、目視解譯圖及當(dāng)窗口滑動(dòng)步長為10,不同窗口大小下的茶提取結(jié)果如圖5至圖11所示。
為了衡量不同窗口大小與窗口滑動(dòng)距離下的提取精度,本文采用查準(zhǔn)率(precision)和查全率(recall)作為參考,F(xiàn)1度量作為主要評價(jià)依據(jù),其定義分別如式(4)至式(6)所示。
(4)
(5)
(6)
式中:TP為真正例,表示提取的茶區(qū)為真實(shí)茶區(qū)的像元數(shù)目;FP為假正例,表示提取的茶區(qū)為非茶區(qū)的像元數(shù)目;FN表示假反例,表示提取的非茶區(qū)為茶區(qū)的像元數(shù)目。
構(gòu)建了窗口滑動(dòng)距離為10、15、20、25下的3種評價(jià)指標(biāo)隨窗口大小的變化曲線圖,如圖12所示。分析4張曲線圖可以得出,在任意一種窗口滑動(dòng)距離下,均為當(dāng)窗口大小為60像元×60像元時(shí)F1度量達(dá)到最大值。同時(shí),當(dāng)窗口大小為60像元×60像元時(shí),窗口滑動(dòng)距離為10,F(xiàn)1度量是最高的,達(dá)到81.34%。這說明窗口滑動(dòng)距離選擇10,窗口大小選擇60像元×60像元提取效果是最佳的。
圖5 原始影像1、對應(yīng)的目視解譯結(jié)果及滑動(dòng)步長為10時(shí)不同窗口大小下的茶區(qū)提取結(jié)果
圖6 原始影像2、對應(yīng)的目視解譯結(jié)果及滑動(dòng)步長為10時(shí)不同窗口大小下的茶區(qū)提取結(jié)果
圖7 原始影像3、對應(yīng)的目視解譯結(jié)果及滑動(dòng)步長為10時(shí)不同窗口大小下的茶區(qū)提取結(jié)果
圖8 原始影像4、對應(yīng)的目視解譯結(jié)果及滑動(dòng)步長為10時(shí)不同窗口大小下的茶區(qū)提取結(jié)果
圖9 原始影像5、對應(yīng)的目視解譯結(jié)果及滑動(dòng)步長為10時(shí)不同窗口大小下的茶區(qū)提取結(jié)果
圖10 原始影像6、對應(yīng)的目視解譯結(jié)果及滑動(dòng)步長為10時(shí)不同窗口大小下的茶區(qū)提取結(jié)果
圖11 原始影像7、對應(yīng)的目視解譯結(jié)果及滑動(dòng)步長為10時(shí)不同窗口大小下的茶區(qū)提取結(jié)果
圖12 提取精度變化曲線
采用本文方法對研究區(qū)域進(jìn)行茶區(qū)提取實(shí)驗(yàn)。原始影像、目視解譯圖、采用本文方法茶區(qū)提取結(jié)果及局部提取結(jié)果如圖13至圖21所示。
圖13 研究區(qū)1結(jié)果
圖14 研究區(qū)2結(jié)果
圖15 研究區(qū)3結(jié)果
圖16 研究區(qū)4結(jié)果
圖17 局部區(qū)域1結(jié)果
圖18 局部區(qū)域2結(jié)果
圖19 局部區(qū)域3結(jié)果
圖20 局部區(qū)域4結(jié)果
圖21 局部區(qū)域5結(jié)果
為了客觀評價(jià)本文方法的提取精度,將目視解譯結(jié)果作為評價(jià)樣本,統(tǒng)計(jì)得到茶區(qū)的提取精度,同時(shí)與文獻(xiàn)[6]的方法進(jìn)行對比,如表2所示??梢钥闯?,使用本文方法茶區(qū)的生產(chǎn)者精度達(dá)到74.50%,用戶精度達(dá)到83.69%,與文獻(xiàn)[6]的方法相比,生產(chǎn)者精度和用戶精度均有所提高。本文方法依舊存在不足之處,有部分分布比較稀疏的茶區(qū)沒有提取出來,主要原因是這部分茶區(qū)排與排之間的距離偏大,導(dǎo)致這部分茶區(qū)的變差函數(shù)值在指定距離范圍的下降幅度不夠或沒有出現(xiàn)下降趨勢。另外,還有少量的林地被錯(cuò)分為茶區(qū)。
表2 茶提取的精度評價(jià)結(jié)果 %
本研究基于高精度提取茶種植區(qū)的實(shí)際需要,采用0.5 m空間分辨率的航拍影像,選擇貴州省銅仁市4塊矩形區(qū)域,提出了一種面向?qū)ο蠼Y(jié)合變差函數(shù)的茶種植區(qū)自動(dòng)提取方法。得出了以下結(jié)論。
1)采用面向?qū)ο蟮姆椒▽?shí)現(xiàn)了非植被區(qū)的高精度提取,綜合利用影像的光譜、紋理、形狀等信息,有效解決了基于像元的方法由于高分辨率遙感影像中同物異譜、同譜異物現(xiàn)象的存在而出現(xiàn)大量錯(cuò)分的問題。此外,排除了非植被區(qū)的干擾,為下一步茶種植區(qū)的提取奠定了基礎(chǔ)。
2)基于茶區(qū)與其他植被區(qū)在變差函數(shù)紋理特征上的差異,構(gòu)建了決策樹分類模型,采用滑窗法對茶種植區(qū)進(jìn)行高精度提取。經(jīng)過精度評價(jià)得出本文方法茶區(qū)提取的生產(chǎn)者精度達(dá)到74.50%,用戶精度達(dá)到83.69%,說明本文方法對茶種植區(qū)進(jìn)行提取是可行且有優(yōu)勢的。
3)從實(shí)驗(yàn)監(jiān)測的結(jié)果來看,本文方法依舊存在少量林地被錯(cuò)分為茶區(qū),少量較稀疏茶區(qū)漏分的情況。在下一步的研究工作中將考慮融合更多的輔助特征數(shù)據(jù),進(jìn)一步提高茶區(qū)提取精度。