王克曉 周蕊 虞豹 黃祥 王茜
摘要:為探索西南地區(qū)水稻種植信息的有效提取方法,以重慶市永川區(qū)朱沱鎮(zhèn)為例,根據(jù)Sentinel-2多光譜影像,結(jié)合高分一號(GF-1)影像數(shù)據(jù)選取樣本分布點,構(gòu)建水稻作物信息隨機森林提取模型,同時分析樣本地類像元光譜曲線,構(gòu)建不同地類樣本影像像元光譜庫,并將隨機森林分類結(jié)果與傳統(tǒng)最大似然法、光譜角及基于時差的光譜角水稻空間種植信息分類結(jié)果進行對比及精度分析。結(jié)果顯示,通過光譜角分類器提取地物精度有限,結(jié)合時差特征能夠明顯提高目標提取精度,而基于水稻樣本信息訓練構(gòu)建的光譜角模型提取方法獲取水稻種植面積準確率高達90.62%,分類結(jié)果總體精度達91.50%,Kappa系數(shù)達到0.83,實現(xiàn)了對西南地塊破碎地區(qū)分散作物種植信息的有效提取,可為西南地形復雜、地塊破碎地區(qū)農(nóng)作物信息提取提供一定參考。
關鍵詞:水稻信息提取;西南地區(qū);遙感;隨機森林
中圖分類號: P237文獻標志碼: A
文章編號:1002-1302(2019)19-0231-05
收稿日期:2018-07-09
基金項目:重慶市科技服務平臺專項(編號:cstc2015ptfw-ggfw80001)。
作者簡介:王克曉(1986—),男,河南平頂山人,碩士,工程師,主要從事農(nóng)業(yè)遙感方面相關研究。E-mail:447215670@qq.com。
通信作者:周蕊,碩士,副研究員,主要從事農(nóng)業(yè)遙感方面相關研究。E-mail:12087836@qq.com。
及時準確掌握水稻種植信息對于農(nóng)業(yè)和經(jīng)濟發(fā)展具有重大的意義[1],同時也是農(nóng)業(yè)遙感研究的重要內(nèi)容[2]。如何獲取高精度水稻空間種植專題信息依然是農(nóng)業(yè)遙感工作者所面臨的挑戰(zhàn)[3]。作物地類遙感制圖精度受影像底圖及分類提取方法的雙重影響[4-5],多時相及多源遙感數(shù)據(jù)能夠進一步提升提取精度[5]。環(huán)境復雜地區(qū)主要依賴影像光譜信息的農(nóng)作物常規(guī)提取分類方法精度有限,而源于機器學習領域的分析方法對精度提取卻更加有效[6]。劉紹貴等基于高分一號(GF-1)影像寬幅(WFV)數(shù)據(jù),采用面向?qū)ο蟮姆诸惙椒▽K省揚州市水稻種植信息進行了提取,并結(jié)合實地調(diào)查驗證,探討了GF-1數(shù)據(jù)面向?qū)ο蠓诸惙椒ㄔ谒痉N植信息提取中的可行性與影響提取精度的因素[7]。王娟等通過對四川省德陽市旌陽區(qū)的SPOT-5衛(wèi)星影像進行監(jiān)督、面向?qū)ο笠约皼Q策樹等多種方法分類結(jié)果對比,研究最適合提取水稻信息的方法[8]。雷小雨等提出利用2個時相的數(shù)據(jù),通過構(gòu)建差值特征突出水稻物候變化的特點,并與隨機森林算法結(jié)合,較高精度地提取了水稻種植面積,與單時相提取結(jié)果相比,總體精度有較大提高[9]。在諸多涉及水稻信息提取的研究中,研究焦點基本都停留在平原地區(qū),較少學者將其研究焦點放在地塊破碎、土地利用類型復雜的我國西南地區(qū)。我國西南地區(qū)水稻種植具有分散、地塊小、形狀多樣等特點,利用中低分辨率遙感數(shù)據(jù)提取水稻種植面積,難以滿足精度要求[10]。李愛農(nóng)等以云南大理地區(qū)30 m×30 m的Landsat TM影像土地利用分類實踐為例,證明了將計算機監(jiān)督分類與非監(jiān)督分類進行有機結(jié)合, 在西南地塊破碎地區(qū)利用多光譜圖像分類具有可行性[11],盡管整體上獲得了令人滿意的分類結(jié)果,但其精度僅通過斑塊對比和各地類總面積統(tǒng)計判對率進行評價,出現(xiàn)較多大圖斑判對率高、小圖斑判對率低、土地利用類型復雜地段錯判的可能性較大的現(xiàn)象。
本研究以重慶市永川區(qū)朱沱鎮(zhèn)Sentinel-2多光譜影像為例,結(jié)合GF-1全色融合多光譜正射影像,充分利用Sentinel-2系列影像多波段特征影像數(shù)據(jù)集,構(gòu)建基于Sentinel-2影像的隨機森林(RF)分類模型,同時分析樣本地類像元光譜曲線,構(gòu)建影像像元光譜庫,并將RF分類結(jié)果與傳統(tǒng)最大似然法(MLC)、光譜角(SAM)及基于時差的光譜角水稻空間種植信息分類結(jié)果進行對比及精度分析,探討西南地區(qū)水稻種植面積的遙感監(jiān)測方法。
1 研究區(qū)概況
重慶市永川區(qū)位于長江上游北岸,重慶市西部,地處 105°38′~106°05′E、28°56′~29°34′N,地貌分為低山、丘陵、緩丘平壩三大類。屬于亞熱帶季風性濕潤氣候,全年平均氣溫17.7 ℃,年均降水量1 015.0 mm。朱沱鎮(zhèn)位于重慶市永川區(qū)南部長江之濱,是永川區(qū)第一大鎮(zhèn),農(nóng)業(yè)以晚熟龍眼、優(yōu)質(zhì)水稻為主導產(chǎn)業(yè),配套發(fā)展柚子、荔枝、枇杷、葡萄以及蔬菜等特色農(nóng)產(chǎn)品,地塊破碎,農(nóng)作物種植結(jié)構(gòu)復雜多樣。研究區(qū)水稻以中稻為主,生長期一般為4月初至8月末。
2 數(shù)據(jù)與方法
2.1 遙感源數(shù)據(jù)獲取及處理
本研究使用的遙感數(shù)據(jù)主要為高分一號(GF-1)數(shù)據(jù)和Sentinel-2A/2B遙感衛(wèi)星數(shù)據(jù),參考系為統(tǒng)一的WGS-84坐標系,經(jīng)過幾何精淮校正,將誤差控制在0.5個像元以內(nèi)。其中,GF-1數(shù)據(jù)獲取時間為2017年4月23日,是分辨率為2 m的全色融合四波段正射影像;Sentinel-2A/2B遙感衛(wèi)星數(shù)據(jù)下載于歐空局Sentinel科學數(shù)據(jù)中心。研究區(qū)影像成像時間分別為2017年5月17日(時相1)和7月11日(時相2),產(chǎn)品等級為L1C。經(jīng)幾何校正和輻射校正過的L1C級數(shù)據(jù)通過輻射校正轉(zhuǎn)換至L2A級,得到地表反射率產(chǎn)品,然后借助歐空局Sentinel影像數(shù)據(jù)專業(yè)處理平臺SNAP的插件工具SEN2RES將Sentinel-2A/2B數(shù)據(jù)紅邊、短波紅外等6個空間分辨率為 20 m 的多光譜波段統(tǒng)一超分辨率重采樣為 10 m,與L2A產(chǎn)品的可見光、近紅外4個波段組成10波段數(shù)據(jù)集,并按照原影像波段次序重新編號供后續(xù)分析。
2.2 樣本選取與光譜庫構(gòu)建
樣本選取主要通過GF-1影像數(shù)據(jù),該數(shù)據(jù)獲取時期重慶市渝西地區(qū)小麥、油菜處于成熟收獲期,水稻處于移栽期,玉米處于七葉期。研究區(qū)的丘陵地形及水體泡田特征可為水稻樣本點選取提供較大輔助。
研究區(qū)內(nèi)植被與人工地物在時相2影像上均呈現(xiàn)出2種不同色調(diào),結(jié)合提取目標,將研究區(qū)地物類型劃分為水稻、植被1、植被2、水域、公路、裸地、人工地物1及人工地物2共8個類型,結(jié)合GF-1影像選取8組樣本點,然后通過Jeffries-Matusita距離對樣本進行可分離性檢驗,結(jié)果顯示,Jeffries-Matusita值均在1.9以上,說明樣本可分離性較好。將通過檢驗的樣本點組加載到不同時相多光譜影像中,獲取對應分組樣本反射率均值,構(gòu)建各地物類型光譜庫(圖1)和2時相目標組光譜對比曲線(圖2)。
2.3 分類原理與方法
2.3.1 隨機森林分類
隨機森林分類是由加利福尼亞大學Breiman開發(fā)完成的一種基于分類與回歸(CART)決策樹的有效的組合式自學習集成機器學習方法[12]。利用bootsrap重抽樣方法從原樣本中隨機抽取若干樣本,分別為各樣本構(gòu)建獨立決策樹并綜合多棵決策樹的預測投票得出最終預測結(jié)果[13]。
建立在CART決策樹基礎上的隨機森林,有更強的數(shù)據(jù)挖掘、泛化能力和更理想的分類效果,已逐步發(fā)展成分析復雜地區(qū)遙感數(shù)據(jù)的有效集成分類器之一[14]。RF能在不作特征選擇、數(shù)據(jù)整理的條件下處理上千維的海量特征數(shù)據(jù),在各類別樣本容量分布不平衡的情況下保持分類誤差平衡,并且能抵制并檢測出訓練樣本集異常值,無需預處理。隨機森林的樹是由隨機方式獨立生成的,能抑制過擬合現(xiàn)象[15]。圖3為其分類結(jié)構(gòu)圖。
RF分類法用于遙感地物識別主要基于大量隨機生長決策樹,其模型建立主要涉及2個參數(shù),即決策樹個數(shù)(ntree)和決策樹內(nèi)部節(jié)點隨機選擇特征個數(shù)(mtry)[17]。本研究以獲取的樣本點對應各個波段光譜信息值作為樣本特征集,按照 70 ∶15 ∶15 的百分比例構(gòu)建訓練集、驗證集及測試集,基于R語言構(gòu)建隨機森林模型并進行模型參數(shù)優(yōu)化。通過參數(shù)優(yōu)化確定決策樹個數(shù)(ntree)為450個,決策樹內(nèi)部節(jié)點隨機選擇特征個數(shù)(mtry)為3個。袋外錯誤率(OOB)為6.86%,接收者操作特征(ROC)曲線下面積(AUC)為0.877。利用優(yōu)化參數(shù)對多波段影像數(shù)據(jù)集進行分類,獲取RF模型研究區(qū)水稻空間分布信息。
2.3.2 其他分類方法
光譜角分類(SAM)直接將影像像元的光譜與地類樣本光譜進行匹配,通過測試像元光譜與參考光譜之間的矢量夾角來判斷其差異性以及相似性[18]。夾角越小,表示目標像元與樣本代表地類光譜相似度越大,如果小于某個設定的閾值,將把目標像元歸類到樣本代表的相應地物類型中。
歸一化植被指數(shù)(NDVI)能夠反映植被季相變化規(guī)律[19-20]。由于研究區(qū)常綠植被分布較廣,其對應NDVI隨季節(jié)變化較小,而水稻在2個時相明顯表現(xiàn)出不同的生理特征,其植被指數(shù)差異較大。因此,利用不同時相下NDVI差值特征進行水稻信息提取,能夠達到區(qū)分單一時相下無法區(qū)分常綠植被與水稻的目的。
3 結(jié)果與分析
通過研究區(qū)樣本訓練影像數(shù)據(jù)集構(gòu)建RF模型并進行水稻信息提取,同時將其分類結(jié)果分別與最大似然分類法(MLC)、光譜角分類(SAM)、基于時差的光譜角(SAM-NDVI)等分類結(jié)果進行對比分析。從結(jié)果(圖4、表1)可以看出,研究區(qū)水稻分布相對較為分散,地塊特征較為復雜,且與渝西地區(qū)的典型丘陵地貌基本相適應。通過研究區(qū)分辨率為30 m的數(shù)字高程模型(DEM)進行坡度分析,并與提取的水稻分布疊加坡度分級分析。研究區(qū)水稻主要分布在坡度較小的臺地地塊,其中78.25%分布在坡度<5°的區(qū)域,坡度<10°的地塊水稻分布率達 98.26%。據(jù)悉研究區(qū)可用耕地面積約36.67 km2,其中水稻種植面積約31.33 km2。MLC識別的水稻面積為 3.13 km2,面積準確率精度僅為9.99%;基于水稻光譜曲線的SAM方法提取精度有很大提高,面積準確率達到56.59%;基于水稻光譜曲線構(gòu)建的MLC和目標時相特征的SAM-NDVI指數(shù)組合提取方法獲取目標的面積準確率有所提升,為87.46%;而RF模型的水稻提取面積總體準確率最高,為90.62%。
本研究驗證集選取主要通過研究區(qū)時相2影像,同時結(jié)合分辨率為2 m的GF-1正射影像,共選取200個檢驗點(圖 4-e),它們基本均勻分布于研究區(qū)內(nèi)。基于所選取的驗證樣本點, 采用混淆矩陣進行分類精度評價。從表2可以看出,在總體精度和生產(chǎn)者精度方面,RF模型較MLC、SAM等精度都有較大提高,SAM-NDVI模型的水稻分類結(jié)果精度為63.09%,Kappa系數(shù)為0.447,而RF模型的分類總體精度達91.50%,Kappa系數(shù)也有了很大的提升,達0.830。
4 結(jié)論
本研究以重慶市永川區(qū)朱沱鎮(zhèn)Sentinel-2多光譜影像為例,結(jié)合GF-1全色融合多光譜正射影像,通過樣本訓練Sentinel-2系列影像多光譜波段數(shù)據(jù)集,構(gòu)建隨機森林(RF)分類模型,同時分析樣本地類像元光譜曲線,構(gòu)建影像像元光譜庫,并將RF分類結(jié)果與傳統(tǒng)最大似然法(MLC)、光譜角(SAM)及基于時差的光譜角水稻空間種植信息分類結(jié)果進行對比及精度分析。分類結(jié)果顯示,研究區(qū)水稻分布相對較為分散,且地塊特征較為復雜,與區(qū)域典型地貌基本相適應。從目標面積及混淆矩陣2方面對提取結(jié)果進行分析。結(jié)果顯示,通過SAM分類器提取地物精度有限,結(jié)合地物時差特征能夠明顯提高目標提取精度。基于水稻樣本構(gòu)建的RF模型提取方法獲取目標的面積準確率最高,為90.62%,分類結(jié)果總體精度為91.50%,Kappa系數(shù)達到0.83。
隨機森林(RF)分類模型通過構(gòu)建多個決策樹,按照一定原則選定分類過程中特征屬性個數(shù)。利用優(yōu)化參數(shù)對多波段影像數(shù)據(jù)集建立模型,并對研究區(qū)影像進行分類提取。在建立模型過程中,能夠充分利用樣本數(shù)據(jù),對測試集合錯誤作出無偏估計,并對模型未來性能進行合理估計。相對于單一分類方法,其具有較高的精度,顯示出RF組合式自學習集成機器學習分類法在高分辨率遙感影像作物精細識別應用的潛力。
基于Sentinel-2系列衛(wèi)星影像構(gòu)建RF模型用于西南地區(qū)地塊破碎地區(qū)農(nóng)作物信息提取是可行的。西南地區(qū)地塊破碎,農(nóng)作物結(jié)構(gòu)復雜,然而不同農(nóng)作物對不同波段響應程度不同,Sentinel-2系列衛(wèi)星影像同時擁有可見光、近紅外及紅邊波段等多個波段數(shù)據(jù)。因此,多波段的Sentinel-2系列影像對于研究農(nóng)作物分布信息更有價值。盡管本研究使用了多達10個Sentinel-2多光譜波段數(shù)據(jù)進行樣本像元特征集構(gòu)建,但并未對綠色植被較為敏感的紅邊波段進行專題研究,基于目標作物在不同時相對紅邊波段的響應分析也有待進一步深入研究。
參考文獻:
[1]張有智. 水稻種植面積提取遙感方法研究——以黑龍江省綏濱縣為例[J]. 中國農(nóng)業(yè)信息,2016(15):72-74.
[2]單 捷,孫 玲,于 堃,等. 基于不同時相高分一號衛(wèi)星影像的水稻種植面積監(jiān)測研究[J]. 江蘇農(nóng)業(yè)科學,2017,45(22):229-232.
[3]劉 璞,張 遠,周 斌,等. 基于SAM和多源信息的土地利用/覆蓋自動分類[J]. 浙江大學學報(工學版),2009,43(9):1574-1579.
[4]Chan J C,Paelinckx D. Evaluation of Random Forest and Adaboost tree-based ensemble classification and spectral band selection for ecotope mapping using airborne hyperspectral imagery[J]. Remote Sensing of Environment,2008,112(6):2999-3011.
[5]Waske B,van der Linden S. Classifying multilevel imagery from SAR and optical sensors by decision fusion[J]. IEEE Transactions on Geoscience and Remote Sensing,2008,46(5):1457-1466.
[6]Gislason P O,Benediktsson J A,Sveinsson J R. Random forests for land cover classication[J]. Pattern Recognition Letters,2006,27(4):294-300.
[7]劉紹貴,姬忠林,張月平,等. 基于GF-1影像面向?qū)ο蠓诸惙椒ǖ乃痉N植信息提取研究[J]. 中國稻米,2017,23(6):43-46.
[8]王 娟,張 杰,張 優(yōu),等. 基于SPOT-5衛(wèi)星影像的水稻信息提取方法研究——以德陽市旌陽區(qū)為例[J]. 西南農(nóng)業(yè)學報,2017,30(4):861-868.
[9]雷小雨,卓 莉,葉 濤,等. 基于時差特征與隨機森林的水稻種植面積提取[J]. 遙感技術(shù)與應用,2016,31(6):1140-1149,1157.
[10]陳燕麗,莫偉華,莫建飛,等. 基于面向?qū)ο蠓诸惖哪戏剿痉N植面積提取方法[J]. 遙感技術(shù)與應用,2011,26(2):163-168.
[11]李愛農(nóng),江小波,馬澤忠,等. 遙感自動分類在西南地區(qū)土地利用調(diào)查中的應用研究[J]. 遙感技術(shù)與應用,2003,18(5):282-285,353.
[12]王書玉,張羽威,于振華. 基于隨機森林的洪河濕地遙感影像分類研究[J]. 測繪與空間地理信息,2014,37(4):83-85,93.
[13]劉 毅,杜培軍,鄭 輝,等. 基于隨機森林的國產(chǎn)小衛(wèi)星遙感影像分類研究[J]. 測繪科學,2012,37(4):194-196.
[14]Waske B,van der Linden S,Oldenburg C A,et al. imageRF-a user-oriented implementation for remote sensing image analysis with Random Forests[J]. Environmental Modelling & Software,2012,35:192-193.[HJ1.7mm]
[15]Breiman L. Random forests[J]. Machine Learning,2001,45(1):5-32.
[16]宋 茜. 基于GF-1/WFV和面向?qū)ο蟮霓r(nóng)作物種植結(jié)構(gòu)提取方法研究[D]. 北京:中國農(nóng)業(yè)科學院,2016.
[17]Li X J,Chen G,Liu J Y,et al. Effects of RapidEye Imagerys red-edge band and vegetation indices on land cover classification in an arid region[J]. Chinese Geographical Science,2017,27(5):827-835.
[18]王旭紅,賈百俊,郭建明,等. 基于SAM遙感影像的分類技術(shù)研究[J]. 西北大學學報(自然科學版),2008,38(4):668-672.
[19]劉元亮,李 艷,吳劍亮. 基于LSWI和NDVI時間序列的水田信息提取研究[J]. 地理與地理信息科學,2015,31(3):32-37,2.
[20]張 猛,曾永年. 基于多時相Landsat數(shù)據(jù)融合的洞庭湖區(qū)水稻面積提取[J]. 農(nóng)業(yè)工程學報,2015,31(13):178-185.