姜星宇 徐華東 陳文靜
摘 要:為實(shí)現(xiàn)快速、高效地監(jiān)測(cè)落葉松毛蟲(Dendrolimus superans)蟲害爆發(fā)狀況,以黑龍江省鄉(xiāng)南經(jīng)營(yíng)所林場(chǎng)8林班為研究區(qū),以2018年Sentinel-2遙感影像為數(shù)據(jù)源,對(duì)該林班的落葉松毛蟲蟲害區(qū)進(jìn)行識(shí)別。提取預(yù)處理后影像的原始光譜特征(8個(gè))、光譜指數(shù)特征(12個(gè))與紋理特征(8個(gè)),基于方差分析(Analysis of Variance,ANOVA)與極度梯度提升(eXtreme Gradient Boosting,XGBoost)分類器對(duì)上述特征降維并按重要性排序,通過集成學(xué)習(xí)分類算法(隨機(jī)森林分類器和XGBoost分類器)進(jìn)行蟲害區(qū)識(shí)別和精度比較。研究結(jié)果表明,1)應(yīng)用重要性前14位特征的XGBoost模型對(duì)蟲害區(qū)識(shí)別的表現(xiàn)最為理想,總體分類精度為95%(Kappa系數(shù)為86%),高于隨機(jī)森林分類器的93%(應(yīng)用重要性前10的特征);2)重要性前14的特征名稱由大到小為EVI1、Mean、MTCI、GNDVI、Variance、B4、B2、Homogeneity、B3、CRI1、EVI2、B8、B5和CRE。研究結(jié)果可實(shí)現(xiàn)落葉松毛蟲蟲害區(qū)的高效識(shí)別,為東北林區(qū)的蟲害防治決策制定提供依據(jù)。
關(guān)鍵詞:落葉松毛蟲;集成學(xué)習(xí);Sentinel-2;遙感;XGBoost
中圖分類號(hào):S763;S763.42+1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8023(2023)06-0147-09
Dendrolimus Superans Infected Area Identification Based on Ensemble Learning Model and Sentinel-2 Data
JIANG Xingyu, XU Huadong, CHEN Wenjing
(College of Mechanical and Electrical Engineering, Northeast Forestry University, Harbin 150040, China)
Abstract:In order to quickly and efficiently monitor the outbreaks of Dendrolimus superans, the 8th forest compartment of South Management Office Forest Farm in Heilongjiang Province was taken as the research area, while the Sentinel-2 remote sensing image in 2018 was used as data source to identify the Dendrolimus superans infestation area in the forest compartment. The original spectral features (8), spectral index features (12) and the texture features (8) were extracted from the preprocessed image. Based on ANOVA and XGBoost classifiers, all features were dimensionally reduced and sorted by importance. The ensemble learning classification algorithm (Random Forest classifier and XGBoost classifier) was used to identify pest areas and compare their accuracy. The results showed that: (1) the XGBoost model with the top 14 important features was the most ideal for the identification of pest areas, and the overall accuracy reached to 95% (Kappa coefficient = 86%), which were higher than the 93% of Random Forest (the top 10 features in order of importance); (2) the top 14 feature names were: EVI1, Mean, MTCI, GNDVI, Variance, B4, B2, Homogeneity, B3, CRI1, EVI2, B8, B5 and CRE. This method can achieve efficient identification of Dendrolimus superans infestation areas, which can provide a basis for decision-making on pest control in northeast forest.
Keywords:Dendrolimus superans; ensemble learning; Sentinel-2; remote sensing; XGBoost
收稿日期:2022-12-24
基金項(xiàng)目:國(guó)家自然科學(xué)基金項(xiàng)目(31870537)。
第一作者簡(jiǎn)介:姜星宇,碩士研究生。研究方向?yàn)榱謽I(yè)遙感與信息化。E-mail: 2905168025@qq.com
*通信作者:徐華東,博士,教授。研究方向?yàn)樯止こ獭⒘謽I(yè)遙感與信息化。E-mail: xhd-8215@163.com
引文格式:姜星宇,徐華東,陳文靜.基于集成學(xué)習(xí)和Sentinel-2的落葉松毛蟲蟲害區(qū)識(shí)別[J].森林工程, 2023, 39(6):147-155.
JIANG X Y, XU H D, CHEN W J. Dendrolimus Superans infected area identification based on ensemble learning model and Sentinel-2 data[J]. Forest Engineering, 2023, 39(6):147-155.
0 引言
落葉松毛蟲(Dendrolimus superans (Butler))是我國(guó)東北地區(qū)主要森林食葉害蟲之一,影響林木生長(zhǎng)發(fā)育并阻礙林產(chǎn)品質(zhì)量提高。森林作為陸地生態(tài)系統(tǒng)中最大的碳庫(kù),其結(jié)構(gòu)組成與固碳能力遭到破壞,將產(chǎn)生巨大的經(jīng)濟(jì)和生態(tài)損失 。因此,如何高效識(shí)別蟲害區(qū)域成為亟待解決的問題。
現(xiàn)有蟲害監(jiān)測(cè)方法中,傳統(tǒng)地面監(jiān)測(cè)的觀測(cè)尺度有限、物資消耗嚴(yán)重,不及遙感監(jiān)測(cè)的覆蓋范圍廣、檢測(cè)效率高 ,后者一般借助光學(xué)遙感(多光譜、高光譜)和微波遙感(合成孔徑雷達(dá)與激光雷達(dá))。高光譜數(shù)據(jù)難獲取、難處理,合成孔徑雷達(dá)數(shù)據(jù)對(duì)植被敏感度低、蟲害監(jiān)測(cè)應(yīng)用比較少見,激光雷達(dá)設(shè)備造價(jià)高昂、使用難度大,而多光譜遙感技術(shù)成熟、處理流程簡(jiǎn)單且計(jì)算量較小,如高時(shí)間分辨率的中分辨率成像光譜儀(moderate-resolution imaging spectroradiometer,MODIS)、高空間分辨率的WorldView-2、具有紅邊波段的Sentinel-2等均在植被監(jiān)測(cè)中表現(xiàn)出優(yōu)勢(shì)。其中,Sentinel-2影像重訪周期高(雙星組合約3~5 d),數(shù)據(jù)開源易獲取,并具有3個(gè)對(duì)植被變化敏感的紅邊波段(Red Edge)。此外,有研究使用多源遙感數(shù)據(jù)(Landsat TM/ETM+/OLI)進(jìn)行蟲害監(jiān)測(cè)和制圖,Sentinel-2數(shù)據(jù)的光譜分辨率(13個(gè)波段)、空間分辨率(10 m分辨率)均較Landsat系列數(shù)據(jù)(7~11個(gè)波段、30 m空間分辨率)更優(yōu),故選擇其作為落葉松毛蟲蟲害區(qū)識(shí)別研究的遙感數(shù)據(jù)源。
蟲害區(qū)域的遙感識(shí)別依賴于特征空間的構(gòu)建。亓興蘭等應(yīng)用SPOT-5的紋理特征與原始光譜波段實(shí)現(xiàn)了馬尾松毛蟲蟲害危害等級(jí)分類;黃曉君應(yīng)用高光譜與Sentinel-2的光譜指數(shù)、光譜導(dǎo)數(shù)特征,對(duì)西伯利亞松毛蟲與雅氏落葉松尺蠖分別建立模型進(jìn)行識(shí)別。特征冗余或?qū)е戮认陆担室话慊诮y(tǒng)計(jì)方法或基于模型進(jìn)行特征降維,其中基于決策樹的集成學(xué)習(xí)分類模型既可降維,也可進(jìn)行蟲害區(qū)的識(shí)別:隨機(jī)森林(Random Forest,RF)與極度梯度提升(eXtreme Gradient Boosting,XGBoost)等基于決策樹的集成學(xué)習(xí)算法繼承了決策樹的優(yōu)點(diǎn),性能更穩(wěn)定,預(yù)測(cè)能力更強(qiáng)。許章華等 利用Landsat-7影像的特征組合對(duì)馬尾松毛蟲蟲害程度進(jìn)行識(shí)別,RF的檢測(cè)效果優(yōu)于Fisher判別;張超等 提取時(shí)序光譜與植被特征識(shí)別作物, 發(fā)現(xiàn)XGBoost算法的精度高于RF算法。在目標(biāo)蟲害上,落葉松毛蟲與馬尾松毛蟲習(xí)性類似,在算法精度上,未有研究對(duì)XGBoost與RF在蟲害區(qū)上的識(shí)別做比較,因此擬選擇上述算法作蟲害區(qū)識(shí)別,以期獲取更高的識(shí)別精度。
綜上,本研究擬以鄉(xiāng)南經(jīng)營(yíng)所林場(chǎng)8林班為研究區(qū),基于Sentinel-2遙感影像,選擇原始波段、光譜指數(shù)與紋理特征,應(yīng)用統(tǒng)計(jì)方法(方差分析)和模型方法(XGBoost)對(duì)分類特征進(jìn)行降維及重要性排序,對(duì)比集成學(xué)習(xí)算法(RF與XGBoost),分析研究區(qū)識(shí)別精度(總體識(shí)別精度OA與Kappa系數(shù)),本研究旨在獲取東北地區(qū)落葉松毛蟲蟲害區(qū)識(shí)別的分類特征與集成學(xué)習(xí)算法的最佳組合模型,為東北地區(qū)落葉松毛蟲害乃至其他森林蟲害的高效監(jiān)測(cè)提供依據(jù)。
1 試驗(yàn)區(qū)概況及數(shù)據(jù)處理
1.1 研究區(qū)概況
研究區(qū)為黑龍江省鄉(xiāng)南經(jīng)營(yíng)所林場(chǎng)8林班,位于伊春市鐵力市朗鄉(xiāng)鎮(zhèn),經(jīng)營(yíng)面積約為3.96 km,氣候?yàn)榇箨懶约撅L(fēng)氣候。該林班林分組成為落葉松(Larix gmelinii)人工林純林,落葉松毛蟲常周期性爆發(fā)。2018年,朗鄉(xiāng)林業(yè)局病防站通過線路踏查方式,監(jiān)測(cè)到8林班遭受嚴(yán)重的落葉松毛蟲蟲害,且未發(fā)現(xiàn)其他病蟲跡象。
1.2 數(shù)據(jù)收集
Sentinel-2遙感數(shù)據(jù)來源為歐空局網(wǎng)站(https://scihub.copernicus.eu/),采用2A衛(wèi)星的多光譜成像儀(MSI)數(shù)據(jù),成像時(shí)間為2018年8月6日,數(shù)據(jù)編號(hào)為S2A_MSIL1C_20180806T021601_N0206_R003_T52TDT_20180806T041543。為避免低分辨率波段對(duì)分類任務(wù)的影響,舍棄Sentinel-2數(shù)據(jù)中的空間分辨率為60 m的水氣、卷云以及可見光中的氣溶膠波段,選取的波段分別為空間分辨率10 m的B2、B3、B4、B8和20 m的B5、B6、B7、B8A、B11、B12。
樣本數(shù)據(jù)來源為固定標(biāo)準(zhǔn)地監(jiān)測(cè)和線路踏查方式獲得的調(diào)查數(shù)據(jù),包括2018年6月7日(發(fā)現(xiàn)蟲情)至2018年8月15日(蟲害不再大幅擴(kuò)散)8林班內(nèi)的蟲害變化、蟲害樣區(qū)與健康樣區(qū)的坐標(biāo)范圍。根據(jù)上述數(shù)據(jù)繪制蟲害區(qū)、健康區(qū)(針對(duì)性選?。┖途用駞^(qū)(目視解譯)3塊矢量區(qū)域作為感興趣區(qū)。
1.3 數(shù)據(jù)處理
運(yùn)用易智瑞(ESRI)公司的ENVI軟件(版本5.5)對(duì)Sentinel-2數(shù)據(jù)預(yù)處理(輻射定標(biāo)、大氣校正):利用輻射定標(biāo)擴(kuò)展工具Radiance Sentinel-2 L1C對(duì)10 m和20 m波段做輻射定標(biāo),在此基礎(chǔ)上,運(yùn)用FLAASH模塊進(jìn)行大氣校正后提取波段。為防止重采樣后與真實(shí)值誤差過大,將10 m的波段數(shù)據(jù)B2、B3、B4、B8,通過ENVI的最近鄰方法重采樣為20 m分辨率,并與20 m分辨率的B5、B6、B7、B8A波段組合為新影像。
3塊感興趣區(qū)包含1 011個(gè)像元樣本數(shù)據(jù)(蟲害區(qū)192個(gè)像元,健康區(qū)119個(gè)像元和居民區(qū)700個(gè)像元)。分類時(shí)設(shè)置訓(xùn)練樣本40%,驗(yàn)證樣本占比60%,將整個(gè)8林班作為測(cè)試樣本,研究區(qū)真彩色影像圖與樣本感興趣區(qū)域分布如圖1所示。
2 研究方法
2.1 特征提取
原始光譜特征、光譜指數(shù)特征和紋理特征是分析遙感圖像的基本要素,可反映植被生理健康變化,現(xiàn)對(duì)上述特征進(jìn)行定性分析,如圖2所示。
原始光譜特征中B2、B3和B4波段組合圖像反映與目視一致的真彩色圖像;紅邊波段(B5、B6、B7)是反射率在近紅外波段與紅光交界處(670~760 nm)快速變化的區(qū)域,常用以描述植物理化參數(shù)與健康狀況;B8(近紅外)與B8A(短波紅外)波段是研究植被時(shí)常用的波段。對(duì)上述原始波段進(jìn)行1—8的編號(hào),分別對(duì)3個(gè)感興趣區(qū)的平均光譜反射率曲線圖進(jìn)行分析,對(duì)比蟲害區(qū)和健康區(qū),2條曲線保持相同的趨勢(shì),但數(shù)值上存在明顯的差異,而居民區(qū)無論趨勢(shì)與數(shù)值均明顯不同。光譜指數(shù)特征是結(jié)構(gòu)簡(jiǎn)明、易于計(jì)算且物理意義明確的原始光譜運(yùn)算組合,基于圖2(a)分析結(jié)果和已有文獻(xiàn),利用波段光譜反射率值和不同波段數(shù)據(jù)組合而來的光譜指數(shù)特征作為識(shí)別蟲害區(qū)域的特征數(shù)據(jù),對(duì)于識(shí)別蟲害區(qū)域具有科學(xué)依據(jù)。對(duì)于原始光譜特征,共選取上述8個(gè)波段;同時(shí)分別選取能夠反映植物中色素含量、含水率和失葉率等的光譜指數(shù)共20個(gè)。光譜特征名稱及計(jì)算公式見表1。
故在Sentinel-2數(shù)據(jù)中共選取上述36個(gè)分類特征用于蟲害區(qū)識(shí)別,其中原始光譜特征8個(gè),光譜指數(shù)特征20個(gè),紋理特征8個(gè)。
紋理特征可描述林木冠層粗糙度。首先應(yīng)用主成分分析法獲取波段信息占比最高的第一主成分,利用5×5的移動(dòng)窗口,使用灰度共生矩陣法提取紋理信息。紋理特征選取8個(gè):同質(zhì)性(Homogeneity,HOM)、均值(Mean,MEAN)、二階矩(Second moment,SEC)、方差(Variance,VAR)、非相似性(dissimilarity,DIS)、對(duì)比度(Contrast,CON)、熵(Entropy,ENT)和相關(guān)性(Correlation,COR) 。為保證特征可在一張圖中顯示,將MEAN的均值縮小10倍。根據(jù)圖2(b)分析可知,居民區(qū)與林區(qū)(健康區(qū)與蟲害區(qū))在MEAN、VAR、CON、DIS和ENT這5個(gè)特征上均表現(xiàn)出明顯的差異,健康區(qū)和蟲害區(qū)在VAR、CON、DIS、ENT和SEC上均表現(xiàn)出明顯的差異,故利用紋理特征作為識(shí)別蟲害區(qū)域的特征數(shù)據(jù)具有科學(xué)依據(jù)。
2.2 特征降維
結(jié)合統(tǒng)計(jì)學(xué)與模型2種方法進(jìn)行特征降維。1)基于統(tǒng)計(jì)學(xué)方法——方差分析方法(Analysis of Variance,ANOVA),篩選特征。ANOVA通過計(jì)算檢驗(yàn)統(tǒng)計(jì)量P與F來描述樣本變異狀況;2)基于模型方法——XGBoost分類器,進(jìn)行特征重要性排序。按照模型默認(rèn)參數(shù),將決策樹棵樹設(shè)為100,最大深度設(shè)為6,得到特征重要性分?jǐn)?shù)分布直方圖并進(jìn)行降序排列。
2.3 分類器對(duì)比與精度評(píng)價(jià)
由于RF分類器未引入正則項(xiàng),訓(xùn)練過程中創(chuàng)建過多決策樹將使模型產(chǎn)生過擬合現(xiàn)象,故決定將其決策樹棵樹設(shè)置為20;而XGBoost分類器中引入了控制模型復(fù)雜度的正則化項(xiàng),故將其決策樹棵樹(子模型數(shù)量)仍設(shè)置為100。為保持其他變量一致,將樹的最大深度均設(shè)置為6。應(yīng)用優(yōu)化后的分類特征,訓(xùn)練RF和XGBoost分類器,得到識(shí)別精度曲線。
3 結(jié)果與討論
3.1 特征篩選與降維
在ANONA篩選特征時(shí),將P> 0.05(ARI1、ARI2、BAI、IRECI、MCARI、NDRE和REP)與F< 100(B6、CRI2、NDI45、PSRI和Correlation)的不敏感特征(共12個(gè))進(jìn)行排除,剩余24個(gè)特征,見表2。
應(yīng)用XGBoost進(jìn)行特征重要性排序時(shí),輸入方差分析篩選后剩余的24個(gè)特征,輸出僅返回20個(gè),即其中4個(gè)對(duì)分類器沒有貢獻(xiàn)。20個(gè)特征按降序排列分別對(duì)應(yīng):f9(EVI1)、f17(Mean)、f13(MTCI)、f11(GNDVI)、f18(Variance)、f2(B4)、f0(B2)、f19(Homogeneity)、f1(B3)、f7(CRI1)、f10(EVI2)、f5(B8)、f3(B5)、f8(CRE)、f22(Entropy)、f20(Contrast)、f6(B8A)、f21(Dissimilarity)、f4(B7)、f23(Second Moment)。依據(jù)方差分析與特征重要性排序,選擇這20個(gè)特征進(jìn)行蟲害區(qū)識(shí)別,降低特征冗余對(duì)于識(shí)別精度的負(fù)面影響,如圖3所示。
3.2 基于特征選擇的不同分類器精度評(píng)價(jià)
為定量分析分類器的性能,按特征重要性降序排列順序,依次取出對(duì)應(yīng)特征訓(xùn)練RF和XGBoost分類器,識(shí)別研究區(qū)內(nèi)蟲害區(qū)、健康區(qū)和居民區(qū)3種類別,記錄識(shí)別精度,如圖4所示。
從峰值的角度來分析,在應(yīng)用重要性前10的特征時(shí),RF分類器總體識(shí)別精度達(dá)到最高值93%。此時(shí),XGBoost分類器總體識(shí)別精度未達(dá)到峰值,已高于RF分類器。在應(yīng)用重要性前14的特征時(shí),XGBoost分類器總體識(shí)別精度達(dá)到95%,后續(xù)仍有并不顯著的小幅精度提升,但是將花費(fèi)更多特征節(jié)點(diǎn)計(jì)算量與計(jì)算時(shí)間;從模型穩(wěn)定性與整體趨勢(shì)來分析,在各個(gè)特征數(shù)目節(jié)點(diǎn)上,XGBoost分類器總體識(shí)別精度均高于RF分類器。隨著特征個(gè)數(shù)的增加,XGBoost分類器識(shí)別精度逐漸平穩(wěn)增加,而RF分類器部分識(shí)別精度時(shí)有下降,整體趨勢(shì)呈現(xiàn)不穩(wěn)定狀態(tài)。
RF的分類效果不及XGBoost的主要原因是二者創(chuàng)建決策樹的策略不同。前者的訓(xùn)練樣本不固定,分裂節(jié)點(diǎn)特征選擇也具有隨機(jī)性,故RF分類器創(chuàng)建決策樹分類時(shí),會(huì)存在隨機(jī)特征的干擾,若隨機(jī)特征不敏感,則分類精度下降;后者的訓(xùn)練樣本是固定的,分裂節(jié)點(diǎn)特征的選擇是遍歷所有特征后選擇使模型內(nèi)部代價(jià)函數(shù)減小最快的特征,所以每次分類都會(huì)更接近真實(shí)結(jié)果。因此,XGBoost分類器在進(jìn)行識(shí)別時(shí)具有更好的穩(wěn)定性,對(duì)蟲害區(qū)域識(shí)別具有更好效果。
3.3 基于分區(qū)的不同分類器精度評(píng)價(jià)
為確定不同分類器、特征數(shù)以及感興趣區(qū)的識(shí)別精度與相互關(guān)系,選取具有代表性的特征數(shù)量(精度達(dá)到穩(wěn)定的最優(yōu)特征個(gè)數(shù)、降維后剩余特征個(gè)數(shù)與未降維的全部特征個(gè)數(shù))進(jìn)行分析。應(yīng)用RF分類器(特征個(gè)數(shù):10、20、36)與XGBoost分類器(特征個(gè)數(shù):14、20、36)對(duì)蟲害區(qū)、健康區(qū)、居民區(qū)進(jìn)行識(shí)別精度評(píng)價(jià),見表3。
從各區(qū)域識(shí)別精度分析,XGBoost分類器的總體識(shí)別精度與各區(qū)域識(shí)別精度均顯著高于RF分類器。所有區(qū)域中,居民區(qū)識(shí)別精度更高,其在特征值上與植被區(qū)域差異較大,更易找到區(qū)分閾值;對(duì)于蟲害區(qū)與健康區(qū),XGBoost在36個(gè)特征取得最高總體識(shí)別精度時(shí),Kappa系數(shù)不升反降,低于14、20個(gè)特征時(shí)的86%,說明36個(gè)特征的識(shí)別模型的識(shí)別結(jié)果混淆矩陣更不平衡,具有偏向性。對(duì)于20個(gè)特征與14個(gè)特征的識(shí)別模型,前者增加了6個(gè)特征的計(jì)算量,卻并未有總體識(shí)別精度的提升,且后者對(duì)于蟲害區(qū)的識(shí)別精度更高,故應(yīng)用14個(gè)特征的XGBoost模型更適用于本研究試圖實(shí)現(xiàn)蟲害區(qū)識(shí)別的研究目的。從識(shí)別精度與特征數(shù)角度分析,RF分類器在特征數(shù)為20、36時(shí),與特征數(shù)為10時(shí)相比,其總體分類精度降低,說明無關(guān)特征對(duì)正確分類存在干擾,冗余特征會(huì)影響分類精度,分類特征不是越多越好。Kappa系數(shù)與總體識(shí)別精度規(guī)律相似。對(duì)于XGBoost分類器,隨著特征個(gè)數(shù)增加,其識(shí)別精度一直在小幅提升,但計(jì)算量也會(huì)隨之增加,從而影響分類效率(圖4與表3)。綜上,本研究確定的綜合識(shí)別精度最高的落葉松毛蟲蟲害識(shí)別模型為基于特征重要性前14個(gè)特征的XGBoost分類器蟲害區(qū)識(shí)別模型。
3.4 識(shí)別結(jié)果比較
圖5是應(yīng)用選定的識(shí)別模型對(duì)研究區(qū)的識(shí)別結(jié)果。整體來看,XGBoost分類器應(yīng)用不同特征個(gè)數(shù)(14、20、36)的識(shí)別結(jié)果保持高度一致,說明減少不敏感的分類特征對(duì)識(shí)別結(jié)果不會(huì)產(chǎn)生較大影響。與圖1不同區(qū)域感興趣區(qū)分布圖對(duì)比,不存在明顯錯(cuò)分區(qū)域,說明使用Sentinel-2影像對(duì)研究區(qū)內(nèi)蟲害區(qū)、健康區(qū)和居民區(qū)進(jìn)行識(shí)別具有很好的效果。XGBoost分類器應(yīng)用特征重要性前14個(gè)特征得到,8林班具有蟲害像元2 647個(gè)(約1.06 km),健康區(qū)像元6 094個(gè)(約2.44 km),居民區(qū)像元1 149個(gè)(約0.46 km),合計(jì)9 890個(gè)像元(約3.96 km),識(shí)別總面積與研究區(qū)概況保持一致。
4 結(jié)論和局限性
本研究以黑龍江省鄉(xiāng)南經(jīng)營(yíng)所林場(chǎng)8林班為研究區(qū),以Sentinel-2多光譜遙感數(shù)據(jù)為數(shù)據(jù)源,結(jié)合方差分析篩選與XGBoost特征重要性排序得到的20個(gè)分類特征,對(duì)比分析XGBoost分類器與RF分類器識(shí)別結(jié)果,獲得一種落葉松毛蟲蟲害區(qū)的遙感識(shí)別模型并得到該蟲害區(qū)的模型精度評(píng)價(jià)與識(shí)別結(jié)果分布圖,為及時(shí)掌握當(dāng)?shù)芈淙~松毛蟲蟲害脅迫的區(qū)域定位與空間分布,進(jìn)而加強(qiáng)蟲害動(dòng)態(tài)管理和災(zāi)后定損提供技術(shù)依據(jù)。
1)按照特征重要性降序排列的20個(gè)特征分別對(duì)應(yīng):EVI1、Mean、MTCI、GNDVI、Variance、B4、B2、Homogeneity、B3、CRI1、EVI2、B8、B5、CRE、Entropy、Contrast、B8A、Dissimilarity、B7和Second Moment。
2)采用重要性排序前10位的特征,RF分類器總體識(shí)別精度達(dá)到峰值93%,XGBoost分類器的精度與其一致,但未達(dá)到峰值;采用重要性排序前14個(gè)特征,XGBoost分類器總體識(shí)別精度達(dá)到95%,Kappa系數(shù)最高(86%),此時(shí)模型趨于穩(wěn)定,增加特征數(shù)對(duì)精度提升影響較小。
3)通過對(duì)比穩(wěn)定性、特征數(shù)與識(shí)別精度,將XGBoost分類器結(jié)合重要性排序前14個(gè)分類特征的識(shí)別模型,作為本研究的落葉松毛蟲蟲害區(qū)識(shí)別模型。
4)本研究的識(shí)別精度較好,但仍存在不足。在特征選擇上,關(guān)注于蟲害影響植株產(chǎn)生的光學(xué)特征,并未結(jié)合地形特征(如DEM);在區(qū)域劃分上,證明居民區(qū)與植被區(qū)(包括蟲害區(qū)與健康區(qū))相比識(shí)別精度更高,后續(xù)研究將對(duì)居民區(qū)進(jìn)行掩膜處理,以忽略其對(duì)識(shí)別精度的影響;在方法改進(jìn)上,后續(xù)可考慮應(yīng)用多源遙感數(shù)據(jù)或深度學(xué)習(xí)方法對(duì)蟲害區(qū)分類以取得更高的分類精度。
【參 考 文 獻(xiàn)】
[1]于德江,鄭依國(guó),孫晨輝,等.長(zhǎng)白山國(guó)家級(jí)自然保護(hù)區(qū)落葉松毛蟲致災(zāi)狀況調(diào)查與致災(zāi)因子分析[J].林業(yè)科學(xué)研究,2022,35(3):103-111.
YU D J, ZHENG Y G, SUN C H, et al. Investigation and factors analysis of Dendrolimus superans outbreaks in Changbai Mountain national nature reserve[J]. Forest Research, 2022, 35(3): 103-111.
[2]陳文靜,楊從從.2001—2017年青海省NDVI時(shí)空變化特征及其對(duì)氣候因子的響應(yīng)[J].森林工程,2020,36(5):54-61.
CHEN W J, YANG C C. Spatiotemporal change characteristics of NDVI and its response to climate factors in Qinghai from 2001 to 2017[J]. Forest Engineering, 2020, 36(5): 54-61.
[3]麻磊,黃曉君,Ganbat Dashzebegd,等.不同遙感傳感器監(jiān)測(cè)森林蟲害研究進(jìn)展與展望[J].中國(guó)農(nóng)學(xué)通報(bào),2022,38(26):91-99.
MA L, HUANG X J, DASHZEBEGD G, et al. Monitoring forest insect pests by different remote sensing sensors: research progress and prospect[J]. Chinese Agricultural Science Bulletin, 2022, 38(26): 91-99.
[4]韓歡慶.基于無人機(jī)多光譜圖像的森林蟲害區(qū)域分割方法[D].北京:北京林業(yè)大學(xué),2018.
HAN H Q. Segmentation of forest pest area based on UAV multispectral remote sensing images[D]. Beijing: Beijing Forestry University, 2018.
[5]陳文靜,徐華東,劉美爽.應(yīng)用MODIS數(shù)據(jù)監(jiān)測(cè)神農(nóng)架林區(qū)大小蠹蟲害時(shí)空分布[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2020,40(12):60-68.
CHEN W J, XU H D, LIU M S. Spatial and temporal distribution of Dendroctonus armandi infestation in Shennongjia forested region using MODIS data[J]. Journal of Central South University of Forestry & Technology, 2020, 40(12): 60-68.
[6]劉俊,周靖靖,菅永峰,等.Worldview-2不同波段紋理特征對(duì)森林蓄積量估算精度影響[J].西北林學(xué)院學(xué)報(bào),2021,36(3):175-181.
LIU J, ZHOU J J, JIAN Y F, et al. Effects of texture parameters of different bands of Worldview-2 images on the estimation of forest volume[J]. Journal of Northwest Forestry University, 2021, 36(3): 175-181.
[7]陳媛媛,雷鳴,王澤遠(yuǎn),等.基于Sentinel衛(wèi)星影像的土地利用類型提?。阂喳愃猩彾紖^(qū)為例[J].森林工程,2022,38(2):54-61.
CHEN Y Y, LEI M, WANG Z Y, et al. Extraction of land use types based on sentinel images: a case study of Liandu district, Lishui[J]. Forest Engineering, 2022, 38(2): 54-61.
[8]黃林生,江靜,黃文江,等.Sentinel-2影像和BP神經(jīng)網(wǎng)絡(luò)結(jié)合的小麥條銹病監(jiān)測(cè)方法[J].農(nóng)業(yè)工程學(xué)報(bào),2019,35(17):178-185.
HUANG L S, JIANG J, HUANG W J, et al. Wheat yellow rust monitoring method based on Sentinel-2 image and BPNN model[J]. Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(17): 178-185.
[9]羅先軼,張永光.基于多源遙感數(shù)據(jù)的森林蟲害監(jiān)測(cè)及驅(qū)動(dòng)力分析[J].航天返回與遙感,2022,43(6):129-140.
LUO X Y, ZHANG Y G. Monitoring forest pests and its driving factors based on multi-source remote sensing data[J]. Spacecraft Recovery & Remote Sensing, 2022, 43(6): 129-140.
[10]亓興蘭,肖豐慶,劉健,等.基于多尺度紋理與光譜特征的馬尾松毛蟲蟲害信息提取方法研究[J].西南林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2019,39(5):136-143.
QI X L, XIAO F Q, LIU J, et al. Information extraction method of Dendrolimus punctatus based on multi-scale texture and spectral features[J]. Journal of Southwest Forestry University (Natural Sciences), 2019, 39(5): 136-143.
[11]黃曉君.落葉松針葉蟲害地面高光譜識(shí)別及遙感監(jiān)測(cè)方法研究[D].蘭州:蘭州大學(xué),2019.
HUANG X J. Remote sensing identification and monitoring of larch needle pests based on ground hyperspectral data[D].Lanzhou: Lanzhou University, 2019.
[12]楊迎港,劉培,張合兵,等.基于特征優(yōu)選隨機(jī)森林算法的GF-2影像分類[J].航天返回與遙感,2022,43(2):115-126.
YANG Y G, LIU P, ZHANG H B, et al. Research on GF-2 image classification based on feature optimization random forest algorithm[J]. Spacecraft Recovery & Remote Sensing, 2022, 43(2): 115-126.
[13]歐強(qiáng)新,李??紫鄸|,等.基于清查數(shù)據(jù)的福建省馬尾松生物量轉(zhuǎn)換和擴(kuò)展因子估算差異解析:3種集成學(xué)習(xí)決策樹模型的比較[J].應(yīng)用生態(tài)學(xué)報(bào),2018,29(6):2007-2016.
OU Q X, LI H K, LEI X D, et al. Difference analysis in estimating biomass conversion and expansion factors of Masson pine in Fujian Province, China based on national forest inventory data: a comparison of three decision tree models of ensemble learning[J]. Chinese Journal of Applied Ecology, 2018, 29(6): 2007-2016.
[14]李博,溫雪巖,徐克生,等.一種改進(jìn)XGboost的DoH流量分類方法[J].哈爾濱理工大學(xué)學(xué)報(bào),2023,28(1):64-72.
LI B, WEN X Y, XU K S, et al. An improved DoH traffic classification method for XGboost[J]. Journal of Harbin University of Science and Technology, 2023, 28(1): 64-72.
[15]李會(huì)朋,胥輝,張超,等.基于隨機(jī)森林模型的云南松天然林生物量遙感估測(cè)[J].西部林業(yè)科學(xué),2022,51(3):60-66,80.
LI H P, XU H, ZHANG C, et al. Remote sensingestimation of Pinus yunnanensis natural forest biomass based on random forest model[J]. Journal of West China Forestry Science, 2022, 51(3): 60-66, 80.
[16]許章華,黃旭影,林璐,等.基于Fisher判別分析與隨機(jī)森林的馬尾松毛蟲害檢測(cè)[J].光譜學(xué)與光譜分析,2018,38(9):2888-2896.
XU Z H, HUANG X Y, LIN L, et al.Dendrolimus punctatus walker damage detection based on fisher discriminant analysis and random forest[J]. Spectroscopy and Spectral Analysis, 2018, 38(9): 2888-2896.
[17]張超,陳暢,徐海清,等.基于XGBoost算法的多云多霧地區(qū)多源遙感作物識(shí)別[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2022,53(4):149-156.
ZHANG C, CHEN C, XU H Q, et al. Multi-source remote sensing crop identification based onXGBoost algorithm in cloudy and foggy area[J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(4): 149-156.
[18]趙琛,許嘉巍,靳英華,等.氣候變化背景下長(zhǎng)白山落葉松毛蟲暴發(fā)氣象因子分析[J].東北師大學(xué)報(bào)(自然科學(xué)版),2022,54(1):141-149.
ZHAO C, XU J W, JIN Y H, et al. Analysis of meteorological factors for outbreak of Larch caterpillar inChangbai Mountains under the background of climate change[J]. Journal of Northeast Normal University (Natural Science Edition), 2022, 54(1): 141-149.
[19]GITELSON A A, MERZLYAK M N, CHIVKUNOVA O B. Optical properties and nondestructive estimation of anthocyanin content in plant leaves[J]. Photochemistry and Photobiology, 2001, 74(1): 38-45.
[20]CHUVIECO E, MARTN M P, PALACIOS A. Assessment of different spectral indices in the red-near-infrared spectral domain for burned land discrimination[J]. International Journal of Remote Sensing, 2002, 23(23): 5103-5110.
[21]GITELSON A A, STARK R, GRITS U, et al. Vegetation and soil lines in visible spectral space: a concept and technique for remote estimation of vegetation fraction[J]. International Journal of Remote Sensing, 2002, 23(13): 2537-2562.
[22]GITELSON A A, ZUR Y, CHIVKUNOVA O B, et al. Assessing carotenoid content in plant leaves with reflectance spectroscopy[J]. Photochemistry and Photobiology, 2002, 75(3): 272-281.
[23]JIANG Z Y, HUETE A R, DIDAN K, et al. Development of a two-band enhanced vegetation index without a blue band[J]. Remote Sensing of Environment, 2008, 112(10): 3833-3845.
[24]NANDY S, SRINET R, PADALIA H. Mapping forest height and aboveground biomass by integrating ICESat-2, Sentinel-1 and Sentinel-2 data using Random Forest algorithm in northwest Himalayan foothills of India[J]. Geophysical Research Letters, 2021, 48(14): e2021GL093799.
[25]DEGERICKX J, ROBERTS D A, MCFADDEN J P, et al. Urban tree health assessment using airborne hyperspectral and LiDAR imagery[J]. International Journal of Applied Earth Observation and Geoinformation, 2018, 73: 26-38.
[26]FRAMPTON W J, DASH J, WATMOUGH G, et al. Evaluating the capabilities of Sentinel-2 for quantitative estimation of biophysical variables in vegetation[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 82: 83-92.
[27]BLACKBURN G A. Quantifying chlorophylls andcaroteniods at leaf and canopy scales[J]. Remote Sensing of Environment, 1998, 66(3): 273-285.
[28]王斌,何丙輝,林娜,等.基于隨機(jī)森林特征選擇的茶園遙感提取[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2022,52(7):1719-1732.
WANG B, HE B H, LIN N, et al. Tea plantation remote sensing extraction based on random forest feature selection[J]. Journal of Jilin University (Engineering and Technology Edition), 2022, 52(7): 1719-1732.