李 瑾 王雷光 鄭 晨 徐偉恒 代沁伶
(1. 西南林業(yè)大學(xué)林學(xué)院,云南 昆明 650233;2. 西南林業(yè)大學(xué)大數(shù)據(jù)與人工智能研究院,云南 昆明 650233;3. 西南林業(yè)大學(xué)森林生態(tài)大數(shù)據(jù)國(guó)家林業(yè)與草原局重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650233;4. 河南大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,河南 開封 475004;5. 西南林業(yè)大學(xué)藝術(shù)與設(shè)計(jì)學(xué)院,云南 昆明 650233)
森林作為地球上可再生資源和陸地生態(tài)系統(tǒng)的主體,對(duì)保持水土,改善環(huán)境,維持生物圈的動(dòng)態(tài)平衡具有重要作用[1-2]。森林分類、識(shí)別和動(dòng)態(tài)監(jiān)測(cè)對(duì)于理解森林生態(tài)系統(tǒng)結(jié)構(gòu)和功能,國(guó)家發(fā)展林業(yè)和制定林業(yè)政策都具有重要意義[3-4]。
森林遙感分類技術(shù)是根據(jù)森林植被在不同波段內(nèi)的光譜等特征,進(jìn)行森林類型、樹種等特征提取和分類識(shí)別的技術(shù)[5]。目前的無(wú)人機(jī)技術(shù)、激光雷達(dá)、高分辨率衛(wèi)星遙感技術(shù)的發(fā)展,使得森林資源遙感監(jiān)測(cè)技術(shù)取得了重大的進(jìn)步[6-8]。采用高光譜數(shù)據(jù)對(duì)林場(chǎng)、縣級(jí)區(qū)域突破了森林類型的分類甚至達(dá)到森林樹種的分類并取得較高的精度[9]。然而,這類數(shù)據(jù)的獲取往往基于機(jī)載或無(wú)人機(jī)平臺(tái),導(dǎo)致數(shù)據(jù)獲取成本昂貴,數(shù)據(jù)時(shí)效性差;另一方面,數(shù)據(jù)的存儲(chǔ)、處理也依賴于計(jì)算性能優(yōu)良但成本昂貴的計(jì)算設(shè)備。
區(qū)域尺度,通常被認(rèn)為面積大于10 km2乃至一個(gè)陸地大小的區(qū)域[10]。隨著Google Earth Engine(GEE)為代表的遙感云計(jì)算平臺(tái)的出現(xiàn),解決了大區(qū)域尺度影像處理的存儲(chǔ)和計(jì)算瓶頸問(wèn)題。目前,GEE 的空間數(shù)據(jù)已超過(guò)29PB,包括超過(guò)290 個(gè)公共數(shù)據(jù)集、500 萬(wàn)景影像,每天增加約4 000 景影像[11]。對(duì)地觀測(cè)衛(wèi)星Sentinel–2 星座的發(fā)射,可免費(fèi)獲得具有豐富光譜信息(13 個(gè)光譜波段)、5 d 重訪周期、較高空間分辨率(10~60 m)的光學(xué)影像,解決了費(fèi)用及時(shí)效性的問(wèn)題。
從技術(shù)上看,已有不少基于Sentinel–2 及時(shí)間序列的分類研究,Ho?ci?o 等[12]采用多時(shí)相Sentinel–2 數(shù)據(jù)與地形信息結(jié)合,在波蘭南部3 800 km2面積實(shí)現(xiàn)了4 種針葉樹種和4 種闊葉樹種的分類,針葉樹種的總體精度達(dá)81.97%,闊葉樹種的總體精度達(dá)89.47%。Persson 等[13]使用多時(shí)相Sentinel–2 數(shù)據(jù),在瑞典中部的15 km2成熟林中實(shí)現(xiàn)了5 種樹種的分類,總體精度達(dá)88.2%。李若楠等[14]基于GEE 平臺(tái)和Landsat 時(shí)間序列,在香格里拉地區(qū)實(shí)現(xiàn)了常綠針葉林、落葉針葉林、常綠闊葉林、落葉闊葉林4 種森林類型的分類。
通過(guò)光學(xué)遙感影像實(shí)現(xiàn)較大區(qū)域的精細(xì)森林類型分類研究少見報(bào)道,究其原因,地理和氣候條件、傳感器重訪周期等條件的限制,導(dǎo)致山區(qū)森林時(shí)間序列遙感數(shù)據(jù)獲取困難。山區(qū)森林的大范圍、精細(xì)分類一直是遙感森林分類研究的一個(gè)熱點(diǎn)和難點(diǎn)[6]。
有鑒于此,擬以云南省迪慶藏族自治州香格里拉市界為研究區(qū),基于GEE 平臺(tái),結(jié)合多時(shí)相Sentinel–2 數(shù)據(jù)和地形因子,在區(qū)域尺度上開展10 m 空間分辨率的森林類型精細(xì)分類研究。云南現(xiàn)有林地中,針葉林占74%[2],分布在廣闊的高原和山地上。迪慶州林木資源豐富,是云南省第一大林區(qū),也是云南省主要的高山針葉林分布地區(qū)。香格里拉市隸屬迪慶州,也是云南省面積最大的縣市級(jí)行政區(qū)域[15],對(duì)其開展多個(gè)層次的分類研究,將為云南省主要森林類型和樹種(組)的識(shí)別和監(jiān)測(cè)提供重要的方法參考。
香格里拉市隸屬迪慶藏族自治州,位于云南省西北部、迪慶州東北部,地理坐標(biāo)為99°20′~100°19′E,26°52′~28°52′N,地處云南亞熱帶常綠闊葉林植被區(qū)向青藏高原高寒植被區(qū)過(guò)渡地帶。南北長(zhǎng)218 km,東西寬88 km,海拔1 478~5 372 m,垂直落差大,平均海拔3 276 m,海拔在3 000 m 以上的雪山有507 座,多年平均氣溫5.4 ℃。地貌形態(tài)有山地、高原、盆地、河谷,總面積11 613 km2,林業(yè)用地占總面積的83.3%,森林覆蓋率74.99%,是云南省主要的高山針葉林分布地區(qū),冷杉(Abies fabri)、云杉(Picea asperata)、鐵杉(Tsuga chinensis)、落葉松(Larix gmelinii)、高山松(Pinus densata)等高山針葉林的總蓄積約占全市活立木總蓄積的86%[16]。
2.1.1 Sentinel–2 數(shù)據(jù)
Sentinel–2 由A、B 2 顆衛(wèi)星組成,是唯一一個(gè)在紅邊范圍包含3 個(gè)波段的數(shù)據(jù)。Immitzer等[17]的研究證實(shí)了Sentinel–2 影像的B2、B3、B4、B5、B6、B7、B8、B8A、B11、B12 這10 個(gè)波段在農(nóng)作物、森林和樹種分類中的適宜性,本研究使用了這10 個(gè)波段,并預(yù)先用QA60 波段去云。遙感影像的選擇,除了考慮云覆蓋的影響,選取影像的日期也一樣重要,選取的多幅影像日期必需接近[18]。獲得的研究區(qū)第1 景地表反射率影像時(shí)間為2018 年12 月14 日,為使得季相上保持連續(xù)性,采用影像時(shí)間區(qū)間為2019 年3 月1 日至2020 年3 月1 日。影像已經(jīng)過(guò)大氣校正,等級(jí)為L(zhǎng)2–A。本研究使用數(shù)據(jù)信息見表1,共514 景影像,每景有不同程度的云覆蓋,沒(méi)有無(wú)云影像。
表1 研究區(qū)影像數(shù)據(jù)Table 1 The image data in study area
研究表明[19-20],GEE 的中值函數(shù)能將時(shí)間序列的多景影像的每個(gè)波段的像素計(jì)算中值合成影像堆棧,且能去除云及陰影的噪聲,去除較亮和較暗的像元,合成質(zhì)量較好的無(wú)云影像。本研究為了構(gòu)建密集的多時(shí)相時(shí)間序列影像,分別用春季的50 景,夏季32 景,秋季56 景、冬季71 景云量低于30%的影像取中值合成春、夏、秋、冬的無(wú)云影像,每季影像10 個(gè)波段。
2.1.2 DEM 數(shù)據(jù)
在研究區(qū)中,森林類型的分布具有垂直分布的特點(diǎn),結(jié)合地形信息能增強(qiáng)森林類型的可分性。高程數(shù)據(jù)SRTM DEM,分辨率30 m,直接從GEE 獲取,并計(jì)算得到坡度、坡向、海拔3 個(gè)波段,分別與四季影像的波段堆疊組合為影像特征集。受益于GEE 運(yùn)算及數(shù)據(jù)管理機(jī)制,Sentinel–2 數(shù)據(jù)和DEM 數(shù)據(jù)自動(dòng)匹配至10 m 分辨率,并通過(guò)內(nèi)嵌的算法統(tǒng)一坐標(biāo),確保每個(gè)像元代表的地理范圍相同。
森林范圍的定義遵循聯(lián)合國(guó)糧農(nóng)組織(FAO)的定義標(biāo)準(zhǔn):樹木高度大于5 m,樹冠覆蓋率超過(guò)10%。本研究將森林以外的類型,如耕地、草地、灌木、水域等其他類型均劃分為非森林類型,不進(jìn)行細(xì)分。依據(jù)《云南森林》[2]的分類單位,參考《云南植被》[21]的分類系統(tǒng),分為森林植被型(針葉林和闊葉林),以及森林類型,主要為8 種針葉優(yōu)勢(shì)樹種,包括柏木(Cupressus funebris)、冷杉、高山松、云杉、云南松(Pinus yunnanensis)、落葉松、華山松(Pinus armandi)、鐵杉。
通過(guò)分層隨機(jī)采樣獲得每個(gè)類別樣本,每層樣本數(shù)據(jù)均是分別各自在小班面數(shù)據(jù)中心內(nèi)生成隨機(jī)點(diǎn),然后對(duì)隨機(jī)點(diǎn)緩沖做成面數(shù)據(jù),通過(guò)空間位置去除與小班交界和接近的面數(shù)據(jù),最后基于Google Earth 高分辨率影像對(duì)面數(shù)據(jù)逐個(gè)進(jìn)行目視判讀。
研究使用的樣本數(shù)據(jù),一共分為3 層。第1 層樣本數(shù)據(jù)用于森林和非森林的分類,通過(guò)Google Earth 高分辨率影像目視解譯獲得,為300 m ×300 m(9 hm2)的面數(shù)據(jù)。第2 層樣本數(shù)據(jù)來(lái)源于2016 年森林資源規(guī)劃設(shè)計(jì)調(diào)查,根據(jù)優(yōu)勢(shì)樹種和小班面積大于0.09 hm2的調(diào)查因子,在小班內(nèi)隨機(jī)生成30 m × 30 m(0.09 hm2)的面數(shù)據(jù),用來(lái)劃分針葉林和闊葉林。第3 層數(shù)據(jù)來(lái)源于2020年森林資源管理圖數(shù)據(jù),根據(jù)優(yōu)勢(shì)樹種、監(jiān)測(cè)地類型為純林和混交林以及小班面積大于0.01 hm2的調(diào)查因子,在小班內(nèi)隨機(jī)生成10 m × 10 m(0.01 hm2)的面數(shù)據(jù)。第2 層和第3 層的面數(shù)據(jù)轉(zhuǎn)為點(diǎn)類型后進(jìn)行實(shí)驗(yàn)用于8 種森林類型分類。
每層樣本數(shù)量見表2,每層隨機(jī)選取50%作為訓(xùn)練樣本,50%作為測(cè)試樣本,訓(xùn)練樣本和測(cè)試樣本各自獨(dú)立不重復(fù)。研究中樣本數(shù)據(jù)生成在線下完成,其余技術(shù)流程在GEE 中在線JavaScript編程完成。
表2 分類體系及樣本數(shù)量Table 2 Classification system and the number of samples
實(shí)驗(yàn)設(shè)計(jì)見表3,采用6 組實(shí)驗(yàn)分別進(jìn)行3 個(gè)層次的分類和精度評(píng)價(jià)。技術(shù)流程見圖1,首先用第1 層樣本劃分森林和非森林,然后以第1 層的森林分類結(jié)果為掩膜使用第2 層樣本劃分針葉林和闊葉林,最后以第2 層的針葉林分類結(jié)果為掩膜用第3 層樣本劃分8 種針葉林森林類型。
表3 實(shí)驗(yàn)設(shè)計(jì)Table 3 Design of classification experiment
圖1 技術(shù)路線Fig. 1 Flowchart of the applied methods
分類器使用隨機(jī)森林(RF)[22],現(xiàn)已被廣泛應(yīng)用于遙感的分類領(lǐng)域[23]。本研究在3 個(gè)層次上展開分類,第2、3 層需使用上一層的分類結(jié)果作為掩膜,采用集成算法的隨機(jī)森林分類器,相較于單一分類器,能最大限度的減少層級(jí)之間的誤差傳遞。該模型參數(shù)較少[24],研究只對(duì)決策樹數(shù)量進(jìn)行設(shè)置。有研究表明[25],在模型參數(shù)缺省或采用默認(rèn)值的情況下,該分類器仍能給出最優(yōu)或接近最優(yōu)的結(jié)果。經(jīng)過(guò)反復(fù)實(shí)驗(yàn),與絕大多數(shù)研究相一致,在計(jì)算可以負(fù)荷的情況下,決策樹的數(shù)量越大越好。研究采用構(gòu)成隨機(jī)森林決策樹的數(shù)量第1 層是100,第2 層是500,第3 層是400,以確保模型能夠收斂。
表4 森林和非森林精度評(píng)價(jià)Table 4 The summary of the accuracy assessment for the forest/non-forest classification
表5 針葉林和闊葉林精度評(píng)價(jià)Table 5 The summary of the accuracy assessment for the needle-leaved forest and broad-leaved forest classification
不同實(shí)驗(yàn)設(shè)計(jì)的針葉林森林類型的分類精度評(píng)價(jià)見表6。在這一層中,無(wú)論是單一時(shí)相還是多時(shí)相,地形信息使各針葉林類型得到更好的分離。3 個(gè)精度評(píng)價(jià)指標(biāo)至少提高5%,實(shí)驗(yàn)5 四季時(shí)相影像與地形信息結(jié)合,總體精度為92.87%,Kappa 系數(shù)為0.918 0,F(xiàn)ˉ1為93.07%,分類制圖結(jié)果見圖2。
圖2 森林類型分類結(jié)果Fig. 2 The classification result of forest type
表6 森林類型精度評(píng)價(jià)Table 6 The summary of the accuracy assessment for the forest type classification
基于實(shí)驗(yàn)5 的森林類型分類混淆矩陣見表7。云杉林、冷杉林和落葉松林相互混淆較多,這3 種森林類型同屬寒溫性針葉林,在海拔分布上一致,云冷杉林是該植被類型的優(yōu)勢(shì)森林類型,落葉松常是云、冷杉林經(jīng)火燒和采伐后恢復(fù)更新的次生林分,因此較容易造成錯(cuò)分。
表7 基于實(shí)驗(yàn)5 的森林類型分類混淆矩陣Table 7 Confusion matrix for the forest type based on experiment 5
森林類型分類面積及其在海拔、坡度、坡向的分布見圖3。由圖3a 可知,面積最大的森林類型冷杉林占比為31.67%、云杉林占比為15.4%、高山松林占比為14.2%、云南松林占比為9.7%,與森林資源監(jiān)測(cè)基本相符,但鐵杉、落葉松林過(guò)分類,云南松林分類不足。鐵杉林在研究區(qū)分布面積不大,但由于其分布在云冷杉林的下方,又常與常綠闊葉林組成針闊混交,群落結(jié)構(gòu)復(fù)雜,呈現(xiàn)出復(fù)層混交林,在本研究中未能呈現(xiàn)理想的分類效果。參照《云南森林》[2]中的8 種森林類型分布的海拔,與本研究分類結(jié)果進(jìn)行比較,如圖3b,柏木林和鐵杉林在生長(zhǎng)海拔的分布上明顯不相符,但冷杉林、高山松林、云杉林、云南松林、落葉松林、華山松林的位置分布基本相符。結(jié)合森林類型分類結(jié)果和DEM 提取各像素點(diǎn)的坡向和坡度,分別從半陽(yáng)坡、陽(yáng)坡、半陰坡、陰坡4 個(gè)坡向統(tǒng)計(jì)了各類型森林面積,由圖3c 可知,各森林類型在4 個(gè)坡向上面積分布相差不大。分別從6 個(gè)坡度類型統(tǒng)計(jì)了森林類型面積,由圖3d 可知,各森林類型主要分布在斜坡、陡坡和緩坡上,面積較大的冷杉林、高山松林、云杉林、落葉松林主要分布在斜坡上,陡坡面積分布次之。
圖3 森林類型分類面積及其在海拔、坡度、坡向的分布圖Fig. 3 Classification area of forest type and its distribution map in elevation, slope and aspect
研究5 結(jié)合四季多時(shí)相影像和地形特征在3 個(gè)層級(jí)中分類精度最高,使用隨機(jī)森林分類器計(jì)算得出實(shí)驗(yàn)5 各層中的特征重要性得分,得分排名見表8。相同的特征在不同分類層中的重要性不同。在第1 層森林和非森林的分類中,冬季紅波段波段(B4_3)排名第1,春季的短波紅外2(B12)排名第2。第2 層針葉林和闊葉林的分類中,秋季的紅邊2 波段(B5_2)排名第1,冬季紅邊2 波段(B5_3)排名第2,由于紅邊波段為Sentinel–2 所特有,實(shí)驗(yàn)驗(yàn)證了Sentinel–2 識(shí)別森林植被的能力。在第3 層針葉林的分類中,光學(xué)影像波段排名第1 的是秋季的藍(lán)波段(B2_2)。結(jié)合植被的光譜曲線,藍(lán)波段是森林類型出現(xiàn)的第1 個(gè)光譜反射峰值,4 個(gè)季相的4 個(gè)藍(lán)波段對(duì)分類的貢獻(xiàn)排名在14 以內(nèi),說(shuō)明同為針葉林,但不同樹種間的葉綠素含量差異較大,對(duì)藍(lán)光的吸收不同。在3 個(gè)層次分類中,地形信息的貢獻(xiàn)度最大,坡度對(duì)森林的分布影響較大,符合人類生產(chǎn)活動(dòng)的足跡。坡度、坡向和海拔對(duì)森林植被型和森林類型影響較大,以滿足植被對(duì)水分、光照的需求。
表8 實(shí)驗(yàn)5 特征重要性得分排名Table 8 The score ranking of feature importance base on experiment 5
續(xù)表8
通過(guò)GEE 云平臺(tái),以香格里拉市為研究區(qū),本研究首先合成了多時(shí)相的Sentinel–2 影像,提取了海拔、坡度、坡向相關(guān)特征,采用隨機(jī)森林分類器,進(jìn)行了3 個(gè)層次的森林場(chǎng)景分類,最終獲得研究區(qū)針葉林森林類型,并進(jìn)行了精度評(píng)價(jià),主要得出以下結(jié)論:
1)Sentinel–2 多時(shí)相影像結(jié)合隨機(jī)森林分類器,能在10 m 空間分辨率下分離森林和森林類型。Sentinel–2 的光譜信息就能識(shí)別森林并達(dá)到95%以上的總體精度,森林類型的總體精度達(dá)87%以上。
2)在3 個(gè)分類層次中,相同特征的重要性排序不同。在森林覆蓋和森林植被層中,光譜的紅邊波段是比較重要的特征,表明了Sentinel–2 影像識(shí)別植被的能力。在森林類型層中,地形特征改善了分類精度,使總體精度提高了5.48%,達(dá)到92.87%。
3)利用GEE 遙感云平臺(tái)獲取和處理Sentinel–2 影像,可以實(shí)現(xiàn)大區(qū)域尺度快速、高精度的森林類型制圖,對(duì)高效監(jiān)測(cè)森林類型的動(dòng)態(tài)變化具有重要作用。
以上研究表明,結(jié)合多時(shí)相的Sentinel–2 影像能在大區(qū)域尺度上實(shí)現(xiàn)森林覆蓋、森林植被類型、森林類型的分類制圖。由于研究區(qū)的森林類型具有垂直分布的特點(diǎn),地形特征能影響森林類型分類的提取,成為光譜信息外最重要的特征。值得注意的是,目前在森林類型的精細(xì)尺度上的研究是較少的。香格里拉地區(qū)氣候類型多變,植被復(fù)雜多樣,地形起伏、云和陰影等因素嚴(yán)重影響地表輻射信號(hào)的傳輸,難以獲得高質(zhì)量的遙感影像,增加了森林類型分類的難度。同時(shí),相比較于其他遙感處理軟件和平臺(tái),GEE 極大提升了遙感影像數(shù)據(jù)的收集能力及運(yùn)算能力。
與其他類型的森林覆蓋、森林類型的分類的研究相比,本研究使用了密集的Sentinel–2 時(shí)間序列影像209 景。研究表明,密集的時(shí)間序列影像數(shù)據(jù)的構(gòu)建,能夠獲得更為豐富的光譜信息,避免因物候和太陽(yáng)角度差異的變化導(dǎo)致的光譜差異[28]。同時(shí),在精細(xì)尺度上的分類研究中,整合密集時(shí)間序列的地表時(shí)間變化特征對(duì)于提高分類精度具有關(guān)鍵作用[29]。
在研究區(qū)中,有林地面積的90.9%為純林[16],這在一定程度上促進(jìn)了森林類型分類精度的提高,使得8 種森林類型的總體分類精度超過(guò)90%。同時(shí),森林結(jié)構(gòu)的異質(zhì)性和林地的高度破碎,很難采集充足或高質(zhì)量的樣本,特別是柏木林、鐵杉林這類不太常見、落葉松林這類占比較小的優(yōu)勢(shì)樹種,研究表明極易發(fā)生誤分類。
采用分層分類進(jìn)行森林類型分類研究,對(duì)地物的提取更加靈活,能提高計(jì)算的效率和精度。然而下一層的結(jié)果極大的依賴于上一層,導(dǎo)致誤差的傳遞不可避免。為了減少這種誤差傳遞,研究在樣本和分類器上做了選擇。樣本方面,3 個(gè)層次的樣本來(lái)源于不同的數(shù)據(jù)源,且第3 層森林類型的樣本與影像年份一致。分類器方面,選擇了隨機(jī)森林,是一個(gè)基于多個(gè)基分類器投票的結(jié)果作為最終分類結(jié)果的集成分類器,相較于單一分類器,結(jié)果更加可靠和穩(wěn)定。
森林的結(jié)構(gòu)是復(fù)雜的,研究?jī)H選取了占比最大的針葉樹種進(jìn)行優(yōu)勢(shì)樹種層的森林類型進(jìn)行分類研究,闊葉林樹種組成的多樣性,植物區(qū)系的豐富性,對(duì)環(huán)境的改造作用等遠(yuǎn)遠(yuǎn)超過(guò)針葉林、竹林和灌木林,是值得研究的重要資源。但由于研究區(qū)中闊葉林的森林類型分布極破碎,樹種雜亂,主要為混交林,沒(méi)有進(jìn)行細(xì)化分類研究。以總面積超過(guò)86%的針葉林作為研究的主要對(duì)象,在大尺度上進(jìn)行區(qū)域規(guī)模的森林類型分類研究,為將來(lái)的闊葉林研究探索更多的可能。