• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      聯(lián)合星載高光譜影像和堆棧集成學(xué)習(xí)回歸算法的紅樹(shù)林冠層葉綠素含量遙感反演

      2022-07-06 07:32:56付波霖鄧良超張麗覃嬌玲劉曼賈明明何宏昌鄧騰芳高二濤范冬林
      遙感學(xué)報(bào) 2022年6期
      關(guān)鍵詞:堆棧植被指數(shù)紅樹(shù)林

      付波霖,鄧良超,張麗,覃嬌玲,劉曼,賈明明,何宏昌,鄧騰芳,高二濤,范冬林

      1.桂林理工大學(xué)測(cè)繪地理信息學(xué)院,桂林 541006;

      2.中國(guó)科學(xué)院空天信息創(chuàng)新研究院,北京 100094;

      3.中國(guó)科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所,長(zhǎng)春 130000

      1 引言

      紅樹(shù)林(Mangrove)主要生長(zhǎng)在熱帶、亞熱帶海岸線潮間帶,由紅樹(shù)植被為主體的常綠灌木和喬木組成耐鹽濕地木本植被群落(Cao等,2018)。紅樹(shù)林具有“海岸腎”功能,有護(hù)堤固灘、防風(fēng)減浪、保護(hù)農(nóng)田、降低鹽害、凈化水質(zhì)、促淤造陸、固碳作用和鳥(niǎo)類(lèi)棲息等生態(tài)價(jià)值。由2019年4月自然資源部、國(guó)家林草局聯(lián)合組織的紅樹(shù)林資源和適宜恢復(fù)地專(zhuān)項(xiàng)調(diào)查結(jié)果表明:廣西壯族自治區(qū)是中國(guó)紅樹(shù)林的重要分布區(qū),紅樹(shù)林總面積為9330.34 ha,占全國(guó)紅樹(shù)林總面積(2.89萬(wàn)ha)的32%,居全國(guó)第二位;廣西壯族自治區(qū)欽州市紅樹(shù)林總面積達(dá)3078.73 ha,占全區(qū)總面積的32.99%,僅次于北海市(4192.78 ha)。病蟲(chóng)害、物種入侵和海區(qū)污染等環(huán)境因素嚴(yán)重威脅著廣西壯族自治區(qū)欽州市紅樹(shù)林的健康生長(zhǎng),CCC 是衡量紅樹(shù)林健康狀況的重要指標(biāo)之一(Wang 等,2019;Ali 等,2020),因此,利用遙感方法進(jìn)行大規(guī)模高精度反演紅樹(shù)林的CCC對(duì)于監(jiān)測(cè)紅樹(shù)林的健康狀況具有重要意義。

      目前,獲取植被生物物理參量的方法主要包括地面測(cè)量方法和遙感反演方法。由于紅樹(shù)林多生長(zhǎng)在含水的泥灘和潮灘上,傳統(tǒng)地面測(cè)量方法耗時(shí)費(fèi)力,且難以對(duì)生物物理參量進(jìn)行大規(guī)模的測(cè)量(Kamal 等,2016),所以亟需一種對(duì)紅樹(shù)林生物物理參數(shù)進(jìn)行高精度估算的遙感方法。Lou等(2021)通過(guò)隨機(jī)森林(RF)回歸模型的參數(shù)優(yōu)化進(jìn)一步提高GF-1 WFV、Landsat 8 OLI 和Sentinel-2 MSI尺度上反演沼澤濕地植被CCC 的精度,其中MSI的反演精度最高,R2為0.79,RMSE為10.96 SPAD。多光譜衛(wèi)星影像光譜分辨率較低,不能充分包含與植被生物物理參量高度相關(guān)的光譜細(xì)節(jié)信息。Wu 等(2010)利用EO-1 Hyperion 高光譜衛(wèi)星數(shù)據(jù)計(jì)算的EVI植被指數(shù)可以表現(xiàn)出適度的抗飽和能力,在估算玉米冠層葉綠素含量中R2達(dá)到0.81。George 等(2018)利用EO-1 Hyperion 高光譜衛(wèi)星數(shù)據(jù)對(duì)印度安達(dá)曼島中紅樹(shù)林CCC 進(jìn)行光譜指數(shù)敏感性評(píng)估,發(fā)現(xiàn)Hyperion 數(shù)據(jù)波譜帶中549 nm、559 nm、702 nm、722 nm、742 nm 和763 nm 對(duì)紅樹(shù)林CCC 最為敏感,比值植被指數(shù)(SR)的相關(guān)性最高,R2為0.75。目前,國(guó)外的高光譜衛(wèi)星數(shù)據(jù)實(shí)現(xiàn)了對(duì)紅樹(shù)林CCC 的有效估算,但國(guó)產(chǎn)珠海一號(hào)高光譜衛(wèi)星數(shù)據(jù)在紅樹(shù)林CCC 反演中的可靠性仍有待進(jìn)一步驗(yàn)證。

      高光譜衛(wèi)星傳感器提供了幾十、上百甚至幾千個(gè)光譜波段(童慶禧等,2016),盡管豐富的光譜信息可以提供植被覆蓋層或葉片的吸收特征更多的細(xì)節(jié)信息,但冗余波段反而會(huì)降低反演精度。Lee 等(2004)和Liu 等(2016)利用機(jī)載高光譜影像估算農(nóng)作物葉面積指數(shù)LAI(Leaf Area Index),論證了使用高相關(guān)性光譜波段和增加對(duì)LAI不敏感的波段,均會(huì)降低模型反演LAI 的準(zhǔn)確性。因此,高光譜影像特征降維在植被生物物理參數(shù)定量反演方面是不可或缺的。目前特征變換(PCA、MNF和ICA等)和特征選擇(REF、OIF和K-means等)算法已成為解決高光譜數(shù)據(jù)中信息冗余問(wèn)題的主要方法(Jain 等,2000)。程志慶等(2015)基于最佳指數(shù)—相關(guān)系數(shù)法選取的高光譜數(shù)據(jù)最佳組合波段(760 nm、1860 nm 和1970 nm),在反演冬小麥葉片葉綠素含量中相較于最佳指數(shù)法和最大相關(guān)系數(shù)法的精度最高(R2=0.827,RMSE=5.44)。最大相關(guān)系數(shù)法方法僅考慮了變量與目標(biāo)值的相關(guān)性,容易忽略其他因素的間接作用,最佳指數(shù)法方法雖能獲得信息量豐富、冗余度小的波段組合,但不能保證所選波段與植被參量之間具有最大相關(guān)性,最佳指數(shù)—相關(guān)系數(shù)法雖然綜合了兩者的優(yōu)點(diǎn),但是無(wú)法定量評(píng)估每個(gè)變量的重要性。Chen 等(2020)基于特征選擇的RF 算法與K 近鄰(KNN)回歸的組合模型(R2=0.834,RMSE=0.824)實(shí)現(xiàn)了玉米LAI 的可靠估計(jì)?;贑ART 的特征選擇方法,可以評(píng)價(jià)每個(gè)變量對(duì)于模型構(gòu)建的貢獻(xiàn)率(Sylvester 等,2018),但是在變量選擇中過(guò)多的數(shù)據(jù)維度會(huì)增加與波長(zhǎng)選擇相關(guān)的信息損失,因此,應(yīng)先采用保持特征與目標(biāo)值之間最大相關(guān)性的數(shù)據(jù)降維方法最大程度降低數(shù)據(jù)的維度,再進(jìn)行特征重要性評(píng)價(jià)。目前在植被生物物理參數(shù)的反演中,綜合最大相關(guān)系數(shù)法與基于CART模型的特征選擇方法應(yīng)用于高光譜數(shù)據(jù)降維,提升模型反演精度的可能性仍有待進(jìn)一步驗(yàn)證。

      目前遙感反演植被生物物理參數(shù)的經(jīng)驗(yàn)統(tǒng)計(jì)回歸模型主要分為簡(jiǎn)單線性和非線性回歸模型。為了探究多種植被指數(shù)反演葉片葉綠素a 含量LCC(Leaf Chlorophyll-a Content)的可行性,Zhen 等(2021)基于4 個(gè)時(shí)期的Sentinel-2 衛(wèi)星數(shù)據(jù),得到單波段反射率與兩波段反射率之和比值指數(shù)(RSSI)的線性回歸模型反演LCC 的調(diào)整R2為0.496、 0.742、 0.681 和0.801, RMSE 為5.75、4.29、4.00 和3.46 SPAD,優(yōu)于傳統(tǒng)波段指數(shù)的核嶺回歸(KRR)模型。線性回歸模型可以有效降低反演過(guò)程中的不確定性(Lin 和Lin,2019),但對(duì)于非線性或特征間具有高相關(guān)性的數(shù)據(jù),線性回歸模型難以建模。為了準(zhǔn)確估計(jì)紅樹(shù)林地區(qū)的LAI 指數(shù),Zhu 等(2017)利用人工神經(jīng)網(wǎng)絡(luò)(ANN)回歸、支持向量機(jī)(SVM)回歸和RF 回歸模型探討WorldView-2影像紅邊波段計(jì)算的植被指數(shù)對(duì)紅樹(shù)林LAI 的敏感性,結(jié)果表明RF 回歸模型的估算精度最高(RMSE=0.45),SVM 回歸模型的估算精度(RMSE=0.51)低于另外兩種反演模型。機(jī)器學(xué)習(xí)回歸算法可以平衡數(shù)據(jù)集的誤差,容易并行化,模型泛化能力比較強(qiáng)。非線性回歸模型能較好地解釋生物物理參數(shù)與模型參數(shù)之間的關(guān)系(唐少飛等,2020),但如果單一回歸模型的預(yù)測(cè)誤差都比較低,則經(jīng)常需要權(quán)衡模型的平衡性與準(zhǔn)確性(Christensen,2003)。Ghosh 等(2021)在估算富含碳的印度紅樹(shù)林地上生物量(AGB)時(shí),采用多時(shí)相圖像堆棧數(shù)據(jù)集和單一RF回歸模型估算AGB 的RMSE 為74.493 t/ha,優(yōu)于單個(gè)數(shù)據(jù)集(RMSE=151.149 t/ha),多時(shí)相圖像堆棧數(shù)據(jù)集中采用堆棧算法反演AGB 的精度得到了進(jìn)一步的提高,RMSE 為72.864 t/ha,集成回歸模型可以集成不同算法的預(yù)測(cè)結(jié)果,并產(chǎn)生更穩(wěn)健的估算結(jié)果。基于堆棧的集成回歸算法可以集成多種基礎(chǔ)回歸模型,并且在回歸預(yù)測(cè)上提供更好的泛化能力(Dietterich,2000)。目前,利用基于堆棧的集成學(xué)習(xí)回歸模型反演紅樹(shù)林CCC 還有待深入研究。

      綜上所述,為了實(shí)現(xiàn)北部灣紅樹(shù)林CCC 高精度遙感反演,本文主要研究?jī)?nèi)容如下:(1)構(gòu)建紅樹(shù)林CCC 反演多維特征數(shù)據(jù)集,并利用最大相關(guān)系數(shù)法與基于CART模型的特征選擇方法對(duì)紅樹(shù)林高維特征數(shù)據(jù)集降維處理;(2)構(gòu)建單一線性回歸、機(jī)器學(xué)習(xí)回歸模型與堆棧集成學(xué)習(xí)回歸模型反演紅樹(shù)林CCC,并驗(yàn)證單一線性回歸、機(jī)器學(xué)習(xí)回歸模型與堆棧集成學(xué)習(xí)回歸模型反演紅樹(shù)林CCC 的精度;(3)驗(yàn)證珠海一號(hào)高光譜衛(wèi)星和Sentinel-2A數(shù)據(jù)反演紅樹(shù)林CCC的適用性,并對(duì)比兩種數(shù)據(jù)源反演紅樹(shù)林CCC的精度差異;(4)評(píng)估SNAP-SL2P 算法反演紅樹(shù)林CCC 的適用性,并定量分析SNAP-SL2P 算法與最優(yōu)回歸模型估算紅樹(shù)林CCC的精度差異。

      2 研究區(qū)概況與數(shù)據(jù)源

      2.1 研究區(qū)概況

      研究區(qū)位于廣西北部灣大風(fēng)江沿岸(圖1(a))的欽州市犀牛腳鎮(zhèn)蘇屋村(圖1(b))和沙角村(圖1(c))。地理坐標(biāo)為21°37′00″N—21°38′20″N,108°48′15″E—108°52′15″E,屬于亞熱帶季風(fēng)型海洋性氣候。欽州市的夏季長(zhǎng)達(dá)6個(gè)月之久,全年平均氣溫為22℃,年均降水量達(dá)2104.2 mm,相對(duì)濕度為81%,夏秋兩季是濕熱多雨的季節(jié),為紅樹(shù)林的生長(zhǎng)提供了溫暖舒適的環(huán)境。研究區(qū)內(nèi)紅樹(shù)林總面積約為2.41 km2,主要分布著3 類(lèi)樹(shù)種:白骨壤、桐花樹(shù)和秋茄,其中白骨壤分布面積最大。根據(jù)實(shí)地采集數(shù)據(jù)計(jì)算白骨壤的平均高度為1.81 m,平均冠幅為4.30 m2;桐花樹(shù)平均高度為1.41 m,平均冠幅為0.93 m2;秋茄的平均樹(shù)高為0.84 m,平均冠幅為1.25 m2,樹(shù)高和冠幅的優(yōu)勢(shì)使得白骨壤成為該地區(qū)的優(yōu)勢(shì)種群。研究區(qū)內(nèi)的紅樹(shù)林主要經(jīng)受外灘互花米草的入侵和病蟲(chóng)害的脅迫。因此,利用遙感手段對(duì)紅樹(shù)林CCC 進(jìn)行大規(guī)模高精度的估算,對(duì)紅樹(shù)林的監(jiān)測(cè)和保護(hù)有著重要意義。

      圖1 研究區(qū)位置及實(shí)測(cè)點(diǎn)分布Fig.1 The location of the study area and the distribution of filed measurements

      2.2 珠海一號(hào)高光譜衛(wèi)星數(shù)據(jù)及預(yù)處理

      珠海一號(hào)高光譜衛(wèi)星(OHS)采用推掃模式單次拍攝影像成像,搭載CMOSMSS 傳感器,影像空間分辨率為10 m,光譜分辨率為2.5 nm,波段數(shù)為32 個(gè),波長(zhǎng)范圍為400—1000 nm。本文OHS數(shù)據(jù)下載網(wǎng)址為:https://www.obtdata.com/,獲取影像時(shí)間為2021年1月12日,產(chǎn)品級(jí)別為L(zhǎng)1 級(jí),整景影像云量為1%,研究區(qū)內(nèi)無(wú)云覆蓋。OHS 數(shù)據(jù)文件中包括32 個(gè)光譜波段的tif 格式的文件與其對(duì)應(yīng)的用于正射校正的RPC文件。

      OHS 數(shù)據(jù)預(yù)處理的流程如下:(1)分別利用ENVI 5.6 軟件下的Radiometric Calibration、FLAASH Atmospheric Correction 模塊進(jìn)行輻射定標(biāo)和大氣校正;(2)利用ENVI 5.6軟件的RPC Orthorectification Workflow 模塊和GMTED2010.jp2 DEM 數(shù)據(jù)進(jìn)行無(wú)控制點(diǎn)正射校正;(3)利用GNSS RTK 的控制點(diǎn)進(jìn)行影像配準(zhǔn),在ENVI 5.6 的Registration:Image to Map 模塊中生成WGS_1984_UTM_Zone_49N 坐標(biāo)系的影像,配準(zhǔn)誤差RMSE為0.42,并進(jìn)行裁剪。

      2.3 Sentinel-2A數(shù)據(jù)及預(yù)處理

      哨兵2 號(hào)(Sentinel-2)為多光譜成像衛(wèi)星,本文下載Sentinel-2A 數(shù)據(jù)的網(wǎng)址為:https://earthexplorer.usgs.gov/,獲取時(shí)間為2021年2月19日,產(chǎn)品級(jí)別為L(zhǎng)1C 級(jí),整幅影像云量為0.319%,研究區(qū)上空無(wú)云層覆蓋,需要進(jìn)行輻射定標(biāo)、大氣校正及重采樣等預(yù)處理。

      Sentinel-2A數(shù)據(jù)處理過(guò)程為:(1)使用Sen2Cor v2.8 軟件進(jìn)行輻射定標(biāo)和大氣校正;(2)利用SNAP 軟件下的S2 Resampling Processor 工具將所有波段重采樣成10 m 空間分辨率的影像;(3)利用GNSS RTK 的控制點(diǎn)進(jìn)行影像配準(zhǔn),在ENVI 5.6的Registration:Image to Map 模塊中生成WGS_1984_UTM_Zone_49N 坐標(biāo)系的影像,配準(zhǔn)誤差RMSE為0.58,并進(jìn)行裁剪。

      2.4 紅樹(shù)林LAI及LCC實(shí)地測(cè)量

      本次實(shí)測(cè)數(shù)據(jù)采集時(shí)間是2021年1月8日至2021年4月6日,一共采集了219個(gè)10 m×10 m的樣方,紅樹(shù)林CCC由LCC與LAI的乘積得到(Gitelson等,2005)。本文利用LAI-2200 Plant Canopy Analyzer 儀器測(cè)量紅樹(shù)林的LAI 數(shù)據(jù),利用Chlorophyll Meter SPAD-502 Plus 儀器測(cè)量紅樹(shù)林葉片的LCC 數(shù)據(jù),并用中海達(dá)V90 GNSS RTK 記錄采集地面點(diǎn)的地理位置。為了高精度地反演紅樹(shù)林CCC,10 m×10 m 的地面實(shí)測(cè)樣方盡量均勻分布整個(gè)研究區(qū)(圖1),采集數(shù)據(jù)見(jiàn)表1。研究區(qū)內(nèi)白骨壤、桐花樹(shù)及秋茄中LAI的數(shù)值范圍分別為0.75—2.83、1.62—4.03和1.44—2.72;白骨壤、桐花樹(shù)及秋茄中LCC的數(shù)值范圍分別為36.60—58.00 μg/cm2、40.40—57.00 μg/cm2和56.40—66.00 μg/cm2。

      表1 研究區(qū)內(nèi)地面實(shí)測(cè)的LAI和LCC數(shù)據(jù)統(tǒng)計(jì)Table 1 Statistics of LAI and LCC values derived from field measurements in the study area

      3 紅樹(shù)林CCC遙感反演方法

      3.1 多源數(shù)據(jù)集生成與統(tǒng)計(jì)檢驗(yàn)

      3.1.1 植被指數(shù)與組合植被指數(shù)計(jì)算

      OHS 及Sentinel-2A 數(shù)據(jù)預(yù)處理后,影像的DN值轉(zhuǎn)換成了地面物體實(shí)際的反射率信息,提取后的反射率信息用于計(jì)算植被指數(shù)與組合植被指數(shù)。本文通過(guò)ENVI 5.6 軟件的Band Math 工具分別計(jì)算了OHS 和Sentinel-2A 數(shù)據(jù)的10 種傳統(tǒng)植被指數(shù),具體類(lèi)型及公式見(jiàn)表2。

      表2 OHS和Sentinel-2A影像傳統(tǒng)植被指數(shù)的計(jì)算Table 2 Calculation of traditional vegetation indices from OHS and Sentinel-2A images

      為了獲取更為豐富的光譜信息,本文在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件的math 標(biāo)準(zhǔn)庫(kù)分別計(jì)算OHS 和Sentinel-2A 數(shù)據(jù)的組合植被指數(shù)(具體計(jì)算見(jiàn)式(1)、式(2)和式(3)),主要包括差值光譜指數(shù)DSI (Difference Spectral Index)、比值光譜指數(shù)RSI(Ratio Spectral Index)和歸一化差值植被指數(shù)NDSI(Normalized difference spectral index)(Wang等,2017;張亞坤等,2018)。OHS 影像有32 個(gè)波段共計(jì)算了1488 個(gè)組合植被指數(shù);Sentinel-2A數(shù)據(jù)有12個(gè)波段共計(jì)算了198個(gè)組合植被指數(shù)。綜合植被指數(shù)和組合植被指數(shù),OHS數(shù)據(jù)一共獲得了1498 個(gè)特征變量,Sentinel-2A 數(shù)據(jù)一共得到了208個(gè)特征變量。

      式中,λ1、λ2是OHS 數(shù)據(jù)或Sentinel-2A 數(shù)據(jù)中任意的兩個(gè)波段,ρλ1、ρλ2分別是λ1、λ2對(duì)應(yīng)兩個(gè)波段的紅樹(shù)林冠層反射率值。

      3.1.2 數(shù)據(jù)集正態(tài)分布檢驗(yàn)

      本文以7.3∶2.7 的比例隨機(jī)選取159 個(gè)地面實(shí)測(cè)點(diǎn)作為模型訓(xùn)練數(shù)據(jù)集,60 個(gè)點(diǎn)作為驗(yàn)證數(shù)據(jù)集,地面實(shí)測(cè)CCC數(shù)據(jù)作為目標(biāo)值(target),植被指數(shù)和組合植被指數(shù)作為特征變量。本文在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件的概率密度函數(shù)對(duì)特征變量測(cè)試集與訓(xùn)練集的進(jìn)行正態(tài)分布檢驗(yàn),OHS 與Sentinel-2A 數(shù)據(jù)符合正態(tài)分布的植被指數(shù)以及組合植被指數(shù)如圖2 和圖3所示。OHS 和Sentinel-2A 數(shù)據(jù)的傳統(tǒng)植被指數(shù)和組合植被指數(shù)均滿(mǎn)足正態(tài)分布,而OHS 與Sentinel-2A 數(shù)據(jù)MCARI、TCARI 與MCARI/OSAVI 的訓(xùn)練集與測(cè)試集正態(tài)分布性相對(duì)較差。

      圖2 OHS數(shù)據(jù)中符合正態(tài)分布的植被指數(shù)與組合植被指數(shù)Fig.2 Vegetation indices and combining vegetation indices conforming to normal distributions in OHS data

      圖3 Sentinel-2A數(shù)據(jù)中符合正態(tài)分布的植被指數(shù)與組合植被指數(shù)Fig.3 Vegetation indices and combining vegetation indices conforming to normal distributions in Sentinel-2A data

      3.2 特征降維無(wú)量綱化最優(yōu)數(shù)據(jù)集生成

      3.2.1 最大相關(guān)系數(shù)法降維

      高光譜數(shù)據(jù)進(jìn)行植被指數(shù)與組合植被指數(shù)計(jì)算產(chǎn)生了冗余的特征變量,增加了算法的時(shí)間復(fù)雜度,通過(guò)最大相關(guān)系數(shù)法可以減少冗余信息同時(shí)保留與目標(biāo)值相關(guān)性最高的特征變量。在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件的Corr 函數(shù)繪制熱力圖,判斷特征數(shù)據(jù)與目標(biāo)數(shù)據(jù)的相關(guān)性,植被指數(shù)與部分組合植被指數(shù)的熱力圖如圖4和圖5所示。在OHS 與Sentinel-2A 數(shù)據(jù)中,組合植被指數(shù)與紅樹(shù)林CCC 的相關(guān)性比植被指數(shù)略高。OHS 數(shù)據(jù)計(jì)算的DSI(6,12)與紅樹(shù)林CCC 的相關(guān)性最高,Corr 為-0.743。Sentinel-2A 數(shù)據(jù)相關(guān)性最高的指數(shù)為NDSI(2,4),Corr 為-0.720。OHS 數(shù)據(jù)MCARI 指數(shù)與目標(biāo)值的Corr 為0.633 大于0.5,而Sentinel-2A數(shù)據(jù)的相關(guān)系數(shù)為0.462,Corr小于0.5。傳統(tǒng)植被指數(shù)中MTCI、TCARI、TCARI/OSAVI 和MCARI/OSAVI 與目標(biāo)值的相關(guān)性最低,相關(guān)系數(shù)(Corr)均小于0.5,需要剔除這4 種植被指數(shù)。在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件feature_selection 庫(kù)的SelectKBest 類(lèi)結(jié)合相關(guān)系數(shù)來(lái)選擇與目標(biāo)值相關(guān)性高的特征變量。經(jīng)過(guò)最大相關(guān)系數(shù)法降維,OHS 數(shù)據(jù)由1498 個(gè)特征變量減少到11 個(gè),Sentinel-2A 數(shù)據(jù)由原始的208 個(gè)特征變量減少到11個(gè)。

      圖4 OHS數(shù)據(jù)特征變量與目標(biāo)值之間相關(guān)性熱力圖Fig.4 Heat map of correlation between feature variables and target values in OHS data

      圖5 Sentinel-2A數(shù)據(jù)特征變量與目標(biāo)值之間相關(guān)性熱力圖Fig.5 Heat map of correlation between feature variables and target values in Sentinel-2A data

      3.2.2 基于XGBoost算法的特征選擇降維

      通過(guò)梯度提升算法在紅樹(shù)林CCC 反演方法中獲取特征變量的重要性得分,對(duì)于重要的特征按重要性得分賦予相應(yīng)的權(quán)重帶入到回歸器中。通過(guò)使損失函數(shù)最小化的策略來(lái)確定下一棵梯度提升算法的決策樹(shù)的參數(shù)θk,梯度提升算法的表達(dá)式見(jiàn)式(4)。

      式中,θk為第k個(gè)紅樹(shù)林CCC 特征變量基學(xué)習(xí)器的參數(shù),L(yi,fk(xi))為假設(shè)的紅樹(shù)林CCC 特征變量提升樹(shù)算法的損失函數(shù),M為紅樹(shù)林CCC 特征變量訓(xùn)練集的個(gè)數(shù)。

      將兩種數(shù)據(jù)源最大相關(guān)系數(shù)法降維后的11 個(gè)特征變量輸入到極端梯度提升(XGBoost)算法中,在Tensorflow 2.0 環(huán)境下利用Python 3.7 軟件的feature_importance 函數(shù)輸出每個(gè)特征變量的重要性得分,輸出結(jié)果如圖6 和表3所示。本文經(jīng)過(guò)基于XGBoost 算法的特征選擇降維,OHS 和Sentinel-2A數(shù)據(jù)均得到8個(gè)最優(yōu)特征變量。OHS數(shù)據(jù)特征變量重要性得分最高的是RSI(12,17),得分為18,NDVI的重要性得分最低,得分為6;Sentinel-2A 數(shù)據(jù)中特征變量重要性得分最高的是EVI,得分為25,重要性得分最低的是EVI2 與RSI(4,8A),重要性得分均為1 (圖6)。說(shuō)明OHS 數(shù)據(jù)的RSI(12,17)及Sentinel-2A 數(shù)據(jù)的EVI 對(duì)紅樹(shù)林CCC 更敏感,而OHS 數(shù)據(jù)的NDVI 與Sentinel-2A 數(shù)據(jù)的EVI2 和RSI(4,8A)對(duì)預(yù)測(cè)結(jié)果的影響較小。

      圖6 基于XGBoost 算法的特征選擇和數(shù)據(jù)降維結(jié)果Fig.6 Feature selection and dimensionality reduction for OHS and Sentinel-2A data using XGBoost algorithm

      3.2.3 無(wú)量綱化數(shù)據(jù)集生成

      為了消除特征變量與目標(biāo)值數(shù)值之間因數(shù)量級(jí)不同而產(chǎn)生的不具可比性,本文對(duì)特征變量與目標(biāo)值進(jìn)行無(wú)量綱化。對(duì)特征變量進(jìn)行歸一化處理,保留原始數(shù)據(jù)的特征,提高訓(xùn)練算法的收斂性能;對(duì)目標(biāo)值進(jìn)行指數(shù)轉(zhuǎn)換以提高目標(biāo)值的正態(tài)分布性。對(duì)OHS 和Sentinel-2A 數(shù)據(jù)的8 個(gè)最優(yōu)特征變量及目標(biāo)值進(jìn)行無(wú)量綱化處理,結(jié)果如表3所示。

      表3 OHS與Sentinl-2A數(shù)據(jù)最優(yōu)特征變量及無(wú)量綱化統(tǒng)計(jì)結(jié)果Table 3 Optimal feature variables and non-dimensional statistical results in OHS and Sentinl-2A data

      3.3 紅樹(shù)林CCC反演方法與精度評(píng)估指標(biāo)

      為了論證不同回歸模型對(duì)紅樹(shù)林CCC 反演的適用性,實(shí)現(xiàn)紅樹(shù)林CCC 高精度估算。本文利用OHS 和Sentinel-2A 數(shù)據(jù)無(wú)量綱化處理后的8 個(gè)最優(yōu)特征變量及目標(biāo)值,嘗試構(gòu)建了3種簡(jiǎn)單一元線性回歸模型、4 種單一機(jī)器學(xué)習(xí)回歸模型和7 種堆棧集成學(xué)習(xí)回歸模型。

      3.3.1 構(gòu)建紅樹(shù)林CCC反演線性回歸模型

      線性回歸模型反演構(gòu)建過(guò)程中主要涉及模型參數(shù)調(diào)優(yōu),使用的策略是最小化損失函數(shù),線性回歸模型的損失函數(shù)見(jiàn)式(5),線性回歸模型的參數(shù)調(diào)優(yōu)問(wèn)題采用梯度下降法求解,對(duì)損失函數(shù)求偏導(dǎo),其表達(dá)式見(jiàn)式(6)。

      式中,w為各個(gè)紅樹(shù)林CCC特征變量特征權(quán)重組成的系數(shù)向量,b為偏置常數(shù),M為紅樹(shù)林CCC 訓(xùn)練集的個(gè)數(shù),h(xi;w;b)是對(duì)輸入紅樹(shù)林CCC 訓(xùn)練數(shù)據(jù)xi的預(yù)測(cè)函數(shù),yi是紅樹(shù)林CCC 訓(xùn)練數(shù)據(jù)xi的實(shí)測(cè)值。

      本文采用套索算法(Lasso)回歸、嶺回歸(Ridge)及彈性網(wǎng)絡(luò)(ElasticNet)線性回歸模型反演紅樹(shù)林CCC,利用網(wǎng)格搜索方法進(jìn)行參數(shù)調(diào)優(yōu)。經(jīng)過(guò)網(wǎng)格搜索,將Lasso 模型參數(shù)正規(guī)化項(xiàng)前的常數(shù)調(diào)節(jié)因子(alpha)設(shè)置為0.00098;Ridge模型的alpha設(shè)為0.25;ElasticNet模型的alpha設(shè)為0.0001,最大迭代次數(shù)(max_iter)設(shè)為100000。

      3.3.2 構(gòu)建紅樹(shù)林CCC反演機(jī)器學(xué)習(xí)回歸模型

      本文采用KNN 回歸模型、RF 回歸模型、梯度提升回歸樹(shù)(GBRT)模型和XGBoost 回歸模型反演紅樹(shù)林CCC。KNN 回歸算法采用K個(gè)最近鄰多數(shù)投票的思想,在給定的距離度量下,最近的K個(gè)樣本的輸出平均值作為回歸預(yù)測(cè)值;RF回歸模型、GBRT 回歸模型和XGBoost 回歸模型均為集成機(jī)器學(xué)習(xí)算法,其中RF 回歸模型以決策樹(shù)為基學(xué)習(xí)器構(gòu)建Bagging 集成的基礎(chǔ)上,引入隨機(jī)特征選擇構(gòu)建決策樹(shù)進(jìn)行回歸預(yù)測(cè);GBRT 回歸模型是基于Boosting 基學(xué)習(xí)器的回歸算法,利用損失函數(shù)的負(fù)梯度(梯度下降法)在前項(xiàng)模型的值作為當(dāng)前提升樹(shù)算法中殘差的近似值,擬合決策樹(shù)進(jìn)行回歸預(yù)測(cè);XGBoost 回歸模型是在GBRT 基礎(chǔ)上改進(jìn)而來(lái),在損失函數(shù)中增加了正則化項(xiàng)。

      機(jī)器學(xué)習(xí)回歸模型參數(shù)調(diào)優(yōu)的策略是最小化損失函數(shù),機(jī)器學(xué)習(xí)回歸模型的優(yōu)化問(wèn)題采用梯度下降法求解,分別見(jiàn)式(7)和式(8)。

      式中,w為各個(gè)紅樹(shù)林CCC最優(yōu)特征變量特征權(quán)重組成的系數(shù)向量,b為偏置常數(shù),M為紅樹(shù)林CCC訓(xùn)練數(shù)據(jù)的個(gè)數(shù),f(xi)是建立的模型對(duì)紅樹(shù)林CCC測(cè)試集的預(yù)測(cè)函數(shù),yi是紅樹(shù)林CCC訓(xùn)練數(shù)據(jù)xi的實(shí)測(cè)值。

      利用網(wǎng)格搜索方法確定機(jī)器學(xué)習(xí)回歸模型的最優(yōu)參數(shù),設(shè)置KNN 模型的鄰近點(diǎn)個(gè)數(shù)(n_neighbors)為10;設(shè)置RF 模型的決策樹(shù)個(gè)數(shù)(n_estimators)為250,設(shè)置內(nèi)部節(jié)點(diǎn)在劃分時(shí)所需的最小樣本(min_samples_split)為4;設(shè)置GBRT模型的n_estimators=150,設(shè)置決策樹(shù)最大深度(max_depth)為1,設(shè)置min_samples_split=5;設(shè)置XGBoost模型的n_estimators=100,max_depth=1。

      3.3.3 構(gòu)建紅樹(shù)林CCC反演堆棧集成學(xué)習(xí)回歸模型

      堆棧集成學(xué)習(xí)回歸模型是采用K折交叉驗(yàn)證單一回歸模型并輸出預(yù)測(cè)結(jié)果,將每個(gè)模型輸出的預(yù)測(cè)結(jié)果合并為新的特征(New Feature),并利用新的模型加以訓(xùn)練的回歸模型。堆棧集成學(xué)習(xí)回歸模型本質(zhì)上是一種分層結(jié)構(gòu),第1 層循環(huán)控制基模型的數(shù)目,第2層循環(huán)控制的是交叉驗(yàn)證的次數(shù)K,其原理為:(1)輸入7 個(gè)單一回歸模型,對(duì)已有的數(shù)據(jù)集進(jìn)行K 折交叉驗(yàn)證;(2)K折交叉驗(yàn)證訓(xùn)練集,對(duì)每折輸出的結(jié)果保存、合并;(3)通過(guò)每一次訓(xùn)練模型,對(duì)整個(gè)測(cè)試集進(jìn)行預(yù)測(cè),2 折交叉驗(yàn)證后,將這兩列求平均值得到Test1。(4)每一個(gè)基模型訓(xùn)練K次,拼接得到預(yù)測(cè)結(jié)果Predictions,最優(yōu)堆棧集成學(xué)習(xí)回歸模型的結(jié)構(gòu)及原理如圖7所示。

      圖7 堆棧集成學(xué)習(xí)回歸模型原理結(jié)構(gòu)圖Fig.7 Principal structure diagram of stacking ensemble regression model

      堆棧集成學(xué)習(xí)回歸的主要過(guò)程:(1)利用Python邏輯語(yǔ)句對(duì)單一線性回歸及機(jī)器學(xué)習(xí)回歸算法中模型精度最高的模型結(jié)果進(jìn)行優(yōu)選;(2)網(wǎng)格搜索后,設(shè)置Lasso 回歸模型的alpha=0.0001;設(shè)置Ridge 模型的alpha=5.75;設(shè)置ElasticNet 模型的alpha=0.0009,max_iter=100000;設(shè)置KNN模型的n_neighbors=3;設(shè)置RF 模型的n_estimators=100,劃分考慮最大特征數(shù)(max_features)為5,min_samples_split=4;設(shè)置GBRT 模型的n_estimators=250,max_depth=2,min_samples_split=7;設(shè)置XGBoost模型的n_estimators=100,max_depth=2。

      堆棧集成學(xué)習(xí)回歸模型可以集成單一線性回歸、機(jī)器學(xué)習(xí)回歸模型等許多基礎(chǔ)回歸模型,產(chǎn)生更穩(wěn)健的估算結(jié)果,在反演過(guò)程中提供更好的泛化能力。

      利用SNAP 軟件神經(jīng)網(wǎng)絡(luò)簡(jiǎn)化的L2 級(jí)產(chǎn)品原型處理器SNAP-SL2P (Simplified level2 product prototype processor)算法對(duì)Sentinel-2A 數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)LCC 與LAI 的有效估算。SNAP-SL2P算法反演紅樹(shù)林CCC 的過(guò)程:(1)進(jìn)行輻射定標(biāo)、大氣校正與重采樣等預(yù)處理:(2)利用SNAP 軟件下的Biophysical Processor S2 模塊生成LAI、LCC兩個(gè)單波段影像;(3)將LCC 與LAI 兩個(gè)單波段影像與Sentinel-2A 影像的其他波段進(jìn)行圖層疊加和配準(zhǔn)。紅樹(shù)林CCC 反演的技術(shù)路線圖如圖8所示。

      3.3.5 精度評(píng)估指標(biāo)

      本文為了驗(yàn)證上述3 種反演方法估算紅樹(shù)林CCC 的精度,利用模型得分、均方根誤差及決定系數(shù)等精度評(píng)估指標(biāo)進(jìn)行精度估計(jì)。

      模型得分(Score)可以有效評(píng)估不同估算模型預(yù)測(cè)紅樹(shù)林CCC 的準(zhǔn)確率,有助于篩選出預(yù)測(cè)精度較優(yōu)的紅樹(shù)林CCC 反演方法,Score 數(shù)值在[-1,1]之間(式(9)),Score值越大表示模型的預(yù)測(cè)精度越高。

      式中,n為輸入紅樹(shù)林CCC 訓(xùn)練數(shù)據(jù)集的個(gè)數(shù),yi表示紅樹(shù)林CCC 訓(xùn)練集xi的實(shí)測(cè)值,為測(cè)試集xi對(duì)應(yīng)的紅樹(shù)林CCC 反演方法的預(yù)測(cè)值,為測(cè)試集中對(duì)應(yīng)的紅樹(shù)林CCC實(shí)測(cè)值yi的平均值。

      均方根誤差(RMSE)可以表征預(yù)測(cè)值與實(shí)測(cè)值的曲線的擬合程度,用來(lái)衡量模型預(yù)測(cè)的準(zhǔn)確程度,RMSE 值越小,預(yù)測(cè)精度越高。RMSE 的表達(dá)式見(jiàn)式(10)(Inoue等,2016)。

      式中,n為輸入紅樹(shù)林CCC 訓(xùn)練集或測(cè)試集的個(gè)數(shù),為紅樹(shù)林CCC 反演方法的預(yù)測(cè)值,yi為紅樹(shù)林CCC的實(shí)測(cè)值。

      學(xué)術(shù)立場(chǎng)和觀點(diǎn)的分歧源于城市小區(qū)治理實(shí)踐的矛盾,而治理實(shí)踐的矛盾根源在于,隨著中國(guó)商品房制度改革以及由此帶來(lái)的城市小區(qū)居住空間結(jié)構(gòu)的變化、社會(huì)交往關(guān)系的變化、基于物權(quán)的權(quán)利關(guān)系及權(quán)利意識(shí)的變化等一系列現(xiàn)實(shí)和觀念的變化,國(guó)家對(duì)這些變化的認(rèn)識(shí)和制度調(diào)整卻相對(duì)滯后。對(duì)小區(qū)內(nèi)部出現(xiàn)的新的經(jīng)濟(jì)社會(huì)關(guān)系及其治理邏輯的辨識(shí),有助于推動(dòng)當(dāng)前城市小區(qū)治理走出困境。

      決定系數(shù)(R2)用來(lái)表示回歸曲線與實(shí)測(cè)值的擬合程度,R2數(shù)值在[0,1],R2越大表示擬合結(jié)果越好。R2的表達(dá)式見(jiàn)式(11)(Pham等,2021)。

      式中,n為輸入紅樹(shù)林CCC 測(cè)試集的個(gè)數(shù),是紅樹(shù)林CCC 反演方法的預(yù)測(cè)值,yi為紅樹(shù)林CCC 的實(shí)測(cè)值,為輸入紅樹(shù)林CCC測(cè)試集的均值。

      為了評(píng)估各回歸模型反演紅樹(shù)林CCC 的性能,模型訓(xùn)練中,從劃分的159 個(gè)訓(xùn)練集中隨機(jī)抽取70%(111 個(gè)點(diǎn))作為模型訓(xùn)練的訓(xùn)練數(shù)據(jù),其對(duì)應(yīng)的target 數(shù)據(jù)集中的111 個(gè)點(diǎn)作為模型訓(xùn)練的驗(yàn)證數(shù)據(jù),利用3 種單一線性回歸模型、4 種單一機(jī)器學(xué)習(xí)回歸模型及7種堆棧集成學(xué)習(xí)回歸模型對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行擬合,輸出對(duì)應(yīng)訓(xùn)練數(shù)據(jù)的各回歸器擬合曲線上的擬合值,將擬合值與驗(yàn)證數(shù)據(jù)進(jìn)行一元線性回歸,得到各回歸器的Score、RMSE 及Corr精度,通過(guò)評(píng)估Score、RMSE及Corr值的大小來(lái)驗(yàn)證各回歸器擬合曲線擬合訓(xùn)練數(shù)據(jù)的精度。

      為了驗(yàn)證不同數(shù)據(jù)源及不同模型算法反演紅樹(shù)林的CCC 精度,在60 個(gè)測(cè)試數(shù)據(jù)中,將基于OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)回歸模型輸出的預(yù)測(cè)值、SNAP-SL2P 算法的估算值分別與測(cè)試集的目標(biāo)值進(jìn)行一元線性回歸,利用R2、RMSE 評(píng)估其反演精度。

      4 精度驗(yàn)證與結(jié)果分析

      4.1 紅樹(shù)林CCC回歸模型訓(xùn)練精度及對(duì)比分析

      單一線性回歸和機(jī)器學(xué)習(xí)回歸模型訓(xùn)練中(訓(xùn)練結(jié)果見(jiàn)表4),除了KNN 模型預(yù)測(cè)精度較低,基于CART的強(qiáng)機(jī)器學(xué)習(xí)回歸器精度明顯優(yōu)于線性回歸器的精度。OHS 數(shù)據(jù)中,最優(yōu)線性回歸模型為L(zhǎng)asso回歸器,Score為0.612(圖9(a)),RMSE為20.346 μg/cm2,Corr 為0.783,最優(yōu)的機(jī)器學(xué)習(xí)回歸模型是RF 回歸器,Score 為0.932,RMSE 為8.494 μg/cm2,Corr為0.971(圖10(c));最優(yōu)機(jī)器學(xué)習(xí)回歸器比最優(yōu)線性回歸器的Score提高了0.320,RMSE 降低了11.852 μg/cm2,Corr 提高了0.188。Sentinel-2A 數(shù)據(jù)中,最優(yōu)機(jī)器學(xué)習(xí)回歸模型是RF回歸器,Score 為0.884,RMSE 為11.148 μg/cm2,Corr 為0.943(圖10(d)),而最優(yōu)線性回歸模型是ElasticNet 回歸器,Score 為0.651,RMSE 為19.316 μg/cm2,Corr 為0.807(圖9(f));最優(yōu)RF機(jī)器學(xué)習(xí)回歸器比最優(yōu)ElasticNet 線性回歸器的Score 提高了0.233,RMSE 降低了8.168 μg/cm2,Corr 提高了0.136。說(shuō)明單一線性回歸和機(jī)器學(xué)習(xí)回歸模型訓(xùn)練中,RF 回歸模型是訓(xùn)練精度最高的紅樹(shù)林CCC反演模型。

      圖9 OHS與Sentinel-2A數(shù)據(jù)單一線性回歸模訓(xùn)練精度Fig.9 Training accuracy of single linear regression models in OHS and Sentinel-2A data

      圖10 OHS與Sentinel-2A數(shù)據(jù)單一機(jī)器學(xué)習(xí)回歸模型精度Fig.10 Training accuracy of single machine learning regression models in OHS and Sentinel-2A data

      表4 OHS與Sentinel-2A數(shù)據(jù)單一線性回歸和機(jī)器學(xué)習(xí)回歸模型訓(xùn)練精度Table 4 Training accuracy of single linear regression and machine learning regression models in OHS and Sentinel-2A data

      堆棧集成學(xué)習(xí)回歸結(jié)果中(預(yù)測(cè)結(jié)果見(jiàn)表5),OHS數(shù)據(jù)最優(yōu)堆棧集成學(xué)習(xí)回歸模型是GBRT回歸器,Score 為0.999,RMSE 為0.963 μg/cm2,Corr 為0.999(圖12(e));3 種堆棧線性集成學(xué)習(xí)回歸器精度趨于一致,其中Ridge 回歸器Score 為0.981,RMSE 為4.445 μg/cm2,Corr 為0.991(圖11(c));最優(yōu)堆棧GBRT 集成學(xué)習(xí)回歸模型比最優(yōu)堆棧Ridge 線性回歸模型的Score 提高了0.018,RMSE降低了3.482 μg/cm2,Corr 提高了0.008。Sentinel-2A 數(shù)據(jù)的最優(yōu)堆棧集成學(xué)習(xí)回歸模型是XGBoost回歸器,Score 為0.991,RMSE 為3.012 μg/cm2,Corr 為0.996(圖12(h));3 種線性回歸模型精度趨于一致,其中Ridge 的Score 為0.944,RMSE 為7.748 μg/cm2,Corr 為0.971(圖11(d));XGBoost回歸器比Ridge 回歸器的Score 提高了0.047,RMSE降低了4.736 μg/cm2,Corr提高了0.025。

      圖11 OHS與Sentinel-2A數(shù)據(jù)堆棧線性回歸模型訓(xùn)練精度Fig.11 Training accuracy of stacking linear regression models in OHS and Sentinel-2A data

      圖12 OHS與Sentinel-2A數(shù)據(jù)堆棧機(jī)器學(xué)習(xí)回歸模型訓(xùn)練精度Fig.12 Training accuracy of stacking machine learning regression models in OHS and Sentinel-2A data

      表5 OHS與Sentinel-2A數(shù)據(jù)堆棧集成學(xué)習(xí)回歸模型訓(xùn)練精度Table 5 Training accuracy of stacking ensemble regression models in OHS and Sentinel-2A data

      OHS 數(shù)據(jù)擁有比Sentinel-2A 數(shù)據(jù)更豐富的波段,其特征數(shù)據(jù)集復(fù)雜程度更高,在單一線性回歸模型訓(xùn)練中,Sentinel-2A 數(shù)據(jù)最優(yōu)ElasticNet 線性回歸模型比OHS 數(shù)據(jù)最優(yōu)Lasso 線性回歸模型的精度略高(RMSE 降低了0.985 μg/cm2),這是因?yàn)閱我痪€性回歸模型對(duì)于數(shù)據(jù)復(fù)雜的數(shù)據(jù)集難以建模。單一線性回歸和機(jī)器學(xué)習(xí)回歸模型訓(xùn)練中輸入數(shù)據(jù)是非線性和特征間具有相關(guān)性的數(shù)據(jù)集,RF 回歸模型具有較高的集成能力,對(duì)于復(fù)雜的數(shù)據(jù)集,RF 模型的擬合曲線較好地?cái)M合了紅樹(shù)林CCC 實(shí)測(cè)值,相比之下,線性回歸模型的擬合能力較弱。在堆棧集成學(xué)習(xí)回歸模型中,線性回歸模型在預(yù)測(cè)過(guò)程中出現(xiàn)了精度飽和的情況,而堆棧GBRT 及XGBoost 集成學(xué)習(xí)回歸模型有效避免了過(guò)擬合的情況,具有更強(qiáng)的泛化能力,并在單一最優(yōu)機(jī)器學(xué)習(xí)回歸模型訓(xùn)練中得到較優(yōu)結(jié)果的基礎(chǔ)上再一次提升了紅樹(shù)林CCC的估算精度。

      堆棧集成學(xué)習(xí)回歸前后的兩次模型訓(xùn)練,機(jī)器學(xué)習(xí)回歸模型對(duì)數(shù)據(jù)的擬合程度都比線性回歸高,說(shuō)明機(jī)器學(xué)習(xí)回歸模型在反演紅樹(shù)林CCC 的性能明顯優(yōu)于線性回歸模型;相較于單一最優(yōu)線性和最優(yōu)機(jī)器學(xué)習(xí)回歸模型,堆棧集成學(xué)習(xí)回歸模型集成了單一線性回歸、機(jī)器學(xué)習(xí)回歸模型的優(yōu)勢(shì),反演紅樹(shù)林CCC的精度最高。

      4.2 OHS 與Sentinel-2A 數(shù)據(jù)紅樹(shù)林CCC 估算精度與結(jié)果分析

      在單一機(jī)器學(xué)習(xí)回歸模型訓(xùn)練過(guò)程中,基于OHS 數(shù)據(jù)的最優(yōu)RF 回歸器的Score 比基于Sentinel-2A 數(shù)據(jù)的最優(yōu)RF 回歸器高0.048,RMSE降低了2.654 μg/cm2,Corr提高了0.028(圖13(a),圖13(b));而在堆棧集成學(xué)習(xí)回歸模型中,基于OHS數(shù)據(jù)的最優(yōu)GBRT 模型的RMSE 比基于Sentinel-2A數(shù)據(jù)的最優(yōu)XGBoost 模型降低了2.049 μg/cm2(圖13(c),圖13(d))。說(shuō)明OHS 數(shù)據(jù)為最優(yōu)堆棧集成學(xué)習(xí)回歸算法提供了最優(yōu)的擬合數(shù)據(jù)集,OHS 數(shù)據(jù)的RSI(12,17)、DSI(12,18)和NDSI(6,12)組合植被指數(shù)對(duì)紅樹(shù)林CCC的敏感性較高。

      圖13 OHS與Sentinel-2A數(shù)據(jù)反演紅樹(shù)林CCC訓(xùn)練精度對(duì)比Fig.13 Comparison of inversing training accuracy of mangrove CCC between OHS and Sentinel-2A data

      本文選取了60 個(gè)測(cè)試集的目標(biāo)數(shù)據(jù)驗(yàn)證OHS與Sentinel-2A 數(shù)據(jù)反演紅樹(shù)林CCC 的精度(驗(yàn)證結(jié)果見(jiàn)表6)。通過(guò)一元線性擬合,得到聯(lián)合OHS數(shù)據(jù)與最優(yōu)堆棧GBRT 集成學(xué)習(xí)回歸的R2為0.761,RMSE為16.738 μg/cm2(圖14(a));聯(lián)合Sentinel-2A數(shù)據(jù)與最優(yōu)堆棧XGBoost集成學(xué)習(xí)回歸模型的R2為0.615,RMSE 為20.701 μg/cm2(圖14(b));聯(lián)合OHS 數(shù)據(jù)和最優(yōu)堆棧集成學(xué)習(xí)回歸模型的紅樹(shù)林CCC 反演精度最高,比Sentinel-2A 數(shù)據(jù)的R2高0.146,RMSE 降低了3.963 μg/cm2。說(shuō)明基于OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型都能有效反演紅樹(shù)林CCC,而在最優(yōu)堆棧集成學(xué)習(xí)回歸模型下,OHS 數(shù)據(jù)比Sentinel-2A 數(shù)據(jù)的預(yù)測(cè)精度更高?;贠HS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型預(yù)測(cè)值之間的R2>0.7、RMSE<14 μg/cm2和Corr>0.8(圖14(f)),說(shuō)明兩種數(shù)據(jù)源的預(yù)測(cè)值之間具有很高的相關(guān)性。

      圖14 基于多源數(shù)據(jù)和最優(yōu)反演模型的紅樹(shù)林CCC精度對(duì)比Fig.14 Comparison of inversing accuracy of mangrove CCC between OHS and sentinel-2A data using optimal models

      聯(lián)合OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型都實(shí)現(xiàn)了紅樹(shù)林CCC 的有效估算,將兩種數(shù)據(jù)源分別與最優(yōu)堆棧集成學(xué)習(xí)回歸模型輸出的預(yù)測(cè)值與紅樹(shù)林CCC 驗(yàn)證數(shù)據(jù)集構(gòu)建一元線性擬合回歸方程,見(jiàn)式(12)和式(13)。

      式中,f(α)、f(β)是分別聯(lián)合OHS、Sentinel-2A數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型得到的回歸方程,α、β是分別聯(lián)合OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型輸出的預(yù)測(cè)值。

      4.3 最優(yōu)紅樹(shù)林CCC 反演模型與SNAP-SL2P 算法精度驗(yàn)證與結(jié)果分析

      本文利用60 個(gè)紅樹(shù)林CCC 驗(yàn)證數(shù)據(jù)集評(píng)估分別基于OHS、Sentinel-2A 數(shù)據(jù)與最優(yōu)堆棧集成學(xué)習(xí)回歸模型、SNAP-SL2P 算法反演紅樹(shù)林CCC 的精度(驗(yàn)證結(jié)果見(jiàn)表6)。SNAP-SL2P 算法估計(jì)紅樹(shù)林CCC 的R2為0.356,RMSE 為49.419 μg/cm2(圖14(c));基于OHS 數(shù)據(jù)的最優(yōu)堆棧GBRT 集成學(xué)習(xí)回歸模型比SNAP-SL2P 算法反演紅樹(shù)林CCC 的R2高0.405,RMSE 降低了32.681 μg/cm2;而在相同Sentinel-2A數(shù)據(jù)源下,最優(yōu)堆棧XGBoost集成學(xué)習(xí)回歸模型對(duì)比SNAP-SL2P 算法的R2提高了0.259,RMSE 降低了28.718 μg/cm2;SNAP-SL2P算法反演紅樹(shù)林CCC 的精度最低,R2小于0.4,RMSE大于40 μg/cm2,說(shuō)明最優(yōu)堆棧集成學(xué)習(xí)回歸模型比SNAP-SL2P 算法在反演紅樹(shù)林CCC 中更具有可靠性。SNAP-SL2P算法在估算紅樹(shù)林CCC時(shí),存在明顯的系統(tǒng)低估,尤其在估計(jì)LAI時(shí),SNAPSL2P 算法估算的LAI 均值(1.226)比實(shí)測(cè)值(2.014)低估了近一倍。環(huán)境因素會(huì)對(duì)SNAP-SL2P算法中PROSAIL 模擬的冠層反射率值造成一定程度的影響,而由OHS 數(shù)據(jù)計(jì)算的最優(yōu)特征變量有效避免了紅樹(shù)林地區(qū)土壤、海區(qū)污染物和海水等環(huán)境因子的影響。

      表6 基于多源數(shù)據(jù)和不同回歸模型的紅樹(shù)林CCC反演精度對(duì)比分析Table 6 Comparison of inversing accuracy of mangrove CCC between different regression models and multi-sources data

      本文對(duì)3種紅樹(shù)林CCC反演方法的預(yù)測(cè)值進(jìn)行了回歸分析(圖14),聯(lián)合OHS數(shù)據(jù)和最優(yōu)堆棧集成學(xué)習(xí)回歸模型的預(yù)測(cè)值與SNAP-SL2P 算法的估算值R2為0.501,RMSE 為48.734 μg/cm2,相關(guān)系數(shù)Corr 為0.708(圖14(d));聯(lián)合Sentinel-2A 數(shù)據(jù)和最優(yōu)堆棧集成學(xué)習(xí)回歸模型的預(yù)測(cè)值與SNAP-SL2P 算法的估算值R2為0.723,RMSE 為43.432 μg/cm2,Corr 為0.850(圖14(e))。SNAPSL2P 算法估算值與分別基于OHS、Sentinel-2A 數(shù)據(jù)的最優(yōu)堆棧集成學(xué)習(xí)回歸模型預(yù)測(cè)值之間的Corr均大于0.7,說(shuō)明3 種反演方法的預(yù)測(cè)值之間具有較高的相關(guān)性。雖然在相同的Sentinel-2A 數(shù)據(jù)源下,最優(yōu)堆棧集成學(xué)習(xí)回歸模型預(yù)測(cè)值與SNAPSL2P 算法估算值間有著較高的Corr(>0.8)和R2(>0.7),但是SNAP-SL2P 算法的RMSE 大于43 μg/cm2,說(shuō)明SNAP-SL2P 算法在紅樹(shù)林CCC 反演中存在明顯的系統(tǒng)性低估。聯(lián)合OHS 數(shù)據(jù)和最優(yōu)堆棧集成學(xué)習(xí)回歸模型的預(yù)測(cè)值與SNAP-SL2P算法的估算值的R2(<0.6)、RMSE(>48 μg/cm2)和Corr(<0.8)最低,這是由于兩者的數(shù)據(jù)源和算法之間都存在差異性,說(shuō)明基于OHS 數(shù)據(jù)的最優(yōu)堆棧集成學(xué)習(xí)回歸模型、SNAP-SL2P 算法不能同時(shí)有效反演紅樹(shù)林CCC。

      SNAP-SL2P 算法在紅樹(shù)林CCC 反演中出現(xiàn)了明顯的系統(tǒng)性低估。在研究區(qū)上,利用SNAPSL2P 算法繪制的LAI、LCC 專(zhuān)題圖(圖15)可以有效刻畫(huà)研究區(qū)紅樹(shù)林LAI和LCC的空間分布,有助于監(jiān)測(cè)紅樹(shù)林健康狀況。蘇屋村分布的樹(shù)種主要是白骨壤,研究區(qū)中間的河道附近的紅樹(shù)林LAI及LCC較高,而道路沿岸的紅樹(shù)林LAI與LCC較低(圖15(a),圖15(c))。沙角村主要分布著白骨壤、桐花樹(shù)和秋茄,研究區(qū)域內(nèi)高緯度地區(qū)主要分布著秋茄與桐花樹(shù),而相對(duì)低緯度地區(qū)主要分布著白骨壤與秋茄(圖15(b),圖15(d))。高緯度地區(qū)的LAI與LCC值比低緯度的高,與該地區(qū)桐花樹(shù)的分布面積較大有關(guān)。

      圖15 基于SNAP-SL2P算法提取的研究區(qū)紅樹(shù)林LAI及LCC值Fig.15 LAI and LCC value of mangrove calculated by SNAP-SL2P algorithm

      5 結(jié)論

      本文以O(shè)HS 和Sentinel-2A 為數(shù)據(jù)源,通過(guò)數(shù)據(jù)降維和變量?jī)?yōu)選,構(gòu)建了最優(yōu)堆棧集成學(xué)習(xí)回歸模型,實(shí)現(xiàn)了北部灣紅樹(shù)林CCC 的高精度反演,得出以下結(jié)論:

      (1)實(shí)現(xiàn)了正態(tài)分布檢驗(yàn)、最大相關(guān)系數(shù)法和基于XGBoost 算法的特征選擇方法對(duì)OHS 數(shù)據(jù)1498 個(gè)高維數(shù)據(jù)集進(jìn)行特征降維和變量?jī)?yōu)選,優(yōu)選出8 個(gè)最優(yōu)特征變量,其中RSI(12,17)、DSI(12,18)和NDSI(6,12)組合植被指數(shù)對(duì)紅樹(shù)林CCC 的敏感性較高;

      (2)對(duì)比了單一線性回歸和機(jī)器學(xué)習(xí)回歸模型與堆棧集成學(xué)習(xí)回歸模型的訓(xùn)練精度,OHS數(shù)據(jù)最優(yōu)堆棧GBRT 集成學(xué)習(xí)回歸模型(Score=0.999,RMSE=0.963 μg/cm2,Corr=0.999),比最優(yōu)機(jī)器學(xué)習(xí)RF 回歸器的RMSE 降低了7.531 μg/cm2,比最優(yōu)線性Lasso 回歸器的RMSE 降低了19.383 μg/cm2,堆棧集成學(xué)習(xí)回歸模型是訓(xùn)練精度最高的反演模型;

      (3)對(duì)比了OHS 和Sentinel-2A 數(shù)據(jù)反演紅樹(shù)林CCC 的精度,OHS 數(shù)據(jù)(R2=0.761,RMSE=16.738 μg/cm2)比Sentinel-2A 數(shù)據(jù)(R2=0.615,RMSE=20.701 μg/cm2)的R2提高0.146,RMSE 降低了3.963 μg/cm2,OHS 數(shù)據(jù)是反演紅樹(shù)林CCC 的最佳數(shù)據(jù)源;

      (4)對(duì)比了最優(yōu)堆棧集成學(xué)習(xí)回歸模型與SNAP-SL2P算法估算紅樹(shù)林CCC的精度,基于OHS、Sentinel-2A 數(shù)據(jù)的最優(yōu)堆棧集成學(xué)習(xí)回歸模型比SNAP-SL2P 算法(R2=0.356,RMSE=49.419 μg/cm2)的R2分別提高了0.405 和0.259,RMSE 降低了32.681 μg/cm2和28.718 μg/cm2,堆棧集成學(xué)習(xí)回歸模型是紅樹(shù)林CCC估算中精度最優(yōu)的反演模型。

      本文在紅樹(shù)林CCC 最優(yōu)反演模型和最佳數(shù)據(jù)源的選擇上進(jìn)行了系統(tǒng)性的研究,但是仍需要進(jìn)一步改進(jìn):在紅樹(shù)林最優(yōu)反演模型和最優(yōu)數(shù)據(jù)集的構(gòu)建過(guò)程中,下一步將采用深度學(xué)習(xí)回歸模型,實(shí)現(xiàn)CCC 的高精度智能估算;下一步將采用高空間分辨率的無(wú)人機(jī)、多光譜和高光譜數(shù)據(jù)實(shí)現(xiàn)紅樹(shù)林種群的CCC反演。

      志 謝此次實(shí)驗(yàn)的高光譜衛(wèi)星影像采用了珠海歐比特宇航科技股份有限公司的珠海一號(hào)高光譜衛(wèi)星數(shù)據(jù)產(chǎn)品,在此表示衷心的感謝!

      猜你喜歡
      堆棧植被指數(shù)紅樹(shù)林
      藏著寶藏的紅樹(shù)林
      神奇的紅樹(shù)林
      AMSR_2微波植被指數(shù)在黃河流域的適用性對(duì)比與分析
      河南省冬小麥產(chǎn)量遙感監(jiān)測(cè)精度比較研究
      走過(guò)紅樹(shù)林
      歌海(2018年4期)2018-05-14 12:46:15
      嵌入式軟件堆棧溢出的動(dòng)態(tài)檢測(cè)方案設(shè)計(jì)*
      基于堆棧自編碼降維的武器裝備體系效能預(yù)測(cè)
      主要植被指數(shù)在生態(tài)環(huán)評(píng)中的作用
      西藏科技(2015年1期)2015-09-26 12:09:29
      基于MODIS數(shù)據(jù)的植被指數(shù)與植被覆蓋度關(guān)系研究
      一種用于分析MCS-51目標(biāo)碼堆棧深度的方法
      淄博市| 西乡县| 巨鹿县| 义马市| 河间市| 平邑县| 乌兰察布市| 宁南县| 涿州市| 海林市| 正阳县| 威信县| 灌南县| 武宁县| 临澧县| 吴堡县| 台北县| 南部县| 江川县| 历史| 隆尧县| 寻乌县| 鲁山县| 阳谷县| 泸西县| 逊克县| 鄂尔多斯市| 虞城县| 靖西县| 广元市| 来凤县| 石城县| 宁德市| 淳安县| 滦平县| 郧西县| 多伦县| 白河县| 武穴市| 长宁区| 隆子县|