孫博學(xué) 吳永強(qiáng) 張靜宜 馬玥
摘?要:以Sentinel1/2哨兵衛(wèi)星獲取的雷達(dá)和多光譜遙感影像為數(shù)據(jù)源,提取多時(shí)相光譜反射和微波后向散射特征變量,基于面向?qū)ο蟮碾S機(jī)森林算法對(duì)吉林省扶余市水稻、玉米和大豆分類,并與支持向量機(jī)算法比較,綜合評(píng)估基于多源遙感數(shù)據(jù)的面向?qū)ο箅S機(jī)森林算法對(duì)大范圍農(nóng)作物自動(dòng)識(shí)別的適用性。結(jié)果表明:利用多時(shí)相多源遙感數(shù)據(jù)能夠有效提高作物分類精度。面向?qū)ο箅S機(jī)森林算法的分類總體精度為87.32%,高于支持向量機(jī)算法9.82%。利用面向?qū)ο箅S機(jī)森林算法結(jié)合多時(shí)相主被動(dòng)遙感特征變量能夠準(zhǔn)確地自動(dòng)識(shí)別大范圍農(nóng)作物,可為作物種植面積調(diào)查與產(chǎn)量估值提供重要的支撐。
關(guān)鍵詞:哨兵衛(wèi)星;主被動(dòng)遙感;面向?qū)ο箅S機(jī)森林算法;農(nóng)作物自動(dòng)識(shí)別
掌握農(nóng)作物的種植分布狀況,對(duì)于宏觀指導(dǎo)農(nóng)業(yè)生產(chǎn)、作物估產(chǎn)及農(nóng)情監(jiān)測(cè)具有重要意義[13]。遙感技術(shù)能夠快速實(shí)時(shí)監(jiān)測(cè)地表信息,為識(shí)別作物提供高效快捷的技術(shù)手段。遙感光學(xué)傳感器易受云雨天氣影響,較難獲取清晰的影像圖,不同作物在可見(jiàn)光—紅外波段下特征相似,識(shí)別精度較低。微波傳感器發(fā)射的微波能夠穿透云層,不易受天氣影響,可獲得清晰的雷達(dá)影像數(shù)據(jù),用以表征不同作物的后向散射特征。但由于微波傳感器成像方式不同,作物影像特征不易識(shí)別,僅利用微波影像分類作物存在較大困難[45]。應(yīng)用主被動(dòng)遙感技術(shù)協(xié)同實(shí)現(xiàn)農(nóng)作物自動(dòng)識(shí)別對(duì)分類精度的提高具有重要意義。
分類方法的選擇在提高作物識(shí)別精度方面至關(guān)重要。面向?qū)ο蠓诸惙▽⑼|(zhì)像元組成的對(duì)象作為基本分類單元,能夠有效保留地物的空間結(jié)構(gòu)、形狀和紋理等特征,降低獨(dú)立像元噪聲的影響,有助于提高分類精度[67]。隨機(jī)森林算法是目前應(yīng)用最廣泛的機(jī)器學(xué)習(xí)算法,模型泛化能力強(qiáng)、穩(wěn)定性高,但在多時(shí)相多源遙感數(shù)據(jù)作物識(shí)別方面仍需進(jìn)一步驗(yàn)證分析[8]。
以Sentinel1/2哨兵衛(wèi)星獲取的雷達(dá)和多光譜遙感影像為數(shù)據(jù)源,提取多時(shí)相光譜反射和微波后向散射特征變量,基于面向?qū)ο箅S機(jī)森林算法對(duì)吉林省扶余市水稻、玉米和大豆自動(dòng)分類,并與支持向量機(jī)算法比較,綜合評(píng)估基于多源遙感數(shù)據(jù)的面向?qū)ο箅S機(jī)森林算法對(duì)大范圍農(nóng)作物自動(dòng)識(shí)別的適用性。
一、研究區(qū)概況和數(shù)據(jù)源
(一)研究區(qū)概況
研究區(qū)位于中國(guó)吉林省扶余市,主要包括大林子鎮(zhèn)、更新鄉(xiāng)、新萬(wàn)發(fā)鎮(zhèn)、弓棚子鎮(zhèn)、五家站鎮(zhèn)和肖家鄉(xiāng)共六個(gè)鎮(zhèn)(鄉(xiāng))級(jí)行政區(qū),地理坐標(biāo)為44°52′~45°25′N,125°24′~125°59′E,年平均氣溫4.5℃,平均降水145.8mm,區(qū)內(nèi)作物主要包括水稻、玉米和大豆。
(二)數(shù)據(jù)源
采用2020年4—10月逐月的Sentinel1/2遙感影像數(shù)據(jù)。Sentinel1雷達(dá)C波段數(shù)據(jù)為GRD?1級(jí)產(chǎn)品,VV和VH兩種極化方式。Sentinel2多光譜數(shù)據(jù)為L(zhǎng)1C級(jí)產(chǎn)品,包括可見(jiàn)光近紅外到短波紅外共13個(gè)波段。利用SNAP軟件對(duì)Sentinel1/2數(shù)據(jù)預(yù)處理。Sentinel1數(shù)據(jù)進(jìn)行輻射定標(biāo),Refined?Lee濾波和地形校正處理。Sentinel2數(shù)據(jù)借助Sen2cor功能模塊進(jìn)行輻射定標(biāo)和大氣校正。將預(yù)處理后的Sentinel1/2數(shù)據(jù)利用ENVI?5.3軟件進(jìn)行空間配準(zhǔn),空間分辨率統(tǒng)一為10m。
二、分類方法與精度評(píng)價(jià)
(一)面向?qū)ο蠓诸惙?/p>
利用eCognition軟件的多尺度分割功能將待分類影像分割成異質(zhì)性最小的對(duì)象單元,需設(shè)置三個(gè)重要參數(shù),即尺度參數(shù)、形狀參數(shù)和緊致度參數(shù)[910]。尺度參數(shù)的大小決定分割對(duì)象的面積大小,直接影響分類效率和精度。形狀參數(shù)和緊致度參數(shù)可以進(jìn)一步優(yōu)化對(duì)象的邊緣特征,使其更加準(zhǔn)確地表達(dá)地物細(xì)節(jié)信息。通過(guò)多次試驗(yàn),最終確定的尺度參數(shù)、形狀參數(shù)和緊致度參數(shù)分別為80、0.8和0.2。
(二)隨機(jī)森林和支持向量機(jī)算法
隨機(jī)森林算法(RF)是由多個(gè)CART決策樹(shù)組合構(gòu)成的集成學(xué)習(xí)算法。RF采用bootstrap抽樣技術(shù)從原始數(shù)據(jù)集中抽取N個(gè)訓(xùn)練數(shù)據(jù)集生成N個(gè)CART決策樹(shù),在每個(gè)CART決策樹(shù)生長(zhǎng)過(guò)程中,從全部M個(gè)特征變量中隨機(jī)抽選m個(gè)(m≤M),根據(jù)Gini系數(shù)最小原則選出最優(yōu)屬性進(jìn)行內(nèi)部節(jié)點(diǎn)分支,最后采用投票法綜合N個(gè)決策樹(shù)的預(yù)測(cè)結(jié)果確定最終的樣本類別[11]。本文設(shè)置決策樹(shù)的個(gè)數(shù)N為1000,節(jié)點(diǎn)分裂的特征變量數(shù)為總特征變量數(shù)的開(kāi)根方值。
支持向量機(jī)算法(SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)算法,通過(guò)選擇相應(yīng)的非線性映射函數(shù),將輸入向量從原空間映射到高維特征空間,采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則,在最小化樣本誤差的同時(shí)縮小模型泛化誤差的上界,提高模型的泛化能力[12]。本文設(shè)置SVM的懲罰系數(shù)C值設(shè)為1,選用RBF核函數(shù)。
(三)精度評(píng)價(jià)
綜合2020年野外地面調(diào)查樣點(diǎn)數(shù)據(jù)和Google?Earth高分辨率影像,隨機(jī)選取560個(gè)驗(yàn)證點(diǎn),計(jì)算混淆矩陣,采用總體精度、Kappa系數(shù)、制圖精度和用戶精度對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià)。
三、農(nóng)作物分類遙感影像特征分析
(一)多源遙感數(shù)據(jù)特征分析
利用Sentinel1的VH和VV極化數(shù)據(jù)分別計(jì)算VV/VH比值極化指數(shù)和(VVVH)/(VV+VH)歸一化極化指數(shù)。利用Sentinel2的多光譜反射率數(shù)據(jù)計(jì)算NDVI歸一化植被指數(shù)、DVI差值植被指數(shù)和RVI比值植被指數(shù)。借助ENVI?5.3軟件制作水稻、玉米和大豆作物的ROI感興趣區(qū),獲取不同作物的后向散射、光譜反射率和多種指數(shù)的均值,分析作物在不同生長(zhǎng)時(shí)間下的遙感數(shù)據(jù)特點(diǎn)。經(jīng)過(guò)分析可知,對(duì)于Sentinel1數(shù)據(jù),三種作物隨季節(jié)變化有不同的生長(zhǎng)狀態(tài),微波后向散射系數(shù)也隨之變化。在VH和VV極化模式下,水稻的后向散射系數(shù)最低,大豆和玉米的后向散射系數(shù)較接近。對(duì)于VV/VH和(VVVH)/(VV+VH)兩種極化指數(shù),水稻、玉米和大豆的曲線特征相似,但經(jīng)過(guò)數(shù)學(xué)比值運(yùn)算后,使三種作物的后向散射系數(shù)差異更加顯著,有利于區(qū)分不同的作物。對(duì)于Sentinel2數(shù)據(jù),三種作物在4~6月播種至出苗的過(guò)程中,光譜反射率逐漸升高,6~8月生長(zhǎng)期內(nèi),反射率逐漸降低,9~10月完全成熟至收獲后,反射率逐漸升高。在播種至成熟的過(guò)程中,水稻的光譜反射率最低,大豆和玉米的反射率較高,且二者的反射率值較為接近。在紅邊波段(B5B7,B8A)處,三種作物的光譜反射率差異較可見(jiàn)光(B1B4)和短波紅外波段(B11B12)處顯著。三種作物從播種至收獲,植被指數(shù)數(shù)值先升高后降低,在7~9月三種作物的指數(shù)值差異最為顯著。
(二)分類特征變量選取
針對(duì)4個(gè)雷達(dá)后向散射特征變量和15個(gè)光譜反射特征變量,將三種作物類型兩兩對(duì)比,篩選出特征值差異最顯著的月份,用于后續(xù)參與分類模型的構(gòu)建。以VV特征變量為例,大豆和水稻在5月后向散射系數(shù)差值最大,大豆和玉米在10月后向散射系數(shù)差值最大,水稻和玉米在5月后向散射系數(shù)差值最大,對(duì)于VV特征變量,最終篩選5月和10月兩個(gè)月份的特征變量數(shù)據(jù)用于后續(xù)分類。分類特征變量篩選情況如表1所示。
四、分類實(shí)驗(yàn)及精度評(píng)價(jià)
為了明確多時(shí)相、多源遙感數(shù)據(jù)的綜合應(yīng)用對(duì)農(nóng)作物種植結(jié)構(gòu)分類精度的影響,針對(duì)不同的特征變量數(shù)據(jù)集,共設(shè)定5組實(shí)驗(yàn),即單一時(shí)相多光譜特征數(shù)據(jù)集(OPTS)、單一時(shí)相雷達(dá)特征數(shù)據(jù)集(SARS)、多時(shí)相多光譜特征數(shù)據(jù)集(OPTM)、多時(shí)相雷達(dá)特征數(shù)據(jù)集(SARM)和多時(shí)相多源特征數(shù)據(jù)集(OPTMSARM)。OPTS組選取作物光譜反射率差異顯著的7月Sentinel2多波段數(shù)據(jù)為特征變量,SARS組選取作物后向散射系數(shù)差異顯著的6月Sentinel1兩種極化數(shù)據(jù)為特征變量。選用RF和SVM算法進(jìn)行作物分類。
(一)特征變量對(duì)分類精度的影響
由表2,多時(shí)相模型(OPTM、SARM)的總體精度和Kappa系數(shù)高于單一時(shí)相模型(OPTS、SARS),多時(shí)相模型比單一時(shí)相模型的總體精度可提升3.39%以上,最高可達(dá)13.93%。選取水稻、玉米和大豆在生長(zhǎng)周期中反射或后向散射差異顯著的多時(shí)相數(shù)據(jù)參與分類,能夠增強(qiáng)不同作物間的影像特征差異,有利于提高識(shí)別精度。從單一數(shù)據(jù)源模型(OPTM、SARM)到多源數(shù)據(jù)模型(OPTMSARM)的總體精度顯著增加,最高可提升9.82%,綜合利用光學(xué)和雷達(dá)影像能夠豐富農(nóng)作物的影像特征,彌補(bǔ)利用單一光學(xué)遙感數(shù)據(jù)或微波遙感數(shù)據(jù)的不足,可有效提高具有相似特點(diǎn)的作物識(shí)別精度。
(二)分類算法對(duì)分類精度的影響
由表3,利用RF和SVM算法結(jié)合多時(shí)相多源特征數(shù)據(jù)集對(duì)水稻、玉米和大豆分類,并計(jì)算混淆矩陣。RF算法的總體精度和Kappa系數(shù)為87.32%和0.8311,較SVM算法高9.82%和0.1304。RF算法中水稻、玉米和大豆的制圖精度較SVM算法高6%、4.29%和25.72%,用戶精度較SVM算法高0.15%、11.08%和8.9%。通過(guò)對(duì)比分析,RF算法的模型性能較好,泛化能力較強(qiáng),能夠高效地處理高維數(shù)據(jù),更高精度地精細(xì)化提取農(nóng)作物種植結(jié)構(gòu)信息,適用于大范圍農(nóng)作物的種植結(jié)構(gòu)制圖。
五、分類結(jié)果
利用基于面向?qū)ο箅S機(jī)森林算法自動(dòng)繪制研究區(qū)農(nóng)作物種植結(jié)構(gòu)圖,獲得的分類結(jié)果比較準(zhǔn)確,較少出現(xiàn)錯(cuò)分和漏分現(xiàn)象,能夠準(zhǔn)確劃分不同農(nóng)作物的地塊邊界。面向?qū)ο蠓诸惙ㄓ行Ц纳屏讼袼胤诸惙ㄖ歇?dú)立像元引起的“椒鹽”現(xiàn)象,最大程度地保留了地物間的空間鄰域關(guān)系,可視化效果較好。
結(jié)語(yǔ)
本文利用面向?qū)ο箅S機(jī)森林算法結(jié)合Sentinel1微波數(shù)據(jù)和Sentinel2多光譜數(shù)據(jù)實(shí)現(xiàn)了對(duì)吉林省扶余市水稻、玉米和大豆大宗農(nóng)作物種植結(jié)構(gòu)的自動(dòng)識(shí)別。多時(shí)相多源遙感數(shù)據(jù)的應(yīng)用極大程度豐富了地物的遙感影像特征,增強(qiáng)了不同作物的影像特征差異,有利于提高分類精度。面向?qū)ο箅S機(jī)森林方法可以高效并行處理高維數(shù)據(jù),有效挖掘特征信息,獲得的農(nóng)作物種植結(jié)構(gòu)圖精度較高,可視化效果較好,可以充分保留地物空間鄰域特征。協(xié)同利用主被動(dòng)遙感技術(shù)能夠高效準(zhǔn)確地實(shí)現(xiàn)大范圍的農(nóng)作物種植結(jié)構(gòu)監(jiān)測(cè),為農(nóng)業(yè)生產(chǎn)與管理提供有力的科學(xué)依據(jù)和數(shù)據(jù)支撐。
參考文獻(xiàn):
[1]潘曉卉,張平宇,劉世薇.東北地區(qū)主要糧食作物種植結(jié)構(gòu)時(shí)空變化分析[J].土壤與作物,2018,7(3):303311.
[2]代海濤.吉林省大豆生產(chǎn)發(fā)展現(xiàn)狀及對(duì)策分析[J].大豆科技,2009,000(002):5153.
[3]李冰,梁燕華,李丹丹,等.多時(shí)相GF1衛(wèi)星PMS影像提取農(nóng)作物種植結(jié)構(gòu)[J].中國(guó)農(nóng)業(yè)資源與區(qū)劃,2017,38(9):5662.
[4]朱鳳敏,吳迪,楊佳琪.基于Sentinel1B?SAR數(shù)據(jù)的農(nóng)作物分類方法研究[J].測(cè)繪與空間地理信息,2020,43(5):105108.
[5]韓冰冰,陳圣波,曾慶鴻,等.基于JM距離的多時(shí)相Sentinel1農(nóng)作物分類[J].科學(xué)技術(shù)與工程,2020,20(17):69776982.
[6]畢愷藝,牛錚,黃妮,等.基于Sentinel2A時(shí)序數(shù)據(jù)和面向?qū)ο鬀Q策樹(shù)方法的植被識(shí)別[J].地理與地理信息科學(xué),2017,33(5):1620+27+127.
[7]賈明明,王宗明,張柏,等.綜合環(huán)境衛(wèi)星與MODIS數(shù)據(jù)的面向?qū)ο笸恋馗采w分類方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2014,39(3):305310.
[8]王利民,劉佳,楊玲波,等.隨機(jī)森林方法在玉米大豆精細(xì)識(shí)別中的應(yīng)用[J].作物學(xué)報(bào),2018,44(4):569580.
[9]杜保佳,張晶,王宗明,等.應(yīng)用Sentinel2A?NDVI時(shí)間序列和面向?qū)ο鬀Q策樹(shù)方法的農(nóng)作物分類[J].地球信息科學(xué)學(xué)報(bào),2019,21(5):740751.
[10]張瀾,王妮,朱冰雪,等.基于無(wú)人機(jī)高分辨率影像的農(nóng)作物分類研究[J].江西農(nóng)業(yè)學(xué)報(bào),2022,34(02):178187.
[11]王德軍,姜琦剛,李遠(yuǎn)華,等.基于Sentinel2A/B時(shí)序數(shù)據(jù)與隨機(jī)森林算法的農(nóng)耕區(qū)土地利用分類[J].國(guó)土資源遙感,2020,32(4):236243.
[12]張東彥,戴震,徐新剛,等.基于時(shí)序Sentinel2影像的現(xiàn)代農(nóng)業(yè)園區(qū)作物分類研究[J].紅外與激光工程,2021,50(05):262272.
基金項(xiàng)目:吉林省教育廳科學(xué)技術(shù)研究項(xiàng)目(JJKH?20210269KJ);吉林省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(2021?10191108)
作者簡(jiǎn)介:孫博學(xué)(2001—?),男,漢族,天津人,本科,研究方向:環(huán)境遙感和遙感圖像分類。