董雯凱 趙青芬
(1.江西省自然資源測繪與監(jiān)測院,江西 南昌 330000;2.江西省國土空間調(diào)查規(guī)劃研究院,江西 南昌 330009)
農(nóng)作物種植信息識別作為經(jīng)濟發(fā)展與糧食安全等策略的重要數(shù)據(jù),一直以來都是各個部門密切關(guān)注的問題[1]。傳統(tǒng)的農(nóng)作物種植信息調(diào)查主要采用實地調(diào)查與樣方測算的方法[2]。如外業(yè)調(diào)查隊伍有目的性地驅(qū)車調(diào)查,調(diào)查種植類型、種植面積,以及在各區(qū)縣劃定樣方,逐年逐季對樣方內(nèi)種植作物進行信息獲取,從而估算大范圍的種植情況。傳統(tǒng)的農(nóng)作物種植面積信息獲取與統(tǒng)計多依托當(dāng)?shù)亟y(tǒng)計部門進行田間樣方抽樣調(diào)查,根據(jù)歷史數(shù)據(jù)進行推算,從而估算整體種植面積。該方法不僅費時費力、效率低下,而且難以獲取精確的空間分布信息,更加難以獲取準(zhǔn)確的農(nóng)作物種植面積[3]。遙感技術(shù)是一種非接觸的、遠距離探測技術(shù),具有覆蓋范圍廣、重訪周期短、現(xiàn)勢性強、數(shù)據(jù)獲取與處理簡便等優(yōu)勢,為農(nóng)作物信息的精準(zhǔn)獲取提供了強有力的手段[4,5]。隨著遙感技術(shù)的發(fā)展,線上遙感處理解譯平臺應(yīng)運而生。美國的Google Earth Engine(GEE)作為目前應(yīng)用人數(shù)最多、范圍最廣的遙感處理解譯平臺,已經(jīng)成為遙感學(xué)科不可或缺的分析途徑[6],GEE平臺存儲了Sentinel系列數(shù)據(jù)、MODIS系列數(shù)據(jù)、TRMM/GPM降水?dāng)?shù)據(jù)、Landsat數(shù)據(jù)和海拔數(shù)據(jù)等海量數(shù)據(jù),容量超過5PB,且每天增加約5000幅影像,可以解決大面積地表、地上遙感分類與反演方面最重要的數(shù)據(jù)來源問題,在平臺上可進行土地利用分類、植被長勢監(jiān)測、水體監(jiān)測等各種遙感分類與反演工作[7,8]。
本研究基于GEE平臺進行南昌縣的農(nóng)作物信息提取,通過GEE平臺進行影像融合高亮顯示,在GEE平臺上進行樣本勾畫,勾畫水體、建筑、農(nóng)作物、林草地等類別,用非監(jiān)督分類、監(jiān)督分類、面向?qū)ο蠓诸惖确椒ㄟM行農(nóng)作物分類以及精度分析與比對,最終篩選出最適用于本研究的分類方法。
本研究選取江西省南昌縣作為研究試點,GEE平臺融合無云Landsat8影像效果(如圖1所示):南昌縣位于江西省中部偏北,南昌市南部,面積1810.7平方千米,東接進賢縣,南鄰宜春豐城市,西、北與新建區(qū)隔贛江相望,東北瀕鄱陽湖,三面環(huán)抱南昌市主城區(qū)。南昌縣是全國著名的商品糧基地、漁業(yè)重點縣,享有“江南糧倉”“魚米之鄉(xiāng)”等美譽,境內(nèi)盛產(chǎn)水稻,主要為雙季稻,本研究著重進行水稻信息遙感提取研究。
圖1 GEE平臺Lands a t8影像南昌縣示意圖
本研究主要采用Landsat8數(shù)據(jù)作為研究數(shù)據(jù)源。Landsat8衛(wèi)星傳感器發(fā)射于2013年2月11日,衛(wèi)星上攜帶兩個傳感器,分別是OLI陸地成像儀和TIRS熱紅外傳感器。Landsat8在空間分辨率和光譜特性等方面與Landsat 1-7基本保持一致,共有11個波段,預(yù)處理后為15米分辨率的多光譜影像。Landsat8影像的短波紅外與近紅外波段,對農(nóng)作物葉片的葉綠素變化及紅邊位移有顯著的監(jiān)測作用,可用于農(nóng)作物種植面積、長勢等監(jiān)測識別。相較于之前的Landsat系列數(shù)據(jù),Landsat8數(shù)據(jù)像元純凈度更高、受大氣影響更少、光譜信息更準(zhǔn)確,在已開展的大量研究中均取得了較理想的成果。
本研究采用非監(jiān)督分類中的K均值聚類、監(jiān)督分類中的最大似然法分類、面向?qū)ο蠓诸愡@三種分類方法,基于GEE平臺進行江西南昌縣的農(nóng)作物分類研究。三種分類原理分別如下所示:
K均值聚類:K均值聚類算法首先將數(shù)據(jù)分為K組,隨機選取K個對象作為初始的聚類中心,然后計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給離它最近的聚類中心。聚類中心以及分配給它們的對象就代表一個聚類。
最大似然法:在兩類或多類判決中,用統(tǒng)計分析方法根據(jù)貝葉斯判決準(zhǔn)則法建立非線性判別函數(shù)集,假定各類分布函數(shù)為正態(tài)分布,并在訓(xùn)練區(qū)內(nèi)計算各待分類樣區(qū)的概率,從而進行分類。
面向?qū)ο螅好嫦驅(qū)ο蠓椒ǖ奶崛☆愃茮Q策樹的構(gòu)思,從簡到繁,先剔除其他無關(guān)信息,再經(jīng)過多次篩選找出有用的地物類別,實現(xiàn)地物的分層提取。經(jīng)過多尺度分割后,需要對分割后的單個對象進行劃分,選擇合適的參數(shù)或者規(guī)則將對象與其他對象區(qū)分開來,以實現(xiàn)各種地物的分類。
本研究的技術(shù)路線(如圖2所示)。首先基于GEE平臺進行6至8月Landsat8無云影像合成,以此避免6至8月的云雨天氣造成的影像。通過影像合成,得到無云的高清影像成果。
圖2 技術(shù)路線圖
其次,在合成的影像上進行樣本采集,主要采集類別為:水體、建筑、林草地、農(nóng)作物,通過豐富樣本類型達到農(nóng)作物高精度識別與提取的目的。將采集的樣本進行篩選,篩選出用于遙感分類的樣本以及用于精度驗證的樣本。
然后,將分類樣本分別帶入到K均值聚類、最大似然法、面向?qū)ο笕N分類方法中,進行基于GEE平臺的遙感分類,得到三種分類成果。
最后,采用預(yù)留的精度驗證樣本對三種分類成果進行分類精度評價,評價出最優(yōu)解譯方法。
本研究選取的樣本是基于GEE平臺,采用人工目視標(biāo)識的方法進行樣本標(biāo)記與統(tǒng)計,主要采集類型為水體、建筑、林草地、農(nóng)作物。各類別采集樣本情況(如圖3所示)。建筑、水體、農(nóng)作物各類樣本量整體保持一致,林草地樣本量相對較少。原因是挑選林草地樣本時,對于灌草地區(qū)未進行樣本采集,避免灌草地區(qū)對后續(xù)研究中的農(nóng)作物分類產(chǎn)生混淆。南昌縣農(nóng)作物多為水稻,水稻在耕種前與收獲后,會閑置一段時間,該時間段內(nèi)田塊中滋生的雜草與灌草地區(qū)的雜草在影像上的紋理相似,且極易出現(xiàn)混淆現(xiàn)象。為避免此現(xiàn)象的發(fā)生,本研究首先在選取樣本的時候避開灌草類別,同時在選取研究時段時選取水稻已耕種且處于拔節(jié)期的時段,即6至8月,該時段較好地解決了灌草對農(nóng)作物提取的影響。
圖3 基于GEE平臺勾畫各地類樣本
通過GEE平臺對南昌縣進行農(nóng)作物分類(如圖4所示),圖4(a)為K均值聚類分類成果,(b)為最大似然分類成果,(c)為面向?qū)ο蠓诸惓晒?。由圖4可知,K均值聚類整體分類成果中,各地類像元相對集中,如居民地具有很好的顯示,但對于非居民地的獨棟建筑,則不能較好地識別出來,究其原因是對像元進行臨近分析時,獨棟建筑作為弱項,被分析計算到相鄰像元類別中,如南昌縣北部地區(qū)的建筑物,均被耕地及林草地類別包括進去;最大似然法分類采用美國公布的CDL耕地數(shù)據(jù)作為掩膜進行分類,分類精度相對于K均值聚類法高,但對混合像元的處理不如K均值聚類方法,如南昌縣南部,建筑出現(xiàn)較多錯誤識別,違背了建筑分布的合理性,空間分布零星散亂,不符合居住及建筑群的特性;面向?qū)ο蠓诸惓晒茸罡?,且各地類分布相對合理,其整體分類成果與最大似然法分類成果相似,但局部地區(qū)的小圖斑識別精度高于最大似然法。
圖4 基于GEE平臺的三種分類器分類成果圖
三種分類方法對農(nóng)作物的識別精度不盡相同,其中面向?qū)ο蠓诸惙椒▽r(nóng)作物的識別精度最高,相比其他兩種分類方法,面向?qū)ο蠓椒ㄌ崛〉霓r(nóng)作物精度高的原因是因為面向?qū)ο蠓椒▽颖咀鳛閷ο?,且對對象進行紋理特征計算、指數(shù)特征計算等,從而豐富特征庫,將農(nóng)作物的特征最大程度地貢獻給分類器,然后將農(nóng)作物精準(zhǔn)識別出來。面向?qū)ο蠓椒ǖ淖R別精度優(yōu)勢區(qū)域在南昌縣中部、北部地區(qū)。南昌縣農(nóng)作物種植集中在中部、北部地區(qū),且呈大面積連片種植。K均值聚類法將過多的地類區(qū)分成了農(nóng)作物,造成了錯分現(xiàn)象;而最大似然法對混合像元的處理效果不太好,像元噪點較多;分類成果中的瑣碎圖斑較多,整體精度低于面向?qū)ο蠓椒?;面向?qū)ο蠓椒▌t較好地識別出了南昌縣地區(qū)的農(nóng)作物種植空間分布。南昌縣種植作物多為水稻,本研究選取的研究時段為6至8月,該時段對水稻的反映可從短波紅外、近紅外、紅邊波段聯(lián)合響應(yīng),通過特征豐富,農(nóng)作物的光譜及紋理特征差異擴大,通過分類器可較好地識別出來。
采用預(yù)留的20%驗證樣本,結(jié)合三種分類方法,對四種地物類型的遙感識別進行精度評價(如表1所示)。整體來說,分類精度最高的是面向?qū)ο蠓诸惙椒ǎ浯问亲畲笏迫环ǎ畹偷氖荎均值聚類分類方法。三種分類方法在Landsat8影像上的地表要素提取精度上均高于遙感分類的85%精度極限,這為后期地表覆蓋遙感分類提供了良好的成果證明。
表1 分類精度評價
基于GEE平臺的農(nóng)作物提取成果中,三種分類方法的提取精度(如圖5所示)。整體來說,面向?qū)ο蠓诸惙椒ǖ木认鄬ψ罡?,是因為面向?qū)ο蠓诸愝^前兩種分類方法,增加了指數(shù)特征、拓撲特征、形狀特征、光譜特征等,在分類時會采用最優(yōu)相關(guān)性選擇進行最優(yōu)特征選取,剔除冗余的特征,并將最優(yōu)特征添加到分類器中,以此保證分類精度的最優(yōu)化;相對于面向?qū)ο蠓诸惙椒ǎ琄均值聚類與最大似然法也具有較好的可取性,如K均值聚類方法在樣本獲取較困難的窗口或地區(qū),可采用K均值聚類方法,通過最優(yōu)類別劃分,進行多次迭代與分類,可得到相對較高精度的聚類成果;而最大似然法在面向?qū)ο蠓椒ㄖ笆沁b感分類方法中應(yīng)用最多的分類器,該方法在建筑與水體的識別中具有較好的適用性,且該優(yōu)點也在本研究中得到證實。
圖5 基于GEE平臺的三種分類器農(nóng)作物識別精度對比圖
本研究整個流程都是在GEE上進行的,如通過GEE平臺進行樣本勾畫、遙感分類、精度評價等工作。
通過GEE平臺進行樣本勾畫工作,較傳統(tǒng)的ENVI等軟件勾畫ROI具有快速標(biāo)記、分類統(tǒng)計等優(yōu)勢,如在GEE平臺上標(biāo)記100個樣本所用時間約為5分鐘,而在ENVI軟件中需要先創(chuàng)建ROI,再標(biāo)記,然后導(dǎo)出XML文件,整體操作時間遠大于GEE平臺操作時間。
通過GEE平臺進行遙感分類工作,三種分類方法均在3分鐘之內(nèi)完成分類,整體效率遠大于傳統(tǒng)的軟件分類,且GEE對分類過程的參數(shù)調(diào)整也具有較直接地操作。
通過GEE平臺進行精度評價工作,與分類相似,可在3分鐘之內(nèi)完成精度評價;傳統(tǒng)的精度評價需要驗證樣本導(dǎo)入、ROI創(chuàng)建等工作,且操作繁瑣。
本研究基于GEE平臺聯(lián)合Landsat影像,采用不同的遙感分類方法對江西南昌縣農(nóng)作物進行研究識別,通過研究得出以下結(jié)論:
整體來說,GEE平臺在農(nóng)作物遙感分類中具有快速、高效、數(shù)據(jù)源豐富、調(diào)參便捷等優(yōu)勢。
K均值聚類、最大似然法分類、面向?qū)ο蠓诸惙椒ㄔ诘乇硇畔⑻崛∩暇哂休^好的分類精度。
農(nóng)作物信息提取中,面向?qū)ο蠓诸惙椒ň哂凶罡叩姆诸惥?,究其原因是面向?qū)ο蠓诸惙椒ㄔ黾恿俗魑锏墓庾V、紋理等特征,將農(nóng)作物的信息最大程度地貢獻給分類器,從而得到更高的分類結(jié)果。
本研究通過GEE平臺進行農(nóng)作物分類研究,雖然取得較好的成果,但仍存在一定的問題。本研究選取的分類方法僅為三種,未引入更多的分類方法;本研究選用的Landsat影像,時間分辨率與空間分辨率較差,而且容易受到云雨影響,導(dǎo)致錯過最佳的農(nóng)作物信息監(jiān)測時期。下步研究將引入歐空局的Sentinel2影像進行研究。