陳利軍,陳 軍,廖安平,何超英
(國家基礎(chǔ)地理信息中心,北京100830)
地表覆蓋(land cover)是指地球表面各種物質(zhì)類型及其自然屬性與特征的綜合體,科學(xué)準(zhǔn)確地測定其空間分布與動態(tài)變化,對于研究地球系統(tǒng)的能量平衡、碳循環(huán)及其他生物地球化學(xué)循環(huán)、氣候變化等有著十分重要的意義[1-2]。國際社會十分重視全球地表覆蓋及其變化研究。經(jīng)過多年努力,國際上相繼研制了6套全球地表覆蓋數(shù)據(jù)產(chǎn)品,其中4套空間分辨率為1 km,2套空間分辨率為300m。這些產(chǎn)品已在全球變化研究與地球模式模擬中得到了廣泛應(yīng)用。隨著遙感技術(shù)的快速發(fā)展,全球變化研究與地球模式發(fā)展對全球地表覆蓋數(shù)據(jù)產(chǎn)品提出了新的需求,期望發(fā)展具有較高時空分辨率、更加符合全球變化需要、精度較好的全球地表覆蓋數(shù)據(jù)產(chǎn)品。
30 m分辨率是用于描述全球地表覆蓋及其變化的最佳尺度,可以更好地刻畫人類活動對陸面過程的影響,提高環(huán)境模型模擬過程中參數(shù)化的靈活[3]。同時,全球30 m分辨率的遙感數(shù)據(jù)十分豐富(如 Landsat MSS/TM/ETM+、ASTER、環(huán)境減災(zāi)衛(wèi)星、CBERS等),已完成全球范圍的多期無縫覆蓋,為全球地表覆蓋遙感制圖提供了數(shù)據(jù)保障。此外,地物要素的遙感提取算法也得到了很大的發(fā)展,為全球地表覆蓋遙感制圖提供技術(shù)保障。
但是,30 m尺度的影像光譜紋理信息比較復(fù)雜,空間分辨率的提高使得復(fù)雜的地物紋理特征得以顯現(xiàn),復(fù)雜的光譜紋理特征又會造成地表覆蓋信息方法提取的相應(yīng)繁雜。在區(qū)域尺度上,單一分類算法即可勝任地表覆蓋的信息提取;而全球范圍內(nèi)地表復(fù)雜多樣,光譜差異大,單一的分類算法則缺乏通用性。Lu等[4]對當(dāng)前分類方法進(jìn)行分析歸納,并把目前的分類方法總結(jié)為子像元分類、像元級分類、對象級分類、基于上下文信息的分類、基于先驗知識的分類與多分類器結(jié)合分類等6類,分類方法總數(shù)達(dá)到數(shù)十種,但各種方法均有一定的適用范圍及缺陷,不能直接運用于全球地表覆蓋遙感制圖。
鑒于30 m影像上復(fù)雜地物直接進(jìn)行多要素分類存在的種種問題,單要素提取方法逐漸得到快速發(fā)展。該方法通過逐一分析影像上每一類地物的特征,逐次完成各類地物的提取,而不求一次性的完成所有地物的提取。目前,單要素提取算法在某些地物類型提取方面已經(jīng)達(dá)到較高的精度。如Xiao等使用MODIS 8天合成的植被指數(shù)時間序列數(shù)據(jù),利用作物的物候特征分別完成了中國南部、南亞與東南亞地區(qū)水田的提取[5];Rosenqvist等使用日本地球資源衛(wèi)星的雷達(dá)數(shù)據(jù),完成了全球雨林制圖[6];Hasen等使用500 m分辨率的MODIS數(shù)據(jù)研究全球森林覆蓋[7];Hall等使用MODIS數(shù)據(jù),利用歸一化差值積雪指數(shù)進(jìn)行全球冰雪的提取[8];Frazier等使用 TM數(shù)據(jù)進(jìn)行水體要素的提取實驗[9];Miyazaki等使用 ASTER 數(shù)據(jù),利用局部-全局一致性學(xué)習(xí)算法(LLGC)完成了全球城市區(qū)域的提取[10]。因此,在全球地表覆蓋制圖過程中采取單要素逐層提取的方式,即層次分類的策略,在一定程度上降低了全球范圍內(nèi)由于區(qū)域、時相與地物類型差異造成的分類誤差,進(jìn)一步提高制圖效率和精度。本文主要針對中國開展的30 m全球地表覆蓋遙感制圖工程,初步探索新一代全球30 m地表覆蓋遙感制圖的總體思路。
全球地表覆蓋遙感制圖是一項龐大的遙感應(yīng)用工程,其自動化與智能化水平直接影響著工程效率與產(chǎn)品質(zhì)量。從遙感影像中提取地物的分類算法,是全球地表覆蓋制圖精度的關(guān)鍵。目前,利用自動分類結(jié)合人工解譯仍是進(jìn)行大尺度遙感分類的主導(dǎo)方法,這種方法具有算法成熟、充分利用人機(jī)交互優(yōu)勢的特點,但也存在著用時長,對參與解譯分析的人員依賴性強,可重復(fù)性低的局限,難以迅速、準(zhǔn)確、客觀地獲取大面積地表覆蓋信息。為了提高遙感分類算法的計算效率和自動化程度,30 m全球地表覆蓋遙感制圖采取層次分類策略的提取思路,即分層、特征提取、多分類器集成與基于專家知識的人工編輯等(見圖1)。
圖1 層次分類策略示意圖
首先,為了降低由于區(qū)域差異造成的地物類型復(fù)雜性,依據(jù)全球地表覆蓋分類體系,根據(jù)全球地形、土壤、氣候、植被及影像光譜等特性所反映的下墊面差異,將全球劃分為865個地表覆蓋類型差異明顯的生態(tài)地理區(qū),盡可能地減少每個生態(tài)地理分區(qū)中分布的地表覆蓋類型數(shù)量,避免了因大范圍區(qū)域地物類型復(fù)雜多樣造成的分類精度低的問題,提高遙感分類的效率和精度[11]。
其次,根據(jù)分類算法的需要對30m分辨率影像進(jìn)行分類前特征向量選擇與提取。有文獻(xiàn)表明分類過程中特征向量的選擇是影響分類成功與否的關(guān)鍵因素[4]。計算分類時所需要的諸多光譜和紋理特征,如植被指數(shù)、紋理信息、纓帽變化的濕度、亮度分量、裸地指數(shù)、居民地指數(shù)等,可以作為分類器的輸入向量,提高分類精度。
再次,通過分析比較目前傳統(tǒng)單要素分類算法的優(yōu)缺點,采取了單要素分層掩膜分類方法,即逐次完成單一地類的提取,完成后掩膜繼續(xù)進(jìn)行下一類地物的提取,這樣有利于減少其他不相關(guān)地物對單要素提取算法的影響。具體做法是依次提取水體—水體掩膜—提取濕地—濕地掩膜—提取冰雪—冰雪掩膜—提取人造覆蓋—人造覆蓋掩膜—提取耕地—耕地掩膜—提取裸地—裸地掩膜—綜合提取林灌草類型,各單類型提取采取不同的分類器,如水體和人造覆蓋采用決策樹的分類方法、耕地采用多源信息融合的方法、林、灌、草、裸地采用基于先驗概率的分類方法、冰雪采用自動閾值的分類方法、濕地和苔原采用人工提取的方式等。單類型提取完成后,最終對各分類結(jié)果進(jìn)行集成形成最終的分類結(jié)果。
最后,在多分類器集成基礎(chǔ)上,基于自主研發(fā)的人機(jī)交互式編輯軟件,利用專家知識和參考資料對自動提取過程中出現(xiàn)錯分、漏分等問題,進(jìn)行人工控制和修改,使分類結(jié)果達(dá)到最優(yōu)。
通過層次分類策略的引入,逐步降低全球地表覆蓋制圖中由于區(qū)域、時相與地物類型差異造成的分類誤差,可以進(jìn)一步提高制圖效率和精度。
以陜西省為例,采用13景2009年Landsat5 TM影像,分別采用層次分類策略、SVM、J48、RF(Random Forest)和貝葉斯等幾種分類方法進(jìn)行分類,然后采用同樣的檢驗樣本進(jìn)行檢驗。檢驗樣本為遍布試驗區(qū)的3291個多邊形,計34 462個像元。其結(jié)果如表1所示:層次分類策略的總體分類精度為78.56%,Kappa系數(shù)為 0.719 8,而其他分類方法中最高的為SVM分類方法,其總體分類精度為73.36%,Kappa 系數(shù)為0.608 0。
表1 陜西試驗區(qū)各種分類方法的精度比較
雖然,總體分類精度相近,但幾種分類方法的分類結(jié)果迥異。以層次分類策略和SVM為例,從表2、表3的混淆矩陣中可以看出:利用層次分類策略,單個類型的精度都能保障在60%以上;而利用SVM分類方法,除了耕地、森林、水體的精度較高外,其他類型的精度都在60%以下,其中草地僅為6.26%。從錯分率和漏分率看,兩種分類方法都集中在草地和灌木類型,如錯分率分別為72.44%和48.51%,漏分率分別為37.43%和93.74%,但兩種分類結(jié)果的精度差異較大,草地的分類精度分別為62.6%和6.26%,灌木的分類精度分別為71.5%和56.01%,層次分類策略的分類結(jié)果明顯要優(yōu)于SVM的分類結(jié)果。
表2 層次分類策略的混淆矩陣、錯分與漏分統(tǒng)計表 (%)
表3 SVM分類方法的混淆矩陣、錯分與漏分統(tǒng)計表 (%)
從類型所占的面積比例看,兩種分類結(jié)果除森林、裸地的比例相近外,其他類型相差達(dá)3% ~20%不等。如SVM分類方法將耕地錯分為耕地、灌木、裸地和人造覆蓋的比例高達(dá)79.78%、46.55%、43.34%和42.32%(如圖2局部實例所示);而采用層次分類策略,耕地錯分為草地、灌木、裸地和人造覆蓋的比例僅為 10.5%、0、1.34% 和 18.3%。由于層次分類策略采取了單類型分層提取的方式,通過層層控制的方法,能夠?qū)㈠e分比例降低到最低,有效地保證了單個類型的分類準(zhǔn)確度。
圖2 局部區(qū)域兩種分類結(jié)果的比較
為了驗證利用層次分類策略提取地表覆蓋方法的通用性和結(jié)果的精度,除了陜西試驗區(qū),在全球范圍內(nèi)又選擇了俄羅斯貝加爾湖地區(qū)、馬來西亞西島、德國中部、西班牙巴塞羅那地區(qū)、北非突尼斯、南非西南部、北美加拿大東南沿海地區(qū)、南美巴西亞馬遜河流域中游、澳大利亞塔斯馬尼亞島等9個地區(qū),分別采用這些試驗區(qū)的4-6景TM影像進(jìn)行了地表覆蓋遙感制圖的試驗。
由表4可以看出,除馬來西亞試驗區(qū)精度較低外,其他試驗區(qū)總體精度在70.4% ~90.26%之間,Kappa系數(shù)在0.622 8~0.851 0之間。而馬來西亞試驗區(qū)精度偏低的原因是該區(qū)域常年為厚云覆蓋,遙感影像質(zhì)量不佳所造成。由此可見,基于層次分類策略的地表覆蓋信息提取方法可以較好地完成全球不同試驗區(qū)地表覆蓋信息的提取,算法魯棒性與通用性較強,可以用于30m分辨率全球地表覆蓋產(chǎn)品的研制。
表4 10個試驗區(qū)地表覆蓋提取精度情況表
由于全球范圍內(nèi)地表覆蓋復(fù)雜多樣,光譜差異大,單一的分類算法進(jìn)行遙感制圖缺乏通用性,因此,本文以全球地表覆蓋遙感制圖工作為依托,針對提出的基于“分區(qū)—特征提取—多分類器集成—基于專家知識的人機(jī)交互”的層次分類策略進(jìn)行了試驗分析。結(jié)果表明,層次分類策略要優(yōu)于傳統(tǒng)的分類方法,如SVM、J48、RF和貝葉斯算法等。通過在10個典型試驗區(qū)的地表覆蓋提取試驗,除受大面積云影響的馬來西亞試驗區(qū)精度為65%之外,總體分類精度均達(dá)到70%以上,具有較強的魯棒性和通用性,可以用于30m分辨率地表覆蓋產(chǎn)品的生產(chǎn)。
[1]FOLEY J.2005.Global Consequences of Land Use[J].Science,2005(309):570-574.
[2]葛全勝,戴君虎,何凡能,等.過去300年中國土地利用、土地覆被變化與碳循環(huán)研究[J].中國科學(xué):D輯地球科學(xué),2008,38(2):197-210.
[3]LOVELAND T.Global Land Cover Initiative:A Concept Paper for GEO[R].Sioux Falls:USGSEROSDate Center,2010.
[4]LU D,WENGQ.A Survey of Image Classification Methods and Techniques for Improving Classification Performance[J].International Journal of Remote Sensing,2007,28(5):823-870.
[5]XIAO X,BOLESS,F(xiàn)ROLKING S,etal.Mapping Paddy Rice Agriculture in South and Southeast Asia Using Multi-Temporal MODIS Images[J].Remote Sensing of Environment,2006(100):95-113.
[6]ROSENQVISTA,SHIMADAM,CHAPMANB,etal.TheGlobalRainForestMappingProject-aReview[J].InternationalJournalofRemoteSensing,2000,21(6/7):1375-1387.
[7]HASENM,DEFRIESR,TOWNSHENDJ,etal.Global PercentTreeCoveratASpatialResolutionof500Meters FirstResultsoftheMODISVegetationContinuousFields Algorithm[J].ErathInteractions,2003,7:1-15.
[8]HALLD,RIGGSG,SALOMONSONV.Developmentof MethodsforMappingGlobalSnowCoverUsingModerate ResolutionImagingSpectroradiometerData[J].Remote SensingofEnvironment,1995(54):127-140.
[9]FRAZIERP,PAGEK.WaterBodyDetectionandDelineationwithLandsatTMData[J].PhotogrammetricEngineering & RemoteSensing,2000,66(12):1461-1467.
[10]MIYAZAKIH,SHAOX,IWAOK,etal.GlobalUrbanAreaMappinginHighResolutionUsingASTERSatelliteImages[C]∥InternationalArchivesofthePhotogrammetry,RemoteSensingandSpatialInformationScience:XXXVIII(8).Kyoto:[s.n.],2010.
[11]DEFOURNYP,VANCUTSEMC,BICHERONP,etal.GlobCover:A300mGlobalLandCoverProductfor2005 UsingEnvisatMERISTimeSeries[C]∥ ProceedingsofISPRSCommissionVIIMid-termSymposium:RemoteSensing:fromPixelstoProcesses,Enschede:[s.n.],2006.