宋宏利,張曉楠
(1.河北工程大學(xué) 地球科學(xué)與工程學(xué)院,河北 邯鄲056038;2.河北工程大學(xué) 礦業(yè)與測繪工程學(xué)院,河北 邯鄲056038)
基于VGI的土地覆被遙感產(chǎn)品精度驗(yàn)證
宋宏利1,張曉楠2
(1.河北工程大學(xué) 地球科學(xué)與工程學(xué)院,河北 邯鄲056038;2.河北工程大學(xué) 礦業(yè)與測繪工程學(xué)院,河北 邯鄲056038)
以GEO_WIKI和DegreeConfluenceProject獲取的自發(fā)地理信息為參考,通過誤差矩陣分析FROM-GLC-agg500m升尺度數(shù)據(jù)和MODISCOLLECTION5 兩種相同空間分辨率土地覆被遙感產(chǎn)品的類別精度及類別混淆,采用InverseDistanceWeighting模型計(jì)算FROM-GLC-agg500m數(shù)據(jù)的類別精度空間圖譜,結(jié)果表明:無論是制圖精度還是用戶精度,F(xiàn)ROM-GLC-agg500m數(shù)據(jù)與MODIS數(shù)據(jù)相比,并沒有表現(xiàn)出顯著的優(yōu)勢,兩種數(shù)據(jù)在林地與灌木、草地與裸地、耕地與灌木間存在一定程度的類別錯分現(xiàn)象;FROM-GLC-agg的類別精度圖表明在中國的西北部、東北及華北南部等裸地、林地及耕地聚集區(qū),類別精度較高,該區(qū)域約占研究區(qū)總面積的36.77%,而在青藏高寒區(qū)、中國西南部等地表景觀異質(zhì)性顯著區(qū)域,類別精度相對較低,約占研究區(qū)總面積的20%。
土地覆被;遙感產(chǎn)品;精度評價(jià);自發(fā)地理信息;反距離加權(quán)
精確的陸表土地覆被信息,是客觀真實(shí)地描述全球及區(qū)域尺度陸表生態(tài)系統(tǒng)結(jié)構(gòu)及其生態(tài)過程的關(guān)鍵因子[1-6],在生物地球化學(xué)、環(huán)境建模、水土流失、大氣環(huán)流模型、全球碳循環(huán)模型等方面均得到了廣泛應(yīng)用[7-10]。但已有研究表明,土地覆被的類別精度具有區(qū)域分布特征,全球尺度精度并不能很好的反映國家或區(qū)域尺度的類別精度,因此深入了解FROM-GLC-agg及其多尺度產(chǎn)品在國家或區(qū)域尺度的類別精度,并比較FROM-GLC-agg多尺度產(chǎn)品與目前已有的同級別土地覆被遙感產(chǎn)品的精度是亟待解決的問題。
本文擬以中國為研究區(qū)域(不含臺灣、南海諸島統(tǒng)計(jì)數(shù)據(jù)),定量比較FROM-GLC-agg500m分辨率產(chǎn)品和MODISCOLLECTION5產(chǎn)品對應(yīng)的類別精度;并探求FROM-GLC-agg數(shù)據(jù)類別精度在空間上的分布特征,和構(gòu)建研究區(qū)域類別精度圖譜,為中國區(qū)域相關(guān)領(lǐng)域研究合理選擇數(shù)據(jù)源提供科學(xué)依據(jù)。
1.1土地覆被遙感數(shù)據(jù)
本文擬對兩種空間分辨率為500m的土地覆被遙感數(shù)據(jù)進(jìn)行精度驗(yàn)證,一種是源于清華大學(xué)地球系統(tǒng)研究中心的FROM-GLC-agg尺度轉(zhuǎn)換產(chǎn)品[11];另一種是源于波士頓大學(xué)的MODISCOLLECTION5數(shù)據(jù)[12]。該兩種數(shù)據(jù)均可通過互聯(lián)網(wǎng)免費(fèi)獲取,鑒于FROM-GLC-agg產(chǎn)品的原始Landsat遙感影像有75%是2010年前后獲取,為了減小時間差異對于地表土地覆被類別的影響,本文選取2010年的MODISCOLLECTION5數(shù)據(jù)作為待驗(yàn)證對象。兩種數(shù)據(jù)的具體參數(shù)見表1。
表1 研究數(shù)據(jù)參數(shù)
Tab.1Parametersofstudydatasets
特征數(shù)據(jù)名稱FROM-GLC-agg500mMODISCOLLECTION5數(shù)據(jù)獲取時間2009.1~2010.122010.1~2010.12空間分辨率500m500m投影IntergridsinusoidalIntergridsinusoidal類別數(shù)1017
1.2參考數(shù)據(jù)
(1)GEO_WIKI數(shù)據(jù)
GEO_WIKI是以GoogleEarth為平臺開發(fā)的一個免費(fèi)的全球尺度土地覆被遙感數(shù)據(jù)驗(yàn)證數(shù)據(jù)庫,該數(shù)據(jù)庫中數(shù)據(jù)由世界各國相關(guān)領(lǐng)域科研工作者提供,數(shù)據(jù)庫中的每條記錄描述了陸表特定經(jīng)緯度交叉點(diǎn)的土地覆被類別組成,并且在向數(shù)據(jù)庫提交記錄時需提供該驗(yàn)證站點(diǎn)的信任度級別(包括絕對確認(rèn)、非常確認(rèn)、確認(rèn)和不確認(rèn)4個等級)。本文所用的GEO_WIKI驗(yàn)證數(shù)據(jù)庫在中國區(qū)域驗(yàn)證站點(diǎn)數(shù)目為3 406個。為了保證驗(yàn)證數(shù)據(jù)的可靠性,根據(jù)數(shù)據(jù)庫提供的關(guān)于GEO_WIKI驗(yàn)證數(shù)據(jù)的類別準(zhǔn)確度級別,選擇驗(yàn)證點(diǎn)準(zhǔn)確度級別為0(絕對準(zhǔn)確)和1(非常準(zhǔn)確)的驗(yàn)證點(diǎn)作為驗(yàn)證數(shù)據(jù),經(jīng)此條件過濾,中國區(qū)域共有2 187條可供使用數(shù)據(jù)。
(2)整度驗(yàn)證計(jì)劃數(shù)據(jù)
所謂整度驗(yàn)證計(jì)劃(DegreeConfluenceProject,DCP)發(fā)起于1996年,該計(jì)劃的目標(biāo)是拜訪地球上每一個整數(shù)緯度和經(jīng)度交匯處,并獲取每個交匯處及其周圍東南西北四個方向的地理標(biāo)簽照片,并且通過網(wǎng)絡(luò)將這些照片及照片描述發(fā)送到指定的網(wǎng)站,以用于各種領(lǐng)域的學(xué)術(shù)研究。為了保證數(shù)據(jù)的質(zhì)量,DCP團(tuán)隊(duì)會對上傳的地理照片通過與OpenStreetMap及GoogleEarth等數(shù)據(jù)進(jìn)行對比,從而發(fā)現(xiàn)明顯的錯誤和惡意信息。
本文選擇研究區(qū)內(nèi)經(jīng)緯整度交匯點(diǎn)作為驗(yàn)證樣點(diǎn),研究區(qū)內(nèi)共包括952個經(jīng)緯度交匯點(diǎn),其中完整訪問點(diǎn)數(shù)為406個,不完整訪問點(diǎn)數(shù)為35個,而未訪問點(diǎn)個數(shù)為511個。
為了構(gòu)建基于整度計(jì)劃的土地覆被參考數(shù)據(jù)庫,本文通過4位有豐富經(jīng)驗(yàn)的遙感方向?qū)I(yè)教師,根據(jù)照片紋理內(nèi)容及照片描述對已訪問的441個點(diǎn)進(jìn)行目視解譯。對于未訪問站點(diǎn),則通過現(xiàn)有土地覆被遙感產(chǎn)品及GoogleEarth軟件平臺對相應(yīng)位置的土地覆被類別進(jìn)行判讀。在解譯過程中每個教師須對每張照片的判讀記錄置信度,置信度分為完全確認(rèn)、確認(rèn)、不完全確認(rèn)和不確認(rèn)4個等級,為了提高驗(yàn)證精度,本文只選擇置信度為完全確認(rèn)和確認(rèn)的土地覆被類別作為參考數(shù)據(jù),經(jīng)過篩選,共有854個站點(diǎn)作為參考數(shù)據(jù)。
1.3數(shù)據(jù)預(yù)處理
已有研究表明,土地覆被遙感產(chǎn)品分類體系的差異是阻礙數(shù)據(jù)間互操作的重要原因。鑒于FROM-GLC-agg和MODISCOLLECTION5數(shù)據(jù)采用的分類體系并不相同,同時考慮到與GEO_WIKI數(shù)據(jù)的9類別分類體系的兼容性,筆者將陸地表面劃分為8個類別,并以聯(lián)合國國際聯(lián)農(nóng)組織提供的LCCS分類標(biāo)準(zhǔn)為依據(jù),對FROM-GLC-agg和MODISCOLLECTION5數(shù)據(jù)的類別進(jìn)行聚合,具體信息參見表2。
表2 土地覆被數(shù)據(jù)分類體系轉(zhuǎn)換表
Tab.2Landcoverclassification
編號類別名稱FROM-GLC-aggMODISCollection5GEO_WIKI1林地21-5,8,912灌木46,723草地31034耕地112,1445水域611,155,96建設(shè)用地81367裸地91688永久性冰雪10177
2.1基于誤差矩陣的類別精度分析
誤差矩陣已成為遙感領(lǐng)域制圖精度比較的常用方法。為了得到FROM-GLC-agg和MODISCOLLECTION5數(shù)據(jù)與參考數(shù)據(jù)間的誤差矩陣,本文以GEO_WIKI和DegreeConfluenceProject兩種自發(fā)地理信息為參考點(diǎn)數(shù)據(jù),在GIS軟件中,利用點(diǎn)屬性提取函數(shù)分別獲取參考點(diǎn)和待驗(yàn)證數(shù)據(jù)指定位置土地覆被類別,通過統(tǒng)計(jì)比較參考點(diǎn)類別與遙感數(shù)據(jù)類別差異,按規(guī)則填充誤差矩陣中各單元數(shù)值。根據(jù)誤差矩陣,計(jì)算出用戶精度(UA)、制圖精度(PA)、總體精度(OA)和Kappa系數(shù)(KA)等參數(shù)。
2.2類別精度空間分布特征分析
誤差矩陣盡管可以揭示土地覆被遙感數(shù)據(jù)類別精度的總體特征,但無法表達(dá)類別精度在空間上的分異規(guī)律。為此,本文提出了在誤差矩陣指示轉(zhuǎn)換基礎(chǔ)上,采用反距離加權(quán)模型(InverseDistanceWeighting,IDW)計(jì)算FROM-GLC-agg500m分辨率土地覆被產(chǎn)品在中國區(qū)域的類別精度空間特征,其計(jì)算思路為:首先,將研究區(qū)域內(nèi)的參考數(shù)據(jù)與FROM-GLC-agg數(shù)據(jù)在對應(yīng)位置一一進(jìn)行比較,如果參考數(shù)據(jù)的類別與驗(yàn)證數(shù)據(jù)的類別相同,則該點(diǎn)被賦予1,否則,該點(diǎn)被賦予0;在進(jìn)行指示轉(zhuǎn)換完成后,采用IDW計(jì)算模型,對研究區(qū)域進(jìn)行插值預(yù)測處理,其計(jì)算公式為:
(1)
3.1類別精度分析
圖1揭示了以GEO_WIKI和DegreeConfluenceProject為參考數(shù)據(jù),F(xiàn)ORM和MODIS兩種500m分辨率土地覆被遙感數(shù)據(jù)的類別精度。從圖1中可以看出,F(xiàn)ROM-GLC-agg數(shù)據(jù)的林地、耕地、建設(shè)用地及永久性冰雪的制圖精度均高于MODIS數(shù)據(jù),但灌木、草地、水域和裸地的制圖精度均低于MODIS數(shù)據(jù)。其主要原因是有兩點(diǎn):一是本文所采用的研究數(shù)據(jù)為FROM-GLC-agg的空間聚合產(chǎn)品,該數(shù)據(jù)是在原始30m分辨率數(shù)據(jù)基礎(chǔ)上,采用比例聚合方法進(jìn)行升尺度轉(zhuǎn)換后的500m土地覆被數(shù)據(jù),由于灌木、水域等類別在我國分布較少,且成零星分布特征,因此在聚合過程中會導(dǎo)致被其優(yōu)勢分布土地覆被類別取代,進(jìn)而降低了該兩種類別的制圖精度。二是在參考數(shù)據(jù)的類別比例中,灌木、草地、水域和裸地的比例相對較低,其中,灌木僅為41個點(diǎn),占參考數(shù)據(jù)總數(shù)的1.3%;水域?yàn)?0個點(diǎn),占參考數(shù)據(jù)總數(shù)的0.96%;草地和裸地均為120點(diǎn),約占參考數(shù)據(jù)總數(shù)的3.84%,由于驗(yàn)證點(diǎn)數(shù)量的稀少,一定程度上無法真實(shí)表達(dá)出土地覆被產(chǎn)品的類別精度,最終導(dǎo)致FROM數(shù)據(jù)的制圖精度低于MODIS數(shù)據(jù)。
對于用戶精度,F(xiàn)ROM-GLC-agg數(shù)據(jù)的水域、裸地和永久性冰雪的精度均高于MODIS數(shù)據(jù),但林地、灌木的精度均低于MODIS數(shù)據(jù),而兩者草地和耕地的精度幾乎相同。這說明,空間分辨率在提取陸表無物候變化特征地物上具有一定優(yōu)勢,但當(dāng)?shù)匚锎嬖诘湫偷奈锖蜃兓卣鲿r,其傳感器的空間分辨率優(yōu)勢即被時間和光譜分辨率優(yōu)勢取代。FROM-GLC-agg數(shù)據(jù)是以LandsatTM/ETM+為源數(shù)據(jù),該數(shù)據(jù)具有30m的空間分辨率,但其時間分辨率為16天,僅由7個可見光、近紅外波段構(gòu)成,而MODIS數(shù)據(jù)的空間分辨率雖僅為250~1 000m,但其時間分辨率為0.25天,擁有36個光譜波段,因此,MODISCOLLECTION5土地覆被數(shù)據(jù)與FROM-GLC-agg數(shù)據(jù)相比,更宜于林地、灌木等物候特征顯著的類別。
3.2土地覆被類別混淆分析
圖2揭示了FROM-GLC-agg數(shù)據(jù)、MODISCOLLECTION5數(shù)據(jù)與參考數(shù)據(jù)之間的類別混淆。從圖中可以看出,混淆主要發(fā)生于林地、灌木、耕地以及草地和裸地之間。例如,在參考數(shù)據(jù)中,有115個點(diǎn)的類別為耕地,但在FROM-GLC-agg產(chǎn)品中則均為林地,混淆率約占參考數(shù)據(jù)總數(shù)的17%;草地與裸地之間的混淆也較為嚴(yán)重,在參考數(shù)據(jù)中有145個點(diǎn)為草地,但在MODIS中則為裸地,類別混淆率達(dá)到了38%。上述類別混淆的原因主要是由于各種類別間的生命形態(tài)相似性,導(dǎo)致了林地、耕地、草地、灌木等類別的光譜特征十分相似,這增加了從遙感圖像本身識別的難度。
3.3類別精度空間分布特征
圖3和圖4揭示了FORM-GLC-agg500m數(shù)據(jù)的類別精度在研究區(qū)域的分布特征及各精度區(qū)間的面積百分比。類別精度取值區(qū)間為0~1,其中0代表該位置的類別精度最低,即該位置FORM-GLC-agg的類別與參考數(shù)據(jù)不一致;相反,1表示類別精度最高,即該位置的類別與參考數(shù)據(jù)一致。從圖中可以看出,類別精度具有顯著的空間集聚特征,其中0.8~1的高值區(qū)域主要分布于中國的西北、東北和華北中南部,該區(qū)域地表土地覆被類別較為單一,以裸地、耕地和林地為主,該區(qū)域面積約占研究區(qū)總面積的36.77%,說明FORM-GLC-agg數(shù)據(jù)的類別精度總體較高;0.4~0.8的中值區(qū)域主要分布于精度高值區(qū)域周圍,符合土地覆被類別的區(qū)域化變量特征,該區(qū)域土地覆被類別主要由草地、林地組成,該區(qū)域約占研究區(qū)總面積的50%;0~0.4的低值區(qū)域主要分布于中國的青藏高原和中國的西南部,該區(qū)域地表景觀呈現(xiàn)破碎分布特征,異質(zhì)性較強(qiáng),增加了遙感數(shù)據(jù)識別土地覆被類別的難度,但該區(qū)域所占比重較小,僅占研究區(qū)總面積的20%。
1)研究表明,無論是FORM-GLC-agg500m數(shù)據(jù)還是MODIS500m數(shù)據(jù),在林地與灌木、灌木與耕地以及草地與裸地之間均存在顯著的混淆現(xiàn)象,這說明對于通過遙感技術(shù)精確獲取陸表土地覆被類別仍存在較大的困難,應(yīng)該深入研究異物同譜問題,進(jìn)一步加強(qiáng)基于光譜特征空間區(qū)分相似土地覆被類別算法的研究。
2)FORM-GLC-agg500m數(shù)據(jù)的類別精度指示值預(yù)測結(jié)果表明,精度高值區(qū)域主要分布于地表景觀均質(zhì)性較強(qiáng)區(qū)域,主要分布于林地、耕地和裸地較為集中的中國東北、華北南部和西北地區(qū);而精度值較低區(qū)域主要分布于青藏高寒區(qū)、中國西南部等地,其地表景觀破碎較為嚴(yán)重,因此如何精確提取景觀異質(zhì)性區(qū)域土地覆被類別是今后亟待解決的問題。
[1]陳 軍,陳 晉,宮 鵬,等.全球地表覆蓋高分辨率遙感制圖[J].地理信息世界,2011(2):12-14.
[2]李曉兵.國際土地利用-土地覆蓋變化的環(huán)境影響研究[J].地球科學(xué)進(jìn)展,1999,14(4):395-400.
[3]李曉兵,陳云浩,喻 鋒.基于遙感數(shù)據(jù)的全球及區(qū)域土地覆蓋制圖-現(xiàn)狀、戰(zhàn)略和趨勢[J].地球科學(xué)進(jìn)展,2004,19(1):71-80.
[4]SUTHERLANDWJ,ADAMSWM,ARONSONRB,etal.Onehundredquestionsofimportancetotheconservationofglobalbiologicaldiversity[J].ConservationBiology,2009,23(3):557-567.
[5]LAMBINEF,GEISTHJ,LEPERSE.Dynamicsofland-useandland-coverchangeintropicalregions[J].AnnualReviewofEnvironmentandResources,2003,28(1):205-241.
[6]FEDDEMAJJ,OLESONKW,BONANGB,etal.Theimportanceofland-coverchangeinsimulatingfutureclimates[J].Science,2005,310(5754):1674-1678.
[7]BONANGB,OLESONKW,VERTENSTEINM,etal.ThelandsurfaceclimatologyofthecommunitylandmodelcoupledtotheNCARcommunityclimatemodel[J].JournalofClimate,2002,15(22):3123-3149.
[8]RUNNINGSW,NEMANIR,ANNH,etal.Acontinuoussatellite-derivedmeasureofglobalterrestrialprimaryproduction[J].Bioscience,2004,54(6):547-560.
[9]ZHANGK,KIMBALLJS,MUQZ,etal.SatellitebasedanalysisofnorthernETtrendsandassociatedchangesintheregionalwaterbalancefrom1983to2005[J].JournalofHydrology,2009,379(1):92-110.
[10]FOLEYJA,DEFRIESR,ASNERGP,etal.Globalconsequencesoflanduse[J].Science,2005,309(5734):570-574.
[11]俞 樂,王 杰,李雪草,等.基于多源數(shù)據(jù)集成的多分辨率全球地表覆蓋制圖[J].中國科學(xué):地球科學(xué),2014(8):5.
[12]FRIEDLMA,MCIVERDK,HODGESJCF,etal.GloballandcovermappingfromMODIS:algorithmsandearlyresults[J].RemoteSensingofEnvironment,2002,83(1):287-302.
(責(zé)任編輯 王利君)
Analysis of land cover category accuracy based on volunteered geographic information
SONGHongli1,ZHANGXiaonan2
(1.SchoolofEarthScienceandEngineering,HebeiUniversityofEngineering,HebeiHandan056038,China;2.SchoolofMiningandSurveyingEngineering,HebeiUniversityofEngineering,HebeiHandan056038,China)
Theinformationonlandcoveratnationalscalesiscriticalforaddressingclimatechange,biodiversityconservation,ecosystemassessmentandenvironmentalmodeling.TheVolunteeredGeographicInformationderivedfromtheGEO_WIKIandDegree-ConfluenceProjectwasusedasreferenceddata.ThecategoryaccuracyandthecategoryconfusionaboutFORM-GLC-agg500mandMODISCOLLECTION5werecomparedandthespatialdistributionofFORM-GLC-agg’scategoryaccuracywasanalyzed.Theresultsshowthat:thereisnosignificantdifferenceonproduceranduseraccuracybetweenFORM-GLC-aggandMODISdata.TheybothhaveaseriousconfusionbetweenForest/shrub,cropland/shrub,especiallythegrasslandandbareland.Thecategoryaccuracyhasanunevendistribution,forexample,itshighervaluemainlydistributesinnorthwestandnorthChina,andthelowervaluemoremainlydistributesinTibetPlateau,andsouthwestChina.Theresultscanprovidereferenceforlandcoverresearch.
Landcoverproducts;accuracyassessment;VolunteeredGeographicInformation;IDW
1673-9469(2016)04-0098-05doi:10.3969/j.issn.1673-9469.2016.04.021
2016-06-18
河北省自然科學(xué)基金資助項(xiàng)目(D2013402014) 特約專稿
宋宏利(1980-),男,河北撫寧人,博士,副教授,研究方向?yàn)榇蟪叨韧恋馗脖贿b感信息挖掘。
P
A