朱思坤,趙學(xué)勝
(中國礦業(yè)大學(xué)(北京)地球科學(xué)與測繪工程學(xué)院,北京 100083)
全球地表覆蓋分布及變化是氣候變化研究、生態(tài)環(huán)境評估、地理國情監(jiān)測、宏觀調(diào)控分析等不可或缺的一項重要基礎(chǔ)信息[1]。我國自主研制了世界上首套30 m空間分辨率的全球地表覆蓋數(shù)據(jù)集GlobeLand30,用于支持全球可持續(xù)發(fā)展和應(yīng)對氣候變化。GlobeLand30采用通用橫軸墨卡托投影(UTM)分幅組織數(shù)據(jù),按6°經(jīng)差分帶投影,全球分為60個投影帶,共853幅數(shù)據(jù)[2-3]。UTM投影為等角投影,為了保持較小的長度和面積變形而采用分帶投影的方法,分別將每一投影帶按照中央子午線兩側(cè)一定經(jīng)差范圍內(nèi)的橢球面正形投影于橢圓柱面[4-5]。這樣做可以保證投影之后的每一個投影帶內(nèi)的幾何變形較小,但是實際上也造成了空間數(shù)據(jù)的斷裂和重疊,導(dǎo)致全球空間數(shù)據(jù)實體的不連續(xù)[6-9]。如在研究一些具有明確邊界劃分的大尺度范圍問題時,往往采用矢量多邊形表示研究區(qū)域,而這些矢量數(shù)據(jù)為了保證數(shù)據(jù)的連續(xù)性無法采用UTM投影、高斯投影這樣的分帶投影,因這些投影方法每個投影帶都有各自坐標(biāo)系,投影空間上并不連續(xù)[10]。實際利用矢量提取研究區(qū)域數(shù)據(jù)時只能選擇根據(jù)投影分帶圖幅范圍裁切矢量數(shù)據(jù),并將裁切后的矢量數(shù)據(jù)投影至與之匹配的投影帶,如文獻[11-12]中采用了先將待統(tǒng)計區(qū)域的矢量數(shù)據(jù)的弧段進行線性內(nèi)插的方法,這樣就需要對每一幅數(shù)據(jù)分別處理,當(dāng)研究大尺度范圍時數(shù)據(jù)量很大,過程往往比較繁瑣,處理效率低下。
為了解決上述問題,本文擬采用全球退化四叉樹格網(wǎng)(Degenerate Quadtree Grid, DQG)代替原始地圖投影重新組織GlobeLand30,利用全球離散格網(wǎng)模型統(tǒng)一、連續(xù)、無縫、高效地表達地表覆蓋信息[13-17]。特別是DQG格網(wǎng)與其他球面離散格網(wǎng)相比,具有結(jié)構(gòu)簡單、幾何變形穩(wěn)定、廣泛的數(shù)據(jù)兼容性、層次性、徑向?qū)ΨQ性、方向一致性等優(yōu)點,便于聚類、統(tǒng)計分析、層次索引以及多分辨率的數(shù)據(jù)組織等操作[18-22]。最后選取典型區(qū)域及相應(yīng)的數(shù)據(jù)質(zhì)量評價指標(biāo),對比分析了GlobeLand30數(shù)據(jù)在UTM投影模式及DQG格網(wǎng)模式的定量化統(tǒng)計表達精度。
首先選取球內(nèi)接正八面體作為球面格網(wǎng)劃分的基礎(chǔ),首次剖分將球面劃分成八個完全相等的球面三角形,稱為八分體。以一個八分體為例,應(yīng)用退化四叉樹剖分方法,將八分體的三條邊按經(jīng)緯度平分,連接兩腰上的中點之間的緯線,再將該緯線中點與底邊中點以經(jīng)線連接,形成一個新的子球面三角形和兩個球面四邊形,為第一層剖分結(jié)果;第二層剖分時,球面三角形仍然按第一層剖分方法,子四邊形按照常規(guī)四叉樹剖分方法進行剖分;第三層重復(fù)第二層剖分方法……依次進行遞歸剖分,直到滿足一定分辨率要求為止,一個八分體的前三層剖分規(guī)則如圖1所示,第三、四、五層全球剖分格網(wǎng)示意圖如圖2所示。詳細(xì)剖分方法以及編碼規(guī)則參考文獻[23]中有具體論述。
圖1 DQG剖分原理Fig.1 Subdivision schemes of DQG
圖2 第三、四、五層全球DQG剖分結(jié)果Fig.2 DQG subdivision in diあerent levels(the 3rd,4th,5th level)
以球面離散格網(wǎng)模型代替地圖投影表達GlobeLand30,首先需要確定平面投影數(shù)據(jù)分辨率與DQG剖分層次的對應(yīng)關(guān)系。格網(wǎng)模型按照其固定剖分方法可以無限細(xì)分,直到達到模擬地表信息的目的,即達到分辨率要求。本文在按照退化四叉樹的方式剖分球面時,按照“轉(zhuǎn)換后的DQG格網(wǎng)單元小于原始數(shù)據(jù)柵格單元”的原則,剖分格網(wǎng)可達到更高分辨率,充分保留了原始數(shù)據(jù)的空間信息。原始數(shù)據(jù)的空間分辨率為30 m,按照公式(1)計算確定其所對應(yīng)的格網(wǎng)層次:
式中,INT為取整運算,R為地球半徑,d為原始數(shù)據(jù)分辨率,N為對應(yīng)的DQG剖分層次。根據(jù)公式確定選取第19層DQG表達原始數(shù)據(jù),實現(xiàn)數(shù)據(jù)從地圖投影到DQG模型的轉(zhuǎn)換。
由于GlobeLand30為分類后結(jié)果,屬于離散的定性地理空間數(shù)據(jù),利用球面格網(wǎng)重新表達時,格網(wǎng)賦值地類必須唯一確定且與原始數(shù)據(jù)分類結(jié)果相吻合,不能出現(xiàn)地表覆蓋結(jié)果的疏漏或增加。因此,本文選取最近鄰重采樣方法,以格網(wǎng)中心點為采樣點確定格網(wǎng)所對應(yīng)的地表覆蓋類型,生成格網(wǎng)模型數(shù)據(jù)結(jié)果。具體方法為:
1)首先根據(jù)DQG地址碼確定格網(wǎng)中心點坐標(biāo),詳細(xì)DQG地址碼與經(jīng)緯度坐標(biāo)的轉(zhuǎn)換方法見參考文獻[24]文中所述。
2)將第19層DQG的格網(wǎng)中心點投影到原始數(shù)據(jù)投影空間中,確定格網(wǎng)中心點地表覆蓋類型。
3)將格網(wǎng)所屬地表覆蓋類型賦值為格網(wǎng)中心點在原始數(shù)據(jù)中的地表覆蓋類型,得到格網(wǎng)模型數(shù)據(jù)結(jié)果。
由于計算機處理能力的限制,不可能將海量的大范圍空間數(shù)據(jù)一次性裝入內(nèi)存處理,必須對數(shù)據(jù)進行分塊處理。為了同時兼顧高效的數(shù)據(jù)存取與數(shù)據(jù)查詢操作,以第6層DQG格網(wǎng)范圍分塊組織轉(zhuǎn)換后的數(shù)據(jù)。即以第6層格網(wǎng)范圍無縫組織成數(shù)據(jù)瓦片,對于每一塊格網(wǎng)瓦片,以轉(zhuǎn)換后的第19層格網(wǎng)單元作為基本像元,每一塊瓦片數(shù)據(jù)包含8 192×8 192個格網(wǎng)像元。以該格網(wǎng)瓦片對應(yīng)的唯一編碼命名數(shù)據(jù),并以文件夾的方式保存數(shù)據(jù)結(jié)果。
DQG本質(zhì)上屬于變經(jīng)緯度格網(wǎng),為了保證格網(wǎng)單元面積的近似相等而采取了隨緯度由低到高逐區(qū)退化的操作。對基于DQG重新表達后的GlobeLand30進行地學(xué)統(tǒng)計時,應(yīng)考慮到DQG格網(wǎng)單元的非均勻性、變形分布的不規(guī)則性對空間采樣合理性和統(tǒng)計精度的影響。以往DQG格網(wǎng)研究主要探討了格網(wǎng)模型幾何屬性的總體變化特性,對格網(wǎng)幾何變形的空間位置分布的定量化研究較少,同時也缺乏相應(yīng)精度評定標(biāo)準(zhǔn)。為此,本文選取球面上不同區(qū)域地理實體作為研究樣本,以采樣點變化率為指標(biāo)分析DQG模型的空間采樣合理性以及其對數(shù)據(jù)轉(zhuǎn)換精度的影響;并以區(qū)域總面積變化、各地類構(gòu)成占比等指標(biāo)分析統(tǒng)計精度變化。
為了在實際應(yīng)用時控制誤差,需分析數(shù)據(jù)轉(zhuǎn)換精度隨DQG格網(wǎng)空間位置分布的變化規(guī)律。由于DQG格網(wǎng)單元大小主要隨瓦片數(shù)據(jù)的緯度范圍變化,所以,選取N45帶原始數(shù)據(jù)(如圖3所示)進行實驗,轉(zhuǎn)換生成DQG瓦片數(shù)據(jù)結(jié)果(如圖4所示)。分別對每塊原始數(shù)據(jù)按均勻分布隨機生成三組不同數(shù)量級的變化檢驗點,進行抽樣調(diào)查,比較采樣點在原始數(shù)據(jù)中的地表覆蓋類型與其在DQG模型數(shù)據(jù)中的地表覆蓋類型變化。以采樣點平均變化率(地表覆蓋類型變化點數(shù)/總抽樣點數(shù))為指標(biāo),分析DQG表達原始數(shù)據(jù)的精度變化,結(jié)果見表1。
圖3 GlobeLand30平面投影模型Fig.3 Projection model of GlobeLand30
圖4 DQG球面數(shù)據(jù)模型Fig.4 Sphere model of DQG
表1 數(shù)據(jù)轉(zhuǎn)換精度隨空間位置分布Tab.1 Spatial distribution of data conversion accuracy
從實驗結(jié)果可以看出:三組對照實驗結(jié)果都相差不大,結(jié)果一致,說明隨機采樣實驗結(jié)果可信。在球面不同緯度區(qū)域內(nèi),采樣點變化率與格網(wǎng)單元大小關(guān)系密切,格網(wǎng)單元越小,采樣點變化率越小。整體上看,雖然數(shù)據(jù)轉(zhuǎn)換精度由于DQG格網(wǎng)單元的面積不均勻分布而隨之變化,但由于剖分層次較高,如前所述,所有格網(wǎng)單元均小于原始數(shù)據(jù)像元,總體數(shù)據(jù)變化率較小,最小低于1%,最高也只有5%左右。
選取0~45°區(qū)、跨退化區(qū)內(nèi)代表性地理實體分別為:西藏(0~45°)、新疆(跨退化區(qū))作為研究區(qū)域。由UTM投影數(shù)據(jù)轉(zhuǎn)換生成DQG瓦片數(shù)據(jù),以格網(wǎng)單元球面面積代替投影面積計算統(tǒng)計,并以原始數(shù)據(jù)在等積圓柱投影下統(tǒng)計結(jié)果作為理論參考值,檢驗DQG數(shù)據(jù)的精度和度量準(zhǔn)確性,區(qū)域總面積統(tǒng)計結(jié)果見表2、表3,各類地表覆蓋面積占比統(tǒng)計結(jié)果見表4。
表2 西藏地表覆蓋面積統(tǒng)計Tab.2 Land cover area statistics in Tibet
表3 新疆地表覆蓋面積統(tǒng)計Tab.3 Land cover area statistics in Xinjiang
表4 西藏和新疆地表覆蓋構(gòu)成占比統(tǒng)計Tab.4 Land cover proportion statistics in Tibet and Xinjiang
從表中可以看出:①無論處于球面哪一個區(qū)域,格網(wǎng)模型總面積統(tǒng)計結(jié)果與等積投影統(tǒng)計結(jié)果(理論參考值)相差都很小,面積變形率小于1%,保證了DQG面積度量的準(zhǔn)確性;②每一個研究區(qū)域內(nèi),每一類地表覆蓋數(shù)據(jù)的格網(wǎng)模型統(tǒng)計結(jié)果也都與理論值相差很小,而且其面積變化率都與總面積變化率一致,說明總體上各類地表覆蓋面積變形趨勢一致;③除了DQG模型面積統(tǒng)計結(jié)果變化很小之外,每一類地表覆蓋面積占比幾乎不變化。
本文以全球離散格網(wǎng)為基礎(chǔ)重新組織表達GlobeLand30數(shù)據(jù),研究了基于DQG格網(wǎng)框架的數(shù)據(jù)應(yīng)用與分析模式。在無縫高效地表達地表覆蓋信息的基礎(chǔ)上,分析了基于DQG應(yīng)用GlobeLand30的數(shù)據(jù)轉(zhuǎn)換精度以及可靠性,得到以下結(jié)論:
1)基于DQG代替地圖投影表達GlobeLand30數(shù)據(jù),有效解決了投影過程帶來的數(shù)據(jù)斷裂、兩極數(shù)據(jù)變形較大等一系列問題;特別是DQG本質(zhì)上是一種變間隔的經(jīng)緯度格網(wǎng),與GlobeLand30數(shù)據(jù)的原有經(jīng)緯度存儲格式基本一致,數(shù)據(jù)轉(zhuǎn)換簡單直接,可以作為一種GlobeLand30數(shù)據(jù)的有效組織和表達模式。
2)通過確定格網(wǎng)模型質(zhì)量評價指標(biāo)與誤差控制方法,基于DQG統(tǒng)計分析地表覆蓋信息的結(jié)果能夠保持原始數(shù)據(jù)的精度,滿足大多數(shù)實際應(yīng)用需要。
實驗分析發(fā)現(xiàn)格網(wǎng)模型的單元面積直接影響數(shù)據(jù)表達精度,雖然可以通過整體系統(tǒng)控制手段減小誤差,但是對變形及誤差的具體分布規(guī)律以及定量化表達還只是初步探索性的,并且精度評價標(biāo)準(zhǔn)的選擇也是根據(jù)特定的應(yīng)用需求,仍需進一步研究構(gòu)建一整套球面格網(wǎng)系統(tǒng)的可靠性評估模型與質(zhì)量控制方法。