侯瑞霞 張乃靜 肖云丹 紀(jì) 平
(1. 中國林業(yè)科學(xué)研究院資源信息研究所,北京 100091;2. 國家林業(yè)和草原科學(xué)數(shù)據(jù)中心,北京 100091;3. 國家林業(yè)和草原局林業(yè)遙感與信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100091)
具有空間含義的多級森林資源數(shù)據(jù),承載著不同空間專題信息,數(shù)據(jù)以不同空間形式存在。在信息技術(shù)和大數(shù)據(jù)技術(shù)等不斷迅猛發(fā)展的時(shí)代,不同的森林作業(yè)形式、不同的經(jīng)營管理模式以及不同渠道獲取的森林資源數(shù)據(jù),展現(xiàn)了多尺度、非結(jié)構(gòu)化、多源性等特征,但是卻又在不同空間尺度和時(shí)間尺度上具有密切的關(guān)聯(lián)性。在森林資源數(shù)據(jù)的分析、更新和業(yè)務(wù)調(diào)查應(yīng)用等工作中,業(yè)務(wù)處理工作要求獲取的空間數(shù)據(jù)是連續(xù)的以及可相互查詢的,但是面對表達(dá)形式多樣、不同時(shí)間點(diǎn)(段)的森林資源空間數(shù)據(jù),如何有效的完成多源異構(gòu)的、不同空間尺度的數(shù)據(jù)集成就成為了數(shù)據(jù)共享和信息智能檢索應(yīng)用的一個(gè)亟待解決的問題[1?4]。
數(shù)據(jù)空間作為一個(gè)新的概念由此被提出,國內(nèi)相關(guān)的研究正在信息集成和空間數(shù)據(jù)整合領(lǐng)域開展[4?6]。國家林業(yè)和草原科學(xué)數(shù)據(jù)中心根據(jù)信息需求的導(dǎo)向,集成多渠道獲取的森林資源數(shù)據(jù),本文分析了多源森林資源空間數(shù)據(jù)的特質(zhì)和差異性,揭示森林中包含的各種因素之間的空間交互關(guān)系以及內(nèi)在變化規(guī)律。同時(shí),通過森林資源空間數(shù)據(jù)的關(guān)聯(lián)性分析,實(shí)現(xiàn)了多源性森林資源空間數(shù)據(jù)的統(tǒng)一表達(dá),為林業(yè)資源空間語義檢索與共享服務(wù)提供空間信息支撐。
森林資源是一個(gè)自身不斷變化的研究對象,作為一個(gè)動態(tài)生長的群體[4],其內(nèi)在生長的個(gè)體相互間存在競爭和互生的關(guān)系,因此,從中獲取的空間數(shù)據(jù)的表達(dá)也存在著不確定性。
傳統(tǒng)的林業(yè)工作野外數(shù)據(jù)采集模式,形成了大量的歷史空間資源數(shù)據(jù)積累,手繪地圖和地圖數(shù)字化是主要的空間數(shù)據(jù)獲取途徑。然而,隨著智慧感知技術(shù)和互聯(lián)網(wǎng)+技術(shù)的不斷發(fā)展,遙感信息技術(shù)、數(shù)字采集以及無人機(jī)拍攝識別等不同渠道的數(shù)據(jù)均成為森林資源空間數(shù)據(jù)匯集的重要組成部分。不同手段獲得的數(shù)據(jù),其存儲格式和處理手段各不相同,從而形成了多種格式數(shù)據(jù)源共存的局面[4]。信息技術(shù)不斷創(chuàng)新,在森林資源空間數(shù)據(jù)采集的過程中,不同空間區(qū)劃的采集標(biāo)準(zhǔn)、采集渠道以及不同操作者等因素,導(dǎo)致空間數(shù)據(jù)的多源性和差異性。
森林資源空間數(shù)據(jù)以專題調(diào)查的形式存儲[7],在基礎(chǔ)地理空間數(shù)據(jù)的基礎(chǔ)上,進(jìn)行專題信息的采集,為林業(yè)的各級應(yīng)用和管理部門服務(wù)。由于各級業(yè)務(wù)職能的不同,數(shù)據(jù)的關(guān)注重點(diǎn)也各有不同,因此,森林資源各類空間數(shù)據(jù)所承載的關(guān)注因子也有不同的側(cè)重點(diǎn)(表1)。
表1 森林資源空間數(shù)據(jù)因子關(guān)注重點(diǎn)Table 1 Focus on forest resource spatial data factors
伴隨著信息技術(shù)的不斷進(jìn)步,森林資源空間數(shù)據(jù)以多種形式的表達(dá)方式,充分展示了森林資源的真實(shí)狀況。在不同的空間尺度下,同一個(gè)森林資源空間實(shí)體的表現(xiàn)形式是可以互相轉(zhuǎn)化的。因此,根據(jù)不同的數(shù)據(jù)可視化需求,森林資源空間數(shù)據(jù)實(shí)現(xiàn)了空間與屬性信息表達(dá)的關(guān)聯(lián),從數(shù)據(jù)表達(dá)形式上,可以劃分為:點(diǎn)狀數(shù)據(jù)、線狀數(shù)據(jù)、面狀數(shù)據(jù)等;從數(shù)據(jù)展示類別上,可以劃分為:表格數(shù)據(jù)、矢量數(shù)據(jù)、柵格數(shù)據(jù)(表2)。
表2 森林資源空間數(shù)據(jù)類別與表達(dá)Table 2 Data categories and expression of forest resource space
實(shí)現(xiàn)多源的森林資源空間數(shù)據(jù)集成,必須具備三個(gè)必要條件:空間數(shù)據(jù)、集成軟件以及集成規(guī)則[8?11]??臻g數(shù)據(jù)是集成的對象;集成軟件是載體,通常是指可以進(jìn)行空間信息處理的通用或?qū)n}GIS軟件,利用其提供的功能,能夠?qū)崿F(xiàn)數(shù)據(jù)集成的主要操作流程;集成規(guī)則,是指空間數(shù)據(jù)集成的依據(jù),也是數(shù)據(jù)集成的標(biāo)準(zhǔn)參照(圖1)。
圖1 森林資源空間數(shù)據(jù)集成機(jī)制Fig. 1 Space data integration mechanism of forest resources
空間數(shù)據(jù)集成,是指在對多源性森林資源空間數(shù)據(jù)進(jìn)行類別劃分的基礎(chǔ)上,按照數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)進(jìn)行空間數(shù)據(jù)的質(zhì)量檢查,對整體采集或整理的空間數(shù)據(jù)實(shí)現(xiàn)統(tǒng)一管理,形成有效的、完整的空間數(shù)據(jù)集[12?14]。隨后,利用空間坐標(biāo)轉(zhuǎn)換、空間模式轉(zhuǎn)換以及多尺度集成手段,完成森林資源空間數(shù)據(jù)的空間定位統(tǒng)一表達(dá);進(jìn)而,采用多層次空間集成方法,完成空間數(shù)據(jù)的集成分析,提取空間數(shù)據(jù)的變化因子,實(shí)現(xiàn)多源性森林資源空間數(shù)據(jù)的信息統(tǒng)一表達(dá),為林業(yè)資源空間語義檢索與共享服務(wù)提供空間信息支撐。
2.2.1 森林資源空間數(shù)據(jù)集成質(zhì)量控制
森林資源空間數(shù)據(jù)在形式上包括:矢量數(shù)據(jù)、屬性數(shù)據(jù)和柵格數(shù)據(jù)等,進(jìn)行空間數(shù)據(jù)的集成工作的第一步就是要實(shí)現(xiàn)各類森林資源數(shù)據(jù)在完整性、準(zhǔn)確性等方面的數(shù)據(jù)質(zhì)量控制,這樣才能確??臻g數(shù)據(jù)集成的統(tǒng)一表達(dá)。
森林資源空間數(shù)據(jù)質(zhì)量控制,主要包括:基礎(chǔ)檢查和集成規(guī)則檢查[12]。基礎(chǔ)檢查是保證空間數(shù)據(jù)集成可操作性的第一步,包括文件形式檢查和空間基準(zhǔn)檢查等。其中,空間基準(zhǔn)檢查又包括地理坐標(biāo)系統(tǒng)檢查和投影坐標(biāo)系統(tǒng)檢查。在數(shù)據(jù)檢查中,空間基準(zhǔn)檢查相當(dāng)重要,可確保各種空間信息之間關(guān)系的準(zhǔn)確表達(dá),完成空間數(shù)據(jù)應(yīng)用共享。森林資源空間數(shù)據(jù)集成的關(guān)鍵是梳理各要素之間的邏輯關(guān)系和拓?fù)潢P(guān)系,因此,集成規(guī)則檢查是保證實(shí)現(xiàn)空間數(shù)據(jù)統(tǒng)一表達(dá)的重要手段,主要包括:屬性數(shù)據(jù)檢查、邏輯一致性檢查以及拓?fù)潢P(guān)系合理性檢查等。進(jìn)行森林資源空間數(shù)據(jù)質(zhì)量控制,是空間信息共享服務(wù)的前提和關(guān)鍵[15?17]。
2.2.2 森林資源空間數(shù)據(jù)轉(zhuǎn)換
森林資源空間數(shù)據(jù)轉(zhuǎn)換需要三個(gè)方面的信息:1)空間定位信息;2)空間關(guān)系;3)屬性數(shù)據(jù)。森林資源空間數(shù)據(jù)具有空間定位屬性,不同時(shí)間段形成的空間數(shù)據(jù),具有對應(yīng)的空間基準(zhǔn)特征,統(tǒng)一的空間基準(zhǔn)是保證空間數(shù)據(jù)集成的一致性、兼容性或可轉(zhuǎn)換性的基礎(chǔ)條件。一般來說,森林資源空間數(shù)據(jù)的空間基準(zhǔn)信息包括兩個(gè)方面:坐標(biāo)系統(tǒng)和投影系統(tǒng)。坐標(biāo)系的統(tǒng)一是數(shù)據(jù)格式轉(zhuǎn)換的基礎(chǔ),也是數(shù)據(jù)集成的基礎(chǔ)。地面上任意一點(diǎn)的位置,均可以采用不同的坐標(biāo)系來表示。根據(jù)數(shù)據(jù)分析的結(jié)果,本文中所采集的森林資源空間數(shù)據(jù)涵蓋了北京1954年坐標(biāo)系和1980年西安坐標(biāo)系,需要進(jìn)行坐標(biāo)系統(tǒng)一工作,以確??臻g數(shù)據(jù)集成的準(zhǔn)確性。
森林資源空間數(shù)據(jù)通過傳統(tǒng)森林作業(yè)手段和不斷更新的信息采集技術(shù)獲取,不同的采集途徑獲得的空間數(shù)據(jù)表達(dá)形式多種多樣,產(chǎn)生不同的空間數(shù)據(jù)格式[10]??臻g數(shù)據(jù)格式轉(zhuǎn)換是做到有效的空間數(shù)據(jù)集成的關(guān)鍵環(huán)節(jié)??臻g數(shù)據(jù)格式轉(zhuǎn)換,即通過專用的轉(zhuǎn)換程序,把一種格式的空間數(shù)據(jù)轉(zhuǎn)換成另一種格式的數(shù)據(jù),也可以利用定位信息和屬性信息進(jìn)行不同的數(shù)據(jù)類型的轉(zhuǎn)換,以實(shí)現(xiàn)空間數(shù)據(jù)集成的完整性。空間數(shù)據(jù)格式轉(zhuǎn)換的表現(xiàn)形式,包括不同軟件數(shù)據(jù)格式的轉(zhuǎn)換、不同數(shù)據(jù)類型數(shù)據(jù)格式的轉(zhuǎn)換以及不同版本的數(shù)據(jù)格式轉(zhuǎn)換[17]。
本文中森林資源空間數(shù)據(jù)轉(zhuǎn)換主要通過GIS軟件平臺實(shí)現(xiàn):首先,確定數(shù)據(jù)格式轉(zhuǎn)換的對象,分析標(biāo)準(zhǔn)數(shù)據(jù)格式的組織方式,確定其空間定位范圍和屬性信息的關(guān)聯(lián)關(guān)系;其次,利用轉(zhuǎn)換工具將其他數(shù)據(jù)轉(zhuǎn)為標(biāo)準(zhǔn)數(shù)據(jù)格式。數(shù)據(jù)轉(zhuǎn)換方法包括:數(shù)據(jù)直接讀取、帶入模型轉(zhuǎn)換和數(shù)據(jù)表現(xiàn)形式轉(zhuǎn)換輸出等。
本文的研究區(qū)域定位于廣西熱林中心,收集整理的森林資源空間數(shù)據(jù)主要包括該區(qū)域四個(gè)年度的森林資源二類調(diào)查數(shù)據(jù)和兩個(gè)年度的森林資源系統(tǒng)抽樣調(diào)查數(shù)據(jù)。這些空間數(shù)據(jù)的采集時(shí)間跨度近二十年,數(shù)據(jù)信息變化程度大,需要全方位空間數(shù)據(jù)集成,尋找其關(guān)聯(lián)關(guān)系,為進(jìn)一步開展森林資源空間數(shù)據(jù)信息共享及檢索分析提供支撐。
本文分別采集了1998年、2004年、2009年和2014年的森林資源二類調(diào)查數(shù)據(jù),以面狀信息表達(dá)資源調(diào)查小班的空間分布狀態(tài)、面積、形狀、位置以及實(shí)體自身屬性。研究采集的森林資源系統(tǒng)抽樣調(diào)查數(shù)據(jù)包括2011年和2013年兩個(gè)年度的數(shù)據(jù),以點(diǎn)狀信息表達(dá)資源調(diào)查空間對象的位置、相對方向以及自身屬性。
森林資源空間數(shù)據(jù)自身是一個(gè)消長變化的數(shù)據(jù),在變化進(jìn)程中,多時(shí)間點(diǎn)所采集的數(shù)據(jù)分別存儲,時(shí)間作為數(shù)據(jù)的一個(gè)屬性特征存在,形成時(shí)間尺度表達(dá)的空間數(shù)據(jù)。不同時(shí)段的數(shù)據(jù),在集成結(jié)果數(shù)據(jù)中占有不同的比重;空間屬性特征由不同時(shí)段的數(shù)據(jù)集成密度相互作用,數(shù)據(jù)集成的密度大,數(shù)據(jù)特征的權(quán)重就高,數(shù)據(jù)的可信度也就越高。疊加分析是指利用數(shù)據(jù)要素之間的相關(guān)關(guān)系,對多時(shí)間尺度數(shù)據(jù)進(jìn)行處理。
空間數(shù)據(jù)的集成在相同的數(shù)據(jù)類型存儲狀態(tài),以及統(tǒng)一的空間投影坐標(biāo)系統(tǒng)的前提下進(jìn)行,通過準(zhǔn)確的獲取空間關(guān)聯(lián)信息,充分掌握森林資源的空間變化狀況,為林業(yè)資源信息空間檢索與數(shù)據(jù)檢索提供分析數(shù)據(jù)支撐。
本文中森林資源調(diào)查數(shù)據(jù)為空間數(shù)據(jù),森林資源系統(tǒng)抽樣調(diào)查數(shù)據(jù)以屬性表信息存在,屬性表中存儲空間坐標(biāo)信息,其X、Y坐標(biāo)的標(biāo)示點(diǎn)與森林資源二類調(diào)查數(shù)據(jù)的小班在空間上是重疊的。根據(jù)坐標(biāo)點(diǎn)數(shù)據(jù),可以將森林資源系統(tǒng)抽樣調(diào)查屬性表數(shù)據(jù)轉(zhuǎn)換為樣地空間點(diǎn)狀分布數(shù)據(jù),從而實(shí)現(xiàn)空間數(shù)據(jù)集成的數(shù)據(jù)類型統(tǒng)一(圖2)。
圖2 空間數(shù)據(jù)不同表達(dá)方式轉(zhuǎn)換Fig. 2 Conversion of spatial data in different expressions
本文中所采集的森林資源調(diào)查數(shù)據(jù)空間位置為固定信息,不同年度的數(shù)據(jù),由于采用了不同的坐標(biāo)系統(tǒng)和地圖投影標(biāo)準(zhǔn),在空間位置上具有偏差。在分析各年度空間投影信息的基礎(chǔ)上,進(jìn)行投影轉(zhuǎn)換工作,使各年度的空間數(shù)據(jù)存儲于統(tǒng)一的空間坐標(biāo)系統(tǒng)中,完成空間數(shù)據(jù)的空間信息標(biāo)準(zhǔn)化。
經(jīng)過對數(shù)據(jù)的空間信息提取得知,1998年與2009年的數(shù)據(jù)空間投影坐標(biāo)信息相同,為Gauss_Kruger3度投影,Beijing_1954_3_Degree_GK_Zone_36坐標(biāo);2004年的森林資源調(diào)查數(shù)據(jù)為GCS_WGS_1984經(jīng)緯度坐標(biāo),未加載投影信息;2014年數(shù)據(jù)為Gauss_Kruger3度投影,Xian_1980_3_Degree_GK_Zone_36坐標(biāo)。以2009年森林資源調(diào)查空間數(shù)據(jù)作為空間基準(zhǔn),利用ArcGIS軟件的投影轉(zhuǎn)換和坐標(biāo)轉(zhuǎn)換功能,實(shí)現(xiàn)多年度空間數(shù)據(jù)的空間信息統(tǒng)一。投影轉(zhuǎn)換前,圖斑位置錯(cuò)位明顯,誤差高達(dá)90 m左右,經(jīng)過投影轉(zhuǎn)換和坐標(biāo)匹配,兩個(gè)年度的數(shù)據(jù)空間位置基本吻合。
森林資源空間數(shù)據(jù)在完成數(shù)據(jù)類型轉(zhuǎn)換和空間投影配置后,將森林資源調(diào)查數(shù)據(jù)與森林資源系統(tǒng)抽樣調(diào)查數(shù)據(jù)進(jìn)行空間疊加,從而落實(shí)樣地點(diǎn)分布與資源小班的空間關(guān)聯(lián)關(guān)系。樣地點(diǎn)分布在資源調(diào)查小班中,可以通過點(diǎn)與面的包含關(guān)系查詢對含有樣地點(diǎn)的小班進(jìn)行提取,為資源信息分析提供空間對比數(shù)據(jù)。
分別以四個(gè)年度森林資源調(diào)查數(shù)據(jù)和2011年抽樣調(diào)查數(shù)據(jù)進(jìn)行疊加信息提取,實(shí)驗(yàn)區(qū)提供的抽樣調(diào)查樣地布設(shè)共238個(gè),按照樣地空間定位為基準(zhǔn),分別與各年度森林資源調(diào)查數(shù)據(jù)實(shí)行空間位置疊加,提取應(yīng)用分布示例數(shù)據(jù)。其中,1998年數(shù)據(jù)提取235個(gè)空間分布單元數(shù)據(jù),2004年數(shù)據(jù)提取232個(gè)空間分布單元數(shù)據(jù),2009年共提取出233個(gè)小班空間分布數(shù)據(jù),2014年共提取186個(gè)與小班空間位置疊合的空間分布數(shù)據(jù)。
以提取空間單元數(shù)量最多的2009年森林資源空間分布為基礎(chǔ),分別對1998年、2004年和2014年的空間數(shù)據(jù)進(jìn)行疊加集成。經(jīng)過分析可知,空間數(shù)據(jù)變化主要分為三種類型:空間信息合并、空間信息分割和空間重新劃分(圖3)。
圖3 空間數(shù)據(jù)多源集成不同尺度數(shù)據(jù)變化類型Fig. 3 Spatial data multi-source integration of different scales of data change types
空間數(shù)據(jù)合并是指多源數(shù)據(jù)經(jīng)過多次調(diào)查后,同處一個(gè)空間層次上的森林資源主要空間信息因子重合度較高,歸并為一個(gè)森林資源空間區(qū)劃單位。在進(jìn)行空間信息查詢時(shí),空間區(qū)劃單位中所包含的森林資源調(diào)查信息中的優(yōu)勢樹種、森林類別、林種等內(nèi)容,進(jìn)行多源信息相似度為100%。
空間數(shù)據(jù)分割是指一個(gè)森林資源小班由于進(jìn)行政策干預(yù)或森林經(jīng)營措施調(diào)整,開展更新、不同階段的規(guī)劃設(shè)計(jì)等工作,森林資源屬性產(chǎn)生較大變化,在原有小班邊界的基礎(chǔ)上,重新區(qū)劃為多個(gè)小班用以表現(xiàn)新的資源信息。
空間重新劃分是指更新度較為復(fù)雜的多個(gè)森林資源小班分布重新進(jìn)行邊界劃分,并根據(jù)編碼規(guī)則,重新進(jìn)行小班編號??臻g單元屬性信息變化多樣,在空間尺度上無法直接從上一年度的資源調(diào)查數(shù)據(jù)中進(jìn)行獲取。
多源森林資源空間數(shù)據(jù)集成是在數(shù)據(jù)空間分布區(qū)域及特性的基礎(chǔ)上,按照數(shù)據(jù)的業(yè)務(wù)空間層次進(jìn)行差異性分析,利用集成機(jī)制,在空間尺度上實(shí)現(xiàn)不同信息渠道獲取的森林資源數(shù)據(jù)的有效統(tǒng)一。空間數(shù)據(jù)集成是一個(gè)復(fù)雜的流程,是支持林業(yè)科學(xué)數(shù)據(jù)多層面專題信息的綜合,涉及的技術(shù)層面比較廣泛,諸如語義集成技術(shù)、共享集成技等。在“互聯(lián)網(wǎng)+”已漸漸融入到林業(yè)信息化建設(shè)的過程中,利用不同的時(shí)空集成模型,進(jìn)行多源森林資源數(shù)據(jù)更準(zhǔn)確的信息回溯與一體化分析,是未來將要推進(jìn)的工作和研究的方向。伴隨著科學(xué)數(shù)據(jù)大批量的匯交,多業(yè)務(wù)類型、多專題的空間數(shù)據(jù)將是數(shù)據(jù)集成任務(wù)的重點(diǎn),也將是林業(yè)和草原科學(xué)數(shù)據(jù)中心實(shí)現(xiàn)數(shù)據(jù)共享服務(wù),開展空間數(shù)據(jù)有效集成探索的重點(diǎn)。