張 亮,周志誠,厲芳婷,趙 鵬
(1.湖北省測繪工程院,湖北 武漢 430074;2.地理國情監(jiān)測國家測繪地理信息局重點實驗室,湖北 武漢 430072,3.湖北省航測遙感院,湖北 武漢 430074)
基礎(chǔ)測繪是基準體系建設(shè)與維護、基礎(chǔ)航攝遙感影像獲取、基本比例尺地圖測制和更新的統(tǒng)稱,其成果對促進各行各業(yè)高質(zhì)量發(fā)展起到了基礎(chǔ)性、保障性和先導(dǎo)性作用[1]。隨著我國經(jīng)濟的發(fā)展,現(xiàn)有基礎(chǔ)測繪成果形式固化、社會經(jīng)濟和人文信息不全、現(xiàn)勢性不足、聯(lián)動更新困難等問題突顯[2],逐漸難以適應(yīng)當前信息化社會和產(chǎn)業(yè)發(fā)展的需求,加上互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能等高新技術(shù)的深入應(yīng)用,促進了測繪技術(shù)體系的升級換代,倒逼基礎(chǔ)測繪轉(zhuǎn)型升級,建立起適應(yīng)新時代要求的新型基礎(chǔ)測繪體系。
國家測繪地理信息“十三五”規(guī)劃的整體思路中強調(diào),應(yīng)加快推進基礎(chǔ)地理信息數(shù)據(jù)庫建設(shè)的轉(zhuǎn)型,逐步建立基于最詳細的地理實體的成果采集和管理模式[3],因此探索按地理實體分級的非尺度基礎(chǔ)時空數(shù)據(jù)庫建設(shè)具有很強的現(xiàn)實意義。
建設(shè)地理實體數(shù)據(jù)庫,首先要弄清地理實體與地理要素之間的異同,地理實體是現(xiàn)實世界中具有空間位置、獨立語義屬性或功能的自然或人工地物[4],其與傳統(tǒng)4D 產(chǎn)品中的地理要素既有聯(lián)系,又有區(qū)別。從本質(zhì)上說,它們都是對現(xiàn)實世界一種現(xiàn)象的抽象,但在數(shù)據(jù)組織形式和表達上又有差別。
傳統(tǒng)4D 產(chǎn)品中的地理要素,將現(xiàn)實世界抽象成點、線、面要素構(gòu)成的圖層,能很好地展示各要素之間的空間關(guān)系,但卻將一個完整的地理實體切割為多個空間目標。由于未建立相互之間的唯一性標識關(guān)聯(lián),使得表達同一實體的空間目標碎片化,難以按照實體提取相關(guān)空間目標,并維護其與相關(guān)專題信息的掛接關(guān)系[5]。另外,以往采集的要素屬性未加入時間戳,因此無法完整描述地理實體在時間和空間上的語義關(guān)系。因此,按要素采集建庫的方式已難以滿足當前地理信息應(yīng)用的需求,如一條道路,以傳統(tǒng)的幾何要素表達,其只能包含道路中心線或道路邊線或道路面,它們之間并無關(guān)聯(lián);而以地理實體來表達,則可同時包含道路中心線、道路邊線和道路面等多個圖元,且有唯一的地理實體編碼作為標識,對其賦予產(chǎn)生和消亡時間屬性,能完整描述地理實體的時空關(guān)系語義。這種按實體對象建庫的表達無疑更符合人們認識現(xiàn)實世界的模式,在應(yīng)用上也更加靈活便捷。
在地理實體建庫過程中,地理實體編碼和通用屬性設(shè)計是關(guān)鍵環(huán)節(jié),直接決定了庫體的組織結(jié)構(gòu)。
地理實體編碼是為每個地理實體賦予唯一的身份標識,目前的基礎(chǔ)地理數(shù)據(jù)分類代碼尚不支持新的時空模型,不能標識地理實體的位置[6],因此不能滿足地理信息時空大數(shù)據(jù)的應(yīng)用需求。針對該問題,本文設(shè)計了分類碼+位置碼+時間碼+順序碼的地理實體編碼方式。
2.1.1 地理實體產(chǎn)品分類碼
哪些地理要素需作為實體進行采集是地理實體生產(chǎn)首先需要解決的問題。目前,對于地理實體產(chǎn)品的采集和分類,尚未形成統(tǒng)一的規(guī)范規(guī)定,本文結(jié)合基礎(chǔ)地理信息數(shù)據(jù)、自然資源和其他行業(yè)部門的應(yīng)用需求來確定分類。在兼容傳統(tǒng)地理要素分類標準的基礎(chǔ)上,本文對地理實體的覆蓋范圍進行了拓展,主要涵蓋基礎(chǔ)實體、專業(yè)實體和綜合實體3 個方面的內(nèi)容,劃分定位基礎(chǔ)、水系、居民地與設(shè)施、交通、植被與土質(zhì)、管線與設(shè)施、境界與區(qū)域、地貌等8 個門類,并在各門類的基礎(chǔ)上進一步劃分出48 個大類,對應(yīng)創(chuàng)建107 個圖層。
分類碼采用10 位十進制數(shù)字碼,實體要素的分類代碼結(jié)構(gòu)是在國標代碼(門類、大類、中類和小類)后加圖形碼和細分碼。具體代碼結(jié)構(gòu)如圖 1 所示。
圖1 要素分類代碼結(jié)構(gòu)
1)第一、二位為門類碼,根據(jù)地理實體的門類劃分,編碼為“01”~“08”。
2)第三、四位為大類碼,是在門類的基礎(chǔ)上細分形成的實體類,是已有各分類編碼體系的一級類編碼。
3)第五、六位為中類碼,是在大類的基礎(chǔ)上細分形成的實體類,是已有各分類編碼體系的二級類編碼,無此級別的,則中類碼補“0”。
4)第七、八位為小類碼,是在中類的基礎(chǔ)上細分形成的實體類,是已有各分類編碼體系的三級類編碼;如有四級類編碼的情況,則將其并入三級類編碼中;無此級別的,則小類碼補“0”。
5)圖形碼采用1 位數(shù)字碼,0 為注記、1 為點、2 為線/中心線、3 為面、4 為邊線。
6)細分碼是對國標代碼中子類碼的進一步劃分,按 1~9 順序添加,如沒有細分類,則為0。
2.1.2 位置碼
位置碼采用GeoSOT 剖分網(wǎng)格[7]的一位四進制變長編碼,不同層級對應(yīng)不同的格網(wǎng)大小劃分,反映地理實體幾何中心點大地坐標所在的地理網(wǎng)格編碼。編碼包含網(wǎng)格的定位信息和級信息,編碼長度等于該網(wǎng)格的級數(shù)。編碼以G 開頭,最長編碼為32 級,由32 位四進制數(shù)字組成,分為9 位度級編碼、6 位分級編碼、6 位秒級編碼和11 位秒以下編碼4 段,具體形式為“Gddddddddd-mmmmmm-ssssss.uuuuuuuuuuu”,其中,d、m、s、u 取值均為0、1、2、3。
2.1.3 時間碼
時間碼采用8 位數(shù)字定長編碼,以地理實體首次采集、調(diào)查或建庫等的公元紀年時間為內(nèi)容,如2020 年7 月27 日,則時間碼為20200727。
2.1.4 順序碼
順序碼采用7 位定長數(shù)字,從1 開始,根據(jù)地理實體分類碼、位置碼和時間碼相同的地理實體產(chǎn)生的先后順序依次編碼,不得重復(fù)使用,順序碼不足7 位的,則補“0”。
地理實體的通用屬性項是指所有地理實體都具備的屬性項,應(yīng)體現(xiàn)地理實體的時空性,能滿足聯(lián)動更新的需求。本文對地理實體數(shù)據(jù)通用屬性項的規(guī)定如表1 所示。
表1 地理實體數(shù)據(jù)通用屬性項
地理實體數(shù)據(jù)建庫主要是在基礎(chǔ)測繪成果數(shù)據(jù)的基礎(chǔ)上進行整合加工,首先對已有基礎(chǔ)測繪成果進行轉(zhuǎn)換,然后按地理實體的方式進行全新采集和更新。其過程主要包括預(yù)處理、實體化、屬性賦值、質(zhì)量檢查、數(shù)據(jù)入庫等。
1)預(yù)處理工作負責統(tǒng)一數(shù)據(jù)格式、數(shù)據(jù)基準,按本文描述的數(shù)據(jù)分類和分層規(guī)則對原基礎(chǔ)測繪成果進行對照,建立映射關(guān)聯(lián);對原有要素屬性進行擴充,實現(xiàn)實體分類碼的編碼轉(zhuǎn)換和錄入;對于新增和更新的實體,按照分類和分層的規(guī)則進行要素的分類采集。
2)實體化工作即為判斷哪些圖元為同一實體的過程[8],建立圖元與實體的對應(yīng)關(guān)系,用以實現(xiàn)地理對象在時空維度的唯一性。將具有相同名稱、空間連通的圖元構(gòu)成一個實體,而沒有名稱的圖元為一個單獨的實體。當圖元屬于多個實體時,則對其進行地理實體編碼的擴充。
3)屬性賦值。按照地理實體通用屬性項的要求進行屬性的采集與完善,通過軟件工具生成地理實體編碼,以保證其唯一性。
4)質(zhì)量檢查。對圖元的拓撲關(guān)系、實體編碼的唯一性、實體邏輯的一致性、屬性結(jié)構(gòu)的完整性和正確性等進行檢查,檢查合格方可入庫。
5)數(shù)據(jù)入庫。開發(fā)和利用相應(yīng)的入庫軟件工具將空間數(shù)據(jù)存儲于關(guān)系數(shù)據(jù)庫中。
地理實體數(shù)據(jù)庫具有對象化的數(shù)據(jù)組織、自由的專題屬性掛接、靈活的按需組裝、高效的空間分析、便捷的聯(lián)動更新等優(yōu)勢,相較于傳統(tǒng)的按要素分類組織的數(shù)據(jù)庫,其有著更加廣闊的應(yīng)用前景。地理實體數(shù)據(jù)庫建設(shè)的關(guān)鍵問題是地理實體編碼的設(shè)計和ETL技術(shù)(數(shù)據(jù)的抽取、轉(zhuǎn)換和加載)的應(yīng)用。地理實體數(shù)據(jù)庫建設(shè)是新型基礎(chǔ)測繪體系建設(shè)的重要一環(huán),如何從各類基礎(chǔ)數(shù)據(jù)、專題數(shù)據(jù)中按地理實體的分類融合圖形和屬性,實現(xiàn)自動化實體構(gòu)建是今后繼續(xù)研究的方向。