張增健,王海波,奚 歌,陳 斐,鄧媛媛
(國家海洋信息中心海洋信息產(chǎn)品研發(fā)部 天津 300171)
海洋數(shù)據(jù)的空間化整合流程解析*
張增健,王海波,奚 歌,陳 斐,鄧媛媛
(國家海洋信息中心海洋信息產(chǎn)品研發(fā)部 天津 300171)
研究海洋數(shù)據(jù)空間化整合是實現(xiàn)海洋信息綜合利用的關鍵技術問題。文章構建了海洋數(shù)據(jù)空間化整合的基本框架結構,設計了海洋數(shù)據(jù)的空間化整合的技術流程,從標準體系建設、質量控制體系建設出發(fā),解析了海洋數(shù)據(jù)空間化整合各項內(nèi)容。
GIS技術;海洋數(shù)據(jù);空間化整合;空間信息庫
根據(jù)信息專家的統(tǒng)計分析,當今政府機關的綜合業(yè)務管理和輔助決策活動,80%以上與空間定位和空間輔助決策相關。地理信息作為社會、經(jīng)濟、人文及各種專題信息的載體和平臺,更好地展示了這些信息的內(nèi)容和空間分布情況,便于快捷地提取有用數(shù)據(jù),可以更加生動、直觀地顯示信息分析結果,在信息資源的集成、處理、分析和應用中起到了獨特的作用,被廣泛地應用于國民經(jīng)濟、社會發(fā)展、國家安全和公眾生活的各個方面,為政府領導科學決策提供了有效的支持??臻g數(shù)據(jù)庫是隨著地理信息系統(tǒng)的開發(fā)和應用而發(fā)展起來的數(shù)據(jù)庫新技術,它是地理信息系統(tǒng)的重要組成部分,是其他應用部分的前提和基礎[2]。而在地理信息系統(tǒng)(GIS)中,空間信息數(shù)據(jù)庫建設卻是一項非常繁重的基礎性工作,通常要占整個工程75%的工作量[1-2]。海洋信息是開發(fā)海洋和建設海洋的基礎,它在我國政治、經(jīng)濟、軍事和維護國家權益方面都具有舉足輕重的地位,新中國成立以來國家各有關部門、地方對海洋調查投入了大量的人力、物力和財力,取得了極為豐富的資料和數(shù)據(jù)[3]。這些資料和數(shù)據(jù)包括Text文本數(shù)據(jù)、Excel數(shù)據(jù)、Oracle數(shù)據(jù)表、SQLServer數(shù)據(jù)庫表、mapinfo數(shù)據(jù)、shapefile數(shù)據(jù)以及各種類型的遙感影像數(shù)據(jù)等。對這些由海、陸、空各種調查手段獲得,涵蓋氣象、水文、生物、化學、地質、地球物理等眾多學科,采用不同格式、不同數(shù)據(jù)庫存儲,定位基準不一,表達方式多樣的數(shù)據(jù)進行空間化信息庫建設是一項極為復雜的工作。這項工作首先要求的是對各類數(shù)據(jù)按照統(tǒng)一的流程進行空間化整合,形成定位基準統(tǒng)一、數(shù)據(jù)存儲與表達統(tǒng)一、數(shù)據(jù)交換標準統(tǒng)一的數(shù)據(jù)集與產(chǎn)品集。本研究將對海洋數(shù)據(jù)的空間化整合流程作初步探討與解析。
關于空間化整合,目前仍然沒有公認的定義。根據(jù)其側重點不同,Shepherd I.D.H將其分為GIS功能觀點、簡單組織轉化觀點、過程觀點、關聯(lián)觀點等[4]。David等認為數(shù)據(jù)整合應包括普通數(shù)據(jù)集的重建模過程,不是簡單地把不同來源的地學數(shù)據(jù)合并到一起[5]。周成虎等認為數(shù)據(jù)整合是指不同來源、格式、特征的地學數(shù)據(jù)邏輯上或物理上的有機集中[6]。在數(shù)據(jù)整合的實現(xiàn)機制上,主要有Mediator/Wrapper整合機制、A-gent整合機制、P2P整合機制以及數(shù)據(jù)倉庫整合機制等[7-8]。張梅蘭等對不同來源的數(shù)據(jù)進行了加工、整理與集成,采用數(shù)據(jù)倉庫整合機制,進行了區(qū)域地理空間數(shù)據(jù)整合技術研究[9]。
本研究提及的海洋數(shù)據(jù)的空間化整合,是為了將空間定位標準不統(tǒng)一、數(shù)據(jù)標準以及信息交換標準不統(tǒng)一的各類海洋數(shù)據(jù)信息,經(jīng)空間定位標準轉換,經(jīng)地理信息空間化、標準化整合,形成一體化組織的地理空間信息,能夠在各種通用的GIS平臺之上進行統(tǒng)一的展示與分析,便于獲取與處理,便于高效實用。簡而言之,空間化整合是從數(shù)據(jù)的時空組織、數(shù)據(jù)結構、數(shù)據(jù)定位標準、數(shù)據(jù)存儲、數(shù)據(jù)交換接口等各方面入手,對現(xiàn)有的海洋基礎數(shù)據(jù)進行統(tǒng)一化與標準化的過程。
圖1為海洋數(shù)據(jù)空間化整合框架結構,左側為標準體系建設,右側為質量控制體系建設,中間為數(shù)據(jù)整合流程。標準體系建設為海洋數(shù)據(jù)空間化整合的根本約束,為多源異構數(shù)據(jù)整合形式的統(tǒng)一提供行為規(guī)范;質量控制體系建設為海洋數(shù)據(jù)空間化整合的根本保障,嚴控多源異構數(shù)據(jù)的質量;數(shù)據(jù)整合流程為海洋數(shù)據(jù)空間化整合的核心,它一方面引入標準體系建設的各類標準,為海洋數(shù)據(jù)空間化整合提供參考;另一方面嚴格執(zhí)行質量控制體系的各類質量控制標準,為海洋數(shù)據(jù)空間化整合的各個步驟提供質量保障。
圖1 海洋數(shù)據(jù)空間化整合框架結構
4.1 標準體系建設
標準體系建設是海洋數(shù)據(jù)空間化整合的基本參考,只有完成了標準體系建設,使數(shù)據(jù)整合工作有 “法”可依,才能避免整合工作的重復性勞動,才能使整合結果的形式、代碼、結果輸出、可視化表達等更加統(tǒng)一。標準體系建設通常來講,包括命名規(guī)范、數(shù)據(jù)格式規(guī)范、實體代碼規(guī)范、質量控制標準、數(shù)據(jù)字典標準、要素編目標準、元數(shù)據(jù)標準、共享分類體系標準、圖示圖例規(guī)范等。
命名規(guī)范用來指導數(shù)據(jù)庫、數(shù)據(jù)表、數(shù)據(jù)集、數(shù)據(jù)字段、關聯(lián)關系、符號庫等的命名,為海洋數(shù)據(jù)空間化整合結果的命名提供依據(jù)。
數(shù)據(jù)格式規(guī)范用來規(guī)范原始數(shù)據(jù)、標準數(shù)據(jù)、數(shù)據(jù)庫輸入、數(shù)據(jù)庫輸出、數(shù)據(jù)交換等內(nèi)容,為海洋數(shù)據(jù)的存儲提供依據(jù)。
實體代碼規(guī)范用來規(guī)范沿海地區(qū)、海島、海底地形、港口、漁場等數(shù)據(jù)中實體代碼的編制,實現(xiàn)對象的邏輯化表達,保持代碼的各行業(yè)一致性。
質量控制標準用來作為質量控制體系建設的依據(jù),規(guī)范表格類、要素類、遙感影像、數(shù)據(jù)庫關聯(lián)關系等的質量控制對象與方法。
數(shù)據(jù)字典標準用來規(guī)范數(shù)據(jù)空間化整合數(shù)據(jù)字典的具體內(nèi)容。海洋資源信息庫要素與屬性分類代碼數(shù)據(jù)字典編寫的內(nèi)容、格式、方法及其技術要求。
要素編目標準用來規(guī)范數(shù)據(jù)空間化整合要素類編目的具體內(nèi)容,以建立海洋信息要素類目錄,應用于信息服務、系統(tǒng)軟件設計和開發(fā)等領域。
元數(shù)據(jù)標準用來規(guī)范數(shù)據(jù)空間化整合元數(shù)據(jù)的具體內(nèi)容,建立完整的海洋信息元數(shù)據(jù),應用于信息服務與檢索等領域。
共享分類體系標準用來規(guī)范數(shù)據(jù)的共享分類,確保數(shù)據(jù)共享安全、通暢,滿足面向用戶提供數(shù)據(jù)服務的基本需求。
圖示圖例規(guī)范用來規(guī)范海洋資源和環(huán)境要素圖形可視化、空間表達和空間制圖,主要應用于海洋資源和環(huán)境要素空間化建庫、圖示和空間可視化表達,海洋資源和環(huán)境要素地圖設計制作,電子地圖和地理信息系統(tǒng)軟件設計和開發(fā)等領域。
4.2 質量控制體系建設
質量控制體系建設是海洋數(shù)據(jù)空間化整合的基本保障,從多源異構海洋數(shù)據(jù)的整合開始,滲透空間化整合流程的各個步驟,采用常規(guī)檢驗、統(tǒng)計學檢驗、人機交互可視化檢驗、拓撲方法檢驗、遙感影像檢驗等方法,對數(shù)據(jù)的質量、數(shù)據(jù)空間化表達的質量進行檢查與控制。同時,保證海洋數(shù)據(jù)空間化整合流程的數(shù)據(jù)標準化、數(shù)據(jù)結構分析、數(shù)據(jù)庫設計、數(shù)據(jù)空間化改造、數(shù)據(jù)編輯、相關信息提取、數(shù)據(jù)庫入庫等關鍵步驟有詳盡的質量控制記錄。
4.3 數(shù)據(jù)標準化
數(shù)據(jù)標準化是對多源異構的各類海洋數(shù)據(jù)進行標準化統(tǒng)一的過程,這個標準化統(tǒng)一包括命名規(guī)范的統(tǒng)一、數(shù)據(jù)格式的統(tǒng)一、量綱統(tǒng)一、實體代碼的統(tǒng)一等內(nèi)容。該項工作涉及新舊格式、新舊代碼的轉換,較為繁瑣與復雜。
4.4 數(shù)據(jù)結構分析
數(shù)據(jù)結構分析是對數(shù)據(jù)進行結構分析與整合,實現(xiàn)要素的歸并與分層組織的過程,需要綜合考慮海洋基礎數(shù)據(jù)的結構、關系、存儲、使用、共享、發(fā)布等因素,按照海洋數(shù)據(jù)結構的時空關系,考慮地理信息系統(tǒng)的空間化特性,為海洋數(shù)據(jù)的空間化提供基礎模型。
4.5 數(shù)據(jù)庫設計
主流的GIS空間數(shù)據(jù)庫包括Oracle公司推出的Oracle Spatial、ESRI公司的Geodatabase等。Geodatabase即是ESRI公司在對Coverage數(shù)據(jù)模型進行全面揚棄之后,遵循面向對象思想,并仍以傳統(tǒng)大中型商用關系型數(shù)據(jù)庫為后臺,所推出的一種全新的空間數(shù)據(jù)模型[10-12],它采用對象-關系型空間數(shù)據(jù)庫存儲機制,以現(xiàn)有大中型商用關系型數(shù)據(jù)庫為基礎,巧妙地將面向對象思想運用到對現(xiàn)實地理世界的建模上來,從而真正實現(xiàn)了地理信息系統(tǒng)領域空間數(shù)據(jù)庫的概念模型[13]。該模型通過ArcSDE在關系數(shù)據(jù)庫中實現(xiàn)Geodatabase具有良好的層次關系,處于層狀結構頂端的是空間數(shù)據(jù)庫,往下是按照不同分類原則組織的要素集和要素類,以及各種值域規(guī)則和行為規(guī)則,要素類還可劃分子類。要素集是具有相同坐標系統(tǒng)和密切關聯(lián)的要素類的集合[11]。
4.6 數(shù)據(jù)空間化改造
通過采用標準體系建設的命名規(guī)范、數(shù)據(jù)格式規(guī)范、實體代碼規(guī)范、數(shù)據(jù)字典標準、要素編目標準、元數(shù)據(jù)標準、圖示圖例標準等,通過專用軟件及C#.NET進行ArcGIS Engine的二次開發(fā)的方式,實現(xiàn)文本數(shù)據(jù)、矢量數(shù)據(jù)、遙感影像數(shù)據(jù)的坐標系轉換、空間化改造,完成多源異構海洋數(shù)據(jù)的整合,形成命名規(guī)范統(tǒng)一、數(shù)據(jù)格式統(tǒng)一、量綱統(tǒng)一、實體代碼統(tǒng)一等各方面統(tǒng)一的空間化數(shù)據(jù)。
4.7 數(shù)據(jù)編輯
4.7.1 矢量數(shù)據(jù)編輯
對改造完成的矢量數(shù)據(jù)進行編輯處理,包括對有誤的點、線、面等矢量數(shù)據(jù)進行增、刪、改處理,對被圖幅切割為多塊的圖元進行要素的幾何的面向對象組合處理;依照數(shù)據(jù)質量要求,消除圖形的幾何錯誤和空間邏輯關系不一致等錯誤;對圖形信息不全、高程點稀少或缺失等情況,參照數(shù)據(jù)或源數(shù)據(jù)進行信息的補充。根據(jù)應用需要,依照相關的行業(yè)標準進行圖幅的拼接或分割處理,以滿足數(shù)據(jù)整合改造全區(qū)域圖或重點區(qū)域圖的需要,并對拼接后的數(shù)據(jù)進行幾何和屬性接邊處理;對重組數(shù)據(jù)不同要素層的量綱根據(jù)項目應用需求進行轉換或歸一化處理;對存在邏輯關系的屬性項進行關聯(lián)處理,保證屬性的一致性;依照參考數(shù)據(jù)、源數(shù)據(jù)進行信息補充;同時,根據(jù)圖示圖例規(guī)范完成矢量圖層的符號庫建設與可視化表達。
4.7.2 影像數(shù)據(jù)編輯
對改造完成的影像數(shù)據(jù)進行編輯處理,包括影像數(shù)據(jù)的去云處理、去噪等處理;遙感圖像的輻射校正、幾何校正,并采用地面控制點和數(shù)字高程模型對幾何校正模型進行修正;遙感影像的鑲嵌、融合處理,并進行影像的勻色、濾波、增強等操作;依據(jù)標準對遙感影像數(shù)據(jù)進行國家標準分幅。
4.7.3 統(tǒng)計數(shù)據(jù)編輯
改造完成的空間化數(shù)據(jù)相當一部分為統(tǒng)計數(shù)據(jù),統(tǒng)計數(shù)據(jù)作為與空間化矢量圖層相關聯(lián)的表,必須進行統(tǒng)計數(shù)據(jù)與矢量數(shù)據(jù)的關聯(lián),主要包括統(tǒng)計數(shù)據(jù)與統(tǒng)計站點、統(tǒng)計航線、統(tǒng)計區(qū)域及統(tǒng)計行政區(qū)等的關聯(lián)。
4.8 相關信息提取與編制
根據(jù)數(shù)據(jù)字典標準、要素編目標準、元數(shù)據(jù)標準、共享分類體系標準等編制相關采集軟件,完成數(shù)據(jù)字典、要素編目、元數(shù)據(jù)的采集,以應用于信息服務與檢索、系統(tǒng)軟件設計和開發(fā)等領域。
4.9 數(shù)據(jù)入庫
根據(jù)設計的數(shù)據(jù)庫模型和相關的表關系,研發(fā)數(shù)據(jù)庫管理系統(tǒng)軟件,完成矢量數(shù)據(jù)、影像數(shù)據(jù)、統(tǒng)計數(shù)據(jù)及元數(shù)據(jù)的加載。
通過對海洋數(shù)據(jù)的空間化流程解析,有利于用戶建立完善的海洋數(shù)據(jù)空間化整合流程,研發(fā)一體化的空間化整合系統(tǒng),形成高標準、高質量的海洋空間化整合數(shù)據(jù),為海洋信息空間化建設與服務奠定基礎。該海洋數(shù)據(jù)的空間化流程已在 “國家自然資源和地理空間基礎信息庫建設項目”海洋和海洋衛(wèi)星分中心的建設中進行了實踐與應用。
[1] 黨安榮,賈海峰,易善楨,等.ArcInfo8地理信息系統(tǒng)指南[M].北京:清華大學出版社,2001.
[2] 石昊楠,孔金玲,董立新,等.空間信息數(shù)據(jù)庫面向對象的設計方法[J].測繪技術裝備,2005(7):25-27.
[3] 劉振民,章任群,陳繼香.WebGIS技術在海洋信息共享中的應用[J].海洋技術,2003,22(4):27-31.
[4] SHEPHERD ID H.Information integration and GIS in Geographical Information Systems:Principles and Application(Vo1.2)[C]//Maguire D J,Goodchild M F,Rhind D W(ed).Longman.London,1991: 337-360.
[5] MARTIN D,BRACKEN I.The integration and socioeconomic and physical resource data for applied landmanagement information systems[J].Applied Geography,1993,13(1):45-53.
[6] 李軍,周成虎.地球空間數(shù)據(jù)集成多尺度問題基礎研究[J].地球科學進展,2000,15(1):48-51.
[7] 李廣建,汪語宇.數(shù)字資源整合的實現(xiàn)機制及關鍵技術:對國外數(shù)字資源整合系統(tǒng)的實證研究[J].中國圖書館學報,2007,33(168):75-80.
[8] 黎小紅,田富鵬.異構數(shù)據(jù)庫中數(shù)據(jù)集成技術研究[J].西北民族大學學報,2006,27(4):61-64.
[9] 張梅蘭,肖桂榮.區(qū)域地理空間數(shù)據(jù)整合技術研究[J].計算機與數(shù)字工程,2011,39(1):48-52.
[10] 宋楊,萬幼川.一種新型空間數(shù)據(jù)模型Geodatabase[J].測繪通報,2004(11):31-33.
[11] 羅智勇,劉湘南.基于Geodatabase模型的空間數(shù)據(jù)庫設計方法[J].地球信息科學,2004(4):105-109.
[12]ZEILER M.Modeling Our World[M].ESRI Press, 1999.
[13] 趙東保,王敏,張成才,等.對Geodatabase空間數(shù)據(jù)模型的再認識[J].計算機與數(shù)字工程,2007,35 (4),75-78.
國家自然基金項目(41106159);國家海洋局海洋大氣化學與全球變化重點實驗室開放基金(GCMAC1202).