李 楊,劉 軍,徐柏楊,齊昱涵,李晨昱
(西安理工大學(xué),陜西 西安 710048)
?
綜合集成平臺下多源水利信息的主題可視化實例
李 楊,劉 軍,徐柏楊,齊昱涵,李晨昱
(西安理工大學(xué),陜西 西安 710048)
摘 要:針對數(shù)據(jù)集成的傳統(tǒng)研究流程(搜集、下載和分析整理數(shù)據(jù))中存在的影響研究工作效率、數(shù)據(jù)本身不能滿足研究人員對信息及知識的需求等不足,提出主題式多源信息的實時篩選、綜合及加工,與可視化分析的方法。以綜合集成平臺為基礎(chǔ),水利行業(yè)的主題、空間數(shù)據(jù)為例,結(jié)合數(shù)字地球技術(shù),運用在線主題式應(yīng)用的思想,探討面向服務(wù)的多源水利信息集成,以此達(dá)到對信息、知識的主題式獲取,即在獲取信息的同時針對業(yè)務(wù)需求對其進(jìn)行加工。在提高數(shù)據(jù)集成效率的同時加強應(yīng)用的適用性,同時針對水利信息的特點進(jìn)行邏輯流程和應(yīng)用結(jié)果的可視化。
關(guān)鍵詞:綜合集成平臺;多源數(shù)據(jù)集成;水利信息;主題式;可視化;面向服務(wù);數(shù)字地球
眾所周知,信息時代最基本的資源是科學(xué)數(shù)據(jù),越來越多的研究組織和國家政府開始重視科學(xué)數(shù)據(jù)。面對巨大的水利信息資源和持續(xù)不斷的數(shù)據(jù)采集工作,對科技人員及有關(guān)部門的管理人員來說,如何直接在多源的水利信息中獲取和挖掘知識與信息,如何有效、有針對性地提高相關(guān)部門決策和科研的效率,成為當(dāng)下迫切的需求。所以,知識挖掘便成了一門學(xué)科,得到很高的關(guān)注度[1],互聯(lián)網(wǎng)(Web)等技術(shù)提供了知識挖掘應(yīng)用的廣闊信息環(huán)境[2]。目前對于水利信息而言,數(shù)據(jù)資源龐大而復(fù)雜,但數(shù)據(jù)的來源較為分散,缺少有規(guī)范的數(shù)據(jù)管理辦法,導(dǎo)致現(xiàn)在的研究工作集中在數(shù)據(jù)的管理規(guī)范和共享方法等方面[3-5]。雖然已有部分研究采用了面向服務(wù)的技術(shù)和思想,但是此類研究依然集中于服務(wù)的發(fā)布方面[6-9]。對于服務(wù)集成,特別是對于屬性、地圖和影像等服務(wù)的集成,以及在線分析的技術(shù)方面探討較少,使得相關(guān)人員在使用時,仍然要通過“數(shù)據(jù)搜集、下載數(shù)據(jù)、整理并分析數(shù)據(jù)”這一流程,影響了研究工作的效率與產(chǎn)出。并且,當(dāng)?shù)卣鸬韧话l(fā)事件發(fā)生時,這種處理數(shù)據(jù)的流程由于計算速度慢,會嚴(yán)重影響到相關(guān)部門的決策。
根據(jù)目前水利信息的共享形式,要實現(xiàn)主題式數(shù)據(jù)共享的環(huán)境構(gòu)建,同時在數(shù)據(jù)的服務(wù)基礎(chǔ)上,實現(xiàn)多數(shù)據(jù)源的綜合集成與在線的可視化處理,為地理信息化研究環(huán)境的構(gòu)建打下基礎(chǔ)[10]。為此提出面向研究的主題,開展分布式的建設(shè)與開發(fā)的流程。對于相同的主題內(nèi)容,對多源水利信息使用虛擬整合與同步分析的研究方法,構(gòu)建由數(shù)據(jù)到知識的分析方法,以達(dá)到高速的知識獲取與可視化的表達(dá)。意義在于經(jīng)過研究主題式共享服務(wù)的方式,實現(xiàn)數(shù)據(jù)共享到服務(wù)共享的轉(zhuǎn)化,在服務(wù)共享的方式中,對多源服務(wù)的集成方法進(jìn)行研究。通過實時虛擬集成多源服務(wù),在線同步數(shù)據(jù)分析和可視化表達(dá)得以實現(xiàn),從而實現(xiàn)快速生成數(shù)據(jù)和信息的需求,提高研究和相關(guān)部門決策的效率。
自從面向服務(wù)的體系出現(xiàn),特別是 2008年SOA(面向服務(wù)的體系結(jié)構(gòu))變成了軟件工程主流方法,推動了 GIS 技術(shù)的革命與創(chuàng)新,成為了多源數(shù)據(jù)融合到知識的便利工具,同時也使資源共享的方式發(fā)生了轉(zhuǎn)變[11-12]。在服務(wù)共享的模式中,能夠輕松地開展對多源服務(wù)的集成處理與同步分析,例如,可以直接從互聯(lián)網(wǎng)上得到 Google Map 服務(wù),ESRI 和 Virtual Earth 的全球影像的服務(wù),還有天氣預(yù)報等 Web 服務(wù)。現(xiàn)在僅僅通過服務(wù)地址,便能方便地將這類服務(wù)集成進(jìn)各類應(yīng)用中??梢韵胂?,以后資源都會通過服務(wù)的方式發(fā)布,從而構(gòu)建起服務(wù)共享的方式。而水資源評價和規(guī)劃中涉及大量的空間信息,如行政區(qū)劃、河流水系、地形地貌、水利工程分布、水文站控制斷面位置,以及人口、實測水文數(shù)據(jù)等屬性數(shù)據(jù),GIS 可以支持這些具有明顯的時維性數(shù)據(jù)的獲取、管理、分析、模擬及顯示。這些技術(shù)和軟件大大促進(jìn)了水利信息的共享和表達(dá),推動了水利工程向數(shù)字化、可視化和智能化方向的發(fā)展。
1.1空間數(shù)據(jù)服務(wù)的發(fā)布與訪問
空間地圖和影像數(shù)據(jù)共同構(gòu)成了空間數(shù)據(jù),當(dāng)今多數(shù)的 GIS 軟件,例如:Super-Map iServer 和ArcGIS Server 等商業(yè)軟件,以及開源軟件 World Wide,都能提供地圖與影像數(shù)據(jù)的服務(wù)與發(fā)布方法。Google,ESRI,Microsoft 等公司還有免費的全球影像與地圖服務(wù)。因此可以輕松地使地圖服務(wù)與全球影像服務(wù)集成,同時對其進(jìn)行聯(lián)合操作。
1.2屬性數(shù)據(jù)服務(wù)的發(fā)布與訪問
Web 技術(shù)中對于屬性數(shù)據(jù)服務(wù)的發(fā)布方案多種多樣,運用 WSDL(Web 服務(wù)描述語言)技術(shù)發(fā)布服務(wù)是時下比較流行的方式,是采用一種動態(tài)的腳本語言開發(fā)動態(tài)的網(wǎng)站。WSDL 是一種 XML 格式的文檔,被用來描述 Web 服務(wù)的公共接口。使用WSDL 定義一個通用的接口,就可以直接訪問并獲取到數(shù)據(jù)庫里的屬性數(shù)據(jù)。
2.1多源數(shù)據(jù)集成的類型
多源數(shù)據(jù)集成包括以下 3 種集成類型:
1)多源空間數(shù)據(jù)集成。多源空間數(shù)據(jù)的集成,關(guān)鍵在于空間地理坐標(biāo)和投影是否統(tǒng)一。只要加載的多源服務(wù)有統(tǒng)一的空間地理坐標(biāo)和投影,那么,空間數(shù)據(jù)的集成是系統(tǒng)自動實現(xiàn)的。
2)多源屬性數(shù)據(jù)集成。多源屬性數(shù)據(jù)的集成,實現(xiàn)的基礎(chǔ)是確定多個屬性表之間的關(guān)聯(lián)字段。每個可能關(guān)聯(lián)的表必須至少有 1 個相關(guān)聯(lián)的字段,這要求每個由服務(wù)形式被發(fā)布的屬性表必須對應(yīng) 1 個元數(shù)據(jù)信息的服務(wù),不然用戶將不能調(diào)用。在實際操作過程中,首先要使用關(guān)鍵字,以便用戶能夠檢索出可能需要的屬性數(shù)據(jù)服務(wù)的列表,然后再通過元數(shù)據(jù)信息服務(wù),幫助用戶選擇查詢屬性表和字段,同時運用交互的方式使用戶確定列表之間相互關(guān)聯(lián)的字段。經(jīng)過設(shè)定后,就可以進(jìn)行多源屬性數(shù)據(jù)的集成。在集成的過程中,通過對訪問接口時所需的數(shù)據(jù)信息加以整合,得到 1 個新的數(shù)據(jù)表,所以這種方式并沒有改變數(shù)據(jù)庫原本的結(jié)構(gòu)。
3)多源空間數(shù)據(jù)與屬性數(shù)據(jù)的集成。多源空間數(shù)據(jù)與屬性數(shù)據(jù)的整合需通過較復(fù)雜的操作,應(yīng)當(dāng)是虛擬整合之后的空間數(shù)據(jù)與屬性數(shù)據(jù)的集成。首先,確定被整合的數(shù)據(jù)屬性的關(guān)聯(lián)字段;其次,選擇需要的空間圖層進(jìn)行綁定;最后,根據(jù)綁定的圖層確定圖層的關(guān)聯(lián)字段。將整合的數(shù)據(jù)和圖層數(shù)據(jù)集關(guān)聯(lián)后,就可對屬性數(shù)據(jù)進(jìn)行空間化與可視化了。
當(dāng)今,對于單純的空間與屬性數(shù)據(jù)而言,有很多的服務(wù)發(fā)布案例,但對于屬性服務(wù)和地圖服務(wù)的共享集成與應(yīng)用的研究卻比較少,這成為阻礙從數(shù)據(jù)到知識轉(zhuǎn)化效率的原因之一。
2.2多源異構(gòu)數(shù)據(jù)服務(wù)的發(fā)布和集成
知識圖平臺是一種綜合集成平臺,構(gòu)建時包括對知識的識別、組織、分級、關(guān)聯(lián)和展現(xiàn),同時在知識圖構(gòu)建的動態(tài)過程中會不斷產(chǎn)生新的知識來更新原本的知識圖。知識圖最大的優(yōu)點是能夠很好地把用戶的隱性知識顯性化地表達(dá)出來,只需明確用戶的主題就可以繪制出面向特定服務(wù)的知識圖[13]。
中間件是一種獨立的系統(tǒng)軟件或服務(wù)程序的接口,作用在于能提供數(shù)據(jù)庫與應(yīng)用程序的連通性,使得在開發(fā)應(yīng)用的過程中不受來自操作系統(tǒng)、通信協(xié)議的影響。因為中間件具備標(biāo)準(zhǔn)的接口與協(xié)議,所以能夠在不同的平臺上開展數(shù)據(jù)操作和共享。按照所完成功能的不同,中間件可分為數(shù)據(jù)可訪問、基于消息、交易及面向?qū)ο蟮闹虚g件等 4 類。
多源水利信息的主題可視化由綜合集成平臺與數(shù)據(jù)集成中間件聯(lián)合完成。中間件可以針對多元數(shù)據(jù)進(jìn)行綜合、篩選和加工,綜合集成平臺能夠針對需求進(jìn)行主題式定制應(yīng)用組件。通過定制的組件控制數(shù)據(jù)集成中間件,可達(dá)到主體化的信息服務(wù),提高信息獲取的效率,加深數(shù)據(jù)的挖掘。
2.3主題式的多源數(shù)據(jù)虛擬整合與可視化分析
水利行業(yè)中涉及大量的空間信息,如行政區(qū)劃、河流水系、地形地貌、水利工程的分布、水文站控制斷面的位置、人口、實測水文數(shù)據(jù)等屬性數(shù)據(jù),GIS 可以支持這些具有明顯的時維性數(shù)據(jù)的獲取、管理、分析、模擬及顯示,這些特點都很適合進(jìn)行信息的可視化展現(xiàn),技術(shù)路線圖如圖 1 所示。
圖1 技術(shù)路線圖
這樣,基于綜合集成平臺和數(shù)據(jù)集成中間件對信息定向加工后,通過 GIS 平臺便可實現(xiàn)對所需信息的展現(xiàn),數(shù)據(jù)發(fā)布方案如圖 2 所示。
圖2 數(shù)據(jù)發(fā)布方案
2.4多源數(shù)據(jù)集成和虛擬整合的應(yīng)用實例
本實例來自于新疆哈密建設(shè)兵團(tuán)十三師水務(wù)局綜合集成水務(wù)平臺,按照分析的技術(shù)流程,采用World Wind 作為地圖服務(wù)發(fā)布引擎,結(jié)合數(shù)據(jù)集成中間件,開發(fā)了基于綜合集成平臺的水利多源數(shù)據(jù)集成系統(tǒng)。該系統(tǒng)能夠集成互聯(lián)網(wǎng)上已經(jīng)發(fā)布的地圖和影像服務(wù)。
應(yīng)用時,首先打開綜合集成平臺,繪制服務(wù)所需的知識圖,應(yīng)用界面如圖 3 所示;根據(jù)需要在各節(jié)點進(jìn)行設(shè)置,包括通過中間件對多源數(shù)據(jù)源的添加,達(dá)到多源數(shù)據(jù)的融合,如圖 4 所示;根據(jù)服務(wù)添加定制的組件,實現(xiàn)對數(shù)據(jù)的定向加工,如圖 5所示;在設(shè)置好前面節(jié)點后,點擊展示,進(jìn)行在數(shù)字地球平臺上的可視化展示,如圖 6 所示。
圖3 水利信息主題可視化應(yīng)用界面
圖4 添加數(shù)據(jù)源
圖5 選擇定制組件
圖6 GIS展示
從實例可以看出,在綜合集成平臺下,針對服務(wù)進(jìn)行主題式的組件定制,可通過控制數(shù)據(jù)集成中間件獲取數(shù)據(jù),最后通過 GIS 展示信息??梢葬槍Σ煌臉I(yè)務(wù)繪制不同的知識圖,添加不同的組件,實現(xiàn)面向不同的服務(wù)。在獲取信息的同時對數(shù)據(jù)進(jìn)行符合業(yè)務(wù)需求的定向加工,大大提高了信息集成的效率,加強了應(yīng)用的實用性,使得有關(guān)人員對信息的需求進(jìn)一步得到滿足。信息處理后的結(jié)果被很好地展示的同時,業(yè)務(wù)的邏輯流程也能夠通過知識圖被展示。
選擇水利行業(yè)的數(shù)據(jù),通過使用主題式的面向服務(wù)技術(shù)處理多源數(shù)據(jù)集成的問題,同時實現(xiàn)將整合后的數(shù)據(jù)集成分析與可視化,達(dá)到對數(shù)據(jù)搜集、整合、分析的目的。結(jié)果顯示,數(shù)據(jù)的分散異構(gòu)問題在主題式的多源數(shù)據(jù)集成研究方法下得到了很好的解決。不僅優(yōu)化了“搜集數(shù)據(jù),下載數(shù)據(jù),整理分析數(shù)據(jù)”的傳統(tǒng)研究流程,而且相較于傳統(tǒng)的數(shù)據(jù)共享模式有著顯著的優(yōu)勢。由于面向服務(wù)的組織架構(gòu)具有相對開放的數(shù)據(jù)接口及統(tǒng)一的發(fā)布規(guī)范,所以能夠方便多源數(shù)據(jù)的集成、直接的在線分析和數(shù)據(jù)的可視化。由此可見,基于主題的服務(wù)共享模式,會成為未來數(shù)據(jù)共享模式的發(fā)展方向。在開發(fā)基于服務(wù)架構(gòu)的應(yīng)用時,首先應(yīng)當(dāng)對具有相同主題的數(shù)據(jù)進(jìn)行服務(wù)發(fā)布和集成應(yīng)用,然后按照主題的分布開展工作,在進(jìn)行服務(wù)的同時構(gòu)建相應(yīng)的主題應(yīng)用。
通過系統(tǒng)應(yīng)用的開發(fā),可以得到以下結(jié)論:
1)每一個數(shù)據(jù)服務(wù)的應(yīng)用、元數(shù)據(jù)信息都必須有一定的規(guī)范且要填寫完整。如果元數(shù)據(jù)信息不夠詳細(xì),在數(shù)據(jù)源相對復(fù)雜時,會嚴(yán)重影響數(shù)據(jù)集成的工作效率。
2)從面向服務(wù)的多源數(shù)據(jù)集成應(yīng)用來看,雖然在技術(shù)上都已解決,但是操作過程較為復(fù)雜,對于沒有經(jīng)過專門培訓(xùn)的人員,使用時存在一定的困難。因此主題式的多源數(shù)據(jù)集成是一項長期的研究工作,廣泛的應(yīng)用不但需要技術(shù)的支撐,更需要友好和智能的操作界面。
參考文獻(xiàn):
[1] 孫吉紅,焦玉英. 知識發(fā)現(xiàn)及其發(fā)展趨勢研究[J]. 情報理論與實踐,2006,29 (5): 528-531.
[2] 龐景安. Web 知識發(fā)現(xiàn)的理論研究及其應(yīng)用[J]. 情報雜志,2008 (1): 65-67.
[3] 諸云強,孫九林,廖順寶,等. 地球系統(tǒng)科學(xué)數(shù)據(jù)共享研究與實踐[J]. 地球信息科學(xué)學(xué)報,2010,12 (1): 1-8.
[4] 賈文玨,張子平,吳洪橋. 國土資源數(shù)據(jù)共享技術(shù)構(gòu)架與應(yīng)用模式研究[J]. 地理信息世界,2010 (1): 43-47.
[5] ZHA Zongxiang,JIA Wenjue. Design and Implementation of Information Sharing Platform of Land and Resources[C]// The International Archives of the Photogrammetry,Remote Sensing and Spatial Information Sciences. Beijing,2008: 1047-1049.
[6] Frehner M,Brandli M. Virtual Database: Spatial Analysis in a Web-based Data Management System for Distributed Ecological Data[J].Environmental Modeling&Software,2006,21 (11): 1544-1554.
[7] Scholl T,Bauer B,Gufler B,et al. Scalable Community Driven Data Sharing in E-science Grids[J]. Future Generation Computer Systems,2009,25 (3): 290-300.
[8] Piwowa HA,Chapman WW. Public Sharing of Research Data sets: A Pilot Study of Associations[J]. Journal of Informetrics,2010,4 (2): 148-156.
[9] Comito C,Gounaris A,Sakellariou R,et al. A Service-oriented System for Distributed Data Queryingand Integration on Grids[J]. Future Generation Computer Systems,2009,25 (5): 511-524.
[10] 諸云強,孫九林. 面向 e-GeoSeienee 的地學(xué)數(shù)據(jù)共享研究進(jìn)展[J]. 地球科學(xué)進(jìn)展,2006,21 (3): 286-290.
[11] 曾洋,張艷梅. 面向服務(wù)的體系結(jié)構(gòu)[J]. 軟件導(dǎo)刊,2008,7 (4): 77-78.
[12] 羅春. 地理信息系統(tǒng)發(fā)展的新趨勢:面向服務(wù)的體系結(jié)構(gòu)[J]. 地理信息世界,2006 (5): 67-69.
[13] 解建倉,羅軍剛. 水利信息化綜合集成服務(wù)平臺及應(yīng)用模式[J]. 水利信息化,2010 (5): 18-21.
Theme Visualization Application of Multi-Source Water Information under Integration Platform
LI Yang,LIU Jun,XU Baiyang,QI Yuhan,LI Chenyu
(Xi' an University of Technology,Xi' an 710048,China)
Abstract:Aiming at impacting studies efficiency and that data do not meet the needs of information and knowledge for researchers in the process of data integration for traditional research process (data collecting,downloading,organizing and analyzing),the article proposes methods of real-time screening synthesis and processing,analysis and visualization of themed multi-source information. Based on comprehensive integration platform,with water industry topics and spatial data as an example,combining with digital earth technology,using the idea of online thematic applications,it discusses service-oriented multi-source water conservancy information integration,in order to achieve the acquisition of subject-type information knowledge. It accesses information and carries on the processing in view of needs of the business also. Improving the efficiency of data integration and strengthening the applicability of application at the same time,it does the visualization of logical process and application results according to the characteristic of water conservancy information simultaneously.
Key words:comprehensive integration platform;multi-source data integration;water information;theme style;visualization;service-oriented;GIS
中圖分類號:TV39
文獻(xiàn)標(biāo)識碼:A
文章編號:1674-9405(2016)03-0001-05
DOI:10.19364/j.1674-9405.2016.03.001
收稿日期:2015-11-15
基金項目:國家自然科學(xué)基金項目(51479160);陜西省科技攻關(guān)項目(2012-16)
作者簡介:李 楊(1988-),男,山西忻州人,博士研究生,主要研究方向為 GIS、水利信息化。