闞璦珂 ,朱利東,湯 晶,龔建輝,黃青倫,胡 濱,王成善
1)成都理工大學(xué)沉積地質(zhì)研究院,四川成都 610059;2)成都理工大學(xué)地球探測與信息技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,四川成都 610059;3)四川省遙感信息測繪院,四川成都 610100;4)中國地質(zhì)大學(xué)(北京)地球科學(xué)與資源學(xué)院,北京 100083
國家投入的眾多地學(xué)研究計(jì)劃產(chǎn)生的科學(xué)數(shù)據(jù),既是研究成果的組成部分,又是科技創(chuàng)新的重要基礎(chǔ)(孫樞,2003)。以科學(xué)數(shù)據(jù)為載體的地學(xué)信息資源,其復(fù)雜性充分反映了地學(xué)研究對象所表現(xiàn)的長時(shí)間、大尺度、綜合性特征。因此,大型綜合地學(xué)科研項(xiàng)目的管理離不開現(xiàn)代信息技術(shù)的支撐。
當(dāng)前,地學(xué)數(shù)據(jù)管理和共享服務(wù)手段正隨著數(shù)據(jù)庫技術(shù)、Web服務(wù)技術(shù)和地理信息技術(shù)的更新不斷發(fā)生變化(高銳等,2001;諸云強(qiáng)等,2006;韓露等,2006;凌曉良等,2007;張金區(qū)等,2010;陳鄭輝等,2011;董樹文等,2011)。例如,國家973計(jì)劃資源環(huán)境領(lǐng)域項(xiàng)目的數(shù)據(jù)類型具有典型的學(xué)科廣泛性和格式多樣性,且大多具備時(shí)空屬性。2008年,國家科技部在“地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺”(王卷樂等,2006;劉潤達(dá)等,2007;諸云強(qiáng)等,2009a,b,2010)的基礎(chǔ)上,成立了專門的數(shù)據(jù)匯交管理中心(王卷樂等,2009a,b),并將數(shù)據(jù)匯交與共享工作納入 973項(xiàng)目驗(yàn)收的考核指標(biāo),在基礎(chǔ)研究領(lǐng)域具有重要的示范意義。同時(shí),為建立面向項(xiàng)目內(nèi)部的數(shù)據(jù)匯交、管理和共享實(shí)施機(jī)制,有必要建立針對項(xiàng)目自身運(yùn)行管理需要和數(shù)據(jù)產(chǎn)出特色的在線數(shù)據(jù)支撐平臺。本文以973項(xiàng)目“白堊紀(jì)地球表層系統(tǒng)重大地質(zhì)事件與溫室氣候變化”(編號:2006CB701400)為例,研究并應(yīng)用Web Services技術(shù)與地理信息技術(shù)建立服務(wù)于大型綜合地學(xué)科研項(xiàng)目數(shù)據(jù)匯交、管理與共享的信息平臺。
973項(xiàng)目“白堊紀(jì)地球表層系統(tǒng)重大地質(zhì)事件與溫室氣候變化”(王成善,2006,2007)分為6個(gè)課題,涉及8家主要承擔(dān)單位和數(shù)十名骨干研究人員,在歷時(shí)5年研究之后于2010年通過結(jié)題驗(yàn)收。項(xiàng)目產(chǎn)生的數(shù)據(jù)類型總體上分為測試分析原始數(shù)據(jù)、松科1井?dāng)?shù)據(jù)、實(shí)測剖面、白堊紀(jì)地層剖面、項(xiàng)目管理數(shù)據(jù)5大類。表1、圖2、表2分別展示了數(shù)據(jù)分類結(jié)構(gòu)、亞類結(jié)構(gòu)及其元數(shù)據(jù)列表。
根據(jù)本項(xiàng)目實(shí)際情況,考慮各課題組數(shù)據(jù)匯交和管理的方便性,盡可能少占用課題組額外的數(shù)據(jù)整理時(shí)間;并充分參照相關(guān)標(biāo)準(zhǔn),擴(kuò)展了 973項(xiàng)目數(shù)據(jù)匯交中心提供的元數(shù)據(jù)模板,針對科學(xué)數(shù)據(jù)共享價(jià)值較大的測試分析原始數(shù)據(jù)制定了表2描述的元數(shù)據(jù)列表。
項(xiàng)目確立了由首席科學(xué)家和課題負(fù)責(zé)人主管數(shù)據(jù)質(zhì)量控制,“課題-項(xiàng)目”兩級數(shù)據(jù)匯交聯(lián)絡(luò)員和項(xiàng)目辦公室負(fù)責(zé)具體實(shí)施的數(shù)據(jù)匯交機(jī)制(圖2)。在項(xiàng)目的生命周期末,由課題數(shù)據(jù)匯交聯(lián)絡(luò)員對本課題產(chǎn)生的各類原始數(shù)據(jù)和運(yùn)行管理文檔按照預(yù)定的匯交規(guī)范和流程進(jìn)行收集和統(tǒng)計(jì),再分別提交課題負(fù)責(zé)人審核和項(xiàng)目辦公室匯總。最后統(tǒng)一上報(bào)項(xiàng)目數(shù)據(jù)匯交聯(lián)絡(luò)員,經(jīng)整理入庫后提交首席科學(xué)家審核。本項(xiàng)目匯交的有效數(shù)據(jù)文件共 29958個(gè),總計(jì)21.3 G。
表1 項(xiàng)目數(shù)據(jù)總體分類Table 1 Overall classification of project data
圖1 項(xiàng)目數(shù)據(jù)亞類結(jié)構(gòu)圖Fig.1 Sub-class structure diagram of project data
表2 元數(shù)據(jù)列表Table 2 Meta data list
圖2 數(shù)據(jù)匯交機(jī)制Fig.2 Data archiving mechanism
平臺框架按照數(shù)據(jù)、功能、用戶3類視圖進(jìn)行組織設(shè)計(jì)(圖3)。
圖3 平臺框架設(shè)計(jì)Fig.3 Design for platform framework
包括測試分析數(shù)據(jù)庫、實(shí)測剖面數(shù)據(jù)庫、白堊紀(jì)地層剖面數(shù)據(jù)庫、松科1井?dāng)?shù)據(jù)庫、項(xiàng)目管理數(shù)據(jù)庫、元數(shù)據(jù)庫六類數(shù)據(jù)匯交子庫(表 1、圖 1、表2)。測試分析數(shù)據(jù)庫,存儲第一、二、五、六課題在進(jìn)行測試分析實(shí)驗(yàn)時(shí)使用的原始數(shù)據(jù),劃分為10大類,近60個(gè)亞類。實(shí)測剖面數(shù)據(jù)庫存儲了野外工作中的剖面位置、實(shí)測單位、人員等基本信息和剖面記錄內(nèi)容。白堊紀(jì)地層剖面數(shù)據(jù)庫集成了本項(xiàng)目專題“中國陸相白堊紀(jì)古氣候與古地理數(shù)據(jù)庫”中錄入的 709條地層剖面的空間坐標(biāo)和資料來源,巖石組與巖石地層、巖性描述等信息。松科1井?dāng)?shù)據(jù)庫存儲第三、四、五課題對鉆井工程施工記錄和測試分析產(chǎn)生的各類數(shù)據(jù)、照片和文檔,劃分為9大類,近50個(gè)亞類。項(xiàng)目管理數(shù)據(jù)庫以資料歸檔為主,存儲項(xiàng)目運(yùn)行以來召開的各類國際會議、學(xué)術(shù)討論會、項(xiàng)目年會等產(chǎn)生的匯報(bào)多媒體、會議紀(jì)要和照片,項(xiàng)目和各課題的年度報(bào)告和簡報(bào),歷年發(fā)表的論文清單。元數(shù)據(jù)庫由匯交數(shù)據(jù)的主研人員填寫數(shù)據(jù)集的元數(shù)據(jù)模板后提交匯總?cè)霂臁?/p>
數(shù)據(jù)視圖中的部分信息含帶空間坐標(biāo),為與平臺中的 GIS服務(wù)器實(shí)現(xiàn)數(shù)據(jù)交互,各子庫均采用ESRI File Geodatabase企業(yè)級地理空間數(shù)據(jù)庫的存儲管理模式。數(shù)據(jù)文件除基于Geodatabase模型的矢量、柵格、表格等 GIS文件外,還包括后綴名為.doc,.txt,.xls,.jpg,.cdr,.tif,.dat,.raw,.d,.sdd,.sta,.stw,.inf,.idx,.itf,.exp,.gcc,.prm,.axp,.map,.pdf等的其他科學(xué)數(shù)據(jù)文件類型。
功能視圖概括了在線數(shù)據(jù)支撐平臺對項(xiàng)目數(shù)據(jù)管理、匯交、發(fā)布和共享等Web Services的功能集成。平臺開發(fā)環(huán)境由Windows Server 2008+Microsoft Visual Studio 2010 + IIS 7+ ESRI ArcGIS Server 9.3,Silverlight 4 Tools for Visual Studio 2010,Bing Maps Silverlight Control SDK組成。數(shù)據(jù)導(dǎo)航主要以課題為目錄樹進(jìn)行內(nèi)容組織,按表 1分類導(dǎo)航到各數(shù)據(jù)子庫,并提供了目錄編輯功能,包括新建、刪除、移動、復(fù)制、壓縮、解壓、搜索等。共享管理提供了數(shù)據(jù)集的上傳、下載和共享功能,數(shù)據(jù)共享機(jī)制既可對項(xiàng)目組內(nèi)部訪問,也可以對外部公開訪問。平臺的主要特色是提供在線數(shù)據(jù)檢索與查看功能(如圖 4),對松科 1井?dāng)?shù)據(jù)實(shí)現(xiàn)了巖心掃描圖件、巖心照片、解釋成果文檔的多視圖管理與查詢(圖5)。特別對剖面分布專題,提供了豐富的可視化交互界面。平臺基于ASP.NET MVC2(Model-View-Controller)框架,采用微軟 Silverlight技術(shù)開發(fā)了剖面數(shù)據(jù)管理WebGIS,構(gòu)建了地圖服務(wù)RIA (Rich Internet Application)程序,賦予了豐富的客戶端數(shù)據(jù)展示與交互特征。通過 Silverlight API(Application Programming Interface)建立一系列wrapper widgets來構(gòu)建頁面交互元素,例如工具欄、底圖選擇面板、圖層控制欄等,并以XAML (Extensible Application Markup Language)文件定義他們的外觀參數(shù)和交互事件。圖6展現(xiàn)了以動畫提示給出被檢索到的剖面坐標(biāo)位置,彈出剖面詳細(xì)信息窗口顯示相關(guān)亞類數(shù)據(jù),實(shí)現(xiàn)剖面記錄的空間信息與屬性信息一體化管理。可以逐條查詢剖面或全部剖面一次性加載,且通過ArcGIS Server Rest API訪問微軟Bing Maps地圖服務(wù),展示多樣化的背景底圖。
圖4 古生物數(shù)據(jù)在線檢索示例Fig.4 An example of paleontological data online search
圖5 松科1井多視圖數(shù)據(jù)管理與查詢Fig.5 Multi-view data management and query for Songke 1 well
圖6 剖面數(shù)據(jù)查詢WebGIS窗口Fig.6 Profile data query in WebGIS window
用戶視圖對課題管理和角色管理的對應(yīng)關(guān)系進(jìn)行映射。由于平臺采用單點(diǎn)登錄的門戶技術(shù),每個(gè)平臺用戶被管理員分配為特定的角色,如首席科學(xué)家、課題負(fù)責(zé)人、主研等,并與其所在課題關(guān)聯(lián),享有對應(yīng)的數(shù)據(jù)檢索、下載、共享、發(fā)布權(quán)限。因此,保證了用戶對平臺數(shù)據(jù)操縱的安全性。
隨著我國對基礎(chǔ)研究投入的不斷加大,越來越多的地學(xué)類大型科研項(xiàng)目對項(xiàng)目組織管理方和承擔(dān)方都提出了海量數(shù)據(jù)管理、共享、以及數(shù)據(jù)成果可持續(xù)應(yīng)用的挑戰(zhàn)。面向基礎(chǔ)地質(zhì)研究的973項(xiàng)目在地學(xué)領(lǐng)域乃至資源環(huán)境領(lǐng)域的大型綜合研究中具有典型性和代表性,其學(xué)科交叉性明顯,參研單位和項(xiàng)目角色多,項(xiàng)目實(shí)施的時(shí)間跨度長,主研人員分布于不同地域和不同單位,數(shù)據(jù)成果大多具有時(shí)空屬性,尤其是地質(zhì)剖面、野外樣品和鉆井工程等歸檔數(shù)據(jù)的時(shí)空跨度大。因而,一般的管理信息系統(tǒng)或者網(wǎng)站難以勝任海量、異構(gòu)、時(shí)空性強(qiáng)的地學(xué)數(shù)據(jù)管理和共享要求。例如,973項(xiàng)目“青藏高原環(huán)境變化及其對全球變化的響應(yīng)與適應(yīng)對策”(2005CB42200)建立的門戶網(wǎng)站 http://973.itpcas.ac.cn,對各課題產(chǎn)出的矢量、柵格、表格、文本等數(shù)據(jù)集提供了基于元數(shù)據(jù)的數(shù)據(jù)共享鏈接,但未建立易操作的 GIS圖形界面接口。本文考慮 GIS和WebServices技術(shù)整合,以973項(xiàng)目“白堊紀(jì)地球表層系統(tǒng)重大地質(zhì)事件與溫室氣候變化”為例,建設(shè)了基于 ESRI File Geodatabase的項(xiàng)目匯交數(shù)據(jù)庫,開發(fā)了較完備的在線數(shù)據(jù)支撐平臺,實(shí)現(xiàn)了對項(xiàng)目數(shù)據(jù)匯交、管理、發(fā)布和共享等服務(wù)集成。同時(shí),采用微軟Silverlight技術(shù)開發(fā)了剖面數(shù)據(jù)管理WebGIS,構(gòu)建了地圖服務(wù)RIA程序,賦予了豐富的客戶端數(shù)據(jù)展示與交互特征。
平臺應(yīng)用結(jié)果表明:
1)項(xiàng)目中古生物、古氣候、地球化學(xué)、沉積學(xué)等地質(zhì)學(xué)研究中常涉及學(xué)科的實(shí)驗(yàn)分析數(shù)據(jù)在數(shù)據(jù)庫中得到了結(jié)構(gòu)分類有序的存儲和組織;包含坐標(biāo)信息的剖面和鉆孔數(shù)據(jù),其空間展布特性能夠得到直觀的表達(dá),有利于地質(zhì)研究或數(shù)據(jù)再利用中對時(shí)空屬性的識別交互。
2)首席科學(xué)家、課題負(fù)責(zé)人、項(xiàng)目辦公室、全體參研人員能借助這一在線數(shù)據(jù)支撐平臺對原始數(shù)據(jù)、成果數(shù)據(jù)和項(xiàng)目運(yùn)行資料等開展高效的匯交、檢索、下載和統(tǒng)計(jì)分析工作;在本項(xiàng)目數(shù)據(jù)匯交機(jī)制的保障下,任何入庫的數(shù)據(jù)都能在后期維護(hù)和使用中進(jìn)行可靠的質(zhì)量跟蹤。
3)本文研究開發(fā)的在線數(shù)據(jù)支撐平臺旨在服務(wù)于以地學(xué)類 973項(xiàng)目為代表的大型綜合科研項(xiàng)目,它對發(fā)揮多源、復(fù)雜、高成本的科學(xué)數(shù)據(jù)共享利用價(jià)值能夠起到良好的支撐作用;它所具備的一定通用性的平臺框架對同類項(xiàng)目數(shù)據(jù)集成、成果歸檔以及匯報(bào)演示具有示范推廣意義。
致謝:感謝973項(xiàng)目“白堊紀(jì)地球表層系統(tǒng)重大地質(zhì)事件與溫室氣候變化”各課題負(fù)責(zé)人及數(shù)據(jù)匯交聯(lián)絡(luò)員、相關(guān)專家和研究生對數(shù)據(jù)整理和分類所作的辛勤工作。