高學正,賈麗瓊,吳 楠,孔昭煜
(1.中國地質調查局發(fā)展研究中心,北京 100037;2.全國地質資料館,北京 100037)
地質資料是地質工作的真實記錄與成果的結晶,是國家的寶貴財富[1],我國能源資源的保障以整個地質工作作為依托,而地質資料管理與服務是開展地質工作的重要基礎[2]。隨著計算機技術的發(fā)展,傳統的紙質資料服務不足的問題凸顯,并逐漸成為地質資料發(fā)展的瓶頸[3],地質資料數字資源成為了新形勢下地質資料服務的主體[4],數字資源目錄的建立可以為海量數字資源的高效管理和精準服務提供支撐[5]。本文以全國地質資料館的目錄資源現狀為基礎,探討目錄體系構建的必要性,分析其價值與意義,為地質資料數字資源目錄的發(fā)展提供理論基礎。
地質服務,目錄先行。隨著地質資料館藏信息資源的日益豐富,館藏資料目錄和元數據目錄不斷完善,也衍生出了包括地質資料目錄、地質圖目錄在內的多種數字資源目錄,利用這些目錄信息資源。近幾年來,全國地質資料館圓滿完成了對世界地球日、中國國際礦業(yè)大會等活動的有力支撐,向世界地質同行展示了我國地質資料管理和服務的最新進展與成果。地質災害應急服務能力顯著提升,實現了地震發(fā)生后4 h內形成該災害地區(qū)的地質專題服務產品,為搶險救災爭取了寶貴時間,為災后重建工作提供了信息支持,資料目錄的高效建設和管理為以上工作的成功開展奠定了基礎。
地質資料是地質工作形成的重要基礎信息資源,是地質工作成果的具體體現,也是地質找礦智力投入的重要載體[6]。經過60多年的不懈努力,全國地質資料館已擁有了數量可觀的資料成果及相應的數字資源目錄[7],依據館藏資料目錄,可以從中提取出包括檔號、題名、編著者、形成單位、形成時間、內容提要等92個數據項,內容較為豐富。截至2017年12月底,全國地質資料館館藏資料目錄達142 380檔,其中包含地質調查資料目錄9 837檔,非地質調查資料目錄132 543檔[8]。其中各類型地質資料目錄占比為:區(qū)域調查資料目錄10 338檔,占比7.26%;海洋地質調查資料目錄303檔,占比0.21%;礦產勘查資料目錄86 673檔,占比60.87%;水工環(huán)勘查資料目錄12 615檔,占比8.86%;物化遙勘查資料目錄13 236檔,占比9.30%;地質科學研究資料目錄17 213檔,占比12.09%;技術方法研究資料目錄1 675檔,占比1.18%;其他資料目錄327檔,占比0.23%。
元數據是數據共享交換的核心與基本形式之一,元數據工作能力也是包括各類圖書館、檔案館和數據中心的核心業(yè)務能力之一,是數據管理的必要手段,同時也是建立數據之間關聯關系的必要手段[9]。為更好地利用網絡技術,發(fā)揮地質資料的巨大價值,為地質資料用戶提供方便,全國地質資料館十分重視地質資料元數據庫的建設,不斷加大投入研究地質資料元數據模型,開發(fā)細粒度元數據采集編目系統,并將采集的數據目錄進行網絡發(fā)布。地質資料元數據庫中包含了唯一標識符、文件名稱、語種、資料格式、文件大小等138項重要內容,隨著元數據信息的不斷擴充,為全國地質資料館其他工作的開展提供了支撐,同時極大的促進了地質資料網絡服務工作的開展。目前,全國地質資料館文件級元數據庫包含目錄共計4 396 937萬條,其中矢量數據目錄1 547 145萬條,圖文數字化目錄2 849 792萬條,按照地質資料文件類型詳細劃分,見表1。
表1 地質資料元數據目錄分類統計表
地質資料目錄體系的構建對于地質資料館藏機構來說十分重要,數字資源目錄可以在數據所有者與用戶之間起到橋梁和紐帶作用,使地質資料管理和服務部門可以更好的實現地質資料信息的表達與傳遞,同時其也是數字資源可以被快速利用的需要,可以保障數字資源的長期可用。
隨著地質工作的開展,每年都有很多地質資料相繼匯交到地質資料館藏機構,盡快將這些資料信息向社會進行公布,既可以使社會公眾及時了解地質工作進展,又是對于地質工作人員的一種回報與肯定。但由于地質資料普遍存在結構紛繁復雜、數據量大等特點,從接收到服務需經過必要的處理環(huán)節(jié),不能立刻進行服務,而地質資料目錄處理相對簡單,時效可以得到保證,將進館數據目錄按批次進行匯總、公開,以便公眾及時了解新進館資料的基本信息,掌握地質資料的動態(tài)變化,為今后到館借閱相關資料做好準備。
隨著互聯網技術的發(fā)展以及館藏資料數字化的逐步完成,全國各地質資料館藏機構的數字資源急劇增長,一方面為用戶提供了豐富的數字資源,另一方面數字資源的巨量與無序,質量良莠不齊,給用戶有效利用數字資源帶來了新的困難與障礙[10]。數字資源目錄可以有效梳理繁雜無序的資料成果,使數字資源質量和數據得到有效控制[11]。為了方便用戶檢索和利用地質資料,同時使館藏數字資源質量得到保證,實現高效管理,快速服務于社會,建設館藏資料目錄成為了使數字資源得到有效利用的有效途徑與必由之路。
大數據時代下,各行業(yè)的數字資源作為一種信息資源,實現其所蘊含的信息資源共享至關重要[12]。在目前的條件下,讓不同部門、不同專業(yè)的各類資料保管機構進行數據的交換比較困難,但如果可以通過制定相應的規(guī)則,在計算機軟硬件技術的配合下,采用資料檔案與數據管理共享的理念,突出資料數據的目錄與元數據服務共享工作成果,即利用資料目錄服務接口互相調用的方式達到多部門、多專業(yè)的電子信息資源的共享,通過對內、對外目錄數據發(fā)布和目錄服務的調用,為地質部門、相關行業(yè)部門、各級政府以及社會公眾提供更好的數據服務。
依托數字地質資料館的建設,全國地質資料館已經實現了多種類數字資源目錄向社會的集中展示,形成了適合全國地質資料館資料管理與社會化服務的目錄體系。以館藏地質資料目錄為基礎,利用統一標準的元數據模型,經過對資料數據的采集,形成了全國地質資料元數據目錄(案卷級目錄和文件級目錄),以此兩個目錄為核心,依據資料利用的需求對目錄進行分析與提取,目前已經形成了全國地質資料目錄、地質圖目錄、專題目錄、最新資料目錄以及互聯互查等資源目錄(圖1)。
圖1 全國地質資料館目錄體系框架
1) 全國資料目錄。包含了全國地質資料館可公開的全部地質資料目錄,發(fā)布內容按照資料的檔號進行排列,提供資料的元數據目錄信息包括了每件地質資料基本信息、分發(fā)信息、空間信息等內容,并可按照專業(yè)分類、礦產名稱、形成時間、工作程度等不同類別信息進行查詢檢索。
2) 地質圖目錄。主要內容為館藏資料中各種比例尺的地質圖空間數據庫目錄,包括國家地質圖數據庫、國家礦產資源數據庫、國家水工環(huán)地質數據庫、國家海洋地質調查數據庫、國家物化遙勘查數據庫、地質科學研究數據庫等??上蛏鐣娞峁?∶50萬地質圖的服務元數據以及WMTS服務以加載到自身的地圖瀏覽器使用,大、中、小比例尺的地圖都涵蓋在其中。
3) 專題目錄。針對國家重點工程建設、找礦突破行動、地質災害應急、公眾關注熱點以及活動紀念等重大事項,全國地質資料館開發(fā)制作了5大板塊、48個專題服務產品,相應的資料目錄也包含在其中。①地質圖庫目錄中包含了國家地質圖數據庫目錄、全國礦產地數據庫目錄、全國1∶20萬地質圖系列目錄、1∶20萬水文地質圖系列目錄等7項內容;②應急服務目錄中包含了我國近期所發(fā)生的各類地質災害目錄,并第一時間向社會公布,如新疆喀什地區(qū)葉城縣5·2級地震專題、四川阿壩州九寨溝縣地震專題等;③行業(yè)聚焦板塊包括了One Geology全球聚合、地質關鍵詞大數據等4項內容;④公眾熱點板塊制作了贛南扶貧綜合地質調查成果數據服務專題、全國礦產資源潛力評價專題、全國城鎮(zhèn)化地質資料專題等;⑤活動紀念板塊包括紀念陳夢熊院士誕辰100周年史、“七七事變”80周年地質史料展、紀念中國地質事業(yè)奠基人丁文江先生等8項內容。專題服務產品及目錄的制作與發(fā)布,可以實現更加有針對性的資料服務,為現代化建設提供重要基礎數據,為地質找礦提供指導信息,為地學知識宣傳普及提供渠道。
4) 最新資料目錄。全國地質資料館每年的進館資料為5 000檔左右,數量十分可觀,為提高服務響應速度,盡快將所接收的資料信息提供社會化服務,全國地質資料館會首先對進館資料的目錄數據進行核查與提取等處理,將其按照新進館資料目錄、新增電子文檔目錄的方式按照批次進行網絡發(fā)布,及時提供用戶使用,使用戶及時了解館藏資料動向,借閱資料做到有的放矢。
5) 互聯互查目錄。目前,全國地質資料館已經建立起了同美國政府開放數據平臺(https:∥www.data.gov/)、澳大利亞地質調查局、英國地質調查局、歐盟空間數據庫(http:∥inspire.ec.europa.eu/)、國家測繪地理信息局、國家自然資源和地理空間基礎信息庫等機構建立了資源目錄的互聯互通機制。實現了目錄元數據的在線注冊和使用,提供語義數據的上傳、編輯、備份、查詢管理等功能。通過數字地質資料館網站,資源目錄的互聯互通實現了各專業(yè)機構資料目錄的一鍵同查、快速響應、信息共享的目標,提升地質資料目錄的使用效率,為用戶提供更豐富的數據,更多元的服務。
1) 制定并優(yōu)化目錄模型。目錄模型是形成資源目錄的基礎與核心,地質資料數據的目錄模型是隨著地質資料數據生命周期的發(fā)展,在不同階段會有不同的擴展,因而在進行數據目錄模型制定時,需要按照一定的標準和規(guī)則,根據實際工作的需要對其不斷優(yōu)化,根據服務對象與服務產品類型進行模型的改造,從而達到理想的使用效果。
2) 設計并開發(fā)目錄系統。地質資料元數據采集編目系統、數字資源目錄互聯互查系統等目錄系統是實現全國地質資料館高質量資料管理與服務的重要手段,依據制定好的目錄模型,設計并開發(fā)相關目錄系統,解決工作中面臨的資料元數據著錄與服務、目錄數據集的集中存儲與管理、資源目錄互聯共享等問題,提高資料管理和服務效果。
3) 注重目錄的維護更新。隨著數字資源目錄的不斷擴充,數據量日益增大,管理好龐大的目錄數據庫成為了一項重要的工作內容,因此在目錄數據的維護上,需要制定數字資源目錄的更新維護策略,定期開展目錄數據的檢驗與核查,確保目錄資源的及時性與準確性,保障數據的長期可用。
4) 探索多樣化的目錄服務模式。充分借鑒國內外先進的服務理念,加強對資料用戶的需求調研,從展現形式和內容把握上研究制作符合用戶需要的目錄服務產品,實現目錄資源的定制化服務,滿足資料用戶的多元化需求,切實提高目錄資源的利用效率,發(fā)揮地質資料的巨大價值。
[1]商云濤,賈麗瓊,齊釩宇,等.地質資料服務元數據互聯互查平臺設計[J].中國礦業(yè),2017,26(4):78-82.
[2]高學正.全國地質資料館地質資料服務現狀及對策研究[D].北京:中國地質大學(北京),2016.
[3]程結晶,張方,熊冬萍.數字資源目錄服務體系研究[J].情報理論與實踐,2009,32(11):75-78.
[4]孔昭煜,商云濤,高學正,等.國家地質資料數據中心構建研究[J].中國礦業(yè),2016,25(S2):92-96.
[5]齊釩宇,孔昭煜,高學正,等.地質資料數字資源建設現狀及發(fā)展趨勢研究:以全國地質資料館為例[J].中國礦業(yè),2017,26(6):34-38.
[6]王新春,齊釩宇,李曉蕾,等.資料數據集成與服務研究——以整裝勘查區(qū)地質工作為例[J].中國地質,2016,43(2):691-697.
[7]高學正,李曉蕾.地質資料網絡服務產品及服務價值研究[J].中國礦業(yè),2017,26(4):64-68.
[8]高學正,孔昭煜,齊釩宇,等.全國地質資料館館藏資料現狀及服務趨勢研究[J].中國礦業(yè),2016,25(S2):73-76.
[9]李晨陽,吳軒,王新春,等.全國地質資料館核心數字系統研發(fā)成果報告[R].中國地質調查局發(fā)展研究中心(全國地質資料館),2013.
[10]譚必勇.目錄控制思想在政府信息資源管理領域的應用及其發(fā)展趨勢[J].圖書情報知識,2009(9):30-35.
[11]程結晶,陳淋.數字資源目錄體系的框架流程初探[J].圖書館學研究,2014(5):63-68.
[12]郭玉梅.目錄體系——實現政務信息資源共享的基礎[J].軟件工程師,2011(7):37-40.