楊婧 關(guān)鑫
摘 要:元數(shù)據(jù)是說明數(shù)據(jù)內(nèi)容、質(zhì)量、條件、查詢和其他有關(guān)特征的背景數(shù)據(jù),在信息共享中有重要作用。本文重點(diǎn)介紹了地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)標(biāo)準(zhǔn)和元數(shù)據(jù)庫管理系統(tǒng)的研究。
關(guān)鍵詞::元數(shù)據(jù);數(shù)據(jù)庫;分析測試
實(shí)驗(yàn)室信息管理系統(tǒng)(LIMS)、區(qū)域地球化學(xué)數(shù)據(jù)管理系統(tǒng)(PGD )和全國巖石數(shù)據(jù)庫的逐步建立和應(yīng)用,使我國海量區(qū)域地球化學(xué)數(shù)據(jù)實(shí)現(xiàn)計(jì)算機(jī)化管理和信息共享,并能靈活、高效、方便地進(jìn)行數(shù)據(jù)查詢和數(shù)據(jù)檢索處理及成果圖示成為現(xiàn)實(shí)。然而,由于分析測試領(lǐng)域?qū)挻螅瑪?shù)據(jù)項(xiàng)目繁多,國內(nèi)外尚未制定出相應(yīng)的元數(shù)據(jù)標(biāo)準(zhǔn),各系統(tǒng)和部門的實(shí)驗(yàn)室,大都依據(jù)本系統(tǒng)的傳統(tǒng)方法建立 LIMS 系統(tǒng),或開發(fā)只局限于本部門的數(shù)據(jù)庫系統(tǒng),本應(yīng)從全局方位客觀地分析實(shí)驗(yàn)室數(shù)據(jù)的需求關(guān)系,未能從全社會(huì)共享的思維設(shè)計(jì)開發(fā)分析測試實(shí)驗(yàn)室的數(shù)據(jù)庫,由此阻礙了基礎(chǔ)數(shù)據(jù)庫的進(jìn)一步應(yīng)用和數(shù)據(jù)共享,使許多珍貴的數(shù)據(jù)資源難以有效地用于解決地質(zhì)、礦產(chǎn)、環(huán)境及農(nóng)業(yè)等方面問題。
因此,開展地質(zhì)礦產(chǎn)實(shí)驗(yàn)室分析測試元數(shù)據(jù)標(biāo)準(zhǔn)研究,建立分析測試數(shù)據(jù)元數(shù)據(jù)庫,它能為立足國內(nèi),加強(qiáng)地質(zhì)勘查,解決礦產(chǎn)資源和能源供應(yīng)以及相關(guān)領(lǐng)域的科學(xué)研究,提供分析數(shù)據(jù)的互操作和信息共享。本項(xiàng)工作為中國地質(zhì)調(diào)查局研究項(xiàng)目的子課題之一,其研究目標(biāo)是:為了指導(dǎo)和規(guī)范地礦實(shí)驗(yàn)室數(shù)據(jù)庫建設(shè)工作,根據(jù)現(xiàn)行國土資源信息的有關(guān)法律、法規(guī)、技術(shù)標(biāo)準(zhǔn),在制定的地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上,研究地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)庫管理系統(tǒng),為地質(zhì)調(diào)查實(shí)驗(yàn)室數(shù)據(jù)的組織維護(hù)、數(shù)據(jù)檢索和數(shù)據(jù)交換提供技術(shù)基礎(chǔ)。
一、 地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)
元數(shù)據(jù)是使數(shù)據(jù)充分發(fā)揮作用的重要條件之一,可用于數(shù)據(jù)文檔的建立、數(shù)據(jù)發(fā)布、數(shù)據(jù)瀏覽、數(shù)據(jù)轉(zhuǎn)換等,對(duì)于促進(jìn)數(shù)據(jù)的管理、使用和共享有重要的作用。如果沒有元數(shù)據(jù),就不能有效地管理和使用原始數(shù)據(jù)。
新一輪地質(zhì)大調(diào)查,對(duì)實(shí)驗(yàn)測試工作提出了更新、更高、更快的要求。地質(zhì)大調(diào)查不僅承擔(dān)區(qū)域化探、地質(zhì)礦產(chǎn)預(yù)查與普查、大中比例尺區(qū)域地質(zhì)及厚覆蓋區(qū)多目標(biāo)地球化學(xué)調(diào)查任務(wù),還要承擔(dān)海洋地質(zhì)、環(huán)境地質(zhì)、水資源環(huán)境的調(diào)查任務(wù)。因此,地質(zhì)大調(diào)查與原來的地質(zhì)工作相比較,已經(jīng)從單純的找礦向多元化方向發(fā)展,測試技術(shù)領(lǐng)域亦從單一的元素分析擴(kuò)大到多目標(biāo)的無機(jī)、有機(jī)、形態(tài)分析,其數(shù)據(jù)之繁多、類型之復(fù)雜,前所未有。有機(jī)地球化學(xué)研究和海洋地質(zhì)、生態(tài)環(huán)境地質(zhì)、農(nóng)業(yè)地質(zhì)、災(zāi)害地質(zhì)等都對(duì)分析測試數(shù)據(jù)管理提出了新要求。特別是開展全球地球化學(xué)填圖,要完成70 多種元素分析,需要進(jìn)行大批量樣品中的元素分析,并保證實(shí)驗(yàn)測試質(zhì)量。因此,地質(zhì)礦產(chǎn)實(shí)驗(yàn)室的分析測試元數(shù)據(jù)標(biāo)準(zhǔn)要適應(yīng)多種數(shù)據(jù)集的要求,同時(shí)力求簡潔,便于操作和實(shí)施,主要數(shù)據(jù)元素被認(rèn)為是那些重要的、值得長期記錄和保存在可存儲(chǔ)大量數(shù)據(jù)庫的計(jì)算機(jī)系統(tǒng)中的元素。為此,我們?cè)谠敿?xì)分析地質(zhì)礦產(chǎn)實(shí)驗(yàn)室分析數(shù)據(jù)的基礎(chǔ)上,參考國內(nèi)已經(jīng)制定的《國家基礎(chǔ)地理信息系統(tǒng)元數(shù)據(jù)標(biāo)準(zhǔn)》和《國土資源信息核心元數(shù)據(jù)標(biāo)準(zhǔn)》,研究制定地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)標(biāo)準(zhǔn)。
本標(biāo)準(zhǔn)提供有關(guān)實(shí)驗(yàn)測試數(shù)據(jù)標(biāo)識(shí)、覆蓋范圍以及數(shù)據(jù)集的內(nèi)容、質(zhì)量、狀況和其他特性信息。它可用于分析數(shù)據(jù)采集、交換、處理和數(shù)據(jù)庫設(shè)計(jì),以及數(shù)據(jù)集編目、數(shù)據(jù)交換網(wǎng)絡(luò)服務(wù),并滿足新一輪地質(zhì)大調(diào)查實(shí)驗(yàn)數(shù)據(jù)管理和數(shù)據(jù)共享要求。根據(jù)地礦實(shí)驗(yàn)室樣品的分析數(shù)據(jù)特征和需求進(jìn)行分類、組合,既要考慮標(biāo)準(zhǔn)的通用性,又要考慮不同實(shí)驗(yàn)室的專業(yè)化要求,在建立通用的一級(jí)元數(shù)據(jù)的基礎(chǔ)上,結(jié)合地質(zhì)行業(yè)數(shù)據(jù)類型多、數(shù)據(jù)量大和用戶類型多的特點(diǎn),建立二級(jí)元數(shù)據(jù)標(biāo)準(zhǔn),以管理好這個(gè)數(shù)據(jù)庫群, 讓用戶更多、更快、更好、更容易地了解、掌握和使用這個(gè)數(shù)據(jù)庫,并和中國地質(zhì)科學(xué)數(shù)據(jù)網(wǎng)站點(diǎn)WDC的欄目相結(jié)合,便于今后進(jìn)行數(shù)據(jù)庫的運(yùn)行維護(hù)。一級(jí)元數(shù)據(jù)的內(nèi)容由6個(gè)不重復(fù)使用的主要子集和2個(gè)可重復(fù)使用的次要子集內(nèi)容組成。
標(biāo)識(shí)信息:用于唯一標(biāo)識(shí)一個(gè)數(shù)據(jù)集,包括數(shù)據(jù)集名稱、版本、語種、出版日期、覆蓋范圍、采集資料等信息。
數(shù)據(jù)質(zhì)量信息:關(guān)于數(shù)據(jù)集質(zhì)量的評(píng)價(jià)。提供有關(guān)數(shù)據(jù)采集項(xiàng)目名稱、數(shù)據(jù)志說明、質(zhì)量控制等方面信息。
描述信息:數(shù)據(jù)集的內(nèi)容描述。提供數(shù)據(jù)集摘要、開發(fā)目的、進(jìn)展情況、關(guān)鍵詞和參考文獻(xiàn)等信息。
發(fā)行信息:數(shù)據(jù)集的獲取信息。包括數(shù)據(jù)集發(fā)行單位、發(fā)行格式、網(wǎng)上發(fā)行地址等信息。
元數(shù)據(jù)參考信息:元數(shù)據(jù)的當(dāng)前信息和負(fù)責(zé)部門信息。包括元數(shù)據(jù)負(fù)責(zé)單位、作者、地址、編寫日期、最后修改日期等信息。
二、 地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)庫管理系統(tǒng)
元數(shù)據(jù)管理的主要目標(biāo)是提高存取元數(shù)據(jù)和它所描述的數(shù)據(jù)集的能力。為了保證元數(shù)據(jù)的準(zhǔn)確性、完備性,由數(shù)據(jù)集的生產(chǎn)者來擔(dān)負(fù)元數(shù)據(jù)的建立工作。在元數(shù)據(jù)信息管理系統(tǒng)的體系結(jié)構(gòu)中,元數(shù)據(jù)的采集工作是由數(shù)據(jù)集生產(chǎn)者通過元數(shù)據(jù)管理系統(tǒng)子系統(tǒng)完成。當(dāng)有新的數(shù)據(jù)集產(chǎn)生后,數(shù)據(jù)集生產(chǎn)者可以依據(jù)元數(shù)據(jù)標(biāo)準(zhǔn),將數(shù)據(jù)集的各項(xiàng)特征信息逐個(gè)從數(shù)據(jù)集中總結(jié)提煉出來,輸入元數(shù)據(jù)管理系統(tǒng)。所有特征元素內(nèi)容填寫完畢后,并且通過管理系統(tǒng)的邏輯檢查之后,就可以將該數(shù)據(jù)利用元數(shù)據(jù)庫管理系統(tǒng)添加入庫。元數(shù)據(jù)庫是為保存和處理元數(shù)據(jù)而設(shè)計(jì)和建立的數(shù)據(jù)庫。元數(shù)據(jù)庫的運(yùn)行方式和正常數(shù)據(jù)庫相同。
1.運(yùn)行環(huán)境。本系統(tǒng)的運(yùn)行環(huán)境要求在網(wǎng)絡(luò)環(huán)境下運(yùn)行,通過WEB 方式將數(shù)據(jù)集生產(chǎn)者手中的元數(shù)據(jù)集中到元數(shù)據(jù)庫管理系統(tǒng)進(jìn)行管理,并且通過元數(shù)據(jù)發(fā)布系統(tǒng)為使用者提供查詢服務(wù)。使用者可以借助元數(shù)據(jù)深入的了解數(shù)據(jù)集的各項(xiàng)特征,最終通過元數(shù)據(jù)提供的獲取途徑取得該數(shù)據(jù)集。
2.系統(tǒng)結(jié)構(gòu)。元數(shù)據(jù)管理系統(tǒng)用于編輯生成元數(shù)據(jù)信息,另外,元數(shù)據(jù)庫是元數(shù)據(jù)共享的信息源,元數(shù)據(jù)的管理工作還必須對(duì)元數(shù)據(jù)庫進(jìn)行日常維護(hù),以保證元數(shù)據(jù)庫成為數(shù)據(jù)集共享的有效信息源,所以必須包括數(shù)據(jù)提交、數(shù)據(jù)瀏覽、數(shù)據(jù)查詢 、數(shù)據(jù)維護(hù)等內(nèi)容。
3.功能模塊
(1)數(shù)據(jù)提交。包括元數(shù)據(jù)\ 數(shù)據(jù)集\ 項(xiàng)目的提交。項(xiàng)目v的提交提供了批量數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫的功能。
(2)數(shù)據(jù)瀏覽。包括分類瀏覽、數(shù)據(jù)查詢。查詢方式簡便,組合查詢形式靈活,可以按相同項(xiàng)目的結(jié)果值大小排序查詢,用戶只須輸入分析項(xiàng)目名稱和選擇排序方式,就可查詢庫中數(shù)據(jù)集中該分析項(xiàng)目的分析結(jié)果,并按用戶要求的排序方式顯示信息。
(3)數(shù)據(jù)維護(hù)。包括用戶管理、新聞管理、訪問日志、項(xiàng)目管理。項(xiàng)目管理建立靜態(tài)數(shù)據(jù)庫,如,針對(duì)各種分析測試類型,編輯常用的分析項(xiàng)目入庫,以此建立了不同分析類型與分析項(xiàng)目的關(guān)系數(shù)據(jù)庫,在進(jìn)行數(shù)據(jù)提交時(shí),只需選擇分析測試類型,相關(guān)的分析項(xiàng)目就可調(diào)出,能大大提高分析項(xiàng)目數(shù)據(jù)提交的效率。另外一種方式是數(shù)據(jù)代碼表,它用于描述一個(gè)數(shù)據(jù)項(xiàng)中可能取值的長列表,它是一個(gè)靈活的枚舉類。使用代碼表不要求表中的元素都是已知的,可以有其他可能的取值,如,使用數(shù)據(jù)代碼表描述分析測試類型,用戶只需選擇列表項(xiàng),即可錄入?yún)?shù)。
三、 結(jié) 語
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,元數(shù)據(jù)已成為信息服務(wù)和信息資源管理不可缺少的組成部分,是信息共享的前提和基礎(chǔ)。地礦實(shí)驗(yàn)室的網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)已初具規(guī)模,利用地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)標(biāo)準(zhǔn)和關(guān)系數(shù)據(jù)庫管理系統(tǒng)建立地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)庫,同時(shí),開發(fā)地質(zhì)礦產(chǎn)分析測試元數(shù)據(jù)操作工具管理和利用元數(shù)據(jù),在地礦行業(yè)推廣實(shí)施,搭建地礦分析測試數(shù)據(jù)共享平臺(tái)。
作者簡介:楊婧(1990-),女,助理工程師,現(xiàn)在遼寧省核工業(yè)地質(zhì)局241大隊(duì)工作。