趙靜儀
地質(zhì)數(shù)據(jù)是地質(zhì)工作記錄及其成果體現(xiàn)的關(guān)鍵,文章基于地質(zhì)數(shù)據(jù)的來源,對(duì)獲取地質(zhì)數(shù)據(jù)的途徑進(jìn)行了分析,并對(duì)地質(zhì)大數(shù)據(jù)的特點(diǎn)進(jìn)行了闡述,同時(shí)提出了地質(zhì)大數(shù)據(jù)建設(shè)的發(fā)展方向,以供相關(guān)人士參考。
近些年,全國的大數(shù)據(jù)研發(fā)與實(shí)踐得到了顯著提升,大數(shù)據(jù)技術(shù)日漸成熟,相關(guān)配套設(shè)施逐步完善。而同時(shí)期,大數(shù)據(jù)產(chǎn)業(yè)展現(xiàn)出蓬勃活力,具有來源多元、形式豐富、應(yīng)用面廣的特點(diǎn)。地理學(xué)作為國民經(jīng)濟(jì)發(fā)展的基石之一,其服務(wù)深度和廣度并不僅限于表面,而地質(zhì)數(shù)據(jù)正是地學(xué)研究者進(jìn)行分析和評(píng)估的關(guān)鍵工具。雖然現(xiàn)在的地質(zhì)信息化已經(jīng)有了相當(dāng)程度的進(jìn)展,但對(duì)于地質(zhì)大數(shù)據(jù)的理解與研究仍顯不足,這就限制了地質(zhì)信息化的進(jìn)一步發(fā)展。因此,文章將立足于現(xiàn)今的大數(shù)據(jù)概念及其發(fā)展趨勢,深入討論地質(zhì)數(shù)據(jù)結(jié)構(gòu)和來源進(jìn)行的識(shí)別,以及從客觀存在和實(shí)際使用角度挖掘出大數(shù)據(jù)特點(diǎn)。希望透過這些工作,能為將來的地質(zhì)大數(shù)據(jù)定義提供更深入和系統(tǒng)的解讀,并基于此剖析當(dāng)前地學(xué)信息化建設(shè)的困難,提出地質(zhì)大數(shù)據(jù)未來發(fā)展思路。
地質(zhì)數(shù)據(jù)的獲取途徑
野外調(diào)查采集。野外勘測是地質(zhì)學(xué)者親歷現(xiàn)場,直接深入地理解地質(zhì)地理環(huán)境,觀察地質(zhì)活動(dòng)實(shí)況,包括定點(diǎn)觀測、巡回檢查、制作剖面和采集樣本,同時(shí)進(jìn)行相應(yīng)的記錄、描繪圖表以及平面圖等工作。對(duì)于地質(zhì)研究而言,這種方式是至關(guān)重要的基礎(chǔ)工作,能夠提供最真實(shí)準(zhǔn)確的地質(zhì)信息。在原始的考察辦法中,地質(zhì)錘、指南針、放大鏡是必不可少的戶外觀察工具,而記錄內(nèi)容則主要以描述性文字為主,將所有現(xiàn)場文獻(xiàn)保存在野外筆記簿中。隨著信息技術(shù)的不斷發(fā)展,新的野外信息采集儀器,如野外數(shù)據(jù)采集儀相繼問世,與數(shù)字化地質(zhì)調(diào)查系統(tǒng)和智能化地質(zhì)調(diào)查系統(tǒng)相互融合,從而完成從初階到高階的電子化、組織規(guī)范化轉(zhuǎn)變,向著更高效、精確的方向繼續(xù)前進(jìn)。
觀測監(jiān)測獲取。精密的觀測與監(jiān)測技術(shù),通過專業(yè)儀器或手工操作對(duì)特定區(qū)域的地質(zhì)屬性進(jìn)行定期評(píng)估并實(shí)時(shí)捕捉數(shù)據(jù),從而準(zhǔn)確掌握地質(zhì)環(huán)境狀態(tài)。其涵蓋范圍包括運(yùn)用傳感器檢測地下水位、流速、溫度及地應(yīng)力、位移、地面沉降等多種地質(zhì)災(zāi)變參數(shù),并由影像記錄地質(zhì)活動(dòng)過程等領(lǐng)域。目前已普遍利用電子傳感設(shè)備結(jié)合網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)數(shù)據(jù)采集與傳輸,并設(shè)立專用的實(shí)時(shí)數(shù)據(jù)庫系統(tǒng)。
工程揭露采集。工程揭露技術(shù)主要采用鉆探機(jī)械與徒手挖掘方式,涵蓋了鉆探、坑探、槽探、洞探等多種手段,以揭示地表下厚重覆蓋層中的地質(zhì)結(jié)構(gòu)及其他探索需要。同時(shí),該過程伴隨著詳細(xì)的鉆進(jìn)進(jìn)度、巖心分布、剖面特征記錄,以柱狀圖、剖面圖等形式進(jìn)行展示。然而,隨著科技發(fā)展的日新月異,現(xiàn)今人們已經(jīng)能夠輕松地利用數(shù)字采集和繪畫技術(shù)來生成各類柱狀圖、剖面圖,此外,大量的鉆井施工數(shù)據(jù)例如轉(zhuǎn)速、溫度、泥漿密度、孔斜等也都能實(shí)現(xiàn)自動(dòng)化監(jiān)測、傳輸和保存,這都得益于借助傳感器、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等現(xiàn)代科技工具。
分析測試獲取。通過對(duì)野外地貌樣本或鉆孔探查中的礦物標(biāo)本進(jìn)行全面物理與化學(xué)分析測試,能夠獲取地表物質(zhì)的特性、成分以及構(gòu)造,最終形成樣本記錄、分析結(jié)果以及處理日志。近幾年內(nèi),隨著相關(guān)分析設(shè)備的快速發(fā)展,獲取的物理、化學(xué)性質(zhì)以及敏感度均得到顯著提升,特別值得指出的是,同位素測年技術(shù)已日益走向完善。
地球化學(xué)勘探采集。地球化學(xué)勘探基于地殼及表層物質(zhì)中化學(xué)特征的獨(dú)特性進(jìn)行采樣與量化成分分析,成功制定施工規(guī)劃、測試結(jié)果以及地質(zhì)剖析報(bào)告。在科技進(jìn)步的推動(dòng)下,如今地球化學(xué)勘探可揭示的物質(zhì)特性已由原先的40余種擴(kuò)展到超過70種,并有潛力覆蓋更廣泛的元素領(lǐng)域。在此過程中,檢測精度逐步提升,微量元素的測量也愈發(fā)精準(zhǔn)。
地質(zhì)大數(shù)據(jù)的特點(diǎn)
地質(zhì)數(shù)據(jù)具備深遠(yuǎn)的應(yīng)用價(jià)值。作為地質(zhì)勘查單位與地質(zhì)學(xué)家的珍貴財(cái)富,地質(zhì)數(shù)據(jù)的應(yīng)用范圍十分廣闊。地質(zhì)工作在經(jīng)濟(jì)、社會(huì)發(fā)展中起到舉足輕重的先導(dǎo)和基礎(chǔ)作用,是決定經(jīng)濟(jì)建設(shè)走向及長期建設(shè)全程的關(guān)鍵因素。其成果不僅滿足了我國能源資源安全的需求,助力生態(tài)文明建設(shè),預(yù)防災(zāi)害,還在服務(wù)于海洋強(qiáng)國,新型城市化,工業(yè)、農(nóng)業(yè)現(xiàn)代化以及重大工程等多個(gè)領(lǐng)域以及軍事國防建設(shè)等方面發(fā)揮著積極作用。因此有理由認(rèn)為,地質(zhì)數(shù)據(jù)具有無法估量的廣泛應(yīng)用價(jià)值。
地質(zhì)數(shù)據(jù)具有獨(dú)特的再利用價(jià)值。根據(jù)地史記載,地球存在約46億年,而地質(zhì)現(xiàn)象的變化相對(duì)人類的生活則顯得極為緩慢。除了偶發(fā)的構(gòu)造變動(dòng)、火山爆發(fā)以及地質(zhì)災(zāi)害之外,大多數(shù)地質(zhì)現(xiàn)象的演變均以萬年乃至百萬年為計(jì)量單位。然而,我國大規(guī)模的有據(jù)可考的地質(zhì)調(diào)查工作至今僅進(jìn)行了不足百年。相較于地質(zhì)體的研究,這些年代因素可以被忽視。地質(zhì)學(xué)家們在某地進(jìn)行勘察時(shí),特別關(guān)注已有地質(zhì)資料的收集與研究,這使得地質(zhì)學(xué)比其他領(lǐng)域更注重?cái)?shù)據(jù)的再利用。由于人類對(duì)地質(zhì)認(rèn)知能力的限制及探測手段的局限,人們對(duì)地下物質(zhì)組成、結(jié)構(gòu)和演化規(guī)律的了解極少,甚至只能推測和猜測,猶如盲人摸象。因此,地質(zhì)工作往往需要反復(fù)進(jìn)行同一區(qū)域的調(diào)查研究,以便更好地了解并深入認(rèn)識(shí)。其中,原始的野外或現(xiàn)場采集的地質(zhì)數(shù)據(jù)最為珍貴,它們只是客觀詳細(xì)地描繪了地質(zhì)現(xiàn)象。而經(jīng)過處理過的數(shù)據(jù),如工作進(jìn)程中的衍生數(shù)據(jù),雖然也具有一定意義,但因其包含了部分個(gè)人主觀推斷,通常只用于參考。
地質(zhì)數(shù)據(jù)獨(dú)具時(shí)空特性。所有地質(zhì)數(shù)據(jù)都以特定地點(diǎn)的地質(zhì)特征或性質(zhì)為主,都附有明確的空間坐標(biāo),而唯有將具體位置予以詳細(xì)記錄的地質(zhì)數(shù)據(jù)才有其科學(xué)價(jià)值。在這其中,地質(zhì)體的地質(zhì)演進(jìn)過程及其相應(yīng)的地質(zhì)年代皆為地質(zhì)數(shù)據(jù)中的重要組成部分。地理信息數(shù)據(jù)同樣具有豐富的時(shí)空特性,與地質(zhì)數(shù)據(jù)以及其他各類型地學(xué)數(shù)據(jù)共享同一性。
地質(zhì)數(shù)據(jù)具有較大的局限性、多解性和模糊性。鑒于地球遼闊,地質(zhì)人員得以實(shí)地考察、施工和取樣的地點(diǎn)極其有限,因此他們所得出的地下狀況理解存在很大偏頗且具局限性,頻繁出現(xiàn)的現(xiàn)象則為“一孔之見”。諸如地球物理探測與遙感在內(nèi)的各種探測技術(shù),都依賴于物性和光性的反演推斷,但其可信度和精度往往受到事實(shí)認(rèn)證的限制,因此這些方法實(shí)測得到的地質(zhì)認(rèn)知同樣具有多解性。此外,地球被視為一個(gè)有機(jī)整體,地質(zhì)研究必須結(jié)合地球體系科學(xué)觀點(diǎn)來深入理解,然而由于野外獲取數(shù)據(jù)的不足以及各類間接手段解讀數(shù)據(jù)時(shí)的多解性,使得基于綜合研究得出的最終結(jié)果(即成果數(shù)據(jù))具有較明顯的模糊性。這也是為何人們在地質(zhì)報(bào)告中經(jīng)??吹绞褂谩巴茰y”“可能”“估算”等模糊措辭的原因。
地質(zhì)大數(shù)據(jù)的發(fā)展方向
多年來,地質(zhì)大數(shù)據(jù)所面臨的挑戰(zhàn)包括:開放共享困難、應(yīng)用效益低且缺乏大規(guī)模應(yīng)用,這主要源于多個(gè)源頭的數(shù)據(jù)。首先,這種數(shù)據(jù)與特定的數(shù)據(jù)描述模型間的間隔,導(dǎo)致了數(shù)據(jù)的多樣性和復(fù)雜性,限制了在存儲(chǔ)與檢索上的效率。其次,數(shù)據(jù)生產(chǎn)者對(duì)共享的積極性較低,也限制了數(shù)據(jù)匯聚的程度。再次,挖掘和分析這些數(shù)據(jù)的難度高,使得獲取有價(jià)值的信息增加了難度。此外,數(shù)據(jù)的匯聚效率較低,尚未實(shí)現(xiàn)有效的系統(tǒng)化方法。最后,地質(zhì)大數(shù)據(jù)的大眾認(rèn)知水平有限,盡管具有潛在的應(yīng)用價(jià)值,但關(guān)注率并不高。為此,應(yīng)加強(qiáng)以下幾個(gè)方面的工作,以推動(dòng)地質(zhì)大數(shù)據(jù)的高質(zhì)量發(fā)展。
加強(qiáng)地質(zhì)數(shù)據(jù)模型研發(fā),規(guī)范化地質(zhì)數(shù)據(jù)采編。要解決現(xiàn)有地質(zhì)數(shù)據(jù)采集的隨意性問題,提高數(shù)據(jù)規(guī)整和應(yīng)用效率,國家應(yīng)大力推動(dòng)開發(fā)具有高度可信度的地質(zhì)數(shù)據(jù)模型,覆蓋全領(lǐng)域通用和專業(yè)數(shù)據(jù)類型。此外,需要制定和發(fā)布地質(zhì)數(shù)據(jù)采編規(guī)程作為行業(yè)指導(dǎo)性標(biāo)準(zhǔn)(如圖1),統(tǒng)一規(guī)范行業(yè)廠商地質(zhì)勘探設(shè)備和相應(yīng)軟件系統(tǒng)的數(shù)據(jù)表示方法,協(xié)助全社會(huì)地質(zhì)勘查機(jī)構(gòu)實(shí)現(xiàn)標(biāo)準(zhǔn)化的數(shù)據(jù)采集及成果展示。
深化大數(shù)據(jù)存儲(chǔ)管理研發(fā),提升數(shù)據(jù)管理與分享能力。同時(shí)改進(jìn)并完善地質(zhì)元數(shù)據(jù)標(biāo)準(zhǔn)體系,設(shè)計(jì)有效且易用的元數(shù)據(jù)收集工具。規(guī)范地質(zhì)多元數(shù)據(jù)的編制流程,搜集并妥善修改已有元數(shù)據(jù),進(jìn)一步加強(qiáng)數(shù)據(jù)的鞏固工作。綜合考慮各類地質(zhì)數(shù)據(jù)的特性和格式、數(shù)量等因素,創(chuàng)新性地構(gòu)建混合式數(shù)據(jù)庫架構(gòu)(如圖2),并實(shí)行在線和離線的雙重?cái)?shù)據(jù)管理策略,以期有效地管理地質(zhì)大數(shù)據(jù)。
深化地質(zhì)大數(shù)據(jù)結(jié)構(gòu)化轉(zhuǎn)化探索,提升處理高效性。當(dāng)前,多數(shù)紙質(zhì)地質(zhì)文獻(xiàn)已實(shí)現(xiàn)數(shù)字化,但仍以非結(jié)構(gòu)化語言描述或圖像形式存在,處理效率較低。針對(duì)已掃描的地質(zhì)報(bào)告,通過精密的文字識(shí)別技術(shù)將其轉(zhuǎn)換為文本格式,并創(chuàng)建相應(yīng)的表格文件。對(duì)于類似文檔,應(yīng)用自然語言智能識(shí)別技術(shù),依據(jù)地質(zhì)數(shù)據(jù)描述模型對(duì)文本進(jìn)行識(shí)別與信息抽取,最終生成結(jié)構(gòu)化的表述數(shù)據(jù)。同時(shí),對(duì)掃描后的圖像數(shù)據(jù)進(jìn)行地質(zhì)屬性的精準(zhǔn)識(shí)別,建立矢量圖形文件。以上相關(guān)研究技術(shù)已然成型,可有效支持大規(guī)模的批量化處理工作。
深化地質(zhì)大數(shù)據(jù)整合分析,提高其利用率和效益。遵循大數(shù)據(jù)理論與方法,致力于推進(jìn)地質(zhì)數(shù)據(jù)的深度融合,創(chuàng)造出具有爆發(fā)力的數(shù)據(jù)“火花”,或者碰撞出新的觀點(diǎn)。而在進(jìn)行數(shù)據(jù)碰撞之前,務(wù)必保證數(shù)據(jù)間坐標(biāo)和時(shí)間基準(zhǔn)的一致性,數(shù)據(jù)描述的精細(xì)度或可比性的高相符度,在此基礎(chǔ)上加強(qiáng)地質(zhì)大數(shù)據(jù)的研究及資料整理。同時(shí),深入解析成礦模型、找礦模型以及地質(zhì)演化模型等,最終構(gòu)建相應(yīng)的業(yè)務(wù)模式、數(shù)據(jù)模型及算法。此外,運(yùn)用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù),進(jìn)一步提高地質(zhì)大數(shù)據(jù)的深層挖掘和分析應(yīng)用。
綜上,我國已累計(jì)形成獨(dú)具價(jià)值的地質(zhì)數(shù)據(jù),堪稱重要的自然與國家大數(shù)據(jù)寶庫。地質(zhì)工作作為構(gòu)建社會(huì)活動(dòng)及經(jīng)濟(jì)穩(wěn)健發(fā)展的基石,其所提供的地質(zhì)數(shù)據(jù)兼?zhèn)鋾r(shí)空特性以及大數(shù)據(jù)的關(guān)鍵特征,且呈現(xiàn)出明顯的行業(yè)特色,具備廣泛的應(yīng)用潛能。同時(shí),建立健全地質(zhì)大數(shù)據(jù)服務(wù)產(chǎn)品分級(jí)管理體制,提升地質(zhì)大數(shù)據(jù)的融合處理效率,加大業(yè)務(wù)分析模型建設(shè)力度,構(gòu)建完整的地質(zhì)大數(shù)據(jù)體系,以增強(qiáng)我國地質(zhì)大數(shù)據(jù)在國際社會(huì)中的影響力。
[作者單位:河北省區(qū)域地質(zhì)調(diào)查院(河北省地學(xué)旅游研究中心)]