李曉翠,朱鵬飛,張云龍,劉琳瑩,劉武生,孔維豪,白蕓
(核工業(yè)北京地質研究院 中核集團鈾資源勘查與評價技術重點實驗室,北京 100029)
建設鈾礦大基地是提高國內天然鈾供應保障能力的重要舉措[1],二連盆地作為北方中新生代沉積盆地首批具備建設鈾礦大基地的地區(qū)之一,具有巨大的找礦潛力,其鈾礦地質工作始于20 世紀80 年代,相繼落實了一批鈾礦床,發(fā)現了一批鈾礦產地,鈾礦勘查和研究取得了重大進展。通過大量找礦實踐和研究,積累了涵蓋基礎地質、礦產地質、地球物理、地球化學、遙感地質、水文地質、鉆探工程、測繪工程等學科領域的科研數據和成果。然而,這些數據多來自于不同渠道的項目,數據結構上未整合為統(tǒng)一體系,鈾礦地質數據模型的標準化方面還不夠完善,從而阻礙了數據之間的訪問與交流。因此,建立一套完整的數據標準是必要的,同時,標準化研制對推動大數據產業(yè)、加快技術與標準的相互融合、推動大數據發(fā)展國家戰(zhàn)略和數據立法具有重要意義[2-3]。
美國地質調查局(USGS)花費9 年時間制定了空間數據轉換標準SDTS。澳大利亞以SDTS 為基礎,結合本國實際情況,制定了自己的SDTS。英國、法國、德國、瑞典、日本等發(fā)達國家也相繼建立了適合本國特點的數據標準[4-5]。我國空間數據標準和規(guī)范的制定起步較晚,有關部門和行業(yè)也制定了一系列空間數據標準和規(guī)范,如國家測繪局開發(fā)的各級比例尺數字地形圖圖式標準、原地質礦產部相繼制定和發(fā)布了一系列地學數據記錄格式標準,1988 年7 月發(fā)布了地質礦產術語分類代碼(GB9649—1988)[6],以此為基礎相繼制定發(fā)布了一系列數據記錄格式標準[7-11],并按關系數據庫模式在全行業(yè)開展了建庫工作。目前,中國地質調查局已制定發(fā)布了一系列標準規(guī)范,并按照各自的規(guī)范標準建立了主要的12 個專題數據庫[12]。在石油領域,制定了一整套完整的勘探開發(fā)數據標準體系,共分為7 大類,83 項標準,其中,基礎標準1 項、元數據數據元標準3項、信息分類與代碼標準8 項、源點數據采集規(guī)范33 項、業(yè)務模型標準33 項、圖形標準3 項、交換標準兩項,為石油勘探開發(fā)數據資源采集、存儲、管理和應用提供了完備的標準支持[13]。但是他們大都是自成體系,很難完全滿足鈾礦地質領域數據庫建設與數據應用等方面的需求。為此,在引用國家已頒布的數據記錄格式的基礎上,借鑒其他行業(yè)相關標準規(guī)范,結合鈾礦地質科研生產實際,本文建立了二連基地多元信息數據庫數據模型,主要包括鉆孔數據模型、圖件數據模型、文檔數據模型等。基于建立的數據模型,規(guī)范了二連基地多元信息數據庫的建設工作。二連基地多元信息數據庫的構建,便于各類資料的綜合管理,利于科研生產人員進行檢索、查詢、數據分析、信息提取和成圖等,為鈾礦地質云平臺應用示范系統(tǒng)建設(以下簡稱“鈾礦地質云平臺”)、三維建模分析及工作區(qū)內四定預測奠定了堅實的數據基礎,有效支撐了二連盆地鈾礦地質科研生產工作的開展。
數據模型是數據組織和數據庫設計的基礎和依據[14]。數據模型的建立能為數據的合理組織和優(yōu)化利用奠定基礎[15]。結合工作實際,在資料收集、綜合研究、調研咨詢、需求分析等工作的基礎上,編制了二連基地多元信息數據庫數據模型,主要包括鉆孔數據模型、圖件數據模型、文檔數據模型,進而構建了二連盆地多元信息數據庫。
參考主流礦業(yè)三維軟件鉆孔數據表結構,依據科研與生產中鉆孔資料的屬性特征,將鉆孔資料數據劃分為鉆孔基本信息表、鉆孔方位測量表、綜合編錄表、測井記錄表、礦化信息表等。
1)鉆孔基本信息表:該表用于記錄鉆孔的地理位置,如施工地點、施工單位、鉆機型號、負責單位、施工日期和操作人員等一般信息(表1)。
表1 鉆孔基本信息及屬性說明Table 1 Basic information and attribute description for the borehole
表1(續(xù))
2)鉆孔方位測量表:該表通過記錄鉆孔的傾角和方位角來描述鉆孔在鉆進過程中的傾斜情況(表2)。
表2 鉆孔方位測量信息及屬性說明Table 2 Azimuth measurement information and attribute description for borhole
3)綜合編錄表:該表用于記錄鉆孔巖心的編錄資料,如巖性、地質時代、粒度等詳細編錄信息(表3)。
表3 綜合編錄信息及屬性說明Table 3 Comprehensive logging and attributes description of bolehole
表3(續(xù))
4)測井記錄表:用于記錄放射性、電法等測井方法所獲取的數據(表4)。
表4 測井記錄信息及屬性說明Table 4 Logging record information and attribute descriptiom of borehole
5)礦化信息表:此表詳細的記錄了鉆孔的礦化位置及礦化程度等信息(表5)。
表5 礦化信息及屬性說明Table 5 Mineralization information and attribute description of borehole
1.2.1 圖件基本構成
二連基地圖件數據所描述的工作成果主要包括:信息類圖件、成果類圖件和典型礦床類圖件,其中信息類圖件又進一步細分為構造類圖件、建造類圖件、改造類圖件和礦化信息類圖件。所有圖件根據研究區(qū)資料的豐富程度和工作程度等將空間劃分方式和比例尺分為4 大類,一般來說,二連盆地或區(qū)域級比例尺為1∶25萬,重點工作區(qū)級比例尺為1∶10萬,成礦區(qū)級比例尺為1∶5萬,礦床級比例尺為1∶1萬~1∶2.5萬。
二連基地多元信息數據庫中,圖件數據模型的主要構成如下表(表6):
表6 二連基地多元信息數據庫圖件數據模型一覽表Table 6 Data scheme of multiple information database in Erlian basin
表6(續(xù))
1.2.2 圖層劃分原則
在二連基地多元信息數據庫中,矢量化的圖件數據主要采用MapGIS 軟件格式進行存儲,因此,圖層劃分需適應GIS 軟件功能特點,其主要劃分原則包括:
1)按照實際科研生產需求,將空間數據模型劃分為若干圖層;
2)相同邏輯內容的空間信息、相互關系密切的數據歸為統(tǒng)一圖層;
3)使用頻率高的作為主要圖層。
1.2.3 圖層劃分
在圖件數據庫中,圖件類數據資料主要有兩類,一類是JPEG、TIFF、PDF 等圖像格式,這類數據的整理需確保圖像內容清晰,文件名與其一致;另一類是MapGIS、ArcGIS 等數字化格式的矢量數據,本小節(jié)中的圖層劃分主要針對MapGIS 格式的圖件,由于數據庫中涉及圖件共63 類,本文僅以二連盆地(或研究區(qū)、重點工作區(qū)、成礦區(qū))砂巖型鈾礦地質圖為例進行說明(表7)。其圖面要素主要分為地質類、地理類、輔助類等3 類,地理類和輔助類可依據具體實際進行選擇,地質類要素進一步劃分為地層、地質界線、沉積盆地邊界、斷裂、富鈾層(體)、富鈾層(體)邊界、鈾礦產地、鉆孔、各類標注等圖層,并規(guī)定了相應圖層的要素類型(點、線、面)和重要程度(必要、可選、輔助),同時,對部分圖層下掛的屬性數據表進行了規(guī)定,進一步規(guī)范和豐富了該圖層的內容,并在表中的“備注”欄進行說明。
表7 二連盆地(研究區(qū)、重點工作區(qū)、成礦區(qū))砂巖型鈾礦地質圖圖面要素信息一覽表Table 7 Mapping elements for sandstone type uranium deposits of working area,key sector and mineralization target in Erlian Basin
在二連基地多元信息數據庫中,文檔數據多以DOC、DOCX、PDF、TIFF、JPEG 等格 式存儲,在建庫過程中,按照資料所屬類別,建立文件夾分類分級別存放(表8)。這類數據的整理要確保內容完整清晰,文件名與內容一致。
表8 文檔數據結構一級分類表Table 8 First level classification of document structure
通過多年的工作,二連盆地已經積累了相當規(guī)模的多源異構地學數據,涵蓋了地、物、化、遙、水、鉆探等專業(yè),這些數據相對零散,利用率較低,在構建二連基地多元信息數據庫之前,需對研究區(qū)資料進行全面收集與梳理,根據數據分類方案,對其進行篩選與初步處理(圖1)。
圖1 資料篩選流程Fig.1 Data screening flow chart
在資料集成工作中,前期的數據采集與數據處理所占工作量最大。針對不同的資料類別,對已篩選的資料進行整理與處理:
1)表格數據,紙質版需采用掃描方式轉為JPG 格式或PDF 文檔,對于需要用于分析研究的數據(如鉆孔數據),采用手工錄入的方式轉換為電子表格,并使之符合鉆孔數據模型或數據庫屬性結構;
2)各類圖件,紙質版需通過掃描形成JPG格式數字柵格化圖,參與專項研究、三維地質建模等工作的圖件,則通過矢量化工作轉化為MapGIS 軟件格式數字線劃圖,并符合圖件數據模型的相關要求;
3)報告數據,紙質版需采用掃描方式將其轉換為PDF 文檔做數字化處理。通過掃描、格式轉換、分類整理后的數據按資料來源分別進行存儲,并對整理完畢的文件賦予可唯一標識的特征碼,作為數據庫原始資料進行有效管理[16]。
二連基地多元信息數據庫主要包括鉆孔數據庫、圖件數據庫和文檔數據庫。
二連基地鉆孔數據庫按照鉆孔基本信息表、鉆孔方位測量表、綜合編錄表、測井記錄表、礦化信息表等5 個表格進行整理匯總,共計入庫各類鉆孔4 814 個,記錄總條數690 余萬,為方便科研與管理人員的使用,在鉆孔基本信息表中增加了原始數據的超鏈接,實現了原始數據的實時查看。
二連基地圖件數據庫主要包括3 類圖件:信息類圖件、成果類圖件和典型礦床類圖件。其中,信息類圖件又進一步細分為構造類圖件、建造類圖件、改造類圖件、礦化信息類圖件、剖面圖、柱狀圖、實際材料圖;典型礦床類圖件進一步按礦床名稱進行分類。目前,圖件數據庫共入庫圖件701 幅。
二連基地文檔數據庫中的數據多以DOC、PDF、TIFF、JPEG 等格式存儲,按照文檔數據模型要求,進行分類分級別存放,目前,共計入庫文檔609 份。
為保證二連基地多元信息數據庫的可靠性和準確性,提交合格規(guī)范的數據,在開展數據庫建設的工作過程中,通過建立質量保障措施和質量監(jiān)控制度,確保數據庫的工作質量。在組織制度方面,成立了項目領導組和專家組,負責項目組織協(xié)調和專業(yè)技術咨詢等工作,從而保證項目的順利實施;在數據標準化方面,項目之初編制了數據模型,規(guī)定了所要完成的數據表、圖件類和文檔類等,使用統(tǒng)一的系統(tǒng)庫,對最終成果進行了規(guī)范標準化;在質控制度方面,采用了工作日志制度、自互檢制度、全面檢查制度、階段性抽查制度、兼職質檢員制度等。通過以上環(huán)節(jié)的工作和采取的相關措施,保障了二連基地多元信息數據庫的數據質量,為后續(xù)應用奠定了良好的數據基礎。
數據庫的建設,大大縮短了三維地質建模研究前期數據準備的時間,據統(tǒng)計,在三維地質建模工作中,前期數據收集、整理、分析的時間約占總工作量的60%~70%,通過前期數據庫的建設,快速建立了哈達圖礦床及外圍三維地質實體模型,有效地提高了工作效率,為該地區(qū)的三維四定預測研究奠定了模型基礎。
在哈達圖礦床及外圍研究范圍內,共收集鉆孔197個、剖面圖11幅,底板等深圖各1幅、基底構造圖1幅、北西向地球物理剖面圖3幅(圖2)。在找礦模型指導下,該區(qū)預測研究在賽漢組上段地層的各亞層中開展,以賽漢組上段各亞層底板模型為基礎,以500 m為間隔對底板模型進行重采樣,提取底板格架控制點,根據鉆孔數據中各亞層的分界點,剖面數據中各亞層之間的分界線,綜合建立了賽漢組上段3個亞層的地層模型(圖3)。根據鉆孔巖性數據,將鉆孔巖性數據根據粒度劃分為泥、粉砂、砂、礫,把屬性數據導入到建模軟件中進行屬性插值,計算研究區(qū)巖性模擬結果,將其最終顯示為泥砂二值化結果,可直觀地查看目的層內泥砂分布情況(圖4)。
圖2 哈達圖礦床及其外圍鉆孔分布三維展示圖Fig.2 3D display of Hadatu deposit and its surrounding boreholes
圖3 哈達圖礦床及其外圍K1s2地層各亞層模型示意圖Fig.3 3D schematic model of sub layers of K1s2 stratum in Hadatu deposit and its periphery
圖4 哈達圖礦床及其外圍砂體模擬結果Fig.4 Simulation results of Hadatu deposit and its surrounding sandbodies
數據庫的建設有利于全面掌握地質勘查數據,為綜合認識和全面把握盆地地質特征提供強有力的支撐。通過對二連盆地全區(qū)鉆孔資料的收集、整理和入庫,為建立區(qū)域性地層對比、地層展布、沉積建造特征及分布等工作提供了最新、最可靠的數據基礎。利用鉆孔數據包括的孔位坐標數據、測斜數據、巖心巖性數據和測井數據等,地質人員可以全面認識盆地鉆孔分布及鉆孔深度,從而制定合理的地層對比方案,并依據數據,規(guī)劃研究尺度和精度等。在鉆孔數據的支撐下,開展的地層對比工作對于區(qū)域性地層分布、構造格局等地質認識和把握更準確、更全面,同時在地層對比過程中可以對區(qū)域地質信息進行綜合研究和分析,深化認識地層發(fā)育與區(qū)域構造運動的耦合關系、抬升剝蝕等區(qū)域不整合信息在地層發(fā)育中的記錄等。
在區(qū)域性地層分布、構造活動記錄等數據綜合分析的基礎上,數據庫的建設同時支撐了對全區(qū)巖相古地理特征的研究與恢復。從單孔垂向巖性巖相記錄入手,在地層對比的基礎上,對區(qū)域性巖相古地理特征剖面進行分析,有助于全面把握和深入理解二連盆地巖相古地理區(qū)域性演化過程,尤其是對目標層,如賽漢組上段沉積相的識別與區(qū)域展布研究,有利于進一步對潛在的含礦砂體進行進行識別和刻畫(圖5)。
圖5 二連盆地賽漢組早期沉積相平面展布圖Fig.5 Distribution map of sedimentary facies of Eearly Saihan formation in Erlian Basin
1)統(tǒng)籌規(guī)劃鈾礦地質領域專題數據庫體系和數據標準規(guī)范建設
經過多年的鈾礦勘查信息化建設,尤其是“十二五”、“十三五”信息化業(yè)務系統(tǒng)建設和一批重大項目的實施,中國鈾業(yè)有限公司及下屬單位已積累了大量的全國范圍鈾礦相關資料及部分海外地勘資料,部分數據和成果建立了專題數據庫和綜合數據庫。通過梳理地、遙、重、磁、電、放射性、鉆井、測井、巖心、水文等各類工作手段成果數據,摸清楚鈾礦勘查數據的基本情況,包括數據來源、數據類型、數據形態(tài)、數據模式、數據總量、數據增量等,開展現有數據庫升級完善及各類專題數據庫有序建設,逐步形成鈾礦地質領域專題數據庫體系,同時開展相應的數據標準規(guī)范體系建設,以標準化引領規(guī)范化,有步驟、分層級的推進兩大體系建設。在此基礎上,穩(wěn)步推進我國北方重點盆地砂巖型鈾礦數據庫建設。
2)建立數據庫更新維護機制,保證數據的現勢性和實用性
建設一個成功的數據庫,需要花費大量的人力、物力、財力和時間,建成后需要有專人對數據庫的數據進行常態(tài)化的更新和維護。隨著地質勘查工作的不斷進展,將會收集、產生各種不同類別的資料、數據和認識等,這些都應在數據庫中進行動態(tài)更新和維護,而且,數據庫建成后,難免有一些數據的錯漏或不足,都需要不斷地改進和完善,因此,建議數據庫堅持實行年度維護制度,確保數據的現勢性和實用性,提高數據庫的質量,以便及時為各項地勘工作的開展提供堅實的數據基礎。建議把數據庫維護工作納入經常性計劃中,保證一定經費和人員組織,落實維護工作的計劃安排。
3)建立數據使用制度,提高數據共享能力
二連基地多元信息數據庫的建立,為課題組各學科科研人員提供了基礎數據支撐,該數據庫依托鈾礦地質云平臺,可進行數據服務發(fā)布,在今后的工作中,建議進一步推動鈾礦地質云平臺的應用,深化數據資源的共享和互聯互通,建立數據使用制度,便于科研生產人員進行檢索、查詢、數據分析、信息提取和成圖等,進一步為鈾礦地質科研生產提供數據支撐,助推鈾礦資源系統(tǒng)全面數字化、信息化和智能化工作模式的發(fā)展。