李偉等
【摘要】隨著勘查手段和數(shù)據(jù)獲取技術的不斷提高,結合現(xiàn)代數(shù)學,順序因子分析、結合因子克里金分析的多元應對分析、小波分析、多重分型分析、神經網絡及神經-模糊模型等一批化探數(shù)據(jù)處理新技術應運而生。然而這些新技術還未在生產中得到廣泛的應用,甚至有些方法并不為人所熟悉。對這些許多新興技術原理及應用的綜述表明,這些方法對識別異常和背景,進行成礦潛力評價,確定成礦遠景區(qū)以及建立地球化學概念模型等較之傳統(tǒng)方法均更為有效。而部分方法的數(shù)學計算可通過商業(yè)化軟件(及其插件、組件等)或從網絡獲取開放的源代碼簡單實現(xiàn)。因此,掌握這些新興數(shù)據(jù)處理技術,對異常識別、解釋及礦產潛力評價有著深遠的意義。
【關鍵詞】地球化學 礦產勘查 數(shù)據(jù)處理 新方法
在本世紀及上世紀的找礦實踐中,水系沉積物、土壤、巖石地球化學測量等化探方法發(fā)揮了令礦產勘查界矚目的重要作用,尤其在貴金屬和有色金屬的找礦中成效更加突出[1-5]。當今,隨著勘查地球化學技術的廣泛應用及分析測試方法的改進[6],使得便捷有效地獲取大量高質量數(shù)據(jù)成為可能。然而,隨著大批有效化探數(shù)據(jù)的獲取,其相伴生的數(shù)據(jù)處理及解譯問題亦顯得日益突出。如何根據(jù)已獲得數(shù)據(jù)有效地識別背景和異常,對異常成礦潛力進行評價,并得出控制該區(qū)地球化學特征的概念模型是勘查地球化學數(shù)據(jù)處理肩負的幾大重任。
針對上述問題,結合現(xiàn)代數(shù)學:順序因子分析[7]、結合因子克里金分析的多元應對分析[8]、小波分析[9-10]、多重分型分析[11]、神經網絡[12]及神經-模糊模型[13]等一批化探數(shù)據(jù)處理新技術應運而生。然而由于這些技術大多源自現(xiàn)代數(shù)學的發(fā)展,在生產中尚未得以廣泛應用,有些方法技術甚至并不為人所熟悉。隨著勘查手段和數(shù)據(jù)獲取技術的不斷提高,掌握這些新興的數(shù)據(jù)處理技術,對異常識別、異常解釋及礦產潛力評價等均至關重要。本文系統(tǒng)地總結了這些新技術的原理及應用,并介紹了部分方法數(shù)學計算部分的簡單實現(xiàn)途徑,以期對該領域科研及工作人員有所啟示。
1順序因子分析
盡管因子分析和主成分分析土壤及水系沉積物化探勘查中廣泛應用于識別自然背景[14-15],然而由于這些方法依賴于隱含的假定條件和數(shù)據(jù)的統(tǒng)計分布,使得目前對其結果質量的明確評價及其重現(xiàn)性研究仍非常少[7]。而且,因子分析和主成分分析中除極值對多元變量結果起的作用(重現(xiàn)性問題)外,分析需要提取因子個數(shù)以及在因子模型中需要包含的具體變量也未得到明確解決[15]。
基于主成分分析的順序因子分析(SequentialFactorAnalysis)則考慮到輸入數(shù)據(jù)的不均一性、提取因子數(shù)量以及需要選擇的變量集合,并允許統(tǒng)計判斷或地球化學專業(yè)判斷[7]。此外,該方法分為穩(wěn)健和非穩(wěn)健版本開發(fā),兩者均應用于相同的地球化學數(shù)據(jù)集合,使得二者可以對比[7]。
順序因子分析一般包含以下四個步驟(圖1):確定最佳因子數(shù)(當應用非穩(wěn)健方法時去除明顯的離群值),并形成基于k個測量變量的完整因子模型;去掉n個高度相關的變量,將k變量數(shù)減少至含m個關鍵變量的抽去因子模型;計算被抽去變量的載荷并將關鍵變量再次擴充至含k個變量的擴展因子模型;將擴展因子模型與完整因子模型根據(jù)解釋的方差進行對比。所有的統(tǒng)計計算在http://www.R-project.org可免費獲取的功能強大的統(tǒng)計軟件包R環(huán)境(版本1.9.1)中進行。
VanHelvoort等應用該方法對荷蘭Rhine-Meuse三角洲洪積物化學數(shù)據(jù)分析結果表明,選擇穩(wěn)健型順序因子分析可比選擇非穩(wěn)健型產生更加穩(wěn)定的,可重現(xiàn)的分析結果[7]。并根據(jù)分析所得的五因子模型建立了形成該區(qū)沉積物化學成分的概念模型,分別為:沉積分選、泥炭形成、氧化還原和次生礦物溶解/沉淀。這些過程歸并為同沉積或后沉積過程。
2結合因子克里金分析的多元對應分析
多元對應分析(MultipleCorrespondenceAnalysis)是一種處理分類變量的數(shù)據(jù)分析方法,它能根據(jù)分類變量以定量指標概括地球化學信息。這些指標代表了地球化學變量組合。因而,運用多重對應分析有可能進行多元素研究,并能克服由于采樣及分析誤差而引起的問題。當原始數(shù)據(jù)不能直接獲得地球化學行為的數(shù)值描述(取樣誤差、分析難度、異常值等等)時,多元對應分析尤為有效。
然而該方法不考慮到空間變化性,而由此得到的因子只能視為有意義的變量組合的非線性合成[8]。而如果借助方差-協(xié)方差矩陣先分解成協(xié)區(qū)域化矩陣,然后通過多元統(tǒng)計總結在不同空間尺度起作用的因子則需要計算機計算交叉變量函數(shù)并聯(lián)合模擬,難以付諸實施。
因子克里金分析(FactorialKrigingAnalysis)是用于過濾目的地球化學勘查中的一種地質統(tǒng)計方法,該方法可通過簡單的變量函數(shù)揭示對應于不同變化性尺度的空間成分(樣品尺度現(xiàn)象、局部和區(qū)域事件)。因此,為了識別和過濾與多元對應分析中因子相組合的空間結構及評估可識別空間型式與顯著異常的局部和區(qū)域組分,有必要完成結構分析和因子克里金分析。多元對應分析可由通用商業(yè)軟件SPSS中的多元應對分析插件實現(xiàn)。
對于葡萄牙Marrancos金-銀礦土壤勘查地球化學填圖[8](圖2)表明:多元對應分析生成2個因子(F1和F2),Au、As、Sb、Te和Bi(與Au礦化相關元素)與F1強烈相關,而變量Zn、Pb、Co、Ni、Mn、Fe和Ag及礦化中的微量元素等都與F2有關;而因子克里金分析的運用則將F1和F2分解成其空間組分,F(xiàn)1異常指向方向N45°E的石英角礫巖(區(qū)域礦化構造方向),F(xiàn)2則可解釋為區(qū)域上受尾礦、垃圾堆場和農場對礦化的擾動。研究表明,這種綜合方法能有效的發(fā)現(xiàn)和辨別維拉福德Marrancos的Au和Ag礦床有關的“多元素”異常。
3小波分析
不同空間尺度的區(qū)域面積性勘查地球化學數(shù)據(jù)反映了不同尺度的異常信息,而同一空間尺度的地球化學數(shù)據(jù)同樣是不同規(guī)模地球化學異常的疊加,采樣間距反映了異常所能代表的精細程度。如何發(fā)掘隱蔽的礦化指示信息,對礦產資源預測評價具有非常重要的意義[9]。小波分析是一個時間和頻率的局域變換,能有效地從信號中提取信息,通過伸縮和平移等運算功能對函數(shù)或信號進行多尺度細化分析,可聚焦到信號的任意細節(jié),解決了Fourier變換不能解決的許多困難問題,被譽為“數(shù)學顯微鏡”。采用小波分析對勘查地球化學異常進行多尺度分析,可以得到異常的精細結構,突出異常的局部變化特征,從而更有效地識別與礦有關的異常。小波變換在通用商業(yè)軟件MATLAB工具箱中為wavelet工具,功過該工具可輕松實現(xiàn)離散小波變換,ε-采樣離散小波變換,和(一維或二維)平穩(wěn)小波變換及其之間的相互轉換。
根據(jù)小波變換后數(shù)據(jù)的分布曲線變化異常特征推測該地區(qū)用表層化探方法所不能找到的隱伏礦化區(qū),這點是其他方法很難達到的[10]。對德興Cu元素地球化學數(shù)據(jù)進行多階平穩(wěn)小波分解與重構[9],可見4階分解的逼近A4總體分布比較均勻,沒有1階、2階、3階分解的逼近A1、A2、A3所表現(xiàn)出的明顯的拐點和變化幅度大的高值區(qū)存在,因此A4可以作為德興礦集區(qū)銅地球化學異常的最大尺度背景(圖3a),由多尺度細節(jié)累積頻率—含量曲線圖可知,各尺度的細節(jié)在0值附近均有均勻波動區(qū)間,該波動范圍應作為背景的變化范圍而以拐點作為各尺度的異常下限(圖3b)。小波變換實現(xiàn)了找礦遠景區(qū)圈定時不同尺度異常的綜合分析,將反映控礦信息的大尺度異常與反映礦化蝕變信息有效結合,從而實現(xiàn)更精確的礦床定位預測(圖4)。
4多重分形分析
由于地質過程往往具有多期次和空間相關性等特點,所產生的地質體或者相應的場會呈現(xiàn)空間自相似性或統(tǒng)計自相似性[11]。與礦產資源有關的地質異常的形成往往是非線性的動力學過程結果,所產生的元素在地質體中的分布常常是奇異的,因而地球化學異常滿足分形或多重分形分布。施俊法等分析了區(qū)域地球化學異常的空間特性。通過分析多重分形的參數(shù)(奇異值、多重分形奇異譜)可以了解異常與礦化及構造的關系,根據(jù)自相似性可對地球化學場的異常和背景進行分離。
多重分形分析方法是一種用于研究具有自相似性或統(tǒng)計自相似性分布規(guī)律的有效方法,文戰(zhàn)久等[11]對前人多重分型方法進行總結,包括C-A方法(含ACAF法),C-D方法,S-A方法,W-A方法和MSVD方法等。而將多重分型分析與小波變換相結合,以小波變換分析分型數(shù)據(jù)的多重分形場的小波極大模分析處理地球化學測量數(shù)據(jù),能有效地壓制噪聲,有可能獲取局部的微弱異常信息。
對牟平-乳山Au成礦亞帶采用小波極大模方法分離異常場(圖5)[11]可以看到幾處明顯的Au異常(1、2、3、4),按編號順序由小到大異常規(guī)模增大。圖5B為用小波極大模法求得的該區(qū)的奇異值,由大到小排列,將奇異值分為四個區(qū)間,分別對應于噪聲、背景、區(qū)域異常和局部異常。圖5C和5D分別為根據(jù)圖5B劃分的奇異值的區(qū)間用小波極大模系數(shù)重構的區(qū)域異常和局部異常的分布圖,從分離后的結果(圖5C和5D)來看,只有4號異常在區(qū)域異常的基礎上有局部的成礦富集作用,成礦潛力較大。1號和2號異常較弱,不能形成有規(guī)模的礦體,而3號異常的區(qū)域礦化用較強,但沒有后期的局部富集作用,有可能形成的是小型礦床。后來的工作表明在1號異常處沒有成礦潛力,而在4號異常處找到小型金礦。從與C-A方法的對比來看,用小波變換下的多重分形方法重構異常,可以分離出不同富集期次的異常,便于對異常的成礦潛力進行評價。
5神經網絡法
人工神經網絡(Artificialneuralnetwork,即ANN,簡稱神經網絡)是以模擬人體神經系統(tǒng)的結構和功能為基礎而建立的一種信息處理系統(tǒng)。ANN技術的基本出發(fā)點,就是通過簡單函數(shù)(如Sigmiod函數(shù)、分段線性函數(shù)、域值函數(shù)及概率函數(shù)等)的多次迭代,實現(xiàn)對網絡所表達映射的擬合和逼近。這種特性,使得神經網絡能夠實現(xiàn)一對一或一對多的映射關系。因此,在解決復雜的、非線性問題時,ANN具有獨到的功效。概率神經網絡(PNN)是一種特殊的ANN結構,用來計算兩組或多組成員之間的概率,例如礦化和非礦化地區(qū)之間。ANN的另一個優(yōu)點是它不需要與數(shù)據(jù)統(tǒng)計分布相關的任何信息。它還能提供良好的置信水平并對離群點相對不敏感。它理想要求沒有一個數(shù)據(jù)點同時符合一種以上的類別,并且訓練數(shù)據(jù)集合包含所有可能的類別。當這些條件都滿足時,一個數(shù)據(jù)點屬于某個類別的無偏估計就能通過PNN來計算。神經網絡計算過程可由通用商業(yè)軟件MATLAB工具箱中神經網絡工具箱實現(xiàn)。
Leite等首次將PNN應用于巴西Carajas礦產省SerraLeste地區(qū)鉑族元素礦產潛力制圖[12],并分別以分析信號振幅,K元素百分含量,Th含量以及巖性模糊隸屬和磁軸緩沖距離為證據(jù)變量,以1代表PGE礦床,0代表非PGE礦床進行PNN訓練。結果表明:Au-PGE礦化的高有利度區(qū)域只占研究區(qū)的0.57%,而中有利度和低有利度區(qū)的面積分別為8.38%和91.05%(圖6);而Cr-PGE礦化低有利度區(qū)占研究區(qū)的99.83%。由PNN得出的礦產潛力模型表明該區(qū)其余PGE礦種極富成礦潛力,這與地質事實相符。模型還縮小了PGE礦種勘查范圍,這有助于有針對性的進行地表詳查(如物探、化探詳查或加密)。類似的神經網絡還可用于研究該區(qū)其它,如金等重要的已知礦化區(qū)。
6神經-模糊模型
將神經網絡知識完全映射到模糊邏輯中是可能的。神經-模糊技術(Neuro-fuzzy)[13]是一門神經網絡與模糊邏輯的交叉科學,它不僅吸取兩項技術的長處,而且把未經詳細敏感度描述的神經網絡與模糊邏輯相結合還將有助于綜合敏感度分析。神經-模糊模型是一種融合神經網絡和模糊邏輯長處,讓二者相互補充的方法。神經-模糊技術采用啟發(fā)式學習策略,用神經網絡領域的理論支持模糊系統(tǒng)的發(fā)展。
這兩項技術的結合還可以克服兩者的缺點。神經-模糊技術可以從一個足夠大的數(shù)據(jù)集中學習一種系統(tǒng)行為,并自動生成模糊規(guī)則和模糊集以達到預設精度水平。由于其可以通則化,因而能克服模糊邏輯方法的主要缺點——無自學能力,無法達到預設精度且缺乏概括能力。
Ziaii等[13]在采礦地球化學中,將模糊C均值(FCM)BP神經網絡(BP-ANN)算法用于處理前人用傳統(tǒng)方法評價過的伊朗西北部一斑巖型銅礦的原生和次生數(shù)據(jù)。運用該方法,Sungun-3地區(qū)識別出盲礦(圖7),Astama地區(qū)南部發(fā)現(xiàn)了分散礦化異常。該研究表明應用多變量地球化學數(shù)據(jù),神經-模糊技術比傳統(tǒng)方法識別盲礦更為有效。即便在背景值未知且未實施鉆探的情況下,模糊C均值BP神經網絡算法依然可用于多元巖石地球化學異常識別和分離虛假異常和盲礦異常。
圖中點為樣點位置(100×20m);等值線為(Pb.Zn)/(Cu.Mo);虛線橢圓表示BM-ANN識別出的盲礦異常區(qū)
7結語
綜觀近一二十年來勘查地球化學中數(shù)據(jù)處理技術的發(fā)展,盡管順序因子分析、結合因子克里金分析的多元應對分析、小波分析、多重分型分析、神經網絡及神經-模糊模型等新興技術還未在生產中得到廣泛的應用,甚至有些方法并不為人所熟悉;然而,不同地區(qū)開展的實際研究卻顯示,這些源自統(tǒng)計、數(shù)值分析、信號處理、分型以及模糊理論的數(shù)據(jù)處理方法對有效的識別異常和背景,合理的進行成礦潛力評價,準確的確定成礦遠景區(qū)以及提供可信的概念模型等較之傳統(tǒng)方法均更為有效。而部分方法的數(shù)學計算可通過商業(yè)化軟件(及其插件、組件等)或從網絡獲取開放的源代碼簡單實現(xiàn)。因此,隨著勘查手段和數(shù)據(jù)獲取技術的不斷提高,掌握這些新興數(shù)據(jù)處理技術,對異常識別、解釋及礦產潛力評價有著深遠的意義。
參考文獻:
[1]伍宗華.隱伏礦床的地球化學勘查[M].北京:地質出版社,2000.
[2]謝學錦.勘查地球化學:發(fā)展史·現(xiàn)狀·展望[J].地質與勘探,2002,38(6):1-9.
[3]謝學錦.礦產勘查的新戰(zhàn)略[J].物探與化探,1997,21(6):402-410.
[4]王學求.礦產勘查地球化學:過去的成就與未來的挑戰(zhàn)[J].地學前緣,2003,10(1):239-245.
[5]徐錫華.金屬礦產地球化學勘查方法的現(xiàn)狀與動向[J].地質找礦論叢,2000,15(1):17-23.
[6]唐金榮,崔熙琳,施俊法.非傳統(tǒng)化探方法研究的新進展[J].地質通報,2009,28(2~3):232-244.
[7]vanHelvoortP,F(xiàn)ilzmoserP,vanGaansPFM.SequentialFactorAnalysisasanewapproachtomultivariateanalysisofheterogeneousgeochemicaldatasets:Anapplicationtoabulkchemicalcharacterizationoffluvialdeposits(Rhine-Meusedelta,TheNehterlands)[J].AppliedGeochemsitry,2005,20:2233-2251.
[8]ReisAP,SousaAJ,daSilvaEF,PatinhaC,F(xiàn)onsecaEC.Combiningmultiplecorrespondenceanalysiswithfactorialkriginganalysisforgeochemicalmappingofthegold-silverdepositatMarrancos(Portugal)[J].AppliedGeochemistry,2004,19:623-631.
[9]曹殿華,王安建,王高尚,李瑞萍,李以科.勘查地球化學異常多尺度分析方法——以贛東北德興礦集區(qū)為例[J].現(xiàn)代地質,2008,22(6):1028-1033.
[10]常興國,申維.小波分析的原理及其在電磁感應儀EM38數(shù)據(jù)分析中的應用[J].地質通報,2009,28(6):812-815.
[11]文戰(zhàn)久,劉洪臣,高星.地球物理和地球化學異常的多重分形分析與分解[J].地球物理學進展,2007,22(3):972-978.
[12]LeiteEP,deSouzaFilhoCR.ProbabilisticneuralnetworksappliedtomineralpotentialmappingforplatinumgroupelementsintheSerraLesteregion,CarajásMineralProvince,Brazil[J].Computers&Geosciences;,2009,35:675-687.
[13]ZiaiiM,PouyanAA,ZiaeiM.Neuro-fuzzymodelinginmininggeochemistry:Identificationofgeochemicalanomalies[J].JournalofGeochemicalExploration,2009,100:25-36.
[14]DeVivoB,BoniM,MarcelloA,DiBonitoM,RussoA.1997.BaselinegeochemicalmappingofSardinia(Italy)[J].JournalofGeochemicalExploration,1997,60:77-90.
[15]ReimannC,F(xiàn)ilzmoserP,GarrettRG.Factoranalysisappliedtoregionalgeochemicaldata:problemsandpossibilities[J].AppliedGeochemistry,2002,17,185-206.