喻思羽
(長(zhǎng)江大學(xué)地球科學(xué)學(xué)院 湖北 武漢 430100)
地質(zhì)統(tǒng)計(jì)學(xué)提出于20 世紀(jì)50~60 年代,起初用于南非金礦儲(chǔ)層預(yù)測(cè)。地質(zhì)統(tǒng)計(jì)方法論是一種建立在空間自相關(guān)性分析基礎(chǔ)上的空間插值方法體系。使用地質(zhì)統(tǒng)計(jì)學(xué)方法可以得到最優(yōu)無(wú)偏估計(jì)量的插值模型,與傳統(tǒng)的各類樣條函數(shù)插值法和反距離加權(quán)插值法相比,地質(zhì)統(tǒng)計(jì)模型不僅能有效表達(dá)空間變量的分布特點(diǎn),而且可以量化評(píng)估結(jié)果誤差及不確定性,因此地質(zhì)統(tǒng)計(jì)方法廣泛應(yīng)用于地質(zhì)、石油、固體礦產(chǎn)等地下資源勘查領(lǐng)域,而且在環(huán)境保護(hù)、衛(wèi)星遙感、地下水資源、農(nóng)業(yè)、現(xiàn)代商業(yè)等其他領(lǐng)域也取得了豐碩成果。
為了讓學(xué)生更容易理解變差函數(shù)概念,本文深入淺出地從傳統(tǒng)統(tǒng)計(jì)學(xué)過渡到變差函數(shù),著重講解其物理意義及其特點(diǎn),以多個(gè)實(shí)例演示不同空間結(jié)構(gòu)模型的變差函數(shù)形態(tài),讓學(xué)生掌握變差函數(shù)的本質(zhì)。本文首先從傳統(tǒng)變量與區(qū)域化變量的異同點(diǎn)入手,由傳統(tǒng)的雙變量相關(guān)性引入到空間單變量的自相關(guān)性,然后再由空間自相關(guān)性過渡到變差函數(shù)的概念及其物理意義,最后講解理論變差函數(shù)模型的參數(shù)意義和不同空間結(jié)構(gòu)的變差函數(shù)曲線特征,為學(xué)生使用變差函數(shù)分析地質(zhì)特征打下基礎(chǔ)。
地質(zhì)統(tǒng)計(jì)學(xué)的研究對(duì)象稱為區(qū)域化變量,這種變量與傳統(tǒng)統(tǒng)計(jì)變量的不同之處在于,區(qū)域化變量是一種分布在空間區(qū)域中的變量,并且具有一定結(jié)構(gòu)性和隨機(jī)性。區(qū)域化變量在現(xiàn)實(shí)中經(jīng)常遇見,例如氣溫、降雨量、儲(chǔ)層地質(zhì)體的物性參數(shù)等??臻g數(shù)據(jù)采樣具有局限性——某個(gè)位置只能采樣一次,無(wú)法通過對(duì)某個(gè)位置進(jìn)行大量采樣獲取該點(diǎn)的統(tǒng)計(jì)量(均值、方差等)。地質(zhì)統(tǒng)計(jì)學(xué)重點(diǎn)集中于區(qū)域化變量的空間自相關(guān)性。以例子簡(jiǎn)單闡述傳統(tǒng)變量的相關(guān)性以及與區(qū)域化變量的自相關(guān)性的區(qū)別。假如有一個(gè)小賣部,我們記錄N 天的雪糕銷量與當(dāng)天氣溫的數(shù)值,得到了如圖1(p59)的一組數(shù)據(jù),并建立銷量與氣溫兩個(gè)變量的映射關(guān)系,對(duì)數(shù)據(jù)進(jìn)行可視化(圖2,p59),其中圖2[a]是對(duì)銷量與氣溫的歸一化曲線圖,每天統(tǒng)計(jì)的兩個(gè)變量大致具有規(guī)律:當(dāng)一個(gè)變量增加時(shí),另外一個(gè)變量也增加,反之亦然,反映了兩個(gè)變量具有一定的相關(guān)性。為了定量計(jì)算兩個(gè)變量的相關(guān)性,建立如圖2[b]的變量映射散點(diǎn)圖,該圖中每個(gè)點(diǎn)的X 軸代表氣溫變量(歸一化數(shù)據(jù)),Y 軸代表銷量變量(歸一化數(shù)據(jù)),將每個(gè)點(diǎn)投影到45 度對(duì)角線上,可以統(tǒng)計(jì)得到當(dāng)前日期的兩個(gè)變量相關(guān)性值,很明顯當(dāng)點(diǎn)偏離對(duì)角線距離越遠(yuǎn),說明該點(diǎn)將拉低兩個(gè)變量的相關(guān)性,反之將提高相關(guān)性。
圖1 某小賣部的雪糕銷量(元)與當(dāng)天的氣溫(攝氏度)
圖2 氣溫(度)與雪糕銷量(元)的相關(guān)程度
協(xié)方差是衡量?jī)蓚€(gè)變量的相關(guān)性常用指標(biāo),協(xié)方差計(jì)算公式如下:
基于協(xié)方差對(duì)“氣溫與銷量”的關(guān)系分析可知兩個(gè)變量在變化過程中是同方向變化,還是反方向變化,以及同向或反向變化的程度。例如氣溫與銷量的關(guān)系,氣溫升高,銷量也隨之增加,說明這兩個(gè)變量是同向變化的,則協(xié)方差為正,否則兩個(gè)變量的協(xié)方差為負(fù)。
以上是傳統(tǒng)變量的相關(guān)性分析方法,在地質(zhì)統(tǒng)計(jì)學(xué)中,通常研究的對(duì)象稱之為區(qū)域化變量,屬于隨機(jī)場(chǎng)的范疇。為了便于描述,下面以一維隨機(jī)過程為例講解如何計(jì)算區(qū)域化變量的相關(guān)性,進(jìn)而引出變差函數(shù)的概念。如圖3 所示是一個(gè)一維隨機(jī)過程,隨機(jī)變量Z隨著時(shí)間t 隨機(jī)波動(dòng)。為了計(jì)算時(shí)間間隔為△t 的兩個(gè)時(shí)間點(diǎn)的變量Z(t)與Z(t+△t)之間的相關(guān)性,需要從隨機(jī)過程f 中提取若干個(gè)間隔△t 的點(diǎn)對(duì)。如圖3 所示,t1 和t1+△t 屬于一個(gè)點(diǎn)對(duì),t2和t2+△t 屬于一個(gè)點(diǎn)對(duì)。注意這里計(jì)算內(nèi)容稱為單個(gè)變量的自相關(guān)性,即變量Z隨著時(shí)間t 變化的自相關(guān)性,而不是兩個(gè)變量的相關(guān)性,此時(shí)如果把橫軸的時(shí)間改為空間位置或者距離,計(jì)算結(jié)果就變換為空間自相關(guān)性了。如圖4所示,得到間距△t 的點(diǎn)對(duì)映射。此時(shí)將變量Z(t)與Z(t+△t)作為兩個(gè)不同的變量,基于傳統(tǒng)變量的協(xié)方差計(jì)算公式即統(tǒng)計(jì)間距△t 的點(diǎn)對(duì)相關(guān)性值,即變量t 的自相關(guān)性。
圖3 隨機(jī)過程中間距為△x
圖4 某小賣部的雪糕銷量與當(dāng)天的氣溫
傳統(tǒng)地質(zhì)統(tǒng)計(jì)學(xué)是以空間兩點(diǎn)相關(guān)性,以變差函數(shù)為工具完成空間相關(guān)性分析,進(jìn)而進(jìn)行未采樣區(qū)域的預(yù)測(cè)。1965 年法國(guó)統(tǒng)計(jì)學(xué)家Matheron 提出基于距估計(jì)的變差函數(shù),定義為在相距h(稱為滯后距,屬于矢量)的區(qū)域化變量Z(x)與Z(x+h)增量的方差之半,計(jì)算公式定義為
其中x 是采樣點(diǎn)的位置,變差函數(shù)反映了區(qū)域化變量的空間結(jié)構(gòu)性,用于評(píng)價(jià)區(qū)域化變量在某個(gè)方向某個(gè)距離的變化程度。實(shí)驗(yàn)變差函數(shù)是指應(yīng)用觀測(cè)值計(jì)算的變差函數(shù),計(jì)算公式如下
其中是空間兩點(diǎn)的位置矢量,N()為點(diǎn)對(duì)的總數(shù),和代表兩個(gè)點(diǎn),是區(qū)域化變量。
為了在教學(xué)中使學(xué)生易于理解變差函數(shù),以下面實(shí)例深入淺出地解釋變差函數(shù)的物理意義。如圖5 所示,在研究區(qū)域內(nèi)有多個(gè)采樣數(shù)據(jù)點(diǎn)(實(shí)心點(diǎn)表示采樣點(diǎn),空白位置表示未采樣點(diǎn))。點(diǎn)與點(diǎn)之間為規(guī)則網(wǎng)格分布,兩個(gè)點(diǎn)之間的水平或垂直間距為100 米。
圖5 某區(qū)域內(nèi)的區(qū)域化變量分布
現(xiàn)計(jì)算滯后距等于1(東西方向、間距100 米)的空間兩點(diǎn)相關(guān)性。如圖6[a]所示,首先從圖5 中提取滯后距為1 的點(diǎn)對(duì),將所有的點(diǎn)對(duì)按照起點(diǎn)值作為橫軸、終止點(diǎn)值作為縱軸投在圖6[b]的散點(diǎn)圖上。根據(jù)公式2 計(jì)算圖6[b]中全部點(diǎn)到45 度對(duì)角線的距離,統(tǒng)計(jì)得到滯后距等于h1的變量Z 增量的方差,即算出該滯后距的變差函數(shù)值。地質(zhì)統(tǒng)計(jì)學(xué)理論強(qiáng)調(diào)距離相近的觀測(cè)值比距離較遠(yuǎn)的觀測(cè)值更加相似,即方差較?。∕atheron,1963),反之隨著距離增加,區(qū)域化變量的空間自相關(guān)性逐漸減小。通過計(jì)算不同滯后距的變差函數(shù)值,建立變差函數(shù)值與滯后距h 的函數(shù)關(guān)系(圖7),就能算出評(píng)價(jià)空間相關(guān)性的一組特征定量化參數(shù),常用參數(shù)包括變差函數(shù)的塊金值、變程和基臺(tái)值。由圖7 可以發(fā)現(xiàn),隨著滯后距的增加,區(qū)域化變量Z 的增量方差首先快速增加,然后逐漸收斂,表明變差函數(shù)值不會(huì)無(wú)限增加。
圖6 間距h=100 的點(diǎn)對(duì)樣本映射關(guān)系
圖7 實(shí)驗(yàn)變差函數(shù)
變差函數(shù)曲線能準(zhǔn)確表征出區(qū)域化變量的結(jié)構(gòu)性變化規(guī)律,例如地質(zhì)結(jié)構(gòu)漸變、突變、周期性以及變化幅度都能敏感地投射到變差函數(shù)的曲線波動(dòng)特征上。以兩組實(shí)例展示模型結(jié)構(gòu)的實(shí)驗(yàn)變差函數(shù)特征。圖8(p61)中有3個(gè)模型,模型中有兩種相類型,用編碼0 和1 代表,圖8[a1]中以背景相編碼為0,目標(biāo)相編碼為1 的垂直高度為10 個(gè)網(wǎng)格單元,圖8[b1]中以背景相編碼為0,目標(biāo)相編碼為1的垂直高度為30 個(gè)網(wǎng)格單元,圖8[c1]中以背景相編碼為1,目標(biāo)相編碼為0 的垂直高度為30 個(gè)網(wǎng)格單元。圖8[a2]、圖8[b2]和圖8[c2]分別是圖8[a1]、圖8[b1]和圖8[c1]的垂直方向的實(shí)驗(yàn)變差函數(shù),滯后距取值范圍為0~80,同時(shí)進(jìn)行理論變差函數(shù)擬合。觀察模型與對(duì)應(yīng)變差函數(shù)曲線特征可以發(fā)現(xiàn),圖8[a1]的實(shí)驗(yàn)變差函數(shù)在滯后距約為10 網(wǎng)格單元的位置達(dá)到第一個(gè)轉(zhuǎn)折點(diǎn),這與目標(biāo)相的垂向高度吻合。分析原因?yàn)椋河蓪?shí)驗(yàn)變差函數(shù)公式(公式3)可知,該模型的變差函數(shù)值大小取決于垂直方向上相距h 的點(diǎn)對(duì)差是否等于1,如果點(diǎn)對(duì)的差等于1,則能增加變差函數(shù)公式的分子項(xiàng),如果點(diǎn)對(duì)的差為0,不會(huì)增加變差函數(shù)分子項(xiàng)。隨著h 的增加,如果分子項(xiàng)沒有增加,則將降低變差函數(shù)最終結(jié)果。因此實(shí)驗(yàn)變差函數(shù)曲線的幾個(gè)拐點(diǎn)對(duì)應(yīng)著實(shí)驗(yàn)變差函數(shù)分子項(xiàng)出現(xiàn)變化的位置。因此圖8[a2]中h 達(dá)到40 時(shí)縱軸值開始下滑,反映了h 大約40 之后,點(diǎn)對(duì)的差值等于1 的比例開始快速減少。在圖8[b2]中,曲線的第一個(gè)轉(zhuǎn)折點(diǎn)對(duì)應(yīng)的h 值為30,與圖8[b1]的編碼為1 的相高度一致。值得注意的是,變差函數(shù)的大小只與某個(gè)滯后距的點(diǎn)對(duì)數(shù)量(實(shí)驗(yàn)變差函數(shù)的分母項(xiàng))和點(diǎn)對(duì)差的絕對(duì)值(實(shí)驗(yàn)變差函數(shù)的分子項(xiàng))有關(guān)。因此如果點(diǎn)對(duì)數(shù)量相同,點(diǎn)對(duì)差絕對(duì)值之和越大,則變差函數(shù)越大,互換背景相和目標(biāo)相的編碼對(duì)變差函數(shù)值沒有本質(zhì)影響,例如圖8[b1]和圖8[c1]中的兩個(gè)模型,它們的相編碼進(jìn)行互換,對(duì)應(yīng)的實(shí)驗(yàn)變差函數(shù)曲線特征(圖8[b2]與圖8[c2])完全一樣。
圖8 三個(gè)模型與實(shí)驗(yàn)變差函數(shù),其中a2 是a1 的垂直方向變差函數(shù),b2 是b1 的垂直方向變差函數(shù),c2 是c1 的垂直方面變差函數(shù)
本文針對(duì)石油地礦類高校中地質(zhì)統(tǒng)計(jì)學(xué)的關(guān)鍵概念——變差函數(shù)講授過程較為枯燥和公式化的問題,將變差函數(shù)的基本思想和物理意義作為重點(diǎn),通過多個(gè)實(shí)例逐步將變差函數(shù)內(nèi)涵展現(xiàn)給學(xué)生。此外還闡述了變差函數(shù)在地質(zhì)研究中的作用特點(diǎn)。本文重點(diǎn)輔助地質(zhì)統(tǒng)計(jì)學(xué)的入門學(xué)習(xí),對(duì)變差函數(shù)的各種高級(jí)復(fù)雜特點(diǎn)不做探討。