鐘亞軍 張宏濤 胡高賢 董 巖
(1. 石油大學(xué)(北京) 北京)(2. 陜西省煤層氣開發(fā)利用有限公司 陜西 西安)(3. 石油集團(tuán)測(cè)井有限公司油氣評(píng)價(jià)中心 陜西 西安)
巖性識(shí)別是儲(chǔ)層測(cè)井評(píng)價(jià)的首要任務(wù)。常規(guī)油田生產(chǎn)往往采用交會(huì)圖法識(shí)別礦物成分,最常用的就是中子—密度交會(huì)圖法識(shí)別巖性。交會(huì)圖法一般適用于巖石骨架成分不超過2 ~3 種,復(fù)雜巖性碳酸鹽巖儲(chǔ)層,其巖石骨架的主要礦物成分是方解石和白云石,通常還含有一些粘土礦物、有機(jī)質(zhì)、石膏、鹽巖、黃鐵礦、硅質(zhì)等,它們雖然含量不多,但對(duì)儲(chǔ)層的影響及對(duì)測(cè)井信息的貢獻(xiàn)特別大,因此依靠該方法無法細(xì)致的劃分儲(chǔ)層巖性。Matlab 具有其他編程語言例如FORTRAN、C 語言無法比擬的強(qiáng)大圖形功能,本文主要引用Matlab工具箱中的聚類分析函數(shù)實(shí)現(xiàn)巖性劃分識(shí)別,即利用Matlab 聚類函數(shù)進(jìn)行測(cè)井相析,通過測(cè)井相與巖相之間轉(zhuǎn)化,得到單井系統(tǒng)聚類巖性。對(duì)研究區(qū)幾口取心井進(jìn)行計(jì)算分析,然后對(duì)比取心巖性。對(duì)比結(jié)果有較高的識(shí)別符合率,可以在該地區(qū)推廣使用。
聚類分析(cluster analysis)是一組將研究對(duì)象分為相對(duì)同質(zhì)的群組(clusters)的統(tǒng)計(jì)分析技術(shù),根據(jù)“物以類聚”的道理,對(duì)樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法,它們討論的對(duì)象是大量的樣品,要求能合理地按各自的特性來進(jìn)行合理的分類,沒有任何模式可供參考或依循,即在沒有先驗(yàn)知識(shí)的情況下進(jìn)行的。聚類是將數(shù)據(jù)分類到不同的類或者簇這樣的一個(gè)過程,所以同一個(gè)簇中的對(duì)象有很大的相似性,而不同簇間的對(duì)象有很大的相異性。聚類分析的目標(biāo)就是在相似的基礎(chǔ)上收集數(shù)據(jù)來分類[1]。
本文主要運(yùn)用系統(tǒng)聚類方法,簡(jiǎn)單地說,是指聚類過程按照一定層次進(jìn)行。它是目前使用最多的一種聚類方法,其基本思想是:首先,將要分類的n 個(gè)變量各自看作一類,然后分別計(jì)算兩個(gè)個(gè)體之間的對(duì)應(yīng)程度或關(guān)系密切程度[2]。可以用兩種方式來測(cè)量:1)采用描述個(gè)體對(duì)(變量對(duì))之間的接近程度的指標(biāo),例如距離,距離越小的個(gè)體(變量)越具有相似性。2)采用表示相似程度的指標(biāo),例如相關(guān)系數(shù),相關(guān)系數(shù)越大的個(gè)體(變量)越具有相似性[3]。在計(jì)算出個(gè)體之間的距離之后,將關(guān)系最密切的兩個(gè)個(gè)體歸為—類,其余不變,即得到n-1 個(gè)類,如此重復(fù)進(jìn)行下去,每次歸類都減少1 類,直至最后n 個(gè)變量都?xì)w為1 類,如圖1 所示。系統(tǒng)聚類能夠得到多個(gè)分類解,可以根據(jù)實(shí)際情況進(jìn)行分類。系統(tǒng)聚類的顯著優(yōu)點(diǎn)就是可以在巖心資料較少情況下,根據(jù)測(cè)井曲線系統(tǒng)聚類,結(jié)合地區(qū)經(jīng)驗(yàn),進(jìn)行巖性分類,不同于判別分析需要大量巖心資料樣本。
圖1 聚類分析原理圖
Matlab 統(tǒng)計(jì)工具箱聚類分析函數(shù)實(shí)現(xiàn)測(cè)井相分析主要有以下步驟:
1)找到數(shù)據(jù)集合中變量?jī)蓛芍g的相似性和非相似性,用pdist 函數(shù)計(jì)算變量之間的距離;
2)用linkage 函數(shù)定義變量之間的連接。將對(duì)象進(jìn)行分組,生成二進(jìn)的具有層次結(jié)構(gòu)的聚類樹;用linkage 函數(shù)將很接近的兩兩對(duì)象聯(lián)系一起;對(duì)象被兩兩合并成為二進(jìn)類,同時(shí)新生成的類合并更大的類,直到聚類樹生成;
3)用cophenetic 函數(shù)評(píng)價(jià)聚類信息,利用pdist 函數(shù)生成的Y 和linkage 函數(shù)生成的Z 計(jì)算cophenet 相關(guān)系數(shù);
4)利用cluster 函數(shù),根據(jù)linkage 函數(shù)的輸出Z 創(chuàng)建分類。
當(dāng)分類變量的測(cè)量尺度不一致時(shí),需要事先做標(biāo)準(zhǔn)化處理。
數(shù)據(jù)標(biāo)準(zhǔn)化處理包括選擇數(shù)量,類型和特征的標(biāo)度,它依靠特征選擇和特征抽取,特征選擇選擇重要的特征,特征抽取把輸入的特征轉(zhuǎn)化為一個(gè)新的顯著特征,它們經(jīng)常被用來獲取一個(gè)合適的特征集來為避免“維數(shù)災(zāi)”進(jìn)行聚類,數(shù)據(jù)預(yù)處理還包括將孤立點(diǎn)移出數(shù)據(jù),孤立點(diǎn)是不依附于一般數(shù)據(jù)行為或模型的數(shù)據(jù),因此孤立點(diǎn)經(jīng)常會(huì)導(dǎo)致有偏差的聚類結(jié)果,因此為了得到正確的聚類,我們必須將它們剔除。
在利用測(cè)井資料作聚類分析時(shí),我們選取六條與巖性相關(guān)度較高的曲線作變量,他們分別是GR、AC、DEN、CNL、PE、RLLD。測(cè)井?dāng)?shù)據(jù)之間的量綱是不一致的,灰?guī)r的電阻率可達(dá)103數(shù)量級(jí),而中子、密度一般只有個(gè)位數(shù)量級(jí),為了防止出現(xiàn)中子、密度曲線被“吃掉”的情況,因此,在作聚類分析之前先將測(cè)井曲線進(jìn)行歸一化處理。
具體代碼如下:
根據(jù)聚類樹圖的分布特征,結(jié)合地質(zhì)取心資料,將本區(qū)巖性主要分為4 大類:灰?guī)r,白云巖,泥質(zhì)白云巖,膏質(zhì)白云巖。所以將測(cè)井相分為4 大類(圖2)。圖中可以看出4 類測(cè)井相在交會(huì)圖上較好區(qū)分。
圖2 Matlab 程序生成聚類樹譜
利用聚類分析程序,對(duì)鄂爾多斯地區(qū)well001 井奧陶系測(cè)井?dāng)?shù)據(jù)進(jìn)行處理,得到該井奧陶系馬家溝組聚類分析巖性,然后與取心巖性相對(duì)比,取得較好的符合率,尤其是膏質(zhì)白云巖層段符合率很高,說明該方法在識(shí)別復(fù)雜巖性上是有效的(圖3,圖4)。
圖3 matlab 聚類分析結(jié)果在巖性交會(huì)圖上的分布
圖4 鄂爾多斯地區(qū)well001 井奧陶系取心巖性與聚類分析巖性對(duì)比圖
鄂爾多斯盆地奧陶系馬家溝組地層屬于海相沉積地層,巖性以灰?guī)r、白云巖為主,白云巖段儲(chǔ)層較多發(fā)育,取心資料較多。該井在馬家溝組共有3 處取心,1#取心13.35 m,2#取心17.22 m,3#取心30.64 m,將取心巖性觀察與測(cè)井聚類分析識(shí)別巖性對(duì)比,符合率達(dá)96.3%。
在1#取心段,可以看出聚類分析識(shí)別的巖性中,很有效的泥質(zhì)白云巖段、灰?guī)r段從白云巖段中分辨出來;在2#取心段中,深度為2 313.24 m ~2 315.45 m 的白云質(zhì)灰?guī)r識(shí)別模糊外,其他層段全部符合取心觀察巖性;在3#取心段聚類分析識(shí)別巖性準(zhǔn)確的識(shí)別除了含膏質(zhì)在內(nèi)的白云巖層段。
1)利用Maltab 函數(shù)編寫程序可以節(jié)省大量時(shí)間,提升工作效率,而且,利用它強(qiáng)大的圖像功能可以實(shí)現(xiàn)測(cè)井解釋的可視化,提高數(shù)據(jù)分析處理效果。
2)可以利用Matlab 統(tǒng)計(jì)分析工具箱實(shí)現(xiàn)了測(cè)井相聚類分析,完成了單井巖性識(shí)別,通過對(duì)比取巖心井巖性驗(yàn)證,證實(shí)該方法是巖性識(shí)別方便有效的手段。
[1]孫宇峰. 基于Matlab 的模糊聚類分析及應(yīng)用[J]. 韶關(guān)學(xué)院學(xué)報(bào)(自然科學(xué)),2006,27(9)
[2]尋知鋒,余繼峰. 聚類和判別分析在測(cè)井巖性識(shí)別中的應(yīng)用[J]. Journal of Shandong University of Science and Technology(Natural Science),2008,27(5)
[3]張振城,孫建孟,馬建海,等. 利用測(cè)井資料自動(dòng)識(shí)別藻灰?guī)r[J]. 吉林大學(xué)學(xué)報(bào)(地球科學(xué)版),2005,35(3)
[4]杜 藏,駱 源. 科學(xué)計(jì)算語言matlab 簡(jiǎn)明教程[M]. 天津:南開大學(xué)出版社,1998
[5]陳桂明. Matlab 數(shù)據(jù)統(tǒng)計(jì)(6. x)[M]. 北京:科學(xué)出版社,2002
[6]劉 飛,陳岳龍,蔣麗婷.MATLAB 在碎屑沉積巖礦物含量計(jì)算中的應(yīng)用[J].沉積學(xué)報(bào),2006,24(2)
[7]朱劍兵. Matlab 軟件在測(cè)井資料處理中的應(yīng)用[J]. 油氣地球物理,2006,4(1)