張 翔,王 智,羅菊蘭,秦民君,王忠于
(1.油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(長江大學(xué)),湖北荊州434023; 2.中國石油集團(tuán)測(cè)井有限公司,陜西西安710201)
基于逐步判別與支持向量機(jī)方法的沉積微相定量識(shí)別
張 翔1,王 智1,羅菊蘭2,秦民君2,王忠于2
(1.油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室(長江大學(xué)),湖北荊州434023; 2.中國石油集團(tuán)測(cè)井有限公司,陜西西安710201)
利用測(cè)井資料快速準(zhǔn)確地確定沉積微相是油田勘探開發(fā)中急需研究解決的問題。沉積微相特征在測(cè)井曲線上有所反映,將常規(guī)測(cè)井資料及其解釋成果中的地質(zhì)資料同巖心資料相結(jié)合,通過逐步判別法提取反映沉積微相變化的特征,利用支持向量機(jī)(SVM)建立沉積微相的判別模型,根據(jù)該模型對(duì)未取心井段的沉積微相進(jìn)行自動(dòng)識(shí)別。實(shí)際資料處理表明該方法在小樣本情況下,性能優(yōu)于貝葉斯判別方法。
測(cè)井解釋;沉積微相;支持向量機(jī);特征提取;逐步判別;貝葉斯判別法
目前沉積相劃分主要以人工識(shí)別為主,但人工識(shí)別存在微相識(shí)別、數(shù)據(jù)統(tǒng)計(jì)等工作量極大、重復(fù)操作性差、工作效率低等缺點(diǎn)。由于每口井都有豐富的測(cè)井資料,而且測(cè)井資料中包含豐富的地層沉積學(xué)信息。因此,將測(cè)井同地質(zhì)等學(xué)科相結(jié)合,應(yīng)用現(xiàn)代數(shù)學(xué)和計(jì)算機(jī)技術(shù)分析、定量識(shí)別沉積微相,成為當(dāng)前測(cè)井資料解釋及地質(zhì)應(yīng)用的新的領(lǐng)域,極大地提高了油田勘探與開發(fā)的效率。
定量識(shí)別沉積微相主要有3種方法。①神經(jīng)網(wǎng)絡(luò)方法。該方法通過網(wǎng)絡(luò)自身地調(diào)節(jié)對(duì)輸入樣本進(jìn)行聚類[1-2]。②貝葉斯判別方法。該方法的判別函數(shù)受所選取樣本及數(shù)量的影響,并且需要知道每種沉積相來自總體的先驗(yàn)概率,然而,這個(gè)概率是無法確知的,因此判別函數(shù)的適應(yīng)性受到一定影響[3-5]。③模糊 K均值方法。該方法是一種無監(jiān)督的模式識(shí)別方法,它在計(jì)算各類樣本的聚類中心時(shí),充分考慮了全體樣本對(duì)各類母體的隸屬程度[6]。前2種方法是一種有監(jiān)督的模式識(shí)別方法,成功應(yīng)用的前提是需要大量訓(xùn)練樣本。
支持向量機(jī)是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來的一種新的模式識(shí)別方法。相比較前面介紹的模式識(shí)別方法,在解決小樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出許多特有的優(yōu)勢(shì)。目前的沉積相定量識(shí)別方法中未考慮特征參數(shù)的篩選,而各種特征參數(shù)往往具有相關(guān)性,會(huì)影響到沉積微相的識(shí)別精度[7]。本文采用逐步判別法對(duì)特征參數(shù)進(jìn)行選擇,通過支持向量機(jī)方法建立測(cè)井-沉積微相判別模型,應(yīng)用實(shí)例表明該方法提高了沉積微相的識(shí)別精度。
1.1 測(cè)井地質(zhì)特征分析
通過分析巖性、砂體幾何形態(tài)、旋回性、巖石粒度、分選性等特征及砂體單層厚度、縱向上的組合形式等方面的地質(zhì)特征能夠?qū)Τ练e環(huán)境進(jìn)行研究,以及對(duì)單井沉積亞相及微相進(jìn)行劃分。各種測(cè)井曲線的幅度、形態(tài)、鋸齒化程度等同樣地反映了沉積環(huán)境的變化。為了利用測(cè)井曲線定量識(shí)別沉積微相特征,需要從測(cè)井曲線中提取反映沉積微相的特征[8]。
測(cè)井曲線幅度大小可以反映沉積物的粒度、分選性等沉積特征。根據(jù)幅度的變化,可以了解沉積環(huán)境能量的變化情況。測(cè)井曲線的平均中位數(shù)能夠較穩(wěn)定地反映井段中平均粒度的大小[9]。測(cè)井曲線基本形態(tài)可分為箱形、鐘形、漏斗形等,在垂向上能反映沉積物的粒序變化,代表了沉積過程中的水流能量及物源供應(yīng)變化情況,是判斷沉積相的重要標(biāo)志。這里采用相對(duì)重心法以及平均斜率來判別曲線形態(tài)。曲線光滑程度是次一級(jí)的曲線形態(tài)特征,它反映了水動(dòng)力環(huán)境對(duì)沉積物改造持續(xù)時(shí)間的長短。曲線越光滑,表示沉積時(shí)的水動(dòng)力作用強(qiáng),持續(xù)時(shí)間長,砂巖分選性好;曲線為微鋸齒狀的,則說明沉積物改造不充分;曲線呈鋸齒狀,則是間歇性沉積的反映,曲線光滑程度可用方差來描述。泥質(zhì)含量反映了地層沉積環(huán)境的巖性,巖性能夠反映沉積能量的大小及距離物源的遠(yuǎn)近,厚度可以是單一曲線形態(tài)的垂向幅度,也可以是某層巖性的厚度。
1.2 特征選擇
由于提取的各特征參數(shù)之間往往具有相關(guān)性,所反映的沉積微相信息具有一定的冗余性。同時(shí)每一個(gè)特征在判別過程中所起的作用一般來說不相同,有的作用較大,有的作用較小。如果將判別能力較小的特征保留在判別式中,不僅會(huì)增加計(jì)算量,還會(huì)產(chǎn)生干擾,影響判別結(jié)果的精度。逐步判別法利用假設(shè)檢驗(yàn)方法,在所選的特征中找出顯著性特征,剔除不顯著性特征[10]。通常利用 Wilks的Λ統(tǒng)計(jì)量來檢驗(yàn)多個(gè)總體的判別效果。
本文采用逐步判別法篩選特征參數(shù),基本步驟如下。
(1)在所有選取的變量中選取具有最小Λ統(tǒng)計(jì)量值的1個(gè),假設(shè)變量 Xi對(duì)應(yīng)的Λ值為最小,則首先選入變量 X1;
(2)尋求滿足Λ1r=Λ1*Λr,(r=2,3,…p)中使得Λ1r達(dá)到最小的那個(gè)變量,假設(shè)有變量 X2使得滿足上述關(guān)系,則選入變量 X2;這樣,依次在第1步、第2步至第l步中選出主要變量X1,X2,…,Xl;
(3)為保證每步選入的變量是重要的,還應(yīng)對(duì)該步所選入的變量的判別能力做顯著性檢驗(yàn),為此需要計(jì)算 F統(tǒng)計(jì)量F0,給定顯著性水平α(可取α= 0.15),若 P=P{F≥F0}<α,則認(rèn)為變量是限制變量,可以引進(jìn),否則不予引進(jìn);
(4)還需要對(duì)選入的變量考慮是否剔除,較早被選入的變量可能由于新變量的選入而失去重要性??梢圆捎?F統(tǒng)計(jì)量,從已選的變量中找出具有最小 F值的變量進(jìn)行判別,計(jì)算 F0統(tǒng)計(jì)量對(duì)應(yīng)的P值:P=P{F≥F0},若 P>α,則認(rèn)為該變量判別能力不顯著,予以剔除。
在實(shí)際計(jì)算中,開始幾步一般都引入變量,以后有可能剔除變量,在既不能剔除,又無法引入新變量的情況下,逐步判別結(jié)束。
每個(gè)微相樣本具有1組特征向量,同一種微相類型的樣本在高維特征空間中聚集在一起,通過樣本集的訓(xùn)練,在高維特征空間中尋找各微相之間的最優(yōu)分類面。確定未知樣本的微相類型,就是依據(jù)最優(yōu)分類面確定樣本的微相類型,即樣本在高維特征空間的位置。該方法輸入的是各樣本的特征向量,輸出為各樣本預(yù)測(cè)的微相類型。
2.1 建立樣本數(shù)據(jù)集
選取多口關(guān)鍵取心井段,根據(jù)其地質(zhì)沉積背景、巖性組合、相標(biāo)志、電性特征等,用傳統(tǒng)的地質(zhì)分析方法進(jìn)行微相精細(xì)劃分,建立沉積微相樣本集。
將已知的樣本井段特征構(gòu)成輸入向量 X=(x1, x2,…,xi,…,xn),其中 xi為每個(gè)樣本點(diǎn)進(jìn)行篩選后的特征值。為了避免一些特征值范圍過大而另一些特征值范圍過小,需要對(duì)特征參數(shù)進(jìn)行歸一化處理,將所有特征參數(shù)歸一到0與1之間。
2.2 SVM學(xué)習(xí)階段
通過SVM學(xué)習(xí),得到最優(yōu)的核函數(shù)及其相應(yīng)參數(shù)。目前主要的核函數(shù)為:
線性核函數(shù)
多項(xiàng)式核函數(shù)
高斯核函數(shù)
在分類問題的概率分布未知的情況下,采取高斯核函數(shù)可以取得較好的推廣效果。因此,本文在采用支持向量機(jī)方法進(jìn)行沉積微相進(jìn)行識(shí)別時(shí),選擇高斯函數(shù)作為核函數(shù),高斯核函數(shù)參數(shù)通過交叉驗(yàn)證法確定。
2.3 SVM預(yù)測(cè)階段
通過建立樣本集、特征歸一化、核函數(shù)的選擇,利用訓(xùn)練樣本集對(duì)支持向量機(jī)進(jìn)行訓(xùn)練,得到基于支持向量機(jī)方法的沉積微相識(shí)別的判別函數(shù)
其中,xi、x分別為支持向量樣本與預(yù)測(cè)樣本的特征向量(測(cè)井特征值);yi、y分別為支持向量樣本與預(yù)測(cè)樣本的輸出(沉積微相類型);K(xi,x)為核函數(shù)。最后利用該判別函數(shù)對(duì)未取心井段進(jìn)行沉積微相的識(shí)別。
3.1 訓(xùn)練樣本的選擇
對(duì)某地區(qū)選取9口取心井段共159個(gè)層的沉積微相作為樣本,其中,水下分流河道30個(gè)、河口壩12個(gè)、前緣席狀砂41個(gè)、水下分流間灣76個(gè)。
3.2 特征參數(shù)的選擇
根據(jù)上述的測(cè)井地質(zhì)特征分析,提取聲波、深側(cè)向、密度、中子、自然伽馬、自然電位等測(cè)井曲線的平均幅度,自然伽馬測(cè)井曲線的平均中位數(shù)、平均斜率、相對(duì)重心、方差以及泥質(zhì)含量的平均值與小層的厚度等12個(gè)特征參數(shù),利用逐步判別法對(duì)12個(gè)特征進(jìn)行篩選。
逐步判別法選入變量的過程是依次在所有選取的變量中選取具有最小Λ統(tǒng)計(jì)量值的1個(gè),并對(duì)選入的變量做顯著性檢驗(yàn),給定顯著性水平α,確定 F0值,若計(jì)算的 F值大于給定的F0值,則該變量被認(rèn)為對(duì)判別分析是有意義的。本文確定的 F0值為3;直到最后一步計(jì)算的 F值都小于 F0值,將不再選入變量。通過逐步判別法依次被選入的特征參數(shù)是自然伽馬中位數(shù)、自然伽馬相對(duì)重心、小層厚度、泥質(zhì)含量平均值、自然伽馬方差、深側(cè)向平均幅度、自然伽馬平均斜率、自然伽馬平均幅度8個(gè)特征參數(shù),并將這8個(gè)特征作為本文沉積微相定量識(shí)別特征。
3.3 核函數(shù)參數(shù)的確定
該研究區(qū)位于三角洲前緣部位,沉積微相主要發(fā)育水下分流河道、分流間灣、河口壩和前緣席狀砂等4個(gè)微相。利用9口井沉積微相的訓(xùn)練樣本以及8個(gè)特征參數(shù),采用交叉驗(yàn)證,得到研究區(qū)對(duì)沉積微相進(jìn)行識(shí)別的最佳高斯核函數(shù)參數(shù)r。
第1組預(yù)測(cè)池53井與池56井,其余7口井的沉積微相作為訓(xùn)練集;
第2組預(yù)測(cè)池56井與黃2井,其余7口井的沉積微相作為訓(xùn)練集;
第3組預(yù)測(cè)羅21井與黃115井,其余7口井的沉積微相作為訓(xùn)練集。
得到不同參數(shù)的沉積微相識(shí)別的正確率結(jié)果見表1。從表1可以看出,當(dāng)高斯核函數(shù)的參數(shù) r為0.001時(shí),3組交叉驗(yàn)證試驗(yàn)得到的正確率都是最高的,其平均在91%左右。因此,對(duì)該區(qū)沉積微相進(jìn)行識(shí)別時(shí),最佳高斯核函數(shù)參數(shù)r為0.001。
3.4 對(duì)比試驗(yàn)
為了評(píng)價(jià)逐步判別方法提取特征的有效性,在交叉驗(yàn)證中,使用全部12個(gè)特征參數(shù)進(jìn)行了對(duì)比試驗(yàn),沉積微相識(shí)別的正確率見表2。
從表1與表2對(duì)比可以看出,當(dāng)高斯核函數(shù)的參數(shù)r為0.001時(shí),采用全部特征參數(shù)的沉積微相識(shí)別的平均正確率為86%左右,而采用通過逐步判別方法進(jìn)行特征選擇后的8個(gè)特征參數(shù),沉積微相識(shí)別的平均正確率為91%左右。因此,經(jīng)過逐步判別特征選擇后,提高了沉積微相的識(shí)別率,可見,在進(jìn)行定量識(shí)別過程中,通過逐步判別對(duì)特征參數(shù)進(jìn)行選擇是有效的。
表1 經(jīng)過特征選擇的特征參數(shù)的沉積微相識(shí)別的正確率(%)
表2 全部特征參數(shù)的沉積微相識(shí)別的正確率(%)
為了評(píng)價(jià)支持向量機(jī)方法進(jìn)行沉積微相識(shí)別的有效性,進(jìn)行了基于貝葉斯方法進(jìn)行沉積微相識(shí)別的對(duì)比試驗(yàn)。利用貝葉斯判別準(zhǔn)則對(duì)該區(qū)的沉積微相建立判別模型,參與計(jì)算的參數(shù)主要有 x1(深測(cè)向曲線的平均幅值特征)、x2(泥質(zhì)含量的平均值)、x3(自然伽馬的平均幅值)、x4(平均中位數(shù))、x5(平均斜率)、x6(相對(duì)重心)、x7(方差)以及 x8(小層厚度),得到如下判別模型。
水下分流河道
分流間灣
河口壩
前緣席狀砂
對(duì)所有樣本進(jìn)行交叉驗(yàn)證,沉積微相識(shí)別的正確率為83.4%??梢娭С窒蛄繖C(jī)的分類方法的正確識(shí)別率高于傳統(tǒng)的貝葉斯判別方法。
3.5 SVM的預(yù)測(cè)
利用支持向量機(jī)訓(xùn)練階段得到的判別模型,對(duì)研究區(qū)未取心的井進(jìn)行了沉積微相的識(shí)別,并與傳統(tǒng)的貝葉斯判別方法、專家劃分沉積微相的結(jié)果作了對(duì)比。圖1為采用該方法對(duì)池61井進(jìn)行了沉積微相識(shí)別的結(jié)果。表3為該方法與貝葉斯方法識(shí)別的沉積微相以及專家劃分沉積微相的對(duì)比結(jié)果。表3中規(guī)定判別函數(shù)輸出與沉積微相類型對(duì)應(yīng)關(guān)系分別為:1水下分流河道;2分流間灣;3河口壩;4前緣席狀砂。
表3 池61井長8井段沉積微相識(shí)別結(jié)果統(tǒng)計(jì)表
圖1 池61井沉積微相圖
以專家劃分的沉積微相為標(biāo)準(zhǔn),支持向量機(jī)方法識(shí)別的沉積微相與專家劃分的沉積微相的符合率為93%,貝葉斯判別方法識(shí)別沉積微相與專家劃分的沉積微相的符合率為81%。可見,支持向量機(jī)方法比貝葉斯判別方法識(shí)別率高,利用支持向量機(jī)方法對(duì)未取心井段沉積微相進(jìn)行識(shí)別是可行的。
通過對(duì)實(shí)際測(cè)井資料的處理表明,逐步判別方法較好地解決了特征信息冗余問題,經(jīng)過特征選擇后,提高了沉積相的識(shí)別率。與貝葉斯判別方法比較,支持向量機(jī)方法優(yōu)于貝葉斯判別方法,表明該方法在沉積微相識(shí)別中有很大的理論和實(shí)際參考價(jià)值。
[1] 王金榮,劉洪濤.測(cè)井沉積微相識(shí)別方法及應(yīng)用[J].大慶石油學(xué)院學(xué)報(bào),2004,28(4):18-21.
[2] 魏 蓮,肖慈珣.用自組織神經(jīng)網(wǎng)絡(luò)方法實(shí)現(xiàn)測(cè)井相定量識(shí)別[J].物探化探計(jì)算技術(shù),2001,23(4):324-328.
[3] 焦巧平.埕島油田沉積微相定量識(shí)別[J].西南石油大學(xué)學(xué)報(bào),2008,30(6):72-76.
[4] 倪新鋒,田景春,陳洪德,等.應(yīng)用測(cè)井資料定量識(shí)別沉積微相[J].成都理工大學(xué)學(xué)報(bào),2007,34(1):57-61.
[5] 張 萌,田景春,吳志勇.用Bayes判別模型識(shí)別未取心井段沉積微相[J].成都理工學(xué)院學(xué)報(bào),2001,28 (3):273-278.
[6] 文 政,雍世和.應(yīng)用測(cè)井資料定量識(shí)別沉積微相[J].沉積學(xué)報(bào),1996,14(1):40-46.
[7] 閻 輝,張學(xué)工,李衍達(dá).應(yīng)用SVM方法進(jìn)行沉積微相識(shí)別[J].物探化探計(jì)算技術(shù),2000,22(2):158-164.
[8] 馬世忠,黃孝特,張?zhí)?定量自動(dòng)識(shí)別測(cè)井微相的數(shù)學(xué)方法[J].石油地球物理勘探,2000,35(5):582-590.
[9] 王仁鐸.利用測(cè)井曲線形態(tài)特征定量判別沉積相[J].中國地質(zhì)大學(xué)學(xué)報(bào),1991,16(3):303-309.
[10]向東進(jìn),李宏偉,劉小雅.實(shí)用多元統(tǒng)計(jì)分析[M].武漢:中國地質(zhì)大學(xué)出版社,2005.
Quantitative Identification of M icrofacies Based on Stepwise Discrim ination and Support Vector Machine
ZHANG Xiang1,WANG Zhi1,LUO Julan2,Q IN M injun2,WANG Zhongyu2
(1.Key Labo ratory of Exp loration Technologies for Oil and Gas Resources,M inistry of Education,Yangtze University, Jingzhou,Hubei 434023,China;2.China Petroleum Logging CO.L TD.,Xi’an,Shaanxi 710201,China)
Quick and accurate determination of the sedimentary facies based on logging data isone of the impo rtant and desiderated p roblem s in the oilfield exp lo ration and development.M icrofacies characteristics are reflected in logging curves.Based on the combination of the conventional logging data,the geological interp retation results and the core data some features described the microfacies changes are extracted by stepw ise discrimination method.Quantitative identification model of m icrofacies based on suppo rt vecto rmachine can automatically determ ine the sedimentary microfacies typesof the non-cores information drills.Real data show s that the p roposed method is better than the Bayes discrimination method in small samp le cases.
log interp retation,sedimentary microfacies,support vector machine,feature extraction,stepw ise discrimination,Bayes discrim ination
1004-1338(2010)04-0365-05
P631.84
A
中國石油科技創(chuàng)新基金資助(2009D-5006-03-04)
張 翔,男,1969年生,教授,博士后,主要從事地球物理信息處理、儲(chǔ)層評(píng)價(jià)與成像測(cè)井等方向的研究。
2010-03-15 本文編輯 余 迎)