孔強夫,楊 才,李 浩,耿 超,鄧 健
(1.中國石化 石油勘探開發(fā)研究院,北京 100083; 2.中國石油集團 長城鉆探工程有限公司 國際測井公司,北京 100083; 3.中國石油 西南油氣田分公司 蜀南氣礦,四川 瀘州 646000; 4.中國石油 華北油田公司 勘探開發(fā)研究院,河北 任丘 062552)
雷口坡組是四川盆地重要的勘探層系之一,具有廣闊的勘探前景[1-6]。由于川西海相碳酸鹽巖地層埋藏深度大,巖性變化快,巖性的準確識別是碳酸鹽巖儲層評價中的一個關(guān)鍵難題。巖性識別對于儲層評價及流體識別至關(guān)重要,目前測井巖性識別方法主要有交會圖法[7-9]、數(shù)據(jù)挖掘識別法(主成分分析、Fisher判別、神經(jīng)網(wǎng)絡(luò)及支持向量機)[10-13]和測井新技術(shù)識別法(成像測井及元素測井)等[14-18]。其中交會圖方法應(yīng)用最為廣泛,但該類方法反映的巖性信息有限,識別精度有待進一步提高。數(shù)據(jù)挖掘方法相對交會圖法識別精度高,但其適用性很大程度上取決于樣本的代表性。測井新技術(shù)識別方法能夠大幅度提高測井巖性識別的解釋精度,但該類方法由于成本較高難以普及。
圖論聚類(MRGC)是一種新型的機器學(xué)習(xí)方法,該方法基于最小臨近算法(K-Nearest Neighbor,KNN)和圖形數(shù)據(jù)表示的多維點陣圖形識別,由于KNN較其他方法更適合類域的交叉或重疊較多的樣本集[19-23],因此本文首先針對川西雷口坡組碳酸鹽巖儲層巖性常規(guī)測井識別難度大的問題引入有監(jiān)督MRGC機制,對已知定名巖性進行聚類生成訓(xùn)練模型,然后結(jié)合最小臨近算法進行外推,對其他未取心井巖性進行全井段預(yù)測,從而實現(xiàn)碳酸鹽巖巖性精確識別。
基于4類選樣原則:①剔除井眼條件或鉆井液質(zhì)量差的樣本;②盡量選擇巖心歸位好,巖性相對穩(wěn)定,井眼相對平滑段的樣本點;③盡量避免選擇薄層和層界面處的樣本;④部分巖心破碎結(jié)合丟失的樣本點需重新歸位。依據(jù)巖性成分結(jié)構(gòu)特征,薄片和巖心鑒定等資料,將雷口坡組碳酸鹽巖巖性歸為藻粘結(jié)白云巖、粉晶白云巖、泥晶白云巖、灰質(zhì)白云巖、白云質(zhì)灰?guī)r、灰?guī)r、膏質(zhì)白云巖和石膏共8大類。
巖性對物性有明顯的控制作用,白云質(zhì)含量的多少(膏質(zhì)白云巖除外)基本決定了儲層質(zhì)量的好與差。其中粉晶白云巖和藻粘結(jié)白云巖物性最好,該類巖性孔隙度大部分大于5%,滲透率大于0.1×10-3μm2,且最容易發(fā)育溶蝕孔和裂縫。泥晶白云巖和灰質(zhì)白云巖孔隙度小于5%,幾乎不發(fā)育溶蝕孔,部分儲層發(fā)育裂縫;白云質(zhì)灰?guī)r、灰?guī)r、膏質(zhì)白云巖和石膏物性最差,不發(fā)育溶蝕孔,有少量儲層發(fā)育裂縫,孔隙度大部分小于2%,滲透率小于0.1×10-3μm2(圖1a)。
絕大部分的藻粘結(jié)白云巖、大部分泥晶白云巖和部分粉晶白云巖、灰質(zhì)白云巖深側(cè)向電阻率(RD)值小于2 000 Ω·m,中子孔隙度(CNL)值介于6%~14%;大部分粉晶白云巖和部分灰質(zhì)白云巖、少量的泥晶白云巖和藻粘結(jié)白云巖深側(cè)向電阻率(RD)值介于7 000~20 000 Ω·m,中子孔隙度(CNL)值介于5%~11%;白云質(zhì)灰?guī)r、灰?guī)r、膏質(zhì)白云巖和石膏深側(cè)向電阻率(RD)值大于7 000 Ω·m,中子孔隙度(CNL)值小于6%(圖1b)。絕大部分藻粘結(jié)白云巖和粉晶白云巖伽馬(GR)值介于35~70 API,聲波時差值(AC)大于49 μs/ft;大部分泥晶白云巖和部分藻粘結(jié)白云巖伽馬(GR)值大于70 API,聲波時差(AC)值小于50 μs/ft;白云質(zhì)灰?guī)r、石膏和部分膏質(zhì)白云巖伽馬(GR)值小于35 API,聲波時差(AC)值大于50 μs/ft(圖1c)。
圖1 川西雷口坡組8類巖性常規(guī)測井響應(yīng)特征Fig.1 Response characteristics of eight lithologic facies in the Leikoupo Formation of western Sichuan Basin during conventional logging a.孔隙度-滲透率交會圖;b. CNL-RD交會圖;c. GR-AC交會圖
MRGC方法是一種新型的機器學(xué)習(xí)方法,該方法采用向量空間模型,將優(yōu)選的模型曲線和預(yù)測曲線轉(zhuǎn)化為由若干個特征組成空間形式(t1,t2,…,tk),再將各個特征樣本在曲線數(shù)據(jù)上賦予的數(shù)值填充到向量空間中。最終一個樣本數(shù)據(jù)dj的數(shù)學(xué)表示形式為:wj(w1j,w2j,…,wkj,…,w|T |j),其中wkj表示特征tk在樣本數(shù)據(jù)dj上的值,|T|表示特征向量的維數(shù)[16]。
設(shè)有2個特征向量X=(x1,x2,…,x|T|)和Y=(y1,y2,…,y|T |) ,則2個樣本數(shù)據(jù)之間的相似度采用歐幾里德距離來表示,如公式(1)所示:
(1)
利用高斯函數(shù)將公式(1)中計算的距離轉(zhuǎn)換為權(quán)重,根據(jù)距離的遠近對預(yù)測結(jié)果進行貢獻值補償,再通過每個最近鄰乘以相應(yīng)權(quán)重,然后將所得到的結(jié)果累加,并除以所有權(quán)重值的和,如公式(2)所示:
(2)
式中:P為最終的預(yù)測結(jié)果;Si為k個最近鄰中的第i個;wi為Si對應(yīng)的權(quán)重值。
最小臨近算法(KNN)是理論上比較成熟的方法,該方法思路是如果1個樣本在特征空間中的k個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。計算這個點與其它所有點之間的距離,取出與該點最近的k個點,然后統(tǒng)計這k個點里面所屬比例最大的,則這點屬于該分類。通過KNN算法,可以建立識別巖性聚類圖版和測井曲線的聯(lián)系。
本文引入機器學(xué)習(xí)的思想,先利用已知準確巖性定名的樣本點進行監(jiān)督,輸入測井曲線作為訓(xùn)練數(shù)據(jù),利用MRGC對樣本數(shù)據(jù)進行聚類分析生成訓(xùn)練模型,得到不同巖性的聚類圖版。為了實現(xiàn)未取心井全井段巖性識別,還需引入KNN算法對按照聚類圖版的原則進行巖性預(yù)測。圖2給出了巖性識別的技術(shù)流程。
圖2 巖性識別技術(shù)流程Fig.2 Flow chart of lithology identification
圖3給出了不同巖性常規(guī)測井值分布,可以看出不同巖性的測井響應(yīng)具有一定的差異這為巖性識別提供了可靠的依據(jù)。因此優(yōu)選了GR,DEN,CNL和RD 4條巖性敏感曲線作為訓(xùn)練數(shù)據(jù),利用MRGC方法建立訓(xùn)練模型如圖4所示,圖5為訓(xùn)練模型得到的巖性識別圖版。
圖3 川西雷口坡組8類巖性常規(guī)測井值分布范圍Fig.3 Distribution ranges of conventional log values of eight lithologic facies in the Leikoupo Formation,western Sichuan Basin
圖5 川西雷口坡組8類巖性聚類圖版Fig.5 Clustering chart of eight lighologic facies in the Leikoupo Formation in western Sichuan Basin
圖4 川西雷口坡組8類巖性MRGC訓(xùn)練模型Fig.4 MRGC training model for eight lithologic facies of the Leikoupo Formation in western Sichuan Basin
基于同刻度分析(將巖性轉(zhuǎn)換為相應(yīng)的代碼符號),利用KNN算法對識別圖版進行學(xué)習(xí)。分別對川西雷口坡組彭州1井、羊深1井、鴨深1井、彭州103井和彭州115井5口井260個樣本點進行了單井驗證,整體符合率91.3%(表1)證明了該方法的可行性。對于巖性相對穩(wěn)定,無明顯擴徑層段,測井識別巖性與薄片定名一致,如圖6倒數(shù)第三道為藻粘結(jié)白云巖(5 785~5 789 m)和粉晶白云巖(5 793~5 798 m)典型鏡下照片,倒數(shù)第二道(EFAC)為測井識別巖性代號,最后一道(DM)為薄片定名巖性代號,從識別效果來看,整體一致性較好。但在薄片定名樣本點少,井況條件差的情況下識別效果較差,如彭州115井6 328.4 m樣本點測井識別為灰質(zhì)白云巖(DM=4),薄片定名為藻粘結(jié)白云巖(圖7)。整體來看,白云巖類(藻粘結(jié)白云巖、粉晶白云巖、泥晶白云巖和灰質(zhì)白云巖)的識別符合率較灰?guī)r類(白云質(zhì)灰?guī)r和灰?guī)r)較高(表1)。
表1 測井巖性識別與薄片定名符合率(部分數(shù)據(jù))Table 1 Coincidence rate between logging lithology identification and slice naming(part of data)
圖7 川西雷口坡組彭州115井(6 310~6 420 m)測井巖性識別與薄片定名對比Fig.7 Comparison of logging lithology identification and thin slice naming in Well Pengzhou 115 (6 310-6 420 m) in the Leikoupo Formation,western Sichuan Basin
圖6 川西雷口坡組鴨深1井(5 770~5 800 m)測井巖性識別與薄片定名對比Fig.6 Comparison of logging lithology identification and thin slice naming in Well Yashen 1 (5 770-5 800 m) in the Leikoupo Formation,western Sichuan Basin
1) 巖性與物性、電性和含氣性之間關(guān)系密切,巖性的準確識別是儲層參數(shù)評價及流體識別的基礎(chǔ)。
2) 白云巖中的藻粘結(jié)白云巖和粉晶白云巖物性相對較好,灰?guī)r的物性相對較差,石膏為非儲層,中子、密度、電阻率和伽馬對不同巖性具有一定的敏感性。
3) 5口井的測井巖性識別與薄片定名對比效果表明,MRGC聚類分析結(jié)合KNN方法在碳酸鹽巖復(fù)雜巖性識別中具有一定的可行性。