陳玉雪,常安定,強玲娟
(長安大學理學院,西安 710064)
?
基于數據挖掘的M地區(qū)低滲透儲層評價
陳玉雪,常安定,強玲娟
(長安大學理學院,西安 710064)
文章以M地區(qū)為研究對象,針對該區(qū)實際地質情況,基于孔隙度、滲透率等測井資料,運用多元統(tǒng)計中的R型因子分析、判別分析及數據挖掘中的聚類分析,對儲層進行合理的分類,得出儲層空間的展布規(guī)律,并建立定量的評價標準。結合實際產能資料驗證,認為該方法在儲層評價中是可行的。
R型因子分析;Fisher判別;凝聚層次聚類;儲層評價;鄂爾多斯
儲層研究的目的是對儲層做出符合地質實況的分類與評價[1-3],故首要任務就是對儲層做出合理的分類評價,它的結果能夠直接指導油氣的勘探與開發(fā)。因此,儲層評價工作一直是國內外研究者關注的焦點。儲層分類的關鍵是合理選擇評價參數及方法,目前研究方向主要集中在運用各種數學方法、地質學與實驗方法等對滲透率和孔隙度等儲層物性參數進行評價,其中包括:地質經驗法、模糊數學法,權重分析法以及各種地震方法等等[1]。根據各個地區(qū)不同的地質特征,每種評價方法均有各自不同的優(yōu)缺點。
本次工作在對M地區(qū)的研究中發(fā)現,M地區(qū)的儲層非均質性較強,溶蝕孔洞發(fā)育較多,現有方法對該區(qū)評價時其結果不太理想。由此,本研究以M地區(qū)的地質資料為例,引入多元統(tǒng)計分析中的R型因子分析優(yōu)化評價參數,然后使用數據挖掘中的凝聚層次聚類算法對儲層分類,并建立評價標準,從而得到更精準的評價結果。相比較而言,比傳統(tǒng)定性分類更加合理、全面[4-5]。
因子分析和判別分析都是多元統(tǒng)計中的典型方法[6]。因子分析的目的是降維和簡化數據,它通過研究多個變量間的內部依賴關系,用少數幾個能反映原來眾多變量主要信息的‘因子’來表示其基本的數據結構。原始變量是可觀測的顯在變量,而因子是不可觀測的潛在變量[7]。因子分析在此用來確定變量權重。
判別分析是利用已經得到的變量數據,找到一種判別函數,使得此函數具有某種最有性質,能夠把屬于不同類別的樣本點盡量區(qū)別開來[6]。判別分析在此用來建立評價標準并驗證評價結果。
數據挖掘的目的是從大量、隨機的數據中通過算法探尋隱藏的潛在信息的過程,主要包括分類、聚類、關聯(lián)分析與異常檢測[8]。其中,聚類分析是數據挖掘中的一個重要方法,它是一種在沒有任何先驗信息條件下,將現有的無標記數據進行歸類的數據分析過程。其目標是,組內的對象相互之間是相似的,而不同組中的對象是不相關的。組內的相似性越大,組間差距越大,聚類效果就越好[9]。
1.1 R型因子分析
設有n個樣本,每個樣本有m項參數,則原始數據集可用矩陣表示為:
(1)將樣本標準化,去除原始量綱及異常點。
(2)判斷原始變量是否適合于因子分析(求變量間的相關系數矩陣,若矩陣中大部分相關系數均大于0.3,且通過球形檢驗即可)。
(4)因子旋轉。
(5)計算公共因子變量得分[9-10]。
1.2 凝聚層次聚類算法
層次聚類常常使用稱作樹狀圖的類似于樹的圖顯示。凝聚層次聚類算法的基本思想是:將數據對象看成一棵樹狀圖,運用遞歸的方法發(fā)現潛在的簇,在自下而上的凝聚模型中,從個體點作為本身的簇開始,相繼合并兩個最接近的簇,直到只剩下一個簇[8]。
算法描述如下:
第一步:根據需要,計算鄰近度矩陣。
第二步:repeat。
第三步:合并最接近的兩個簇。
第四步:更新鄰近性矩陣,以反映新的簇與原來的簇之間的鄰近性。
第五步:until僅剩下一個簇。
1.3 Fisher判別
從m個總體中抽取具有n個指標的樣品觀測數據,然后借助方差分析的思想構造一個線性判別函數:
U(X)=u1X1+u2X2+…+unXn=u′X
(1)
其中,系數u=(u1,u2, …un)確定的原則是使得總體之間區(qū)別最大,每個個體內部離差最小。有了線性判別函數后,對于一個新的樣品,將它的n個指標值代入(1)式中求出U(X)值,然后根據判別一定的規(guī)則,即可判別出新的樣品屬于哪個總體[6,11]。
2.1 地質背景
鄂爾多斯盆地是一個位于中國西部,在華北地臺上發(fā)育起來的多旋回中、新生代沉積盆地。盆地具有構造穩(wěn)定,整體抬升、持續(xù)下降、地層平緩的特征[12]。在晚三疊世延長期,發(fā)育了大型的鄂爾多斯湖盆,成藏了大量的油氣資源[9],其中“長4+5—長2”是湖盆的萎縮期,面積逐漸變小[12]。
M地區(qū)位于鄂爾多斯盆地伊陜斜坡中部,地層為一個單斜,傾角不足1°。M地區(qū)長2期以三角洲平原分流河道沉積為主,尤其是長21期,三角洲發(fā)育進入鼎盛時期,廣泛發(fā)育的河道砂體為油氣聚集提供了必須的儲集空間,由于巖性的橫向變化和儲集砂體沉積之后的差異壓實作用形成構造—巖性圈閉。
三疊紀末期,鄂爾多斯盆地受印支運動的影響整體抬升。地表遭受長時期的風化剝蝕,形成起伏不平、溝谷縱橫的古地貌景觀。研究區(qū)位于前侏羅紀甘陜古河谷南側的子午嶺斜坡帶。延長組長2保存完整,長1也不同程度的有所保存,保存厚度可達30~50 m,有利于油氣成藏。
2.2 參數優(yōu)選和因子分析
在4口取心井產段選,取樣本32個,優(yōu)選了孔隙度、滲透率,非汞飽和度、中值壓力、結構系數和進汞迂曲度作為分析指標,并對數據進行因子分析,分析結果見表1。
從表1可知,本例中有兩個因子對應的特征值大于1,因此應提取相應的兩個公因子,且從中可以看出,前兩個因子已經可以解釋79.093%的方差。
從表2可以看出,第一個公因子在指標x1、x2、x6上有較大載荷,說明這三個指標有較強的相關性,可以歸為一類;其他指標歸為另一類。
根據表2可得到旋轉后的因子得分表達式為:
F1=0.696x1+0.658x2+0.834x3+0.923x4+0.59x5+0.762x6
F2=0.102x1+0.217x2+0.378x3+0.29x4+0.946x5+0.035x6
式中:x1為孔隙度(%);x2為滲透率(×10-3μm);x3為非汞飽和度(%);x4為中值壓力(MPa);x5為結構系數;x6為進汞迂曲度。
表1 各公因子方差貢獻表
注:提取方法為主體元件分析。
表2 旋轉后因子載荷陣
圖1 M地區(qū)儲層分類系譜圖(橫坐標為樣本,縱坐標為距離系數)Fig.1 Family tree of reservoir classification in area M
2.3 凝聚層次聚類
根據2個公共因子的得分對該區(qū)儲層進行聚類分析,可得到分類系譜圖1。由圖1可知:當距離系數為1.5時,所有樣品明顯的分為4類(A、B、C、D)。
結合系譜圖,對劃分的四類儲層進行分析,其結果如表3所述。
為驗證分類的合理性,與現場儲層分類結果對比發(fā)現,A類為好儲層,B類為較好儲層,C類為較差儲層,D類為非儲層。
2.4 儲層類型判別
確定了儲層劃分的4個類型以后,將標準樣品按照以上四類儲層類型分組,建立判別需要的輸入文件,利用Fisher判別分析法建立每一類儲層的判別函數模型,判別函數分別為:
F1=-64.98-1.680x1+0.656x2+0.877x3+0.097x4+0.017x5+0.579x6
表3 儲層分類參數統(tǒng)計
表4 正2井區(qū)相對滲透率分析數據表
圖2 5032井相對滲透率曲線Fig.2 Permeability saturation curve of well 5032
F2=-28.767-0.867x1+1.155x2+0.357x3+0.038x4+0.054x5+0.698x6
式中:x1為孔隙度(%);x2為滲透率(×10-3μm);x3為非汞飽和度(%);x4為中值壓力(MPa); x5為結構系數;x6為進汞迂曲度。
從中可以得到,孔隙度和第一個判別函數關系較密切,滲透率和第二個判別函數關系較密切。實際上這兩個函數式計算的是各觀測值在每個維度上的坐標,這樣可以通過這兩個式子求出各個樣品觀測值的具體空間位置。
通過驗證,隨機選擇的樣本點與上述聚類分析結果吻合率達到94%以上,說明所建立的Fisher判別函數與其評價指標的分類標準符合了精度上的要求。通過spss判別分析,可計算其他井樣品所屬儲層類型。
2.5 應用效果分析
通過對正2井區(qū)5032井巖心樣品模擬地層條件進行的儲層潤濕性試驗,結果為親水儲層。水潤濕指數為0.646,油潤濕指數為0。相對滲透率分析見圖2、表4所述,等滲點含水飽和度58.4%,束縛水飽和度為35.3%。水驅油試驗,無水驅油效率為25%,最終驅油效率為43%。滲流分析成果表明,正2井區(qū)長2油藏的儲層性質對油田開發(fā)較為有利。
綜上所述,該儲層分類評價標準的結論與實際生產情況吻合,這一新的評價標準達到了較高的精度,適用于該區(qū)的儲層評價分析。
采用因子分析優(yōu)化評價參數,解決了參數多、數據不規(guī)整的問題;通過凝聚層次聚類分析,將該區(qū)儲層分為四類,每類儲層各參數值均是規(guī)律遞變;最后,通過Fisher判別函數建立了儲層分類的綜合判別函數表達式,以及定量的分類標準。
[1] 陳歡慶, 丁超, 杜宜靜, 等. 儲層評價研究進展[J]. 地質科技情報, 2015, 34(5): 66-74.
[2] 楊俊杰. 鄂爾多斯盆地構造演化與油氣分布規(guī)律[M]. 北京: 石油工業(yè)出版社, 2002.
[3] 于興河. 油氣儲層地質學基礎[M]. 北京: 地質出版社, 2009: 362-382.
[4] 黃淵, 廖明光, 李斌, 等. 數據挖掘技術在碳酸鹽巖儲層評價中的應用[J]. 特種油氣藏, 2014(5): 37-42.
[5] 譚鋒奇, 李洪奇, 孟照旭, 等. 數據挖掘方法在石油勘探開發(fā)中的應用研究[J]. 石油地球物理勘探, 2010, 45(1): 85-91.
[6] 張潤楚. 多元統(tǒng)計分析[M]. 北京: 科學出版社, 2010.
[7] 張林泉. 基于因子分析的應用研究[J]. 哈爾濱師范大學學報(自然科學報), 2009, 25(5): 60-63.
[8] 范明, 范宏建, 等. 數據挖掘導論[M]. 北京: 人民郵電出版社, 2014.
[9] 李文厚, 龐軍剛, 曹紅霞, 等. 鄂爾多斯盆地晚三疊世延長期沉積體系及巖相古地理演化[J]. 西北大學學報(自然科學版), 2009(3): 501-506.
[10] 呂紅華, 任明達, 柳金誠, 等. Q型主因子分析與聚類分析在柴達木盆地花土溝油田新近系砂巖儲層評價中的應用[J]. 北京大學學報(自然科學版), 2006, 42(6): 740-745.
[11] 付殿敬, 徐敬領, 王貴文. 基于Q型聚類分析和貝葉斯判別算法研究儲層分類評價[J]. 科技導報, 2011, 29(3): 29-33.
[12] 劉池洋, 趙紅格, 桂小軍. 鄂爾多斯盆地演化-改造的時空坐標及成藏(礦)響應[J]. 地質學報, 2006, 80(5): 617-633.
The data mining-based evaluation of low permeability reservoir in area M
CHEN Yuxue, CHANG Anding, QIANG Lingjuan
(ChanganUniversityFacultyofScience,Xi’an710064,China)
According to practical geological situation, logging data, such as porosity, permeability of area M multivariate statistical R factor analysis, discriminant analysis and cluster analysis for data mining are used to make reasonable classification of reservoirs, then is summarized the spatial distribution pattern of reservoirs and set up evaluation criterion. The actual production data show that the method is feasible.
type R factor analysis; Fisher discrimination; condensation hierarchical clustering; reservoir evaluation; Erduosi
2016-04-28;
2016-07-21; 責任編輯: 王傳泰
陜西省科技計劃項目(編號:2015JM1022)資助。
陳玉雪(1970—),女,在讀研究生,主要從事統(tǒng)計最優(yōu)化方向研究工作。通信地址:陜西省西安市南二環(huán)中段,長安大學理學院;郵政編碼:710064;E-mail:332575096@qq.com
10.6053/j.issn.1001-1412.2016.04.009
P618.13,TE348
A