陳 袁,鮮讓之,吳德順,周 飛,陳麗群
(1.中石油塔里木油田分公司勘探開發(fā)研究院,新疆 庫爾勒841000;2.中石油塔里木油田分公司庫車項目經(jīng)理部,新疆 庫爾勒841000)
?
基于PCA-RBF神經(jīng)網(wǎng)絡的新型錄井巖性識別方法
陳 袁1,鮮讓之1,吳德順2,周 飛1,陳麗群1
(1.中石油塔里木油田分公司勘探開發(fā)研究院,新疆 庫爾勒841000;2.中石油塔里木油田分公司庫車項目經(jīng)理部,新疆 庫爾勒841000)
摘要:新的鉆井工藝或鉆井液體系的使用在保證鉆井施工順利進行的同時,也給錄井巖屑的巖性識別帶來了極大的挑戰(zhàn),其中以膏鹽巖地層尤為突出。以塔里木油田大北X井為例,提出了主成分分析(PCA)與徑向基函數(shù)(R BF)神經(jīng)網(wǎng)絡相結合的膏鹽巖地層巖性識別方法,利用主成分分析法去除指標變量間的相關性,將原始指標變量重新線性組合為4項綜合變量作為R BF神經(jīng)網(wǎng)絡的輸入向量;最后建立適于識別膏鹽巖地層巖性的R BF神經(jīng)網(wǎng)絡模型。實際識別結果表明,該PCA-R BF神經(jīng)網(wǎng)絡模型對于膏鹽巖地層巖性的識別具有較高的準確性,完全可以滿足實際應用的要求,具有進一步推廣的價值。
關鍵詞:R BF神經(jīng)網(wǎng)絡;綜合錄井參數(shù);膏鹽巖地層;塔里木
PDC鉆頭由于其高鉆速、高效益、高井身質量等優(yōu)勢而被廣泛使用,然而它特殊的鉆頭結構和巖石破碎機理又使得巖屑量少且細碎[1],這給現(xiàn)場巖樣的采集和巖屑的巖性識別帶來極大的困難。譬如在膏鹽巖地層中,為了避免因鹽巖層蠕動而帶來的卡鉆等鉆井事故,常常采用欠飽和鉆井液體系。這種鉆井液體系由于溶解了地下鹽層,從而使得返出井口的巖屑量急劇減少,難以觀察到鹽巖,同時由于鹽巖溶解而造成上覆巖層的局部垮塌,還會使得巖屑中混入大量非該目的層段的假巖屑,這些影響因素無疑都增加了巖性準確識別的難度。
以往用于識別或預測地層巖性的方法主要有以下三類:①通過研究綜合錄井參數(shù)(如鉆時、扭矩或轉速等)與巖性間直接對應關系來識別[3-7];②通過建立錄井參數(shù)與巖性的數(shù)學線性關系來確定,如鉆速與巖性的關系[8],錄井參數(shù)相關系數(shù)二階導與巖性的關系[9];③通過建立模型來識別巖性,如模糊數(shù)學[10]、BP神經(jīng)網(wǎng)絡[11-14]等。盡管上述方法在錄井巖性的識別上取得了一定的效果,但也存在一定的局限性,如錄井參數(shù)多選取以鉆速為主的工程參數(shù)而忽略了鉆井液參數(shù)的運用,而且以上方法無一例外都應用在砂泥巖地層,還沒有提出針對特殊地層(如膏鹽巖地層)的錄井巖性識別方法。因此,結合前人研究成果,綜合運用多錄井參數(shù),首次提出了基于主成分分析的徑向基函數(shù)神經(jīng)網(wǎng)絡在膏鹽巖地層錄井巖屑的巖性識別方法,不僅克服了過去所選參數(shù)的單一化,還彌補了鮮有針對膏鹽巖地層巖屑的巖性識別這一空白。
主成分分析(Principal Component Analysis,簡稱PCA)是利用降維的思想,把多個指標轉化為少數(shù)幾個不相關的綜合指標的一種多元統(tǒng)計數(shù)學分析方法。PCA的基本思想為把眾多具有一定相關性的原始可觀測指標變量X1,X2,…,Xp,通過線性變換,重新組合成一組互不相關的綜合指標變量Fm(m≤p),以代替原來可觀測的指標變量[15],排除其相互重疊的信息,組成少數(shù)幾個不能直接觀測的新變量。這些新變量在反映地層真實信息方面又盡可能多的表征了原變量的數(shù)據(jù)特征,以此來綜合反應地層巖性。假定有n 個巖性樣本,每個樣本有p 個指標變量,所構成得n×p 的矩陣則為:
主成分分析的具體步驟可分為以下幾步:
1.1原始指標變量標準化
原始觀測指標有不同的量綱,有的有很大的差異。由于不同量綱的數(shù)量級會引出新的問題,為了消除由于量綱的不同而帶來的影響,主成分分析前需對數(shù)據(jù)進行標準化處理,公式為:
式中,表示第i個指標變量與第k個指標變量的相關系數(shù)。
1.3計算R矩陣的特征值λ j及特征向量α ji,建立主成分得分函數(shù)Fj
特征值是主成分的方差,其大小反映了各個主成分在被評價對象上所起作用,可根據(jù)特征方程式來求出,并進一步求出屬于λj特征向量αji(i=1,2,…,p),最后通過特征向量,可將標準化后的指標變量Zi轉換為綜合指標變量,即主成分得分函數(shù)為原指
標變量的第j個主成分,它是Z1,Z2,…,Zp的一切線性組合中方差最大的,即Fj是與F1,F(xiàn)2,…,F(xiàn)j-1都不相關的Z1,Z2,…,Zp的所有線性組合中方差最大者。其中F1在總方差中所占比重最大,其余主成分方差依次遞減,因此實際處理中只需挑選其中幾個方差最大的主成分來簡化系統(tǒng)結構。
1.4計算方差貢獻率,確定主成分個數(shù)m
徑向基函數(shù)(Radial Basis Function,簡稱RBF)神經(jīng)網(wǎng)絡,是1998年提出的一種典型的三層前饋網(wǎng)絡,由輸入層、隱層和輸出層組成(見圖)。作為整個神經(jīng)網(wǎng)絡體系中應用最廣泛的網(wǎng)絡結構,相比較其他神經(jīng)網(wǎng)絡而言,RBF神經(jīng)網(wǎng)絡在訓練速度、逼近能力等方面則更具優(yōu)勢,具有收斂速度快、不易陷入局部極小點、魯棒性好和易于實現(xiàn)等優(yōu)點[16-18]。
RBF神經(jīng)網(wǎng)絡結構圖
RBF神經(jīng)網(wǎng)絡的基本思想是用徑向基函數(shù)作為隱層神經(jīng)節(jié)點的基,通過非線性函數(shù)的線性組合來實現(xiàn)非線性映射。徑向基函數(shù)神經(jīng)節(jié)點的基函數(shù)形式各異,其中最常用的為高斯函數(shù),它是一種局部分布、中心對稱衰減的非負非線性函數(shù)。高斯函數(shù)表達式為:
式中:h為隱層節(jié)點數(shù);Ri(x)為隱層第i個節(jié)點的輸出;x為m維輸入向2量;ci為隱層第i個徑向基函數(shù)中心;σi為隱層節(jié)點響應寬度,用于調節(jié)神經(jīng)節(jié)點的敏感程度;x-ci為x-ci的歐式距離,表示x與ci之間的距離。
從高斯函數(shù)表達式來看,在ci處隱層節(jié)點的響應值達到最大,隨著x-ci的增大,R(ix)迅速衰減,因此從輸入層輸入的向量只有一小部分靠近ci的值才會被激活,即徑向基函數(shù)為一個具有局部感受特性的函數(shù)形式。
RBF神經(jīng)網(wǎng)絡從輸入層到隱層x→Ri(x)為非線性變換,而隱層到輸出層則為線性變換:
式中:wki為第i個隱層節(jié)點到第k個輸出層之間的權值;p為輸出層數(shù)。
通過RBF神經(jīng)網(wǎng)絡表達式可以看出,由徑向基函數(shù)構成的隱層對輸入層進行變換,能將低維數(shù)據(jù)變換到高維空間,使得在低維空間線性不可分的問題在高維空間線性可分,并最終通過輸出層線性輸出。利用高斯函數(shù)作為基函數(shù)的徑向基神經(jīng)網(wǎng)絡學習過程可簡述為兩個階段:①自組織學習階段,即學習隱層基函數(shù)的中心與方差的階段;②監(jiān)督學習階段,即學習輸入層權值階段。在網(wǎng)絡學習中需要確定的參數(shù)有兩類:①隱層節(jié)點數(shù)h、基函數(shù)中心ci和寬度σi,一般可采用K-均值算法來訓練ci,基函數(shù)寬度的選取則往往根據(jù)聚類的結果來確定,而隱層節(jié)點個數(shù)的確定至今沒有完善的計算公式,只能通過遍歷嘗試直到達到誤差滿意為止;②輸出層與隱層之間的連接權值,在確定ci和σi之后,權值的大小可采用線性最小二乘法(LMS)來確定。
塔里木盆地庫車坳陷庫姆格列木群(E1-2km)廣泛發(fā)育厚層膏鹽巖,其中塔里木油田大北X井庫姆格列木群第二段(5 071.0m~5 681.0m)為一典型的膏鹽巖地層,巖性較為豐富,主要為不同厚度的褐色含鹽泥巖、鹽質泥巖、泥巖,白色鹽巖、泥質鹽巖、膏鹽巖、石膏巖,灰白色泥膏巖等。為了保證合理的井眼結構和鉆井施工的安全,該井E1-2km段采用了PDC鉆井工藝和欠飽和鹽水鉆井液體系,這也使得鉆井巖屑顆粒細小且量少,在現(xiàn)場可能造成巖屑定名不準確,甚至連巖屑的主要巖性都可能出現(xiàn)重大偏差?;诖耍疚倪x擇了該井5 512.0m~5 591.0m井段的79個巖屑樣本(巖屑為1米1撈)進行PCA-RBF神經(jīng)網(wǎng)絡訓練,并對5 591.0m~5 646.0m井段共55組巖屑巖性進行識別。在此需要補充說明的是,訓練樣本和識別樣本巖性都做了適當?shù)暮喕蝗∑渲饕獛r性(鹽巖、膏巖及泥巖)作為研究對象。
表1 原始觀測指標變量樣本匯總表(已標準化)
3.1 原始觀測指標變量的選取
由于地下地層巖性的不同會引起鉆井效率的不同,因此可以根據(jù)鉆井效率的改變來判斷地下地層的巖性。對于膏鹽巖等軟地層來說,PDC鉆頭的使用壽命較長,在長時間鉆進該類型地層后,鉆頭仍能保持良好的工作狀態(tài)[19],因此本次研究忽略了鉆頭磨損對鉆井效率的影響。在充分考慮鉆井工藝和鉆井液體系對膏鹽巖地層鉆井效率的影響[20-22]后,優(yōu)選出了3大類共計9項的原始觀測指標變量。第1類為可以直接從錄井儀上讀取的錄井參數(shù),如鉆時等;第2類為需要做簡單線性處理的參數(shù),如當量進尺深度;第三類為鉆井液參數(shù),如氯離子含量。其具體參數(shù)為:鉆速(X1)、入口流量(X2)、出口密度(X3)、全烴(X4)、當量進尺深度(X5)、當量扭矩(X6)、DC指數(shù)(X7)、出入口電導差(X8)、氯離子含量(X9)。
3.2PCA-RBF神經(jīng)網(wǎng)絡巖性識別
由于所選原始觀測指標較多,各指標勢必存在不同程度的相關性,如不進行處理將增加神經(jīng)網(wǎng)絡的規(guī)模,影響識別精度。經(jīng)主成分分析后的數(shù)據(jù)可以在保留主要信息的基礎上降低神經(jīng)網(wǎng)絡的輸入維數(shù),從而消除變量間的相關性,增強神經(jīng)網(wǎng)絡的識別能力。PCA-RBF神經(jīng)網(wǎng)絡巖性識別步驟如下:
1)對所選樣本按照標準化公式進行處理,其結果見表一。
表2 主成分方差解釋表
2)對79個訓練樣本建立相關系數(shù)矩陣R。
3)計算R特征值,確定主成分。通過對相關系數(shù)矩陣特征值的計算可知(表2),前4個主成分的特征值都大于1,且方差累計貢獻率達到88.82%,說明前4個主成分基本包含了9個原始觀測指標變量的所有信息。根據(jù)因子載荷矩陣(表3)可發(fā)現(xiàn):鉆速、當量進尺深度、DC指數(shù)和當量扭矩在第1主成分(F1)上有很高的載荷,說明了第1主成分主要反映了鉆速等原指標變量的信息;入口流量、出口密度及氯離子含量在第2主成分(F2)上載荷較高;出入口電導差在第3主成分(F3)上有很高載荷;第4主成分(4)主要反映了全烴指標變量的信息。以上4個主成分綜合反映了全部9項指標變量的絕大部分信息,因此可以用前四個主成分來代替原有觀測指標變量進行神經(jīng)網(wǎng)絡分析。表三的主成分得分系數(shù)矩陣給出了原始指標變量與主成分之間的線性關系,根據(jù)該矩陣以及原始指標變量就可以計算出各主成分的得分,其線性表達式為:
表3 因子載荷矩陣與主成分得分系數(shù)矩陣
4)建立PCA-RBF神經(jīng)網(wǎng)絡巖性識別模型。
利用上述4個主成分公式,計算出134組巖性樣本各主成分得分,并將其作為神經(jīng)網(wǎng)絡訓練識別的輸入向量。在79組訓練樣本中,隨機選取其中的28組作為神經(jīng)網(wǎng)絡模型的回判樣本。由樣本特征可以確定PCA-RBF神經(jīng)網(wǎng)絡的結構:輸入層為4層,輸出層為3層,隱層節(jié)點數(shù)則通過遍歷嘗試確定,當隱層節(jié)點數(shù)為22時,神經(jīng)網(wǎng)絡模型誤差最小,模型的其余參數(shù)是在確定了隱層節(jié)點數(shù)后,自動調整其值至到最小誤差為止。表四為PCA-RBF神經(jīng)網(wǎng)絡訓練識別的結果匯總表,從該表可以看出,該網(wǎng)絡模型訓練樣本的正確率高達98.0%,回判正確率達92.9%,對55待識別樣本的識別正確率達90.9%。其中僅有2個膏巖被錯誤識別為泥巖,1個泥巖誤認為鹽巖,2個鹽巖樣本分別錯判為膏巖和泥巖。從訓練和識別的結果來看,該PCA-RBF神經(jīng)網(wǎng)絡模型對于膏鹽巖地層巖性的識別具有較高的準確性,可以滿足實際應用的要求,可以進一步推廣。
表4 訓練識別結果匯總表
主成分分析法(PCA)作為一種降維的數(shù)學分析方法被大量用于石油勘探領域,而徑向基函數(shù)神經(jīng)網(wǎng)絡由于其訓練速度快,逼近能力強、魯棒性好和易于實現(xiàn)等優(yōu)點而成為神經(jīng)網(wǎng)絡體系中應用最廣泛的網(wǎng)絡結構。將主成分分析法與徑向基函數(shù)神經(jīng)網(wǎng)絡結合,并應用于膏鹽巖地層錄井巖屑的巖性識別尚屬首次。經(jīng)主成分分析后的眾多原始可觀測指標變量能線性組合為少數(shù)保留了原始變量信息的綜合變量,從而降低神經(jīng)網(wǎng)絡的輸入維數(shù),增強網(wǎng)絡模型的識別能力。實際應用表明,以塔里木油田大北X井為例,對優(yōu)選出的9項綜合錄井參數(shù)進行主成分分析,確定了方差貢獻率最大的前4個主成分作為徑向基函數(shù)神經(jīng)網(wǎng)絡的輸入層,通過遍歷嘗試隱層節(jié)點數(shù)后,確定了RBF神經(jīng)網(wǎng)絡的最優(yōu)模型,將其對55個待識別樣本進行識別,最終識別正確率達90.9%。因此可以認為,基于PCA-RBF神經(jīng)網(wǎng)絡的膏鹽巖地層巖性識別方法具有一定的合理性,有進一步推廣的價值。
參考文獻:
[1]焦繼延.PDC鉆頭鉆井對地質錄井的影響[J].西部探礦工程,2005,111(增):35~37.
[2]王曉陽,張泳.塔河油田膏鹽巖地層錄井技術[J].錄井工程,2006,17(增):12~15.
[3]賀登兵.不同鉆井參數(shù)條件下PDC鉆頭鉆井巖屑分析與識別[J].內(nèi)蒙古石油化工,2007(8):208~209.
[4]高峰,張書桐,滕玉明,等.PDC鉆頭下錄井巖性的識別方法[J].石油地質與工程,2007,21(1):37~38,63.
[5]曾艷濤,肖天君,使用PDC鉆頭時的錄井方法研究[J].西部探礦工程,2010(6):58~60.
[6]徐振中,蔡福華.談談在使用PDC鉆頭時的幾種錄井方法[J].西部探礦工程,2005,107(4):61~62.
[7]何國賢.應用錄井參數(shù)綜合判別巖性[J].海洋石油,2002,111(1):19~23.
[8]曹正林,周麗清,王志章,等.利用鉆井參數(shù)進行隨鉆巖性預測[J].天然氣工業(yè),2000,20(1):48~50.
[9]王佑寧,惠卓雄,劉志剛,等.PDC鉆頭條件下巖性識別新技術探討[J].錄井技術,2003,14(4):1~7.
[10]張文旗,王志章,孫新銷,等.PDC鉆頭條件下隨鉆巖性模糊識別[J].錄井工程,2008,19(2):27~29.
[11]李功權,曹代勇,陳恭洋,等.PDC鉆頭條件下隨鉆巖性識別方法研究[J].石油鉆采工藝,2006,28(2):25~27.
[12]楊進,張輝.地層巖性隨鉆識別的神經(jīng)網(wǎng)絡方法研究[J].天然氣工業(yè),2006,26(12):109~111.
[13]周勁輝,鄢泰寧,屠厚澤.識別所鉆地層的人工神經(jīng)網(wǎng)絡法應用[J].地球科學—中國地質大學學報,2000,25(6):642~645.
[14]張輝,高德利,鉆井巖性實時識別方法研究[J].石油鉆采工藝[J].2005,27(1):13~15.
[15]于秀林,任雪松.多元統(tǒng)計分析[J].北京:中國統(tǒng)計出版社,1999.
[16]Meng JooEr,Shiqian Wu,Juwei Lu,et al.Face Recognition With Radial Basis Function(RBF)Neural Networks[J].Ieee Transactionson Neural Networks,2002,13(3):697~710.
[17]Tianshu Bi,Zheng Yan,F(xiàn)ushuan Wen.Online Fault Section Estimation in Power Systems With Radial Basis Function Neural Network[J].Electrical Power and Energy Syst.,2002,24:321~328.
[18]Sridhar Seshagiri,Hassan K Khalil.Output Feedback Control of Nonlinear Systems Using RBF Neural Networks[J].Ieee Transactionson Neural Networks,2000,11(1):69~79.
[19]鄒德永,王瑞和.PDC鉆頭的巖石研磨性試驗研究[J].石油大學學報(自燃科學版),2003,27(2):41~43.
[20]陳庭根,管志川.鉆井工程理論與技術[M].東營:中國石油大學出版社,2000.
[21]石秉忠.鉆井液對鉆井效率的影響因素分析[J].西部探礦工程,2011(12):74~78.
[22]尚鎖貴.膏鹽巖地層地質特征與錄井技術[J].錄井工程,2006,17(4):10~13.
Lithology Identification Method While Drilling Based on PCA-RBF Neural Network
CHEN Yuan1XIAN Rang-zhi1WU De-shun2ZHOU Fei1CHEN Li-qun1
(1-Research Institute of Exploration and Development,Tarim Oilfield Company,PetroChina,Korla Xinjiang 841000; 2-Kuqa Project Management Department,Tarim Oilfield Company,PetroChina,Korla Xinjiang 841000)
Abstract:This paper has a discussion on lithology identification method while drilling based on PCA-RBF neural network by the example of gypsum salt rock formation in DB-X Well,Tarim Oilfield and puts forward lithology identification method for gypsum salt rock formation based on PCA and RBF neural network.A RBF neural network model for lithology identification of gypsum salt rock formation is set up.
Key words:PCA method; RBF neural network; comprehensive mud logging parameter; gypsum salt rock formation; lithology identification
DOI:10.3969/j.issn.1006-0995.2016.01.035
中圖分類號:O212
文獻標識碼:A
文章編號:1006-0995(2016)01-0156-05
作者簡介:陳袁(1987-)男,四川內(nèi)江人,助理工程師,現(xiàn)從事油藏描述,油氣田開發(fā)地質研究工作
收稿日期:2015- 03-06