王 俊,曹俊興,尤加春,劉 杰,周 欣
(成都理工大學地球物理學院,四川成都610059)
孔隙度、滲透率和飽和度(簡稱孔滲飽)參數(shù)作為評價儲層質量的重要特征參數(shù),其準確估計可為儲層評價提供可靠的參考依據。目前,鉆井取心后進行巖石物理分析所獲得的物性參數(shù)最為準確[1],但這種方法的取樣和測試成本高,故僅限于某些層段,難以獲取整個工區(qū)的物性參數(shù)。根據地質信息和測井資料之間的關系確定儲層巖性及孔滲飽等地層參數(shù),是實現(xiàn)精確儲層預測與評價的關鍵,也是油藏描述最基本的內容。前人提出并發(fā)展了許多儲層孔滲飽參數(shù)的預測方法,如根據理論孔隙度模型定量計算孔隙度[2]、根據SDR模型[3]和TimCoates模型[4]計算儲層滲透率、采用線性假設方式計算飽和度[5]等方法。雖然在一定條件下上述方法均取得了不錯的預測結果,但它們是基于統(tǒng)計學的思想或通過簡化地質條件建立理論模型來估算儲層孔滲飽參數(shù),未考慮這些參數(shù)與測井數(shù)據之間復雜的非線性關系及空間的連續(xù)性。由于地下地質情況復雜,不同類型的測井參數(shù)響應不同[6],以及地震信息與測井參數(shù)之間存在復雜的非線性關系[7],故難以建立巖心分析數(shù)據與測井響應之間的關系。此外,上述方法受主觀因素的影響較大,故其預測結果的準確性較差。
近年來機器學習在科學和工程領域取得了突破性的進展,很多學者對此進行了深入研究,已將一些常規(guī)的淺層機器學習方法應用于儲層孔滲飽參數(shù)預測,如人工神經網絡(artificial neural network,ANN)[8-10]、支持向量機(support vector machine,SVM)[11-13]等,在一定條件下,這些方法取得了較傳統(tǒng)方法更好的預測效果。但由于這些淺層機器學習方法網絡結構簡單,所以其解決復雜非線性問題的能力有限,泛化能力在一定程度上受到制約[14]。測井曲線與儲層孔滲飽參數(shù)之間大都表現(xiàn)出極其復雜的非線性特征,難以明確其數(shù)學關系,因此將淺層機器學習方法應用于儲層孔滲飽參數(shù)的預測亦具有一定的局限性。
由HINTON等[15]提出的深度學習方法,是當前機器學習領域發(fā)展最活躍的研究方向之一。其網絡結構較淺層的機器學習方法更復雜,具有多個隱藏層,其核心思想就是利用各隱藏層之間的連接來挖掘樣本數(shù)據間的本質關聯(lián)與規(guī)律,使得計算機可以像人一樣具有從大量的信息中不斷地學習、挖掘數(shù)據間存在的本質聯(lián)系和深層次特征,實現(xiàn)解決復雜非線性問題的能力。目前,常見的深度學習方法主要有卷積神經網絡(convolutional neural network,CNN)[16]、循環(huán)神經網絡(recurrent neural network,RNN)[17]、棧式自編碼(stacked auto-encoder,SAE)[18]等,上述方法已成功應用于圖像處理、語音識別等[19]領域。近年來,很多研究者將深度學習方法應用于油氣地震儲層預測[20-24]和儲層物性參數(shù)預測[25-26],與淺層機器學習方法相比,深度學習方法的預測準確率更高。測井曲線和孔滲飽參數(shù)是不同深度地層特征的響應,整體而言具有一定的時序漸變性。采用深度學習方法進行物性參數(shù)預測容易忽略孔滲飽參數(shù)隨儲層深度變化的趨勢及不同地層參數(shù)歷史數(shù)據之間的關聯(lián)性。
循環(huán)神經網絡是一類用于處理序列數(shù)據的神經網絡,其核心是內部設置的自循環(huán)結構。信息在循環(huán)神經網絡中傳遞時,每一次循環(huán)都會重新判斷,以在隱藏層細胞中保留部分有用信息,這些被保留的部分有用信息與新的輸入信息一起傳遞到下一個細胞單元,與之后的輸入信息共同決定輸出結果[27]。相較傳統(tǒng)層間全連接、層內無連接的神經網絡,RNN隱藏層內的細胞單元之間是有連接的,即當前時刻的輸入信息和之前的信息共同作用于下一時刻,這也符合地質學研究思想以及實際地質分析經驗。長短期記憶(long short term memory,LSTM)[28]網絡是對RNN的改進,可有效解決梯度消失及梯度爆炸等問題,使得網絡具有更強的記憶功能,可記憶更長的歷史數(shù)據信息,已有學者將其應用于儲層物性參數(shù)預測[29]和測井曲線合成[30-31]等。LSTM網格存在結構復雜、訓練參數(shù)多、且訓練過程收斂速度較慢等問題。門控循環(huán)單元(gated recurrent unit,GRU)神經網絡[32]是對LSTM網絡的優(yōu)化,與LSTM網絡功能相當,但前者具有更快的收斂速度,該網絡已在電力[33]、交通[34]和金融[35]等領域得到應用,但目前未見應用于儲層孔滲飽參數(shù)預測的相關文獻。
基于此,本文使用GRU神經網絡對儲層孔滲飽參數(shù)進行預測。首先通過基于Copula函數(shù)的相關性分析(correlation analysis,CA)定量計算各測井曲線與孔滲飽參數(shù)之間的非線性相關程度,篩選出與孔滲飽參數(shù)關聯(lián)度較高的測井參數(shù),然后利用GRU神經網絡建立測井數(shù)據與孔滲飽參數(shù)之間的非線性映射關系(以下簡稱CA_GRU)模型,最后將上述流程應用于實際資料測試以證明預測結果的精度和魯棒性。
測井曲線與孔滲飽參數(shù)均反映了不同深度地層的特征,在一定程度上,孔滲飽參數(shù)與測井曲線存在一定的相關性,但測試數(shù)據往往包含從不同角度反映地層不同信息的多種參數(shù)。實際應用中,如果直接利用所有樣本數(shù)據建立測井曲線與孔滲飽參數(shù)之間的映射關系模型,不但增加了模型的復雜度,也可能丟失部分有用信息或加入無用的冗余信息,導致預測的準確性降低。對一些物性參數(shù)進行預測時需要考慮不同測井曲線對物性參數(shù)預測的影響,如通過線性相關性分析選擇測井資料中一部分可靠的、有代表性且對預測參數(shù)敏感的曲線作為輸入進行模型訓練和預測,但目前多采用Pearson線性相關系數(shù)進行相關性計算[23]。Pearson相關系數(shù)只聚焦于線性相關,往往忽略了孔滲飽參數(shù)與測井曲線之間的非線性關系。當測井數(shù)據與預測參數(shù)之間為非線性相關關系時,仍采用線性相關系數(shù)度量其相關關系是不可靠的。而利用Copula函數(shù)來分析測井數(shù)據與預測參數(shù)之間的相關性可在一定程度上減弱這種影響。基于Copula函數(shù)及其推導出的相關性指標,可以準確度量測井曲線與預測物性參數(shù)之間存在的非線性、非對稱性相關關系。因此本文利用基于Copula函數(shù)的Kendall秩相關系數(shù)τ和Spearman秩相關系數(shù)ρ來定量分析測井曲線與孔滲飽參數(shù)之間的相關關系,其中Kendall秩相關系數(shù)τ可用于度量測井參數(shù)與孔滲飽參數(shù)之間的一致性變化程度,Spearman秩相關系數(shù)ρ可用于度量測井曲線與孔滲飽參數(shù)之間的單調相關程度,并與Pearson線性相關系數(shù)的計算結果進行對比。
Copula函數(shù)理論準確描述了非線性和非對稱變量之間的相關性。具體如下:假設1個n元隨機變量分布函數(shù)H的邊緣概率分布函數(shù)分別為F(x1),F(x2),…,F(xn),其中x1,x2,…,xn為n維隨機變量,則存在一個Copula函數(shù)C滿足如下條件:
H(x1,x2,…,xn)=C[F1(x1),F2(x2),…,Fn(xn)]
(1)
其中,N維t-Copula函數(shù)定義為[36]:
(2)
Kendall秩相關系數(shù)τ用于度量x與y的一致性變化程度,假設(x1,y1),(x2,y2)是獨立同分布的向量,x1,x2∈x,y1,y2∈y,則:
τ=P[(x1-x2)(y1-y2)>0]-P[(x1-x2)(y1-y2)<0]
(3)
式中:P表示概率分布函數(shù)。對上式進行推導后可以得到:
τ=2P[(x1-x2)(y1-y2)>0]-1τ∈[-1,1]
(4)
假設(x1,y1)對應的Copula函數(shù)是C1(u,v),則可由相應的Copula函數(shù)得出Kendall秩相關系數(shù)τ:
(5)
對于Spearman秩相關系數(shù)ρ,假設(x,y)的聯(lián)合分布函數(shù)為H(x,y),x和y對應的邊緣分布函數(shù)分別是F(x)和G(y),若H(x,y)=F(x)G(y),則隨機變量x,y相互獨立。若x0∈x,y0∈y則x0,y0相互獨立。若(x,y)與(x0,y0)也獨立,則:
ρ=3{P[(x-x0)(y-y0)>0]-P[(x-x0)(y-y0)<0]}
(6)
假設(x,y)的Copula函數(shù)為C(u,v),其中u=F(x),v=G(y),則同樣可由相應的Copula函數(shù)得出Spearman秩相關系數(shù)ρ:
(7)
RNN是一類專門用于處理序列數(shù)據的神經網絡。在不同的時間步長上,RNN循環(huán)地共享權重,并進行跨越時間步長的連接。只含有一個隱藏層的RNN結構如圖1所示,與多層感知器相比,RNN的隱藏層不僅與輸出層連接,而且其隱藏層節(jié)點之間自連接,即隱藏層的輸出不僅會傳輸給輸出層,而且還會傳輸給隱藏層自身,這使得RNN不僅在很大程度上減少了參數(shù)量,而且也對不同時刻的序列數(shù)據建立了非線性關系。在處理非線性和時間序列問題上RNN具有獨特的優(yōu)勢。
圖1 只含有1個隱藏層的RNN結構
LSTM網絡是對RNN的重要改進,可有效解決RNN中易出現(xiàn)的梯度消失及梯度爆炸問題,使網絡具有更強的記憶功能。此外,LSTM網絡還可以記憶更長的歷史數(shù)據信息。LSTM網絡不但具有外部的RNN循環(huán)結構,而且還具有內部的“LSTM細胞”循環(huán)(自環(huán)),因此LSTM不是簡單地向輸入和循環(huán)單元的仿射變換之后施加一個逐元素的非線性。與普通的循環(huán)網絡類似,每個單元不但有相同的輸入和輸出結構,而且有更多的參數(shù)和控制信息流動的門控單元系統(tǒng),LSTM隱藏層結構如圖2所示,圖中ct-1為前一序列隱藏層節(jié)點狀態(tài);ht-1為前一序列隱藏層節(jié)點輸出;xt為當前序列隱藏層節(jié)點輸入;ct為當前序列隱藏層節(jié)點狀態(tài);ht為當前序列隱藏層節(jié)點輸出;σ表示sigmoid非線性激活函數(shù);tanh表示雙曲正切函數(shù)。
圖2 LSTM隱藏層結構
相較RNN,LSTM網絡更擅長學習序列數(shù)據之間的長期依賴關系,但LSTM網絡結構復雜、參數(shù)多、收斂速度慢。
圖3 GRU神經網絡的門控循環(huán)單元結構
重置門rt和更新門zt在t時刻的狀態(tài)定義為:
rt=σ(Wrxt+Urht-1)
(8)
zt=σ(Wzxt+Uzht-1)
(9)
(10)
(11)
式中:*表示點乘。
(8)式和(11)式中兩種不同的激活函數(shù)可分別定義為:
(12)
(13)
儲層孔滲飽參數(shù)預測中,測井曲線由淺到深反映了不同地質時期的地層特征,其變化趨勢包含了預測物性參數(shù)的重要信息。利用傳統(tǒng)的統(tǒng)計分析和常規(guī)的機器學習方法預測孔滲飽參數(shù),易破壞測井參數(shù)歷史序列中潛在的內部聯(lián)系,降低預測結果的精確度。GRU神經網絡具有長期記憶功能,能處理序列數(shù)據間的長期依賴關系,可有效降低此類關系的影響,其內部的門控機制還可自動地學習序列特征。圖4 為本文構建的3層GRU神經網絡模型結構。
從圖4可以看出,GRU神經網絡模型結構包括輸入層、隱藏層和輸出層,其中隱藏層是網絡結構的核心部分。訓練過程中需要對GRU神經網絡模型結構的超參數(shù),包括隱藏層層數(shù)、隱藏層神經元個數(shù)等主要結構超參數(shù)進行優(yōu)化調整,理論上隱藏層層數(shù)和神經元個數(shù)越多越好,網絡越深越復雜獲得的預測精度越高。但實際應用中,隱藏層層數(shù)和神經元個數(shù)選擇過多會導致訓練困難,易造成過擬合,進而降低預測精度;網絡太淺太簡單又易造成欠擬合,達不到預期要求。所以隱藏層層數(shù)和神經元個數(shù)的選取對網絡預測性能至關重要,我們需要平衡網絡的學習能力與訓練的復雜程度以及對預測精度的要求,根據經驗和多次實驗結果確定二者的最佳值。此外,對于學習率、批量大小、最大迭代次數(shù)等訓練超參數(shù),選取合適的參數(shù)值可在一定程度上降低模型的復雜度,提高模型的收斂速度與預測精度。
圖4 3層GRU神經網絡模型結構
GRU神經網絡的訓練過程大致分為如下3個步驟:1)將訓練數(shù)據輸入網絡,沿著前向傳播方向從淺層到深層順序計算GRU神經網絡單元的輸出,得到當前時間點輸入數(shù)據對應的預測輸出值;2)沿著反向傳播方向計算每個神經元細胞的誤差,GRU神經網絡誤差的反向傳播包括沿時間順序傳播和在網絡層級之間逐層向上一級傳播;3)根據反向傳播計算得到的誤差計算每個權重的梯度,采用學習率自適應優(yōu)化算法(Adam算法)計算得到權重梯度調整網絡參數(shù)。重復以上步驟進行循環(huán)迭代,不斷優(yōu)化網絡。
基于CA_GRU的組合預測模型的建模流程如圖5所示,主要包括以下6個步驟。
圖5 基于CA_GRU的組合預測模型的建模流程
1) 根據已獲得的測井曲線和孔滲飽參數(shù),利用基于Copula函數(shù)的Kendall秩相關系數(shù)τ和Spearman秩相關系數(shù)ρ以及Pearson線性相關系數(shù)P定量計算并分析兩兩之間的相關程度,優(yōu)選出對預測參數(shù)敏感的測井曲線,構成新樣本數(shù)據。
2) 對新樣本數(shù)據進行標準化處理,并且按照一定的比例劃分訓練集和測試集。
3) 分別對孔滲飽參數(shù)構建GRU神經網絡模型,初始化網絡參數(shù),并根據試驗確定網絡層數(shù)、隱藏層神經元個數(shù)等超參數(shù)。
4) 利用劃分出的訓練集對已初始化且初步確定網絡參數(shù)的GRU神經網絡模型進行迭代訓練,在訓練過程中不斷優(yōu)化網絡結構,直至模型訓練誤差達到事先設定的目標,然后保存模型。
5) 利用劃分出的測試集對已訓練好的GRU神經網絡模型展開測試,將得到的模型預測值進行反標準化處理,得到與實際值相對應的物性參數(shù)預測值。
6) 對比分析預測值與實際值,開展誤差分析,根據相應的評價指標評價模型預測性能優(yōu)劣。
本文實驗數(shù)據來自于四川盆地某探區(qū)的實際測井數(shù)據,共8482組測井數(shù)據樣本,包括自然伽馬(GR)、補償中子(CNL)、聲波時差(AC)、密度(DEN)、井徑(CAL)、井斜(DEV)、泥質含量(SH)、地層真電阻率(RT)、沖洗帶地層電阻率(RXO)以及相對應的孔隙度(POR)、滲透率(PERM)、飽和度(SW)數(shù)據。本文選擇測深為5230~5430m的1580組測井數(shù)據作為GRU神經網絡模型的測試數(shù)據集,用以測試模型預測性能,剩下的數(shù)據作為訓練數(shù)據集訓練模型。
分別采用基于Copula函數(shù)的Kendall秩相關系數(shù)τ和Spearman秩相關系數(shù)ρ以及Pearson線性相關系數(shù)P定量計算測井數(shù)據與孔滲飽參數(shù)之間的相關關系,3種相關系數(shù)絕對值的變化趨勢如圖6所示。
圖6 測井數(shù)據與孔滲飽參數(shù)之間的相關關系
從圖6可以看出,Pearson相關性分析時常會忽略變量之間的非線性相關關系。如在測井數(shù)據與滲透率相關關系計算中,自然伽馬、補償中子和泥質含量與滲透率的線性相關系數(shù)較低,但采用基于Copula函數(shù)的相關性測度法得到的τ和ρ較高,這說明自然伽馬、補償中子與滲透率的線性相關程度較低,但非線性相關程度較高,兩者之間存在非線性相關關系,這與實際地質分析經驗相符。因此本文選擇自然伽馬、補償中子、泥質含量3種測井參數(shù)預測滲透率。
在測井數(shù)據與孔隙度相關關系計算中,密度、泥質含量與孔隙度的相關系數(shù)均較高,說明密度、泥質含量與孔隙度之間存在強相關關系。自然伽馬與孔隙度的P值較低,但采用基于Copula函數(shù)的相關性測度法得到τ和ρ則較高,這說明自然伽馬與孔隙度的線性相關程度較低,但非線性相關程度較高,兩者之間存在強非線性相關關系。因此本文選擇密度、泥質含量和自然伽馬3種測井參數(shù)預測孔隙度。
從飽和度與測井數(shù)據之間3種相關系數(shù)的對比可以看出,自然伽馬、補償中子、聲波時差、泥質含量與飽和度之間的P、τ和ρ均較高,說明飽和度與自然伽馬、補償中子、聲波時差、泥質含量之間存在強相關性。因此本文選擇自然伽馬、補償中子、聲波時差、泥質含量4種測井參數(shù)預測飽和度。
為減小因輸入數(shù)據數(shù)量級差別較大引起的預測誤差,本文采用z-score標準化方法對輸入數(shù)據進行標準化處理,以確保輸入數(shù)據處于合理的分布范圍,標準化處理的表達式為:
(14)
本文采用學習率自適應的優(yōu)化算法Adam算法進行網絡優(yōu)化調整,Adam算法融合了RMSProp算法和AdaGrad算法的優(yōu)勢,可為不同參數(shù)設計獨立的自適應學習率。GRU神經網絡模型參數(shù)設置如下:首先根據經驗進行多次試驗,初步確定學習率(learning rate)=0.005,批量大小(batch size)=10,時間步長(time step)=50,參照以往經驗,隱藏層神經元個數(shù)一般設置為2n,n的取值范圍為[2,8]。本文以滲透率為預測對象進行對比試驗以確定網絡隱藏層層數(shù)和神經元個數(shù),試驗結果如圖7所示。圖中橫坐標為網絡隱藏層層數(shù),縱坐標為滲透率的均方根誤差,不同顏色的線表示不同的隱藏層神經元個數(shù)對應的滲透率均方根誤差。從圖7可以看出,網絡隱藏層層數(shù)和神經元個數(shù)過多或過少均會導致預測結果的均方根誤差劇烈變化,造成預測準確性降低,當網絡隱藏層層數(shù)為3層,隱藏層神經元個數(shù)為16時,預測結果的均方根誤差最小,預測精度最高,因此確定隱藏層為3層,神經元個數(shù)為16個。
圖7 滲透率對比實驗結果
本文采用均方根誤差(root mean squared error,RMSE)和Pearson相關系數(shù)(P)作為評價模型預測效果的指標。其中RMSE反映目標參數(shù)與預測參數(shù)之間存在的偏差,Pearson相關系數(shù)P用于衡量預測值與實際值之間的相關程度。RMSE與P的計算公式分別如下:
(15)
(16)
式中:Y表示預測值;Q表示實際值;N表示樣本數(shù)量;D表示方差;Cov(Y,Q)為協(xié)方差函數(shù),表示Y與Q相互關系的特征。RMSE值越小,表示模型對測井曲線的預測結果越精確;P值越大,表示預測值與實測值的相關性越強,更能體現(xiàn)實際參數(shù)的變化趨勢。
4.6.1 滲透率預測結果分析
根據相關性分析結果,綜合考慮強相關因素對預測結果的影響,本文選取對滲透率敏感的自然伽馬、補償中子、泥質含量3種測井參數(shù)作為模型的輸入,對滲透率進行訓練預測。利用4種模型(包括多元線性回歸(multiple linear regression,MLR)模型)預測的滲透率均方根誤差和Pearson相關系數(shù)見表1。為了便于顯示,選取測深5395~5425m的預測數(shù)據作為分析對象,4種模型對滲透率的預測結果如圖8所示。
圖8 利用4種模型預測的滲透率和滲透率真實值(1mD≈0.987×10-3μm2)
表1 4種模型的滲透率預測性能
由表1可以看出,相較于GRU、RNN和MLR模型,利用CA_GRU模型預測的滲透率均方根誤差最低,為0.0826,Pearson相關系數(shù)最高,為0.9028,說明利用CA_GRU模型得到的滲透率準確度及模型性能均為最高。相較于GRU模型,利用CA_GRU模型展開訓練和預測時,其運行時間更短。利用滲透率預測評價模型的優(yōu)劣,需要同時考慮模型預測的準確度和模型預測的效率,利用CA_GRU模型得到的結果不僅預測準確度高,而且因輸入冗余信息少故預測效率高。因此利用CA_GRU模型進行滲透率預測具有一定的優(yōu)勢。
從圖8可以看出,利用CA_GRU、GRU、RNN模型得到的預測滲透率均優(yōu)于MLR模型的預測結果,表明了利用循環(huán)神經網絡進行滲透率預測的有效性和實用性,其中利用CA_GRU、GRU模型得到的預測結果又優(yōu)于利用RNN模型得到的結果,說明具有長短期記憶功能的門控循環(huán)單元神經網絡在處理非線性和時序性預測問題中具有獨特的優(yōu)勢。CA_GRU模型的預測值與真實值一致性最好,整體趨勢與真實值基本一致,利用MLR模型得到的預測結果最差,基本偏離了真實值。利用GRU和RNN模型均可對滲透率的變化趨勢進行較準確的預測,但在預測滲透率發(fā)生突變的峰谷值時,GRU、RNN模型均不能準確預測滲透率的變化趨勢,即未能準確分析滲透率的波動規(guī)律,導致模型預測的準確性下降。對比可知,CA_GRU模型能較好地學習測井數(shù)據和滲透率的變化趨勢,面對滲透率變化不確定性較大的峰谷值時,該模型可準確地學習該層段輸入特征對預測滲透率的影響,以保證預測的準確度。
4.6.2 孔隙度預測結果分析
根據相關性分析結果,本文選取與孔隙度相關性較強的密度、泥質含量和自然伽馬3種測井參數(shù)作為孔隙度預測模型的輸入。分別利用4種模型預測孔隙度的均方根誤差和Pearson相關系數(shù),結果如表2所示。選取測深為5395~5425m的預測數(shù)據作為分析對象,利用4種模型對孔隙度進行預測,結果如圖9所示。由表2可知利用CA_GRU模型預測的孔隙度均方根誤差最小,為0.6787,Pearson相關系數(shù)最高,為0.9126。相較于其它模型,利用CA_GRU模型得到的預測結果在均方根誤差、Pearson相關系數(shù)兩項指標上均出現(xiàn)了明顯提升,預測的準確性更高,運行時間在一定程度上得到縮短,這也證明了利用CA_GRU模型預測孔隙度的魯棒性和適應性。
表2 4種模型的孔隙度預測性能
由圖9可看出,利用CA_GRU模型得到的預測孔隙度與真實值整體一致性最好,GRU模型的擬合效果次之,MLR模型的整體預測效果最不理想。對于預測孔隙度發(fā)生階躍變化的波峰及波谷值,利用CA_GRU模型進行預測,不僅能夠更準確捕捉孔隙度隨測井數(shù)據變化的規(guī)律,而且也能較準確地預測孔隙度的整體變化趨勢,提高模型的預測準確度。這也說明考慮強相關影響因素有助于提高孔隙度預測精度。
圖9 利用4種模型預測的孔隙度和孔隙度真實值
4.6.3 飽和度預測結果分析
綜合對比分析后,選擇τ、ρ和P三者均較高的自然伽馬、補償中子、聲波時差、泥質含量4種測井數(shù)據作為輸入預測飽和度參數(shù)。4種模型預測的飽和度參數(shù)均方根誤差和Pearson相關系數(shù)見表3。選取測深為5230~5260m的預測數(shù)據作為研究對象,分析比較4種預測模型的預測效果,結果如圖10所示。
表3 4種模型的飽和度預測性能
由表3可看出,CA_GRU、GRU、RNN模型在預測值與實際值的偏差及相關性上表現(xiàn)均優(yōu)于MLR模型,說明循環(huán)神經網絡具有良好的測井數(shù)據特征參數(shù)提取能力。利用CA_GRU模型得到的均方根誤差和Pearson相關系數(shù)均為最優(yōu),數(shù)值分別為5.2421和0.9206,并且其計算效率相較于其它模型有所提高。
從圖10可以看出,在飽和度出現(xiàn)峰值的深度層段,4種模型對峰值段飽和度普遍存在預測缺失。對比幾種模型的預測結果不難看出,CA_GRU模型的預測準確度更高,穩(wěn)定性更強,在峰值處最為明顯,說明為減少冗余信息進行相關性分析并對原始數(shù)據降維處理,對模型預測精度的提高有明顯的作用。這表明利用基于Copula函數(shù)的相關性測度法定量計算預測參數(shù)與測井曲線之間的相關關系,可優(yōu)選出對預測參數(shù)更關鍵、更有用的數(shù)據信息。
圖10 利用4種模型預測的飽和度和飽和度真實值
本文介紹了基于門控循環(huán)單元神經網絡的儲層孔滲飽參數(shù)預測方法。該方法采用基于Copula函數(shù)的相關性分析方法篩選出敏感的測井參數(shù),而后利用GRU神經網絡構建預測模型。該方法不僅考慮了強相關樣本數(shù)據對物性參數(shù)預測的影響,還同時兼顧了物性參數(shù)與測井曲線之間的非線性映射關系以及測井信息隨深度的變化趨勢和前后關聯(lián)。采用基于Copula函數(shù)的相關性測度法可優(yōu)選出對物性參數(shù)敏感的測井曲線,實現(xiàn)模型輸入的降維,消除變量之間的冗余性,有利于提升模型的整體預測性能。實驗結果表明門控循環(huán)單元神經網絡模型擁有較強的特征提取能力,可以從測井數(shù)據中提取有效反映物性參數(shù)的深層特征,相較多元線性回歸分析等模型其能夠對孔滲飽參數(shù)進行更為準確的預測,具有較高的精度和魯棒性,并具有良好的抗干擾能力,為測井資料的精準解釋提供了新的思路。
雖然利用本文方法預測儲層孔滲飽參數(shù)取得了一定的效果,但預測的孔滲飽參數(shù)不可能完全符合地層的真實情況,預測值與真實值之間亦存在一定偏差。本文采用的深度學習模型較為單一,模型改進以及多模型混合運用能否進一步提升模型預測效果有待進一步研究。