樊冬艷 楊燦 孫海 姚軍 張磊 付帥師 羅飛
摘要:頁(yè)巖氣井單變量產(chǎn)量預(yù)測(cè)存在較強(qiáng)的不確定性,而現(xiàn)場(chǎng)生產(chǎn)動(dòng)態(tài)數(shù)據(jù)同時(shí)包括多個(gè)相關(guān)指標(biāo),針對(duì)如何選取合理的多變量數(shù)據(jù)對(duì)頁(yè)巖氣井產(chǎn)量進(jìn)行預(yù)測(cè),在保證計(jì)算效率的情況下提高預(yù)測(cè)精度。頁(yè)巖氣井的生產(chǎn)動(dòng)態(tài)數(shù)據(jù)集包括日產(chǎn)氣量、日產(chǎn)水量、套壓、油壓、油嘴直徑、開(kāi)井時(shí)間和溫度等,采用歐式距離和動(dòng)態(tài)時(shí)間彎曲距離對(duì)生產(chǎn)動(dòng)態(tài)數(shù)據(jù)時(shí)間序列進(jìn)行相似性度量,依據(jù)與日產(chǎn)氣量的相關(guān)度,把數(shù)據(jù)分為強(qiáng)相關(guān)時(shí)間序列和弱相關(guān)時(shí)間序列;其次,基于卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶網(wǎng)絡(luò)和門(mén)控神經(jīng)網(wǎng)絡(luò)分別對(duì)全時(shí)間序列、強(qiáng)相關(guān)序列、弱相關(guān)序列和單變量序列進(jìn)行頁(yè)巖氣井產(chǎn)量預(yù)測(cè);最后,以平均絕對(duì)誤差、均方根誤差和決定系數(shù)作為評(píng)價(jià)指標(biāo),得到不同序列的誤差由小到大排序?yàn)閺?qiáng)相關(guān)序列、全時(shí)間序列、弱相關(guān)序列、單變量序列,優(yōu)選的機(jī)器學(xué)習(xí)方法為門(mén)控神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)。結(jié)果表明,采用機(jī)器學(xué)習(xí)方法結(jié)合頁(yè)巖氣井強(qiáng)相關(guān)性序列(日產(chǎn)氣量、套壓、油壓、日產(chǎn)水量)能有效降低預(yù)測(cè)誤差,提高頁(yè)巖氣井產(chǎn)量預(yù)測(cè)效果。
關(guān)鍵詞:頁(yè)巖氣井; 機(jī)器學(xué)習(xí); 相似性; 時(shí)間序列; 產(chǎn)量預(yù)測(cè)
中圖分類(lèi)號(hào):TE 312?? 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1673-5005(2024)03-0119-08?? doi:10.3969/j.issn.1673-5005.2024.03.013
Shale gas well production forecasting based on time sequence similarity and machine learning methods
FAN Dongyan1,2, YANG Can1, SUN Hai1,2, YAO Jun1,2, ZHANG Lei1,2, FU Shuaishi1,2, LUO Fei1
(1.State Key Laboratory of Deep Oil and Gas, China University of Petroleum(East China), Qingdao 266580, China;2.School of Petroleum Engineering in China University of Petroleum(East China), Qingdao 266580, China)
Abstract: Production data from shale gas wells contains multiple different dynamic variables during on-site collection, and there is uncertainty for production forecasting if only a single variable is used. It is important to choose reasonable multi-variable data to predict the output of shale gas wells, and ensure the precision accuracy and computing efficiency. In this study, a new method was proposed. Firstly, a dynamic data set can be comprehensively collected, including daily gas rate, water rate, well pressure, oil choke size, well opening time and fluid temperature. Euclidean distance and dynamic time warping were used to perform similarity testing of the production dynamic data time sequences. Based on the correlation with daily gas rate, the production data were divided into strong related time series and weak related time sequences. Secondly, based on convolutional neural network, recurrent neural network, long and short-term memory network (LSTM)and gate recurrent units (GRU), the shale gas well production was predicted for full-time sequences, strong related sequences, weak related sequences and univariate sequences, respectively. Evaluation indicators were used to verify the methods, including average absolute error, root mean squared error and decision coefficient. The results indicate that the order of error from small to large for different sequences is the strong related sequence, the full time sequence, the weak related sequence, the univariate sequence. The preferred machine learning methods are the GRU and LSTM models. The strong correlation sequence can be used to improve the accuracy and reduce errors in shale gas well forecasting.
Keywords: shale gas well; machine learning; similarity; time series; productivity prediction
產(chǎn)量的準(zhǔn)確預(yù)測(cè)在油氣井高效開(kāi)發(fā)和開(kāi)采過(guò)程中至關(guān)重要,涉及整個(gè)生產(chǎn)開(kāi)發(fā)歷程,包括早期資源評(píng)價(jià)、中期技術(shù)調(diào)整以及后期提高采收率措施[1]。目前產(chǎn)量預(yù)測(cè)方法主要包括解析方法[2-3]、數(shù)值計(jì)算方法[4-5]、經(jīng)驗(yàn)遞減方法[6-7]和機(jī)器學(xué)習(xí)方法4類(lèi)[8-9]。近年來(lái),隨著人工智能方法快速發(fā)展,以及油田現(xiàn)場(chǎng)大數(shù)據(jù)收集技術(shù)的提升,為機(jī)器學(xué)習(xí)在油田現(xiàn)場(chǎng)的產(chǎn)量預(yù)測(cè)提供了重要基礎(chǔ),機(jī)器學(xué)習(xí)方法的油氣井產(chǎn)量預(yù)測(cè)也受到了越來(lái)越多的學(xué)者關(guān)注。吳新根等[10]在1994年首次利用ANN進(jìn)行油田產(chǎn)量預(yù)測(cè),證明了機(jī)器學(xué)習(xí)方法在油田產(chǎn)量預(yù)測(cè)領(lǐng)域的可行性。近年來(lái),大量學(xué)者采用不同的機(jī)器學(xué)習(xí)方法對(duì)油氣井產(chǎn)量進(jìn)行預(yù)測(cè),以及方法之間的對(duì)比優(yōu)選[11-15]。為了提高預(yù)測(cè)模型的精度及穩(wěn)定性,一方面采用機(jī)器學(xué)習(xí)方法與其他方法進(jìn)行耦合,例如將遺傳算法(GA)[12]、粒子群算法(PSO)[13]和帝國(guó)競(jìng)爭(zhēng)算法(ICA)[15]與機(jī)器學(xué)習(xí)方法相結(jié)合,以優(yōu)化神經(jīng)網(wǎng)絡(luò)模型的超參數(shù)提高模型的準(zhǔn)確性;另一方面采用多變量輸入增加數(shù)據(jù)本身的信息量,例如Hamzeh等[16]將日產(chǎn)氣量、油壓和溫度作為輸入變量,基于循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)多變量氣井產(chǎn)量進(jìn)行預(yù)測(cè)。以及以上兩種方法的結(jié)合,如Fan等[17]將ARIMA與長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)方法相結(jié)合,考慮人工操作的情況下對(duì)頁(yè)巖氣井的產(chǎn)量進(jìn)行預(yù)測(cè)。Cuthbert等[18]將PSO與支持向量機(jī)(SVR)、反饋神經(jīng)網(wǎng)絡(luò)(FNN)以及循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),采用多變量輸入對(duì)油井產(chǎn)量進(jìn)行預(yù)測(cè)。為了進(jìn)一步挖掘輸入數(shù)據(jù)與目標(biāo)值的相關(guān)關(guān)系,在初期產(chǎn)量預(yù)測(cè)中進(jìn)行主控因素排序及主成分分析[19-20]。劉合等[21]基于多變量時(shí)間序列模型對(duì)高含水油藏產(chǎn)量預(yù)測(cè)進(jìn)行了研究,筆者基于收集的現(xiàn)場(chǎng)多維生產(chǎn)動(dòng)態(tài)數(shù)據(jù),應(yīng)用時(shí)間序列相似性分析方法,將輸入數(shù)據(jù)分為強(qiáng)相關(guān)和弱相關(guān)序列,采用不同的機(jī)器學(xué)習(xí)方法對(duì)頁(yè)巖氣井產(chǎn)量進(jìn)行預(yù)測(cè),建立一種基于時(shí)間序列相似性與機(jī)器學(xué)習(xí)方法相結(jié)合的產(chǎn)能預(yù)測(cè)方法,為現(xiàn)場(chǎng)頁(yè)巖氣井的高效開(kāi)發(fā)提供指導(dǎo)。
1 頁(yè)巖氣井多時(shí)間序列的相似性分析
針對(duì)頁(yè)巖氣井生產(chǎn)動(dòng)態(tài)多維數(shù)據(jù)之間存在內(nèi)部相關(guān)的特點(diǎn),采用歐式距離和動(dòng)態(tài)時(shí)間彎曲距離,對(duì)不同的生產(chǎn)時(shí)間序列與日產(chǎn)氣量進(jìn)行相似性度量,依據(jù)相似度把不同生產(chǎn)動(dòng)態(tài)數(shù)據(jù)分為強(qiáng)相關(guān)時(shí)間序列和弱相關(guān)時(shí)間序列,為下一步基于機(jī)器學(xué)習(xí)方法對(duì)頁(yè)巖氣產(chǎn)量預(yù)測(cè)提供多變量數(shù)據(jù)集。
1.1 頁(yè)巖氣井時(shí)間序列特點(diǎn)
選取頁(yè)巖氣井X1井生產(chǎn)動(dòng)態(tài)數(shù)據(jù)進(jìn)行分析,包括日產(chǎn)氣量、日產(chǎn)水量、套壓、油壓、油嘴直徑、開(kāi)井時(shí)間和溫度,繪制成動(dòng)態(tài)曲線,如圖1所示。X1井的生產(chǎn)時(shí)間為691 d,從曲線形態(tài)可見(jiàn),部分曲線之間存在較明顯的相關(guān)關(guān)系,氣井產(chǎn)量發(fā)生波動(dòng)時(shí),部分曲線也出現(xiàn)了不同程度的數(shù)值變化,例如在400~500 d,頁(yè)巖氣井出現(xiàn)了較長(zhǎng)時(shí)間關(guān)井操作,產(chǎn)氣產(chǎn)水量為0,套壓、油壓出現(xiàn)不同程度的壓力恢復(fù),而溫度、開(kāi)井時(shí)間和油嘴直徑變化不明顯,因此有必要對(duì)生產(chǎn)動(dòng)態(tài)數(shù)據(jù)集進(jìn)行相關(guān)性分析,為下一步多變量產(chǎn)量預(yù)測(cè)的變量選擇提供有力支撐。
1.2 時(shí)間序列相似性分析方法
相似性度量作為時(shí)間序列間相互依賴關(guān)系的重要衡量指標(biāo),若兩個(gè)序列的距離函數(shù)值小于規(guī)定的誤差閾值,則判定兩個(gè)序列相似,同時(shí)距離函數(shù)計(jì)算結(jié)果越小,則相似度越高。在頁(yè)巖氣井生產(chǎn)時(shí)間序列相似性分析中,分別選取鎖步度量[22]的歐式距離法[23]對(duì)時(shí)間序列進(jìn)行一對(duì)一的比較;同時(shí)選取彈性度量[24]的動(dòng)態(tài)時(shí)間規(guī)整方法[25],允許時(shí)間序列一對(duì)多的進(jìn)行比較。
1.2.1 歐式距離
歐式距離(euclidean distance, ED)[23]可度量維數(shù)相等的時(shí)間序列相似性,將節(jié)點(diǎn)為n的時(shí)間序列視為n維向量,例如目標(biāo)序列P=(p1,p2,…,pn)與比較序列Q=(q1,q2,…,qn)的維度(長(zhǎng)度)相等,對(duì)歐式距離dED進(jìn)行計(jì)算為
dED=∑ni=1(pi-qi)2.(1)
式中,pi為目標(biāo)序列中的第i個(gè)值;qi為比較序列中的第i個(gè)值。
對(duì)于任意兩個(gè)時(shí)間序列,規(guī)定相似度為ε,若序列P和Q有D(P,Q)≤ε,則兩個(gè)時(shí)間序列相似,如圖2所示。
歐式距離是一種簡(jiǎn)單的距離計(jì)算方法,易于理解、計(jì)算量小且效率高,能較好地反映兩個(gè)序列的相似關(guān)系,是普遍首選的相似性度量方法。但需要保證相似性度量的兩個(gè)序列長(zhǎng)度一致,靈活度不高,不具有在時(shí)間軸上彎曲伸縮的能力,因此難以捕捉時(shí)間序列的變形特征,所以需要結(jié)合動(dòng)態(tài)時(shí)間彎曲距離方法。
1.2.2 動(dòng)態(tài)時(shí)間彎曲距離
動(dòng)態(tài)時(shí)間規(guī)整[25]方法允許序列在時(shí)間軸方向彎曲,使不等長(zhǎng)的時(shí)間序列在彎曲時(shí)能夠通過(guò)相似波形進(jìn)行最優(yōu)相似匹配的度量方法。動(dòng)態(tài)時(shí)間彎曲(dynamic time warping, DTW) 距離在兩個(gè)時(shí)間序列之間進(jìn)行匹配(圖3),避免了時(shí)間不同步問(wèn)題。若給定兩個(gè)時(shí)間序列P=(p1,p2,…,pm)和Q=(q1,q2,…,qn),其長(zhǎng)度分別為m和n(m≥n),則兩個(gè)序列的動(dòng)態(tài)時(shí)間彎曲距離可以表示為
D(P,Q)=minp∑mk-1d(pk).(2)
式中,d(pk)為點(diǎn)pk與某個(gè)點(diǎn)q的距離。為了得到動(dòng)態(tài)時(shí)間彎曲距離,通過(guò)構(gòu)造網(wǎng)格矩陣(圖4),查找一條最佳規(guī)整路徑,使其經(jīng)過(guò)的距離累積最小。
該方法不要求兩個(gè)序列的長(zhǎng)度相等,可以很好地捕捉時(shí)間序列在計(jì)算過(guò)程中產(chǎn)生的伸縮、變形等問(wèn)題,相對(duì)于歐式距離其距離衡量更精確,同時(shí)計(jì)算量也較大,耗時(shí)較長(zhǎng),且對(duì)噪聲非常敏感。綜上所述,為了達(dá)到相似性分析更準(zhǔn)確及驗(yàn)證對(duì)比的目的,同時(shí)選用歐式距離和時(shí)間動(dòng)態(tài)彎曲距離對(duì)頁(yè)巖氣井多維動(dòng)態(tài)數(shù)據(jù)進(jìn)行相似性度量。
1.3 多時(shí)間序列相似性分析
對(duì)頁(yè)巖氣井的動(dòng)態(tài)生產(chǎn)數(shù)據(jù)集進(jìn)行預(yù)處理,主要包括異常值檢測(cè)、缺失值處理和數(shù)據(jù)的歸一化。由于數(shù)據(jù)集中不同變量的量級(jí)差別較大,為提高序列相似性計(jì)算的準(zhǔn)確性,采用極差法對(duì)數(shù)據(jù)進(jìn)行歸一化處理,
si(k)=xi(k)-min xi(k)max xi(k)-min xi(k), k=1,2,…,n.(3)
式中,xi(k)和si(k)分別為第k時(shí)刻歸一化前和歸一化后時(shí)間序列對(duì)應(yīng)值。
其次確定目標(biāo)序列和比較序列,目標(biāo)序列為氣井日產(chǎn)氣量,比較序列包括日產(chǎn)水量、開(kāi)井時(shí)間、油嘴直徑、套壓、油壓和溫度。分別采用歐式距離和動(dòng)態(tài)時(shí)間彎曲距離計(jì)算不同比較序列與目標(biāo)序列的相似性度量值,如表1所示。
由表1可得:頁(yè)巖氣X1井的歐式距離和動(dòng)態(tài)時(shí)間彎曲距離由小到大排序都為日產(chǎn)水量、套壓、油壓、溫度、油嘴直徑、開(kāi)井時(shí)間,說(shuō)明不同度量方法計(jì)算相似度的正確性。結(jié)果表明:日產(chǎn)水量、套壓、油壓與日產(chǎn)氣量的相似距離較小,而溫度、油嘴直徑和開(kāi)井時(shí)間相對(duì)而言,與氣井日產(chǎn)氣量的相似距離較大,其中日產(chǎn)水量和套壓與氣井產(chǎn)量相似度距離最小,相關(guān)關(guān)系最強(qiáng)。為了對(duì)比不同相關(guān)序列對(duì)氣井產(chǎn)量預(yù)測(cè)的影響,本文中把比較序列與目標(biāo)序列組合分為3類(lèi)進(jìn)行對(duì)比分析:①全時(shí)間序列,日產(chǎn)氣量、套壓、油壓、日產(chǎn)水量、油嘴直徑、開(kāi)井時(shí)間、溫度;②強(qiáng)相關(guān)時(shí)間序列,日產(chǎn)氣量、套壓、油壓、日產(chǎn)水量;③弱相關(guān)時(shí)間序列,日產(chǎn)氣量、油嘴直徑、開(kāi)井時(shí)間、溫度。
2 基于相似性分析機(jī)器學(xué)習(xí)方法的產(chǎn)量預(yù)測(cè)
為了對(duì)比以上3類(lèi)不同時(shí)間序列組合對(duì)頁(yè)巖氣井產(chǎn)量預(yù)測(cè)的影響,采用機(jī)器學(xué)習(xí)方法對(duì)多變量輸入序列進(jìn)行產(chǎn)量預(yù)測(cè),運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)[26](CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)[27](RNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)[28](LSTM)和門(mén)控神經(jīng)網(wǎng)絡(luò)[29](GRU)4種常用的時(shí)間序列預(yù)測(cè)方法,構(gòu)建相應(yīng)的頁(yè)巖氣井產(chǎn)量預(yù)測(cè)模型,評(píng)價(jià)指標(biāo)包括平均絕對(duì)誤差(δr)、均方根誤差(δRMSE)和決定系數(shù)(R2)。
2.1 輸入序列構(gòu)成及標(biāo)準(zhǔn)化處理
對(duì)3類(lèi)不同相關(guān)序列數(shù)據(jù)(全時(shí)間序列、強(qiáng)相關(guān)時(shí)間序列和弱相關(guān)時(shí)間序列)進(jìn)行整理,補(bǔ)充完善缺失數(shù)據(jù),數(shù)據(jù)集的前90%作為訓(xùn)練集,后10%作為測(cè)試集,其中每個(gè)訓(xùn)練和測(cè)試單元為一個(gè)短的時(shí)間序列包括前n個(gè)時(shí)間步的輸入信息和輸出信息,在此采用滑動(dòng)窗口的方式對(duì)n值進(jìn)行選取,如圖5所示,取n值為3[30],即選用前面的3個(gè)時(shí)間步長(zhǎng)預(yù)測(cè)下一個(gè)時(shí)間步長(zhǎng),即
xt,pre=f(xt-1,xt-2,xt-3).(4)
式中,xt,pre 為t時(shí)刻時(shí)間序列預(yù)測(cè)值;xt-1、xt-2、xt-3為前3步相關(guān)的輸入值。
為了更好地?cái)M合并防止機(jī)器學(xué)習(xí)過(guò)程的訓(xùn)練發(fā)散問(wèn)題,需要對(duì)輸入的不同序列集數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化公式為
Xt,N=xt-δstd(x), Yt,N=yt-δstd(y) .(5)
式中,Xt,N和Yt,N分別為標(biāo)準(zhǔn)化后的輸入數(shù)據(jù)及日產(chǎn)氣量輸出數(shù)據(jù);xt和yt分別為原輸入數(shù)據(jù)及日產(chǎn)氣量數(shù)據(jù);t和t分別為輸入及日產(chǎn)氣量數(shù)據(jù)平均值;δstd(x)和δstd(y)分別為輸入及日產(chǎn)氣量數(shù)據(jù)標(biāo)準(zhǔn)方差。
2.2 機(jī)器學(xué)習(xí)產(chǎn)能預(yù)測(cè)模型構(gòu)建
對(duì)不同序列數(shù)據(jù)集進(jìn)行氣井的產(chǎn)量預(yù)測(cè),分別基于CNN、RNN、LSTM和GRU神經(jīng)網(wǎng)絡(luò)構(gòu)建多步預(yù)測(cè)模型,如圖6所示,主要包括考慮相似性序列的生成、不同相關(guān)序列的數(shù)據(jù)標(biāo)準(zhǔn)化、網(wǎng)絡(luò)的初始化參數(shù)設(shè)置、不同的神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型構(gòu)建及訓(xùn)練、訓(xùn)練模型評(píng)價(jià)、測(cè)試數(shù)據(jù)的對(duì)比評(píng)價(jià)、產(chǎn)量預(yù)測(cè)結(jié)果。
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)[26](convolutional neural network,CNN)是一種具有卷積操作的前向神經(jīng)網(wǎng)絡(luò),它主要包括輸入層、卷積層、池化層、全連接層和輸出層,一般采用多個(gè)卷積+池化進(jìn)行輸入信號(hào)多個(gè)特征的提取,其核心是卷積運(yùn)算。在CNN的訓(xùn)練過(guò)程中,首先進(jìn)行前向傳播,目標(biāo)數(shù)據(jù)通過(guò)輸入層輸入網(wǎng)絡(luò),然后通過(guò)卷積運(yùn)算、池化等過(guò)程提取隱藏在輸入數(shù)據(jù)中的特征信息,并利用反向傳播算法優(yōu)化網(wǎng)絡(luò)參數(shù),當(dāng)滿足條件時(shí)結(jié)束網(wǎng)絡(luò)的訓(xùn)練過(guò)程,利用該網(wǎng)絡(luò)模型可以實(shí)現(xiàn)對(duì)未知輸入的預(yù)測(cè)。
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)[27](recurrent neural network,RNN)是一種具有記憶功能的神經(jīng)網(wǎng)絡(luò)。RNN由輸入層、隱藏層和輸出層3層構(gòu)成。RNN是采用遞歸計(jì)算將所有神經(jīng)元通過(guò)鏈?zhǔn)竭B接,將神經(jīng)元的計(jì)算結(jié)果以一定的權(quán)重比例傳輸給新的神經(jīng)元。在模型隱藏層中,神經(jīng)元之間存在著自連接和互連接的關(guān)系,構(gòu)成了一種傳遞延遲信號(hào)的矩陣,使得該模型能夠獲得短暫的記憶特性。利用隱藏層將上一層輸出和下一刻狀態(tài)結(jié)合起來(lái),實(shí)現(xiàn)了神經(jīng)元間的信息交換,形成反饋網(wǎng)絡(luò)結(jié)構(gòu)。
2.2.3 長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)
長(zhǎng)短期神經(jīng)網(wǎng)絡(luò)[28](long short-term memory,LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)模型的一種改進(jìn),包含輸入層、隱藏層和輸出層。LSTM神經(jīng)網(wǎng)絡(luò)模型最大的特點(diǎn)是在每個(gè)神經(jīng)元中都添加了3個(gè)控制門(mén),分別是輸入門(mén)、輸出門(mén)和遺忘門(mén)。這3個(gè)門(mén)可以對(duì)接收到的信息進(jìn)行選擇性地記憶并不斷地修改參數(shù),進(jìn)而緩解了在模型擬合時(shí)產(chǎn)生的梯度爆炸或者消失。
2.2.4 門(mén)控神經(jīng)網(wǎng)絡(luò)
門(mén)控神經(jīng)網(wǎng)絡(luò)[29](gate recurrent units,GRU)是循環(huán)神經(jīng)網(wǎng)絡(luò)的改進(jìn)形式,也屬于LSTM的變體,門(mén)控循環(huán)神經(jīng)單元采用了門(mén)控機(jī)制,由LSTM的3種門(mén)縮減到2種門(mén),包含更新門(mén)和重置門(mén),去掉了類(lèi)似于LSTM的輸出門(mén),且不存在LSTM中的細(xì)胞狀態(tài)。GRU的重置門(mén)決定了歷史信息被遺忘的程度。更新門(mén)主要決定將多少過(guò)去的信息保存到當(dāng)前時(shí)間步。該模型減少了門(mén)的數(shù)量,精簡(jiǎn)了門(mén)的結(jié)構(gòu),縮減了模型參數(shù),使GRU運(yùn)算比LSTM簡(jiǎn)單,大大減少運(yùn)算量。
2.3 模型評(píng)價(jià)指標(biāo)
模型評(píng)價(jià)指標(biāo)是在測(cè)試集上對(duì)預(yù)測(cè)模型進(jìn)行泛化能力評(píng)價(jià),表征本文模型的產(chǎn)量預(yù)測(cè)結(jié)果的準(zhǔn)確程度。所選擇的模型評(píng)價(jià)指標(biāo)包含平均絕對(duì)誤差δr、均方根誤差δRMSE和決定系數(shù)R2,計(jì)算公式分別為
δr=1N∑Ni=1qi,pred-qi,realqi,real ,(6)
δRMSE=1N∑Ni=1(qi,pred-qi,real)2 ,(7)
R2=1-∑Ni=1(qi,pred-qi,real)2∑Ni=1(qi,pred-q-)2 .(8)
式中,N為時(shí)間序列的散點(diǎn)個(gè)數(shù);qi,real和qi,pred分別為在任一時(shí)間點(diǎn)的產(chǎn)量的預(yù)測(cè)值和實(shí)際值,t/d。
綜上,平均絕對(duì)誤差在±5%表示達(dá)到了較好的預(yù)測(cè)效果,且與均方根誤差值同理,值越小說(shuō)明預(yù)測(cè)效果越好。決定系數(shù)取值為[0,1],結(jié)果為0表示模型預(yù)測(cè)效果很差;結(jié)果是1,表示預(yù)測(cè)結(jié)果為函數(shù)關(guān)系;結(jié)果在0~1之間,數(shù)值越大表示模型預(yù)測(cè)效果越好。因此采用以上3種模型評(píng)價(jià)指標(biāo)來(lái)全面地考察數(shù)據(jù)結(jié)果,較為理性客觀地評(píng)價(jià)數(shù)據(jù)誤差。
3 結(jié)果對(duì)比及分析
基于頁(yè)巖氣井X1井的現(xiàn)場(chǎng)生產(chǎn)數(shù)據(jù),采用相似性分析得到全時(shí)間序列、強(qiáng)相關(guān)時(shí)間序列和弱相關(guān)時(shí)間序列,在此運(yùn)用CNN、RNN、LSTM和GRU網(wǎng)絡(luò)模型對(duì)不同的多變量時(shí)間序列和單變量時(shí)間序列進(jìn)行X1氣井的產(chǎn)量預(yù)測(cè),并分別對(duì)不同序列和網(wǎng)絡(luò)模型進(jìn)行結(jié)果分析。
3.1 網(wǎng)絡(luò)模型的超參數(shù)設(shè)置
將日產(chǎn)氣量作為目標(biāo)序列,日產(chǎn)水量、油嘴直徑、開(kāi)井時(shí)間、油管壓力、套管壓力和溫度作為比較時(shí)間序列。采用CNN、RNN、LSTM和GRU神經(jīng)網(wǎng)絡(luò)模型分別進(jìn)行單變量序列、弱相關(guān)序列、強(qiáng)相關(guān)序列和全時(shí)間序列的機(jī)器學(xué)習(xí)方法產(chǎn)量預(yù)測(cè)。通過(guò)對(duì)網(wǎng)絡(luò)模型超參數(shù)進(jìn)行不斷優(yōu)化,本文中的神經(jīng)網(wǎng)絡(luò)的基本超參數(shù)如表2所示,其次所有神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率均為0.005,隨機(jī)失活層刪除率為0.2。
3.2 不同相關(guān)序列的結(jié)果
針對(duì)不同時(shí)間序列(全時(shí)間序列、強(qiáng)相關(guān)序列、弱相關(guān)序列、單變量序列)采用不同的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè),得到不同模型下的預(yù)測(cè)結(jié)果,如圖7和表3所示??梢钥闯觯孩倏紤]多變量產(chǎn)量預(yù)測(cè)時(shí),產(chǎn)量預(yù)測(cè)結(jié)果隨著實(shí)際產(chǎn)量的波動(dòng),預(yù)測(cè)曲線都出現(xiàn)了不同程度變化,說(shuō)明多變量產(chǎn)量預(yù)測(cè)的有效性;②全時(shí)間序列和強(qiáng)相關(guān)序列,相對(duì)于弱相關(guān)序列的預(yù)測(cè)效果更好,曲線的波動(dòng)變化更符合實(shí)際效果,特別是LSTM和GRU模型表現(xiàn)更為明顯;③由表3可見(jiàn),采用不同的網(wǎng)絡(luò)模型對(duì)氣井進(jìn)行產(chǎn)量預(yù)測(cè),其中絕對(duì)誤差δr和均方根誤差δRMSE由小到大的排序?yàn)閺?qiáng)相關(guān)序列、全時(shí)間序列、弱相關(guān)序列、單變量序列,且與決定系數(shù)R2的結(jié)果一致。說(shuō)明強(qiáng)相關(guān)序列的構(gòu)建進(jìn)一步提高了產(chǎn)量預(yù)測(cè)的精度,全時(shí)間序列中弱相關(guān)序列的加入,相比于強(qiáng)相關(guān)性序列在一定程度上減低了產(chǎn)量預(yù)測(cè)的精度,由此可見(jiàn),在多變量產(chǎn)量預(yù)測(cè)過(guò)程中進(jìn)行序列的相似性分析至關(guān)重要,可以提取出有效數(shù)據(jù),排除干擾影響,提高預(yù)測(cè)精度。
基于上述計(jì)算結(jié)果可知:①不同相關(guān)性的多變量預(yù)測(cè)中,采用不同評(píng)價(jià)標(biāo)準(zhǔn)對(duì)氣井產(chǎn)量預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),GRU和LSTM網(wǎng)絡(luò)具有較好的預(yù)測(cè)效果,誤差較小,絕對(duì)系數(shù)較大;②弱相關(guān)序列和單變量序列預(yù)測(cè)結(jié)果相對(duì)誤差較大,弱相關(guān)序列不同網(wǎng)絡(luò)模型的誤差由小到大的排序?yàn)長(zhǎng)STM、GRU、RNN、CNN;單變量序列δRMSE和δr由小到大的排序?yàn)镚RU、LSTM、RNN、CNN,R2的誤差由小到大的排序?yàn)镚RU、RNN、LSTM、CNN;強(qiáng)相關(guān)序列和全時(shí)間序列預(yù)測(cè)誤差由小到大的排序?yàn)镚RU、LSTM、CNN、RNN??傮w而言,頁(yè)巖氣井X1井預(yù)測(cè)網(wǎng)絡(luò)模型優(yōu)選為GRU和LSTM,優(yōu)選的預(yù)測(cè)序列為強(qiáng)相關(guān)序列。
4 結(jié) 論
(1)依據(jù)歐式距離和DTW距離由小到大排序?yàn)槿债a(chǎn)水量、套壓、油壓、溫度、油嘴直徑、開(kāi)井時(shí)間,將時(shí)間序列分為3類(lèi),全時(shí)間序列、強(qiáng)相關(guān)時(shí)間序列(日產(chǎn)氣量、套壓、油壓、日產(chǎn)水量)和弱相關(guān)時(shí)間序列(日產(chǎn)氣量、油嘴直徑、開(kāi)井時(shí)間、溫度)。
(2)不同序列的氣井產(chǎn)量預(yù)測(cè),基于不同評(píng)價(jià)指標(biāo)得到的誤差(平均絕對(duì)誤差δr、均方根誤差δRMSE和決定系數(shù)R2)由小到大的排序?yàn)閺?qiáng)相關(guān)序列、全時(shí)間序列、弱相關(guān)序列、單變量序列,即強(qiáng)相關(guān)序列預(yù)測(cè)效果好于全時(shí)間序列、弱相關(guān)序列和單變量序列,故在多變量產(chǎn)量預(yù)測(cè)過(guò)程中進(jìn)行序列的相似性分析非常有必要。
(3) GRU和LSTM網(wǎng)絡(luò)具有較好的預(yù)測(cè)效果,誤差較小,絕對(duì)系數(shù)較大,故總體而言頁(yè)巖氣井X1井預(yù)測(cè)機(jī)器學(xué)習(xí)網(wǎng)絡(luò)模型優(yōu)選為GRU和LSTM,優(yōu)選的相關(guān)序列為強(qiáng)相關(guān)序列。
參考文獻(xiàn):
[1] KYUNGBOOK L, JUNGTEK L, DAEUNG Y, et al. Prediction of shale-gas production at Duvernay formation using deep-learning algorithm[J]. SPE Journal, 2019,24(6):2423-2437.
[2] JI J H, YAO Y D, HUANG S, et al. Analytical model for production performance analysis of multi-fractured horizontal well in tight oil reservoirs[J]. Journal of Petroleum Science and Engineering, 2017,158:380-397.
[3] MOHAMMAD B, MORTEZA D, SOHRAB Z. Semi-analytical solution for productivity evaluation of a multi-fractured horizontal well in a bounded dual-porosity reservoir[J]. Journal of Hydrology, 2020,581:124288.
[4] KAZEMI H, MERRILL L S, PORTERFIELD K L, et al. Numerical simulation of water-oil flow in naturally fractured reservoirs[J]. SPE Journal, 1976,16(6):317-326.
[5] MOHAMMAD M, VATANI A, MAJID S, et al. Parallel processing of numerical simulation of two-phase flow in fractured reservoirs considering the effect of natural flow barriers using the streamline simulation method[J]. International Journal of Heat and Mass Transfer, 2019,131(1):574-583.
[6] HENRIK W, LINNEA L, KJELL A, et al. Production decline curves of tight oil wells in eagle ford shale[J]. Natural Resources Research, 2017,26(3):365-378.
[7] ZHANG H, DEAN R, ADAM C, et al. Extended exponential decline curve analysis[J]. Journal of Natural Gas Science and Engineering, 2016,36(1): 402-413.
[8] 李淑霞,于笑,吳伏波,等.基于神經(jīng)網(wǎng)絡(luò)的水合物藏降壓開(kāi)采產(chǎn)能預(yù)測(cè)及參數(shù)優(yōu)化[J].中國(guó)石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,47(1):89-97.
LI Shuxia, YU Xiao, WU Fubo, et al. Prediction and parameter optimization of depressurization productivity of natural gas hydrate reservoirs based on neural network[J]. Journal of China University of Petroleum (Edition of Natural Science),2023,47(1):89-97.
[9] AMIRMASOUD K D, SHAHAB M, SOODABEH E. Coupling numerical simulation and machine learning to model shale gas production at different time resolutions[J]. Journal of Natural Gas Science and Engineering, 2015,25(1):380-392.
[10] 吳新根,葛家理.應(yīng)用人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)油田產(chǎn)量[J].石油勘探與開(kāi)發(fā),1994,21(3):75-78,131.
WU Xingen, GE Jiali. Application of artificial neural networks in predicting oilfield production[J]. Petroleum Exploration and Development, 1994,21(3):75-78,131.
[11] SUN J, MA X, KAZI M. Comparison of decline curve analysis DCA with recursive neural networks RNN for production forecast of multiple wells[R]. SPE 190104-MS, 2018.
[12] SAGHEER A, MOSTAFA K. Time series forecasting of petroleum production using deep LSTM recurrent networks[J]. Neurocomputing,2019,323(1):203-213.
[13] 丁帥偉,席怡,劉騫,等.基于粒子群算法的低滲油藏CO2驅(qū)油與封存自動(dòng)優(yōu)化[J].中國(guó)石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,46(4):109-115.
DING Shuaiwei, XI Yi, LIU Qian, et al. An automatic optimization method of CO2 injection for enhanced oil recovery and storage in low permeability reservoirs based on particle swarm optimization algorithm[J]. Journal of China University of Petroleum(Edition of Natural Science),2022,46(4):109-115.
[14] 陳建華,晏慶輝,駱逸婷,等.基于歷史生產(chǎn)數(shù)據(jù)的多層合采井產(chǎn)量劈分新方法[J].中國(guó)海上油氣,2022,34(1):110-116.
CHEN Jianhua, YAN Qinghui, LUO Yiting, et al. A historical production data based method for production splitting of multi-layer commingled gas wells[J]. China Offshore Oil and Gas,2022,34(1):110-116.
[15] 高亞軍,唐力輝,王振鵬,等.基于循環(huán)神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)差分處理的油田產(chǎn)量預(yù)測(cè)方法[J].中國(guó)海上油氣,2023,35(3):126-136.
GAO Yajun, TANG Lihui, WANG Zhenpeng, et al. A method for oilfield production prediction based on recurrent neural network and data differential processing[J].China Offshore Oil and Gas,2023,35(3):126-136.
[16] HAMZEH A, HAMID R, NANCY C. Multivariate time series modelling approach for production forecasting in unconventional resources[R]. SPE 201571-MS,2020.
[17] FAN D, SUN H, YAO J, et al. Well production forecasting based on ARIMA-LSTM model considering manual operations[J]. Energy, 2021,220:119708.
[18] CUTHBERT S W N G, ASHKAN J G, MENAD N A. Well production forecast in volve field: application of rigorous machine learning techniques and metaheuristic algorithm[J]. Journal of Petroleum Science and Engineering, 2022,208:109468.
[19] 曹沖,程林松,張向陽(yáng),等.基于多變量小樣本的滲流代理模型及產(chǎn)量預(yù)測(cè)方法[J].力學(xué)學(xué)報(bào),2021,53(8):2345-2354.
CAO Chong, CHENG Linsong, ZHANG Xiangyang, et al. Permeability surrogate model and production forecasting method based on multivariate small samples[J]. Journal of Mechanics, 2021,53(8):2345-2354.
[20] 韓珊,車(chē)明光,蘇旺,等.四川盆地威遠(yuǎn)區(qū)塊頁(yè)巖氣單井產(chǎn)量預(yù)測(cè)方法及應(yīng)用[J].特種油氣藏,2022,29(6):141-149.
HAN Shan, CHE Mingguang, SU Wang, et al. Production forecasting method and application for single well shale gas in Weiyuan block, Sichuan Basin[J] Special Oil and Gas Reservoirs, 2022,29(6):141-149.
[21] 劉合,李艷春,杜慶龍,等.基于多變量時(shí)間序列模型的高含水期產(chǎn)量預(yù)測(cè)方法[J].中國(guó)石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,47(5):103-114.
LIU He, LI Yanchun, DU Qinglong, et al. Prediction of production during high water-cut period based on multivariate time series model[J]. Journal of China University of Petroleum (Edition of Natural Science),2023,47(5):103-114.
[22] AGRAWAL R, IMIELINSKI T, SWAMI A. Mining assocation rules between sets of items in large databases[J]. Acm Sigmod Record, 1993,22(2):207-216.
[23] BREU H, GIL J, KIRKPATRICK D, et al. Linear time euclidean distance algorithms[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1995, 17(5):529-533.
[24] ORSENIGO C, VERCELLIS C. Dimensionality reduction via isomap with lock-step and elastic measures for time series gene expression classification: Proc of the European Conference on Evolutionary Computation, Machine Learning and Data Mining in Bioinformatics[C].Berlin Heidelberg: Springer, 2013.
[25] 王成成,谷建偉,劉衛(wèi)華,等.基于DTW算法的井間動(dòng)態(tài)連通性評(píng)價(jià)[J].中國(guó)科技論文,2021,16(5):482-486.
WANG Chengcheng, GU Jianwei, LIU Weihua, et al. Evaluation of dynamic connectivity between wells based on DTW algorithm[J]. Chinese Science and Technology Papers, 2021,16(5):482-486.
[26] YANN L, LEON B, YOSHUA B, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998,86(11):2278-2324.
[27] SCHUSTER M, PALIWAL K K. Bidirectional recurrent neural networks[J]. IEEE Transactions on Signal Processing, 1997,45(11):2673-2681.
[28] GRAVES A. Generating sequences with recurrent neural networks[J]. Ar Xiv,2013:1308.0850.
[29] 夏瑜潞.循環(huán)神經(jīng)網(wǎng)絡(luò)的發(fā)展綜述[J].電腦知識(shí)與技術(shù),2019,15(21):182-184.
XIA Yulu. A review of the development of recurrent neural networks[J]. Computer Knowledge and Technology, 2019,15(21):182-184.
[30] LI X, XIAO K, LI X, et al. A well rate prediction method based on LSTM algorithm considering manual operations[J]. Journal of Petroleum Science and Engineering, 2022,210:110047.
(編輯 李志芬)
基金項(xiàng)目:山東省自然科學(xué)基金項(xiàng)目(ZR2022JQ23);國(guó)家自然科學(xué)基金優(yōu)秀青年科學(xué)基金項(xiàng)目(52122402);國(guó)家自然科學(xué)基金重大項(xiàng)目(42090024)
第一作者:樊冬艷(1985-),女,副教授,博士,研究方向?yàn)榉浅R?guī)油氣試井及動(dòng)態(tài)分析方法。E-mail:fandongyan2010@126.com。
通信作者:孫海(1984-),男,教授,博士,博士生導(dǎo)師,研究方向?yàn)榉浅R?guī)油氣滲流理論及流動(dòng)機(jī)制。E-mail:sunhai@upc.edu.cn。
引用格式:樊冬艷,楊燦,孫海,等. 基于時(shí)間序列相似性與機(jī)器學(xué)習(xí)方法的頁(yè)巖氣井產(chǎn)量預(yù)測(cè)[J].中國(guó)石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2024,48(3):119-126.
FAN Dongyan, YANG Can, SUN Hai,et al. Shale gas well production forecasting based on time sequence similarity and machine learning methods[J].Journal of China University of Petroleum(Edition of Natural Science),2024,48(3):119-126.