卜亞輝
(中國石化勝利油田分公司勘探開發(fā)研究院,山東東營 257015)
中國東部老油田已普遍進(jìn)入高含水開發(fā)階段,生產(chǎn)歷史復(fù)雜,剩余油分布零散,開發(fā)效益逐年變差。在低油價及成本上漲的雙重壓力下,亟待建立更加準(zhǔn)確、高效的油藏生產(chǎn)數(shù)據(jù)分析方法。大數(shù)據(jù)及人工智能技術(shù)的出現(xiàn)可為傳統(tǒng)方法的升級提供全新解決途徑。目前智能學(xué)習(xí)算法在油藏工程領(lǐng)域的研究正處于快速發(fā)展階段,研究方向主要包括:流場聚類算法識別水驅(qū)油藏流場[1],卷積神經(jīng)網(wǎng)絡(luò)自動試井解釋[2],智能算法加速數(shù)值模擬歷史擬合[3]及閃蒸分離相平衡計算[4],使用代理模型數(shù)值模擬歷史擬合及方案優(yōu)化[5-6],通過機(jī)器學(xué)習(xí)量化評價多井分層注水效果、分析注水調(diào)整方向[7-8],預(yù)測產(chǎn)量遞減及裂縫發(fā)育[9-11],儲層流體分級識別[12],頁巖油產(chǎn)能預(yù)測[13]等。
將機(jī)器學(xué)習(xí)應(yīng)用于剩余油預(yù)測仍處于起步研究階段,面臨的挑戰(zhàn)包括:第一,影響剩余油分布的參數(shù)眾多,如何篩選提取特征參數(shù);第二,如何用更少的參數(shù)描述剩余油空間分布特征。為此,筆者提出了基于數(shù)值模擬正演的樣本構(gòu)建方法,首先從數(shù)值模擬結(jié)果中提取含油飽和度等值線進(jìn)行擬合,然后通過人工神經(jīng)網(wǎng)絡(luò)(ANN)建立擬合參數(shù)隨時間和空間的變化關(guān)系,最后根據(jù)擬合參數(shù)重構(gòu)含油飽和度場。該方法可快速評價剩余油潛力區(qū),為開發(fā)調(diào)整政策的制定提供參考。
高含水油田雖然采出程度較高,但仍蘊(yùn)藏較大開發(fā)潛力,取心及礦場動態(tài)資料顯示,剩余油呈整體分散、局部富集的特點[14-16],有效驅(qū)替僅發(fā)生在注采井組間局部范圍,注采主流線之外依然存在剩余油富集區(qū)。礦場實踐表明,改變注采方向、注采強(qiáng)度等流場調(diào)控手段可實現(xiàn)高含水油田采收率的進(jìn)一步提高[17-21]。針對高含水期剩余油及其開發(fā)特點,設(shè)計了基于機(jī)器學(xué)習(xí)的剩余油預(yù)測方法(圖1),具體步驟包括:①方案設(shè)計及模擬計算。影響注采井組間剩余油分布的主要因素包括井距、厚度、滲透率、相對滲透率和地層傾角等,設(shè)計多組概念模型調(diào)用數(shù)值模擬器獲得不同時刻及層位的含油飽和度場。②含油飽和度場提取及擬合。對每個時間步及模擬層含油飽和度作等值線,提取等值線對應(yīng)數(shù)據(jù)點,選用多種曲線方程擬合,記錄每種擬合方法的參數(shù)及擬合精度。③樣本庫構(gòu)建及學(xué)習(xí)訓(xùn)練。將各影響因素及對應(yīng)擬合參數(shù)關(guān)聯(lián)建立樣本庫,通過神經(jīng)網(wǎng)絡(luò)模型擬合訓(xùn)練樣本,形成含油飽和度等值線預(yù)測模型。④注采井組劃分及開發(fā)指標(biāo)標(biāo)定。根據(jù)開發(fā)歷史及動態(tài)數(shù)據(jù),對各開發(fā)階段每個井組間的流動方向、采液量和含水率進(jìn)行標(biāo)定。⑤注采井組間含油飽和度預(yù)測。調(diào)用訓(xùn)練好的模型,預(yù)測各注采井組間含油飽和度等值線擬合參數(shù)。⑥含油飽和度場疊加及驗證。將多階段多注采井組含油飽和度場疊加,通過插值獲得整個研究區(qū)預(yù)測結(jié)果。將預(yù)測結(jié)果與礦場動態(tài)進(jìn)行對比,當(dāng)誤差較大時,調(diào)整參數(shù)重新計算;當(dāng)誤差較小時,將驗證后的參數(shù)值樣本保存入庫,隨著應(yīng)用區(qū)塊的積累逐步建立礦場樣本庫。
圖1 基于機(jī)器學(xué)習(xí)的剩余油預(yù)測方法技術(shù)路線Fig.1 Roadmap of remaining oil prediction method based on machine learning
高含水期注采井組間含油飽和度場特征的表征是該方法的關(guān)鍵,需要滿足形態(tài)保真且數(shù)據(jù)量小的要求。油藏工程及礦場實踐表明高含水期注采井組間含油飽和度分布形態(tài)受儲層物性、注水井、采油井位置及工作制度等參數(shù)影響,通過數(shù)值模擬正演可建立各種剩余油模式。針對中-高滲透均質(zhì)概念模型,設(shè)置模型尺寸為1 000 m×1 000 m×10 m,網(wǎng)格數(shù)為50×50×5,滲透率為300 mD。在一注一采條件下,采油井的含水率分別為10%和80%時,縱向上選取模型頂部(第1 層)、中部(第3 層)、底部(第5 層)3 個位置進(jìn)行數(shù)值模擬。由圖2 可知,含油飽和度形態(tài)呈近似的曲線帶,隨著含水率升高,水驅(qū)波及范圍不斷擴(kuò)大。其中藍(lán)色代表強(qiáng)驅(qū)替區(qū),紅色代表未波及區(qū),藍(lán)色至紅色之間代表過渡區(qū)。過渡區(qū)分布范圍雖較小,但含油飽和度變化最快。此外受重力作用影響,儲層底部較頂部水驅(qū)波及范圍更大。
圖2 含油飽和度數(shù)值模擬結(jié)果Fig.2 Numerical simulation results of oil saturation
含油飽和度場圖雖然能夠全面表征其空間特點,但數(shù)據(jù)量較大,且以整個場數(shù)據(jù)為樣本進(jìn)行學(xué)習(xí)訓(xùn)練難度較大。為此,可提取少量含油飽和度等值線,降低數(shù)據(jù)量及學(xué)習(xí)難度。編寫模塊自動讀取各時刻開發(fā)指標(biāo)與含油飽和度場數(shù)據(jù),繪制并提取指定含油飽和度等值線,獲取每條等值線對應(yīng)的點集坐標(biāo)。在含油飽和度為0.5 的條件下,繪制模型第5層的不同時刻含油飽和度等值線(圖3),可以看出當(dāng)初始時刻的含水率為2%時,注入水波及范圍較小,受模擬網(wǎng)格影響含油飽和度等值線近似四邊形;當(dāng)含水率為5%時,含油飽和度等值線呈水舌形向采油井推進(jìn);當(dāng)含水率為30%~70%時,含油飽和度等值線逐漸過渡到橢圓形,隨著含水率升高,橢圓長短軸的差異不斷縮?。划?dāng)含水率為90%時,含油飽和度等值線接近圓形。
根據(jù)以上分析,含油飽和度隨時間變化規(guī)律可用一組特征曲線表示,由此設(shè)計采用多項式方法進(jìn)行擬合。在注采井距為400 m、油藏厚度為5 m、垂向位置為0.5 m、采液量為104 m3的條件下,獲得3條含油飽和度等值線(圖4a)。以含油飽和度為0.45的等值線為例,其是由若干等值點組成的(圖4b),以注水井為坐標(biāo)原點(0,0),定義注水井到采油井連線方向為x軸正方向,垂直x軸作y軸,等值點整體呈對稱分布,僅使用y軸正半軸數(shù)據(jù)進(jìn)行擬合。采用三次多項式進(jìn)行回歸計算,其表達(dá)式為:
圖4 含油飽和度等值線多項式擬合結(jié)果Fig.4 Polynomial fitting results of oil saturation isolines
采用判定系數(shù)R2評價多項式擬合質(zhì)量,R2值越接近1,表示擬合質(zhì)量越好,其表達(dá)式為:
由含油飽和度等值線的多項式擬合參數(shù)及判定系數(shù)(表1)可以看出,R2值均大于0.9,說明該方法具有較高的擬合精度。每一條含油飽和度等值線的空間分布特征用4 個擬合參數(shù)(a,b,c,d)表示,而原網(wǎng)格數(shù)據(jù)至少需要20 個橫縱坐標(biāo)點值,對等值點開展多項式擬合后只需要保留坐標(biāo)原點值和擬合參數(shù)值,數(shù)據(jù)量下降至原來的10%以內(nèi)。
表1 含油飽和度等值線的多項式擬合參數(shù)及判定系數(shù)Table1 Fitting parameters and determination coefficient of oil saturation isolines
參考中-高滲透油藏物性及井網(wǎng)特征設(shè)置方案,通過數(shù)值模擬獲得訓(xùn)練樣本數(shù)據(jù)集。模型尺寸為2 000 m×2 000 m,較大的平面尺寸是為了消除邊界對等值線形態(tài)的影響,網(wǎng)格數(shù)為100×100×5,地層壓力為20 MPa,原油黏度為10 mPa·s,體積系數(shù)為1.2,平均滲透率為300 mD。
考慮注采井距(50,200,250,300,350,400 和450 m)、油藏厚度(2,3,5 和9 m)、滲透率(200,400,600 和800 mD)3 個參數(shù),共組合112 個方案。每個方案提取第1 層、第3 層、第5 層含油飽和度等值線(So=0.3,0.5,0.7)的擬合數(shù)據(jù),獲得原始樣本數(shù)據(jù)9 072 組,采用隨機(jī)方式劃分為訓(xùn)練集(80%)和測試集(20%)。
學(xué)習(xí)訓(xùn)練采用TensorFlow 搭建人工神經(jīng)網(wǎng)絡(luò)模型(圖5),其結(jié)構(gòu)為1 個輸入層、若干個隱藏層、1 個輸出層[22-25]。輸入層包含6 個神經(jīng)元,分別為注采井距、油藏厚度、滲透率、垂向位置、采液量和含油飽和度;隱藏層數(shù)及隱藏層包含神經(jīng)元個數(shù)Hij是需要優(yōu)化的參數(shù),隱藏層數(shù)越多,神經(jīng)元個數(shù)越多,其對非線性數(shù)據(jù)的擬合能力越強(qiáng);輸出層神經(jīng)元有4個參數(shù)。
圖5 人工神經(jīng)網(wǎng)絡(luò)模型示意Fig.5 Schematic diagram of artificial neural network model
為了提高人工神經(jīng)網(wǎng)絡(luò)模型的非線性擬合能力,測試多種激活函數(shù)的預(yù)測效果,本方案備選的激活函數(shù)包括Sigmoid,Tanh 和Relu 三種非線性函數(shù),表達(dá)式分別為:
模型質(zhì)量的評價指標(biāo)采用均方根誤差,其表達(dá)式為:
初始采用5 個隱藏層,每層10 個神經(jīng)元的網(wǎng)絡(luò)模型,對比150 個訓(xùn)練輪次,測試Sigmoid,Tanh 和Relu 激活函數(shù)的均方根誤差,其值分別為96,119和82 m,故選用Relu 作為所有神經(jīng)元的激活函數(shù),從而使模型的預(yù)測能力達(dá)到最強(qiáng)。對隱藏層數(shù)和神經(jīng)元個數(shù)開展敏感性分析,對比測試3~8個隱藏層、5~20個神經(jīng)元的網(wǎng)絡(luò)模型,結(jié)果顯示5個隱藏層,每層8~16 個神經(jīng)元模型能獲得較好的預(yù)測效果。以該模型為基礎(chǔ),繼續(xù)增加訓(xùn)練輪次,提高模型的訓(xùn)練精度。
由訓(xùn)練集學(xué)習(xí)曲線(圖6)可以看出,500個訓(xùn)練輪次內(nèi),前20 個訓(xùn)練輪次均方根誤差快速下降,等值線各點位置的均方根誤差由75 m下降至20 m,即該模型預(yù)測等值線點的空間距離偏差在20 m 以內(nèi);第20~270 個訓(xùn)練輪次,精度緩慢下降,均方根誤差由20 m 下降至9.8 m;第270 個訓(xùn)練輪次后,均方根誤差基本穩(wěn)定在8.9 m。由測試集預(yù)測結(jié)果(圖7)可以看出,數(shù)據(jù)點整體集中于45°線,離45°線距離較遠(yuǎn)的數(shù)據(jù)點來自中低含水期的樣本,預(yù)測精度較低;離45°線距離較近的數(shù)據(jù)點來自高含水期的樣本,整體預(yù)測精度較高。
圖6 訓(xùn)練集學(xué)習(xí)曲線Fig.6 Learning curve of training set
圖7 測試集預(yù)測結(jié)果Fig.7 Prediction results of test set
測試區(qū)塊為某封閉斷塊油藏,該油藏被5 條斷層(F1—F5)包圍,其中F1 斷層位于油藏的高部位,F(xiàn)5 斷層位于低部位,砂體厚度為7.1 m,平均孔隙度為0.26,平均滲透率為460 mD,地層原油密度為0.897 g/cm3,原油黏度為9 mPa·s,屬于中-高孔、中-高滲透、常壓、稀油油藏,經(jīng)過30多年的開發(fā)采出程度為46.9%,含水率為96%。除天然能量開采階段外,主要生產(chǎn)階段采用兩注兩采方式(注水井為Inj1,Inj2;采油井為Prod1,Prod2)。開發(fā)動態(tài)響應(yīng)顯示注采對應(yīng)關(guān)系明確,Inj1—Prod1 和Inj2—Prod2是主見效方向,采液量分別為6.78×104,4.68×104m3,Inj1—Prod2 是次見效方向,采液量為3.56×104m3。將注采數(shù)據(jù)代入訓(xùn)練模型,獲得含油飽和度等值線擬合參數(shù),并根據(jù)該參數(shù)重構(gòu)含油飽和度場,對于井組間的重疊部分取其最大值,從而獲得整個區(qū)塊的剩余油分布。
對比含油飽和度數(shù)值模擬和機(jī)器學(xué)習(xí)預(yù)測結(jié)果(圖8),新方法對該區(qū)塊整體的剩余油分布特征預(yù)測較好??梢钥闯鯢1 斷層附近的高部位及F2 和F3 斷層附近的斷邊帶剩余油描述最清晰,說明該學(xué)習(xí)模型對水驅(qū)波及的外部邊界描述差異較小,其次是2 口注水井之間存在剩余油富集區(qū)(圖8b),該區(qū)域預(yù)測能力主要受到注采井距和采液量影響,當(dāng)注采井距越大且采液量越小時描述越準(zhǔn)確,以上剩余油分布位置均符合礦場認(rèn)識。然而該方法的不足之處主要表現(xiàn)在Prod1 和Prod2 井間剩余油邊界描述不精準(zhǔn),對井間滯留區(qū)的刻畫能力較弱,其原因是學(xué)習(xí)樣本來自單個注采井組的含油飽和度,未考慮多注多采條件下流場相互干擾作用。為此,下一步研究將整個注采井網(wǎng)結(jié)構(gòu)作為輸入代入神經(jīng)網(wǎng)絡(luò),描述含油飽和度分布從簡單的多項式函數(shù)變?yōu)槎喾N組合函數(shù),不斷提高注采井組間含油飽和度分布的預(yù)測能力。
圖8 含油飽和度數(shù)值模擬和機(jī)器學(xué)習(xí)預(yù)測結(jié)果Fig.8 Results of oil saturation by machine learning and numerical simulation
建立了一種基于機(jī)器學(xué)習(xí)的剩余油預(yù)測方法,通過數(shù)值模擬建立考慮不同因素影響下的含油飽和度等值線擬合參數(shù)樣本,采用神經(jīng)網(wǎng)絡(luò)算法建立預(yù)測模型,并針對高含水油田開展應(yīng)用測試。預(yù)測結(jié)果顯示新方法在復(fù)雜井間聯(lián)動關(guān)系的條件下,依然能較高質(zhì)量描述高含水油田平面及縱向剩余油分布形態(tài)特征,同時計算效率得到大幅度提高。所提出的含油飽和度等值線多項式擬合樣本預(yù)處理方法,克服了直接采用含油飽和度場作為學(xué)習(xí)樣本時參數(shù)多、訓(xùn)練慢的缺點,訓(xùn)練后獲得的預(yù)測模型具有更靈活、高效的特點。該方法可實現(xiàn)剩余油的快速預(yù)測分析,指導(dǎo)新井方案及注采調(diào)控方案設(shè)計。針對目前方法存在的缺陷提出了改進(jìn)方向,未來隨著考慮因素及樣本數(shù)據(jù)量的擴(kuò)充,預(yù)測精度將進(jìn)一步提高,具有很大的發(fā)展?jié)摿Α?/p>
符號解釋
a,b,c,d——三次多項式系數(shù),無量綱;
f(x)——擬合函數(shù),無量綱;
h——油藏厚度,m;
Hij——隱藏層第i層第j個神經(jīng)元;
K——滲透率,mD;
label——樣本值,無量綱;
L——注采井距,m;
Ly——垂向位置,m;
N——等值點總數(shù);
Nl——采液量,m3;
i——等值點序號;
predicted——預(yù)測值,無量綱;
R2——判定系數(shù),無量綱;
RMSE——均方根誤差,無量綱;
So——含油飽和度,無量綱;
xi——第i個等值點橫坐標(biāo);
yi——第i個等值點縱坐標(biāo);
——等值點縱坐標(biāo)平均值;
X,Y——空間位置,m。