朱璇,袁彬,同元輝,趙明澤,鄭賀,劉秀磊
1)中國石油大學(華東)石油工程學院,山東青島 266580;2)中國石油塔里木油田實驗檢測研究院油氣分析測試中心,新疆庫爾勒841009
2021年,中國原油和天然氣對外依存度分別高達73%和43%[1],油氣資源高效開發(fā)成為能源安全重大需求.中國致密油藏儲量巨大,占全國新增探明儲量的75%以上,但致密油儲層品位低、物性差、產(chǎn)量低[2],亟需提高采收率.壓裂氣驅(qū)是當前開采致密低滲油藏最有效的提高采收率技術(shù)之一,準確模擬壓裂氣驅(qū)過程、預測生產(chǎn)效果是實現(xiàn)致密低滲油藏注氣高效開發(fā)的關(guān)鍵理論基礎.目前,進行油藏生產(chǎn)效果預測的方法主要有傳統(tǒng)油藏工程方法和油藏數(shù)值模擬方法.傳統(tǒng)油藏工程方法僅能建立較簡單的預測模型,難以考慮不同油藏類型、開發(fā)階段和工作制度等因素;油藏數(shù)值模擬方法可以模擬實際生產(chǎn)井條件,預測任意措施的效果,但需要以準確的地質(zhì)模型和歷史擬合為基礎,模擬擬合預測周期較長,調(diào)參繁瑣,不適合短期、局部的快速調(diào)整預測.
近年來,深度學習算法在油氣勘探和生產(chǎn)分析中得到廣泛應用[3],包括壓力體積溫度(pressure&volume &temperature,PVT)特性預測、礦物識別、滲透率預測、增產(chǎn)措施預測、油藏描述[4]、流體分析[5]和生產(chǎn)曲線分析[6]等.針對本研究所聚焦的壓裂場景,MAKHOTIN等[7]采用梯度提升算法預測水力壓裂增產(chǎn)效果;LIU 等[8]利用含有多隱藏層的人工神經(jīng)網(wǎng)絡預測了多裂縫性頁巖儲層產(chǎn)油量;SONG 等[9]基于粒子群優(yōu)化的長短期記憶單元(long short-term memory,LSTM)算法預測了火山巖儲層壓裂水平井產(chǎn)能.針對井網(wǎng)注采場景,目前采用機器學習方法預測注水開發(fā)效果等研究較多,包括KALAM 等[10]利用人工神經(jīng)網(wǎng)絡預測了層狀油藏五點注水開發(fā)的采收率;PAL[11]將基于LSTM 的遞歸神經(jīng)網(wǎng)絡模型應用于致密碳酸鹽巖油藏長水平井注水開發(fā)產(chǎn)量預測;DONG等[12]研究了基于深度學習的CO2最小混相壓力預測等.但目前采用深度學習方法預測注氣開發(fā)效果研究相對較少.
壓裂氣驅(qū)是將油藏壓裂與注氣驅(qū)油相結(jié)合,是當前開采致密低滲油藏提高采收率有效技術(shù)之一,然而,水力裂縫性質(zhì)和多相流動的復雜性,使得通過建立精細油藏數(shù)值模擬預測壓裂井網(wǎng)注氣開發(fā)效果變得更加困難和耗時[13].為此,本研究將深度神經(jīng)網(wǎng)絡(deep neural network,DNN)算法與油藏壓裂注氣開采技術(shù)相結(jié)合,實現(xiàn)基于數(shù)據(jù)模型的油藏生產(chǎn)效果準確高效預測,提高生產(chǎn)效率,對致密低滲油藏開發(fā)與管理提供借鑒.
基于Eclipse 的E300 組分模擬器,分別建立致密低滲雙孔雙滲油藏壓裂衰竭開發(fā)和注氣開發(fā)數(shù)值模擬基礎模型,所建模型基本參數(shù)如表1.
表1 模型基本參數(shù)Table 1 Basic parameters of the model
所建立的致密低滲油藏壓裂衰竭開發(fā)模型和注氣開發(fā)模型[14]中,采用局部網(wǎng)格加密技術(shù),對壓裂生產(chǎn)水平井多級水力裂縫進行模擬.其中,等效裂縫導流能力范圍為0.15~0.51 μm2·m,等效裂縫網(wǎng)格寬度為0.1 m.在致密低滲油藏注氣開發(fā)模型中,對每口注氣直井分別壓裂,雙翼裂縫沿x方向、縫長為60 m,等效導流能力范圍為0.15~0.51 μm2·m,等效裂縫網(wǎng)格寬度為0.1 m.水力裂縫導流能力等效公式為
其中,f=1,2,…,n(n為各數(shù)值模擬模型水力裂縫條數(shù));wf和Δf分別為水力裂縫和等效水力裂縫網(wǎng)格的寬度,單位:m;分別為水力裂縫和等效水力裂縫網(wǎng)格的滲透率,單位:μm2.
本研究建立的致密低滲油藏壓裂井網(wǎng)注氣開發(fā)數(shù)值模擬模型如圖1,壓裂衰竭開發(fā)模型無注氣井.
圖1 致密低滲油藏壓裂井網(wǎng)注氣開發(fā)數(shù)值模擬模型示意圖Fig.1 Schematic diagram of numerical simulation model of gas flooding in fractured well pattern in tight oil reservoirs.
圖2 水平井水力裂縫分布示意圖Fig.2 Schematic diagram of horizontal well distribution.Gaussian function curve(dashed line)was introduced to calibrate the position of heel,toe and equivalent hydraulic fracture tip of horizontal well(green dots).
一維高斯函數(shù)公式為
其中,a為曲線尖峰的高度;b為標準方差;d為尖峰中心的坐標.水平井水力裂縫以水平井中心位置左右對稱,本研究設置d=0.5.
油藏基質(zhì)系統(tǒng)油-氣兩相相對滲透率可采用Stone公式計算,如式(3)至式(6)所示.
其中,Sw為含水飽和度;Swc為束縛水飽和度;Sorw為油水系統(tǒng)殘余油飽和度;krw為油水系統(tǒng)水相相對滲透率;krwmax為油水系統(tǒng)最大水相相對滲透率;nw為油水系統(tǒng)水相指數(shù).krow為油水系統(tǒng)油相相對滲透率;now為油水系統(tǒng)油相指數(shù);Sg為含氣飽和度;Sgc為束縛氣飽和度;Sorg為油氣系統(tǒng)殘余油飽和度;krg為油氣系統(tǒng)氣相相對滲透率;krgmax為油氣系統(tǒng)最大氣相相對滲透率;ng為油氣系統(tǒng)氣相指數(shù).krog為油氣系統(tǒng)油相相對滲透率;nog為油氣系統(tǒng)油相指數(shù).
代理模型指通過訓練復雜度低的數(shù)學模型,替代原有模型進行設計優(yōu)化[16].常用的代理模型有克里金方法、多項式響應面法和神經(jīng)網(wǎng)絡方法等.本研究中構(gòu)建并對比了3種神經(jīng)網(wǎng)絡代理模型.
誤差逆?zhèn)鞑ィ╞ack propagation,BP)神經(jīng)網(wǎng)絡是一種典型多層前饋神經(jīng)網(wǎng)絡,只在一個方向訓練模型,不考慮過去輸入數(shù)據(jù)的反饋,任何一層的輸出不影響在同一層進行的訓練過程(即沒有記憶).
與前饋神經(jīng)網(wǎng)絡不同,基于反饋的神經(jīng)網(wǎng)絡是動態(tài)的,模型狀態(tài)不斷變化,直到達到平衡狀態(tài).傳統(tǒng)前饋神經(jīng)網(wǎng)絡不能處理順序輸入,而且所有輸入(和輸出)必須彼此獨立.而基于反饋的遞歸神經(jīng)網(wǎng)絡模型(recurrent neural network,RNN)提供門來存儲并利用之前輸入的順序信息,成為時間序列數(shù)據(jù)建模的有效選擇.
Email:cefs@vip.163.com(有意參加者,請先發(fā)郵件索要報名表)。投稿和演講日程等學術(shù)事宜,請聯(lián)系臧建成大夫(電話)13261797099
普通RNN 不能記憶長時間輸入,LSTM 是針對RNN的完善擴展,能記憶長時間輸入數(shù)據(jù),解決梯度消失問題.圖3 為單個LSTM 神經(jīng)元的運算示意圖.由圖3 可見,在1 個LSTM 單元結(jié)構(gòu)中,輸入t時刻輸入值xt、t-1時刻輸出值ht-1和t-1時刻單元狀態(tài)值ct-1,生成4 個加權(quán)輸入?yún)?shù)(Zo、Zi、Zf和Z),運算后輸出t時刻輸出值ht和t時刻單元狀態(tài)值ct.
圖3 單個LSTM神經(jīng)元的運算Fig.3 The operation of single LSTM neuron.
其中,下標f、i 和o 分別為遺忘門、輸入門和輸出門;W是輸入權(quán)值;U是循環(huán)權(quán)值;B為偏差.
雙向長短期記憶單元(bi-directional long shortterm memory,BiLSTM)網(wǎng)絡網(wǎng)絡是普通LSTM 網(wǎng)絡的升級演化,提出雙向架構(gòu)是為了利用過去和未來時間窗所有可用信息來訓練網(wǎng)絡.模型可從輸入到輸出、從輸出到輸入進行雙向訓練[17],優(yōu)化目標函數(shù)[18].通過雙向架構(gòu),兩個或多個LSTM 層可以在兩個方向進行堆疊,以實現(xiàn)最佳序列學習.
本研究神經(jīng)網(wǎng)絡優(yōu)化器采用均方根傳播(root mean square propagation,RMSProp)優(yōu)化器.均方根傳播是一種自適應學習率方法.RMSProp將動量思想引入梯度的累加計算中,使用指數(shù)衰減平均以丟棄遙遠過去的歷史,使其能夠在找到凸碗裝結(jié)構(gòu)后快速收斂[19],抑制梯度的鋸齒下降.在RMSProp算法中,對每個參數(shù)單獨迭代,每次迭代根據(jù)式(17)至式(19)完成.
其中,gt為t時刻沿著ωj方向的梯度值;?t為t時刻梯度的平方的指數(shù)平均值;?t-1為t-1 時刻梯度的平方的指數(shù)平均值;ρ為衰減速率.
其中,η為全局學習率;ωt為t時刻參數(shù);?為小常數(shù),用于除數(shù)過小時的數(shù)值穩(wěn)定.
機器學習被用于預測石油產(chǎn)量,過去的許多研究僅使用節(jié)流閥壓力和氣油比等工程參數(shù),沒有考慮與生產(chǎn)油藏地質(zhì)有關(guān)的參數(shù),如ALIYUDA 等[20]基于隨機森林算法實證研究了地質(zhì)參數(shù)對油田動態(tài)的重要影響.本研究通過正交試驗設計(orthogonal experimental design,DOE)法,涉及地質(zhì)、裂縫和生產(chǎn)等參數(shù)變量,設計473 套壓裂注氣/衰竭開發(fā)方案,試驗變量及其取值范圍如表2.其中,注氣模型因所涉及的地質(zhì)和流體條件變化范圍大,使用單一正交試驗設計表匹配的生產(chǎn)制度并不適用(如注氣量Q過大等).為符合實際生產(chǎn),調(diào)試不同范圍地質(zhì)、流體條件變化數(shù)模中生產(chǎn)制度,采用多個正交試驗設計表進行方案設計.
表2 試驗變量及其取值范圍Table 2 Test variables and the corresponding value range
根據(jù)試驗方案中的a、b、n和L取值,以L、水平井長度、最大裂縫半長和裂縫等間隔分布等作為限制條件,自動尋找a的近似值,并生成水平井水力裂縫位置和半長,建立對應油藏裂縫模型.自動參數(shù)生成與建模程序流程如圖4.
圖4 水平井水力裂縫構(gòu)建流程Fig.4 Programming flow chart of horizontal well hydraulic fracture construction.
基于Python編程建立值模擬模型并提取處理數(shù)據(jù),最終建立致密低滲雙孔雙滲油藏壓裂注氣和衰竭開發(fā)數(shù)據(jù)庫.
油田生產(chǎn)由一系列相互作用的地質(zhì)、流體、生產(chǎn)參數(shù)控制,所有參數(shù)重要性可用數(shù)字來描述和估計,用于確定包括建立日產(chǎn)油(field oil production rate,F(xiàn)OPR)、地層壓力(field pressure,F(xiàn)PR)和采出程度(field oil extraction,F(xiàn)OE)的油藏整體性能.隨機森林是一種通過袋外數(shù)據(jù)進行評估揭示所有輸入變量對預測貢獻的算法,該方法簡單且計算成本小.為防止樣本數(shù)據(jù)量小產(chǎn)生過擬合風險,如圖6,應用隨機森林算法[21]分別選取各預測代理模型重要性占比>2%的特征作為下一步訓練的輸入?yún)?shù).選取各預測代理模型特征參數(shù)如下:FOPR 代理模型特征參數(shù)包括生產(chǎn)時間t、Q、Cf、km、a、P和kfi;FPR 代理模型特征參數(shù)包括t、Cf、P、a和km;FOE 代理模型特征參數(shù)包括t、P、Cf、km、Q、a、kfn和L.由圖6可見,F(xiàn)OPR、FPR和FOE整體變化趨勢受時間因素影響較大,而地質(zhì)、生產(chǎn)和裂縫等參數(shù)對壓裂氣驅(qū)效果初始狀態(tài)影響較大.
預測代理模型可以根據(jù)歷史數(shù)據(jù)預測未知,準確地復制油藏模擬器的行為.通過BP 神經(jīng)網(wǎng)絡、LSTM 和BiLSTM 算法分別訓練3 種預測代理模型.為避免偶然性,調(diào)用程序自動將注氣和衰竭開發(fā)模型數(shù)據(jù)打亂混合,劃分訓練集(90%)和測試集(10%),利用訓練集分別訓練FOPR、FPR 和FOE預測代理模型,在測試集上進行盲測.采用的評價標準有均方根誤差(root mean square error,RMSE)、平均絕對誤差(mean absolute error,MAE)和決定系數(shù)(coefficient of determination,R2),如式(20)至式(22).
其中,y為真實值;為預測值;為真實值的平均值;N為測試樣本數(shù);i=1,2,…,N.
預測代理模型擬合結(jié)果如表3,真實值預測值對比如圖6.
由表3 可知,較FOPR 和FPR 預測代理模型,BP 神經(jīng)網(wǎng) 絡、LSTM 和BiLSTM 算法在FOE 預測代理模型上的表現(xiàn)最優(yōu).同一預測代理模型中,各算法的預測表現(xiàn)為BiLSTM >LSTM >BP.其中,BiLSTM和LSTM的預測表現(xiàn)十分接近,較BP神經(jīng)網(wǎng)絡效果好很多,說明LSTM 門結(jié)構(gòu)特點更適合解決時間序列相關(guān)問題,也驗證了圖5中時間重要性占比顯著的結(jié)論,而BiLSTM 網(wǎng)絡是普通LSTM 網(wǎng)絡的升級演化,模型從輸入到輸出、從輸出到輸入進行雙向訓練,能發(fā)掘隱藏信息,使其較傳統(tǒng)LSTM 可以更好預測復雜油藏條件壓裂氣驅(qū)產(chǎn)能隨時間變化規(guī)律.
圖5 FOPR、FPR和FOE 三種預測模型特征重要性暴風圖Fig.5 Characteristic importance storm chart prediction models of FOPR(blue column),FPR(red column),and FOE(green column).
表3 預測代理模型擬合結(jié)果Table 3 The fitting results of pridicted proxy models
圖6 為基于BiLSTM 算法的多個預測模型真實值預測值的對比.由圖6 可知,代理模型真實值與預測值的差異程度依次為FOPR >FPR >FOE,這與各預測代理模型數(shù)據(jù)分布范圍有密切關(guān)系,F(xiàn)OPR 預測代理模型的數(shù)據(jù)分布范圍最廣,F(xiàn)PR 次之,F(xiàn)OE預測代理模型的數(shù)據(jù)分布范圍最小.
基于RMSProp 的BiLSTM 算法提出預測代理模型,可準確高效地模擬預測致密低滲油藏壓裂井網(wǎng)氣驅(qū)效果.與油藏數(shù)值模擬結(jié)果對比,F(xiàn)OE預測代理模型準確度更高.不同預測代理模型準確性表現(xiàn)次序為BiLSTM >LSTM >BP,其中,BiLSTM 和LSTM 預測表現(xiàn)接近.綜合分析,BiLSTM 算法預測致密低滲油藏壓裂井網(wǎng)氣驅(qū)、衰竭開發(fā)效果最好.本研究基于深度學習算法所建立的壓裂氣驅(qū)效果預測代理模型,為指導致密低滲油藏高效生產(chǎn)提供借鑒.