翟 亮
(1.中國石油大學(xué)(華東)石油工程學(xué)院,山東 青島 266580;2.中國石化勝利油田分公司勘探開發(fā)研究院,山東 東營 257015)
勝利油區(qū)埕島油田22F井區(qū)是中國最早投入開發(fā)建設(shè)的年產(chǎn)油量百萬噸級的灘海邊際油田,位于渤海灣南部的極淺海海域,為典型的復(fù)式油氣田,含油面積為1.27 km2,上報石油地質(zhì)儲量為5.29×106t,綜合含水率為80.2%,采出程度為29.2%,處于高含水的初期階段,剩余可采儲量規(guī)模較大。為進(jìn)一步提高油藏采收率,改善油田的整體開發(fā)效果,亟需開展吸水剖面的預(yù)測研究,準(zhǔn)確把握油藏各個層段的注水情況[1-3]。由于油藏縱向非均質(zhì)性較嚴(yán)重,現(xiàn)有的KH 劈分和劈分系數(shù)等方法未考慮注采系統(tǒng)和動態(tài)生產(chǎn)參數(shù)對注水井吸水剖面的影響,其劈分結(jié)果均不能準(zhǔn)確反映油藏的實際吸水情況[4-8]。
近年來,機(jī)器學(xué)習(xí)和人工智能技術(shù)在互聯(lián)網(wǎng)[9]、金融[10]和智慧醫(yī)療[11-12]等領(lǐng)域起到了推動作用,極大地提高了生產(chǎn)效率。目前,機(jī)器學(xué)習(xí)在石油行業(yè)的應(yīng)用主要集中在鉆完井[13-14]、地質(zhì)解釋[15]、測井解釋[16-17]和故障診斷[18-20]等方面,在油藏工程上的研究相對較少。由于機(jī)器學(xué)習(xí)方法能夠利用學(xué)習(xí)任務(wù)的數(shù)據(jù),學(xué)習(xí)并生成特定于該任務(wù)的預(yù)測模型,挖掘數(shù)據(jù)中物理規(guī)律和知識,目前已在油氣田開發(fā)中取得較好應(yīng)用效果,主要體現(xiàn)在油井生產(chǎn)指標(biāo)預(yù)測、井間連通性分析、生產(chǎn)優(yōu)化和歷史擬合等方面[21-31]?;诖耍梦拭尜Y料,分析并確定影響吸水剖面的主要地質(zhì)參數(shù)和動態(tài)生產(chǎn)參數(shù),進(jìn)而結(jié)合XGBoost 算法[32-33]建立吸水剖面預(yù)測模型,實現(xiàn)對吸水剖面的實時預(yù)測,為準(zhǔn)確認(rèn)識油藏各層段的注水情況提供數(shù)據(jù)基礎(chǔ),也為合理調(diào)配注水方法提供指導(dǎo)。
吸水剖面的動態(tài)變化主要受油藏地質(zhì)參數(shù)和注采系統(tǒng)動態(tài)生產(chǎn)參數(shù)的影響,因此,利用回溯關(guān)聯(lián)分析,對小層吸水量與注采系統(tǒng)中相關(guān)靜態(tài)地質(zhì)參數(shù)和動態(tài)開發(fā)參數(shù)進(jìn)行關(guān)聯(lián)性分析,依據(jù)關(guān)聯(lián)度的大小篩選、確定影響吸水剖面的主要因素。關(guān)聯(lián)度的計算包括4個步驟。
確定分析序列 吸水剖面的影響因素主要包括注采系統(tǒng)的靜態(tài)地質(zhì)參數(shù)和動態(tài)開發(fā)參數(shù),靜態(tài)地質(zhì)參數(shù)主要包括孔隙度、滲透率和有效厚度等,動態(tài)開發(fā)參數(shù)包括產(chǎn)量、注入量和井口壓力等。將影響吸水剖面的各個特征參數(shù)當(dāng)作比較序列,構(gòu)建分析矩陣為:
以小層吸水量作為參考數(shù)據(jù)列 關(guān)聯(lián)性分析目的在于確定與吸水剖面相關(guān)性較大的參數(shù),因而以小層吸水量數(shù)據(jù)列作為參考數(shù)據(jù)列,表示為:
無量綱化序列 考慮到各序列參數(shù)之間的數(shù)量級和量綱的不同會影響關(guān)聯(lián)性分析結(jié)果,因此需要對這些原始數(shù)據(jù)進(jìn)行無量綱化處理,這里采用均值法對序列進(jìn)行無量綱化處理,具體計算式為:
計算吸水量與各因素之間的關(guān)聯(lián)系數(shù) 依次計算由特征參數(shù)構(gòu)成的比較序列與小層吸水量構(gòu)成的參考數(shù)據(jù)列之間的關(guān)聯(lián)度,即:
其中:
依據(jù)各個影響因素與小層吸水量的關(guān)聯(lián)度進(jìn)行排序,從而剔除與小層吸水量關(guān)聯(lián)度小的無關(guān)特征,構(gòu)建最相關(guān)的特征參數(shù),用于XGBoost模型的訓(xùn)練和預(yù)測。
XGBoost 算法是一種以CART 決策樹模型為基礎(chǔ)的集成學(xué)習(xí)方法,通過構(gòu)建多棵CART 決策樹來提供預(yù)測模型的準(zhǔn)確性,最后將每輪訓(xùn)練得到?jīng)Q策樹的預(yù)測結(jié)果求和得到最終的預(yù)測值[33]。相較于GBDT 算法,XGBoost 算法在目標(biāo)函數(shù)中添加正則項,可有效防止過擬合,其第t棵CART 決策樹的目標(biāo)函數(shù)定義如下:
其中:
在進(jìn)行特征節(jié)點選擇時,遍歷訓(xùn)練集所有特征變量的取值,用節(jié)點分裂前的目標(biāo)函數(shù)值減去分裂后2個葉子節(jié)點的目標(biāo)函數(shù)值之和,計算增益值,得到樹模型最優(yōu)的切分點,其中增益值計算式為:
在測試集上評價預(yù)測模型的泛化能力,即模型的吸水剖面預(yù)測效果。采用的預(yù)測效果評價指標(biāo)主要包括:決定系數(shù)R2、平均相對誤差MAPE、均方誤差RMSE,其表達(dá)式分別為:
考慮到吸水剖面預(yù)測模型的現(xiàn)場實用性,結(jié)合滲流理論和油藏工程師的經(jīng)驗,篩選出現(xiàn)場廣泛易獲取的參數(shù)作為初始的特征參數(shù),對于注水井,主要包括:孔隙度、滲透率、有效厚度、注入壓力、日注入水平和累積注水量;對于生產(chǎn)井,主要包括:孔隙度、滲透率、有效厚度、井距、日產(chǎn)液水平、油壓、累積產(chǎn)油量、累積產(chǎn)水量和含水率。結(jié)合埕島油田22F 井區(qū)監(jiān)測的吸水剖面資料,建立初始的吸水剖面數(shù)據(jù)集,部分?jǐn)?shù)據(jù)如表1所示。
表1 部分吸水剖面數(shù)據(jù)Table1 Water injection profile data
為了提高學(xué)習(xí)模型的準(zhǔn)確性,利用油藏工程方法對選取的特征參數(shù)進(jìn)行預(yù)處理。
注水井的注入壓力 為了充分體現(xiàn)每個小層特征的差異性,需根據(jù)井口壓力計算每個小層的注入壓力,具體計算公式為:
生產(chǎn)井的孔隙度和滲透率 生產(chǎn)井中小層的孔喉性質(zhì)和滲流特性對注水井的吸水剖面產(chǎn)生影響,因而根據(jù)小層的厚度加權(quán)求平均孔隙度和平均滲透率。計算公式分別為:
通過灰色關(guān)聯(lián)分析,從眾多影響因素中篩選出與吸水剖面最相關(guān)的特征,建立預(yù)測模型。各特征參數(shù)與吸水剖面的關(guān)聯(lián)度分析結(jié)果如圖1所示。
圖1 各特征參數(shù)與吸水剖面的關(guān)聯(lián)度Fig.1 Correlations of characteristic parameters with water injection profile
從圖1可以看出,注水井的有效厚度,生產(chǎn)井的日產(chǎn)液水平、油壓、累積產(chǎn)水量與吸水剖面的相關(guān)性最強(qiáng),關(guān)聯(lián)度均大于0.7。注水井的滲透率、注入壓力,生產(chǎn)井的有效厚度、含水率、累積產(chǎn)油量與吸水剖面關(guān)聯(lián)度為0.10~0.45,為中等強(qiáng)度的關(guān)聯(lián)性,而其余參數(shù)與吸水剖面的關(guān)聯(lián)度幾乎為0,為弱關(guān)聯(lián)或無關(guān)聯(lián)特征。因此,選擇與吸水剖面相關(guān)的特征參數(shù):注水井的有效厚度、滲透率、注入壓力和生產(chǎn)井的日產(chǎn)液水平、累積產(chǎn)水量、油壓、有效厚度、累積產(chǎn)油量、含水率作為XGBoost 模型的輸入特征參數(shù)。結(jié)合特征屬性和吸水剖面數(shù)據(jù)構(gòu)成數(shù)據(jù)集,并以8∶1∶1 的比例將該數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集,分別用于XGBoost模型的訓(xùn)練、參數(shù)調(diào)優(yōu)和預(yù)測效果測試。
XGBoost 算法需要調(diào)優(yōu)的模型超參數(shù)主要包括:學(xué)習(xí)率、樹模型個數(shù)、最大樹深度、正則參數(shù)γ,α和λ。采用K 折交叉驗證和網(wǎng)格搜索相結(jié)合的參數(shù)調(diào)優(yōu)方法,確定XGBoost的最優(yōu)超參數(shù)主要包括:學(xué)習(xí)率為0.15,樹模型個數(shù)為25,最大樹深度為7,正則參數(shù)γ為0.05,α為0.03,λ為1。
利用訓(xùn)練好的XGBoost 模型預(yù)測測試集中的吸水剖面,計算各個模型評價指標(biāo)分別為R2為0.87,MAPE為0.96,RMSE為3.12。從模型在測試集上的評價指標(biāo)可以看出,模型的預(yù)測值和實際值的吻合度較高,預(yù)測效果較好。選取測試集中注水井22FC-3 的吸水剖面,應(yīng)用XGBoost 模型預(yù)測方法與KH 劈分方法,由對比結(jié)果(圖2)可以看出,XGBoost模型的預(yù)測值與實際值的吻合度要好于KH 劈分方法,說明考慮了動態(tài)參數(shù)對吸水剖面影響的XG?Boost預(yù)測模型更能反映油藏的實際吸水情況,滿足礦場的應(yīng)用需求。
圖2 XGBoost模型預(yù)測值與實際吸水剖面的對比結(jié)果Fig.2 Comparison results of XGBoost model prediction with actual water injection profile
提出了基于XGBoost 算法的吸水剖面預(yù)測方法,能夠利用井區(qū)現(xiàn)有的吸水剖面資料,通過訓(xùn)練和學(xué)習(xí)得到吸水剖面預(yù)測模型,可有效反演和預(yù)測吸水剖面的動態(tài)變化。通過灰色關(guān)聯(lián)分析準(zhǔn)確提取了與吸水剖面最相關(guān)的靜態(tài)地質(zhì)參數(shù)和動態(tài)開發(fā)參數(shù),用于構(gòu)建預(yù)測模型的輸入特征,有助于認(rèn)識吸水剖面的影響機(jī)理。同時,模型的復(fù)雜度得以有效降低,模型的訓(xùn)練速度和泛化性能得以提高。利用XGBoost 模型準(zhǔn)確挖掘了吸水剖面與各參數(shù)之間的相關(guān)關(guān)系,能夠?qū)崿F(xiàn)對吸水剖面的連續(xù)準(zhǔn)確預(yù)測。在埕島油田22F 井區(qū)的應(yīng)用研究表明,所提出的吸水剖面預(yù)測方法相較于KH 劈分方法,預(yù)測效果更好,便于油田實際應(yīng)用,具有較高的礦場應(yīng)用價值。
符號解釋