侯智瑋,劉 勇,葉 鋒,官志銳,石 丹,楊興超
(中國石油遼河油田分公司勘探開發(fā)研究院,遼寧盤錦 124010)
CO2混相驅(qū)替的成功與否,在很大程度上取決于CO2與原油達(dá)到混相所需的最小混相壓力(MMP)。目前測定最小混相壓力的方法主要有實(shí)驗(yàn)方法和理論方法,實(shí)驗(yàn)方法主要有細(xì)管實(shí)驗(yàn)法[1]、上升氣泡儀法[2]、蒸汽密度法[3]、界面張力法[4]、多級混相接觸方法、溶脹/萃取實(shí)驗(yàn)方法等,其實(shí)驗(yàn)過程繁瑣,費(fèi)時(shí)費(fèi)力,且實(shí)驗(yàn)費(fèi)用昂貴,比如構(gòu)建一套完整的上升氣泡儀器需要15 000 美元,而構(gòu)建一套完整的細(xì)管實(shí)驗(yàn)儀器則大概需要40 000美元[5]。理論方法主要包含經(jīng)驗(yàn)公式法、圖版法、狀態(tài)方程法、數(shù)值模擬方法、智能優(yōu)化算法等。其中,經(jīng)驗(yàn)公式法和圖版法是根據(jù)某一特定油藏或特定的流體性質(zhì)而得到的,適用范圍較窄,精確度較差;狀態(tài)方程法在計(jì)算最小混相壓力時(shí),需要根據(jù)油藏的具體特性計(jì)算出混相函數(shù),而要確定具體混相函數(shù)比較復(fù)雜和困難;數(shù)值模擬方法要以大量的實(shí)驗(yàn)數(shù)據(jù)為基礎(chǔ),進(jìn)行PVT 數(shù)據(jù)擬合,建立數(shù)值模型,最后確定最小混相壓力,整個(gè)過程耗時(shí)比較長。
近年來,隨著智能優(yōu)化算法在油藏工程領(lǐng)域的廣泛應(yīng)用,許多學(xué)者嘗試?yán)迷撍惴▉眍A(yù)測CO2-原油體系最小混相壓力,其具有良好的魯棒性、快速性和精確性,能夠?qū)斎胱宰兞颗c輸出變量之間的復(fù)雜關(guān)系進(jìn)行建模。目前中外學(xué)者主要利用人工神經(jīng)網(wǎng)絡(luò)[6]、遺傳算法[7]、交替條件期望[8]、最小二乘支持向量機(jī)方法[9]、基因表達(dá)編程[10]及混合類算法[11-13]構(gòu)建預(yù)測模型。目前最小混相壓力預(yù)測模型主要存在以下缺點(diǎn):①模型大都是基于有限的數(shù)據(jù)點(diǎn)開發(fā)的,精確度差。②所使用的熱力學(xué)參數(shù)和油藏流體參數(shù)取值范圍有限。③模型預(yù)測的相關(guān)性不能準(zhǔn)確地描述最小混相壓力隨輸入?yún)?shù)變化的趨勢。如根據(jù)實(shí)驗(yàn)數(shù)據(jù),最小混相壓力隨著油藏溫度的升高而增大,然而一些預(yù)測模型未能體現(xiàn)出這種關(guān)系。
為解決目前模型中數(shù)據(jù)點(diǎn)過少和模型精確度太低的問題,提出基于高斯過程回歸(GPR)和差分進(jìn)化算法(DE)的GPR-DE 模型來預(yù)測CO2-原油體系最小混相壓力。
通常模型或相關(guān)參數(shù)的適用性、可靠性和準(zhǔn)確性與所使用基礎(chǔ)數(shù)據(jù)的全面性和有效性有關(guān)。本次采用的數(shù)據(jù)庫,比以往文獻(xiàn)中數(shù)據(jù)更多,各項(xiàng)數(shù)據(jù)的取值范圍也更廣,主要包括油藏溫度、注入氣體中不同組分的組成、原油中C5+組分的分子質(zhì)量(MWC5+)、原油中揮發(fā)組分與中間組分的比值、注入氣體的臨界溫度和最小混相壓力等,其實(shí)驗(yàn)數(shù)據(jù)主要來源于中外35個(gè)油田,據(jù)此總結(jié)了各項(xiàng)參數(shù)取值范圍(表1)。
表1 不同參數(shù)的取值范圍Table1 Value range of different parameters
1.2.1 高斯過程回歸
GPR 是基于貝葉斯學(xué)習(xí)和統(tǒng)計(jì)理論發(fā)展起來的一種機(jī)器學(xué)習(xí)方法,在處理高維數(shù)和非線性等復(fù)雜回歸問題時(shí)具有較大優(yōu)勢[14-15],主要包括以下步驟。
第一步,預(yù)測過程。假設(shè)訓(xùn)練數(shù)據(jù)集為D=。f(xi)用來描述輸入變量的隨機(jī)過程。GPR 由均值函數(shù)m(x)和協(xié)方差函數(shù)k(x,x′)確定,因此,GPR可以定義為:
一般情況下,GPR模型可以表示為:
由于,ε~N(0,),因此(4)式可變?yōu)椋?/p>
依據(jù)貝葉斯原理,在測試數(shù)據(jù)集D*=[(X*,y*)]可以得到訓(xùn)練數(shù)據(jù)輸出和測試數(shù)據(jù)輸出的高斯分布為:
在訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集確定后,可以計(jì)算出預(yù)測值的后驗(yàn)概率分布為:
第二步,訓(xùn)練過程。協(xié)方差核函數(shù)是對稱正定函數(shù),常用的協(xié)方差核函數(shù)為平方指數(shù)函數(shù):
通過建立訓(xùn)練樣本的負(fù)對數(shù)似然函數(shù)計(jì)算超參數(shù)的初始值,并對每一項(xiàng)求偏導(dǎo),再利用優(yōu)化算法對偏導(dǎo)最小化得到超參數(shù)的最優(yōu)解:
求得最優(yōu)超參數(shù)后,利用(8)和(9)式可求得測試數(shù)據(jù)對應(yīng)的預(yù)測值均值和方差,最終高斯過程回歸的關(guān)系式如下:
1.2.2 差分進(jìn)化算法
DE 算法是由RAINER 等于1997 年在遺傳算法等進(jìn)化思想的基礎(chǔ)上提出的,用于求解多維空間中的整體最優(yōu)解[16]。由于該算法具有尋優(yōu)能力強(qiáng)、收斂速度快、魯棒性強(qiáng)等特點(diǎn)[17],因而被廣泛應(yīng)用在數(shù)據(jù)挖掘、模式識別、油氣田開發(fā)等各個(gè)領(lǐng)域。差分進(jìn)化算法主要包括以下步驟。
第一步,種群初始化操作。在N維可行解空間隨機(jī)生成初始種群。
第二步,變異操作。從初始種群中隨機(jī)選取3個(gè)個(gè)體進(jìn)行變異操作,得到變異后的種群:
第三步,交叉操作。將變異種群和初始種群交叉操作,得到交叉后的種群:
第四步,選擇操作?;谪澙愤x擇方法,從初始種群和變異種群中選擇適應(yīng)度更高的個(gè)體進(jìn)入下一代。當(dāng)變異個(gè)體的適應(yīng)度優(yōu)于時(shí),變異個(gè)體取代原個(gè)體,反之放棄變異個(gè)體,保留原個(gè)體,得到選擇后的個(gè)體:
第五步,參數(shù)選擇。差分進(jìn)化算法的控制參數(shù)主要是種群規(guī)模、縮放因子和交叉概率,算法的性能很大程度上取決于控制參數(shù)的取值。
構(gòu)建模型的過程主要包括:第一步,確定輸入和輸出變量。輸入變量包括油藏溫度、原油中C5+組分的分子質(zhì)量、原油中揮發(fā)組分(C1和N2)/中間組分(C2—C5,H2S 和CO2)、注入氣體的臨界溫度和CO2-原油體系最小混相壓力實(shí)驗(yàn)數(shù)據(jù),輸出變量包括CO2-原油體系最小混相壓力預(yù)測值。第二步,訓(xùn)練和測試樣本的選取。為建立準(zhǔn)確可靠的模型,將模型所用數(shù)據(jù)集隨機(jī)分為兩個(gè)不同的樣本,作為訓(xùn)練樣本和測試樣本。其中訓(xùn)練樣本包含大約80%的數(shù)據(jù)點(diǎn)(約260 個(gè)數(shù)據(jù)點(diǎn)),用于模型開發(fā)和學(xué)習(xí)CO2-原油體系最小混相壓力的物理規(guī)律。測試樣本包括剩余20%的數(shù)據(jù)點(diǎn)(大約65個(gè)數(shù)據(jù)點(diǎn)),用于評估模型的準(zhǔn)確性和有效性。第三步,建立CO2-原油體系最小混相壓力模型。GPR-DE 模型在編程軟件MATLAB 環(huán)境下實(shí)現(xiàn),其中DE 用來優(yōu)化GPR 中的超參數(shù),使模型精確度更好,構(gòu)建模型的流程如圖1所示。
圖1 GPR-DE模型流程Fig.1 Flow chart of GPR-DE model
由于樣本量過大,從預(yù)測結(jié)果中選取了15組代表性數(shù)據(jù)進(jìn)行分析。由表2 可知,模型預(yù)測結(jié)果與實(shí)驗(yàn)數(shù)據(jù)接近,為更加準(zhǔn)確評價(jià)模型的誤差,利用統(tǒng)計(jì)誤差分析和圖形誤差分析來評價(jià)GPR-DE 模型預(yù)測精確度。
表2 GPR-DE模型部分預(yù)測結(jié)果Table2 Partial prediction results of GPR-DE model
2.1.1 統(tǒng)計(jì)誤差分析
為了綜合評價(jià)GPR-DE 模型預(yù)測結(jié)果的準(zhǔn)確性和精確度,對模型預(yù)測結(jié)果的平均絕對相對誤差、平均相對誤差、均方根誤差、標(biāo)準(zhǔn)差、平方相關(guān)系數(shù)等誤差參數(shù)進(jìn)行了綜合誤差研究。其表達(dá)式分別為:
其中:
分析各項(xiàng)誤差參數(shù),結(jié)果表明,平均絕對相對誤差的大小最有說服力,平均絕對相對誤差越小,模型的精確度越高。GPR-DE 模型計(jì)算的平均絕對相對誤差為2.060%,標(biāo)準(zhǔn)差為0.053 2,平均相對誤差為-0.183%,均方根誤差為0.655。
2.1.2 圖形誤差分析
將GPR-DE 模型預(yù)測的最小混相壓力與實(shí)驗(yàn)獲得的最小混相壓力交會(huì)(圖2),數(shù)據(jù)點(diǎn)在45°線(X=Y)附近集中分布,證明其精確度較高。另外,還可以用模型的相關(guān)系數(shù)平方(R2)來表示,其值越大,模型精確度越高。由圖2可以看出,R2為0.984 7,證明GPR-DE 模型精確度較高。預(yù)測結(jié)果數(shù)據(jù)點(diǎn)在0°線附近集中(圖3),也證明GPR-DE 模型精確度較高。
圖2 GRE-DE模型數(shù)據(jù)交會(huì)圖Fig.2 Data crossplot of GRE-DE model
圖3 GRE-DE模型結(jié)果相對誤差Fig.3 Relative error of GRE-DE model results
2.2.1 統(tǒng)計(jì)誤差對比
現(xiàn)有預(yù)測模型多數(shù)僅能預(yù)測純CO2-原油體系最小混相壓力,而本文提出的GPR-DE 模型既可以預(yù)測純CO2-原油體系最小混相壓力,還能預(yù)測非純CO2-原油體系最小混相壓力。為證明其精確度,對比部分文獻(xiàn)模型預(yù)測結(jié)果的統(tǒng)計(jì)誤差。由表3可以看出,ANFIS-PSO,ANFIS-GA 提出的模型精確度較高。GLASO 和KAMARI 提出的模型精確度低。本文提出的GPR-DE 模型的平均絕對相對誤差為2.060%,平均相對誤差為-0.183%,均方根誤差為0.655,整體上來看誤差小。因此,本文提出的GPRDE模型精確度高于其他模型。
表3 不同模型預(yù)測結(jié)果的統(tǒng)計(jì)誤差對比Table3 Comparison between statistical errors in prediction results of different models
2.2.2 圖形誤差對比
分別繪制GPR-DE模型、ANFIS-PSO模型及YELLIG,SHOKIR和LEE提出的模型預(yù)測結(jié)果交會(huì)圖,并對比其相關(guān)系數(shù)平方。由圖2和圖4—圖7可看出,本文提出的GPR-DE模型的相關(guān)系數(shù)平方(R2為0.984 7)最大,證明GPR-DE模型的精確度較高。
圖4 ANFIS-PSO模型結(jié)果交會(huì)圖Fig.4 Crossplot of ANFIS-PSO model results
為驗(yàn)證模型的有效性和可靠性,需要證明模型預(yù)測結(jié)果與實(shí)驗(yàn)數(shù)據(jù)隨各變量的變化趨勢是一致的。分析油藏溫度、原油中C5+組分的分子質(zhì)量、揮發(fā)組分/中間組分和注入氣體臨界溫度4 個(gè)輸入?yún)?shù)的敏感性。
由圖8—圖11 可看出,模型預(yù)測結(jié)果與實(shí)驗(yàn)數(shù)據(jù)呈較好的一致性。模型預(yù)測的最小混相壓力隨著油藏溫度、原油中C5+組分的分子質(zhì)量、揮發(fā)組分/中間組分的增大而增大,隨著注入氣體臨界溫度的增大而降低,證明本文提出的GPR-DE模型可靠。
圖5 YELLIG模型結(jié)果交會(huì)圖Fig.5 Crossplot of YELLIG model results
圖6 SHOKIR模型結(jié)果交會(huì)圖Fig.6 Crossplot of SHOKIR model results
圖7 LEE模型結(jié)果交會(huì)圖Fig.7 Crossplot of LEE model results
圖8 最小混相壓力隨油藏溫度的變化Fig.8 Relationship between minimum miscibility pressure and reservoir temperature
圖9 最小混相壓力隨MWC5+的變化Fig.9 Relationship between minimum miscibility pressure and MWC5+
圖10 最小混相壓力隨揮發(fā)組分/中間組分的變化Fig.10 Relationship between minimum miscibility pressure and volatile components/intermediate components
圖11 最小混相壓力隨注入氣體的臨界溫度的變化Fig.11 Relationship between minimum miscibility pressure and critical temperature
利用統(tǒng)計(jì)誤差和圖形誤差評價(jià)GPR-DE 模型的精確度,并與現(xiàn)有模型的預(yù)測結(jié)果進(jìn)行了對比。結(jié)果表明,GPR-DE 模型預(yù)測最小混相壓力精確度最高,平均絕對相對誤差僅為2.060%,在現(xiàn)有模型中誤差最低。通過分析參數(shù)敏感性、統(tǒng)計(jì)誤差和圖形誤差,驗(yàn)證了模型的有效性和可靠性。GPR-DE模型具有容易實(shí)現(xiàn)、精確度高、收斂速度快、魯棒性強(qiáng)、使用范圍廣等優(yōu)點(diǎn),不僅可以用于預(yù)測CO2-原油體系最小混相壓力,還可以預(yù)測其他氣體和原油體系最小混相壓力,為最小混相壓力的預(yù)測提供了一個(gè)簡單、便捷、精確度高的新方法。
符號解釋
averageMMPpred——模型預(yù)測值的平均值,MPa;
AAPRE——平均絕對相對誤差百分比,%;
APRE——平均相對誤差百分比,%;
cov(y*)——測試數(shù)據(jù)x*對應(yīng)預(yù)測值y*的方差;
C——噪聲觀測矢量;
CR——交叉概率;
D——訓(xùn)練數(shù)據(jù)集;
DE——差分進(jìn)化算法;
Ei——相對誤差百分比,%;
E[f(x)]——期望函數(shù);
F——縮放因子;
f(x)——高斯過程回歸函數(shù);
GP——高斯過程;
GPR——高斯過程回歸;
In——n維單位矩陣;
i,j——個(gè)體的第i,j個(gè)分量;
k(x,x')——協(xié)方差函數(shù);
k(x*,x*)——測試點(diǎn)x*本身的協(xié)方差;
K(X,X)——n階對稱正定的協(xié)方差矩陣;
K(X,x*)——訓(xùn)練數(shù)據(jù)X與測試數(shù)據(jù)x*之間的n維列向量;
l——方差尺度;
L(θ)——負(fù)對數(shù)似然函數(shù);
m(x)——均值函數(shù);
MMP——最小混相壓力,MPa;
MMPiexp——第i組最小混相壓力實(shí)驗(yàn)數(shù)據(jù),MPa;
MMPipred——第i組最小混相壓力預(yù)測值,MPa;
MWC5+——原油中C5+組分的分子質(zhì)量,g/mol;
N——構(gòu)建模型數(shù)據(jù)個(gè)數(shù),取值為325;
Np——種群規(guī)模;
randn(i)——1,2,…,N之間的隨機(jī)量;
rand(j)——[0,1]之間的隨機(jī)數(shù);
R2——相關(guān)系數(shù)平方;
RMSE——均方根誤差;
SD——標(biāo)準(zhǔn)差;
t——種群代數(shù);
xi——D中第i個(gè)輸入變量;
x*——測試數(shù)據(jù)X*中的測試點(diǎn);
X——訓(xùn)練數(shù)據(jù);
X*——測試數(shù)據(jù);
y——訓(xùn)練數(shù)據(jù)X對應(yīng)的輸出;
yi——D中第i個(gè)輸出結(jié)果;
y*——測試點(diǎn)x*對應(yīng)的預(yù)測值;
α——估計(jì)參數(shù);
θ——模型的超參數(shù);
θi——模型的第i個(gè)超參數(shù);
ε——服從高斯分布的噪聲;