馮中申(遼河油田興隆臺(tái)采油廠,遼寧 盤(pán)錦 124010)
用于動(dòng)液面軟測(cè)量的經(jīng)驗(yàn)?zāi)B(tài)分解和高斯過(guò)程回歸建模方法
馮中申(遼河油田興隆臺(tái)采油廠,遼寧 盤(pán)錦 124010)
動(dòng)液面的軟測(cè)量預(yù)測(cè)模型一直存在著預(yù)測(cè)精度不高、泛化能力差的缺點(diǎn),針對(duì)上述問(wèn)題本文提出基于經(jīng)驗(yàn)?zāi)B(tài)分解和高斯過(guò)程回歸相結(jié)合的算法對(duì)動(dòng)液面進(jìn)行預(yù)測(cè),以提高模型的預(yù)測(cè)精度,滿(mǎn)足實(shí)際的生產(chǎn)要求。
動(dòng)液面;經(jīng)驗(yàn)?zāi)B(tài)分解;高斯過(guò)程回歸
動(dòng)液面參數(shù)是油田生產(chǎn)指導(dǎo)的重要依據(jù),傳統(tǒng)的人工測(cè)量容易受到各種因素的影響,存在著實(shí)時(shí)性差、誤差大的缺陷,而現(xiàn)有的動(dòng)液面軟測(cè)量模型又達(dá)不到較高的預(yù)測(cè)精度。本文提出基于經(jīng)驗(yàn)?zāi)B(tài)分解[1]和高斯過(guò)程回歸相結(jié)合的算法對(duì)動(dòng)液面進(jìn)行預(yù)測(cè),以此改善模型的預(yù)測(cè)性能,提高預(yù)測(cè)精度。
軟測(cè)量建模過(guò)程中,對(duì)于主導(dǎo)變量而言,輔助變量的選取是否合理直接關(guān)系到建模質(zhì)量,影響模型的預(yù)測(cè)性能。在實(shí)際生產(chǎn)中,相關(guān)的可測(cè)變量有很多,如何選取輔助變量變得尤為重要。根據(jù)相關(guān)機(jī)理分析與先驗(yàn)知識(shí)得出:
其中,Ld為動(dòng)液面深度;Pt是井口套壓;Qr代表日產(chǎn)液量;泵效η;Δv為建模的動(dòng)態(tài)項(xiàng)。所以,輔助變量選取為泵效、套壓和日產(chǎn)液量。
在油田的現(xiàn)場(chǎng)開(kāi)采過(guò)程中,由于其復(fù)雜的生產(chǎn)環(huán)境影響,使得輔助變量的數(shù)據(jù)監(jiān)測(cè)傳感器在采集數(shù)據(jù)時(shí)難免受到噪聲干擾。噪聲對(duì)于建模數(shù)據(jù)的影響直接關(guān)系到建模質(zhì)量,所以本文提出采用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的方法對(duì)數(shù)據(jù)進(jìn)行去噪處理。經(jīng)驗(yàn)?zāi)B(tài)分解過(guò)程如下:
其中,x(t)為待分解信號(hào);c1(t),c2(t),...,cn(t)為一系列的本征模態(tài)函數(shù)(IMF),頻率由低到高排列;r(t)為殘差信號(hào)。由于先分解出來(lái)的IMF高頻數(shù)據(jù)為噪聲信號(hào)或者異常數(shù)據(jù),所以,刪除高頻的IMF成分并將其他段的IMF數(shù)據(jù)進(jìn)行重新整合作為輔助變量數(shù)據(jù)。
高斯過(guò)程回歸[2]是一種熱門(mén)的機(jī)器學(xué)習(xí)方法,相對(duì)于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)在處理高維數(shù)據(jù)和非線性復(fù)雜問(wèn)題的應(yīng)用上有明顯的適用性;建模的參數(shù)比較少并且有優(yōu)化簡(jiǎn)單的優(yōu)勢(shì),所以本文選取高斯過(guò)程回歸進(jìn)行軟測(cè)量建模。選用徑向基函數(shù)作為模型的協(xié)方差函數(shù),使用極大似然法對(duì)超參數(shù)θ=[w1,w2,…wm,v1,v0]進(jìn)行調(diào)整。選用的徑向基函數(shù)如下:
式中,v0是噪聲方差(服從高斯分布);wd是模型的測(cè)度參數(shù);v1是局部相關(guān)性程度;δij為算子Kronecker算子。
以某油田J18-32油井的實(shí)際產(chǎn)生數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)對(duì)本文提出的方法進(jìn)行驗(yàn)證分析。對(duì)同一口井采集350組數(shù)據(jù),200組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),150組數(shù)據(jù)作為測(cè)試數(shù)據(jù)。對(duì)傳感器采集的輔助變量數(shù)據(jù)進(jìn)行EMD處理,消除噪聲干擾。為了驗(yàn)證EMD算法對(duì)輔助變量去噪處理的有效性,對(duì)經(jīng)過(guò)去噪處理的輔助變量數(shù)據(jù)和未經(jīng)過(guò)處理的輔助變量數(shù)據(jù)分別進(jìn)行軟測(cè)量建模,對(duì)比分析實(shí)驗(yàn)結(jié)果。建模方法采用高斯過(guò)程回歸,模型對(duì)應(yīng)的協(xié)方差函數(shù)如式(1)所示,對(duì)于模型中的超參數(shù)θ=[w1,w2,…wm,v1,v0],w1~wm的初值均設(shè)置為1,v1和v0分別取2和0.01,假設(shè)認(rèn)為每個(gè)輔助變量對(duì)主導(dǎo)變量的貢獻(xiàn)是相同的,利用極大似然法對(duì)輸入的超參數(shù)最優(yōu)值進(jìn)行尋優(yōu)。仿真的結(jié)果圖如下:
圖1 不同方法的仿真結(jié)果圖
計(jì)算圖中兩種方法對(duì)應(yīng)預(yù)測(cè)結(jié)果的均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)。輔助變量經(jīng)過(guò)EMD處理的建模方法對(duì)應(yīng)的誤差值分別為16.569、28.653;輔助變量未經(jīng)過(guò)EMD處理的建模方法對(duì)應(yīng)的誤差值分別為21.843、35.964。通過(guò)誤差對(duì)比分析可知,輔助變量經(jīng)過(guò)EMD處理后的預(yù)測(cè)結(jié)果誤差明顯小于輔助變量未經(jīng)過(guò)去噪處理的預(yù)測(cè)結(jié)果誤差,由此可說(shuō)明EMD算法對(duì)于輔助變量去噪處理的有效性,可以提高模型的預(yù)測(cè)精度。
本文針對(duì)油田生產(chǎn)數(shù)據(jù)采集過(guò)程中存在的噪聲干擾,以及軟測(cè)量建模方法的選取對(duì)模型預(yù)測(cè)性能的影響問(wèn)題進(jìn)行了研究。提出經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的方法對(duì)輔助變量數(shù)據(jù)進(jìn)行去噪處理,以及更適用于復(fù)雜的非線性問(wèn)題和高維數(shù)據(jù)的高斯過(guò)程回歸進(jìn)行軟測(cè)量建模,對(duì)動(dòng)液面結(jié)果進(jìn)行預(yù)測(cè)。通過(guò)對(duì)實(shí)際生產(chǎn)數(shù)據(jù)進(jìn)行仿真分析,證明了本方法的有效性,確實(shí)能夠有效提升模型的預(yù)測(cè)精度。
[1]J Huang N E,Shen Z,Long S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-sta?tionary time series analysis[J].Proc.Rsoc.Lond.,1998,454:56-78
[2]Wang Huazhong(王華忠).Gaussian process and its appli?cation to soft-sensor modeling[J].Journal of Chemical Industry and Engineering(China)(化工學(xué)報(bào)),2007,58(11):2839-2845.