楊豐銘(遼河油田興隆臺(tái)采油廠(chǎng),遼寧 盤(pán)錦 124010)
基于KPCA和BH-LSSVM的動(dòng)液面軟測(cè)量建模
楊豐銘(遼河油田興隆臺(tái)采油廠(chǎng),遼寧 盤(pán)錦 124010)
針對(duì)動(dòng)液面?zhèn)鹘y(tǒng)的人工測(cè)量方法,不能實(shí)現(xiàn)實(shí)時(shí)測(cè)量和誤差大的缺陷,不利于實(shí)際生產(chǎn)指導(dǎo)的問(wèn)題。本文提出基于灰色關(guān)聯(lián)度、核主元分析(KPCA)和BH-LSSVM算法相結(jié)合的方法進(jìn)行動(dòng)液面軟測(cè)量建模,實(shí)現(xiàn)動(dòng)液面的實(shí)時(shí)準(zhǔn)確預(yù)測(cè),切實(shí)指導(dǎo)于實(shí)際生產(chǎn)應(yīng)用。
動(dòng)液面;灰色關(guān)聯(lián)度;核主元分析;BH-LSSVM算法
動(dòng)液面參數(shù)的變化能夠反映實(shí)際生產(chǎn)工況條件變化的趨勢(shì),對(duì)于油田生產(chǎn)運(yùn)行調(diào)度,達(dá)到合理運(yùn)行狀態(tài)有重要的指導(dǎo)意義。本文針對(duì)傳統(tǒng)人工測(cè)量方法的缺陷,提出動(dòng)液面的軟測(cè)量建模預(yù)測(cè)方法,通過(guò)灰色關(guān)聯(lián)度選取關(guān)聯(lián)度高的輔助變量;利用核主元分析法(KPCA)進(jìn)行數(shù)據(jù)有效特征的提取,避免冗余數(shù)據(jù)對(duì)建模質(zhì)量的影響;最后,采用黑洞算法對(duì)LSSVM建模參數(shù)進(jìn)行優(yōu)化,建立動(dòng)液面軟測(cè)量模型實(shí)現(xiàn)動(dòng)液面的實(shí)時(shí)準(zhǔn)確測(cè)量。
在油田實(shí)際開(kāi)采過(guò)程中,相關(guān)的可測(cè)變量有產(chǎn)氣量、流量、油壓、套壓、泵效、示功圖等等。如果選取的輔助變量與主導(dǎo)變量的關(guān)聯(lián)程度較低,會(huì)直接導(dǎo)致訓(xùn)練誤差變大。對(duì)于如何選取有效的輔助變量,本文提出采用灰色關(guān)聯(lián)度[1]進(jìn)行定量分析,計(jì)算變量間的關(guān)聯(lián)度rio如下:
ξio(n)為t=n時(shí)刻,輸入序列和輸出序列的關(guān)聯(lián)系數(shù);L為變量的個(gè)數(shù)。計(jì)算關(guān)聯(lián)度的大小進(jìn)行排序,最后選取套壓、泵效、流量作為輔助變量。
在油田的開(kāi)發(fā)利用中,生產(chǎn)工況的變化是一個(gè)慢時(shí)變的過(guò)程,相關(guān)生產(chǎn)數(shù)據(jù)在一段時(shí)間內(nèi)不會(huì)發(fā)生很大的變化。對(duì)于采集到的生產(chǎn)數(shù)據(jù)而言,其中的樣本相似度必然很高,容易產(chǎn)生冗余信息,造成模型的泛化能力變差。對(duì)此,本文提出采用核主元分析[2](KPCA)的方法,進(jìn)行主元特征提取,消除數(shù)據(jù)間的相關(guān)性,以提取的特征向量作為建模的樣本數(shù)據(jù)。核主元分析是將核函數(shù)引入到主元分析(PCA)中,對(duì)樣本進(jìn)行非線(xiàn)性變化實(shí)現(xiàn)樣本空間的映射,轉(zhuǎn)化為求核矩陣的特征值和特征向量問(wèn)題。本文采用的核函數(shù)為徑向基函數(shù):
最小二乘支持向量機(jī)(LSSVM)已成為機(jī)器學(xué)習(xí)研究的熱點(diǎn),是對(duì)支持向量機(jī)(SVM)的一種改進(jìn),實(shí)現(xiàn)了傳統(tǒng)的二次規(guī)劃問(wèn)題的轉(zhuǎn)化,以其優(yōu)越的運(yùn)算速度廣泛應(yīng)用于分類(lèi)、函數(shù)逼近和回歸的研究。LSSVM建模參數(shù)的選取直接關(guān)系到建模質(zhì)量和模型的預(yù)測(cè)精度,傳統(tǒng)的參數(shù)優(yōu)化算法容易陷入局部極值、出現(xiàn)早熟的現(xiàn)象,對(duì)于訓(xùn)練模型參數(shù)設(shè)置非常不利。對(duì)此,本文采用黑洞算法(BH)來(lái)對(duì)LSSVM模型的懲罰系數(shù)C和核參數(shù)σ進(jìn)行尋優(yōu)[3],以提高模型的預(yù)測(cè)精度,實(shí)現(xiàn)動(dòng)液面的準(zhǔn)確測(cè)量。
采用遼河某油田平臺(tái)的現(xiàn)場(chǎng)生產(chǎn)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),對(duì)本文提出的方法進(jìn)行有效性驗(yàn)證。分別采用核主元分析法對(duì)輔助變量數(shù)據(jù)進(jìn)行特征提取,減少冗余信息的建模方法和輔助變量樣本數(shù)據(jù)隨機(jī)選取的建模方法進(jìn)行對(duì)比實(shí)驗(yàn)分析。其中LSSVM模型中的懲罰因子C與核參數(shù)σ,采用BH算法尋優(yōu)。對(duì)黑洞優(yōu)化算法的參數(shù)進(jìn)行初始化設(shè)置:星體個(gè)數(shù)50,最大尋優(yōu)代數(shù)100,最優(yōu)解精度e為10-20,核參數(shù)σ設(shè)置范圍[1,2000],懲罰參數(shù)c設(shè)置范圍[0.01,50],自適應(yīng)度函數(shù)采用均方根誤差。為使仿真結(jié)果對(duì)比有意義,仿真模型的參數(shù)設(shè)置均相同。仿真結(jié)果如下圖所示:
圖1 不同算法的動(dòng)液面預(yù)測(cè)
計(jì)算兩種樣本選取方法模型的均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)。隨機(jī)樣本選取對(duì)應(yīng)的模型預(yù)測(cè)誤差值分別為23.462、32.122;樣本數(shù)據(jù)經(jīng)過(guò)核主元分析對(duì)應(yīng)的模型預(yù)測(cè)誤差值分別為16.652、26.862。通過(guò)實(shí)驗(yàn)結(jié)果對(duì)比分析可知,本文提出的核主元分析法能夠有效的提取數(shù)據(jù)特征,降低模型計(jì)算的復(fù)雜度,提高動(dòng)液面的預(yù)測(cè)精度。
本文針對(duì)傳統(tǒng)的人工測(cè)量方法對(duì)動(dòng)液面難以實(shí)現(xiàn)實(shí)時(shí)準(zhǔn)確測(cè)量,影響于實(shí)際生產(chǎn)指導(dǎo)的問(wèn)題。本文提出利用核主元分析法進(jìn)行數(shù)據(jù)的特征提取,消除數(shù)據(jù)間的相關(guān)性,降低模型的復(fù)雜度增強(qiáng)其泛化能力。通過(guò)黑洞優(yōu)化算法對(duì)LSSVM模型的參數(shù)進(jìn)行尋優(yōu),構(gòu)建軟測(cè)量模型實(shí)現(xiàn)動(dòng)液面預(yù)測(cè)。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證分析,得出本方法能夠有效提升模型的預(yù)測(cè)精度,實(shí)現(xiàn)動(dòng)液面的實(shí)時(shí)準(zhǔn)確測(cè)量。
[1]Jeng-shyng P.Application of gray relation analysis foe mul?tivariate time series[C].Eighth International Conference on Intelli?gent Systems Design and Applications,Washington,IEEE,2008: 432-437.
[2]Zhang Yingwei.Enhanced statistical analysis of nonlinear processes using KPCA,KIC A and SVM[J].Chemical Engineer in g Science,2009,64:801-811
[3]Wang Tong(王通),Gao Xianwen(高憲文),Jiang Zijian(蔣子健).Parameters optimizing of LSSVM based on black hole algo?rithm[J].Journal of Northeastern University:Natural Science(東北大學(xué)學(xué)報(bào):自然科學(xué)版),2014,35(2):170-174