馬 群 王勝軍 蔣國(guó)軍 何 飛 郭宇恒 胡家榮
(1.中國(guó)石油塔里木油田公司庫(kù)車(chē)油氣開(kāi)發(fā)部,新疆 庫(kù)爾勒 841000;2.中國(guó)石油塔里木油田公司開(kāi)發(fā)事業(yè)部 新疆 庫(kù)爾勒 841000)
無(wú)阻流量是描述氣井產(chǎn)能的重要指標(biāo)之一,是確定氣井合理工作制度的重要依據(jù),一般通過(guò)產(chǎn)能試井得到,繼產(chǎn)能試井之后,又相繼提出了單點(diǎn)試井、等時(shí)試井等方法,上述測(cè)試方法所獲得的產(chǎn)能多數(shù)是以二項(xiàng)式分析方法以及指數(shù)式分析方法為基礎(chǔ)完成的[1]。但對(duì)于庫(kù)車(chē)前陸盆地地質(zhì)構(gòu)造極為復(fù)雜、地層壓力超高(122 MPa大于100 MPa)、埋藏超深(7 000 m大于6 000 m)、地層溫度超高(168℃)的典型“三超”氣井[2]來(lái)說(shuō),進(jìn)行產(chǎn)能測(cè)試不僅面臨較大困難,而且壓力超高,超出壓力平方二項(xiàng)式產(chǎn)能方程適用范圍[3],進(jìn)而導(dǎo)致傳統(tǒng)方法不能獲得理想的預(yù)測(cè)效果。基于此,尋找一種預(yù)測(cè)準(zhǔn)確且方便的“三超”氣井產(chǎn)能預(yù)測(cè)方法尤為重要。筆者以keS區(qū)塊為研究工區(qū),利用收集到的氣井靜態(tài)資料結(jié)合探井資料,建立多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)3種預(yù)測(cè)模型,運(yùn)用建立好的預(yù)測(cè)模型對(duì)檢驗(yàn)樣本進(jìn)行產(chǎn)能預(yù)測(cè),根據(jù)其預(yù)測(cè)結(jié)果優(yōu)選一種適合庫(kù)車(chē)前陸盆地“三超”氣井產(chǎn)能預(yù)測(cè)的新方法。
在氣田開(kāi)發(fā)過(guò)程中影響氣井無(wú)阻流量的因素有很多,據(jù)前人對(duì)氣井產(chǎn)能預(yù)測(cè)的研究[4-5]可知,影響氣井產(chǎn)能的因素主要有儲(chǔ)層滲透率、測(cè)井孔隙度、含水飽和度、氣層有效厚度、地層壓力、地層系數(shù)、裂縫密度、地層溫度、天然氣相對(duì)密度和臨界壓力。收集到的KeS區(qū)塊共31口井所組成的數(shù)據(jù)集見(jiàn)表1。
多元線性回歸的單井產(chǎn)能預(yù)測(cè)其原理是用多個(gè)影響因素作為自變量線性表示因變量的變化。假定因變量和自變量參數(shù)之間存在如下線性關(guān)系:
式中,Y為可觀測(cè)的隨機(jī)變量;ai為自變量系數(shù)(i=0,1,2,3,…,10),也稱(chēng)回歸系數(shù);X1為儲(chǔ)層滲透率,mD;X2為孔隙度,%;X3為氣層有效厚度,m;X4為地層壓力,MPa;X5為含水飽和度,%;X6為地層系數(shù),mD·m;X7為裂縫密度,條/m;X8為地層溫度,℃;X9為天然氣相對(duì)密度;X10為臨界壓力,MPa;ε0為不可觀測(cè)的隨機(jī)誤差。
利用本次收集到的31口單井?dāng)?shù)據(jù)構(gòu)建相應(yīng)模型。利用建立的模型在SPSS軟件中對(duì)31口井的數(shù)據(jù)進(jìn)行了綜合分析,得出主要影響因素的影響程度,即相關(guān)系數(shù)R和判定系數(shù)R2(判定線性回歸的擬合程度)。由該模型擬合的相關(guān)系數(shù)R為0.895可知,相關(guān)性較好;R2為0.801(大于0.8),則擬合結(jié)果較為理想。運(yùn)用SPSS軟件對(duì)基于多元線性回歸的單井產(chǎn)能預(yù)測(cè)模型進(jìn)行求解,得到相關(guān)系數(shù),將相關(guān)系數(shù)帶入公式(1)得回歸擬合公式(2),進(jìn)而可預(yù)測(cè)氣井產(chǎn)能,其預(yù)測(cè)結(jié)果見(jiàn)圖1。
表1 樣本數(shù)據(jù)集表
圖1 多元線性回歸預(yù)測(cè)結(jié)果圖
BP神經(jīng)網(wǎng)絡(luò)是1956年由Rumelhart和Meeelland為首的科學(xué)家小組提出[6],它實(shí)際上是一個(gè)非線性多元回歸方法,包括輸入層、隱含層和輸出層,上下層之間實(shí)現(xiàn)全連接,而每層神經(jīng)元之間無(wú)連接[7]。輸入樣本從輸入層經(jīng)隱含層逐層傳遞至輸出層,如果輸出層的實(shí)際輸出與期望輸出的誤差在允許程度內(nèi),則結(jié)束學(xué)習(xí)算法;如果輸出層的實(shí)際輸出與期望輸出的誤差較大,則轉(zhuǎn)至誤差反向傳播,即輸出誤差通過(guò)隱含層反向直至輸入層,在反傳過(guò)程中將誤差分?jǐn)偨o各層的各個(gè)單元,獲得各層各單元的誤差信號(hào),作為其修正各單元權(quán)值的依據(jù)[8],這一計(jì)算過(guò)程使用梯度下降法完成。在不停地調(diào)整各層神經(jīng)元的權(quán)值和閾值過(guò)程中就是模型學(xué)習(xí)訓(xùn)練的過(guò)程。
基于BP神經(jīng)網(wǎng)絡(luò)的非線性函數(shù)擬合算法流程可以分為BP神經(jīng)網(wǎng)絡(luò)構(gòu)建、BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練以及BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)3個(gè)步驟,按照上述步驟開(kāi)展氣井產(chǎn)能預(yù)測(cè)研究。BP神經(jīng)網(wǎng)絡(luò)構(gòu)建根據(jù)非線性函數(shù)的特點(diǎn)確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),由于氣井產(chǎn)能預(yù)測(cè)的非線性函數(shù)有10個(gè)輸入?yún)?shù),1個(gè)輸出參數(shù),所以BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為10-8-1,即輸入層有10個(gè)節(jié)點(diǎn),隱含層有8個(gè)節(jié)點(diǎn)(可以進(jìn)行調(diào)整,值越大表明訓(xùn)練越精確,但消耗時(shí)間越長(zhǎng)),輸出層有1個(gè)節(jié)點(diǎn)。網(wǎng)絡(luò)參數(shù)配置:迭代次數(shù)80次,學(xué)習(xí)率0.01以及學(xué)習(xí)目標(biāo)為4.0×10-4,用表1中的前26組數(shù)據(jù)作為訓(xùn)練樣本對(duì)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練學(xué)習(xí),用訓(xùn)練好的模型對(duì)表1中的后5組數(shù)據(jù)進(jìn)行預(yù)測(cè)計(jì)算,其預(yù)測(cè)結(jié)果見(jiàn)圖2。
支持向量機(jī)是Corinna Cortes和Vapnik等人于1995年在統(tǒng)計(jì)學(xué)習(xí)理論中結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論基礎(chǔ)之上提出的[9],與BP神經(jīng)網(wǎng)絡(luò)相比,克服了過(guò)學(xué)習(xí)和局部極值等問(wèn)題,在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì)。支持向量機(jī)主要解決分類(lèi)和回歸兩類(lèi)問(wèn)題,而氣井產(chǎn)能預(yù)測(cè)屬于其回歸范疇[4]34,利用支持向量機(jī)函數(shù)逼近的回歸算法,其回歸函數(shù)f可表示為[10]:
圖2 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果圖
式中,x∈Rn為輸入變量;w∈Rn為權(quán)值矢量;b∈R為偏差。
采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,將式(1)轉(zhuǎn)化為求解下列函數(shù)的最優(yōu)解:
對(duì)于上述凸規(guī)劃問(wèn)題,可轉(zhuǎn)化為以下對(duì)偶形式[11]:
引入核函數(shù),通過(guò)非線性映射函數(shù)Φ將數(shù)據(jù)樣本映射到一個(gè)高維特征空間,再在高維特征空間中完成內(nèi)積運(yùn)算。最終,非線性問(wèn)題的SVM回歸方程可表示為:
根據(jù)其原理建立產(chǎn)能預(yù)測(cè)模型[12],在模型建立過(guò)程中,最主要的工作是選擇合適的參數(shù)對(duì)(懲罰參數(shù)C與核函數(shù)基寬g),它們的合理確定直接影響所建模型的預(yù)測(cè)精度和推廣能力。本次研究運(yùn)用最為普遍的交叉驗(yàn)證網(wǎng)格搜索方法[13]來(lái)確定優(yōu)化參數(shù),而C、g值越小,其模型的預(yù)測(cè)精度越高,推廣能力越強(qiáng)。在精細(xì)網(wǎng)格搜索選擇計(jì)算下可以得到最佳參數(shù)對(duì)(C,g)=(11.313 7,0.062 5)。
圖3 支持向量機(jī)模型回歸預(yù)測(cè)結(jié)果圖
1)由上述3種方法的預(yù)測(cè)結(jié)果(表2)可知,多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果不穩(wěn)定,相對(duì)誤差較大,平均相對(duì)誤差分別為14.99%、17.60%,而支持向量機(jī)預(yù)測(cè)精度高,預(yù)測(cè)結(jié)果穩(wěn)定,平均相對(duì)誤差僅為4.34%。
2)支持向量機(jī)是由BP神經(jīng)網(wǎng)絡(luò)發(fā)展而來(lái),具有適應(yīng)性強(qiáng)、理論完備、訓(xùn)練時(shí)間短、泛華能力強(qiáng)等優(yōu)點(diǎn),在處理小樣本學(xué)習(xí)問(wèn)題上具有的獨(dú)到優(yōu)越性[14],克服了BP神經(jīng)網(wǎng)絡(luò)局部極小值以及對(duì)統(tǒng)計(jì)樣本依賴(lài)大的問(wèn)題;其次支持向量機(jī)預(yù)測(cè)方法操作簡(jiǎn)便,易實(shí)現(xiàn),而B(niǎo)P神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選擇困難,一般只能依靠經(jīng)驗(yàn)選定,因此在用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)時(shí)需要具備豐富的操作經(jīng)驗(yàn)和知識(shí)儲(chǔ)備。
3)氣井產(chǎn)能預(yù)測(cè)屬于非線性研究的范疇,用多元線性回歸方法預(yù)測(cè),預(yù)測(cè)精度較差,預(yù)測(cè)結(jié)果不穩(wěn)定,而本次研究是利用支持向量機(jī)預(yù)測(cè)的非線性回歸問(wèn)題,因此預(yù)測(cè)精度遠(yuǎn)高于多元線性回歸方法。
綜上所述,支持向量機(jī)方法為庫(kù)車(chē)前陸盆地“三超”氣井產(chǎn)能快速準(zhǔn)確預(yù)測(cè)提供了一個(gè)新的途徑,同時(shí),也為同類(lèi)氣井產(chǎn)能預(yù)測(cè)提供了可借鑒的方法。
表2 單井產(chǎn)能預(yù)測(cè)相對(duì)誤差統(tǒng)計(jì)表
1)根據(jù)氣井靜態(tài)資料結(jié)合探井資料,建立了多元線性回歸、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)3種氣井產(chǎn)能的預(yù)測(cè)模型,利用表1中的后5組數(shù)據(jù)對(duì)3種模型進(jìn)行了檢驗(yàn),由預(yù)測(cè)結(jié)果可知,3種方法預(yù)測(cè)結(jié)果的平均相對(duì)誤差分別為14.99%、17.60%、4.34%。
2)由氣井產(chǎn)能預(yù)測(cè)結(jié)果可知,支持向量機(jī)方法比多元線性回歸方法和BP神經(jīng)網(wǎng)絡(luò)方法的預(yù)測(cè)結(jié)果穩(wěn)定,預(yù)測(cè)精度高;通過(guò)3種產(chǎn)能預(yù)測(cè)方法優(yōu)缺點(diǎn)對(duì)比分析可知,支持向量機(jī)克服了BP神經(jīng)網(wǎng)絡(luò)與多元線性回歸的缺點(diǎn),具有適應(yīng)性強(qiáng)、泛華能力強(qiáng)、訓(xùn)練時(shí)間短和操作簡(jiǎn)便易實(shí)現(xiàn)等優(yōu)點(diǎn);綜上所述,支持向量機(jī)方法為庫(kù)車(chē)前陸盆地“三超”氣井產(chǎn)能快速準(zhǔn)確預(yù)測(cè)提供了一個(gè)新的途徑。
3)研究中所建立的基于支持向量機(jī)的產(chǎn)能預(yù)測(cè)模型僅適用于本區(qū)塊的氣井產(chǎn)能預(yù)測(cè)。若在其他區(qū)塊應(yīng)用時(shí)需結(jié)合實(shí)際情況,合理選擇數(shù)據(jù)樣本,重新建立預(yù)測(cè)模型才能得到有效的結(jié)果。
[1]唐洪俊,徐春碧,唐皓.氣井產(chǎn)能預(yù)測(cè)方法的研究與進(jìn)展[J]. 特種油氣藏,2011,18(5):11-15.
[2]趙益秋.試油完井一體化技術(shù)在“三超”氣井中的應(yīng)用[J]. 鉆采工藝,2017,40(3):53-56.
[3]李勇,劉啟國(guó),郜國(guó)喜,等.塔里木油田氣井無(wú)阻流量計(jì)算公式探討[J]. 新疆石油地質(zhì),2004,25(1):72-73
[4]李月麗,伊向藝,盧淵,等.基于支持向量機(jī)的氣井新井產(chǎn)能預(yù)測(cè)[J]. 油氣田地面工程,2010,29(1):34-36.
[5]許玲,陳德民,賴(lài)楓鵬.氣井新井產(chǎn)能預(yù)測(cè)的神經(jīng)網(wǎng)絡(luò)方法研究[J]. 油氣井測(cè)試,2008,17(3):12-14.
[6] Dayhoff J E,Deleo J M.Artifieial neural networks[J].Caneer,200l,91(8):1 615-1 634.
[7]尹瑯,任山,顏晉川,等.神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法在沙溪廟氣藏壓前評(píng)估中的應(yīng)用[J].天然氣技術(shù)與經(jīng)濟(jì),2012,6(6):27-29.
[8]沈花玉,王兆霞,高成耀,等.BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的確定[J]. 天津理工大學(xué)學(xué)報(bào),2008,24(5):13-15.
[9]克里斯蒂亞尼尼.支持向量機(jī)導(dǎo)論[M].李國(guó)正,王猛,曾華軍,譯.北京:電子工業(yè)出版社,2004.
[10]虞朝陽(yáng),馬群,鄭鵬宇.基于改進(jìn)支持向量機(jī)的壓裂效果預(yù)測(cè)方法研究[J].重慶科技學(xué)院學(xué)報(bào):自然科學(xué)版,2016,18(3):116-118.
[11] Keerthi S,Shevade S,Bhattcharyya C.A fast iterative nearest point algorithm for support vector machine clas?sifierdesign[J].IEEE Transactions on NeuralNet?work,2000,11(1):124-136.
[12]董雁萍.支持向量機(jī)預(yù)測(cè)模型的構(gòu)建及其應(yīng)用[D].西安:西安理工大學(xué),2010.
[13]童凱軍,單鈺銘,李海鵬,等.支持向量回歸機(jī)在氣井產(chǎn)能預(yù)測(cè)中的應(yīng)用[J].新疆石油地質(zhì),2008,29(3):382-384.
[14]張亞軍,劉志剛,霍柏超,等.基于支持向量機(jī)的電力負(fù)荷組合預(yù)測(cè)模型[J].電力需求側(cè)管理,2007,9(2):14-17.