劉寶軍
(中國石化股份有限公司勝利油田分公司 信息化管理中心,山東 東營 257001)
抽油機(jī)因其結(jié)構(gòu)簡(jiǎn)單、管理維護(hù)簡(jiǎn)便、運(yùn)行成本相對(duì)較低而在國內(nèi)應(yīng)用廣泛,一直占據(jù)著有桿泵采油的主導(dǎo)地位,確保抽油機(jī)井正常平穩(wěn)生產(chǎn)運(yùn)行是確保油田產(chǎn)量和經(jīng)濟(jì)效益的重中之重[1]。目前抽油機(jī)井示功圖診斷方面絕大多數(shù)采用功圖灰度特征、位移/載荷特征、幾何不變矩等方法,在進(jìn)行計(jì)算時(shí)需要引入工程修正系數(shù)或業(yè)務(wù)專家經(jīng)驗(yàn),降低了特征的敏感性,對(duì)于功圖之間細(xì)微的差異性表征不明顯,存在進(jìn)一步提升的空間。
在目前大數(shù)據(jù)背景下,卷積神經(jīng)網(wǎng)絡(luò)在圖像的分類識(shí)別領(lǐng)域取得成功,尤其是在手寫體識(shí)別、人臉識(shí)別等圖形識(shí)別領(lǐng)域具有良好的識(shí)別效果[2]。作為神經(jīng)網(wǎng)絡(luò)領(lǐng)域的一個(gè)重要分支,卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)在于其每一層的特征都由上一層的局部區(qū)域通過共享權(quán)值的卷積核激勵(lì)取得。這一特點(diǎn)使得卷積神經(jīng)網(wǎng)絡(luò)相比于其他神經(jīng)網(wǎng)絡(luò)方法更適合應(yīng)用于圖像特征的學(xué)習(xí)與表達(dá)[3]。結(jié)合目前主流的CNN卷積神經(jīng)網(wǎng)絡(luò)技術(shù),通過將油井生產(chǎn)參數(shù)圖形化,并結(jié)合地面、井下功圖散點(diǎn)圖形,建立示功圖診斷模型,實(shí)現(xiàn)單井功圖自動(dòng)診斷、異常報(bào)警,能夠更加準(zhǔn)確高效地識(shí)別油井工況問題,更有針對(duì)性地采取優(yōu)化措施。
抽油機(jī)井地面示功圖是由懸點(diǎn)載荷與位移構(gòu)成的圖形,其中摻雜著油桿與井筒的摩擦及震動(dòng)等干擾信號(hào),不能準(zhǔn)確描述抽油泵的工作狀態(tài)。功圖圖形特征抽取時(shí)需要同時(shí)考慮到地面功圖和井下泵功圖的工作狀態(tài)及圖形,以便充分表征各類特征。
1.1.1 井下泵功圖仿真方法
S.G.Gibbs于1963年提出有桿抽油系統(tǒng)的行為預(yù)測(cè)模型,并于1977年對(duì)該法進(jìn)行了總結(jié)歸納。根據(jù)Gibbs方程可將懸點(diǎn)示功圖轉(zhuǎn)化為泵功圖[4]。應(yīng)力波在抽油桿柱中的傳播過程可用帶阻尼的波動(dòng)方程
進(jìn)行描述。
由于引起示功圖形狀對(duì)稱變化的相同強(qiáng)度的2種或2種以上設(shè)備故障同時(shí)發(fā)生的幾率很小,所以可以用差分曲線描述抽油泵示功圖[5],采用有限差分?jǐn)?shù)值解法精細(xì)求解波動(dòng)方程,實(shí)現(xiàn)井下泵功圖仿真,如圖1所示。
圖1 井下泵功圖仿真Fig.1 Simulation of pump indicator diagram
1.1.2 功圖圖形特征抽取方法
對(duì)井下泵功圖和地面示功圖采用灰度網(wǎng)格技術(shù)將功圖散點(diǎn)圍成的封閉曲線映射到40*30的網(wǎng)格內(nèi),轉(zhuǎn)化為向量輸入。主要過程如下:
1)將原始功圖散點(diǎn)分別按照位移、載荷整理為2個(gè)數(shù)組;
2)對(duì)每個(gè)數(shù)組分別進(jìn)行歸一化處理,將數(shù)值范圍規(guī)范到(0,1)之間;
3)合并上述2個(gè)一維數(shù)組到二維數(shù)組xy;
4)新建一個(gè)40*30的二維數(shù)組,將上述數(shù)組xy按照坐標(biāo)值點(diǎn),映射到此40*30的網(wǎng)格內(nèi)。對(duì)于通過網(wǎng)格點(diǎn)的數(shù)據(jù)點(diǎn)填充1,其他非通過網(wǎng)格點(diǎn)的數(shù)據(jù)填充0;
5)遍歷上述網(wǎng)格數(shù)據(jù),參照灰度共生矩陣的方式將0和1組成的矩陣數(shù)據(jù)轉(zhuǎn)為特征數(shù)據(jù),以表征出功圖散點(diǎn)之間細(xì)微的差異;
6)重復(fù)步驟1,將泵功圖也做同樣處理。
映射完成后的數(shù)據(jù)如圖2所示。
其中灰度共生矩陣的求解方法為:在圖像中任意一點(diǎn)(x,y)及偏離它的一點(diǎn)(x+a,y+b)(其中a,b為整數(shù))構(gòu)成點(diǎn)對(duì)。設(shè)該點(diǎn)對(duì)的灰度值為(f1,f2),假設(shè)圖像的最大灰度級(jí)為L(zhǎng),則f1與f2的組合共有L*L種。對(duì)于整個(gè)圖像,統(tǒng)計(jì)每一種(f1,f2)值出現(xiàn)的次數(shù),然后排列成一個(gè)方陣,再用(f1,f2)出現(xiàn)的總次數(shù)將其歸一化為出現(xiàn)的概率P(f1,f2),取上述方陣中出現(xiàn)的次數(shù)作為網(wǎng)格輸出。
1.1.3 生產(chǎn)參數(shù)圖形化方法
單純用示功圖圖形進(jìn)行油井工況診斷時(shí),對(duì)于功圖形狀接近的工況無法進(jìn)行有效區(qū)分,例如供液不足與氣體影響工況,其圖像十分接近,如圖3所示。此時(shí)就需要根據(jù)單井產(chǎn)液量、動(dòng)液面、油套壓等參數(shù),對(duì)這2種工況進(jìn)行區(qū)分。
圖2 功圖特征數(shù)據(jù)Fig.2 Schematic diagram for feature data of pump indicator diagram
圖3 供液不足與氣體影響示功圖Fig.3 Indicator diagrams influenced by insufficient liquid supply and gas
選取油井產(chǎn)液量、含水率、油壓、套壓、沖次、井口溫度、耗電量7個(gè)生產(chǎn)現(xiàn)場(chǎng)容易獲取的參數(shù)用于工況診斷,為配合CNN卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)要求,進(jìn)行圖形化處理,主要過程如下:
1)抽取當(dāng)前油井歷史上3個(gè)月的生產(chǎn)資料,從中獲取7個(gè)一維數(shù)組;
2)為保證輸入樣本的量綱和數(shù)值范圍一致,按以下范圍將生產(chǎn)數(shù)據(jù)進(jìn)行歸一化:產(chǎn)量120,含水100,油壓2,套壓2,沖次10,井口溫度50,耗電量300;對(duì)于超過數(shù)值范圍的參數(shù),取為1;
3)以時(shí)間為橫軸、參數(shù)為縱軸形成二維數(shù)組,并映射到50*30的網(wǎng)格內(nèi),映射方法與功圖圖形特征抽取方法一致;
4)重復(fù)步驟2以便將7個(gè)所需參數(shù)都轉(zhuǎn)為矩陣數(shù)據(jù)。
1.2.1 卷積神經(jīng)網(wǎng)絡(luò)技術(shù)原理
在機(jī)器學(xué)習(xí)中,卷積神經(jīng)網(wǎng)絡(luò)是一種深度前饋人工神經(jīng)網(wǎng)絡(luò)。一般地,CNN的基本結(jié)構(gòu)包括2層,其一為特征提取層,每個(gè)神經(jīng)元的輸入與前一層的局部接受域相連,并提取該局部的特征。一旦該局部特征被提取后,它與其他特征間的位置關(guān)系也隨之確定下來;其二是特征映射層,網(wǎng)絡(luò)的每個(gè)計(jì)算層由多個(gè)特征映射組成,每個(gè)特征映射是一個(gè)平面,平面上所有神經(jīng)元的權(quán)值相等。特征映射結(jié)構(gòu)采用影響函數(shù)核小的sigmoid函數(shù)作為卷積網(wǎng)絡(luò)的激活函數(shù),使得特征映射具有位移不變性。此外,由于一個(gè)映射面上的神經(jīng)元共享權(quán)值,因而減少了網(wǎng)絡(luò)自由參數(shù)的個(gè)數(shù)。卷積神經(jīng)網(wǎng)絡(luò)中的每一個(gè)卷積層都緊跟著一個(gè)用來求局部平均與二次提取的計(jì)算層,這種特有的兩次特征提取結(jié)構(gòu)減小了特征分辨率。典型的卷積和池化過程如圖4和圖5所示。
通過卷積-池化過程完成圖形特征抽取后,最后使用全鏈接的神經(jīng)網(wǎng)絡(luò)進(jìn)行樣本的學(xué)習(xí),將知識(shí)以權(quán)值和閾值的形式存儲(chǔ)在網(wǎng)絡(luò)中,網(wǎng)絡(luò)的輸入是被診斷對(duì)象的征兆即特征值, 輸出則表示發(fā)生故障類型的概率值,通過訓(xùn)練逐層修改權(quán)值和閾值獲得均衡收斂,使網(wǎng)絡(luò)的分類性能收斂到最佳點(diǎn)[6]。
1.2.2 CNN工況診斷模型
根據(jù)示功圖形狀和油井生產(chǎn)情況,可將油井工況分為以下幾類:正常、供液不足、氣體影響、桿柱斷脫、偏磨、抽噴、泵漏、出砂、氣鎖等,如圖6所示。
利用計(jì)算機(jī)程序進(jìn)行功圖識(shí)別和診斷的核心是得到抽油桿的各個(gè)截面示功圖和泵功圖,通過示功圖的形狀特點(diǎn),選擇和提取最能反映示功圖形狀信息的特征量,從而實(shí)現(xiàn)快速、準(zhǔn)確地識(shí)別示功圖以對(duì)整個(gè)油井生產(chǎn)系統(tǒng)的工作狀況進(jìn)行分析和判斷[7]。采用CNN卷積神經(jīng)網(wǎng)絡(luò)圖形識(shí)別技術(shù),建立示功圖診斷樣本庫, 利用油井功圖和生產(chǎn)參數(shù)對(duì)油井工況進(jìn)行診斷分析。
圖4 卷積過程Fig.4 Schematic diagram of convolution process
圖5 池化過程Fig.5 Schematic diagram of pooling process
圖6 典型工況Fig.6 Indicator diagrams of typical working conditions
相較于傳統(tǒng)的圖形識(shí)別方法,卷積神經(jīng)網(wǎng)絡(luò)通過多層網(wǎng)絡(luò)結(jié)構(gòu)可以學(xué)習(xí)到原始圖像的最高層的特征,這些特征對(duì)于數(shù)據(jù)本身是更本質(zhì)的表達(dá)[8]。當(dāng)前常見的卷積神經(jīng)網(wǎng)絡(luò)模型包含輸入層、卷積層、激活層、池化層、全鏈接層和最后的輸出層。應(yīng)用于功圖診斷的卷積部分的網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。
一般情況下,卷積神經(jīng)網(wǎng)絡(luò)以原始圖像為輸入,在卷積層中將前一層的特征圖與一個(gè)卷積核進(jìn)行卷積運(yùn)算,卷積的結(jié)果經(jīng)過激活函數(shù)映射后形成下一層的特征圖。
池化層經(jīng)常周期性地插入在連續(xù)的卷積層之間,池化單元計(jì)算特征圖中的一個(gè)區(qū)域的值,相鄰的池化單元通過移動(dòng)一行或者一列從一小塊區(qū)域上讀取數(shù)據(jù)。這樣就可以對(duì)特征圖進(jìn)行降維,在一定程度上保持了數(shù)據(jù)的平移不變性,減少了網(wǎng)絡(luò)中的參數(shù)數(shù)量和計(jì)算量。
圖7 卷積過程架構(gòu) Fig.7 Convolution process architecture for indicator diagram diagnosis
最后,卷積神經(jīng)網(wǎng)絡(luò)依靠全鏈接層對(duì)提取的特征運(yùn)用回歸模型進(jìn)行分類識(shí)別[8]。
以典型的LeNet5模型為基礎(chǔ),將原始示功圖數(shù)據(jù)進(jìn)行歸一化處理,隨后轉(zhuǎn)換為灰度圖形并進(jìn)行數(shù)字化輸出,輸出結(jié)果中功圖線段所在的網(wǎng)格為1,空白網(wǎng)格為0,組成了高度30*長(zhǎng)度30的網(wǎng)格數(shù)據(jù)。隨后采用tensorflow的CNN模型進(jìn)行數(shù)據(jù)處理、訓(xùn)練和驗(yàn)證工作,訓(xùn)練參數(shù)如下:
激活函數(shù) ReLu;
池化方法 Max Pooling、Mean Pooling;
優(yōu)化算法SGD,batch_size= 64,momentum= 0.9,lrate= 1e-4;
損失函數(shù)cross-entropy;
Dropout 0.5。
訓(xùn)練完成后,將基于圖形卷積的CNN模型的診斷結(jié)果轉(zhuǎn)化為業(yè)務(wù)上由專家定義的工況類型,再根據(jù)現(xiàn)場(chǎng)經(jīng)驗(yàn)進(jìn)行部分工況的修正與剔除。例如,若模型的輸出為“下偏磨”和“出砂”,則根據(jù)業(yè)務(wù)規(guī)則識(shí)別下載荷線的震動(dòng)頻率,若頻率小于專家經(jīng)驗(yàn)界定的某個(gè)常數(shù),則剔除“出砂”工況,保留“下偏磨”工況。
利用計(jì)算機(jī)程序?qū)Τ橛蜋C(jī)井示功圖進(jìn)行診斷識(shí)別的過程:
1) 首先判斷圖形形狀是否正常,將由于傳感器采集錯(cuò)誤或傳輸錯(cuò)誤的功圖剔除掉;
2)對(duì)生產(chǎn)參數(shù)進(jìn)行歸一化處理,轉(zhuǎn)換為能夠被卷積神經(jīng)網(wǎng)絡(luò)識(shí)別的標(biāo)準(zhǔn)化圖元;
3)對(duì)圖形進(jìn)行歸一化處理,轉(zhuǎn)換為能夠被卷積神經(jīng)網(wǎng)絡(luò)識(shí)別的標(biāo)準(zhǔn)化圖元;
4)將樣本導(dǎo)入基于圖形卷積的CNN模型進(jìn)行訓(xùn)練,獲取訓(xùn)練結(jié)果;
5)將待診斷功圖特征量導(dǎo)入訓(xùn)練好的CNN網(wǎng)絡(luò)進(jìn)行運(yùn)算,獲取輸出數(shù)值;
6)根據(jù)專家經(jīng)驗(yàn)處理神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果,并輸出最后確定的工況類型。
基于上述模型和診斷流程進(jìn)行軟件編制工作,軟件包括數(shù)據(jù)處理、泵功圖仿真、特征抽取、樣本庫訓(xùn)練、工況診斷等功能。基本結(jié)構(gòu)如圖8所示。
圖8 工況診斷軟件基本架構(gòu)Fig.8 Basic framework of working condition diagnosis software
1)數(shù)據(jù)處理模塊:負(fù)責(zé)處理油井工況診斷和建立樣本庫所需的數(shù)據(jù),包括基礎(chǔ)、生產(chǎn)、管桿、井斜、物性、功圖數(shù)據(jù)包等共30余項(xiàng)參數(shù);
2)泵功圖仿真模塊:基于油井?dāng)?shù)據(jù)和三維波動(dòng)方程,采用有限差分?jǐn)?shù)值解法實(shí)現(xiàn)井下逐深度處的示功圖計(jì)算,送入特征抽取模塊進(jìn)行抽取后再送入樣本庫訓(xùn)練模塊;
3)特征抽取模塊:綜合油井生產(chǎn)數(shù)據(jù)、地面示功圖及泵示功圖,采用卷積-池化方法進(jìn)行特征抽取;
4)樣本訓(xùn)練模塊:建立結(jié)構(gòu)化數(shù)據(jù)庫,存儲(chǔ)各類工況的典型樣本,并導(dǎo)入CNN網(wǎng)絡(luò)進(jìn)行特征學(xué)習(xí)訓(xùn)練;
5)工況診斷模塊:實(shí)現(xiàn)抽油機(jī)井示功圖在線診斷功能,結(jié)合專家經(jīng)驗(yàn)可對(duì)16種常見油井工況進(jìn)行診斷識(shí)別。
考慮生產(chǎn)現(xiàn)場(chǎng)的實(shí)際情況,在保證神經(jīng)網(wǎng)絡(luò)訓(xùn)練的可靠性和樣本的均衡性的基礎(chǔ)上,挑選了200口典型的抽油機(jī)井示功圖作為訓(xùn)練樣本,構(gòu)建示功圖診斷樣本庫,使用CNN功圖診斷模型進(jìn)行樣本特征學(xué)習(xí)和訓(xùn)練。
應(yīng)用訓(xùn)練完成的模型對(duì)某井進(jìn)行泵功圖仿真和工況診斷,結(jié)果如圖9所示:功圖工況診斷為供液不足(99.92%幾率)。
圖9 某井1工況診斷結(jié)果Fig.9 Diagnosis result of working conditions of well 1
對(duì)另一口井進(jìn)行特征抽取和工況診斷,結(jié)果如下:功圖工況診斷為上偏磨(99.98%幾率)和下偏磨(99.94%幾率)。
圖10 某井2工況診斷結(jié)果Fig.10 Diagnosis result of working conditions of well 2
多個(gè)月連續(xù)跟蹤該井的示功圖均顯示上下偏磨工況,且偏磨程度逐漸加劇。繼續(xù)生產(chǎn)一段時(shí)間后由于腐蝕作用桿斷躺井上作業(yè)?,F(xiàn)場(chǎng)起出管柱后發(fā)現(xiàn)原井第38根油桿腐蝕斷,第46~87根油桿偏磨1~2 mm,實(shí)際情況與模型診斷結(jié)果完全一致。
本模型調(diào)優(yōu)后在現(xiàn)場(chǎng)進(jìn)行規(guī)?;C合診斷與驗(yàn)證, 將模型診斷結(jié)果與專家人工診斷結(jié)果進(jìn)行對(duì)比, 診斷的準(zhǔn)確率有了較大的提高, 能夠有效地對(duì)供液不足、漏失、偏磨等常見油井工況進(jìn)行分析診斷。
利用CNN神經(jīng)網(wǎng)絡(luò)模式識(shí)別技術(shù)建立抽油機(jī)井示功圖診斷模型,開發(fā)軟件系統(tǒng)實(shí)現(xiàn)功圖自動(dòng)識(shí)別和診斷,是智能油田信息化發(fā)展的重要內(nèi)容。與傳統(tǒng)功圖診斷方法相比,本模型將特征抽取交由成熟的卷積-池化技術(shù)進(jìn)行處理,能夠提高或改善特征細(xì)節(jié);同時(shí)采用圖形化的方法與生產(chǎn)參數(shù)相結(jié)合,盡可能地挖掘出更多工況判別依據(jù),提高工況識(shí)別精度。隨著模型在應(yīng)用過程中的迭代完善,將有效提高抽油機(jī)井預(yù)警診斷及時(shí)率、準(zhǔn)確率與工況管理水平。
西安石油大學(xué)學(xué)報(bào)(自然科學(xué)版)2018年5期