李琨,韓瑩,佘東生,魏澤飛,黃海礁
(1渤海大學工學院,遼寧 錦州 121013;2遼河油田分公司錦州采油廠采油作業(yè)五區(qū),遼寧 錦州 121209)
基于IFOA-KELM-MEA模型的游梁式抽油機采油系統(tǒng)井下工況的短期預測
李琨1,韓瑩1,佘東生1,魏澤飛1,黃海礁2
(1渤海大學工學院,遼寧 錦州 121013;2遼河油田分公司錦州采油廠采油作業(yè)五區(qū),遼寧 錦州 121209)
實現(xiàn)對井下工況的預測是及時掌握抽油井生產(chǎn)狀態(tài)的有效方法,對提高油井生產(chǎn)效率和降低維護成本具有十分重要的意義。采用混沌理論實現(xiàn)抽油井井下工況的短期預測,首先將所提取的示功圖的不變曲線矩特征向量作為預測變量,在證明其數(shù)據(jù)序列具有混沌特性后,由核極限學習機(kernel extreme learning machine, ELM)建立混沌時間序列預測模型,對其中的幾個不確定參數(shù)采用改進的果蠅優(yōu)化算法(improved fruit fly optimization algorithm, IFOA)進行優(yōu)化選取,IFOA采用全局群體多樣進化和局部個體隨機變異的策略,最后,對模型所預測的結(jié)果進行物元分析(matter-element analysis, MEA),診斷其屬于哪種故障類型。由某油田作業(yè)區(qū)的兩口生產(chǎn)井進行實例驗證,結(jié)果表明所提出的IFOA-KELM-MEA預測模型是合理有效的。
混沌時間序列預測;游梁式抽油機;核極限學習機;果蠅優(yōu)化算法;物元分析;測量;石油;模型
游梁式抽油機采油系統(tǒng)是目前國內(nèi)外油田的主要生產(chǎn)方式,依靠抽油桿的上下移動帶動井下抽油泵將油液抽出地面。系統(tǒng)主要由兩個部分組成,其中,地上部分主要包括電動機、皮帶輪-齒輪箱、四連桿機構(gòu)等;地下部分主要包括抽油桿、抽油泵、油管、套管等。由于地下部分工作在不易觀察的地面以下,特別是抽油泵工作在數(shù)千米的地下,工作環(huán)境惡劣,造成井下工況復雜且不確定性較強。根據(jù)目前的生產(chǎn)現(xiàn)狀,典型的井下工況類型有:“供液不足”“氣體影響”“抽油桿斷落”“油稠”“游動凡爾漏失”“固定凡爾漏失”“泵上碰”“泵下碰”“油井出砂”和“柱塞脫出工作筒”等,不同的工況發(fā)生程度對采油系統(tǒng)的影響不同,會造成減產(chǎn)、高能耗甚至停井修井等問題。
在油田實際生產(chǎn)中,通過采集抽油井的示功圖分析井下的工況類型,示功圖是抽油桿光桿位移變化在一個完整周期內(nèi)載荷-位移數(shù)據(jù)所構(gòu)成的二維關(guān)系曲線。示功圖的形狀可以反映不同的工況類型[1],例如:“正常”的圖形特征是“上、下趨近于平行,左右趨近于平行”,“供液不足”的圖形特征是“圖形右下部分缺失,加載線正常,卸載線變化較慢”,“油井出砂”的圖形特征是“出現(xiàn)鋸齒狀波峰,尖小且變化快”。對于示功圖的分析,傳統(tǒng)的方法是依靠技術(shù)人員進行人工識別,再根據(jù)結(jié)果調(diào)整生產(chǎn)措施;近年來,隨著計算機信息技術(shù)的不斷發(fā)展以及油田生產(chǎn)對先進技術(shù)要求的不斷提高,基于計算機的智能分析方法越來越受到關(guān)注。文獻[2]提出基于 FBH-SC聚類的抽油井井下故障診斷方法,不依賴訓練樣本,以一種無監(jiān)督學習的方式實現(xiàn)井下工況的診斷;文獻[3]提出一種有桿抽油系統(tǒng)井下工況診斷方法,分析井下泵功圖閥門打開和關(guān)閉點間的曲線段,將曲線段的曲率特征作為分類依據(jù),建立了16個井下工況類別的Mamdani模糊推理系統(tǒng);文獻[4]提出基于示功圖的有桿抽油系統(tǒng)故障遞階診斷方法,通過分析故障機理,建立有桿抽油系統(tǒng)故障識別的搜索樹,對故障樣本進行故障類型的詳細識別;文獻[5]提出基于生物地理優(yōu)化算法的抽油機故障診斷方法,將混沌變異算子與生物地理優(yōu)化算法相結(jié)合,對BP神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù)進行優(yōu)化選取,用于抽油機的故障識別;文獻[6]采用基于曲線矩和PSO-SVM的方法實現(xiàn)有桿泵抽油系統(tǒng)井下工況的診斷,提取示功圖的曲線矩特征向量作為診斷模型的輸入向量,建立PSO-SVM模型實現(xiàn)井下工況的識別;文獻[7]考慮井下多工況共存時的診斷,提出一種基于Freeman鏈碼和指定元分析的多故障診斷方法,由Freeman鏈碼表示示功圖,提取其特征向量,再根據(jù)指定元分析方法實現(xiàn)多故障識別。
根據(jù)目前的研究現(xiàn)狀,對于游梁式抽油機采油系統(tǒng)井下工況的診斷,主要針對系統(tǒng)當前工況發(fā)生時的狀態(tài)評價及定位,而對井下工況預測的研究卻鮮有涉及。然而在實際生產(chǎn)中,對于一些工況類型來說,如果不能做出提前預測,當發(fā)現(xiàn)時系統(tǒng)生產(chǎn)已經(jīng)偏離正常水平,雖然管理者可以通過調(diào)整生產(chǎn)措施使其恢復到正常水平,但已嚴重影響了生產(chǎn)的經(jīng)濟效益;而對于另一些工況類型來說,如果不能做出提前預測,當發(fā)現(xiàn)時已使系統(tǒng)生產(chǎn)處于負面甚至危險的境地,此時管理者很難將系統(tǒng)工況恢復到正常水平。對此,本文對游梁式抽油機采油系統(tǒng)井下工況的短期預測方法展開研究,主要解決兩個問題:一是如何建立合理的預測模型,二是如何確定預測后的工況類型。
采用非線性建模和線性關(guān)聯(lián)相結(jié)合的策略,首先對所提取的示功圖的特征向量序列進行混沌特性分析,然后由核極限學習機建立混沌時間序列預測模型,對于不確定的模型參數(shù)采用改進的果蠅優(yōu)化算法進行優(yōu)化選取,最后根據(jù)物元分析理論將預測結(jié)果與工況類型進行線性關(guān)聯(lián),以判斷預測后的工況類型。
游梁式抽油機采油過程是一個連續(xù)的生產(chǎn)過程,井下工況的變化可以體現(xiàn)在示功圖形狀的不斷變化上,因此,可以對示功圖圖形形狀進行數(shù)字化特征提取,將其特征向量作為預測模型的輸入。采用文獻[1]的特征提取方法,首先將采集的地面示功圖轉(zhuǎn)化為井下泵功圖,然后將其劃分為4個區(qū)域,如圖1所示,然后提取每一區(qū)域的7個不變曲線矩特征向量,將28個不變曲線矩特征向量作為表達示功圖圖形特征的特征向量。鑒于篇幅原因,基于曲線矩的示功圖特征提取的相關(guān)內(nèi)容不再過多贅述。
要實現(xiàn)游梁式抽油機采油系統(tǒng)井下工況的短期預測,需要首先對所提取的28個示功圖的不變曲線矩特征向量數(shù)據(jù)序列分別進行混沌特性分析,只要能夠證明它們具有混沌特性,就可以采用預測模型進行預測。采用0-1混沌測試法[8-9]進行不變曲線矩特征向量數(shù)據(jù)序列的混沌特性分析,下面對 0-1混沌測試法的原理進行簡要介紹。
圖1 示功圖特征提取Fig.1 Feature extraction of dynamometer card
設(shè)示功圖的不變曲線矩特征向量數(shù)據(jù)序列為fi(j)(i=1, 2,…, 28;j=1 ,2,…, N),一隨機常數(shù)c∈(0, π),定義如下2個函數(shù)pi,c(n)和qi,c(n)有
其中,i=1, 2,…, 28;n=1, 2,…, N。
由pi,c(n)和qi,c(n)計算均方位移Mi(n)如下
其中,Vosc(c,n,i)為攝動項,定義如下
采用文獻[8]中的回歸分析方法計算均方位移Mi(n)的漸近增長率Ki,c如下
為了減小計算偏差,在(0, π)取值范圍內(nèi)隨機重復選擇Nc次常數(shù)c,每一次重復計算式(1)~式(5),然后取Nc個Ki,c值的均值i,c,取Nc=100。根據(jù)文獻[10-11],若i,c≈1,表明該時間序列具有混沌特性;若i,c≈ 0,表明該時間序列不具有混沌特性。
在實際計算過程中,pi,c(n)和qi,c(n)可以通過如下迭代計算得到[8]
其中,j=1, 2,…, N;n=1, 2,…, N。
圖2 不同采樣時間間隔下的示功圖變化趨勢圖Fig.2 Changing trends of dynamometer card under different sampling time intervals
在實現(xiàn)過程中采用迭代方式計算均方位移Mi(n)和漸近增長率Ki,c時,采用如下限定條件[8]:n≤N/10,為了計算方便,設(shè)定n=N/10。
以國內(nèi)某油田作業(yè)區(qū)一口抽油井的實際生產(chǎn)數(shù)據(jù)進行驗證,當該油井的沖程為2.5 m和沖次為3次·min?1時,根據(jù)安裝在油井“驢頭”懸點處的示功圖采集設(shè)備的工作方式,對油井示功圖進行連續(xù)采集,采集頻率為每分鐘3幅示功圖,每幅示功圖由250組數(shù)據(jù)點組成。在采用時間序列方法進行預測時,樣本點的采樣時間間隔的選擇較為重要,分別以“分鐘(min)”、“小時(h)”和“天(day)”為采樣時間間隔的5幅示功圖如圖2所示。
由圖2可以看到,當以“分鐘”為采樣時間間隔采集數(shù)據(jù)時,由于采樣間隔過短,示功圖的變化不明顯,由此數(shù)據(jù)構(gòu)成時間序列進行預測意義較?。划斠浴疤臁睘椴蓸訒r間間隔采集數(shù)據(jù)時,由于采樣間隔過長,示功圖的變化幅度較大,中間過程的很多有用信息丟失,由此數(shù)據(jù)構(gòu)成時間序列的可預測性較差;而以“小時”為采樣時間間隔采集數(shù)據(jù)時,所構(gòu)成的時間序列既能兼顧數(shù)據(jù)的變化趨勢,又不易丟失變化過程的有用信息。因此,所采用的實際示功圖數(shù)據(jù)以“小時”為采樣時間間隔,即兩幅示功圖之間的時間間隔為1 h。
以“小時”為采樣時間間隔連續(xù)采集該抽油井一段生產(chǎn)周期內(nèi)的228幅示功圖,首先采用第2節(jié)的特征提取方法分別提取228幅示功圖的28個不變曲線矩特征向量,然后構(gòu)成28個不變曲線矩特征向量數(shù)據(jù)序列,每個序列包含228個數(shù)據(jù)點。下面以第12個不變曲線矩特征向量為例,采用0-1混沌測試法進行混沌特性分析。第12個不變曲線矩特征向量數(shù)據(jù)序列如圖3所示。
根據(jù)式(1)~式(7),由 0-1混沌測試法對第 12個不變曲線矩特征向量數(shù)據(jù)序列進行混沌特性分析,得到p12,c(n)和q12,c(n)的相圖如圖4所示,100次重復計算后的平均均方位移M12(n)和平均漸近增長率12,c如圖5所示。
圖3 第12個不變曲線矩特征向量數(shù)據(jù)序列Fig.3 Data sequence of 12th invariant curve moments eigenvalue
圖4 p12,c(n)和q12,c(n)的相圖Fig.4 Phase diagram of p12,c(n) and q12,c(n)
圖5 平均均方位移和漸近增長率(100次重復計算)Fig.5 Mean-square displacement and progressive growth rate (average value of 100 times)
由圖4、圖5,p12,c(n)和q12,c(n)的相圖呈現(xiàn)布朗運動特性,均方位移M12(n)呈線性增長變化,漸近增長率K的變化趨近于1,因此,可以證明第12個不變曲線矩特征向量數(shù)據(jù)序列具有混沌特性,可以建立預測模型進行預測。同理,根據(jù)式(1)~式(7)對其他不變曲線矩特征向量數(shù)據(jù)序列進行混沌特性的驗證,都能證明滿足混沌特性,鑒于文章篇幅原因,不再一一列舉驗證結(jié)果。
在驗證了不變曲線矩特征向量數(shù)據(jù)序列具有混沌特性之后,就可以通過相空間重構(gòu)進行預測。相空間重構(gòu)是混沌時間序列預測最基礎(chǔ)的第一步,它的基本思想是:系統(tǒng)中每一個變量的變化都會受到與之有聯(lián)系的其他變量的影響,因此這些相關(guān)變量的信息就包含在任一變量的動態(tài)變化過程中,通過重構(gòu)得到的相空間會反映系統(tǒng)狀態(tài)的變化規(guī)律。
設(shè)不變曲線矩特征向量混沌時間序列為{xi(n), i=1, 2,…, 28, n=1, 2,…, N},通過相空間重構(gòu)得到如下形式
采用一步預測,即由一段時間的數(shù)據(jù)序列去預測下一個時間點的值,過長的預測步長會降低預測的精度。那么預測輸出可以由如下形式進行表示
其中,m為嵌入維數(shù),τ為延遲時間。m和τ是相空間重構(gòu)中兩個關(guān)鍵的參數(shù),如果能夠選取正確的值,則可以使重構(gòu)的相空間在一定程度上逼近原始的系統(tǒng)。
將 Xi和Yi分別作為預測模型的輸入和輸出即可完成建模,采用核極限學習機作為混沌時間序列的預測模型。
極限學習機(extreme learning machine, ELM)是Huang等[12]在2006年提出的一種新型前饋神經(jīng)網(wǎng)絡(luò)模型,能夠克服像BP神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)模型存在的收斂速度慢、易陷入局部最優(yōu)、泛化能力差等不足[13]。對于給定的訓練樣本集{(xi,ti)|xi∈Rd,ti∈Rn,i=1,2,…, N},ELM 模型的數(shù)學描述為:,其中,ti為ELM模型的訓練輸出;βj為隱含層神經(jīng)元與第i個輸出神經(jīng)元之間的連接權(quán)值;ωj為隱含層神經(jīng)元與輸入神經(jīng)元之間的連接權(quán)值;bj為第 j個隱含層神經(jīng)元的偏置;L為隱含層節(jié)點的個數(shù);g(·)為激活函數(shù)。ωj和 bj在系統(tǒng)初始化時隨機給定,在模型訓練過程中其值不發(fā)生變化。
ELM 模型訓練的目的就是找到最優(yōu)的輸出權(quán)值矩陣β,使得||H·?βY||=0,其中:H為隱含層輸出矩陣,Y為期望輸出值矩陣。
采用如下公式求得β
其中,H+為隱含層輸出矩陣H的偽逆[14]。
那么ELM模型的輸出函數(shù)可以表示為[15]
其中,C為正則化參數(shù),T=[t1t2… tN],h(x)=g(ω, b, x)。
對于式(11),當h(x)為未知的特征映射時,可以構(gòu)建KELM模型,定義核矩陣形式如下[15]
其中,i,j=1, 2, …, N。
那么,KELM模型的輸出函數(shù)可以表示為
本文采用高斯核函數(shù)如下
其中,γ為核函數(shù)參數(shù)。
相對于ELM模型,采用KELM模型的好處是不需要明確h(x)的特征映射類型,因此不需要給定隱含層節(jié)點的個數(shù) L,使得模型訓練的特征空間維數(shù)大大降低,從而降低KELM訓練的復雜度;另外,與傳統(tǒng)支持向量機方法相比,KELM在求解時約束更少,因而性能更好[14]。
5.1 不確定模型參數(shù)分析
在構(gòu)建基于核極限學習機的預測模型過程中,存在4個不確定模型參數(shù),分別為:相空間重構(gòu)中的嵌入維數(shù)m和延遲時間τ,KELM模型中的正則化參數(shù)C和核函數(shù)參數(shù)γ。4個模型參數(shù)的準確賦值在一定程度上決定了KELM模型的預測精度,圖6(a)給出了不同的m和τ下模型的預測誤差,評價指標采用預測結(jié)果與實際結(jié)果的均方根誤差(root mean square error, RMSE),圖6(b)給出了不同的C和γ下模型的RMSE評價指標,所采用的測試數(shù)據(jù)集為圖2中的第12個不變曲線矩特征向量數(shù)據(jù)序列。
由圖6可以看到,不同的模型參數(shù)值會造成模型預測性能的差異;在建模過程中,如果設(shè)置的參數(shù)準確,可以得到較好的預測效果,但是如果給定的參數(shù)偏差較大,那么勢必會降低模型的預測性能。對此,采用改進的果蠅優(yōu)化算法實現(xiàn)建模過程中不確定模型參數(shù)的優(yōu)化選擇。
5.2 改進果蠅優(yōu)化算法(IFOA)
5.2.1 果蠅優(yōu)化算法(FOA) 果蠅優(yōu)化算法是Pan[16]提出的一種新的群智能優(yōu)化算法,通過模擬果蠅群體的覓食行為,實現(xiàn)全局最優(yōu)解的搜索;與傳統(tǒng)的遺傳算法、蟻群算法和粒子群優(yōu)化算法相比,該算法具有計算過程簡單、編碼實現(xiàn)容易和易于理解等優(yōu)點,且受主觀設(shè)定參數(shù)的影響較小?;贔OA的模型參數(shù)優(yōu)化的實現(xiàn)步驟如下。
(1)參數(shù)初始化。初始生成4個果蠅群體,分別指派給m、τ、C和γ這4個待優(yōu)化參數(shù),設(shè)定每個果蠅群體的位置區(qū)間[pos_low, pos_up],設(shè)置最大迭代次數(shù)(maxgen)和果蠅種群規(guī)模(sizepop)。對于每個果蠅群體,在位置區(qū)間內(nèi)隨機給定每個果蠅的初始位置X_axisi和Y_axisi如下
其中,i=1, 2,…, sizepop。
(2)每個果蠅群體中果蠅個體利用嗅覺搜尋食物,隨機給定每個個體的飛行方向和距離
其中,Xi和Yi表示第i個果蠅移動后的位置坐標,RandomValue為搜尋距離。
(3)由于無法知道食物的具體位置,首先估計果蠅個體與原點的距離(Disti),然后計算味道濃度判定值(Si),這個值為距離的倒數(shù)
(4)將4個果蠅群體中每個果蠅個體的味道濃度判定值Si(分別對應(yīng)4個優(yōu)化參數(shù))代入相空間重構(gòu)和KELM模型中,得到模型預測輸出值,計算預測值與實際值的RMSE指標值,將其作為適應(yīng)度函數(shù)值(Smell),計算每個果蠅個體的Smelli值。
(5)找到果蠅群體中具有最小適應(yīng)度函數(shù)值的個體,如下
其中,bestSmell表示最小的適應(yīng)度函數(shù)值,bestIndex表示最小適應(yīng)度函數(shù)值對應(yīng)的果蠅個體的序號。
(6)將具有最小Smelli值的個體標記為最優(yōu)的果蠅個體,果蠅群體中其他的個體都利用視覺飛向此位置
其中,Smellbest為記錄最優(yōu)適應(yīng)度函數(shù)值的參數(shù)。
(7)重復步驟(2)~步驟(5),每一次迭代都判斷味道濃度是否比前一代更優(yōu),如果是,執(zhí)行步驟(6),否則繼續(xù)迭代直至達到最大迭代次數(shù)。
根據(jù)經(jīng)典的果蠅優(yōu)化算法,當在迭代過程中確定最優(yōu)個體后,其他的個體都向其移動,通過不斷縮小搜索范圍逐漸接近食物源(最優(yōu)解),但是如果該個體是局部最優(yōu)值,則會造成算法陷入局部最優(yōu)解導致“早熟”問題[17]。對此,對經(jīng)典的果蠅優(yōu)化算法進行改進,提出一種改進的果蠅優(yōu)化算法(IFOA)。
5.2.2 改進果蠅優(yōu)化算法(IFOA) 為了防止搜索過程過早陷入局部最優(yōu)解的問題,所提出的 IFOA方法采用全局群體多樣進化和局部個體隨機變異的策略。
(1)全局群體多樣進化策略
根據(jù)式(17)、式(18)、式(23)和式(24),當在迭代過程中確定最優(yōu)個體([X_axis, Y_axis])后,其他個體都會向其移動,那么搜索方向由其信息所決定,極易陷入局部最優(yōu)解。對此,IFOA中對每個個體的移動方式進行改進,不僅采用當前最優(yōu)個體的信息,還同時考慮次優(yōu)個體的信息,即
其中,SecbestIndex為當前代中具有第二小 Smell值的個體的序號。
新的群體移動機制中,以每一次迭代中最優(yōu)和次優(yōu)的兩個個體的信息為導向,可以在一定意義上增大最優(yōu)解的搜索空間和進化方向,從而增加可行解群體的多樣性。
(2)局部個體隨機變異策略
根據(jù)步驟(1)~步驟(3),首先給定果蠅群體的初始位置,然后每個果蠅個體向不同的方向進行移動,通過計算果蠅個體與原點的距離得到味道濃度判定值,最后確定最優(yōu)個體。由于果蠅群體的初始位置是隨機給定的,那么最優(yōu)解迭代進化的過程就會受到初始值的影響;如果給定的初始值合適,則能盡快找到最優(yōu)解,否則極易陷入局部最優(yōu)值。對此,IFOA方法借鑒模擬退火算法[18]中的以一定概率接受壞解的策略,能夠在一定意義上跳出當前最優(yōu)解,避免過早陷入“早熟”的問題。
根據(jù)式(19)和式(20),最優(yōu)個體的選擇標準為果蠅個體與原點的距離Dist最?。次兜罎舛扰卸ㄖ礢最大),可以設(shè)定一個閾值ξ,當最優(yōu)個體在連續(xù)兩代內(nèi)的位置變化差(Distbest為最優(yōu)個體與原點的距離,t為迭代的代數(shù))時,以一個較小的概率p(p∈[0,0.5))放棄該個體,然后在解空間內(nèi)的任意位置隨機生成一個新的個體。ξ的定義如下
5.2.3 仿真實驗 為了驗證所提出IFOA方法的有效性,采用Mackey-Glass混沌時間序列進行仿真實驗。該時間序列由如下微分方程描述
當η>17時,式(34)具有混沌行為,η越大混沌特征越明顯。本文選定 η=30,給定初始值x(t)|t=0=0.9,生成600組數(shù)據(jù),其中前400組數(shù)據(jù)作為訓練樣本用以建立預測模型,后200組數(shù)據(jù)作為測試樣本。為了說明本文所提出方法的有效性,首先將其與最小二乘支持向量機(least squares support vector machine, LSSVM)方法進行橫向?qū)Ρ?,LSSVM 被廣泛應(yīng)用于時間序列預測領(lǐng)域,與粒子群算法(particle swarm optimization, PSO)、遺傳算法(genetic algorithm, GA)、蟻群算法(ant colony optimization, ACO)和聲搜索算法(harmony search, HS)等相結(jié)合進行參數(shù)的優(yōu)化選擇是其中一個研究熱點[19]。將本文所提出的 IFOA-KELM 方法與PSO-LSSVM方法、GA-LSSVM方法、ACO-LSSVM方法和HS-LSSVM方法進行對比,為了更好地體現(xiàn)本文所提出方法的有效性,在對比分析中使PSO、GA、ACO和HS算法不依賴主觀設(shè)定參數(shù)值,將其中各參數(shù)設(shè)定取值范圍,其中:PSO中的慣性權(quán)重ω∈[1,3],學習因子c1∈[0,2]和c2∈[0,2];GA中的編碼串長為10,交叉概率pc∈[0.4,0.8],變異概率pm∈[0.001,0.005];ACO中的信息素重要程度因子α=1,轉(zhuǎn)移概率判斷因子p0∈[0.1,0.5]、信息素蒸發(fā)系數(shù) P∈[0.1,0.5]和信息素增加強度系數(shù) Q∈[0.1,0.5];HS中和聲記憶庫的和聲數(shù)M∈[10,40],和聲記憶庫保留概率 HMCR∈[0.5,0.9],記憶擾動概率 PAR∈[0.05,0.2],帶寬范圍為[0.001,1]。設(shè)定算法迭代次數(shù)為100次,每個預測模型重復執(zhí)行20次取平均結(jié)果(平均值±標準偏差),每次執(zhí)行過程中,各算法的相關(guān)參數(shù)在取值范圍內(nèi)隨機取值,由RMSE和MAE(mean absolute error)作為評價指標,對比結(jié)果見表1。
表1 不同方法的MAE和RMSE指標對比(橫向)Table 1 Comparison of MAE and RMSE index value of different methods (horizontal comparison)
由表1的結(jié)果可以看到,相比于PSO-LSSVM、GA-LSSVM、ACO-LSSVM和HS-LSSVM這幾種方法,本文所提出的IFOA-KELM方法在訓練集和測試集上都有較好的預測效果。由于不受主觀設(shè)定參數(shù)的影響,多次預測的結(jié)果較為穩(wěn)定,波動較小。
為了進一步說明IFOA-KELM的有效性,將其與 FOA-KELM 方法、IFOA1-KELM 方法[17]、AMFOA-KELM方法[20]進行縱向比較。各種方法的對比結(jié)果見表2。
表2 不同方法的MAE和RMSE指標對比(縱向)Table 2 Comparison of MAE and RMSE index value of different methods (vertical comparison)
由表2的對比結(jié)果可以看到,IFOA-KELM的預測性能優(yōu)于其他幾種方法。
物元分析理論是蔡文等[21]所建立可拓學的重要組成部分,綜合考慮定性分析和定量分析兩個方面,由信息的可拓展性去解決問題。首先建立所預測28個不變曲線矩特征向量的物元模型如下
式中,C為不變曲線矩特征;v為不變曲線矩特征的取值。
在油田生產(chǎn)中,抽油機常出現(xiàn)的故障類型有如下11種:“正?!保榱吮阌谘芯?,將“正?!笨醋饕环N故障類型)、“氣體影響”、“供液不足”、“抽油桿斷落”、“油稠”、“游動閥漏失”、“固定閥漏失”、“泵上碰”、“泵下碰”、“油井出砂”和“柱塞脫出工作筒”,然后由已有的示功圖樣本建立每一種故障類型的不變曲線矩特征值庫[1],其物元模型表示如下
其中,i=1,2,…,11,F(xiàn)i為第i種故障類型;vi=[via,vib]表示第i種故障類型的不變曲線矩特征的取值區(qū)間。
根據(jù)式(37)~式(39)計算所預測樣本與各故障類型的關(guān)聯(lián)度
其中,j=1, 2, …, 28;vj為第Cj個不變曲線矩特征的取值,Rei(vj)為第Cj個不變曲線矩特征下所預測樣本與第i種故障類型的關(guān)聯(lián)函數(shù);“ vj? vi”表示所預測樣本的第 Cj個不變曲線矩特征的取值不在區(qū)間vi=[via,vib]內(nèi),“vj∈vi”表示在區(qū)間內(nèi);X為節(jié)域,本文取X=[0,20];|vi|為區(qū)間的間距;ρ(vj, vi)表示第 Cj個不變曲線矩特征的值與區(qū)間[via,vib]的距離,定義如下
那么,所預測樣本與第i種故障類型的關(guān)聯(lián)度定義如下
采用最大值原則,最大值發(fā)生程度所對應(yīng)的故障類型即為所預測樣本的故障類型;若所有的I(Fi)<0,則認為所預測樣本不屬于當前任一故障類型。
采用國內(nèi)某油田作業(yè)區(qū)的兩口抽油井進行實例驗證,“油井1”的主要生產(chǎn)參數(shù):額定電壓380 V、額定功率37 kW、電動機額定轉(zhuǎn)速980 r·min?1、沖次3次·min?1、沖程2.5 m;“油井2”的主要生產(chǎn)參數(shù):額定電壓380 V、額定功率27 kW、電動機額定轉(zhuǎn)速490 r·min?1、沖次4次·min?1、沖程 3.5 m。以“小時”為采樣時間間隔,采集每口油井在連續(xù)250 h生產(chǎn)時間內(nèi)的250幅示功圖,采集設(shè)備如圖7所示。
圖7 示功圖采集設(shè)備Fig.7 Data acquisition equipment of dynamometer card
為了驗證所提出方法的有效性,首先進行如下仿真實驗,250幅示功圖中選取前240幅作為訓練樣本建立預測模型,后10幅作為測試樣本,由生產(chǎn)技術(shù)人員人工識別測試樣本的故障類型,作為預測準確率的評價標準。將本文所提出的IFOA-KELM-MEA 預 測 模 型 分 別 與PSO-LSSVM-MEA 、 GA-LSSVM-MEA 、ACO-LSSVM-MEA 、 HS-LSSVM-MEA 、IFOA1-KELM-MEA和AMFOA-KELM-MEA預測模型進行對比,PSO、GA、ACO和HS算法的主觀設(shè)定參數(shù)值采用5.2.3節(jié)的取值范圍,在預測每個樣本時,預測模型重復執(zhí)行20次得到預測準確率,每次執(zhí)行過程中,各算法的相關(guān)參數(shù)在取值范圍內(nèi)隨機取值。各預測模型的預測準確率如圖8所示。
由圖8可以看到,由于受到主觀設(shè)定參數(shù)不確定性的影響,PSO、GA、ACO和HS算法的參數(shù)優(yōu)化穩(wěn)定性較差,使得 PSO-LSSVM-MEA、 GA-LSSVM-MEA 、 ACO-LSSVM-MEA 和HS-LSSVM-MEA模型的預測準確率的波動較大,在70%~100%之間波動,預測效果不是很理想;而IFOA1-KELM-MEA、AMFOA-KELM-MEA 和IFOA-KELM-MEA模型中的優(yōu)化算法不需要設(shè)定主觀參數(shù),因此受其值的影響較小,使得預測結(jié)果穩(wěn)定性較好,預測準確率保持在95%~100%。
圖8 各模型預測準確率對比Fig.8 Comparisons of prediction accuracy of different models
圖 8反映出 IFOA1-KELM-MEA、AMFOAKELM-MEA和IFOA-KELM-MEA模型的預測效果較好,為了說明本文所提出IFOA-KELM-MEA模型有更好的性能,進行如下仿真實驗,將兩口油井的250幅示功圖都作為訓練樣本,預測下一個時間點的示功圖故障類型,然后與實際采集的示功圖(圖9)進行對比。
根據(jù)人工分析結(jié)論,圖9(a)示功圖反映抽油桿接箍與油管偏磨嚴重,造成上死點處的負荷突然增大,典型的“泵上碰”故障類型;圖9(b)示功圖反映圖形右下角嚴重缺失,加載線正常,但是卸載線變化緩慢,典型的“供液不足”故障類型。IFOA1-KELM-MEA、AMFOA-KELM-MEA和IFOA-KELMMEA模型的預測結(jié)果見表3。
圖9 兩口油井采集的實際示功圖Fig.9 Actual dynamometer cards of two oil wells
表3 3個模型的關(guān)聯(lián)度對比(I(F1)/ I(F2)/ I(F3)/ I(F4)/ I(F5)/ I(F6)/ I(F7)/ I(F8)/ I(F9)/ I(F10)/ I(F11))Table 3 Comparison of correlation degree (I(F1)/ I(F2)/ I(F3)/ I(F4)/ I(F5)/ I(F6)/ I(F7)/ I(F8)/ I(F9)/ I(F10)/ I(F11)) among three models
根據(jù)表3的對比結(jié)果可以看到,對于“油井1”故障類型的預測,AMFOA-KELM-MEA模型的結(jié)論是 I(F1)最大,認為屬于“正常”,與實際工況不符,IFOA1-KELM-MEA和IFOA-KELM-MEA模型都得到了I(F8)最大的結(jié)論,都認為屬于“泵上碰”,但是IFOA1-KELM-MEA模型得到的與“泵上碰”的關(guān)聯(lián)度明顯小于本文所提出的IFOA-KELM-MEA模型,說明后者的結(jié)論更精確,這也正是采用物元分析理論的優(yōu)勢,不止評價“屬于”或“不屬于”,還能得到“屬于”或“不屬于”的程度;對于“油井 2”故障類型的預測,IFOA1-KELM-MEA模型得到的結(jié)論是I(F2)和I(F3)同為最大,無法分辨是屬于“氣體影響”還是“供液不足”故障類型,AMFOA-KELM-MEA模型的結(jié)論是 I(F2)最大,認為屬于“氣體影響”,與實際工況不符,而本文所提出的IFOA-KELM-MEA模型得到的I(F3)結(jié)果明顯大于其他類型,預測結(jié)果明確,性能優(yōu)于其他兩個預測模型。
針對游梁式抽油機采油系統(tǒng)井下工況的預測問題,首先將28個不變曲線矩特征向量作為預測序列變量,通過0-1混沌測試法驗證其混沌特性后證明可以采用基于混沌時間序列的預測方法。然后根據(jù)核極限學習機理論建立預測模型,將相空間重構(gòu)后的Xi和Yi分別作為其輸入和輸出;經(jīng)過仿真實驗,預測模型中的嵌入維數(shù) m、延遲時間 τ、正則化參數(shù)C和核函數(shù)參數(shù)γ會影響預測精度,對此采用改進的果蠅優(yōu)化算法進行參數(shù)的尋優(yōu);通過橫向和縱向不同方法的比較,驗證了改進算法中所采用全局群體多樣進化和局部個體隨機變異策略的有效性。對于所得到的預測變量的工況類型診斷,由可拓理論中的物元分析方法計算其與各標準工況的關(guān)聯(lián)度,通過某油田作業(yè)區(qū)兩口抽油井的實際生產(chǎn)數(shù)據(jù)驗證了預測結(jié)果與實際工況的一致性。
[1]李琨, 高憲文, 仇治學, 等. 有桿泵抽油系統(tǒng)井下工況診斷的物元分析方法[J]. 東北大學學報(自然科學版), 2013, 34(5): 613-617. LI K, GAO X W, QIU Z X, et al. Matter-element analysis method of downhole conditions diagnosis for suck rod pumping system [J]. Journal of Northeastern University (Natural Science), 2013, 34(5): 613-617.
[2]LI K, GAO X W, ZHOU H B, et al. Fault diagnosis for down-hole conditions of sucker rod pumping systems based on the FBH-SC method [J]. Petroleum Science, 2015, 12(1): 135-147.
[3]REGES G D, SCHNITMAN L, REIS R, et al. A new approach to diagnosis of sucker rod pump systems by analyzing segments ofdownhole dynamometer cards [C]// SPE Artificial Lift Conference—Latin America and Caribbean, Salvador Bahia, Brazil: Society of Petroleum Engineers, 2015: SPE-173964-MS: 1-13.
[4]梁華. 有桿抽油系統(tǒng)故障遞階診斷的故障識別研究[J]. 西南石油大學學報(自然科學版), 2015, 37(1): 165-171. LIANG H. Hierarchical fault diagnosis of rod pumping system based on fault distinguishing [J]. Journal of Southwest Petroleum University (Science & Technology Edition), 2015, 37(1): 165-171.
[5]任偉建, 趙月嬌, 王天任, 等. 基于生物地理優(yōu)化算法的抽油機故障診斷研究[J]. 系統(tǒng)仿真學報, 2014, 26(6): 1243-1250, 1273. REN W J, ZHAO Y J, WANG T R, et al. Research on pump-jack fault diagnosis method based on biogeography-based optimization algorithm [J]. Journal of System Simulation, 2014, 26(6): 1243-1250, 1273.
[6]LI K, GAO X W, TIAN Z D, et al. Using the curve moment and the PSO-SVM method to diagnose downhole conditions of a sucker rod pumping unit [J]. Petroleum Science, 2013, 10(1): 73-80.
[7]LI K, GAO X W, YANG W, et al. Multiple fault diagnosis of down-hole conditions of sucker-rod pumping wells based on Freeman chain code and DCA [J]. Petroleum Science, 2013, 10(3): 347-360.
[8]GOTTWALD G A, MELBOURNE I. On the implementation of the 0-1 test for chaos [J]. SIAM Journal on Applied Dynamical Systems, 2009, 8(1): 129-145.
[9]田中大, 李樹江, 王艷紅, 等. 短期風速時間序列混沌特性分析及預測[J]. 物理學報, 2015, 64(3): 030506-1-12. TIAN Z D, LI S J, WANG Y H, et al. Chaotic characteristics analysis and prediction for short-term wind speed time series [J]. Acta Phys. Sin., 2015, 64(3): 030506-1-12.
[10]GOTTWALD G A, MELBOURNE I. On the validity of the 0-1 test for chaos [J]. Nonlinearity, 2009, 22(6): 1367-1382.
[11]周偉, 李引珍, 俞建寧. 利用0-1測試快速識別交通流時間序列中的混沌[J]. 系統(tǒng)工程, 2015, 33(9): 122-126. ZHOU W, LI Y Z, YU J N. Fast identification for chaos of traffic flow times series based on 0-1 test [J]. Systems Engineering, 2015, 33(9): 122-126.
[12]HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications [J]. Neurocomputing, 2006, 70(1): 489-501.
[13]王新迎, 韓敏. 多元混沌時間序列的多核極端學習機建模預測[J].物理學報, 2015, 64(7): 070504-1-7. WANG X Y, HAN M. Multivariate chaotic time series prediction using multiple kernel extreme learning machine [J]. Acta Phys. Sin., 2015, 64(7): 070504-1-7.
[14]韓敏, 劉曉欣. 一種基于互信息變量選擇的極端學習機算法[J].控制與決策, 2014, 29(9): 1576-1580. HAN M, LIU X X. An extreme learning machine algorithm based on mutual information variable selection [J]. Control and Decision, 2014, 29(9): 1576-1580.
[15]HUANG G B, ZHOU H, DING X, et al. Extreme learning machine for regression and multiclass classification [J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics, 2012, 42(2): 513-529.
[16]PAN W T. A new fruit fly optimization algorithm: taking the financial distress model as an example [J]. Knowledge-Based Systems, 2012, 26: 69-74.
[17]WANG L, SHI Y L, LIU S. An improved fruit fly optimization algorithm and its application to joint replenishment problems [J]. Expert Systems with Applications, 2015, 42(9): 4310-4323.
[18]KIRKPATRICK S. Optimization by simulated annealing [J]. Science, 1983, 220(5): 671-679.
[19]李琨, 韓瑩, 黃海礁. 基于IBH-LSSVM的混沌時間序列預測及其在抽油井動液面短期預測中的應(yīng)用[J]. 信息與控制, 2016, 45(2): 241-247. LI K, HAN Y, HUANG H J. Chaotic time series prediction based on IBH-LSSVM and its application for short-term prediction of dynamic fluid level of the oil wells [J]. Information and control, 2016, 45(2): 241-247.
[20]WANG W C, LIU X G. Melt index prediction by least squares support vector machines with an adaptive mutation fruit fly optimization algorithm [J]. Chemometrics and Intelligent Laboratory Systems, 2015, 141: 79-87.
[21]蔡文, 楊春燕, 林偉初. 可拓工程方法[M]. 北京: 科學出版社, 2000: 18-97. CAI W, YANG C Y, LIN W C. Extension Engineering Method [M]. Beijing: Science Press, 2000: 18-97.
IFOA-KELM-MEA model based transient prediction on down-hole working conditions of beam pumping units
LI Kun1, HAN Ying1, SHE Dongsheng1, WEI Zefei1, HUANG Haijiao2
(1College of Engineering, Bohai University, Jinzhou 121013, Liaoning, China;2The Fifth District of Jinzhou Oil Production Plant, Liaohe Oilfield Company, Jinzhou 121209, Liaoning, China)
Prediction for down-hole working conditions of beam pumping units is an effective strategy to timely control oil well's working state, and is important to improve production efficiency and to reduce maintenance cost. Chaos theory was used in transient prediction for oil well's down-hole working conditions. First, moment eigenvalues of invariant curves were extracted from dynamometer chart as predictive variables. Then, after data sequence of these predictive variables were proved to have chaotic characteristics, chaotic time series prediction model was established by ELM (kernel extreme learning machine) method and several uncertain variables of the model were optimally solved by IFOA (improved fruit fly optimization algorithm) with two strategies of global population diversity-evolution and local individual random-variation. Finally, model predictive results were analyzed to determine fault types according to MEA (matter-element analysis) method. Case study of two oil wells in one oilfield showed that the IFOA-KELM-MEA prediction model was reasonable and effective.
chaotic time series prediction; beam pumping units; kernel extreme learning machine; fruit fly optimization algorithm; matter-element analysis; measurement; petroleum; model
LI Kun, bhulikun@163.com
TP 273
:A
:0438—1157(2017)01—0188—11
10.11949/j.issn.0438-1157.20160834
2016-06-20收到初稿,2016-09-28收到修改稿。
聯(lián)系人及第一作者:李琨(1983—),男,博士,副教授。
國家自然科學基金項目(61403040)。
Received date: 2016-06-20.
Foundation item: supported by the National Natural Science Foundation of China (61403040).