周 陽,王壽喜
(西安石油大學,西安 710065)
目前,我國部分氣田已經(jīng)進入到開發(fā)后期階段,這些集輸管道的服役時間相對較長,介質中的含水率以及酸性物質含量隨服役時間的延長不斷提升,致使管道的腐蝕速率不斷加快[1-4]。腐蝕是威脅管道運行安全的重要因素。因此,氣田集輸管道腐蝕速率的準確預測對提前制定防護措施、保障氣田管道運行安全十分重要[2-6],同時也有利于推動我國能源產業(yè)的進一步發(fā)展。
國內外學者對于氣田管道腐蝕速率預測進行了多方面的研究。駱正山等[7]通過建立隨機森林算法,對凝析氣田管道的腐蝕問題進行了全面研究,研究過程中使用灰色關聯(lián)度算法對內腐蝕速率的影響因素進行了全面篩選,并使用氣田集輸管道實際腐蝕速率數(shù)據(jù)對所建立的模型進行了驗證,但是隨機森林算法在使用的過程中會出現(xiàn)過度擬合問題,最終導致預測結果精度降低。RAJU等[8]通過引入壓電傳感器的方式,對管道的腐蝕問題進行了全面評價,使用該種方法的腐蝕速率評價結果相對精度較高,但是所需要的經(jīng)濟成本也相對較高,同時壓電傳感器非常容易受到腐蝕的影響出現(xiàn)損壞問題。曾維國等[9]建立了徑向基神經(jīng)網(wǎng)絡模型進行腐蝕速率研究,在模型訓練過程中,其預測值與期望值之間的相關性相對較高,使用該種模型可以對腐蝕風險相對較高的管道進行篩選,但是神經(jīng)網(wǎng)絡類型的算法對于樣本數(shù)量的依賴度相對較高,在訓練樣本相對較少的前提下,預測結果將會受到較大的影響。梁金祿等[10]針對高含硫氣田的腐蝕問題,使用PSO(粒子群優(yōu)化)模型對SVM(支持向量機)模型中的參數(shù)進行了優(yōu)選,然后使用SVM模型進行了腐蝕速率研究,預測結果顯示,該種模型的預測誤差相對較小,但是在使用PSO對參數(shù)進行篩選的過程中,非常容易出現(xiàn)局部最優(yōu)的問題,即優(yōu)選的參數(shù)可能不是最佳參數(shù)。
通過全面調研發(fā)現(xiàn),目前國內外關于管道腐蝕速率預測的研究存在一定的局限性。為此,本工作將使用灰色關聯(lián)度(GRA)模型對氣田集輸管道內腐蝕的影響因素進行全面篩選。螢火蟲(FA)模型非常容易出現(xiàn)局部最優(yōu)的問題,因此,對其進行了改進,得到改進后的螢火蟲(IFA)模型。最小二乘支持向量機(LSSVM)模型中兩種參數(shù)的設定會對預測結果產生影響,因此,使用IFA模型對LSSVM模型進行了參數(shù)優(yōu)選,最終建立GRA-IFA-LSSVM模型,對氣田集輸管道的內腐蝕速率問題進行預測研究,為保障氣田集輸管道的安全運行奠定基礎。
對于灰色關聯(lián)度(GRA)模型而言,其屬于一種根據(jù)系統(tǒng)的發(fā)展趨勢進行定量分析以及比較的算法[11]。使用GRA算法的過程可分為以下5個步驟。
(1) 確定母序列與子序列之間的關系。在進行氣田集輸管道內腐蝕速率預測的過程中,將介質的溫度、流速、H2S含量、CO2含量、O2含量、水含量、鹽含量以及pH作為其影響因素,此時的母序列可以表示為:X0={x0(1),x0(2),…,x0(m)}。對于第i個子序列而言,可以表示為:Xi={xi(1),xi(2),…,xi(m)}(i=1,2,3,…,8),最終可以構成式(1)所示矩陣。
(1)
(2) 對數(shù)據(jù)進行處理。由于各個影響因素數(shù)據(jù)以及腐蝕速率數(shù)據(jù)量綱之間存在較大的差異,因此,數(shù)值的差異度相對較大,需要對其進行初值變換處理,得到式(2)。
(2)
式中:X0為數(shù)列后面的數(shù)據(jù);X0(1)為某一列數(shù)據(jù)的第一個數(shù)值;Y0為處理后得到的數(shù)據(jù)。
初值變換處理后的第i個子序列,可表示為式(3)。
(3)
在進行無量綱處理以后,可以得到如式(4)所示矩陣。
(4)
(3) 對Yi和Y0之間的關聯(lián)系數(shù)σ0i進行計算,見式(5)。
(5)
式中:ρ為分辨系數(shù),其處于區(qū)間[0,1]內,一般可以取值0.5。
(4) 對所有影響因素的關聯(lián)度進行處理,此時可以得到Yi對Y0的關聯(lián)度γ0i,如式(6)所示。
(6)
式中:M為數(shù)據(jù)數(shù)量。
(5) 對所有影響因素的關聯(lián)度γ0i進行排序,對較為重要的影響因素進行篩選[12]。
螢火蟲(FA)模型是一種相對較為先進的參數(shù)優(yōu)選算法,在整個種群中,每一個螢火蟲都代表一個數(shù)值解,其相對亮度表示適應度,根據(jù)其相對亮度可以確定每個個體的位置移動方向,亮度較小的個體將會向亮度大的個體移動,而最亮的個體,會隨機移動[13-14]。使用該種類型算法的步驟如下:
(1) 對各個參數(shù)進行初始化處理,計算每個個體的初始化相對亮度I0。
(2) 根據(jù)式(7)、(8)、(9)對I和β進行計算。
(7)
(8)
(9)
式中:β為吸引力數(shù)值;β0為最大吸引力數(shù)值;I為個體的相對亮度;I0為個體的初始化相對亮度;γ為光吸收系數(shù)數(shù)值;rij為個體i和個體j之間的距離;d為空間維數(shù),根據(jù)優(yōu)化運算的目標確定;xi,k為個體i的第k個數(shù)值。
(3) 根據(jù)式(10)對個體的位置進行更新。
xi(t+1)=xi(t)+
β[xj(t)-xi(t)]+α(rand-0.5)
(10)
式中:xi,xj分別為個體i和個體j所處的位置;α為隨機步長,其處于區(qū)間[0,1]中;rand函數(shù)表示在區(qū)間[0,1]內產生隨機實數(shù)。
(4) 確定位置更新以后個體的亮度。
(5) 若滿足所有的條件,輸出最佳的極值,結束;若不滿足條件,需要從步驟(3)開始重新迭代。
在FA算法的使用過程中,非常容易出現(xiàn)局部最優(yōu)的問題,同時如果參數(shù)設置不合理,還可能會出現(xiàn)函數(shù)無法收斂的問題。因此,需要對其進行合理的改進,改進后的螢火蟲(IFA)算法為:
(1) 對每個個體的位置進行Logistics混沌初始化處理,進而使得種群多樣性得到提升,全局搜索能力得到增強,Logistics混沌處理的映射公式見式(11)。
zn+1=rzn(1-zn)
(11)
式中:r為混沌因子,在取值為4的前提下,表示完全混沌,此時滿足公式zn+1∈(1-zn)。
(2) 對于線性遞減過程中的慣性權重w而言,其變化情況與迭代次數(shù)T以及最大迭代次數(shù)Tmax之間具有很強的聯(lián)系,在進入到后期階段后,其收斂的速度將會大幅降低,進而出現(xiàn)局部最優(yōu)的問題。針對該問題,本工作引入一種新的慣性權重計算方法,如式(12)~(13)所示。該計算方法基于每個個體以及整體的適應度數(shù)值,適應度fi如式(14)所示,IFA算法位置更新如式(15)所示。
(12)
(13)
(14)
xi(t+1)=w(t)xi(t)+
β[xj(t)-xi(t)]+α(rand-0.5)
(15)
LSSVM模型屬于一種對SVM(支持向量機)進行改進的算法,使用該算法時,在對偶空間之內,不等式可以使用等式進行約束。同時,可以根據(jù)最小二乘基本理論,對損失函數(shù)進行合理優(yōu)化。最終將二次規(guī)劃問題轉化為方程組的求解問題。此時使用該模型進行數(shù)據(jù)預測的精度進度得到大幅提升[18-20]。LSSVM算法的應用步驟為:
(1) 將數(shù)據(jù)集合分為兩個樣本組,分別是訓練樣本以及預測樣本,訓練樣本可以表示為D={(xi,yi)|i=1,2,…,n},其中,xi∈Rn為第i個樣本,yi∈{-1,+1}輸出數(shù)據(jù)組合。
(2) 在高維空間之內,可以將回歸函數(shù)表示為式(16)。
y(x)=ω·φ(x)+b
(16)
式中:ω為可調權函數(shù);φ(x)為映射函數(shù);b為偏差參數(shù)。
(3) 在對參數(shù)ω和b進行求解的過程中,需要引入結構風險最小化理論,求解公式如式(17)所示。
(17)
式中:C為正則化參數(shù);ξi為誤差。
(4) 為了實現(xiàn)最優(yōu)的目標,引入拉格朗日函數(shù)進行求解,如式(18)所示。
(18)
式中:αi為乘子,使用L(ω,b,ξ,α)對ω,b,ξ,α進行偏微分求解,進而得到式(19)。
(19)
(5) 將上述公式中的參數(shù)ω和ξi去除,并將式(19)轉化為矩陣
(20)
式中:e=[1,1,…,1]T,y=[y1,y2,…,yn]T,α=[α1,α2,…,αn]T,Ωij=φ(xi)·φ(xj)=k(xi,xj)。k(xi,xj)為核函數(shù)矩陣,本工作中使用的核函數(shù)為徑向基函數(shù),如式(21)所示。
(21)
(6) 對上述方程進行求解,最終得到線性方程
(22)
在使用LSSVM算法時,正則化參數(shù)C以及徑向基函數(shù)中的參數(shù)σ會對最終的預測結果產生重要影響,為了全面降低內腐蝕速率預測的誤差,使用改進的螢火蟲算法對參數(shù)進行優(yōu)選[21-23]。
按圖1所示流程建立預測氣田集輸管道內腐蝕速率的GRA-IFA-LSSVM組合模型。
圖1 GRA-IFA-LSSVM組合模型建立流程Fig.1 Process of building GRA-IFA-LSSVM combined model
(1) 引入灰色關聯(lián)度算法,對氣田集輸管道內腐蝕速率的影響因素進行篩選,確定內腐蝕的主要影響因素。
(2) 引入螢火蟲算法,對初始參數(shù)進行設置。
(3) 根據(jù)式(11)產生混沌序列,將其作為螢火蟲算法使用過程中的初始種群。
(4) 對適應度進行計算,使用LSSVM模型對訓練數(shù)據(jù)集合進行學習,并對預測數(shù)據(jù)集的預測誤差進行計算,將每個螢火蟲的絕對百分比誤差作為IFA算法使用過程中的適應度,如式(23)所示。
(23)
式中:Ai為實際值;Pi為預測值。
(5) 根據(jù)式(8)和式(9)對IFA算法進行計算,對每個個體之間的距離以及步長進行判斷,使用式(10)和式(15)對每個個體的位置進行更新。
(6) 對適應度進行重新計算,使用式(11)和式(12)進行混沌序列優(yōu)化以及搜素。
(7) 輸出最佳參數(shù)至LSSVM模型中,使用LSSVM模型對訓練數(shù)據(jù)集進行學習,對預測數(shù)據(jù)集進行預測。
為了對GRA-IFA-LSSVM組合模型的預測精度進行全面評價,引入三種誤差評價方法,分別是均方根誤差ERMSE、平均相對誤差EMRE以及可決系數(shù)R2,三種評價方法的計算公式分別如式(24)~(26)所示。
(24)
(25)
(26)
為了對本研究所提出的GRA-IFA-LSSVM組合模型進行驗證,以我國某氣田為例,進行了集輸管道腐蝕試驗。該氣田集輸管道的材料為16Mn鋼,隨著管道使用時間逐漸增長,腐蝕已經(jīng)成為威脅管道安全運行的重要因素。在研究的過程中,采用腐蝕掛片的方式對腐蝕樣本進行提取。腐蝕掛片的尺寸為10 mm×3 mm×50 mm,采樣周期為30 d,取出的掛片經(jīng)清水沖洗、防銹劑浸泡以及無水乙醇處理等步驟后吹干,然后進行了稱量。根據(jù)掛片腐蝕前后質量變化計算腐蝕速率,如式(27)所示。
(27)
式中:vcorr為腐蝕速率,mm/a;K為換算系數(shù),8.76×104;Δγ為掛片腐蝕前后質量差,g;t為時間,d;μ為材料密度,g/cm3;S為掛片的表面積,cm2。經(jīng)過試驗,共獲取76組數(shù)據(jù),部分數(shù)據(jù)如表1所示。
表1 部分腐蝕速率及影響因素數(shù)據(jù)Tab.1 Partial data of corrosion rates and influencing factors
根據(jù)GRA算法的計算步驟,計算各影響因數(shù)與腐蝕速率的關聯(lián)度,結果如表2所示。分析表2中數(shù)據(jù)可以發(fā)現(xiàn),每種影響因素與管道腐蝕速率的關聯(lián)度數(shù)值都相對較高。本研究將選擇關聯(lián)度數(shù)值較高的前五項作為模型的特征變量,腐蝕速率作為模型的輸出目標。這五項影響因素分別為溫度、H2S含量、CO2含量、pH以及流速。
表2 影響因素關聯(lián)度計算結果Tab.2 Calculation results of correlation degree of influencing factors
為了對本研究所提出的GRA-IFA-LSSVM組合模型進行先進性驗證,將其與FA-LSSVM算法、GA-LSSVM算法(遺傳算法優(yōu)化最小二乘支持向量機)以及PSO-LSSVM(粒子群算法優(yōu)化最小二乘支持向量機)算法進行對比。在使用IFA算法以及FA算法的過程中,種群規(guī)模設定為30,步長因子設定為0.1,光吸收強度設定為1,最大吸引度設定為1,最大迭代次數(shù)設定為100,訓練精度設定為10-6。在使用GA算法的過程中,種群規(guī)模設定為30,最大迭代次數(shù)設定為100,訓練精度設定為10-6,交叉概率設定為0.6,突變概率設定為0.05。在使用PSO算法的過程中,種群規(guī)模設定為30,粒子群維數(shù)設定為2,慣性權重設定為0.4,學習因子設定為0.2,最大迭代次數(shù)設定為100,訓練精度設定為10-6。使用4種算法分別對LSSVM模型中的正則化參數(shù)C以及徑向基函數(shù)參數(shù)σ進行優(yōu)選,得到的參數(shù)數(shù)值如表3所示,將這些參數(shù)數(shù)值分別輸入LSSVM算法中,進行腐蝕速率預測。
表3 參數(shù)優(yōu)選結果Tab.3 Results of parameter optimization
將76組數(shù)據(jù)分為兩組,訓練數(shù)據(jù)組以及預測數(shù)據(jù)組。訓練數(shù)據(jù)組為66組氣田集輸管道腐蝕速率及影響因素數(shù)據(jù),用于GRA-IFA-LSSVM、FA-LSSVM、GA-LSSVM以及PSO-LSSVM模型訓練;預測數(shù)據(jù)組有10組,用于模型驗證。采用訓練數(shù)據(jù)組對4種模型進行訓練后,再根據(jù)預測數(shù)據(jù)組數(shù)據(jù)進行預測,預測結果如表4、圖2及圖3所示。通過對預測結果進行分析可以發(fā)現(xiàn):GA-LSSVM模型的預測精度最差,其最大相對誤差達到了21.454 7%,平均相對誤差達到了9.500 8%; GRA-IFA-LSSVM模型的預測精度最好,其預測結果的最大相對誤差為2.919 1%,最小相對誤差為1.012 3%,該模型的誤差區(qū)間為[1.012 3%, 2.919 1%];PSO-LSSVM模型的誤差區(qū)間為[2.860 8%,9.115 5%],FA-LSSVM模型的誤差區(qū)間為[2.014 5%,17.281 8%],相比之下,GRA-IFA-LSSVM模型的誤差區(qū)間較小,取值范圍也相對較小。對圖2進行分析可以發(fā)現(xiàn),本研究所提出的GRA-IFA-LSSVM組合模型的預測結果與實際腐蝕速率相對較為接近,相對誤差變化相對平穩(wěn),證明該模型的魯棒性較強,因此,GRA-IFA-LSSVM組合模型優(yōu)于其他三種模型,適用于氣田集輸管道內腐蝕速率預測。
表4 4種模型的預測結果Tab.4 Prediction results of four models
圖2 4種模型預測結果與實際腐蝕速率對比Fig.2 Comparison of prediction results of four models and actual corrosion rate
圖3 4種模型預測誤差對比Fig.3 Comparison of prediction errors of four models
分別將GRA-IFA-LSSVM、FA-LSSVM、GA-LSSVM以及PSO-LSSVM模型的預測結果與實際腐蝕速率進行相關性分析,結果如圖4~7所示。由圖4~7可以發(fā)現(xiàn),GRA-IFA-LSSVM模型的R2為0.975 3,FA-LSSVM模型的R2為74.39,GA-LSSVM模型的R2為67.53,PSO-LSSVM模型的R2為81.08。其中,GRA-IFA-LSSVM模型的R2最為接近1,說明用GRA-IFA-LSSVM模型對氣田集輸管道內腐蝕速率預測具有很強的準確性以及魯棒性。
圖4 GRA-IFA-LSSVM模型預測結果線性擬合圖Fig.4 Linear fitting diagram of IFA-LSSVM model prediction results
圖5 FA-LSSVM模型預測結果線性擬合圖Fig.5 Linear fitting diagram of FA-LSSVM model prediction results
圖6 GA-LSSVM模型預測結果線性擬合圖Fig.6 Linear fitting diagram of GA-LSSVM model prediction results
圖7 PSO-LSSVM模型預測結果線性擬合圖Fig.7 Linear fitting diagram of PSO-LSSVM model prediction results
為了進一步對GRA-IFA-LSSVM組合模型進行驗證,使用2.2節(jié)中的方法對模型進行評價,評價結果如圖8所示。分析圖8中數(shù)據(jù)可以發(fā)現(xiàn),在用GRA-IFA-LSSVM模型進行氣田集輸管道內腐蝕速率預測的過程中,其平均相對誤差為1.946%,均方根誤差為1.496%,可決系數(shù)為0.975 3,這三項指標均小于其他模型。因此,在氣田集輸管道內腐蝕速率預測過程中,本研究提出的GRA-IFA-LSSVM組合模型具有很強的準確性、魯棒性以及先進性,可以在氣田集輸管道腐蝕速率預測的過程中推廣使用該種類型的方法。
圖8 誤差分析Fig.8 Error analysis
(1) 在使用FA模型對LSSVM模型進行參數(shù)尋優(yōu)的過程中,非常容易陷入局部最優(yōu)的問題,因此,需要對其進行改進。對于IFA模型而言,其引入了新的慣性權重計算措施,同時,在對螢火蟲個體的位置進行初始化時,引入了Logistics混沌初始化方法,可以避免出現(xiàn)參數(shù)優(yōu)選過程中的局部最優(yōu)問題。
(2) 在進行腐蝕速率預測時,如果將所有影響因素都輸入到預測模型中,將會使得模型的復雜性提升,通過使用GRA算法對影響因素進行簡化發(fā)現(xiàn),溫度、H2S含量、CO2含量、pH以及流速屬于氣田集輸管道內腐蝕的主要影響因素,可以使用這五項影響因素代替所有影響因素輸入到預測模型中進行腐蝕速率預測。
(3) 通過本研究所提出的GRA-IFA-LSSVM組合模型對氣田集輸管道內腐蝕速率進行預測,其平均相對誤差為1.946%,均方根誤差為1.496%,可決系數(shù)為0.975 3,這3項指標均小于其他模型,相對誤差的變化也相對較小,證明該模型具有很強的準確性、魯棒性以及先進性,可以在我國氣田中推廣使用。