,,,
(北京化工大學(xué) 化工安全教育部工程研究中心,北京 100029)
工藝管道中影響腐蝕的因素眾多,腐蝕速率與管道內(nèi)的介質(zhì)成分、環(huán)境條件以及管道運(yùn)行時間等息息相關(guān)[1]。一般情況下,腐蝕影響因素之間相互關(guān)聯(lián),這使得管道內(nèi)的腐蝕情況十分復(fù)雜。此外,管道內(nèi)影響腐蝕的諸多因素也是不斷發(fā)生變化的,這導(dǎo)致難以用函數(shù)表達(dá)式直接建立起影響因素與腐蝕速率之間的關(guān)系。
目前,國內(nèi)學(xué)者就管道腐蝕速率預(yù)測問題,進(jìn)行了大量研究。喻西崇等[2]在灰色模型的基礎(chǔ)上進(jìn)行了改進(jìn),實(shí)現(xiàn)了管道腐蝕速率趨勢預(yù)測;張鎮(zhèn)等[3]將灰色理論與人工神經(jīng)網(wǎng)絡(luò)、時間序列分析方法相結(jié)合,建立了灰色組合模型來預(yù)測管道腐蝕速率;王海濤等[4]采用三次指數(shù)平滑法,對已有的腐蝕速率統(tǒng)計數(shù)據(jù)進(jìn)行擬合,并對腐蝕速率進(jìn)行了預(yù)測分析。現(xiàn)有研究中的預(yù)測方法各有特點(diǎn)并且都能夠?qū)艿栏g速率進(jìn)行預(yù)測,但這些方法多從單一角度進(jìn)行分析,未能全面考慮管道腐蝕影響因素及其相關(guān)性和冗余性,這不可避免造成了預(yù)測誤差;另一方面,用于腐蝕速率預(yù)測的樣本數(shù)據(jù)有限,因而預(yù)測準(zhǔn)確性也在一定程度上受到了制約。
因此,為解決有限樣本數(shù)據(jù)條件下工藝管道中腐蝕速率難以估算的問題,本工作采用核主成分分析方法對多種腐蝕影響因素進(jìn)行融合處理,摒棄核主成分分析結(jié)果中貢獻(xiàn)率低的主元變量,將貢獻(xiàn)率高即包含主要信息的主元變量作為輸入,腐蝕速率作為目標(biāo)輸出,建立支持向量機(jī)模型來對管道腐蝕速率進(jìn)行預(yù)測。
核主成分分析(KPCA)是PCA算法的改進(jìn),它采用非線性方法來提取主成分[5]。KPCA首先對樣本xk進(jìn)行非線性變換φ(xk),將其映射到高維特征空間F,此時協(xié)方差矩陣為
上述矩陣的特征值λ和特征向量V滿足以下條件
λV-CV=0(2)
引入非線性函數(shù)φ(xk),可得
λφ(xk)V-φ(xk)CV=0(3)
上式中的特征向量V可由φ(xi)線性表示,即
將式(2)和式(4)代入式(3),并引入核函數(shù)Kij=K(xi,xj)=φ(xi)φ(xj),簡化后有
mλα-Kα=0(5)
式中:α為核矩陣K的特征向量。對于任意樣本,在特征空間F中主元φ(x)上的投影為
式中:L為m×m階單位矩陣,系數(shù)為1/m。
支持向量機(jī)(SVM)是一種以統(tǒng)計學(xué)習(xí)理論為基礎(chǔ),專門處理小樣本情況下非線性分類和回歸問題的新穎算法[7],最早由Cortes和Vapnik于1995年提出。在處理回歸問題時,其基本思想是通過一個非線性映射將低維空間非線性回歸問題轉(zhuǎn)換到一個高維特征空間(Hilbert空間),然后用數(shù)據(jù)集在此高維特征空間中建立模型來進(jìn)行回歸擬合[8-10]。
本工作選取工藝管道中腐蝕影響因素原始數(shù)據(jù)經(jīng)KPCA融合后累計貢獻(xiàn)率在85%以上的主元變量作為模型輸入,腐蝕速率為輸出,建立了一個如圖1所示的支持向量機(jī)模型,該模型為多輸入單數(shù)輸出結(jié)構(gòu)。
圖1 支持向量機(jī)模型結(jié)構(gòu)Fig. 1 Support vector machine model
利用支持向量機(jī)的基本思想,將數(shù)據(jù)集(x1,x2,…,xm)通過非線性映射φ(x),映射到一個高維的特征空間,然后用數(shù)據(jù)集X在該空間建立模型來進(jìn)行線性回歸,回歸函數(shù)形式如下:
f(xi)=ω·φ(xi)+b(8)
式中:ω,b是回歸因子,為模型中待確定參數(shù)。
為求得回歸函數(shù),將上述問題轉(zhuǎn)換為下列規(guī)劃問題:
約束條件為:
通過引入拉格朗日函數(shù),將上述的優(yōu)化問題轉(zhuǎn)化為Lagrange對偶問題,求解得
將式(11) 代入式(10) 中,可得下式
本工作數(shù)據(jù)源于四川石化某裝置三條精制柴油管道,各管道腐蝕影響因素值及實(shí)測腐蝕速率分別見表1。表中腐蝕速率由電阻探針在線監(jiān)測得到,部分影響因素數(shù)據(jù)是經(jīng)采樣分析計算得出的,壓力和溫度由現(xiàn)場監(jiān)測儀表得到。
由表1可見:對于上述三條管道,均選取的影響管道內(nèi)腐蝕速率的主要因素有測試時間、壓力、溫度、總硫含量、氮含量、pH、氧含量、流速等8個。其中,構(gòu)成原始數(shù)據(jù)集的共3個數(shù)據(jù)集,每個數(shù)據(jù)集包含24組樣本。選取管道a的24組樣本數(shù)據(jù)作為訓(xùn)練樣本,管道b和c的樣本數(shù)據(jù)作為測試樣本。
核主成分分析中最關(guān)鍵的是核參數(shù)σ的確定,目前仍無統(tǒng)一的選擇標(biāo)準(zhǔn)。為研究不同核參數(shù)對最終預(yù)測誤差的影響,將KPCA核參數(shù)σ作為單一變量,選用不同的參數(shù)值對樣本進(jìn)行核主成分分析,建立SVM模型來預(yù)測腐蝕速率,并根據(jù)式(13)計算預(yù)測結(jié)果的平均相對誤差。圖2和表2分別為核參數(shù)與誤差的關(guān)系曲線圖及相應(yīng)的計算數(shù)據(jù)。
由圖2可知,預(yù)測誤差emape隨著核參數(shù)σ值的增大先減小后增大至不變,當(dāng)σ=100時,emape最小。
利用KPCA對訓(xùn)練樣本進(jìn)行處理,提取貢獻(xiàn)率較大的前8個特征值和相對應(yīng)的貢獻(xiàn)率,各特征值的對應(yīng)貢獻(xiàn)率如圖3所示,根據(jù)各特征值的貢獻(xiàn)率計算累計貢獻(xiàn)率,結(jié)果如表3所示。
由表3可見:前3個特征值的累計貢獻(xiàn)率已達(dá)到85%,故選取前三個特征值所對應(yīng)的主元作為支持向量機(jī)模型的輸入,建立支持向量機(jī)模型。對比原始樣本發(fā)現(xiàn),KPCA方法在最大程度保留原始樣本信息的情況下,實(shí)現(xiàn)了樣本維數(shù)的縮減,將樣本維數(shù)由原來的8維縮減到3維,降低了影響因素間的冗余性,為建立SVM預(yù)測模型奠定了基礎(chǔ)。
表1 三條管道的腐蝕影響因素及對應(yīng)腐蝕速率Tab. 1 Corrosion influencing factors and corresponding corrosion rates of three pipes
圖2 核參數(shù)與預(yù)測誤差關(guān)系曲線Fig. 2 Relationship curve between kernel parameter and prediction error
序號核參數(shù)平均相對誤差/%1102.9821021.7131033.0041043.3151053.3261063.32
圖3 特征值貢獻(xiàn)率Fig. 3 Contribution rate of eigenvalues
序號特征值貢獻(xiàn)率/%累計貢獻(xiàn)率/%15.88365.8865.8821.4416.1382.0130.7728.6590.6640.4595.1495.8050.1691.9097.7060.0880.9998.6970.040.4599.1480.0280.3199.45
分別運(yùn)用同類型管道b和c的工程數(shù)據(jù),對管道a樣本數(shù)據(jù)建立的KPCA-SVM預(yù)測模型進(jìn)行檢驗(yàn),結(jié)果如圖4所示。
(a) 管道b
(b) 管道c圖4 管道腐蝕速率預(yù)測結(jié)果Fig. 4 Prediction results of corrosion rate of pipeline
由圖4可見:基于KPCA和SVM方法得到的預(yù)測腐蝕速率與真實(shí)腐蝕速率的趨勢基本一致,對管道b、管道c的24個樣本的腐蝕速率預(yù)測值均能良好地逼近真實(shí)值。為評定預(yù)測效果,根據(jù)式(13)~(15)分別計算預(yù)測結(jié)果的平均相對誤差、絕對平均誤差及方均根誤差,計算結(jié)果如表4所示。
表4數(shù)據(jù)表明,KPCA-SVM模型在預(yù)測同類型管道腐蝕速率時的三類預(yù)測誤差均較小,預(yù)測效果比較符合實(shí)際需求。
表4 腐蝕速率預(yù)測誤差Tab. 4 Corrosion rate prediction error
(1) 采用KPCA方法,降低了多種腐蝕影響因素間的冗余性,有效縮減了數(shù)據(jù)維數(shù),為后續(xù)腐蝕速率預(yù)測奠定了基礎(chǔ)。
(2) 當(dāng)KPCA選用徑向基核函數(shù)時,KPCA-SVM模型的預(yù)測誤差隨著KPCA核參數(shù)σ的增大先減小后增大,最后穩(wěn)定不變。
(3) 由同類型管道實(shí)際工程數(shù)據(jù)對模型的預(yù)測效果的檢驗(yàn)結(jié)果可知,基于KPCA和SVM方法建立的模型得到的管道腐蝕速率的預(yù)測值與真實(shí)值的吻合程度較高,三類誤差均較小,符合實(shí)際要求。