范 婕,許欣怡,周詩(shī)崠,周年勇
(常州大學(xué) 石油工程學(xué)院 江蘇省油氣儲(chǔ)運(yùn)技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 常州 213164)
天然氣水合物又稱籠型水合物,是一種類冰狀的結(jié)晶物質(zhì),由天然氣(主要成分為甲烷)和一定量的水在低溫高壓的條件下形成[1]。作為一種清潔能源,天然氣水合物的應(yīng)用前景十分廣闊[2]。然而在天然氣集輸管道中,天然氣水合物的生成會(huì)影響輸送管線的安全運(yùn)行。大量生成的天然氣水合物在流動(dòng)過(guò)程中會(huì)集聚并堵塞管道,導(dǎo)致管內(nèi)壓差增大,嚴(yán)重時(shí)會(huì)損壞管道[3-4]。為確保天然氣在管道中的流動(dòng)安全,提高天然氣水合物生成條件的預(yù)測(cè)精度是十分有必要的[5]。
在天然氣水合物形成條件的預(yù)測(cè)方面,國(guó)內(nèi)外學(xué)者取得了相對(duì)豐富的研究成果,形成了以vdW-P模型和Chen-Guo模型[6-7]為代表的熱力學(xué)計(jì)算模型。但在實(shí)際過(guò)程中,影響天然氣水合物生成的因素較為復(fù)雜,需要考慮的變量較多,計(jì)算復(fù)雜繁瑣,這限制了純理論模型的應(yīng)用。為進(jìn)一步拓展水合物生成條件的預(yù)測(cè)方法,REBAI等[8]提出了一種預(yù)測(cè)混合組分體系水合物生成壓力的方法,使用人工神經(jīng)網(wǎng)絡(luò)(ANN),對(duì)基于vdW-P模型的熱力學(xué)模型近似地補(bǔ)充了壓力修正項(xiàng),結(jié)果顯示,壓力的總體相對(duì)誤差從23.75%顯著降低到3.15%。SOROUSH等[9]建立了一種前饋式ANN用于預(yù)測(cè)糖類和酸性氣體體系的水合物形成,該模型與其他關(guān)聯(lián)式熱力學(xué)模型相比,尤其是對(duì)混酸氣體進(jìn)行生成預(yù)測(cè)時(shí),預(yù)測(cè)精度很高,總均方誤差為0.349。MEHRIZADEN[10]采用ANN和自適應(yīng)神經(jīng)模糊干擾系統(tǒng)(ANFIS)來(lái)估算不同天然氣系統(tǒng)的水合物生成壓力,將預(yù)測(cè)結(jié)果與實(shí)驗(yàn)方程進(jìn)行比較,結(jié)果表明,ANFIS模型在所有情況下都優(yōu)于ANN模型,且ANFIS模型比經(jīng)驗(yàn)公式的預(yù)測(cè)精度更高。鄭秋海等[11]通過(guò)深度神經(jīng)網(wǎng)絡(luò)提取生產(chǎn)數(shù)據(jù)的網(wǎng)絡(luò)特征,將提取的特征融合生產(chǎn)數(shù)據(jù)來(lái)增強(qiáng)數(shù)據(jù)區(qū)分度,使用非線性支持向量機(jī)(SVM)對(duì)融合數(shù)據(jù)進(jìn)行水合物生成預(yù)測(cè),實(shí)驗(yàn)表明深度神經(jīng)網(wǎng)絡(luò)結(jié)合支持向量機(jī)(FDNN-SVM)模型滿足海底管線生產(chǎn)運(yùn)行需求。彭炎等[12]采用支持向量回歸方法進(jìn)行天然氣水合物成藏預(yù)測(cè)研究,結(jié)果表明,支持向量回歸方法在凍土區(qū)天然氣水合物生成預(yù)測(cè)方面的應(yīng)用是有效的。徐小虎等[13]建立了基于粒子群算法(PSO)的最小二乘支持向量機(jī)(LSSVM)模型和誤差反向傳播(BP)神經(jīng)網(wǎng)絡(luò),對(duì)含抑制劑體系下的天然氣水合物生成進(jìn)行了預(yù)測(cè),結(jié)果表明,前者更為精準(zhǔn)??梢?jiàn),支持向量機(jī)能夠結(jié)合不同的優(yōu)化算法,對(duì)水合物生成預(yù)測(cè)領(lǐng)域進(jìn)行研究。
本文針對(duì)天然氣水合物樣本數(shù)少這一問(wèn)題,將粒子群算法結(jié)合SVM,選用預(yù)測(cè)效果好的核函數(shù)構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)純水體系中,純組分和多組分天然氣水合物的生成條件。PSO-SVM模型的輸入?yún)?shù)為天然氣組分及溫度,輸出參數(shù)為壓力。
本文選用SVM和PSO算法建立天然氣水合物生成預(yù)測(cè)模型,并借助MATLAB語(yǔ)言編程實(shí)現(xiàn)。實(shí)驗(yàn)中能夠得到的天然氣水合物生成數(shù)據(jù)并不多,支持小樣本數(shù)據(jù)下的訓(xùn)練預(yù)測(cè)是SVM的特點(diǎn)之一,因此選用SVM構(gòu)建天然氣水合物生成預(yù)測(cè)模型。天然氣水合物生成數(shù)據(jù)所繪制的溫度壓力圖是近似平滑的曲線,SVM在曲線擬合方面也較為精準(zhǔn)。PSO算法不需要額定的參數(shù),靈活性強(qiáng),與SVM相結(jié)合能解決SVM初始準(zhǔn)確度不高和自身學(xué)習(xí)能力較弱的缺點(diǎn)。
1.1.1 支持向量機(jī)
SVM定義最優(yōu)線性超平面,并把尋找最優(yōu)線性超平面的算法歸納為求解一個(gè)凸規(guī)劃問(wèn)題[14]?;贛ercer核展開(kāi)定理,通過(guò)非線性映射Φ,把樣本空間映射到一個(gè)高維乃至無(wú)窮維的特征空間(Hilbert空間),使在特征空間中可以應(yīng)用線性學(xué)習(xí)機(jī)的方法,解決樣本空間中的高度非線性分類和預(yù)測(cè)等問(wèn)題[15]。簡(jiǎn)而言之,就是先將問(wèn)題升維,然后線性化。SVM是用于分類和回歸的算法。天然氣水合物生成條件預(yù)測(cè)是一個(gè)低維、非線性問(wèn)題,本文將對(duì)天然氣水合物生成條件構(gòu)建SVM回歸預(yù)測(cè)模型,使其變成能夠被解決的高維、線性回歸問(wèn)題。
對(duì)于SVM的基本原理,給定訓(xùn)練樣本D= {(xi,yi),i= 1, 2, …,N},xi為自變量,yi為因變量,N為樣本量,回歸模型如下:
式中,f(x)為模型的輸出變量;ω為特征空間權(quán)向量;x為輸入變量;b為偏置向量。
SVM回歸中所使用的結(jié)構(gòu)風(fēng)險(xiǎn)函數(shù)表達(dá)式如下:
式中,C為懲罰因子;m為樣本量;Lε為ε不敏感損失函數(shù);ε為損失函數(shù)的損失因子。
SVM回歸函數(shù)如下:
式中,αi為第i個(gè)樣本的Lagrange乘子,K(xi,x)為內(nèi)積,即核函數(shù)。
對(duì)于內(nèi)積問(wèn)題,一般會(huì)選用性能較好、應(yīng)用較多的RBF核函數(shù),其表達(dá)式如下:
式中,g為核函數(shù)的寬度因子。
1.1.2 粒子群算法
PSO是一種進(jìn)化計(jì)算技術(shù)[16],具有容易實(shí)現(xiàn)和不需要許多參數(shù)調(diào)節(jié)的特點(diǎn)。這使得PSO能夠被廣泛地應(yīng)用到函數(shù)優(yōu)化、神經(jīng)網(wǎng)絡(luò)及其參數(shù)優(yōu)化和模糊系統(tǒng)控制等應(yīng)用領(lǐng)域[17-18]。PSO通過(guò)設(shè)計(jì)一種無(wú)質(zhì)量的例子來(lái)模擬鳥(niǎo)群中的鳥(niǎo),粒子僅具有速度和位置兩個(gè)屬性,用速度體現(xiàn)粒子移動(dòng)的快慢,用位置體現(xiàn)粒子移動(dòng)的方向。
粒子通過(guò)下式來(lái)更新自身的速度和位置:
式中,i= 1, 2, …,N,N為此群中粒子的總數(shù);vi為粒子的速度;rand()為介于(0, 1)之間的隨機(jī)數(shù);pbesti為每個(gè)粒子的個(gè)體最優(yōu)值;gbesti為全局粒子的最優(yōu)值;xi為粒子的當(dāng)前位置;c1和c2為學(xué)習(xí)因子,通常取2;vi的最大值為Vmax(大于0),如果vi大于Vmax,則vi= Vmax。
1.1.3 PSO-SVM預(yù)測(cè)模型的實(shí)現(xiàn)方法
管線輸送天然氣的過(guò)程中,天然氣中各氣體組分含量(物質(zhì)的量分?jǐn)?shù))、溫度和壓力等都是天然氣水合物生成的影響因素。將天然氣的組分含量、溫度作為PSO-SVM模型的變量,將壓力作為因變量。為了減少迭代時(shí)間,保證算法的高效性,需要對(duì)SVM中的懲罰因子C和核函數(shù)參數(shù)g進(jìn)行優(yōu)化。PSO中的個(gè)體最優(yōu)對(duì)應(yīng)SVM中的懲罰因子C,群體最優(yōu)對(duì)應(yīng)核函數(shù)參數(shù)g。
本文中PSO-SVM模型的訓(xùn)練過(guò)程如下:(1)導(dǎo)入原始數(shù)據(jù),按比例隨機(jī)劃分訓(xùn)練集和測(cè)試集,同時(shí)對(duì)數(shù)據(jù)進(jìn)行歸一化處理;(2)對(duì)PSO進(jìn)行初始化參數(shù)設(shè)置,將訓(xùn)練集代入到PSO中,結(jié)合SVM迭代運(yùn)算,更新權(quán)值,得到兩個(gè)最優(yōu)參數(shù)懲罰因子C和核函數(shù)參數(shù)g;(3)將經(jīng)過(guò)PSO計(jì)算后的最優(yōu)參數(shù)代入SVM模型中,用測(cè)試集進(jìn)行運(yùn)算,對(duì)得到的數(shù)據(jù)反歸一化;(4)計(jì)算實(shí)際值與預(yù)測(cè)值的誤差。
1.2.1 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備及處理
通過(guò)調(diào)研現(xiàn)有文獻(xiàn)[19-22]數(shù)據(jù),得到純水體系下水合物生成數(shù)據(jù)共132組。其中,純組分天然氣水合物生成數(shù)據(jù)69組,溫度范圍273.49~298.20 K,壓力范圍2.71~43.80 MPa;多組分天然氣水合物生成數(shù)據(jù) 63組,溫度范圍 273.59~298.00 K,壓力范圍0.82~24.85 MPa,氣體組分如表1。本研究以該數(shù)據(jù),建立基于PSO-SVM模型的天然氣水合物生成預(yù)測(cè)模型,并以8:2的比例隨機(jī)劃分訓(xùn)練集和測(cè)試集。
對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練之前,需要先對(duì)數(shù)據(jù)進(jìn)行歸一化處理,使得數(shù)據(jù)范圍穩(wěn)定,避免存在極端的最大最小值,同時(shí)避免數(shù)據(jù)中的異常值和極端值帶來(lái)的影響。歸一化的效果是將原數(shù)據(jù)規(guī)整到一個(gè)閉區(qū)間內(nèi),通過(guò)Mapminmax函數(shù)來(lái)實(shí)現(xiàn)。該程序選用的區(qū)間是[1, 2],即yi∈[0, 1](i= 1, 2, 3, …,N),這種歸一化方式稱為[1, 2]區(qū)間歸一化。所用的歸一化映射如下式:
式中,x,y∈R;xmin= min(x);xmax= max(x)。
1.2.2 SVM模型核函數(shù)選取
就SVM中無(wú)法處理的非線性可分問(wèn)題而言,數(shù)據(jù)需要從低維向高維映射,核函數(shù)能夠?qū)⑻卣饔成涞礁呔S的空間,而計(jì)算過(guò)程在低維中運(yùn)行,實(shí)際效果表現(xiàn)在高維上,從而解決了維度爆炸的問(wèn)題。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、Sigmoid核函數(shù)和徑向基核函數(shù)[23]。本文在實(shí)際運(yùn)算過(guò)程中,以PSO-SVM模型為基礎(chǔ)進(jìn)行了試算,計(jì)算結(jié)果見(jiàn)2。由表2可知,徑向基核函數(shù)的結(jié)果最理想,訓(xùn)練集平均平方誤差(MSE)和測(cè)試集MSE最小,因此選擇徑向基核函數(shù)。
表2 不同核函數(shù)下PSO-SVM模型的參數(shù)及誤差Table 2 Parameters and errors of PSO-SVM model with different kernel functions
1.2.3 運(yùn)算參數(shù)
PSO參數(shù)設(shè)置對(duì)算法本身的運(yùn)行有很大影響[24]。為進(jìn)一步研究PSO-SVM模型在天然氣水合物生成預(yù)測(cè)領(lǐng)域中的精準(zhǔn)度,對(duì)PSO初始化參數(shù)進(jìn)行了優(yōu)化設(shè)計(jì),見(jiàn)表3。PSO-SVM模型運(yùn)算得到的最優(yōu)懲罰因子C為97.5331,最優(yōu)核函數(shù)參數(shù)g為0.6439。
表3 PSO初始參數(shù)Table 3 Initial parameters of PSO
PSO-SVM模型模擬的適應(yīng)度較高,所以在程序編寫(xiě)過(guò)程中,對(duì)適應(yīng)度的倒數(shù)進(jìn)行曲線描述,如圖1所示。由圖1可知,隨著PSO迭代次數(shù)增加,適應(yīng)度倒數(shù)的值越小,該值也指均方差均值,誤差越小越好。說(shuō)明PSO-SVM模型適用于天然氣水合物的生成預(yù)測(cè)。
圖1 適應(yīng)度曲線Fig.1 Fitness curve
通過(guò)PSO-SVM模型,對(duì)收集到的數(shù)據(jù)組進(jìn)行訓(xùn)練預(yù)測(cè)。純組分天然氣水合物生成預(yù)測(cè)結(jié)果如圖2所示。圖2中方點(diǎn)代表天然氣水合物生成的真實(shí)壓力,圓點(diǎn)代表PSO-SVM模型計(jì)算得到的預(yù)測(cè)壓力。從圖2可知,兩條曲線的數(shù)據(jù)點(diǎn)很接近,但在高于295 K后,預(yù)測(cè)壓力誤差較大。說(shuō)明在 273.49~295.00 K之間,PSO-SVM模型預(yù)測(cè)的可靠性很高,模型相對(duì)誤差的最大值為8.768%,最小值為0.015%。
圖2 純組分天然氣水合物生成預(yù)測(cè)Fig.2 Formation prediction of pure component natural gas hydrate
4個(gè)不同體系多組分天然氣水合物生成預(yù)測(cè)結(jié)果如圖3所示。由圖3可知,體系1中,兩條曲線的數(shù)據(jù)點(diǎn)基本吻合,個(gè)別預(yù)測(cè)值誤差較大;體系2中,數(shù)據(jù)點(diǎn)在273.80~291.00 K之間的誤差較小,但溫度高于291 K后,數(shù)據(jù)的吻合度不高;體系3和體系4中,兩條曲線的數(shù)據(jù)點(diǎn)大體吻合。總的看來(lái),PSO-SVM模型對(duì)多組分天然氣水合物生成預(yù)測(cè)的準(zhǔn)確度也很高。
圖3 多組分天然氣水合物生成預(yù)測(cè)Fig.3 Formation prediction of multi-component gas hydrate
為進(jìn)一步檢驗(yàn)PSO-SVM模型預(yù)測(cè)的可行性和準(zhǔn)確性,采用MSE、平方相關(guān)系數(shù)(R2)和平均絕對(duì)比例誤差(MAPE)等指標(biāo)進(jìn)行評(píng)價(jià)。評(píng)價(jià)指標(biāo)定義如下:
式中,n為樣本數(shù);Yi為實(shí)際值;為預(yù)測(cè)值。
MSE為所有樣本的樣本誤差絕對(duì)值的均值,該值越接近0,模型越準(zhǔn)確;R2為因變量的方差能被自變量解釋的程度,該值越接近1,模型效果越好;MAPE為所有樣本誤差的絕對(duì)值占實(shí)際值的比值,該值越接近0,模型越準(zhǔn)確。PSO-SVM模型對(duì)測(cè)試集預(yù)測(cè)的評(píng)價(jià)結(jié)果見(jiàn)表4。
表4 評(píng)價(jià)結(jié)果Table 4 Evaluation results
由表4可知,對(duì)于純組分和多組分天然氣水合物,模型的MSE和R2都很理想,并且MAPE也比較低。
建立了預(yù)測(cè)純組分和多組分天然氣水合物生成條件的PSO-SVM模型,并對(duì)模型進(jìn)行了分析與評(píng)價(jià),得到如下結(jié)論。
(1)SVM的核函數(shù)是影響PSO-SVM模型預(yù)測(cè)結(jié)果的主要因素,其中徑向基核函數(shù)的預(yù)測(cè)效果最優(yōu)。預(yù)測(cè)天然氣水合物生成條件,模型最優(yōu)懲罰因子C為97.5331,最優(yōu)核函數(shù)參數(shù)g為0.6439,訓(xùn)練集和測(cè)試集的MAPE分別為2.74%和2.84%。
(2)PSO-SVM模型中,純組分和多組分天然氣水合物的適用溫度分別為273.49~295.00 K和273.59~298.00 K。
(3)PSO-SVM模型對(duì)純水體系下,純組分和多組分天然氣水合物生成條件具有較好的預(yù)測(cè)精度,預(yù)測(cè)純組分天然氣水合物時(shí),MSE、R2和MAPE分別為0.0003963、0.9996和2.84%;預(yù)測(cè)多組分天然氣水合物時(shí),MSE、R2和MAPE分別為 0.0006870、0.9983和2.74%。