唐莉
(大慶師范學(xué)院數(shù)學(xué)科學(xué)學(xué)院,黑龍江 大慶 163712)
氣相色譜法是利用氣體作流動相的色層分離分析方法。汽化的試樣被載氣(流動相)帶入色譜柱中,柱中的固定相與試樣中各組份分子作用力不同,各組份從色譜柱中流出時間不同,組份彼此分離。采用適當(dāng)?shù)蔫b別和記錄系統(tǒng),制作標(biāo)出各組份流出色譜柱的時間和濃度的色譜圖。根據(jù)圖中表明的出峰時間和順序,可對化合物進行定性分析;根據(jù)峰的高低和面積大小,可對化合物進行定量分析。具有效能高、靈敏度高、選擇性強、分析速度快、應(yīng)用廣泛、操作簡便等特點。適用于易揮發(fā)有機化合物的定性、定量分析。對非揮發(fā)性的液體和固體物質(zhì),可通過高溫裂解,氣化后進行分析[7]。氣相色譜分析常被用在地化分析技術(shù)當(dāng)中,在漫長的地質(zhì)歷史過程中,水中的細菌就與部分烴類發(fā)生菌解和氧化作用,使正構(gòu)烷烴減少,異構(gòu)烴類與雜原子化合物增加,導(dǎo)致色譜峰較油層低,輕組分相對減少,主峰碳明顯,碳數(shù)范圍變窄等。經(jīng)過對樣品分析結(jié)合試油資料,就可以總結(jié)油層、油水同層、水層的典型譜圖特征[10]。
在應(yīng)用過程中總結(jié)了不同油質(zhì)類型的譜圖特征基本上響應(yīng)值是以正態(tài)分布為主,峰形為三角形(包括前三角形、后三角形)、馬鞍型等。用這些特征來判斷油水層基本上是以圖形來定義油水層特征,屬于定性判斷,且圖形的微觀變化無法表示出來,并且受人為因素影響太大,因此如何將圖形數(shù)字化,用數(shù)字描述圖形,建立氣相色譜譜圖解釋模型;從氣相色譜譜圖解釋模型入手,尋找敏感參數(shù),建立定量解釋標(biāo)準是急需解決的難題[11]。
氣相色譜分析技術(shù)可以檢測儲層中可流動部分的烴類,從氣相色譜譜圖解釋模型入手,尋找敏感參數(shù),為定量解釋標(biāo)準的建立奠定基礎(chǔ)[9]。
氣相色譜圖目前可以由保留時間-響應(yīng)值的坐標(biāo)系、碳數(shù)-峰高坐標(biāo)系、碳數(shù)-飽和烴面積坐標(biāo)系及碳數(shù)-質(zhì)量分數(shù)坐標(biāo)系四種形式顯示[12]。無論以哪一種形式顯示的譜圖,其大致形狀是一致的。下面以碳數(shù)-質(zhì)量分數(shù)坐標(biāo)系的形式來對譜圖的形態(tài)進行分析。從碳數(shù)-質(zhì)量分數(shù)坐標(biāo)系下的氣相色譜圖的形態(tài)可以聯(lián)想到正態(tài)函數(shù)該函數(shù)取不同的σ值和不同的μ值時的圖形如下。
圖1 正態(tài)函數(shù)圖像
為了很好地對氣相色譜圖進行表征,首先需要確定要表征的圖形對象。原始譜圖的橫坐標(biāo)是保留時間,縱坐標(biāo)是響應(yīng)值[8]。由于各種組分的保留時間不一致,因此本文將碳數(shù)作為橫坐標(biāo),分別將峰高、峰面積、質(zhì)量分數(shù)作為縱坐標(biāo),再對離散數(shù)據(jù)點進行擬合。當(dāng)峰高、峰面積為縱坐標(biāo)時,氣相色譜擬合圖數(shù)值差別較大,不容易進行對比,但取質(zhì)量分數(shù)為縱坐標(biāo)時的擬合卻很好,一方面保留了圖形的信息,另一方面不同井、層位和深度的差異相對很小,只是形狀有些差異,比較便于進行表征。因此表征的對象定為將碳數(shù)作為橫坐標(biāo)、將質(zhì)量分數(shù)作為縱坐標(biāo)的氣相色譜圖[14]。
在后面的分析中會看到,氣相色譜圖表征的出發(fā)點是分段表征,因此要求在分段表征前先對所有離散數(shù)據(jù)點合理地分成幾段[15]。離散點的分布從整體上看具有明顯的變化趨勢,但是離散點有時高、有時低,因此要對所有離散點進行整體擬合,以確定色譜圖是單峰還是雙峰。作整體擬合的另外一個原因是要用整體擬合函數(shù)的峰值點將所有離散數(shù)據(jù)點進行分段并參與分段后的擬合[16]。
函數(shù)擬合最常用的方法是最小二乘法,該法選取的基函數(shù)是{1,x,x2, …,xn},其最后一步要解一個線性代數(shù)方程組,而此方程組的系數(shù)矩陣是Hilbert矩陣,這就不易得到準確的擬合函數(shù),出現(xiàn)這個問題的原因是基函數(shù)選擇不恰當(dāng)。所以,我們構(gòu)造正交多項式族作為基函數(shù),這時再求擬合函數(shù)的系數(shù)時,不用解方程組,不僅克服了系數(shù)矩陣病態(tài)的問題,同時也大大減少了計算量[17]。方法的原理如下:
假設(shè)給定m+1個數(shù)據(jù)點(xi,yi),i=0, 1, …,m其中x0<x1<…<xm。求n次(n<m)多項式使得在m+1個給定點上的偏差平方和最小。先約定關(guān)于點集{x0,x1, …,xm}的內(nèi)積定義為
(1)正交函數(shù)族的構(gòu)造
首先從線性無關(guān)的函數(shù)族{1,x,x2, …,xn}出發(fā),利用施密特正交化方法構(gòu)造出如下的函數(shù)族
其中
下面證明這樣構(gòu)造的函數(shù)族確實是關(guān)于點集{x0,x1, …,xm}正交的。
由上述的表達式有
現(xiàn)假定(Pl,Ps)=0(l≠s)對s=0,1,…,l-1及l(fā)=0,1,…,k;k<n均成立。要證(Pk+1,Ps)=0,s=0,1,…,k,
由于(Pk+1,Ps)=((x-γk+1)Pk,Ps)-βk(Pk-1,Ps)=(xPk-Ps)-γk+1(Pk,Ps)-βk(Pk-1,Ps)
由歸納法假定,當(dāng)0≤s≤k-2時(Pk,Ps)=0,(Pk-1,Ps)=0
另外,xPx(x)是首項系數(shù)為1的s+1次多項式,它可由P0,P1,…,Ps+1的線性組合表示,而s+1≤k-1,固由歸納法假定又有(xPx,Ps)≡(Pk,xPs)=0,所以當(dāng)0≤s≤k-2時,(Pk+1,Ps)=0。
由(Pk+1,Pk-1)=(xPx,Pk-1)-γk+1(Pk,Pk-1)-βk(Pk-1,Pk-1)及假定有(Px,Pk-1)=0得
由上式和βk的表達式得(Pk+1,Pk-1)=(xPx,Pk-1)-βk(Pk-1,Pk-1)= (Pk,Pk)-(Pk,Pk)=0
最后
至此就證明了多項式{Pk(x)}(k=0,1,…,n,n<m)組成一個關(guān)于點集{xi}正交系[19]。
(2)擬合函數(shù)的求取
令S(x)=a0P0(x)+a1P1(x)+…+anPn(x)
由P0(x),P1(x),…,Pn(x)關(guān)于點集{x0,x1,…,xm}正交,即(Pi,Pj)=0,i≠j,方程組變?yōu)?/p>
所以方程組的解為
ak求出后,擬合函數(shù)就為S(x)=a0P0(x)+a1P1(x)+…+anPn(x)。
由于利用了正交多項式擬合,減少了工作量,也避免解方程組時出現(xiàn)的病態(tài)性。關(guān)于n的值不宜取得過大,否則會出現(xiàn)震蕩現(xiàn)象,一般取n=5時擬合效果就很好了。由前面的分析看到圖形的寬窄由于函數(shù)中標(biāo)準差σ的改變而發(fā)生變化,最高點的縱坐標(biāo)也發(fā)生了改變,這對圖形表征不利[20]。因此我們選擇概率函數(shù) 來取代正態(tài)函數(shù),k值的大小可以反映概率函數(shù)圖形的主要形態(tài),參數(shù)個數(shù)變少了,還有明確的幾何意義,這兩類函數(shù)很適合作為表征函數(shù)[21]。
(1) 確定概率函數(shù)和二次函數(shù)的表征參數(shù)的數(shù)學(xué)方法研究
設(shè)此段離散數(shù)據(jù)點為(x0,y0), (x1,y1), (x2,y2),…,(xm,ym),其中整體擬合函數(shù)的頂點坐標(biāo)為(x0,y0)[1]
兩邊取對數(shù)得:lny=lny0+k(x-x0)2
所以
即
所以
(2) 圖形的分段表征函數(shù)的確定
由于已確定了所有的離散數(shù)據(jù)點的分段,并且研究了對每一段離散數(shù)據(jù)點用概率函數(shù)進行表征時表征參數(shù)k的求取公式和用二次函數(shù)進行表征時表征參數(shù)a的求取公式[3]。接下來就是對每段數(shù)據(jù)點進行表征擬合,通過比較來確定哪一類函數(shù)表征擬合的效果好就作為該離散數(shù)據(jù)段的表征函數(shù)。可以發(fā)現(xiàn)有單峰有雙峰,經(jīng)統(tǒng)一辨別,將所有譜圖定義為四段,當(dāng)擬合的曲線為單峰時,僅有第一段、第四段函數(shù)的參數(shù)信息;為雙峰時,第一、二、三、四段函數(shù)的參數(shù)信息都存在[22]。
下邊首先對飽和烴氣相色譜表征過程進行完整的說明,接著給出表征結(jié)果的效果檢驗,最后給出表征參數(shù)的統(tǒng)一定義[4]。 飽和烴氣相色譜表征分以下四步進行:(1)選取數(shù)據(jù)庫中要表征的氣相色譜圖;(2)擬合,確定峰形和頂點坐標(biāo);(3)利用擬合頂點將數(shù)據(jù)點進行分段;(4)對每一段確定表征函數(shù)及相應(yīng)的參數(shù)值。為了說明圖形表征及所求特征參數(shù)的有效性,需要定量分析利用特征參數(shù)恢復(fù)的圖形和原始圖形的近似程度[23]。
假設(shè)在原始離散點的坐標(biāo)為(x0,y0), (x1,y1), (x2,y2),…,(xm,ym),每一段所選的特征函數(shù)及相應(yīng)的特征參數(shù)其實就是得到了在區(qū)間[x0,xm]上的分段函數(shù),求該分段函數(shù)在x0,x1, …,xm上的函數(shù)值,記為y0′,y0′,…,ym′。
(1) 圖2是得到的表征函數(shù)及其參數(shù)進行圖形恢復(fù)的效果圖,圖3是用擬合函數(shù)作為表征函數(shù)進行圖形恢復(fù)的效果圖[24]。
圖2 圖形恢復(fù)效果圖
圖3 圖形恢復(fù)效果圖
觀察圖形可知利用所研究的方法恢復(fù)效果的近似度大,且表征參數(shù)個數(shù)少,因此表征效果優(yōu)于直接利用整體擬合函數(shù)作為表征函數(shù)進行表征的效果[6]。
(2) 圖4是利用研究所得到的表征函數(shù)及其參數(shù)進行圖形恢復(fù)的效果圖,圖5是用一個概率函數(shù)作為表征函數(shù)進行圖形恢復(fù)的效果圖[25]。
圖4 圖形恢復(fù)效果圖
圖5 圖形恢復(fù)效果圖
從恢復(fù)圖形的效果及近似度可以看出,利用所研究的方法恢復(fù)效果優(yōu)于后者。同時也說明了研究中所提出的分段表征的科學(xué)性和正確性[26]。
觀察氣象色譜如圖6、圖7所示。
圖6 單峰
圖7 雙峰
從選取的函數(shù)來看,是二次函數(shù)及概率函數(shù),因此,將分段函數(shù)做如下定義:第一段二次函數(shù)的特征參數(shù)用a1表示,第一段概率函數(shù)的特征參數(shù)用k1表示;第二段二次函數(shù)的特征參數(shù)用a2表示,第二段概率函數(shù)的特征參數(shù)用k2表示;第三段二次函數(shù)的特征參數(shù)用a3表示,第三段概率函數(shù)的特征參數(shù)用k3表示;第四段二次函數(shù)的特征參數(shù)用a4表示,第四段概率函數(shù)的特征參數(shù)用k4表示。
文章通過地化分析參數(shù)進行量化表征處理方法的研究,對氣相色譜資料進行數(shù)學(xué)表征,求取有效的評價參數(shù),所建立的地化分析單項資料的處理方法,有效地提高了算法的全面性,并通過對實例計算驗證了算法的可行性及可用性,對地化分析參數(shù)進行量化表征處理方法的研究達到了預(yù)期的目的,為實際生產(chǎn)提供了很強的實際指導(dǎo)意義。本文的圖形表征時主要考慮飽和烴面積的質(zhì)量分數(shù),這為下一步將未分辨面積作表征奠定了基礎(chǔ),接下來將進一步做探究。