周圍,李安吉,俞鐵鋮,尹冉,趙麗娟,趙美琪
(東北石油大學(xué)物理與電子工程學(xué)院,黑龍江 大慶 163318)
柴油是使用最廣泛的石油燃料之一,其使用價值取決于它的純度。傳統(tǒng)的柴油純度檢測方法費(fèi)用高且耗時冗長,不能滿足快速、無污染與低成本檢測柴油純度的現(xiàn)實(shí)需求。因此,需要建立一種檢測柴油純度的新方法。
紅外光譜技術(shù)具有分析速度快、無損檢測以及價格低等優(yōu)點(diǎn),在石化、食品、農(nóng)業(yè)和藥物分析等領(lǐng)域被廣泛應(yīng)用[1-4]。在石化分析領(lǐng)域,該技術(shù)已逐步應(yīng)用于檢測油品成分及其物化性質(zhì)[5]。Wikberg等[6]利用紅外光譜技術(shù)對化石柴油混合物中的可再生柴油(HVO)含量進(jìn)行了定量分析,HVO預(yù)測模型的RMSEP為0.026 6,預(yù)測效果較好。歐陽愛國等[7]利用紅外光譜法結(jié)合支持向量機(jī)對乙醇柴油中的乙醇含量進(jìn)行了分析,結(jié)果表明,預(yù)測模型的Rp為0.995 3,RMSEP為0.571 0,該預(yù)測模型可實(shí)現(xiàn)對乙醇含量的預(yù)測。陳素彬等[8]建立了ELM光譜校正模型來快速測定柴油凝點(diǎn),所建模型預(yù)測精度高且較穩(wěn)定,其Rp為0.956 8,RMSEP為1.029 9。國內(nèi)外文獻(xiàn)報道中主要針對柴油混合物中其他物質(zhì)含量或柴油性質(zhì)進(jìn)行分析檢測,而對柴油純度即柴油體積分?jǐn)?shù)的檢測卻鮮有報道。
本研究利用紅外光譜技術(shù)采集51種不同體積分?jǐn)?shù)的柴油光譜數(shù)據(jù),采用主成分馬氏距離法來檢測并剔除柴油樣本中的異常樣本[9]。根據(jù)預(yù)處理效果的不同,將常用的十種預(yù)處理方法Savitzky-Golay(SG)平滑、一階導(dǎo)數(shù)(1stderivative)、二階導(dǎo)數(shù)(2ndderivative)、移動窗口平滑(MWA)、標(biāo)準(zhǔn)正態(tài)變換(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)、歸一化(normalization)、標(biāo)準(zhǔn)化(auto)、中心化(center)、尺度化(scal)[10-11]共分為4類,選出每類方法中的最佳預(yù)處理方法并進(jìn)行全排列組合研究,結(jié)合無預(yù)處理和單一預(yù)處理,通過偏最小二乘法(partial least squares,PLS)建模,根據(jù)建模后的模型評價指標(biāo)選出適用于柴油純度光譜數(shù)據(jù)的預(yù)處理組合,實(shí)現(xiàn)對柴油純度的快速檢測。
柴油、煤油、機(jī)油購自當(dāng)?shù)卣?guī)的加油站,其純度與品質(zhì)均符合國家標(biāo)準(zhǔn)。在實(shí)驗(yàn)室中,通過控制每次加入柴油、機(jī)油、煤油的體積分?jǐn)?shù),使溶液中的柴油含量按2%從0遞增到1,其中煤油與機(jī)油隨機(jī)配比,最終得到51個不同體積分?jǐn)?shù)的柴油溶液樣本。
IRTracer-100傅里葉變換紅外光譜儀,日本島津;APTC-2帕爾貼恒溫控制器,奧特賽恩斯儀器有限公司。
實(shí)驗(yàn)在常溫下進(jìn)行,波長用波數(shù)表征,光程為0.1 mm,紅外波數(shù)范圍為400~4 000 cm-1,采集7 467個數(shù)據(jù)點(diǎn),共得到51個不同體積分?jǐn)?shù)的柴油光譜數(shù)據(jù)樣本。
采用主成分馬氏距離法來剔除異常樣本,從而提高柴油純度檢測模型的精確性與可靠性。
采用KS方法以2∶1的比例劃分校正集和預(yù)測集[12],從51個不同體積分?jǐn)?shù)柴油樣本中剔除1個異常樣本,從剩下的50個柴油樣本中,選擇34個樣本為校正集,預(yù)測集為剩下的16個樣本。
采用無預(yù)處理和單一預(yù)處理對不同體積分?jǐn)?shù)柴油數(shù)據(jù)進(jìn)行相應(yīng)處理。將一階導(dǎo)數(shù)、MWA、SNV等10種預(yù)處理方法分為4類,包括基線校正、散射校正、平滑處理和尺度縮放[13],如表1所示。然后,選出每類方法中的最佳預(yù)處理方法并對這四種方法進(jìn)行全排列組合研究,探討不同預(yù)處理組合及相同預(yù)處理組合的不同順序?qū)5挠绊?并根據(jù)建模后的模型評價指標(biāo)選出適用于紅外光譜分析柴油純度的最佳預(yù)處理方法。
表1 預(yù)處理方法的分類
使用PLS建立校正模型,采用相關(guān)系數(shù)(Rp)、預(yù)測均方根誤差(RMSEP)來評價各個預(yù)處理方法對所建模型的影響。Rp越接近1,RMSEP越小,則所建模型預(yù)測能力越強(qiáng),預(yù)測精度越高。
為測試所提出的最優(yōu)預(yù)處理及建模方法的可靠性與正確性,對0.025 mm光程的柴油光譜數(shù)據(jù)進(jìn)行相同的處理,分析建模后的評價指標(biāo)包括Rp及RMSEP。
對原始柴油數(shù)據(jù)進(jìn)行了數(shù)據(jù)集劃分,并通過PLS法建立了定量模型,得到了模型的RMSEP為0.061 9,Rp為0.982 8。為了消除樣本光譜數(shù)據(jù)中存在的異常樣本,采用主成分馬氏距離法對柴油數(shù)據(jù)進(jìn)行異常樣本剔除,得到馬氏距離的最佳閾值約為2.4,剔除的異常樣本個數(shù)為1,其序號為6,如圖1所示。
圖1 樣本序號與馬氏距離的關(guān)系
對剔除后的柴油光譜數(shù)據(jù)進(jìn)行了PLS建模分析,得到的RMSEP為0.041 1,Rp為0.988 8,RMSEP下降了33.6%,Rp提高了6.1%。由此可見,異常樣本的剔除是必要的,模型的性能得到了很大提升。
剔除后的柴油光譜如圖2所示。從圖2可以看出,柴油樣本光譜曲線大體的趨勢是一致的,并且大多數(shù)曲線具有相同或者相似的吸收峰。大部分曲線有一定的重疊現(xiàn)象,其次,光譜的平滑性較差,具有一定數(shù)量的尖峰,同時也存在一定程度的基線漂移與背景干擾,基于此,需要對光譜數(shù)據(jù)進(jìn)行預(yù)處理。
圖2 剔除異常樣本后的柴油光譜
將剔除異常樣本后的柴油光譜數(shù)據(jù)進(jìn)行一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、MSC、SNV等10種單一預(yù)處理,處理后的柴油光譜如圖3所示。
圖3 柴油數(shù)據(jù)進(jìn)行單一預(yù)處理后的光譜
從圖3可見,導(dǎo)數(shù)處理可以消除部分基線和背景的干擾,二階導(dǎo)數(shù)曲線在波長2 400~3 300 cm-1范圍內(nèi)光譜信息丟失比較嚴(yán)重;經(jīng)過MSC、SNV處理后的光譜的重合度變高,原始光譜受散射的影響得到了一定的抑制;通過平滑處理能夠較好地消除部分噪聲且對原始光譜中的有效信息不會產(chǎn)生影響,可使光譜更平滑,經(jīng)過尺度縮放后,光譜數(shù)據(jù)集中在一個特定區(qū)間內(nèi),去除了尺度及結(jié)構(gòu)差異的干擾,能夠有效保留原始光譜的有效信息;標(biāo)準(zhǔn)化后,光譜重合度降低,引入了散射的影響。
每類預(yù)處理方法中的最佳方法分別是一階導(dǎo)數(shù)、SNV、MWA、中心化。利用這4種預(yù)處理方法進(jìn)行全排列組合,具體組合方式如表2所示。
表2 預(yù)處理組合方法
對柴油光譜數(shù)據(jù)分別進(jìn)行71種預(yù)處理,然后建立PLS模型,根據(jù)RMSEP及Rp分析不同預(yù)處理的建模效果。預(yù)處理后PLS的預(yù)測結(jié)果如表3~表5所示。
表3 預(yù)處理組合方法1—23的模型評價指標(biāo)
從表3中可以看出,對于柴油數(shù)據(jù)大部分預(yù)處理都有一定的效果,RMSEP降到了0.040 0以下,Rp達(dá)到了0.990 0以上。其中經(jīng)SG平滑與歸一化處理后,模型評價指標(biāo)變差,說明這兩種預(yù)處理方法不適于柴油純度光譜數(shù)據(jù)。在單一預(yù)處理中,編號2即一階導(dǎo)數(shù)效果最好,RMSEP為0.019 5,比原始數(shù)據(jù)降低了52.6%,Rp為0.997 4,比原始數(shù)據(jù)提高了0.87%。經(jīng)兩種預(yù)處理組合處理后,模型的性能基本都得到了一定的提升,相同組合的不同順序?qū)?yīng)的RMSEP與Rp也不同,如預(yù)處理組合編號14、15的預(yù)處理組合方法相同,但先后順序不同,其RMSEP前者為0.024 4,后者為0.024 7,其Rp前者為0.995 7,后者為0.996 9,這說明預(yù)處理順序?qū)δP陀幸欢ǖ挠绊?。在兩種預(yù)處理組合中,編號12即一階導(dǎo)數(shù)與SNV組合得到的RMSEP與Rp最優(yōu),RMSEP可達(dá)0.018 7,Rp可達(dá)0.997 8,建模效果最好。
從表4中可以看出,柴油光譜數(shù)據(jù)經(jīng)3種預(yù)處理組合處理后,消除了光譜數(shù)據(jù)中的無用與干擾信息,RMSEP降到了0.027 0以下,Rp提高到了0.994 0以上,提高了模型預(yù)測能力,相比兩種預(yù)處理組合方法,3種預(yù)處理組合方法整體上更能提升模型性能。編號30與31,36與37,44與45預(yù)處理后的模型評價指標(biāo)相同,這說明中心化與SNV、MWA等組合時,組合順序不同對模型的影響可能較小。其中編號30、31、34這3種預(yù)處理組合效果最好,RMSEP降到了0.018 7,Rp提高到了0.997 8。
表4 預(yù)處理組合方法24—47的模型評價指標(biāo)
從表5中可以看出,4種預(yù)處理組合對模型優(yōu)化有一定效果,其最優(yōu)RMSEP為0.018 9,Rp為0.998 2,相比于3種預(yù)處理組合其最優(yōu)RMSEP略高,可能光譜中的部分有效信息在去除干擾信息時被扣除掉了,從而降低了建模效果。其中編號50、51、53、67這4種預(yù)處理組合效果最好,RMSEP為0.018 9,Rp為0.998 2。
表5 預(yù)處理組合方法48—71的模型評價指標(biāo)
對0.025 mm光程的原始柴油數(shù)據(jù)進(jìn)行PLS建模,得到Rp為0.972 6,RMSEP為0.074 2,然后對其進(jìn)行主成分馬氏距離法異常樣本剔除,共剔除兩個異常樣本,剔除后的模型評價指標(biāo)Rp為0.978 4,RMSEP為0.061 6,模型性能得到一定提升。利用實(shí)驗(yàn)得出的最優(yōu)的四種預(yù)處理組合方法即編號12、30、31、34對剔除后的柴油數(shù)據(jù)進(jìn)行處理,處理后其模型指標(biāo)Rp最高為0.997 4,RMSEP最低為0.020 7,相比原始數(shù)據(jù),其Rp提高了2.6%,RMSEP降低了72.1%??梢?實(shí)驗(yàn)所提出的數(shù)據(jù)處理及建模方法是可靠的、正確的,能夠?qū)Σ裼蛿?shù)據(jù)建立穩(wěn)定準(zhǔn)確的校正模型,實(shí)現(xiàn)柴油純度的檢測。
a.提出了一種考慮組合順序的預(yù)處理組合策略,構(gòu)建了柴油純度校正模型。
b.異常樣本的剔除是必要的,能夠有效提升模型的預(yù)測性能,其RMSEP下降了33.6%,Rp提高了6.1%。
c.建模前的預(yù)處理是必要的,預(yù)處理后的建模效果明顯優(yōu)于未經(jīng)預(yù)處理后的效果,大部分預(yù)處理及組合的RMSEP降到了0.040 0以下,Rp達(dá)到了0.990 0以上。預(yù)處理組合方法的順序不同,其建模效果也不同。
d.過多的預(yù)處理組合可能會扣除一定的有效信息,從而降低模型的預(yù)測效果。紅外光譜技術(shù)結(jié)合光譜預(yù)處理與偏最小二乘法可以實(shí)現(xiàn)對柴油純度的檢測。
e.本文所提出的柴油純度檢測方法與傳統(tǒng)的看柴油顏色、用手捻摸柴油等方法相比,客觀性強(qiáng),檢測精度高;而與餾程、實(shí)驗(yàn)室化驗(yàn)分析法等相比,快捷方便,可實(shí)現(xiàn)無損檢測。與文獻(xiàn)[6-7]中對HVO、乙醇含量所建模型相比,本文所建柴油純度模型預(yù)測精度高,RMSEP可達(dá)0.018 7,Rp可達(dá)0.997 8。