董曉煒,楊繼平,楊志猛,晏 剛,夏梓航
(重慶賽寶工業(yè)技術(shù)研究院有限公司,重慶 401332)
隨著油價(jià)不斷上漲,市場(chǎng)上油品摻假銷(xiāo)售的現(xiàn)象屢見(jiàn)不鮮。以汽油為例,一些不法分子通過(guò)非法手段以次充好,如將低標(biāo)號(hào)汽油和高標(biāo)號(hào)汽油混合作高標(biāo)號(hào)汽油銷(xiāo)售,甚至添加甲醇等含氧化合物等。這些摻假行為不僅有損消費(fèi)者權(quán)益,更會(huì)對(duì)社會(huì)安全造成不利影響,因此加強(qiáng)對(duì)市售油品質(zhì)量的檢測(cè)監(jiān)督非常重要。
油品質(zhì)量檢測(cè)的方法有很多種,如測(cè)定油品的密度、超聲波傳導(dǎo)速率、電導(dǎo)率、元素組成、光譜等[1]。相比于傳統(tǒng)的油品鑒別方法,采用拉曼光譜技術(shù)可快速獲取油品的物質(zhì)組成信息,而且其具有非接觸、快速、穩(wěn)定等優(yōu)勢(shì),尤其適合用于定性分析[2-3]。石油產(chǎn)品中烯烴、芳香烴類(lèi)等化合物有明顯的拉曼光譜特征峰,因而拉曼光譜分析技術(shù)在石油產(chǎn)品分析領(lǐng)域不斷突破[4]。隨著小型化、高分辨率、抗干擾的便攜式拉曼光譜儀的發(fā)展,拉曼光譜在油品在線(xiàn)檢測(cè)領(lǐng)域的應(yīng)用前景良好。
拉曼光譜與相關(guān)化學(xué)計(jì)量方法相結(jié)合,在石油產(chǎn)品種類(lèi)鑒別、油品分析、質(zhì)量檢測(cè)等領(lǐng)域的應(yīng)用研究不斷增多[5]。例如:婁婷婷等[6]用632.8 nm波長(zhǎng)拉曼光譜儀成功對(duì)包括燃料油和潤(rùn)滑劑在內(nèi)的共6種石油產(chǎn)品進(jìn)行了分類(lèi)鑒別;包麗麗等[7]利用其自主研發(fā)的785 nm波長(zhǎng)便攜式拉曼光譜儀,對(duì)比了汽油、噴氣燃料、柴油、石腦油等油品的拉曼光譜特征峰位移和強(qiáng)度,實(shí)現(xiàn)對(duì)不同種類(lèi)油品的鑒別;李晟等[8]采用主成分分析法(PCA)對(duì)不同牌號(hào)汽油的拉曼光譜進(jìn)行分析,實(shí)現(xiàn)了對(duì)不同牌號(hào)汽油的快速鑒別。此外,喻星辰等[9]提出一種以石墨化炭黑吸附、過(guò)濾的方法,成功抑制了石油產(chǎn)品拉曼光譜定性分析中的熒光干擾影響。
在上述基于拉曼光譜的油品鑒別研究中,通常采用PCA或偏最小二乘法(PLS)將油品組分簡(jiǎn)化為互不相關(guān)的幾個(gè)主成分,拉曼光譜上得到的主成分往往是油品組分原始光譜的線(xiàn)性重組。然而,主成分載荷矩陣元素通常非零,很難對(duì)每個(gè)主成分分量做出合理解釋[10]。此外,其分類(lèi)模型采用線(xiàn)性判別法(LDA)或采用構(gòu)造類(lèi)間距閾值方法構(gòu)建,未考慮光譜中的非線(xiàn)性影響因素[11],模型泛化能力不足?;诖?,本研究利用785 nm便攜式光譜儀探索一種針對(duì)輕質(zhì)燃油種類(lèi)的快速鑒別方法:首先對(duì)原始拉曼光譜數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)而結(jié)合稀疏主成分分析法(SPCA)對(duì)數(shù)據(jù)進(jìn)行降維處理[12],然后運(yùn)用支持向量機(jī)(SVM)建立基于SPCA的非線(xiàn)性關(guān)系分類(lèi)模型,實(shí)現(xiàn)油品快速鑒別,期望為成品油管道混油界面判斷、油品摻假鑒別提供檢測(cè)方法和理論依據(jù)。
石油醚、乙醇(體積分?jǐn)?shù)75%),購(gòu)自上海華天生物科技有限公司。
試驗(yàn)輕質(zhì)燃料油樣本為取自重慶、山東、遼寧等不同產(chǎn)地0號(hào)車(chē)用柴油、3號(hào)噴氣燃料、92號(hào)汽油、95號(hào)汽油、98號(hào)汽油5種樣品各100個(gè),共計(jì)500個(gè)。其中,將每種油品隨機(jī)抽取80個(gè)樣本,共400個(gè)樣本組成訓(xùn)練集,每種油品其余20個(gè)樣本,組成共100個(gè)樣本測(cè)試集。
以不同產(chǎn)地95號(hào)汽油和92號(hào)汽油樣本配制得到5種不同摻混比例的混合汽油樣品A,B,C,D,E樣本各50個(gè)。其中,混合汽油樣品A,B,C,D,E中95號(hào)汽油的體積分?jǐn)?shù)分別為97.5%,95%,90%,85%,70%。
使用北京華泰諾安有限公司生產(chǎn)的CRM100PS-1型便攜式激光光譜儀對(duì)上述試驗(yàn)輕質(zhì)燃料油樣本進(jìn)行光譜采集。試驗(yàn)條件:激光器波長(zhǎng)為785 nm,光譜范圍為350~3 000 cm-1,激光器功率為200 mW,積分時(shí)間為2 s,累加次數(shù)為2次,取兩次測(cè)量平均值作為最終拉曼光譜。
受激光器功率微弱變化等干擾因素影響,光譜采集過(guò)程中會(huì)產(chǎn)生噪聲;同時(shí),輕質(zhì)燃油自身會(huì)受到熒光干擾,致使出現(xiàn)基線(xiàn)漂移、抬高的現(xiàn)象。研究表明,采用較長(zhǎng)波長(zhǎng)(如785 nm、1 064 nm)激光光源可以在一定程度上消除熒光對(duì)燃油拉曼光譜的干擾,但仍需要進(jìn)行熒光背景校正[9]。
因此,在進(jìn)行分析前,需對(duì)原始拉曼光譜數(shù)據(jù)進(jìn)行預(yù)處理:首先,采用歸一化算子,消除數(shù)據(jù)量綱的影響,增強(qiáng)特征峰之間的可比性;然后,采用平滑卷積(SG)算子[13]對(duì)光譜進(jìn)行平滑處理;最后,采用自適應(yīng)迭代懲罰最小二乘(airPLS)算子[14],基于誤差的迭代加權(quán)策略,逐步消除擬合基線(xiàn)和原始信號(hào)之間的差異,實(shí)現(xiàn)對(duì)拉曼光譜基線(xiàn)的校正。
輕質(zhì)燃油的拉曼光譜范圍較廣、波數(shù)較多,通常采用降維的方法去除光譜中的冗余信息。目前,廣泛使用的降維方法有PCA,其核心思想是通過(guò)將多個(gè)成分變量降維成少數(shù)相互獨(dú)立的主成分;但其主成分仍是所有原始光譜的線(xiàn)性組合,實(shí)際意義模糊,難以對(duì)光譜特征峰進(jìn)行合理解釋[10]。Zou等[14]在PCA的基礎(chǔ)上對(duì)載荷矩陣進(jìn)行稀疏化,提出了一種稀疏主成分分析法(SPCA),其主要思想是將載荷矩陣看作主成分對(duì)原始成分變量的回歸系數(shù)矩陣,進(jìn)而將PCA分析轉(zhuǎn)換為優(yōu)化回歸系數(shù)求解問(wèn)題,如式(1)所示。其中:第一項(xiàng)為誤差平方項(xiàng);第二項(xiàng)為嶺懲罰項(xiàng);第三項(xiàng)為關(guān)于回歸系數(shù)的L1范數(shù)懲罰項(xiàng)。
(1)
且滿(mǎn)足ATA=Ik×k
式中:Xn×p為樣本矩陣,其中n為樣本數(shù)量,p為成分變量維度;Ap×k=[α1…αk],Bp×k=[β1…βk]分別為對(duì)樣本矩陣降維、稀疏化后的兩個(gè)矩陣,1 若同時(shí)優(yōu)化Ap×k和Bp×k兩個(gè)變量會(huì)導(dǎo)致目標(biāo)函數(shù)不收斂,因而首先由PCA得到矩陣Ap×k的k個(gè)成分載荷初值,在固定Ap×k的基礎(chǔ)上求解Bp×k,將式(1)轉(zhuǎn)換為求解k個(gè)獨(dú)立的彈性網(wǎng)問(wèn)題,如式(2)所示。 (2) 然后,將求得的Bp×k=[β1…βk]作為定值,即可將式(1)簡(jiǎn)化為式(3);根據(jù)普式矩陣旋轉(zhuǎn)定理[14]將式(3)對(duì)Ap×k的求解問(wèn)題轉(zhuǎn)換為對(duì)矩陣XTXB進(jìn)行奇異值分解(SVD)問(wèn)題,如式(4)所示;進(jìn)而,用由式(4)得到列正交矩陣U、奇異值矩陣D、行正交矩陣VT迭代更新Ap×k=UVT;之后,交替求解Ap×k和Bp×k,直至滿(mǎn)足終止條件。 (3) XTAB=UDVT (4) 評(píng)價(jià)成分變量降維效果的指標(biāo)有稀疏度、可解釋性方差比、輪廓系數(shù)[15]、方差比準(zhǔn)則[16]等。其中:稀疏度是指稀疏載荷矩陣中元素為零的個(gè)數(shù)(當(dāng)元素絕對(duì)值小于0.01時(shí),即看作為0);可解釋性方差比是指每個(gè)主成分的可解釋方差貢獻(xiàn)率;輪廓系數(shù)和方差比準(zhǔn)則均為基于原始數(shù)據(jù)和聚類(lèi)結(jié)果評(píng)估聚類(lèi)模型優(yōu)劣性的方法。輪廓系數(shù)和方差比準(zhǔn)則的計(jì)算值越大,表明聚類(lèi)結(jié)果越好[17]。 SVM作為一種小樣本的機(jī)器學(xué)習(xí)方法,在光譜吸收峰混疊識(shí)別、光譜多組分分析等領(lǐng)域取得了較好的效果[18]。其模型參數(shù)主要有核函數(shù)為RBF、懲罰因子(c)和不敏感系數(shù)(g),其中c和g的取值范圍均為0.25~64。構(gòu)建的SVM模型需通過(guò)網(wǎng)格搜索算法5折交叉驗(yàn)證確定,即將訓(xùn)練集樣本隨機(jī)分為5組,其中1組用于模型預(yù)測(cè),也稱(chēng)交叉驗(yàn)證集,其他4組用于模型訓(xùn)練。SVM分類(lèi)模型的性能主要通過(guò)對(duì)其查準(zhǔn)率(precision)、查全率(recall)和F1度量3項(xiàng)指標(biāo)來(lái)評(píng)價(jià),其越接近于1,表明分類(lèi)模型性能越好。此外,為了進(jìn)一步考察模型的泛化能力,對(duì)測(cè)試集的5種輕質(zhì)燃油共100個(gè)樣本進(jìn)行預(yù)測(cè),并且與傳統(tǒng)PLS-DA光譜分類(lèi)模型進(jìn)行對(duì)比。 圖1為5種輕質(zhì)燃油的典型拉曼光譜,其中圖1(a)是預(yù)處理前5種輕質(zhì)燃油的拉曼光譜,圖1(b)為經(jīng)過(guò)預(yù)處理后5種輕質(zhì)燃油的拉曼光譜。由圖1可以看出,經(jīng)過(guò)預(yù)處理操作,可以去除原始光譜的熒光背景和背景噪聲,拉低基線(xiàn),使光譜輪廓平滑,特征峰更明顯,顯著改善拉曼光譜的表征效果。 圖1 5種輕質(zhì)燃油的典型拉曼光譜 —0號(hào)車(chē)用柴油; —3號(hào)噴氣燃料; —92號(hào)汽油; —95號(hào)汽油; —98號(hào)汽油1~12—拉曼位移特征峰 由圖1(b)預(yù)處理后5種輕質(zhì)燃料的拉曼光譜,分析輕質(zhì)燃料拉曼光譜的典型特征峰,結(jié)果如表1所示。結(jié)合表1和圖1可知,3種汽油中較強(qiáng)的特征峰分別是在拉曼位移為525 cm-1附近的CH2CH3等基團(tuán)振動(dòng)(特征峰1)、拉曼位移737 cm-1附近的季碳基團(tuán)對(duì)稱(chēng)伸縮振動(dòng)(特征峰2)、拉曼位移769 cm-1處C—C—C 對(duì)稱(chēng)伸縮振動(dòng)(特征峰7)以及拉曼位移1 003 cm-1處單環(huán)芳烴的強(qiáng)呼吸振動(dòng)(特征峰5)。這4處特征峰是汽油區(qū)別于柴油、噴氣燃料的主要特征峰。 表1 輕質(zhì)燃油產(chǎn)品拉曼光譜與振動(dòng)模式的對(duì)應(yīng)表[19-22] 由圖1(b)可知:汽油與柴油、噴氣燃料之間的特征峰區(qū)別較為明顯,汽油中含有較多直鏈飽和烴和少量不飽和烴,且飽和烴的拉曼特征峰清晰尖銳,受熒光干擾的影響較?。坏煌铺?hào)汽油間的特征峰差異較弱,主要體現(xiàn)在直鏈飽和烴含量的不同,對(duì)應(yīng)在拉曼位移737,769,1 003 cm-1附近的特征峰強(qiáng)度上存在微弱差異。 噴氣燃料與柴油的拉曼光譜具有相似的特征峰,二者在拉曼位移1 306 cm-1和1 451 cm-1處均有兩個(gè)較強(qiáng)的特征峰(特征峰8和10);噴氣燃料中不飽和烴含量較高,在拉曼位移1 400~1 500 cm-1區(qū)域的拉曼散射強(qiáng)度較高,而柴油中含有大量的芳烴及其衍生物,在拉曼位移1 500~2 735 cm-1區(qū)域拉曼散射強(qiáng)度略高于噴氣燃料。 從上述分析不難看出,不同輕質(zhì)燃料油中某些特定成分化學(xué)特性不同,組分含量存在差異,使其在對(duì)應(yīng)的拉曼光譜特征峰強(qiáng)度上存在微弱差異,因而可以考慮通過(guò)化學(xué)計(jì)量學(xué)建模的方法進(jìn)行特征提取,并結(jié)合機(jī)器學(xué)習(xí)算法進(jìn)行物質(zhì)鑒別。 將預(yù)處理之后的拉曼光譜,分別采用PCA和SPCA方法將特征成分變量維度降至6維,圖2為可解釋方差比最高的前3個(gè)主成分的得分圖。如圖2(a)所示,采用PCA降維方法大致能區(qū)分5種輕質(zhì)燃油,但同類(lèi)樣本的分布較離散,并且0號(hào)車(chē)用柴油和3號(hào)噴氣燃料在主成分空間中有個(gè)別交錯(cuò)現(xiàn)象;而由圖2(b)可知,SPCA降維方法的分類(lèi)效果更優(yōu),同類(lèi)別樣本內(nèi)部數(shù)據(jù)點(diǎn)分布緊湊,不同類(lèi)別樣本簇獲得明顯區(qū)分。 圖2 特征成分變量分別采用PCA和SPCA降維的效果●—0號(hào)車(chē)用柴油; ■—3號(hào)噴氣燃料; ▲—92號(hào)汽油; 號(hào)汽油; ◆—98號(hào)汽油 分別計(jì)算PCA和SPCA方法對(duì)拉曼光譜特征降維效果的量化指標(biāo),結(jié)果如表2所示。由表2可以看出,與采用PCA方法的效果相比,采用SPCA方法對(duì)特征變量降維,在獲得變量載荷矩陣高稀疏度的情況下,雖然可解釋性方差比略低,而在輪廓系數(shù)和方差比準(zhǔn)則兩項(xiàng)指標(biāo)上表現(xiàn)更優(yōu)。 表2 采用PCA和SPCA方法降維效果的量化指標(biāo)比較 圖3為分別采用PCA和SPCA方法對(duì)拉曼光譜特征變量降維后得到的前2個(gè)主成分的載荷因子(PC1、PC2)在各拉曼位移處的分布情況。載荷因子絕對(duì)值越大,則對(duì)主成分的貢獻(xiàn)越大。由圖3可以看出:采用PCA法得到的主成分由全光譜信息組合而成,主要特征峰因受背景噪聲的影響而對(duì)主成分的貢獻(xiàn)不高;而采用SPCA的大部分載荷因子絕對(duì)值為零,主成分可表示成少數(shù)特征峰的線(xiàn)性組合,其中載荷因子絕對(duì)值較大的特征峰的拉曼位移在517,735,769,1 003,1 306,1 447 cm-1處和2 855~2 940 cm-1區(qū)域等,基本與表1中的特征峰吻合,充分體現(xiàn)了稀疏主成分對(duì)光譜特征峰的解釋性,并且為后續(xù)建模分析提供基礎(chǔ)。 圖3 采用PCA和SPCA方法降維得到的前2個(gè)主成分的載荷因子分布 在拉曼光譜數(shù)據(jù)預(yù)處理的基礎(chǔ)上,分別采用PLS-DA,PCA-SVM,SPCA-SVM方法構(gòu)建輕質(zhì)燃料分類(lèi)模型;同時(shí),為了探究對(duì)光譜特征成分變量降維影響模型分類(lèi)的效果,對(duì)原始光譜數(shù)據(jù)也分別采用SVM、PCA-SVM方法建立輕質(zhì)燃料分類(lèi)模型。不同分類(lèi)模型的預(yù)測(cè)結(jié)果如表3所示。 表3 不同分類(lèi)模型對(duì)訓(xùn)練集樣本的預(yù)測(cè)結(jié)果 通過(guò)分析表3中的模型評(píng)價(jià)指標(biāo)可知:針對(duì)原始光譜的兩種分類(lèi)模型,在PCA降維的基礎(chǔ)上,通過(guò)SVM法構(gòu)建分類(lèi)模型的分類(lèi)指標(biāo)比變量降維前有明顯提升,模型預(yù)測(cè)準(zhǔn)確率達(dá)到為96.75%,同時(shí)分類(lèi)模型的精確率、召回率和F1度量的輸出值分別為0.974 9,0.984 5,0.987 4;降維后,光譜特征成分變量維度從1 160降為6,顯著降低了運(yùn)算復(fù)雜度,大幅縮短了分類(lèi)模型的訓(xùn)練和預(yù)測(cè)時(shí)間;基于預(yù)處理拉曼光譜所建3種分類(lèi)模型的預(yù)測(cè)結(jié)果均優(yōu)于原始光譜的分類(lèi)模型,其中PCA-SVM和SPCA-SVM方法構(gòu)建模型的準(zhǔn)確率均達(dá)到100%。 為了進(jìn)一步驗(yàn)證模型的泛化能力,避免分類(lèi)模型過(guò)擬合,將5種輕質(zhì)燃料測(cè)試集樣本(每種燃料20個(gè)樣本)按照0號(hào)車(chē)用柴油、3號(hào)噴氣燃料、92號(hào)汽油、95號(hào)汽油、98號(hào)汽油的順序依次編號(hào)為1~100,進(jìn)而基于其原始拉曼光譜和預(yù)處理拉曼光譜,采用不同分類(lèi)模型進(jìn)行分類(lèi)預(yù)測(cè),結(jié)果如圖4所示。 由圖4可以看出:對(duì)比不同分類(lèi)模型對(duì)測(cè)試集樣本的預(yù)測(cè)結(jié)果,采用SPCA-SVM方法基于預(yù)處理后拉曼光譜所建分類(lèi)模型的分類(lèi)效果最好,僅有1個(gè)3號(hào)噴氣燃料樣本被錯(cuò)歸類(lèi)為0號(hào)車(chē)用柴油,3個(gè)95號(hào)車(chē)用汽油樣本被錯(cuò)歸類(lèi)為92號(hào)車(chē)用汽油;而采用PLS-DA、PCA-SVM方法基于預(yù)處理后拉曼光譜所建分類(lèi)模型在鑒別0號(hào)車(chē)用柴油和3號(hào)噴氣燃料時(shí)效果不理想,多個(gè)樣本被錯(cuò)誤歸類(lèi);采用PCA-SVM方法基于原始拉曼光譜所建分類(lèi)模型對(duì)0號(hào)車(chē)用柴油、95號(hào)車(chē)用汽油分類(lèi)效果較差。 圖4 不同分類(lèi)模型對(duì)測(cè)試集樣本的分類(lèi)結(jié)果●—0號(hào)車(chē)用柴油; ■—3號(hào)噴氣燃料; ▲—92號(hào)汽油; 號(hào)汽油; ◆—98號(hào)汽油 5種分類(lèi)模型對(duì)測(cè)試集樣本的分類(lèi)性能指標(biāo)如表4所示。由表4可知,相較于其他建模方法,基于預(yù)處理后拉曼光譜用SPCA-SVM法所建分類(lèi)模型的分類(lèi)準(zhǔn)確率最高,為96%。這說(shuō)明基于預(yù)處理后拉曼光譜用SPCA-SVM法所建分類(lèi)模型訓(xùn)練和驗(yàn)證效果均最好,可以用于輕質(zhì)燃料油類(lèi)別的快速、準(zhǔn)確鑒定。 表4 采用不同建模方法時(shí)測(cè)試集預(yù)測(cè)結(jié)果比較 在實(shí)際應(yīng)用中,需要對(duì)摻混油品的類(lèi)型進(jìn)行鑒別,如鑒別成品油輸運(yùn)過(guò)程混油界面的摻混油品和純牌號(hào)油品等。為考察所建模型對(duì)摻混油品分類(lèi)鑒別的效果,將純牌號(hào)95號(hào)汽油樣本、95號(hào)汽油和92號(hào)汽油按不同配比調(diào)合的5種混合汽油樣本各取50個(gè),并且隨機(jī)將每種樣本的70%劃分為訓(xùn)練集(每種各35個(gè)樣本)和30%劃分為測(cè)試集(每種各15個(gè)樣本)。 不同混合汽油樣品的預(yù)處理后拉曼光譜及其局部特征光譜如圖5所示。由于95號(hào)汽油與92號(hào)汽油最明顯的區(qū)別是直鏈飽和烷烴含量不同[圖1(b)],因此在混合汽油樣品中95號(hào)汽油占比越高,直鏈飽和烷烴含量就越高,對(duì)應(yīng)拉曼光譜的特征峰強(qiáng)度也就越大。如圖5(b)所示:混合汽油A的拉曼光譜中異構(gòu)烷烴(拉曼位移737 cm-1)和單苯基烷烴(拉曼位移1 003 cm-1)的特征峰強(qiáng)度最高;當(dāng)混合汽油中95號(hào)汽油的占比降低,上述兩處特征峰強(qiáng)度也隨之減弱。 圖5 不同混合汽油樣品的預(yù)處理后拉曼光譜 —混合汽油A; —混合汽油B; —混合汽油C; —混合汽油D; —混合汽油E 基于預(yù)處理后的拉曼光譜,為區(qū)分純牌號(hào)95號(hào)汽油與某種混合汽油,采用SPCA-SVM方法建立了95號(hào)汽油分別對(duì)應(yīng)混合汽油A,B,C,D,E的5種二分分類(lèi)模型,其分類(lèi)結(jié)果如表5所示。從表5可以看出:當(dāng)混合汽油中92號(hào)汽油體積分?jǐn)?shù)為2.5%和5%時(shí),模型分類(lèi)的準(zhǔn)確率均不理想,主要原因在于摻混92號(hào)汽油含量較低時(shí),混合汽油組成改變引起拉曼光譜特征峰的變化很弱,而拉曼光譜自身的穩(wěn)定性誤差為±2.5%,因而模型難以建立光譜特征峰與組分變化的準(zhǔn)確關(guān)聯(lián);隨著混合汽油中摻混92號(hào)汽油含量升高,其拉曼光譜特征峰的強(qiáng)度變化增大,差異性愈加明顯;當(dāng)92號(hào)汽油體積分?jǐn)?shù)達(dá)15%后,所建分類(lèi)模型對(duì)測(cè)試集樣本的錯(cuò)判數(shù)僅為2,可以較準(zhǔn)確地識(shí)別出混合汽油類(lèi)型。因此,混合汽油中92號(hào)汽油體積分?jǐn)?shù)為15%可視為該分類(lèi)模型的識(shí)別下限。 表5 采用SPCA-SVM法所建分類(lèi)模型鑒別5種混合汽油樣本的結(jié)果 利用拉曼光譜分析技術(shù)來(lái)自對(duì)不同產(chǎn)地的0號(hào)車(chē)用柴油、3號(hào)噴氣燃料、92號(hào)汽油、95號(hào)汽油、98號(hào)汽油共5種輕質(zhì)燃料油進(jìn)行了定性分析,進(jìn)而基于原始拉曼光譜采用SVM、PCA-SVM方法和基于預(yù)處理后拉曼光譜采用PLS-DA,PCA-SVM,SPCA-SVM方法分別構(gòu)建了一種輕質(zhì)燃油分類(lèi)模型。經(jīng)過(guò)對(duì)上述5種燃料油樣本的訓(xùn)練分類(lèi)和測(cè)試驗(yàn)證,結(jié)果表明基于預(yù)處理后拉曼光譜以SPCA-SVM方法構(gòu)建的分類(lèi)模型的分類(lèi)預(yù)測(cè)效果最好、準(zhǔn)確率最高,其訓(xùn)練集樣本分類(lèi)準(zhǔn)確率為100%,測(cè)試集樣本分類(lèi)準(zhǔn)確率為96%,說(shuō)明該分類(lèi)模型可以用于輕質(zhì)燃料油類(lèi)別的快速、準(zhǔn)確鑒定。 此外,對(duì)拉曼光譜預(yù)處理過(guò)程發(fā)現(xiàn),經(jīng)過(guò)預(yù)處理操作,可以去除原始拉曼光譜的熒光背景和噪聲,使光譜特征峰更明顯,顯著改善拉曼光譜的表征效果。對(duì)拉曼光譜特征成分變量降維結(jié)果表明,與采用PCA方法的效果相比,采用SPCA降維方法的分類(lèi)效果更優(yōu),同類(lèi)別樣本內(nèi)部數(shù)據(jù)點(diǎn)分布緊湊,不同類(lèi)別樣本簇獲得明顯區(qū)分;在獲得變量載荷矩陣高稀疏度的情況下,SPCA降維方法在輪廓系數(shù)和方差比準(zhǔn)則方面表現(xiàn)更優(yōu)。 基于拉曼光譜的分類(lèi)模型鑒定方法預(yù)處理過(guò)程簡(jiǎn)單、光譜可解釋性強(qiáng)、鑒別準(zhǔn)確率高,適用于石油產(chǎn)品鑒別、油品摻假鑒定、輸油管線(xiàn)油品質(zhì)量監(jiān)控等領(lǐng)域。1.5 SVM分類(lèi)模型及性能評(píng)價(jià)
2 結(jié)果與討論
2.1 拉曼光譜及其預(yù)處理
2.2 特征成分變量降維
2.3 模型構(gòu)建與訓(xùn)練
2.4 分類(lèi)模型驗(yàn)證
2.5 摻混油品的識(shí)別
3 結(jié) 論