萬順寬, 呂 波, 張洪明*, 何 梁, 符 佳, 計(jì)華健, 王福地, 賓 斌, 李義超
1. 中國科學(xué)院合肥物質(zhì)科學(xué)研究院等離子體物理研究所, 安徽 合肥 230031 2. 中國科學(xué)技術(shù)大學(xué), 安徽 合肥 230026 3. 南華大學(xué)核科學(xué)與技術(shù)學(xué)院, 湖南 衡陽 421001
近紅外(near infrared, NIR)光譜分析技術(shù)[1-3]具有方便、 快速、 高效、 結(jié)果準(zhǔn)確, 不破壞樣品, 不消耗化學(xué)試劑和不污染環(huán)境等優(yōu)點(diǎn), 受到越來越多的關(guān)注。 便攜式NIR光譜儀無法配備溫控模塊, 環(huán)境溫度的差異會(huì)對樣品的吸收或反射光譜產(chǎn)生較大影響, 因此必須要建立包含環(huán)境溫度修正項(xiàng)的預(yù)測模型, 以降低環(huán)境溫度的差異造成檢測結(jié)果的誤差。 目前, 國內(nèi)外已經(jīng)開展了一些關(guān)于近紅外光譜的溫度修正研究。 孫彥華等利用自主研制的手持式近紅外光譜儀采集玉米樣品的近紅外光譜, 研究樣品溫度變化對模型預(yù)測結(jié)果的影響, 可以實(shí)現(xiàn)樣品的快速無損檢測[4]。 Thamasopinkul等基于近紅外光譜儀(Spectra-StarTM 2500, Unity Scientific, Milford, MA, USA) 利用標(biāo)準(zhǔn)正態(tài)變量變換的擬最小二乘回歸建立了三種恒溫(25, 35和45 ℃)校正模型, 并建立了具有溫度補(bǔ)償?shù)男UP湍M了蜂蜜的近紅外光譜受樣品溫度變化的影響[5]。
上述研究是針對不同種類的含水分樣品開展了溫度修正模型研究, 而特種柴油中的水含量可以忽略, 目前環(huán)境溫度差異對無水柴油的檢測結(jié)果的影響尚不明確, 阻礙了利用近紅外分析方法對特種柴油進(jìn)行現(xiàn)場快檢應(yīng)用的發(fā)展[6]。 柴油的凝點(diǎn)是柴油的重要指標(biāo)之一, 對貯存, 運(yùn)輸和使用都有重要影響。 柴油的凝點(diǎn)與其結(jié)構(gòu)組成有著密切關(guān)系, 鏈羥結(jié)構(gòu)對柴油的凝點(diǎn)貢獻(xiàn)起著決定性作用, 近紅外光譜在分析C—H結(jié)構(gòu)方面有著獨(dú)特的優(yōu)勢[7]。 因此基于便攜式近紅外光譜儀對無水的特種柴油開展溫度修正模型的研究, 通過引入溫度修正項(xiàng), 得到了修正后的預(yù)測模型, 結(jié)果表明該模型可以有效降低環(huán)境溫度對預(yù)測結(jié)果的影響。
首先在室溫T0=25 ℃條件下測量了特種柴油樣品的光譜, 并采用偏最小二乘(PLS)[8-10]建立了該柴油的凝點(diǎn)預(yù)測模型[11]
c=b0+b1A1+b2A2+…+bnAn
(1)
式(1)中,A1—An是樣品各個(gè)波長處的吸光度,b0—bn為不同波長處光強(qiáng)的權(quán)重系數(shù),c為樣品的理化指標(biāo), 在本研究中c為柴油樣品的凝點(diǎn)值。
在各環(huán)境溫度條件下(-10, 0, 10, 20, 30, 40和50 ℃)測量了樣品的吸收光譜, 再將這些溫度條件下的光譜數(shù)據(jù)帶入25 ℃條件下的預(yù)測模型, 以分析環(huán)境溫度(TE)差異對預(yù)測結(jié)果帶來的影響
Δc(TE)=c(TE-T0)-c0
(2)
其中,c(TE)為利用TE環(huán)境溫度下測量光譜數(shù)據(jù)得到凝點(diǎn)預(yù)測值,c0為采用國標(biāo)方法(GB/T510)得到的柴油凝點(diǎn)標(biāo)準(zhǔn)值。
利用偏最小二乘法將每個(gè)環(huán)境溫度下預(yù)測結(jié)果與標(biāo)準(zhǔn)值之間的差異對環(huán)境溫度TE進(jìn)行一次函數(shù)擬合, 得到
Δc=f1(TE-T0)
(3)
其中,f1為環(huán)境溫度TE變化對預(yù)測結(jié)果產(chǎn)生的修正項(xiàng)系數(shù), 以修正環(huán)境溫度差異帶來的測量誤差,T0為25 ℃。
最后得到了帶有溫度修正項(xiàng)的預(yù)測模型
cm=b0+b1A1+b2A2+…+bnAn+f1(TE-T0)
(4)
式(4)中,cm修正模型得到的柴油樣品凝點(diǎn)修正值。
采用遼寧方圓國家標(biāo)準(zhǔn)樣品油有限公司提供的特種無水柴油樣品, 樣品凝點(diǎn)值分別為-54.0, -48.0, -44.0, -36.0, -33.0, -28.0, -24.0, -16.0, -12.0, -8.0和-3.0 ℃共計(jì)50種柴油, 每個(gè)凝點(diǎn)值同時(shí)包括數(shù)個(gè)其他指標(biāo)不同的樣品。 所有樣品的凝點(diǎn)均采用國標(biāo)方法GB/T510進(jìn)行測定。
使用基于德州儀器(Texas Instruments Inc)DMD芯片的透射式近紅外光譜儀[12], 掃描模式可通過控制界面設(shè)置, 為列掃描模式, 波長數(shù)據(jù)點(diǎn)設(shè)置為228個(gè), 通過6次掃描取平均值。
實(shí)驗(yàn)步驟: (1) 將恒溫箱調(diào)整至25 ℃, 等待30 min后, 把按照1—50編號的比色皿(光程10 mm)依次放入光譜儀樣品池, 待溫度恒定后進(jìn)行空比色皿的參考光譜采集; 然后將柴油樣品按照1—50進(jìn)行標(biāo)號, 并依次裝入對應(yīng)編號的石英比色皿中, 將盛有柴油樣品的比色皿依次放入光譜儀樣品池, 在箱內(nèi)溫度恒定后依次進(jìn)行數(shù)據(jù)采集。 考慮此款光譜儀在900~950和1 650~1 700 nm波長范圍內(nèi)的測量誤差較大, 本實(shí)驗(yàn)僅采用950~1 650 nm波長范圍內(nèi)的光譜數(shù)據(jù)如圖1(a), 采集到的波長點(diǎn)數(shù)由原來的228減少到197。 (2) 將恒溫箱溫度分別設(shè)定為-10, 0, 10, 20, 30, 40和50 ℃, 然后依次重復(fù)上面的測量步驟, 即可得到不同溫度條件下柴油樣品的吸收光譜數(shù)據(jù)。
圖1 溫度環(huán)境為25 ℃條件下柴油樣品的(a)原始吸收光譜和(b)預(yù)處理后的吸收光譜數(shù)據(jù)
利用在25 ℃條件下測量的吸收光譜數(shù)據(jù)建立了柴油凝點(diǎn)的預(yù)測模型。 首先對原始數(shù)據(jù)進(jìn)行預(yù)處理[13], 預(yù)處理方法包含了歸一化, 標(biāo)準(zhǔn)正態(tài)化和差分二階求導(dǎo), 以降低噪聲對最終結(jié)果的干擾。 預(yù)處理后的光譜數(shù)據(jù)如圖1(b)所示, 由圖中可以看出柴油在950~1 650 nm波長范圍內(nèi)有兩組主要的吸收譜帶, 即1 100~1 260 nm范圍內(nèi)的二級倍頻吸收以及1 300~1 500 nm范圍內(nèi)的合頻吸收。 對各級倍頻或合頻, 主要有三種基團(tuán)的典型吸收, 即芳環(huán)中C—H、 甲基C—H、 和亞甲基C—H吸收。 因?yàn)榇瞬裼蜆悠窞闊o水柴油, 譜線中無水吸收峰。
根據(jù)馬氏距離法[14], 計(jì)算出50種樣本的馬氏距離, 剔除馬氏距離較大的點(diǎn), 為了避免對查找出的異常樣本產(chǎn)生誤判, 將實(shí)際并非異常那個(gè)點(diǎn)的樣本判定為異常點(diǎn), 需要對查找的樣本可以進(jìn)行二次檢驗(yàn), 最后剔除了異常點(diǎn)4個(gè), 將剩下46個(gè)樣品的光譜數(shù)據(jù)分成校正集和獨(dú)立驗(yàn)證集兩個(gè)數(shù)據(jù)集合, 校正集與獨(dú)立驗(yàn)證集分別包含37個(gè)和9個(gè)樣品的光譜數(shù)據(jù), 其中9個(gè)獨(dú)立驗(yàn)證集分別隨機(jī)選擇9個(gè)凝點(diǎn)不同的樣品數(shù)據(jù)。 利用偏最小二乘法基于校正集數(shù)據(jù)建立凝點(diǎn)值的預(yù)測模型, 并將獨(dú)立驗(yàn)證集數(shù)據(jù)代入模型, 以計(jì)算獨(dú)立驗(yàn)證集的殘差RMSEP, 可以計(jì)算出RMSEP隨模型維度的變化關(guān)系[15], 如圖2(a)所示, 在p=9條件下(p為PLS的主因子數(shù)), RMSEP取得最小值0.100 3。 因此, 在本模型中選擇維度p=9來建立預(yù)測模型。 模型預(yù)測值與凝點(diǎn)國標(biāo)測量值間的關(guān)系如圖2(b)所示。
圖2 (a)校正集殘差(RMSEC)和檢驗(yàn)集殘差(RMSEP)隨PLS維數(shù)的變化關(guān)系; (b)環(huán)境溫度為25 ℃條件下柴油樣品凝點(diǎn)值的預(yù)測曲線
依次將另外7個(gè)環(huán)境溫度條件下測量到的光譜數(shù)據(jù)在相同的馬氏距離異常點(diǎn)剔除法和預(yù)處理之后代入上述模型進(jìn)行凝點(diǎn)值預(yù)測。 圖3(a)給出了Δc隨環(huán)境溫度TE的變化關(guān)系。 可以發(fā)現(xiàn)預(yù)測偏差Δc隨TE的上升而有明顯的線性上升趨勢。 根據(jù)式(3), 利用最小二乘法對圖中數(shù)據(jù)進(jìn)行擬合, 可以得到凝點(diǎn)值誤測偏差Δc隨TE-T0的一次擬合系數(shù)f1=-0.019 8。 再根據(jù)式(4)即可得到基于溫度修正模型的預(yù)測值
cm=3.521 8+3.405 5A1-6.124 4A2+…-
12.787 1A197-0.019 8(TE-25)
(6)
其中TE為環(huán)境溫度;cm為修正模型得到的柴油樣品凝點(diǎn)修正值。
圖3(b)給出了基于溫度修正模型的凝點(diǎn)值預(yù)測偏差, 可以發(fā)現(xiàn)由環(huán)境溫度變化趨勢產(chǎn)生的整體上升趨勢得到消除, 顯著降低了環(huán)境溫度變化對預(yù)測結(jié)果產(chǎn)生的影響。
圖3 基于(a)無溫度修正模型和(b)溫度修正模型的凝點(diǎn)預(yù)測值偏差對比
根據(jù)前面溫度修正做馬氏距離法剔除異常點(diǎn)時(shí), 10 ℃下所用的46個(gè)樣本, 分別給出了環(huán)境溫度為10 ℃條件下溫度修正前后的凝點(diǎn)值預(yù)測模型的預(yù)測值與國標(biāo)法測量值之間的關(guān)系如圖4(a)和(b), 可以明顯觀測到溫度修正后的樣品凝點(diǎn)值更向國標(biāo)法所測量得凝點(diǎn)值收斂, 說明溫度修正后的凝點(diǎn)值更精確, 預(yù)測值偏差得到明顯改善。
圖4 基于(a)無溫度修正模型和(b)溫度修正模型對環(huán)境溫度為10 ℃條件下柴油凝點(diǎn)的預(yù)測值對比
為了證明溫度修正后的效果, 在所有樣品中隨機(jī)抽出一個(gè)樣本, 凝點(diǎn)為-54.0 ℃, 此樣品在不同溫度下的溫度修正前后的變化關(guān)系如圖5所示, 可以看出在經(jīng)過溫度修正后, 樣品的預(yù)測凝點(diǎn)值受溫度影響的效果明顯減少。 數(shù)據(jù)測量時(shí)已經(jīng)將空比色皿和光譜儀的溫飄作為參考光扣除了, 光譜儀的影響可以排除。 近紅外模型的好壞可以由兩個(gè)參數(shù)相關(guān)系數(shù)和殘差來證明, 檢驗(yàn)集的相關(guān)系數(shù)越大, 殘差越小, 模型越好。 表1給出了多個(gè)環(huán)境溫度條件下的預(yù)測集殘差RMSEP與相關(guān)系數(shù)r在密度修正前后的數(shù)值對比, 在經(jīng)過溫度修正后預(yù)測集相關(guān)系數(shù)相對增大, 預(yù)測集殘差相對減小, 由此證明溫度修正方法對溫度引起的預(yù)測偏差起到了消除作用。r數(shù)值相對偏小的原因可能是由于在實(shí)驗(yàn)時(shí)開關(guān)恒溫箱箱門更換樣品過程中箱內(nèi)溫度急劇變化導(dǎo)致比色皿表面起霧引入的一些誤差。 總體結(jié)果顯示出了此溫度修正方法對溫度引起的預(yù)測偏差的消除作用。
圖5 不同溫度下凝點(diǎn)值為-54.0 ℃的樣品在溫度修正前后的對比
利用基于DMD的便攜近紅外光譜儀采集了不同環(huán)境溫度條件下的柴油油品樣品在的近紅外波段的吸收光譜, 研究了樣品溫度變化對模型預(yù)測結(jié)果的影響。 通過分析發(fā)現(xiàn)樣品吸光度光譜與溫度之間存在線性關(guān)系, 在環(huán)境溫度高于建立模型的環(huán)境溫度時(shí), 模型的預(yù)測偏差高于實(shí)際值。 利用這一關(guān)系提出了溫度修正模型, 并通過試驗(yàn)結(jié)果證明該溫度修正方法可以對光譜進(jìn)行修正, 利用修正后的光譜代入已建立好的模型預(yù)測結(jié)果有了很大的改善。 最后使用10 ℃下46個(gè)樣本對溫度修正理論進(jìn)行了檢驗(yàn), 均方根誤差分別為~14.6和~8.8。 本研究顯示基于此溫度修正模型, 可以顯著降低建模過程的工作量, 在25 ℃條件下建立預(yù)測模型后將此溫度修正項(xiàng)帶入模型即可用于在其他環(huán)境溫度條件下進(jìn)行柴油凝點(diǎn)值預(yù)測, 而不需要在其他多個(gè)溫度條件下分別建立預(yù)測模型。 此方法顯著提高了建模效率和便攜式近紅外光譜快速檢測的溫度適應(yīng)性。