許嘉東 唐 杰 朱 玲 朱立軍 譚廣璐 彭 忠 胡興鋒
(重慶中煙工業(yè)有限責(zé)任公司 技術(shù)中心,重慶 400060)
煙用爆珠是一種脆性膠囊,里面包裹了由多種香精香料和適量溶劑調(diào)和制成的特色香味液體[1],埋于成品卷煙濾棒絲束內(nèi),是用于卷煙香氣補(bǔ)償?shù)募夹g(shù)手段之一。香精香料化學(xué)成分中無論是小分子易揮發(fā)的酯、醛、酮、不飽和醇、不飽和烴類,還是芳香族化合物以及生物大分子化合物,在紫外可見光譜區(qū)絕大部分都有吸收[2,3]。樣品化學(xué)成分和/或濃度發(fā)生改變,其在不同波長(zhǎng)處的吸光度值將發(fā)生變化,光譜圖隨之改變。紫外可見光譜技術(shù)具有靈敏度高、儀器價(jià)格低、操作簡(jiǎn)單及分析快捷等優(yōu)點(diǎn),方法便于普及與應(yīng)用[4]。因此可選用紫外可見光譜技術(shù)檢測(cè)煙用爆珠內(nèi)液。
在應(yīng)用紫外光譜技術(shù)檢測(cè)復(fù)雜體系時(shí),其核心是光譜數(shù)據(jù)的預(yù)處理和模型的建立。光譜數(shù)據(jù)的預(yù)處理方法主要有平滑、導(dǎo)數(shù)、歸一化、多元散射校正(MSC)及標(biāo)準(zhǔn)正態(tài)變量變換(SNV)等[5,6]。偏最小二乘判別分析(PLS-DA)方法是基于PLS回歸的一種判別分析方法,PLS算法與主成分分析(PCA)算法基本思想相近,但PLS算法將光譜分解和回歸同時(shí)進(jìn)行,將濃度矩陣的信息引入到光譜矩陣的分解過程中,從而可以最大程度地利用光譜數(shù)據(jù)與主成分濃度之間的線性關(guān)系[7],因此具有高效的鑒別能力。目前對(duì)煙用爆珠的研究主要集中在不同類型爆珠的研發(fā)[8]、爆珠外觀質(zhì)量檢測(cè)[9]、爆珠對(duì)卷煙有害成分及特性的影響[8,10]、爆珠安全性[11]及其內(nèi)液化學(xué)成分的檢測(cè)[12]等,尚未見到煙用爆珠判別分析的研究,而煙用爆珠的錯(cuò)、混和穩(wěn)定性改變將極大的影響爆珠卷煙制品的質(zhì)量。因此,本實(shí)驗(yàn)以3種不同牌號(hào)的煙用爆珠樣品紫外可見光譜為基礎(chǔ),采用PLS-DA算法建立煙用爆珠判別模型,旨在為煙用爆珠判別分析提供快速簡(jiǎn)便的參考方法。
煙用爆珠樣品由重慶中煙工業(yè)有限責(zé)任公司技術(shù)研發(fā)中心提供。
無水乙醇(分析純,≥99.7,上海國(guó)藥集團(tuán))。
Cary60光纖紫外光譜儀(馬來西亞安捷倫公司);XSE204電子天平(感量:0.1 mg,瑞士Mettler Toledo公司)。
1.2.1煙用爆珠樣品的準(zhǔn)備
A、B、C3種牌號(hào)煙用爆珠樣品,每月抽樣,連續(xù)抽樣12個(gè)月,每批次每個(gè)牌號(hào)隨機(jī)抽取不少于60顆。采用電子天平稱量,精確到0.001 g,篩選質(zhì)量和粒徑偏差均不大于±5%的煙用爆珠作為測(cè)試樣品。
1.2.2樣品溶液的制備
在10 mL 試管中加入2~3 mL無水乙醇,取煙用爆珠1~3粒加入到試管中(由于不同牌號(hào)煙用爆珠樣品內(nèi)液的濃度差異較大,因此需根據(jù)不同煙用爆珠樣品內(nèi)液的濃度調(diào)整煙用爆珠和無水乙醇的料液比,使得樣品在250~330 nm范圍內(nèi)的最高峰吸收值在0.2~1.0范圍內(nèi))。壓破煙用爆珠,使得爆珠內(nèi)液釋放,充分搖勻,靜置,待測(cè)。
1.2.3紫外光譜測(cè)定
設(shè)定光纖紫外光譜儀測(cè)定波長(zhǎng)范圍為190~350 nm,吸光度記錄范圍為-0.1~3.5,波長(zhǎng)間隔0.5 nm,光程為10 mm,測(cè)定時(shí)將光纖探頭完全浸沒在溶液中,無水乙醇作為參比液調(diào)零,以連續(xù)波長(zhǎng)掃描3次的光譜數(shù)據(jù)平均值作為樣品最終紫外光譜數(shù)據(jù)。
PLS-DA算法將光譜數(shù)據(jù)與分類變量進(jìn)行線性回歸,其基本判別過程如下:首先建立校正集樣本的分類變量,將分類變量與光譜數(shù)據(jù)進(jìn)行PLS分析,建立分類變量與光譜數(shù)據(jù)的PLS回歸模型,并計(jì)算預(yù)測(cè)集的分類變量的值(y)。具體的判別規(guī)則是[13]:①當(dāng)y>0.5,且偏差<0.5,判定樣本屬于該類;②當(dāng)y<0.5,且偏差<0.5,判定樣本不屬于該類;③當(dāng)y的偏差≥0.5,判別不穩(wěn)定。
根據(jù)正常樣本的y值作質(zhì)量控制(QC)圖,中心線為樣本統(tǒng)計(jì)的平均值,控制上限(UCL)為平均值加3倍的標(biāo)準(zhǔn)偏差,控制下限(LCL)為平均值減3倍的標(biāo)準(zhǔn)偏差,對(duì)于未知樣本一致性判別規(guī)則是:①當(dāng)LCL≤y≤UCL,判定樣本一致性較好;②當(dāng)y>UCL或y 采用Orange軟件(3.16.0 版)和R軟件(3.5.1版)進(jìn)行數(shù)據(jù)處理與統(tǒng)計(jì)分析。 2.1.1變量分類賦值及校正集、檢驗(yàn)集樣本的選取 PLS-DA模型是基于PLS方法建立的樣本分類變量與樣品紫外可見光譜的回歸模型,根據(jù)煙用爆珠樣本不同的牌號(hào)進(jìn)行分類變量和賦值。以A牌號(hào)煙用爆珠PLS模型為例,對(duì)于選定的爆珠樣本,隨機(jī)選取100個(gè)樣品,設(shè)定Y值為1,再從B和C牌號(hào)煙用爆珠樣本中各隨機(jī)選取105個(gè)樣品,設(shè)置y值為0,將上述選取的樣品作為校正集樣本。A、B、C牌號(hào)煙用爆珠各自剩下的20個(gè)樣品作為驗(yàn)證集。 表1 煙用爆珠樣本分類變量 2.1.2特征波長(zhǎng)區(qū)間的選擇 不同煙用爆珠內(nèi)液的紫外可見光譜峰型和吸收強(qiáng)度存在差異,如圖1所示。為避免波段過寬造成光譜矩陣含有大量冗余信息和噪音干擾,導(dǎo)致后續(xù)分析的效率和準(zhǔn)確度降低,本研究首先對(duì)紫外光譜波段進(jìn)行了優(yōu)化提取。煙用爆珠內(nèi)液在190~230nm區(qū)域存在較強(qiáng)的末端吸收,噪音較大,不適合模型的建立,而在波長(zhǎng)大于330nm區(qū)域吸光度小,曲線相對(duì)平滑,可利用信息少[6],光譜信息最為豐富的區(qū)域在230~330nm范圍內(nèi),因此選擇波段230~330nm作為優(yōu)選譜區(qū)。 圖1 不同牌號(hào)煙用爆珠樣品紫外可見光譜圖 2.1.3紫外可見光譜數(shù)據(jù)預(yù)處理方法的比較 紫外光譜數(shù)據(jù)通過預(yù)處理可以減少噪音和干擾,提高信噪比,提取出更多的有效光譜信息,從而增強(qiáng)光譜的穩(wěn)定性和分辨率[14]。本實(shí)驗(yàn)對(duì)比了紫外光譜原始數(shù)據(jù)、平滑、平滑后標(biāo)準(zhǔn)歸一化、多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、一階導(dǎo)數(shù)和二階導(dǎo)數(shù)預(yù)處理方法(表2)對(duì)PLS-DA模型的影響,依據(jù)校正均方根(RMSE)和決定系數(shù)(R2)值,判別數(shù)據(jù)預(yù)處理效果,其中RMSE越小,R2值越大,模型的穩(wěn)定性越好。當(dāng)主成分?jǐn)?shù)均設(shè)置為7時(shí),PLS-DA建模,不同預(yù)處理方式RMSE和R2值如表2所示。歸一化預(yù)處理對(duì)煙用爆珠PLS-DA模型沒有優(yōu)化作用,1階導(dǎo)數(shù)處理對(duì)于B牌號(hào)、2階導(dǎo)數(shù)處理對(duì)于B和C牌號(hào)PLS-DA模型均起到負(fù)作用,可能是因?yàn)楣庾V數(shù)據(jù)中帶有的少許隨機(jī)噪聲,采用導(dǎo)數(shù)方法時(shí)放大了這些噪聲信號(hào),從而導(dǎo)致信噪比降低。平滑加MSC以及平滑加SNV均能優(yōu)化PLS-DA模型,其中SNV預(yù)處理結(jié)果略優(yōu)于MSC預(yù)處理結(jié)果。因此,平滑加SNV被選為最優(yōu)預(yù)處理方法。 表2 不同預(yù)處理方法不同牌號(hào)煙用爆珠PLS-DA模型RMSE和R2值 2.1.4最佳主成分?jǐn)?shù)的確定 PLS-DA建模中最主要的問題就是確定最佳主成分?jǐn)?shù),主成分?jǐn)?shù)的選擇直接影響模型的實(shí)際預(yù)測(cè)能力。本實(shí)驗(yàn)通過不同主成分?jǐn)?shù)下所建模型的RMSE和R2值的大小,綜合確定模型的最佳主成分?jǐn)?shù)值[15]。從3個(gè)不同牌號(hào)煙用爆珠的PLS-DA模型的RMSE和R2值隨主成分變化圖(圖2)可知,隨著主成分?jǐn)?shù)增加,3個(gè)模型的RMSE值均逐漸減小,R2值逐漸增加;當(dāng)主成分?jǐn)?shù)分別達(dá)到3、6、5時(shí),A、B、C牌號(hào)煙用爆珠PLS-DA模型RMSE和R2值分別趨于穩(wěn)定。而當(dāng)主成分?jǐn)?shù)過大時(shí),將可能出現(xiàn)模型過擬合的現(xiàn)象[13]。因此,A、B、C牌號(hào)煙用爆珠PLS-DA模型的最佳主成分?jǐn)?shù)值分別為3、6、5。 圖2 主成分?jǐn)?shù)對(duì)PLS-DA模型RMSE和R2值的影響 (a):RMSE值;(b):R2值 3種不同牌號(hào)煙用爆珠樣品PLS-DA模型校正集樣本的預(yù)測(cè)結(jié)果如表3所示。A牌號(hào)煙用爆珠樣品分類變量校正集樣本的預(yù)測(cè)值分散在1附近,其他分類變量的預(yù)測(cè)值分散在0附近,偏差均小于0.2。因此,根據(jù)判別規(guī)則該模型對(duì)校正集樣本中A牌號(hào)的煙用爆珠均能準(zhǔn)確判別,識(shí)別準(zhǔn)確度為100%,模型的校正集相關(guān)系數(shù)(R2)為0.9862,校正集預(yù)測(cè)均方根誤差(RMSEP)為0.0550,說明該模型有較好的擬合性和較高的預(yù)測(cè)精度。B和C牌號(hào)煙用爆珠PLS-DA模型對(duì)其樣本同樣具有較好的判別能力和預(yù)測(cè)精度,預(yù)測(cè)準(zhǔn)確度均為100%,R2分別為0.9562和0.9586,RMSEP分別為0.0994和0.0980,可用于判別和預(yù)測(cè)新的樣本。 表3 不同牌號(hào)煙用爆珠PLS-DA模型校正集預(yù)測(cè)結(jié)果 T 利用3種不同牌號(hào)煙用爆珠的PLS-DA模型對(duì)未參與建模的驗(yàn)證集樣本進(jìn)行分析預(yù)測(cè),結(jié)果如表4所示。A牌號(hào)煙用爆珠樣品分類變量驗(yàn)證集樣本的預(yù)測(cè)值分散在1附近,其他分類變量的預(yù)測(cè)值分散在0附近,偏差均在0.2以內(nèi)。因此,根據(jù)判別規(guī)則該模型對(duì)驗(yàn)證集樣本中A牌號(hào)的煙用爆珠均能準(zhǔn)確判別,對(duì)A牌號(hào)煙用爆珠樣品的預(yù)測(cè)準(zhǔn)確度為100%。模型的驗(yàn)證集相關(guān)系數(shù)R2為0.9686, RMSEP為0.0835,說明該模型判別準(zhǔn)確度高。B和C牌號(hào)煙用爆珠PLS-DA模型對(duì)其樣本同樣具有較好的判別能力和較高的預(yù)測(cè)精度,預(yù)測(cè)準(zhǔn)確度均為100%,R2分別為0.9411和0.9560, RMSEP分別為0.1146和0.1063。B和C牌號(hào)煙用爆珠PLS-DA模型也具有較好的判別能力和較高的預(yù)測(cè)精度。 表4 不同牌號(hào)煙用爆珠PLS-DA模型驗(yàn)證集預(yù)測(cè)結(jié)果 圖3 煙用爆珠內(nèi)液?jiǎn)沃悼刂茍D (a):A牌號(hào);(b):B牌號(hào);(c):C牌號(hào) (1)通過無水乙醇稀釋煙用爆珠內(nèi)液,紫外可見光譜掃描獲得煙用爆珠內(nèi)液紫外光譜數(shù)據(jù),光譜數(shù)據(jù)經(jīng)平滑和SNV預(yù)處理后,建立了3種不同牌號(hào)煙用爆珠的PLS-DA判別模型。 (2)3個(gè)牌號(hào)煙用爆珠PLS-DA模型的校正集分類變量的預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)系數(shù)均≥0.9562,PLS-DA模型對(duì)于參與建模的310個(gè)煙用爆珠樣本(校正集)和未參與建模的60個(gè)煙用爆珠樣本(驗(yàn)證集)的預(yù)測(cè)準(zhǔn)確度均為100%,模型擬合性好,預(yù)測(cè)精度高,判別能力強(qiáng)。且基于PLS-DA模型的分類變量值建立的單值控制圖可以對(duì)煙用爆珠內(nèi)液的一致性進(jìn)行快速判定。 (3)紫外可見光譜技術(shù)結(jié)合PLS-DA算法可對(duì)不同牌號(hào)煙用爆珠進(jìn)行有效判別,且方法快速準(zhǔn)確、經(jīng)濟(jì)環(huán)保、易于推廣。1.4 數(shù)據(jù)處理
2 結(jié)果與討論
2.1 PLS-DA模型的建立
2.2 PLS-DA模型對(duì)校正集樣本的驗(yàn)證結(jié)果
2.3 PLS-DA模型對(duì)驗(yàn)證集樣本的預(yù)測(cè)效果
2.4 煙用爆珠內(nèi)液一致性分析
3 結(jié)論