段 學(xué),趙小波,2,鄒勝瓊,田 敏,鄧 波,2,周 軍,2,張宿義,2,3
(1.瀘州老窖股份有限公司,四川瀘州 646000;2.國(guó)家固態(tài)釀造工程技術(shù)研究中心,四川瀘州 646000;3.釀酒生物技術(shù)及應(yīng)用四川省重點(diǎn)實(shí)驗(yàn)室,四川瀘州 646000)
我國(guó)從20 世紀(jì)80 年代開(kāi)始進(jìn)行近紅外(NIR)技術(shù)的研究,主要側(cè)重于農(nóng)產(chǎn)品[1-2]的分析研究,發(fā)展至今,此項(xiàng)技術(shù)已經(jīng)應(yīng)用于石化[3-4]、制藥[5-6]、食品[7-8]、紡織品[9-10]等領(lǐng)域。近紅外光譜分析方法是指通過(guò)分析待測(cè)樣品近紅外光譜中所呈現(xiàn)出的官能團(tuán)信息,比較待測(cè)樣品與已知或標(biāo)準(zhǔn)樣品的近紅外光譜從而確定待測(cè)樣品含量的一種方法,該方法屬于二次檢測(cè)方法。
白酒基酒即基礎(chǔ)酒,是糧食發(fā)酵后的酒糟經(jīng)蒸餾后得到的未經(jīng)勾兌的原酒,白酒基酒精度一般在60%vol~70%vol之間[11]。不同的基酒除酒精度不同之外,影響口味的其他成分如總酯、總酸、乙酸乙酯、乳酸乙酯、己酸乙酯等都不同[12]?,F(xiàn)階段酒精度常規(guī)采用酒精計(jì)進(jìn)行測(cè)定,相對(duì)簡(jiǎn)單;總酸、總酯采用指示劑法,相對(duì)復(fù)雜;其他含量較低的成分采用氣相色譜進(jìn)行測(cè)定,檢測(cè)時(shí)間長(zhǎng)[13]。近紅外分析方法作為一種快速、高效、無(wú)損和現(xiàn)場(chǎng)分析的方法,具有檢測(cè)方便,樣品無(wú)需預(yù)處理,適合在線分析等特點(diǎn),因此非常適合白酒快速定性、定量分析。陳林等[14]建立了基酒中甲酸的近紅外預(yù)測(cè)模型,驗(yàn)證集樣品的決定系數(shù)為0.98,校正集樣品的決定系數(shù)為0.99,所建的模型效果良好,能滿足白酒生產(chǎn)中甲酸的快速檢測(cè)需求。劉建學(xué)等[15]建立了基酒中己酸、乙酸的快速檢測(cè)方法,預(yù)處理方法與波段分別采用:一階導(dǎo)數(shù)+減去一條直線、一階導(dǎo)數(shù)+矢量歸一化預(yù)處理光譜;譜區(qū)選擇6101.7~5446 cm-1和11998.9~7501.7 cm-1,6101.7~5449.8 cm-1和11998.9~7497.9 cm-1;己酸、乙酸校正集樣品的決定系數(shù)分別為0.997、0.97;己酸和乙酸模型驗(yàn)證集的決定系數(shù)分別為0.994、0.96,檢測(cè)效果較好。
本項(xiàng)目以瀘州老窖基酒為研究對(duì)象,采用近紅外分析技術(shù)對(duì)其進(jìn)行快速檢測(cè),采用不同的預(yù)處理方法,比較全波段和特征波段對(duì)建模效果的影響,不斷優(yōu)化模型,建立基酒總酯的近紅外檢測(cè)模型,為基酒實(shí)現(xiàn)在線檢測(cè)提供技術(shù)支持。
基酒樣品:基酒樣由瀘州老窖股份有限公司提供。采集了釀酒生產(chǎn)基酒樣,選擇一部分為校正集,剩余為驗(yàn)證集,校正集中的基酒樣品必須包含驗(yàn)證集樣品檢測(cè)項(xiàng)目所有可能測(cè)定范圍,并且盡可能均勻分布。此外再隨機(jī)抽取未知基酒樣進(jìn)行外部驗(yàn)證,以最終評(píng)價(jià)所建模型的穩(wěn)定性、準(zhǔn)確度。
儀器設(shè)備:BUCHI 公司的近紅外NIR Master。光譜儀光源為高強(qiáng)度鹵鎢燈,配有玻璃樣品檢測(cè)皿,光譜范圍為4000~10000 cm-1,掃描次數(shù)為32次,分辨率為8 cm-1。利用近紅外光譜儀采集基酒光譜,利用BUCHI 公司自帶建模軟件建立定量基酒總酯模型,最后再用NIR Ware Management Console操作軟件測(cè)定未知基酒樣。
理化檢測(cè)設(shè)備與試劑:水浴鍋(溫控100 ℃),全玻璃回流裝置,全玻璃蒸餾器,50 mL 堿式滴定管,50 mL 酸式滴定管。酚酞指示劑(10 g/L):按GB/T 603—2002 配制;氫氧化鈉標(biāo)準(zhǔn)滴定溶液(c(NaOH)=0.1 mol/L):按GB/T 601—2016 配制與標(biāo)定;硫酸標(biāo)準(zhǔn)滴定溶液(c(1/2H2SO4)=0.1 mol/L):按GB/T 601—2016 配制與標(biāo)定;體積分?jǐn)?shù)為40 %乙醇溶液:量取95%乙醇600 mL 于1000 mL 回流瓶中,加入3.5 mol/L 氫氧化鈉標(biāo)準(zhǔn)溶液5 mL,加熱回流皂化1 h。然后移入蒸餾器中重蒸,再配成40%乙醇溶液[13]。
數(shù)據(jù)采集:采用透反射方式掃描采集基酒樣品,掃描32次取平均,每個(gè)基酒樣做2個(gè)平行樣,對(duì)獲得基酒樣光譜進(jìn)行預(yù)處理,舍去異常光譜,最終獲得建模用的光譜。建模酒樣總酯實(shí)測(cè)值測(cè)定:采用GB/T 10345—2007[13]《白酒分析方法》中的指示劑法。
樣品集劃分方法有擇3留1、Random Sam-pling(RS)、Kennard-Stone(KS)[16-17]等方法,本實(shí)驗(yàn)采用擇2 留1 方法來(lái)進(jìn)行樣本集劃分,去除異常樣,最終得到樣品光譜,其中一部分基酒樣品為校正集作為建模使用,另一部分為驗(yàn)證集以最終評(píng)價(jià)模型的穩(wěn)定性和準(zhǔn)確度,并調(diào)整模型,消除常規(guī)化學(xué)分析法測(cè)量的誤差。之后抽取50 個(gè)白酒樣品不參與建模分析,作為預(yù)測(cè)集樣品,用于預(yù)測(cè)模型效果。
為提高模型的準(zhǔn)確性,需對(duì)所采集的光譜進(jìn)行預(yù)處理,以選擇合適的譜區(qū)來(lái)建立模型。本實(shí)驗(yàn)通過(guò)BUCHI 自帶NIR Cal 建模軟件對(duì)光譜經(jīng)Ncl(趨近歸一化)、Mma(最大歸一化)、N01(0~1 間歸一化)、Nle(單位長(zhǎng)度歸一化)、Db1(一階導(dǎo)數(shù))、Db2(二階導(dǎo)數(shù))、Snv(標(biāo)準(zhǔn)歸一化)、Msc(多元散射校正)等光譜預(yù)處理后,選出最佳預(yù)處理方法,利用PLS 偏最小二乘法建立基酒總酯模型,探討全波段和特征波段所建模型的預(yù)測(cè)效果,所建模型用決定系數(shù)R2、交叉驗(yàn)證誤差均方根RMSECV 評(píng)價(jià)。R2越大,RMSECV 越小,模型預(yù)測(cè)性能越好。其計(jì)算公式如下:
式中:yi為實(shí)測(cè)數(shù)據(jù),fi為預(yù)測(cè)數(shù)據(jù),fp為實(shí)測(cè)平均值,N為樣品個(gè)數(shù)。
在原定的測(cè)定條件下,掃描采集到492 個(gè)基酒光譜。同時(shí)采用GB/T 10345—2007 中規(guī)定的方法測(cè)量基酒總酯的含量為輸入的手工值,為建立定標(biāo)模型提供手工標(biāo)準(zhǔn)值。對(duì)基酒樣品按擇2 留1 方法來(lái)進(jìn)行樣本集劃分,最終得到352 個(gè)基酒樣本為校正集,140個(gè)驗(yàn)證集樣品集。其校正集、驗(yàn)證集樣品基本信息見(jiàn)表1,校正集樣品完全包含了驗(yàn)證集,且校正集的偏差比驗(yàn)證集的偏差相差較小,符合近紅外光譜檢測(cè)要求。
表1 校正集、驗(yàn)證集樣品基本信息
對(duì)所采集的原始光譜進(jìn)行數(shù)學(xué)處理后,各個(gè)樣品的原始光譜圖和處理光譜圖見(jiàn)圖1、圖2。由圖1、圖2 可知,通過(guò)預(yù)處理方法處理后,光譜更加光滑,樣品之間的差異性更加明顯,Q 值有較為明顯的改善,這樣處理有利于定標(biāo)過(guò)程中對(duì)光譜信息的進(jìn)一步選擇。
圖1 基酒樣品原始光譜圖
在原始光譜4000~10000 cm-1共采集到1501個(gè)光譜點(diǎn),因?yàn)殚g隔數(shù)量會(huì)對(duì)模型有影響,通過(guò)MATLAB 軟件Si-PLS 組合間隔偏最小二乘法[18]將原始光譜分割為均勻等份,得到區(qū)間組合為(2,6,10,12),對(duì)應(yīng)的波段為(4300~4600,5500~5800,6700~7000,7300~7600)。將此特征波段與全波段進(jìn)行比較,結(jié)果見(jiàn)表2。由表2 可知,在特征波段條件下所建立的總酯模型校正集的決定系數(shù)R2C為0.95,校正集的均方根誤差RMSEC 為0.17%;預(yù)測(cè)集的決定系數(shù)R2P為0.93、預(yù)測(cè)集的均方根誤差RMSEP 為0.19%,特征波段的模型的校正集、驗(yàn)證集精度高,RMSEC 和RMSEP 都比全波段小,R2C、R2P都比全波段高,模型預(yù)測(cè)精度顯著提高,因此本文選擇特征波段進(jìn)行建模。
為驗(yàn)證基酒樣品總酯模型的準(zhǔn)確性,另取50個(gè)基酒樣品,利用特征波段所建模型對(duì)樣品中總酯含量進(jìn)行兩次預(yù)測(cè),將兩次預(yù)測(cè)結(jié)果取平均值后與手工值進(jìn)行比較,結(jié)果見(jiàn)圖3。
從圖3 可看出,基酒總酯含量的實(shí)測(cè)值與預(yù)測(cè)值線性相關(guān)較好,都在y=x 直線附近,通過(guò)計(jì)算得出R2為0.97,其中相對(duì)誤差小于5%高達(dá)90.12%,說(shuō)明總酯模型的預(yù)測(cè)效果較好。由此可見(jiàn),所建模型可適用于基酒總酯的實(shí)際檢測(cè)。
表2 特征波段與全波段模型比較
圖3 外部驗(yàn)證樣品的線性回歸
隨著白酒生產(chǎn)過(guò)程對(duì)先進(jìn)檢測(cè)技術(shù)要求的不斷提高,而利用近紅外光譜技術(shù)建立基酒總酯檢測(cè)方法是一種無(wú)需制樣,只用基酒潤(rùn)洗檢測(cè)皿極大的簡(jiǎn)化了分析流程的方法。本文分析比較了全波段和特征波段建立的基酒總酯模型效果,發(fā)現(xiàn)特征波段的模型的校正集、驗(yàn)證集精度高,RMSEC 和RMSEP 都比全波段小,模型預(yù)測(cè)精度顯著提高,因此選擇特征波段進(jìn)行建模。之后,通過(guò)外部驗(yàn)證,得到基酒總酯含量的實(shí)測(cè)值與預(yù)測(cè)值線性相關(guān)較好。由此可見(jiàn),所建模型可以用于快速檢測(cè)基酒總酯的含量,為更好的揭示總酯與白酒風(fēng)味的關(guān)系提供了數(shù)據(jù)支持,對(duì)推動(dòng)白酒行業(yè)實(shí)現(xiàn)智能化摘酒具有重要意義。