白永利 黃新國 , 彭 楠 張姍姍鐘云飛 , 翟小陽 謝小春
1.湖南工業(yè)大學(xué) 包裝與材料工程學(xué)院 湖南 株洲 412007
2.湖南福瑞印刷有限公司 湖南 長沙 410100
水性油墨具有黏度低、流動(dòng)性好、價(jià)格便宜、無毒無害、利于環(huán)境保護(hù)等優(yōu)點(diǎn),被認(rèn)為是最有潛力的綠色環(huán)保油墨,在印刷業(yè)中發(fā)揮著重要作用[1-2]。水性油墨的印刷適性是衡量油墨質(zhì)量的重要參數(shù),主要包括黏度、黏著性、顏色、pH值、分散穩(wěn)定性、觸變性等性能指標(biāo)[3]。印刷水性油墨通常為液體狀態(tài),印前黏度相對較高,需要添加酒精降低其黏度以達(dá)到印刷適性,但由于酒精易揮發(fā),在印刷過程中水性油墨的黏度會(huì)不斷變化,這嚴(yán)重影響印刷質(zhì)量。因此,印刷過程中需要不斷添加酒精來保證油墨黏度處于穩(wěn)定的狀態(tài)[4]。目前大部分企業(yè)主要通過有經(jīng)驗(yàn)的工作人員手動(dòng)添加酒精來調(diào)整水性油墨的黏度,這種方法主觀性強(qiáng),難以精確控制,費(fèi)時(shí)、繁瑣、效率低,無法保證油墨的穩(wěn)定性和一致性等印刷性能。所以,水性油墨黏度光譜表征研究對提高印刷品質(zhì)量具有重要意義。
可見/近紅外光譜分析技術(shù)是通過光譜學(xué)原理結(jié)合實(shí)驗(yàn)方法確定被測物質(zhì)組成結(jié)構(gòu)和化學(xué)成分的一種低成本、操作簡單、高效無損的檢測技術(shù)[5]。近紅外光譜分析廣泛應(yīng)用于農(nóng)產(chǎn)品[6]、食品[7-9]、臨床醫(yī)學(xué)[10]、化工以及環(huán)境水質(zhì)等檢測領(lǐng)域,并成為生產(chǎn)現(xiàn)場、無人監(jiān)守、連網(wǎng)工作環(huán)境下在線測控、野外環(huán)境監(jiān)測等領(lǐng)域的重要分析檢測手段。目前利用光譜分析技術(shù)對液體材料黏度的研究主要集中在航空潤滑油、抗燃液壓液、石油等方面。曾金等[11]通過傅立葉變換結(jié)合中紅外光譜分析技術(shù),建立紅外光譜和潤滑油黏度回歸方程,以實(shí)現(xiàn)快速檢測潤滑油黏度,該方法可行且測定結(jié)果穩(wěn)定。余良武等[12]利用中紅外光譜分析技術(shù)將后向間隔偏最小二乘法(backward interval partial least squares,BIPLS)和主成分分析BP神經(jīng)網(wǎng)絡(luò)法(principal component analysis-BP neural network,PCA-BPNN)結(jié)合,對水-乙二醇抗燃液壓液(water-glycol fire resistant hydraulic fluid,HFC)的黏度進(jìn)行了研究,為HFC的黏度測量開發(fā)了一種新的檢測技術(shù),測量精度符合監(jiān)測要求。馮新瀘[13]應(yīng)用近紅外光譜技術(shù)結(jié)合量化自組織神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)方法,建立內(nèi)燃機(jī)油在不同溫度下(40,100 ℃)的黏度指數(shù)模型,相比來說,量化自組織神經(jīng)網(wǎng)絡(luò)模型具有較好的預(yù)測性能。
上述研究為利用光譜分析技術(shù)實(shí)現(xiàn)水性油墨黏度檢測提供了參考,但它們大都使用中紅外光譜法(λ>1000 nm),價(jià)格昂貴,不利于實(shí)現(xiàn)后期的在線檢測研究。同時(shí),基于原始全波段的光譜數(shù)據(jù)進(jìn)行研究,數(shù)據(jù)量龐大繁雜,所建模型性能需進(jìn)一步優(yōu)化。本研究通過比較分析各種預(yù)處理效果,基于連續(xù)投影算法(successive projection algorithm,SPA)和競爭性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling,CARS)提取特征光譜,建立并優(yōu)化水性油墨黏度預(yù)測模型,定量無損預(yù)測黏度, 為實(shí)現(xiàn)水性油墨黏度的在線檢測提供了技術(shù)方法。
WZ01系列黃色水性油墨,細(xì)度小于 20 μm,黏度為(23±6)s(25 ℃,蔡恩2號杯),初干性為10~30 mm,著色力為95%~105%,購于珠海市樂通化工有限公司;醫(yī)用酒精,體積分?jǐn)?shù)為75%±5%,購于河南華陽藥業(yè)有限公司;蒸餾水,實(shí)驗(yàn)室自制。
光纖光譜儀,USB6500-Pro型,購于廣州景頤光電科技有限公司;鹵素?zé)艄庠矗琂Y-L2000型,波長范圍為300~2500 nm,輸入功率為100 W,購于廣州景頤光電科技有限公司。
光譜測量系統(tǒng)如圖 1 所示,由光源、反射光譜測量支架、光纖光譜儀、適配器、標(biāo)準(zhǔn)反射白板及計(jì)算機(jī)組成。數(shù)據(jù)采集前,光譜設(shè)備需預(yù)熱30 min并進(jìn)行校正,主要的參數(shù)設(shè)置包括系統(tǒng)的積分時(shí)間為2.5 ms,掃描平均次數(shù)(參數(shù)優(yōu)化后)為6次,光譜獲取范圍為 300.0~1023.1 nm。
圖1 光譜測量系統(tǒng)Fig.1 Spectral measurement system
通過添加一定體積分?jǐn)?shù)(0%, 5%, 10%, …,70%)的酒精溶劑改變水性油墨的黏度,并采用蔡恩2號杯對其黏度進(jìn)行測量。每組樣品重復(fù)測量 3 次,讀數(shù)并記錄結(jié)果,取平均值作為該水性油墨樣品的實(shí)測黏度值。在黏度可變化范圍內(nèi)共制得15組樣品。
水性油墨具有混濁、不透明的特點(diǎn),需要通過采集樣品的反射光譜進(jìn)行研究。為了避免儀器噪聲、人員操作等對測得的光譜數(shù)據(jù)造成影響,每次采集時(shí)光纖光譜儀、光源、標(biāo)準(zhǔn)反射白板、反射光譜測量支架四者的位置保持固定不變,對同一目標(biāo)連續(xù)采集10條光譜,將平均后的光譜作為樣品的原始光譜數(shù)據(jù)。
采集得到的光譜數(shù)據(jù)除樣品本身包含的化學(xué)信息外,還包括噪聲等影響模型準(zhǔn)確性的無關(guān)背景信息,因此需要對光譜數(shù)據(jù)進(jìn)行預(yù)處理。常用的預(yù)處理方法包括均值中心化(mean centering)、歸一化、小波變換、平滑、標(biāo)準(zhǔn)正態(tài)變量轉(zhuǎn)換(standard normal variate transformation,SNV)和多元散射校正(multiplicative scatter correction,MSC)等[14-15]。其中,均值中心化是通過將樣品的光譜減去校正集的平均光譜;數(shù)據(jù)平滑法包括移動(dòng)窗口平滑和Savitzky-Golay(SG)卷積平滑,旨在消除儀器噪聲或因其他變量所引起的噪聲;MSC是通過計(jì)算校正集樣品的平均光譜,即“理想光譜”,將其他光譜與理想光譜進(jìn)行線性回歸,通過線性方程的截距和斜率校正樣品的原始光譜;與MSC類似,SNV也用于校正樣品間由于光譜散射而引起的光譜誤差,但它不需要“理想光譜”,即通過原始光譜減去該光譜的平均值,再除以該光譜數(shù)據(jù)的標(biāo)準(zhǔn)偏差。本實(shí)驗(yàn)分別采用均值中心化、SG卷積平滑、移動(dòng)窗口平滑、MSC和SNV等方法對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。
原始光譜矩陣中共有2088個(gè)光譜波段,光譜數(shù)據(jù)量大而復(fù)雜,且數(shù)據(jù)之間相關(guān)性強(qiáng),因此在全光譜波長內(nèi)建立的模型運(yùn)算速度慢,復(fù)雜且效率低,不利于后期在線檢測。
特征變量選擇方法,能夠有效提取特征波長,通過壓縮波長變量,簡化模型,進(jìn)而優(yōu)化模型性能,提高模型的預(yù)測能力[16]。SPA是一種前向變量選擇算法,能夠從光譜信息中充分尋找出含有最低限度冗余信息的變量組,使變量之間的共線性達(dá)到最小[17-18]。CARS 是一種將回歸系數(shù)作為變量重要性指標(biāo),結(jié)合蒙特卡羅采樣算法的特征波長提取方法,其將每個(gè)變量看為一個(gè)個(gè)體,多次重復(fù)實(shí)驗(yàn),通過自適應(yīng)重加權(quán)采樣技術(shù)優(yōu)選出PLS模型中回歸系數(shù)絕對值大的波長變量,最終比較計(jì)算得到的均方根誤差(rootmean-square error,RMSE),選擇均方根誤差最小的子集作為最優(yōu)變量子集[19]。本研究基于SPA和CARS提取用于黏度值檢測的特征波長。
本研究分別基于原始全波段光譜、預(yù)處理后的全波段光譜數(shù)據(jù)和特征波段光譜數(shù)據(jù),構(gòu)建水性油墨黏度的偏最小二乘回歸預(yù)測模型(partial least square regression,PLSR)和主成分回歸(principal component regression,PCR)預(yù)測模型,并以決定系數(shù)(R2)和均方根誤差(RMSE)為精度指標(biāo)的評價(jià)模型。
基于微型光纖光譜儀獲取的光譜數(shù)據(jù)和蔡恩杯測定的實(shí)際黏度值,采用濃度梯度法,將所有樣本集按照2∶1的比例劃分為10個(gè)校正集與5個(gè)預(yù)測集,所得樣本的黏度統(tǒng)計(jì)結(jié)果如表1所示。由表可知,樣本校正集的黏度值范圍大于測試集的黏度范圍,因此劃分結(jié)果合理可行。
表1 校正集和預(yù)測集中水性油墨的黏度統(tǒng)計(jì)結(jié)果Table 1 Statistics results of the viscosity of water-based inks in calibration and prediction sets
原始光譜中首末兩端存在閑散光、背景信息等大量噪聲,對后期光譜數(shù)據(jù)分析造成嚴(yán)重影響,因此,本研究選取 300~1021nm 波段的數(shù)據(jù)作為原始光譜數(shù)據(jù),共1084個(gè)波段,用于后續(xù)的預(yù)測分析。為了進(jìn)一步消除可見/近紅外原始光譜數(shù)據(jù)中噪聲及光源強(qiáng)度分布不均勻等環(huán)境因素對實(shí)驗(yàn)精度的影響[20],分別采用均值中心化、移動(dòng)窗口平滑、SG卷積平滑、MSC、SNV等5種預(yù)處理方法對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。水性油墨樣本的原始反射光譜(raw)以及5種預(yù)處理后對應(yīng)的反射光譜如圖2所示。
圖2 水性油墨原始反射光譜及5種預(yù)處理后的反射光譜圖Fig.2 Original reflectance spectra of water-based ink and reflectance spectra processed by 5 pre-treatments
由圖2可以看出,所有光譜曲線的波形相似且平坦,沒有明顯的波峰和波谷,經(jīng)過MSC和SNV預(yù)處理后,光譜曲線的散射效應(yīng)明顯減小。
為了比較不同光譜預(yù)處理方法對模型性能的影響,本研究分別基于原始全波段光譜信息和預(yù)處理后的全光譜數(shù)據(jù)建立了水性油墨黏度的 PCR、PLSR預(yù)測模型,預(yù)測結(jié)果見表2,其中和分別為校正集和預(yù)測集的決定系數(shù),RMSEC和RMSEP分別為校正集和預(yù)測集的均方根誤差。
表2 PCR和PLSR模型對水性油墨黏度的預(yù)測結(jié)果Table 2 Viscosity prediction results of water-based inks by PCR and PLSR model
由表2可知,經(jīng)過 MSC和 SNV預(yù)處理后的光譜數(shù)據(jù)建立的水性油墨預(yù)測模型均比其他預(yù)處理方法效果好。對比這兩種預(yù)處理方法,可以發(fā)現(xiàn)經(jīng)過SNV預(yù)處理后建立的PLSR模型效果最好,其中高達(dá)0.9966,達(dá)到0.9796,RMSEC和RMSEP誤差相對也是最小。同時(shí),對比分析PCR和PLSR這兩種模型效果,發(fā)現(xiàn)PLSR模型的性能要優(yōu)于PCR模型。由此可見,對原始光譜進(jìn)行預(yù)處理尤為必要。
經(jīng)過SNV預(yù)處理后建立的PLSR模型達(dá)到了較好的預(yù)測效果,但該模型是以預(yù)處理后的全波段光譜數(shù)據(jù)量作為輸入變量,數(shù)據(jù)量龐大且繁雜,影響模型的運(yùn)算效率,不利于后續(xù)的在線檢測。本研究通過分析和比較SPA和CARS兩種特征光譜波長提取方法來篩選有效光譜,簡化模型的復(fù)雜程度,進(jìn)一步優(yōu)化模型[21]。
3.3.1 基于SPA提取特征波長
采用SPA算法對預(yù)處理后的光譜數(shù)據(jù)提取特征波長,以預(yù)測模型的均方根誤差為評價(jià)指標(biāo)來確定特征波長變量個(gè)數(shù),特征波長的提取過程如圖3所示。圖3a反應(yīng)了RMSE隨SPA中有效變量數(shù)的變化規(guī)律,可以看出RMSE隨著有效變量數(shù)的增加先逐漸下降,當(dāng)有效變量數(shù)為4時(shí),RMSE最小,最小值為0.0732,當(dāng)變量數(shù)大于4后,RMSE又出現(xiàn)波動(dòng),呈現(xiàn)先上升后下降趨勢。因此,通過SPA算法選擇4個(gè)特征波長變量,分別為 273, 322, 716, 721 nm,如圖 3b 所示。
圖3 SPA特征波長變量選擇過程Fig.3 SPA feature wavelength variable selection process
3.3.2 基于CARS提取特征波長
圖4顯示了通過CARS算法提取特征波長的整個(gè)過程,設(shè)定其蒙特卡洛采樣次數(shù)為50次,然后利用五折交叉驗(yàn)證的RMSECV值構(gòu)建PLS模型,選取最佳特征波長。從不同采樣次數(shù)下RMSECV的變化規(guī)律可知,當(dāng)?shù)降?5次時(shí),RMSECV達(dá)到最小,此時(shí)該最優(yōu)變量子集包含12個(gè)特征變量,分別為:194,196, 227, 231, 232, 239, 241, 255, 537, 729, 736, 740 nm。
圖4 CARS特征波長變量選擇過程Fig.4 CARS feature wavelength variable selection process
本研究分別將SPA算法得到的4個(gè)特征波長和CARS算法得到的12個(gè)特征波長光譜數(shù)據(jù)作為自變量,建立水性油墨黏度值的PLS預(yù)測模型,預(yù)測結(jié)果如表3所示。
表3 基于特征光譜建立的偏最小二乘法回歸模型對水性油墨的預(yù)測結(jié)果Table 3 Viscosity prediction results of water-based inks by PLSR model based on the characteristic spectra
橫向?qū)Ρ确治霰?中兩種特征波長提取算法建立的PLS模型發(fā)現(xiàn),基于SPA-PLS和SNV-SPA-PLS模型不僅顯著簡化了模型,同時(shí),預(yù)測模型也得到了較好的預(yù)測精度,優(yōu)于基于CARS-PLS和SNVCARS-PLS建立的黏度預(yù)測模型,表明基于SPA構(gòu)建的水性油墨黏度值模型預(yù)測效果優(yōu)于CARS模型預(yù)測效果。同時(shí)縱向?qū)Ρ缺?可以發(fā)現(xiàn),原始全光譜經(jīng)過SNV最優(yōu)預(yù)處理后,基于特征變量提取算法(SPA、CARS)構(gòu)建的PLS水性油墨黏度模型的預(yù)測性能遠(yuǎn)遠(yuǎn)優(yōu)于不進(jìn)行預(yù)處理的基于原始反射光譜特征波長的預(yù)測模型。綜上,經(jīng)過SNV預(yù)處理后,基于特征變量算法構(gòu)建的SNV-SPA-PLS模型預(yù)測性能最佳,其中和分別高達(dá)0.9954和0.9992,RMSEC和RMSEP分別為0.2570和0.0732,表明利用SPA特征波長提取算法,不僅簡化了模型,提高了模型的運(yùn)算速率,而且顯著提高了模型的預(yù)測精度。
為實(shí)現(xiàn)快速無損檢測水性油墨的黏度,提出了一種基于可見/近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)預(yù)測水性油墨黏度的方法。首先,將采集到的原始反射光譜數(shù)據(jù)進(jìn)行預(yù)處理;然后,通過比較分析各種預(yù)處理方法的去噪效果,分別建立PCR和PLSR黏度預(yù)測模型;最后,利用SPA和CARS光譜特征波長提取方法從全光譜中優(yōu)選出最優(yōu)特征波長,建立PLS預(yù)測模型。結(jié)果表明,經(jīng)SNV預(yù)處理后建立的預(yù)測模型效果好于其他預(yù)處理和基于原始光譜的預(yù)測模型;基于特征變量建立的模型效率得到了較大提升,并且預(yù)測能力也優(yōu)于全光譜模型。本研究中SNV-SPA-PLS預(yù)測模型顯著降低了模型的復(fù)雜程度,具有非常好的預(yù)測能力,其中,RMSEP為0.0732,表明采用可見/近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法建立的水性油墨黏度預(yù)測模型是極其可行的,為實(shí)現(xiàn)水性油墨黏度在線檢測提供了技術(shù)基礎(chǔ)。