董春旺,劉中原,2,楊 明,王 梅,張人天,2,林 智,
(1.中國(guó)農(nóng)業(yè)科學(xué)院茶葉研究所,浙江 杭州 310008;2.石河子大學(xué)機(jī)械電氣工程學(xué)院,新疆 石河子 832003;3.中國(guó)科學(xué)院發(fā)展規(guī)劃局,北京 100864)
綠茶是我國(guó)主要茶類之一,因其有益健康的特性而被廣泛消費(fèi)。綠茶也是我國(guó)茶葉產(chǎn)量最大的茶類,居六大初制茶類之首,截至2020年我國(guó)綠茶產(chǎn)量達(dá)到184.27萬 t,占我國(guó)茶葉總產(chǎn)量60%以上。殺青是綠茶加工的關(guān)鍵工序,水分含量直接影響殺青葉物理狀態(tài)和生化反應(yīng)的進(jìn)程,對(duì)茶葉品質(zhì)的形成具有重要的作用。
傳統(tǒng)的茶葉水分檢測(cè)方法為烘干稱質(zhì)量法,該方法測(cè)量精度較高,但存在耗時(shí)和有損的缺點(diǎn),無法滿足茶葉加工過程中在線、快速和無損傷檢測(cè)的需求。因此,在綠茶生產(chǎn)實(shí)際中,多根據(jù)殺青葉色澤變化和手握的觸感,判斷殺青葉水分含量情況和殺青程度,如適度的殺青葉色澤暗綠,手捏葉質(zhì)柔軟,略有黏性。人工經(jīng)驗(yàn)法屬于專家行為,易導(dǎo)致在制品發(fā)生紅邊、焦葉或殺不透現(xiàn)象,造成品質(zhì)不穩(wěn)定和鮮葉原料的浪費(fèi)。目前,已有國(guó)內(nèi)外學(xué)者開展茶葉水分含量的快速檢測(cè),如Mizukami等提出一種基于電容特性的含水率檢測(cè)方法,研究了碾茶原料的電學(xué)特性和水分含量之間的關(guān)系。劉飛等利用電特性參數(shù)對(duì)綠茶干燥過程中在制品水分含量進(jìn)行了預(yù)測(cè),得到較好的模型效果。電特性信息采集時(shí),其接觸力、時(shí)間、頻率及攤?cè)~厚度、均勻度等均影響檢測(cè)性能,難以應(yīng)用于實(shí)際生產(chǎn)。
近紅外光譜和機(jī)器視覺技術(shù)是2 種常用的無損檢測(cè)方法,具有快速、高效、無損的優(yōu)點(diǎn),已廣泛應(yīng)用于茶葉成分定量檢測(cè)、茶葉品質(zhì)劃分、茶葉原產(chǎn)地的定性判別等領(lǐng)域。Wang Yujie等為了快速檢測(cè)紅茶加工過程中多酚和兒茶素含量,融合微型近紅外光譜和自建計(jì)算機(jī)視覺系統(tǒng)采集的數(shù)據(jù)信息,采用競(jìng)爭(zhēng)性自適應(yīng)權(quán)重取樣(competitive adaptive reweighted sampling,CARS)法和主成分分析(principal component analysis,PCA)法從光譜和顏色變量中選擇有效變量,并建立偏最小二乘回歸(partial least squares regression,PLSR)預(yù)測(cè)建模,結(jié)果表明,預(yù)測(cè)的校正集相關(guān)系數(shù)(correlation coefficient of calibration set,)值分別為0.98±0.00和0.96±0.01,預(yù)測(cè)集的相關(guān)系數(shù)(correlation coefficient of the prediction set,)值分別為0.98±0.01和0.97±0.01,相對(duì)分析誤差(relative percent deviation,RPD)分別為5.41±0.99和4.03±0.38。董春旺等建立了基于圖像色澤特征的針芽形綠茶外形品質(zhì)評(píng)價(jià)方法。胡永光等采用可見-近紅外光譜技術(shù),建立了綠茶殺青葉料含水率檢測(cè)方法,其預(yù)測(cè)相關(guān)系數(shù)為0.819,均方根誤差為0.037,預(yù)測(cè)含水率的平均相對(duì)誤差為3.30%。Li Luqing等證明了融合近紅外光譜和計(jì)算機(jī)視覺技術(shù)在區(qū)分綠茶質(zhì)量等級(jí)方面可以實(shí)現(xiàn)優(yōu)于單一傳感器技術(shù)的性能。然而,融合近紅外光譜和機(jī)器視覺技術(shù)在檢測(cè)綠茶殺青過程中水分含量的研究鮮有報(bào)道,尚未評(píng)估融合機(jī)器視覺和近紅外光譜數(shù)據(jù)預(yù)測(cè)綠茶殺青過程中水分含量的可行性。
綜上,本研究以針芽形綠茶自動(dòng)化生產(chǎn)線為載體,同步采集殺青過程中在制品的圖像與光譜信息,提取圖像紋理、顏色特征及特征光譜變量。探討有效的數(shù)據(jù)融合方式以提高模型的預(yù)測(cè)精度,旨在克服單一傳感信息預(yù)測(cè)精度不夠的問題,為今后在標(biāo)準(zhǔn)化、數(shù)字化生產(chǎn)線中殺青模塊的專家系統(tǒng)研發(fā)提供理論依據(jù)和數(shù)據(jù)支撐。
于2020月4月7日在湖南省長(zhǎng)沙市湘豐智能裝備有限公司實(shí)施,茶葉品種為高橋銀峰茶,嫩度為一芽一葉和一芽二葉。
如圖1所示,采用數(shù)據(jù)融合裝置主要由3 部分組成:近紅外光譜部分、機(jī)器視覺部分、水分采集部分。在近紅外光譜部分使用IAS-3100采集光譜數(shù)據(jù),測(cè)樣方式為下照漫反射;波長(zhǎng)范圍為900~1 700 nm;光譜精度為±1 nm,分辨率為4 cm;機(jī)器視覺部分包括圖像傳感器、專業(yè)工業(yè)相機(jī)、弧形光源、暗箱、計(jì)算機(jī)和GUI軟件處理系統(tǒng)組成,專業(yè)工業(yè)相機(jī)型號(hào)為FI-S200C-G,其中鏡頭為4 nm低畸變鏡頭,傳感器為1/2.8 CMOS圖像傳感器,分辨率為1 080 像素×1 080 像素,曝光時(shí)間設(shè)為0.09 ms;光源采用DOME單色純白弧形光源,底部光照強(qiáng)度均值約為1 000 lx,圖片類型為bmp格式;相機(jī)鏡頭被固定在暗箱頂部,以確保拍攝角度和距離恒定。水分采集部分使用三臺(tái)賽多利斯水分測(cè)定儀(MA35M-000230V1,上海右一儀器有限公司)對(duì)茶葉樣品含水率進(jìn)行采集,其量程為35 g,稱質(zhì)量系統(tǒng)精度為1 mg,可讀性為0.01%。
圖1 數(shù)據(jù)融合流程圖Fig.1 Flowchart of the data fusion used in this study
為了實(shí)時(shí)檢測(cè)殺青過程中水分的變化,采用每間隔1 min取一次樣品,每次取15 個(gè)樣品,每個(gè)樣品質(zhì)量約80 g,均勻平鋪在規(guī)格為70 mm×10 mm的石英培養(yǎng)皿中,每個(gè)樣品采集3 次光譜,取3 次采集光譜的平均值作為該樣品的光譜信息,共獲得105 條不同時(shí)序下的殺青葉光譜信息。將每個(gè)采集完光譜數(shù)據(jù)的樣品放置于相機(jī)的視野中,采集樣品圖像信息,該研究共獲得105 張圖像用于數(shù)據(jù)的分析和模型的建立。將采集完光譜和圖像信息的樣品進(jìn)行水分分布情況測(cè)定,結(jié)果見表1。
表1 綠茶殺青樣本水分分布情況Table 1 Moisture contents in samples at different stages of tea fixation
1.3.1 樣品制備
將采集好的鮮葉原料(含水率為76.52%)放置于鮮葉攤青機(jī)中,攤?cè)~厚度為5~6 cm,室內(nèi)環(huán)境溫度在20 ℃左右,相對(duì)濕度60%左右,攤青處理10 h后,根據(jù)水分測(cè)定儀測(cè)定結(jié)果(測(cè)定3 次取平均值),含水率為65.05%,攤青結(jié)束,隨即進(jìn)行殺青。殺青在滾筒式殺青機(jī)內(nèi)進(jìn)行,滾筒殺青溫度為270 ℃+250 ℃+230 ℃(前段筒溫+中段筒溫+后段筒溫),滾筒轉(zhuǎn)速為22 r/min,殺青時(shí)間為6 min,含水量為54.24%。
1.3.2 特征提取和數(shù)據(jù)融合
1.3.2.1 近紅外光譜處理
在光譜采集的過程中,由于培養(yǎng)皿中樣品不平整,光譜信息容易受到散光、噪聲等因素干擾,故使用多元散射校正(multiplicative scatter correction,MSC),中心化、標(biāo)準(zhǔn)差歸一化、極差歸一化和微分5 種方式對(duì)原始光譜預(yù)處理,以校正因散射引起的光譜差異,降低干擾信息的影響。為了消除與光譜信息無關(guān)的冗余信息,使用競(jìng)爭(zhēng)性自適應(yīng)加權(quán)算(competitive adaptive reweighted sampling,CARS)法、變量組合集群分析(variables combination population analysis,VCPA)法、變量組合集群分析法結(jié)合迭代保留信息變量(variables combination population analysis and iterative retained information variable algorithm,VCPA-IRIV)法和隨機(jī)蛙跳(random frog,RF)法4 種變量篩選算法從全光譜中提取特征波段。
1.3.2.2 圖像特征
軟件系統(tǒng)部分以圖像中像素點(diǎn)(1 728,1 152)為中心,自動(dòng)分割出1 000 像素×1 000 像素區(qū)域,提取該興趣區(qū)域的色澤和紋理特征。通過RGB和HSV之間的顏色模型轉(zhuǎn)換,最終獲得樣品圖樣的9 個(gè)顏色特征以及6 個(gè)紋理特征。9 個(gè)顏色特征分別為紅色通道均值()、綠茶通道均值()、藍(lán)色通道均值()、色點(diǎn)均值()、飽和度均值()、亮度均值()、超綠變換(2)、紅色通道均值與綠色通道均值的比值(/)和顏色角();6 個(gè)紋理特征分別為:平均灰度值()、標(biāo)準(zhǔn)差()、平滑度()、三階距()、一致性()、熵(),共計(jì)得到15 個(gè)圖像特征。
據(jù)蚯蚓測(cè)土實(shí)驗(yàn)室副總裁劉剛介紹,蚯蚓測(cè)土實(shí)驗(yàn)室有專業(yè)的服務(wù)團(tuán)隊(duì)、檢測(cè)設(shè)備、檢測(cè)人員及管理系統(tǒng)四大優(yōu)勢(shì),多元素同時(shí)檢測(cè),批量化、自動(dòng)化作業(yè),信息管理系統(tǒng)可以自動(dòng)分配任務(wù)、自動(dòng)抓取檢測(cè)結(jié)果、自動(dòng)生成檢測(cè)報(bào)告,報(bào)告中包括土壤養(yǎng)分的含量、施肥的時(shí)期、養(yǎng)分的配比、施肥量、施肥方法的介紹,從而使農(nóng)民科學(xué)施肥達(dá)到節(jié)本增收的目的。
1.3.2.3 數(shù)據(jù)融合
數(shù)據(jù)融合可以分為3 個(gè)不同的層次:數(shù)據(jù)級(jí)、特征級(jí)和決策級(jí)。在數(shù)據(jù)級(jí)融合過程中,直接將近紅外光譜和機(jī)器視覺系統(tǒng)所采集的數(shù)據(jù)融合起來為數(shù)據(jù)級(jí)融合;特征級(jí)數(shù)據(jù)融合是將來自不同傳感器之間的特征變量進(jìn)行數(shù)據(jù)融合;在決策級(jí)融合過程中,從每個(gè)數(shù)據(jù)源中計(jì)算出單獨(dú)的回歸模型,并將其結(jié)果合并,得到最終的回歸模型。然而,決策級(jí)數(shù)據(jù)融合需要準(zhǔn)確的數(shù)據(jù)處理方式,如果沒有考慮不同傳感器之間的數(shù)據(jù)相關(guān)性,此過程可能會(huì)導(dǎo)致大量信息丟失。因此,本研究選擇數(shù)據(jù)級(jí)和特征級(jí)融合進(jìn)行數(shù)據(jù)處理。為了消除數(shù)據(jù)的大小對(duì)建模結(jié)果的影響,采用數(shù)據(jù)歸一化對(duì)融合的數(shù)據(jù)進(jìn)行預(yù)處理。
1.3.3 多變量數(shù)據(jù)分析
1.3.3.1 PCA
變量篩選和特征提取都是對(duì)原始光譜進(jìn)行降維和壓縮,剔除與待測(cè)對(duì)象無關(guān)的信息,簡(jiǎn)化模型的過程。但不同的是,變量篩選是從原始數(shù)據(jù)中篩選出有代表性的數(shù)據(jù),而特征提取是通過映射(或變換)的方法對(duì)原始數(shù)據(jù)進(jìn)行重組,從中提取新的特征供下一步處理分析。通常先經(jīng)過變量篩選再進(jìn)行特征提取,最后利用新提取的特征建立模型。PCA作為特征提取的一種方式,在保證光譜和圖像主要特征不丟失的情況下,降低數(shù)據(jù)集的維數(shù),將多特征轉(zhuǎn)化為少量主要特征的方法。PCA通過將原始變量轉(zhuǎn)換為一組成分(PCs)的線性不相關(guān)的新變量匯總數(shù)據(jù),累計(jì)貢獻(xiàn)率表示相應(yīng)的PC解釋原始變量的能力,本研究第10個(gè)PCs的交互驗(yàn)證均方根誤差(root mean square error cross-validation,RMSECV)值最低,且前10 個(gè)PCs的累計(jì)貢獻(xiàn)率達(dá)到了99%以上,因此本研究采用前10 個(gè)PCs建立定量預(yù)測(cè)模型。
1.3.3.2 定量預(yù)測(cè)建模方法
在建立模型之前,使用Kennard-Stone(K-S)法將數(shù)據(jù)集分為校正集和預(yù)測(cè)集,其中校正集樣本數(shù)為79 個(gè),預(yù)測(cè)集樣本數(shù)為26 個(gè),校正集與預(yù)測(cè)集比例為3∶1。采用PLSR、支持向量回歸(support vector regression,SVR)建立綠茶殺青過程中水分含量定量預(yù)測(cè)模型。
PLSR模型是用于解決回歸問題最廣泛使用的線性算法之一,集中了PCA和典型相關(guān)分析的特點(diǎn),通過從自變量和因變量數(shù)據(jù)中提取包含原數(shù)據(jù)變異信息的PC建立回歸模型,廣泛應(yīng)用于食品和農(nóng)產(chǎn)品內(nèi)質(zhì)成分的定量預(yù)測(cè);SVR模型是一種基于支持向量機(jī)(support vector machine,SVM)理論的非線性數(shù)據(jù)處理方法,基本思想是在高維空間中進(jìn)行線性回歸,實(shí)現(xiàn)函數(shù)逼近。SVR的過程是通過引入非線性映射函數(shù),即核函數(shù),將原始空間映射到高維特征空間。因此,低維空間中的非線性問題可以轉(zhuǎn)化為高維空間中的線性問題。在這個(gè)空間中,構(gòu)造了特殊類型的超平面,然后在超平面中建立回歸模型。
1.3.3.3 模型評(píng)價(jià)指標(biāo)
采用、RMSECV和、預(yù)測(cè)均方根誤差(root mean square error of predication,RMSEP)分別作為訓(xùn)練集與預(yù)測(cè)集評(píng)價(jià)指標(biāo)。為了更好地衡量所建模型的預(yù)測(cè)性能,引入RPD作為模型性能指標(biāo)。與在0~1的范圍值越大,RMSECV和RMSEP越小,預(yù)測(cè)性能越好;當(dāng)RPD值大于1.4時(shí),表明模型可以應(yīng)用,當(dāng)RPD在1.8~2之間,表明模型預(yù)測(cè)效果較好,當(dāng)RPD>2時(shí),表明模型具有極好的預(yù)測(cè)效果,計(jì)算公式如(1)~(5)所示。所有的數(shù)據(jù)處理分析均在Origin 2018和Matlab 2019a中完成。
式中:y為預(yù)測(cè)集中的第個(gè)樣品的預(yù)測(cè)值;為校正集中的第個(gè)樣品的實(shí)際測(cè)定值;為對(duì)應(yīng)所有個(gè)校正集樣品或個(gè)預(yù)測(cè)集樣品實(shí)際測(cè)定值平均值;std為預(yù)測(cè)集的標(biāo)準(zhǔn)差。
圖2a為綠茶殺青實(shí)驗(yàn)樣本的近紅外光譜圖,記錄了900~1 650 nm波長(zhǎng)樣本的光譜曲線,剔除噪聲影響較大的1 651~1 700 nm范圍內(nèi)的光譜數(shù)據(jù),不同殺青時(shí)間樣本的光譜曲線存在細(xì)微差距。發(fā)現(xiàn)主要吸收峰位于960、1 225 nm和1 440 nm處。其中,960 nm處的吸收峰主要與水分子中O—H基團(tuán)的二級(jí)倍頻有關(guān);1 220 nm處的吸收峰受水分子O—H基團(tuán)的合頻吸收帶以及C—H鍵二級(jí)倍頻的影響,其中C—H的影響來自殺青過程中,在制品發(fā)生酶鈍反應(yīng),引起內(nèi)質(zhì)成分變化的影響;1 440 nm處的吸收峰受水分子中OH基團(tuán)在近紅外區(qū)的伸縮振動(dòng)一級(jí)倍頻的影響。
由于采集的近紅外原始光譜中包含了除光譜信息之外的其他噪聲信息,為了降低噪聲對(duì)模型效果的影響,使用5 種不同方法對(duì)原始數(shù)據(jù)預(yù)處理,校正后的光譜如圖2b~f所示,隨后建立PLSR預(yù)測(cè)模型,并與原始數(shù)據(jù)建立的PLSR模型相比較,以確定最優(yōu)的預(yù)處理方法,結(jié)果如表2所示。由表2可知,基于原始光譜所建立的預(yù)測(cè)模型效果較差,RPD<1.8,只可以對(duì)綠茶殺青過程中水分含量實(shí)現(xiàn)粗略的預(yù)測(cè);使用預(yù)處理后所建立的預(yù)測(cè)模型性能相比原始光譜所建立的模型效果明顯較優(yōu),其中中心化為最佳的預(yù)處理方法。值為0.938 5,值為0.907 1,RPD為2.180 4,可以對(duì)綠茶殺青過程中水分含量精準(zhǔn)預(yù)測(cè)。
表2 基于不同預(yù)處理方法水分含量預(yù)測(cè)模型Table 2 Parameters of moisture content prediction models developed using different pretreatment methods
圖2 不同預(yù)處理方法對(duì)光譜的影響Fig.2 Effect of different pretreatment methods on NIR spectra
為了更好研究殺青過程中葉片顏色變化規(guī)律,本研究首先對(duì)整體視覺變化進(jìn)行分析。隨機(jī)拍攝不同殺青時(shí)間的圖像,根據(jù)殺青時(shí)間順序排列。然后提取圖像的平均顏色,結(jié)果如圖3A、B所示,殺青時(shí)間不同,顏色也存在一定的差異。為了更好區(qū)分不同加工時(shí)間圖像之間的差異性,本研究將RGB圖像轉(zhuǎn)化為HSV顏色模型然后取平均色,結(jié)果如圖3C、D所示。在綠茶殺青過程中,葉子變得柔軟卷曲,顏色逐漸由青綠色變成深綠色。隨后,提取圖像的不同顏色特征參數(shù),從微觀角度呈現(xiàn)葉子顏色的變化規(guī)律,結(jié)果如圖4所示。其中RGB值隨著綠茶殺青過程而顯著降低,導(dǎo)致顏色從青綠色變成暗綠色,這是因?yàn)樵诟邷剽g化了酶的活性,終止了各種酶促變化途徑,同時(shí)葉綠素總量、葉綠素a與葉綠素b的比例發(fā)生了變化,鮮葉中墨綠色的葉綠素a與黃綠色的葉綠素b的比例大約是2∶1,通過殺青,葉綠素a破壞較多,剩下25%左右,葉綠素b破壞較少,在殺青葉中約50%~60%,由此可見,殺青之前墨綠色的葉綠素a比黃綠色的葉綠素b大約多1 倍,殺青之后,則葉綠素b比葉綠素a多1 倍,使葉色由鮮綠色變?yōu)榘稻G。對(duì)于HSV顏色空間,在殺青過程中值和值在殺青過程中逐漸降低,值在殺青過程中逐漸增大,這可以通過圖3描繪的顏色得以證明。其中,紋理變化過程中除了三階矩值和一致性值逐漸增大之外,其他紋理特征均呈現(xiàn)逐漸降低的趨勢(shì)。
圖3 殺青過程中顏色變化圖Fig.3 Color changes of tea leaves during the fixation process
圖4 殺青過程中色澤和紋理特征值的變化結(jié)果Fig.4 Changes in color and texture characteristics during the fixation process
為了進(jìn)一步提高模型的預(yù)測(cè)精度,將采集的近紅外光譜數(shù)據(jù)使用最佳預(yù)處理后,分別使用CARS、VCPA、VCPA-IRIV和RF四種特征波長(zhǎng)篩選方法提取特征波長(zhǎng)。其中,運(yùn)行CARS算法時(shí)迭代次數(shù)和蒙特卡羅采樣運(yùn)行次數(shù)分別設(shè)置為1 000和50,共篩選出20 個(gè)特征波長(zhǎng),篩選結(jié)果如圖5a、b所示;運(yùn)行VCPA算法時(shí),最佳子集占比為0.1,二進(jìn)制矩陣采樣運(yùn)行次數(shù)設(shè)為1 000,指數(shù)衰減函數(shù)運(yùn)行的次數(shù)設(shè)為50,剩余變量數(shù)目設(shè)為14,因此VCPA算法篩選出9 個(gè)特征波長(zhǎng),篩選結(jié)果如圖5c所示;VCPA-IRIV算法首先采用VCPA進(jìn)行快速縮小變量空間,設(shè)置最終剩余變量數(shù)為N;然后再通過IRIV評(píng)估剩余變量空間中每個(gè)變量的重要性,以優(yōu)選出最佳變量子集,最終優(yōu)選出33 個(gè)特征波長(zhǎng),篩選結(jié)果如圖5d所示;RF算法是近年提出的新型特征波長(zhǎng)選擇算法,其根據(jù)不同變量被選擇的可能性不同,通過多次迭代來確定每個(gè)變量被選擇的概率,進(jìn)而選擇概率高的變量作為特征波長(zhǎng),此方法篩選出25 個(gè)特征波長(zhǎng),篩選結(jié)果如圖5e所示。如圖5f所示,為4 種變量篩選方法提取的特征波長(zhǎng)分布圖,可以看出特征波長(zhǎng)在960、1 220、1 440 nm和1 620 nm附近,這可能與OH基團(tuán)、NH基團(tuán)和CH基團(tuán)的伸縮振動(dòng)有關(guān)。
圖5 通過不同的變量篩選方法選擇的特征波長(zhǎng)Fig.5 Characteristic wavelength variables selected by different variable selection methods
為獲取較優(yōu)模型以實(shí)現(xiàn)綠茶殺青過程中含水率的定量預(yù)測(cè),對(duì)原始光譜進(jìn)行預(yù)處理后,基于不同特征波長(zhǎng)篩選方法優(yōu)選出特征波長(zhǎng),然后結(jié)合PCA建立SVR非線性預(yù)測(cè)模型,并與線性的PLSR模型相比較。表3列出了基于近紅外光譜數(shù)據(jù)和顏色特征數(shù)據(jù)預(yù)測(cè)綠茶殺青過程中水分含量的模型性能指標(biāo)。
表3 基于光譜和圖像信息的模型性能指標(biāo)Table 3 Performance of models based on spectral or image information
對(duì)比線性的PLSR模型結(jié)果可知,全光譜-PLSR模型的為0.938 5,為0.907 1,RPD為2.180 4,表明模型的預(yù)測(cè)效果較好。通過不同特征波長(zhǎng)篩選方法所建立的模型效果均優(yōu)于基于全光譜所建立的模型性能,因?yàn)樵诤Y選特征波長(zhǎng)過程中剔除了很多冗余和無關(guān)的信息變量,其中基于VCPA-IRIV算法所建立的模型效果最優(yōu),為0.955 0,RMSECV為0.010 2,為0.942 2,RMSEP為0.010 3,RPD為2.795 6,并且變量從750 個(gè)減少至33 個(gè),變量壓縮率為95.6%,既提高了模型的預(yù)測(cè)精度,也降低了模型的運(yùn)算時(shí)間?;谏珴珊图y理所建立的模型效果要低于基于近紅外光譜數(shù)據(jù)所建立的模型效果,其中為0.932 6,為0.901 8,RPD為2.136 5。
對(duì)比非線性的SVR模型結(jié)果可知,全光譜-SVR校正集為0.942 3,為0.921 2,RPD為2.353 5,模型的預(yù)測(cè)性能較全光譜-PLSR模型性能有所提高。分析比較CARS-SVR、VCPA-SVR、VCPA-IRIV-SVR、RF-SVR四種模型結(jié)果可知,基于VCPA-IRIV算法所建立的模型效果做好,其為0.972 7,RMSECV為0.008 7,為0.954 5,RMSEP為0.009 8,RPD為2.950 6。基于顏特征所建立的SVR模型效果顯著優(yōu)于所建立的PLSR模型效果,但是相比基于光譜數(shù)據(jù)所建立的模型效果較差。其中SVR算法由Matlab平臺(tái)下Li-SVMLAB工具箱創(chuàng)建,選用RBF為核函數(shù),以PCA后的PC數(shù)據(jù)為輸入,水分含量為輸出。因懲罰因子()和核函數(shù)參數(shù)()對(duì)模型影響較大,故采用交叉驗(yàn)證函數(shù)tunelsssvm進(jìn)行參數(shù)優(yōu)化。
基于近紅外光譜數(shù)據(jù)所建立的模型效果相比圖像數(shù)據(jù)實(shí)現(xiàn)了更好的預(yù)測(cè)精度,具有更高的、和RPD,以及更低的RMSECV和RMSEP。導(dǎo)致這一結(jié)果的原因可能是機(jī)器視覺可以直接捕獲顏色相關(guān)成分信息,但是這是一種間接的測(cè)定,有些成分并不能完全捕獲,相比之下,近紅外光譜對(duì)OH基團(tuán)、NH基團(tuán)和CH基團(tuán)具有很好的響應(yīng),可以很好地捕獲綠茶加工過程中的成分變化。
如表4所示,基于數(shù)據(jù)級(jí)數(shù)據(jù)融合所建立的PLSR和SVR模型獲得了較好的模型效果,其中所建立的SVR模型精度較高,其值為0.955 0,為0.902 6,RPD值為1.857 3。然而這種預(yù)測(cè)效果是不可采用的,因?yàn)槭褂脝蝹€(gè)傳感器獲得的模型取得了更高的預(yù)測(cè)精度。與基于數(shù)據(jù)級(jí)數(shù)據(jù)融合所建立的PLSR和SVR模型效果相比,基于光譜數(shù)據(jù)的所建立的模型具有更好的、以及RPD值。這些結(jié)果表明,不合理的數(shù)據(jù)融合并不能有效提高預(yù)測(cè)精度。相比之下,基于特征級(jí)數(shù)據(jù)融合所建立的PLSR和SVR模型獲得了更好的預(yù)測(cè)精度,具有更高的、和RPD值以及更低的RMSECV和RMSEP。其中基于CARS算法提取的特征波長(zhǎng)融合15 個(gè)顏色特征所建立的SVR模型效果最優(yōu),為0.974 2,為0.971 9,RMSEP為0.007 9,RPD為4.154 6,不僅減少了建模的輸入變量,還提高了模型的預(yù)測(cè)精度,預(yù)測(cè)值和實(shí)測(cè)值的關(guān)系如圖6所示。其中根據(jù)水分測(cè)定儀測(cè)得殺青葉含水率方差在1%的量級(jí),模型所獲得的RMSEP分布在0.7%~1.2%,而RMSEP本身就是指誤差值,因此模型預(yù)測(cè)結(jié)果滿足水分測(cè)定儀測(cè)定結(jié)果??傮w而言,通過近紅外光譜和機(jī)器視覺的有效結(jié)合,實(shí)現(xiàn)了對(duì)綠茶加工過程中水分含量的準(zhǔn)確預(yù)測(cè),為低成本、快速、有效的綠茶質(zhì)量評(píng)估提供了手段。
表4 基于數(shù)據(jù)融合的模型性能指標(biāo)Table 4 Performance of models based on data fusion
圖6 基于SVR的模型優(yōu)化Fig.6 Model optimization based on SVR
本研究證明了融合近紅外光譜和機(jī)器視覺檢測(cè)綠茶殺青在制品水分含量的可行性,通過采用數(shù)據(jù)級(jí)和特征級(jí)數(shù)據(jù)融合方式,并建立PLSR和SVR模型進(jìn)行比較。結(jié)果表明,基于單一傳感器數(shù)據(jù)所建立的模型效果優(yōu)于數(shù)據(jù)級(jí)數(shù)據(jù)融合所建立的模型效果,表明無效的數(shù)據(jù)融合并不能提高模型的預(yù)測(cè)效果。相比之下,基于特征級(jí)數(shù)據(jù)融合所建立的模型效果明顯優(yōu)于單一傳感器和低級(jí)數(shù)據(jù)融合所建立的模型效果。其中基于CARS算法提取光譜特征波長(zhǎng)融合圖像的15 個(gè)顏色特征,然后采用歸一化和PCA所建立的SVR模型效果最優(yōu),其中為0.974 2,值為0.971 9,RPD為4.154 6,且RMSEC和RMSEP差值僅為0.004。因此,本研究證明了融合光譜和成像系統(tǒng)對(duì)綠茶加工過程中水分含量的預(yù)測(cè)能力,克服了單一傳感信息預(yù)測(cè)能力不足的問題。