基于卷積神經(jīng)網(wǎng)絡(luò)和近紅外光譜的茶葉品種和等級(jí)鑒別

2022-11-24 08:28:36圣陽(yáng)，焦俊，滕燕，馬鑫，李春，蔣玲*

分析科學(xué)學(xué)報(bào) 2022年5期

圣陽(yáng)，焦俊，滕燕，馬鑫，李春，蔣玲*

(南京林業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院，江蘇南京 210037)

茶葉不僅具有很高的經(jīng)濟(jì)價(jià)值，而且茶葉中富含茶多酚、氨基酸、咖啡堿等物質(zhì)[1]，有益人體健康，深受消費(fèi)者的喜愛(ài)。不同品種和等級(jí)的茶葉在價(jià)格上相差巨大，市場(chǎng)上茶葉銷售以假亂真、以次充好的現(xiàn)象時(shí)有發(fā)生[2]。感官評(píng)審法通過(guò)對(duì)茶葉外形、湯色、香氣、滋味等方面對(duì)茶葉品種和等級(jí)進(jìn)行鑒別[3]，但是這種方法主觀因素影響大，缺乏準(zhǔn)確性。理化方法主要用于茶葉內(nèi)部成分的檢測(cè)[4]，主要有氣相色譜[5]、液相色譜[6]等方法。這些理化方法不僅檢測(cè)成本高，而且測(cè)試周期長(zhǎng)、操作復(fù)雜、專業(yè)性要求高，所以急需對(duì)茶葉品質(zhì)實(shí)現(xiàn)快速、無(wú)損、低成本檢測(cè)[7]。

近紅外光譜(Near Infrared Spectroscopy，NIRS)，波長(zhǎng)范圍在780～2 500 nm[8]，可以用于含氫基團(tuán)物質(zhì)的定性定量檢測(cè)，具有快速、無(wú)損、簡(jiǎn)單的特點(diǎn)[9]。目前已有學(xué)者將近紅外光譜應(yīng)用于茶葉檢測(cè)相關(guān)領(lǐng)域，實(shí)現(xiàn)對(duì)茶葉品種[10]、產(chǎn)地[11]、等級(jí)[12]和是否發(fā)生霉變[13]的鑒別。目前大多采用主成分分析法(Principal Component Analysis，PCA)進(jìn)行光譜特征提取，降低模型的復(fù)雜度，但PCA僅從數(shù)據(jù)方差最大的方向?qū)?shù)據(jù)進(jìn)行壓縮[14]，沒(méi)有考慮到近紅外光譜的實(shí)際物理特征，降維后的數(shù)據(jù)丟失了光譜的原始信息，模型的可解釋性低。而聯(lián)合區(qū)間偏最小二乘法[15](synergy interval PLS，siPLS)、連續(xù)投影算法[16](Successive Projections Algorithm，SPA)、競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法[17](Competitive Adaptive Reweighting Algorithm，CARS)可以在保留原始光譜信息的基礎(chǔ)上，實(shí)現(xiàn)對(duì)光譜的特征提取，在實(shí)際應(yīng)用中可以僅對(duì)特征波長(zhǎng)附近的光譜數(shù)據(jù)進(jìn)行采集，提高檢測(cè)的效率。Ren等[18]采用PCA+SVM方法快速分析評(píng)價(jià)紅茶的品質(zhì)，并區(qū)分紅茶產(chǎn)地，鑒別不同產(chǎn)地紅茶地理起源，準(zhǔn)確率達(dá)94.3%。Meng等[19]利用PCA+BP-ANN對(duì)福建三個(gè)品種的茶葉樣品進(jìn)行鑒別，識(shí)別準(zhǔn)確率達(dá)到95.6%。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network，CNN)具備局部感知，權(quán)值共享的特點(diǎn)[20]，模型的運(yùn)行效率較高，從而被廣泛應(yīng)用在計(jì)算機(jī)視覺(jué)，自然語(yǔ)言處理，語(yǔ)音識(shí)別等領(lǐng)域。近年來(lái)有學(xué)者利用近紅外光譜與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合檢測(cè)夏威夷果[21]、煙葉[22]、花椒[23]等，對(duì)在茶葉品種和等級(jí)的鑒別還少有文獻(xiàn)報(bào)道。使用機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)模型通常需要大量的樣本數(shù)量保證模型的準(zhǔn)確性和穩(wěn)定性，而采集大量的光譜數(shù)據(jù)需要很高的成本，可采用數(shù)據(jù)增強(qiáng)的方式擴(kuò)充數(shù)據(jù)集。

基于以上背景，本文對(duì)茶葉光譜數(shù)據(jù)進(jìn)行預(yù)處理，分別采用聯(lián)合區(qū)間偏最小二乘法(siPLS)、連續(xù)投影算法(SPA)、競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(CARS)選取光譜特征波長(zhǎng)，對(duì)特征波長(zhǎng)數(shù)據(jù)建立基于CNN的茶葉品種和等級(jí)的鑒別模型，最后使用平移法、線性疊加法、添加噪聲法對(duì)光譜數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)，驗(yàn)證特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型的穩(wěn)定性。

1 實(shí)驗(yàn)部分

1.1 樣品收集與制備

市售的5種茶葉分別是龍井、雨花茶、碧螺春、金駿眉和鐵觀音，分別制備30個(gè)樣本共計(jì)150個(gè)樣本。將市售的4個(gè)不同等級(jí)的龍井茶葉，分別制備30個(gè)樣本，共計(jì)120個(gè)樣本。所有樣本低溫避光儲(chǔ)藏，具體信息如表1所示。實(shí)驗(yàn)前，將不同品種和等級(jí)的茶葉樣品粉碎成粉末，并通過(guò)100目篩后，取茶葉粉末2 g壓片制成樣品。

表1 5個(gè)品種和4個(gè)等級(jí)茶葉樣品信息Table 1 Sample information of five varieties and four grades of tea

1.2 近紅外光譜采集

實(shí)驗(yàn)使用美國(guó)PerkinElmer Lambda 950紫外-可見(jiàn)近紅外分光光度計(jì)，對(duì)壓片樣品進(jìn)行漫反射光譜掃描，波長(zhǎng)范圍800～2 500 nm，設(shè)置間隔為1 nm，每個(gè)樣品進(jìn)行3次光譜采集，取3次采集光譜的均值作為該樣品的光譜。維持室溫在25 ℃左右，相對(duì)濕度保持在45%～50%，測(cè)試前儀器預(yù)熱3 min以保證儀器的穩(wěn)定性。

1.3 光譜預(yù)處理

由于檢測(cè)器檢測(cè)到的光譜信號(hào)不僅包含樣品信息，還有各種儀器干擾信息，這些干擾信息會(huì)影響所建立模型穩(wěn)定性和可靠性，因此有必要在數(shù)據(jù)處理前對(duì)采集的光譜數(shù)據(jù)進(jìn)行合理的處理[24]，從而減弱甚至消除非目標(biāo)因素對(duì)光譜信息的影響。本文用小波分析(WT)算法對(duì)光譜數(shù)據(jù)進(jìn)行平滑去噪預(yù)處理。

1.4 特征波長(zhǎng)選擇

1.4.1 siPLSsiPLS是一種常用的特征變量篩選方法，是聯(lián)合同一次區(qū)間劃分后的子區(qū)間建立的PLS模型，最終篩選出精度較高的特征變量。為了得到最佳的篩選結(jié)果，需要對(duì)子區(qū)間的劃分?jǐn)?shù)及聯(lián)合區(qū)間數(shù)進(jìn)行優(yōu)化，以交互驗(yàn)證均方根誤差(Root Mean Square Error of Cross Validation，RMSECV)為評(píng)判標(biāo)準(zhǔn)，Bias是檢驗(yàn)樣品的預(yù)測(cè)值與真實(shí)值之間的整體平均偏差。

1.4.2 SPASPA是一種使矢量空間共線性最小化的前向變量選擇算法，在有效信息獲取和降低共線信息的研究中取得了較好的效果。通過(guò)投影方式選取線性關(guān)系最小的波長(zhǎng)組合，從光譜信息中尋找含有最低冗余信息的變量組，使得變量之間的共線性達(dá)到最小，同時(shí)保留原始數(shù)據(jù)的絕大部分特征，被選取的特征波長(zhǎng)物理意義明確，具有很強(qiáng)的解釋能力，因此，可以有效地提高建模的速度以及模型的穩(wěn)定性。

1.4.3 CARSCARS算法利用自適應(yīng)重加權(quán)采樣手段選出PLS模型中回歸系數(shù)絕對(duì)值相對(duì)較大的波長(zhǎng)點(diǎn)，去除權(quán)重相對(duì)較小的波長(zhǎng)點(diǎn)，并使用RMSECV值最低的子集，可以有效地尋找到變量的最優(yōu)組合。

1.5 模型的方法及評(píng)價(jià)指標(biāo)

1.5.1 CNNCNN是深度學(xué)習(xí)中最經(jīng)典的模型之一，它巧妙的減少了參數(shù)數(shù)量并且達(dá)到了全連接神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)不了的效果。CNN的基本結(jié)構(gòu)通常由卷積層、池化層和全連接層三個(gè)部分組成，具體細(xì)節(jié)又可以分為濾波器、步長(zhǎng)、卷積操作和池化操作等。由于近紅外光譜是一維信號(hào)，因此采用的卷積核為一維卷積核。池化是一種非線性的降采樣方法，主要是對(duì)卷積層輸出的特征值進(jìn)行降維，減少運(yùn)算規(guī)模。目前，池化方式主要分為最大值池化和平均值池化兩種方式，本工作則采用最大池化法對(duì)模型進(jìn)行降采樣處理。為了防止過(guò)擬合現(xiàn)象，本模型選擇交叉熵函數(shù)(Cross-entropy)與模型權(quán)重系數(shù)L2正則化的結(jié)合作為模型的損失函數(shù)(Loss function)。

(1)

其中

(2)

式中，zi為第i個(gè)節(jié)點(diǎn)的輸出值；C為輸出節(jié)點(diǎn)的個(gè)數(shù)，即分類的類別個(gè)數(shù)；p(i)是輸出的概率值；W為模型權(quán)重；λ為正則化參數(shù)。

1.5.2 模型評(píng)價(jià)指標(biāo)本研究將識(shí)別準(zhǔn)確率(Accuracy)作為茶葉品種和等級(jí)鑒別模型的判別指標(biāo)。

(3)

其中，Ncorrect為測(cè)試集中預(yù)測(cè)正確的數(shù)量；Ntotal為測(cè)試集樣本總數(shù)量。

2 結(jié)果與討論

2.1 光譜分析

用小波函數(shù)Daubechies的正交小波基Db3進(jìn)行光譜信號(hào)去噪，其中分解尺度為4。圖1為隨機(jī)選取某一樣本處理前后的光譜，從中可以看出平滑去噪效果明顯。

圖1 隨機(jī)選取樣本的原始光譜和小波變換處理后的光譜Fig.1 Original spectrum of randomly selected samples and the spectrum after wavelet transform

圖2(a)和(b)分別為5個(gè)不同茶葉品種和4個(gè)不同龍井茶等級(jí)經(jīng)預(yù)處理后的近紅外光譜?？梢钥闯霾煌贩N和等級(jí)的茶葉光譜變化趨勢(shì)相似，如在1 400～1 500 nm，1 900～2 000 nm，2 200～2 400 nm范圍內(nèi)有強(qiáng)度不同的吸收峰,由吸收峰的位置結(jié)合茶葉化學(xué)組分分析，以上吸收峰依次為氨基酸(R-NH),茶多酚(=C-H)，咖啡堿(-OH)類化合物。不同品種和等級(jí)茶葉的茶多酚、氨基酸和咖啡堿等物質(zhì)成分的含量有差異，這些差異是應(yīng)用近紅外光譜實(shí)現(xiàn)茶葉品種和等級(jí)快速檢測(cè)的光譜信息基礎(chǔ)。要進(jìn)一步找到與茶葉更為密切的特征波長(zhǎng)，需要利用化學(xué)計(jì)量學(xué)方法對(duì)隱含特征波長(zhǎng)進(jìn)一步挖掘[25]。

圖2 5種茶葉預(yù)處理后的平均光譜(a)和4個(gè)等級(jí)龍井茶葉預(yù)處理后的平均光譜(b) Fig.2 Average spectra of 5 kinds of tea after pretreatment(a) and average spectra of 4 grades of Longjing tea after pretreatment(b)

2.2 特征波長(zhǎng)選擇

2.2.1 siPLS特征波長(zhǎng)選擇以5種茶葉光譜數(shù)據(jù)為例，4:1劃分訓(xùn)練集和測(cè)試集，經(jīng)反復(fù)比較，當(dāng)劃分區(qū)間數(shù)為20，聯(lián)合區(qū)間數(shù)為4，對(duì)應(yīng)選取的子區(qū)間的波數(shù)范圍為1 215～1 300 nm，1 500～1 585 nm，1 800～1 885 nm，2 200～2 285 nm波長(zhǎng)區(qū)間,一共340個(gè)波長(zhǎng)變量,最優(yōu)波長(zhǎng)區(qū)間如圖3(a)所示。此時(shí)測(cè)試集的RMSECV最小為0.0435,相關(guān)系數(shù)r為0.9992，如圖3(b)所示。

圖3 siPLS選取的最優(yōu)子區(qū)間(a)和相關(guān)系數(shù)及誤差(b) Fig.3 Optimal subinterval(a) and correlation coefficient and error(b) selected by siPLS

2.2.2 SPA特征波長(zhǎng)選擇SPA在選取截取后的訓(xùn)練集光譜數(shù)據(jù)的特征波長(zhǎng)點(diǎn)時(shí)，利用均方根誤差(Root Mean Square Error，RMSE)最小化原則選出均方根誤差的導(dǎo)數(shù)變小的過(guò)渡點(diǎn)，在過(guò)渡點(diǎn)之前冗余信息被剔除。由圖4(a)可知最后選取的特征波長(zhǎng)數(shù)為15個(gè)，RMSE為0.0634。圖4(b)為選取的15個(gè)特征波長(zhǎng)，依次為912、1 186、1 506、1 621、1 734、1 877、1 902、1 937、2 024、2 185、2 216、2 327、2 376、2 409、2 452 nm，這些波長(zhǎng)基本都在茶葉光譜的吸收峰附近。

圖4 SPA特征波長(zhǎng)選取個(gè)數(shù)(a)和選取的特征波長(zhǎng)(b)Fig.4 Number of SPA characteristic wavelengths selected(a) and selected characteristic wavelengths(b)

2.2.3 CARS特征波長(zhǎng)選擇對(duì)預(yù)處理后的訓(xùn)練集光譜數(shù)據(jù)使用CARS進(jìn)行特征波長(zhǎng)選擇，經(jīng)反復(fù)嘗試，本實(shí)驗(yàn)將蒙特卡羅采樣次數(shù)設(shè)定為50，采用5折交叉驗(yàn)證。由圖5(a)可知，隨著取樣運(yùn)行次數(shù)的增加，選取變量的數(shù)量逐步遞減。由圖5(b)可知,RMSECV值先緩慢遞減后遞增。RMSECV值遞減，說(shuō)明種茶葉光譜數(shù)據(jù)中部分無(wú)用的信息被剔除，RMSECV值遞增，說(shuō)明茶葉光譜數(shù)據(jù)中有部分重要信息被剔除。當(dāng)RMSECV值達(dá)到最小時(shí)，各變量的回歸系數(shù)如圖5(c)中豎線處，此時(shí)的采樣運(yùn)行次數(shù)是17，RMSECV=0.014，CARS提取的最優(yōu)波長(zhǎng)點(diǎn)數(shù)量為19。所選取的特征波長(zhǎng)依次為891、972、1 190、1 233、1 421、1 463、1 537、1 549、1 635、1 689、1 735、1 748、1 901、1 967、1 973、2 004、2 112、2 134、2 219 nm。

圖5 CARS特征波長(zhǎng)選取取樣變量數(shù)(a)、RMSECV(b)和回歸系數(shù)路徑(c) Fig.5 CARS characteristic wavelength selection sampling variable number(a),RMSECV(b) and regression coefficient path(c)

2.3 基于CNN的茶葉品種和等級(jí)鑒別

2.3.1 CNN搭建在建模之前先對(duì)光譜數(shù)據(jù)集進(jìn)行劃分，按照4∶1劃分訓(xùn)練集和測(cè)試集，并采用5折交叉驗(yàn)證，輸出為模型的平均正確率。CNN通常由卷積層(Convolutional layer)、池化層(Pooling layers)與全連層(Fully connected layers，F(xiàn)C)等構(gòu)成。卷積層用于提取特征，池化層可以減小卷積層提取的特征維數(shù)，從而加速神經(jīng)網(wǎng)絡(luò)收斂,全連接層可將網(wǎng)絡(luò)前端輸出的特征還原給輸出層，最后由輸出層輸出分類結(jié)果。對(duì)特征波長(zhǎng)選取后的光譜數(shù)據(jù)，搭建了5層的卷積神經(jīng)網(wǎng)絡(luò)，包括了3個(gè)卷積層和2個(gè)全連接層，具體實(shí)現(xiàn)過(guò)程如圖6所示，卷積層均使用大小為1×3×1的卷積核(kernel)，步長(zhǎng)(stride)設(shè)置為1，池化方式采用最大池化(Max Pooling，MP)，卷積層的卷積核數(shù)量(kernel number)分別為32、64和128，將卷積運(yùn)算后的光譜數(shù)據(jù)輸入到全連接層,兩個(gè)全連接層的神經(jīng)元個(gè)數(shù)分別為256和512個(gè)(以siPLS提取的茶葉特征波長(zhǎng)數(shù)據(jù)為例，SPA和CARS結(jié)構(gòu)與之相同)。

圖6 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.6 Convolution neural network structure diagram

2.3.2 CNN訓(xùn)練與測(cè)試CNN的訓(xùn)練和優(yōu)化依賴于損失函數(shù)，損失函數(shù)計(jì)算預(yù)測(cè)值和真實(shí)值之間的誤差，通過(guò)反向傳播算法將誤差從最后一層反向傳播至網(wǎng)絡(luò)各層并更新權(quán)值。更新后的參數(shù)繼續(xù)參與訓(xùn)練，循環(huán)往復(fù),直到損失函數(shù)值達(dá)到最小，即達(dá)到了最終訓(xùn)練的目的。損失函數(shù)下降采用Adam優(yōu)化器[26]，選擇訓(xùn)練過(guò)程中最佳梯度下降方向，可加速模型的收斂。學(xué)習(xí)率(learning-rate)初始化為0.01，dropout設(shè)置為0.5，迭代次數(shù)設(shè)置為500后開(kāi)始訓(xùn)練。如果測(cè)試集損失值相比上一個(gè)訓(xùn)練周期沒(méi)有下降，則經(jīng)過(guò)50個(gè)周期后停止訓(xùn)練，以防止過(guò)擬合，不同模型在茶葉品種和等級(jí)鑒別的結(jié)果如圖7所示。

圖7(a)、7(b)為全光譜結(jié)合卷積神經(jīng)網(wǎng)絡(luò)建模結(jié)果，訓(xùn)練集損失值(loss)和測(cè)試集損失值(val_loss)在訓(xùn)練過(guò)程中迅速下降，模型為過(guò)欠擬合狀態(tài)，模型的準(zhǔn)確度較低。經(jīng)過(guò)特征波長(zhǎng)選取后，相比圖7(c)、7(d) 的siPLS+CNN模型和圖7(e)、7(f)的SPA+CNN模型，圖7(g)、7(h)的CARS+SPA模型測(cè)試集精度更高，模型訓(xùn)練效果更好。

圖7 全光譜品種鑒別結(jié)果(a)、全光譜等級(jí)鑒別結(jié)果(b)、siPLS+CNN品種鑒別結(jié)果(c)、siPLS+CNN等級(jí)鑒別結(jié)果(d)、SPA+CNN品種鑒別結(jié)果(e)、SPA+CNN等級(jí)鑒別結(jié)果(f)、CARS+CNN品種鑒別結(jié)果(g)、CARS+CNN等級(jí)鑒別結(jié)果(h)Fig.7 Full spectra variety identification results(a),full spectra grade identification results(b),siPLS+CNN variety identification results(c),siPLS+CNN grade identification results(d),SPA+CNN variety identification results(e),SPA+ CNN grade identification results(f),CARS+CNN variety identification results(g),CARS+CNN grade identification results(h)

表2為采用不同特征提取方法結(jié)合CNN模型對(duì)5種茶葉和4個(gè)茶葉等級(jí)分類檢測(cè)的結(jié)果,在全光譜范圍類，卷積神經(jīng)網(wǎng)絡(luò)模型在茶葉品種和等級(jí)鑒別的精度僅有66.7%和75%，這是由于全光譜中含有許多無(wú)用信息且變量數(shù)過(guò)多。經(jīng)過(guò)特征波長(zhǎng)提取后的光譜數(shù)據(jù)再結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型，在茶葉品種和等級(jí)的鑒別上可以實(shí)現(xiàn)更好的檢測(cè)精度，其中siPLS+CNN對(duì)品種和等級(jí)區(qū)分分別達(dá)到了91.67%和93.33%的準(zhǔn)確率，SPA+CNN提高到95.83%和96.67%的準(zhǔn)確率，CARS+CNN將準(zhǔn)確率進(jìn)一步提升到97.72%和98.67%。

表2 特征提取及卷積神經(jīng)網(wǎng)絡(luò)建模結(jié)果Table 2 Results of feature extraction and convolution neural network modeling

表3為特征提取結(jié)合支持向量機(jī)(Support vector machine，SVM)、K近鄰(K-nearest neighbor，KNN)、極端梯度提升(Extreme gradient boosting，Xgboost)、隨機(jī)森林(Random Forest，RF)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)模型在茶葉品種和等級(jí)的鑒別結(jié)果(僅列舉CARS特征提取方法)，模型參數(shù)均已調(diào)到最優(yōu)，其中CARS+Xgboost模型表現(xiàn)最好，在品種和等級(jí)鑒別分別實(shí)現(xiàn)91.56%和93.33%的正確率，但和特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)果仍有差距。

表3 特征提取結(jié)合其他分類模型結(jié)果Table 3 Results of feature extraction combined with other classification models

2.3.3 模型穩(wěn)定性驗(yàn)證針對(duì)機(jī)器學(xué)習(xí)模型所需樣本量大的問(wèn)題，本文采用平移法、添加噪聲法和線性疊加法三種數(shù)據(jù)增強(qiáng)的方法對(duì)原始的光譜數(shù)據(jù)進(jìn)行擴(kuò)充。圖8為隨機(jī)選取的鐵觀音茶葉原始光譜通過(guò)不同方法的數(shù)據(jù)增強(qiáng)結(jié)果,圖8(a)為平移法生成的光譜數(shù)據(jù)，將原始光譜的橫坐標(biāo)隨機(jī)左右移動(dòng)1～5 nm實(shí)現(xiàn)。圖8(b)為通過(guò)線性疊加法生成光譜數(shù)據(jù)，將兩個(gè)隨機(jī)樣本光譜數(shù)據(jù)求和之后再除以比例生成。圖8(c)為添加噪聲法生成的光譜數(shù)據(jù)，通過(guò)添加1～20 dB的高斯白噪聲得到。

圖8 平移法(a)、線性疊加法(b)和添加噪聲法(c)Fig.8 Translation method(a),linear superposition method(b) and noise addition method(c)

利用以上3種方法將原始光譜5個(gè)不同品種和4個(gè)等級(jí)的茶葉各擴(kuò)充500個(gè)光譜數(shù)據(jù)，將增強(qiáng)的光譜數(shù)據(jù)和原始光譜數(shù)據(jù)混合建模，按照4∶1的比例劃分訓(xùn)練集和測(cè)試集，采用5折交叉驗(yàn)證，CARS+CNN模型的分類結(jié)果如表4所示(僅列舉CARS+CNN模型結(jié)果)。CARS+CNN模型在原始光譜的茶葉品種和等級(jí)的鑒別準(zhǔn)確率為97.72%和98.67%，通過(guò)表4的結(jié)果可知，擴(kuò)充后的數(shù)據(jù)集在CARS+CNN的建模結(jié)果和原始光譜結(jié)果非常接近，平移法和線性疊加法對(duì)模型的精度略有提升，而添加噪聲法使模型精度略有下降?？傊珻ARS+CNN模型在三種不同數(shù)據(jù)增強(qiáng)方法擴(kuò)充的數(shù)據(jù)集都實(shí)現(xiàn)了和原始光譜建模相近的結(jié)果，說(shuō)明了原始光譜建立的CARS+CNN模型具有很好的穩(wěn)定性。

表4 數(shù)據(jù)增強(qiáng)的卷積神經(jīng)網(wǎng)絡(luò)建模結(jié)果Table 4 Data-enhanced convolutional neural network modeling results

3 結(jié)論

本文利用近紅外光譜技術(shù)，通過(guò)對(duì)光譜數(shù)據(jù)進(jìn)行特征提取，對(duì)選取后特征數(shù)據(jù)建立卷積神經(jīng)網(wǎng)絡(luò)模型，實(shí)現(xiàn)了茶葉品種和等級(jí)的鑒別。其中SPA+CNN對(duì)茶葉品種和等級(jí)識(shí)別率分別達(dá)95.83%和96.67%，CARS+CNN對(duì)茶葉品種和等級(jí)識(shí)別率分別達(dá)97.72%和98.67%，為后續(xù)相應(yīng)裝置的研發(fā)提供了模型支持。同時(shí)，特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型在茶葉品種和等級(jí)鑒別結(jié)果優(yōu)于傳統(tǒng)的分類模型。本文使用平移法、線性疊加法、添加噪聲法對(duì)光譜數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng)，驗(yàn)證了特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型的穩(wěn)定性。因此，特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的方法，可以實(shí)現(xiàn)近紅外光譜茶葉品種和等級(jí)的高精度鑒別，為茶葉品種和等級(jí)的快速鑒別提供幫助，減少專業(yè)人員的感官評(píng)審工作量，可作為傳統(tǒng)化學(xué)檢測(cè)法的有效補(bǔ)充。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看