• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于卷積神經(jīng)網(wǎng)絡(luò)和近紅外光譜的茶葉品種和等級(jí)鑒別

      2022-11-24 08:28:36陽(yáng),俊,燕,鑫,春,玲*
      分析科學(xué)學(xué)報(bào) 2022年5期
      關(guān)鍵詞:特征提取波長(zhǎng)光譜

      圣 陽(yáng), 焦 俊, 滕 燕, 馬 鑫, 李 春, 蔣 玲*

      (南京林業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院,江蘇南京 210037)

      茶葉不僅具有很高的經(jīng)濟(jì)價(jià)值,而且茶葉中富含茶多酚、氨基酸、咖啡堿等物質(zhì)[1],有益人體健康,深受消費(fèi)者的喜愛(ài)。不同品種和等級(jí)的茶葉在價(jià)格上相差巨大,市場(chǎng)上茶葉銷售以假亂真、以次充好的現(xiàn)象時(shí)有發(fā)生[2]。感官評(píng)審法通過(guò)對(duì)茶葉外形、湯色、香氣、滋味等方面對(duì)茶葉品種和等級(jí)進(jìn)行鑒別[3],但是這種方法主觀因素影響大,缺乏準(zhǔn)確性。理化方法主要用于茶葉內(nèi)部成分的檢測(cè)[4],主要有氣相色譜[5]、液相色譜[6]等方法。這些理化方法不僅檢測(cè)成本高,而且測(cè)試周期長(zhǎng)、操作復(fù)雜、專業(yè)性要求高,所以急需對(duì)茶葉品質(zhì)實(shí)現(xiàn)快速、無(wú)損、低成本檢測(cè)[7]。

      近紅外光譜(Near Infrared Spectroscopy,NIRS),波長(zhǎng)范圍在780~2 500 nm[8],可以用于含氫基團(tuán)物質(zhì)的定性定量檢測(cè),具有快速、無(wú)損、簡(jiǎn)單的特點(diǎn)[9]。目前已有學(xué)者將近紅外光譜應(yīng)用于茶葉檢測(cè)相關(guān)領(lǐng)域,實(shí)現(xiàn)對(duì)茶葉品種[10]、產(chǎn)地[11]、等級(jí)[12]和是否發(fā)生霉變[13]的鑒別。目前大多采用主成分分析法(Principal Component Analysis,PCA)進(jìn)行光譜特征提取,降低模型的復(fù)雜度,但PCA僅從數(shù)據(jù)方差最大的方向?qū)?shù)據(jù)進(jìn)行壓縮[14],沒(méi)有考慮到近紅外光譜的實(shí)際物理特征,降維后的數(shù)據(jù)丟失了光譜的原始信息,模型的可解釋性低。而聯(lián)合區(qū)間偏最小二乘法[15](synergy interval PLS,siPLS)、連續(xù)投影算法[16](Successive Projections Algorithm,SPA)、競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法[17](Competitive Adaptive Reweighting Algorithm,CARS)可以在保留原始光譜信息的基礎(chǔ)上,實(shí)現(xiàn)對(duì)光譜的特征提取,在實(shí)際應(yīng)用中可以僅對(duì)特征波長(zhǎng)附近的光譜數(shù)據(jù)進(jìn)行采集,提高檢測(cè)的效率。Ren等[18]采用PCA+SVM方法快速分析評(píng)價(jià)紅茶的品質(zhì),并區(qū)分紅茶產(chǎn)地,鑒別不同產(chǎn)地紅茶地理起源,準(zhǔn)確率達(dá)94.3%。Meng等[19]利用PCA+BP-ANN對(duì)福建三個(gè)品種的茶葉樣品進(jìn)行鑒別,識(shí)別準(zhǔn)確率達(dá)到95.6%。

      卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)具備局部感知,權(quán)值共享的特點(diǎn)[20],模型的運(yùn)行效率較高,從而被廣泛應(yīng)用在計(jì)算機(jī)視覺(jué),自然語(yǔ)言處理,語(yǔ)音識(shí)別等領(lǐng)域。近年來(lái)有學(xué)者利用近紅外光譜與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合檢測(cè)夏威夷果[21]、煙葉[22]、花椒[23]等,對(duì)在茶葉品種和等級(jí)的鑒別還少有文獻(xiàn)報(bào)道。使用機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)模型通常需要大量的樣本數(shù)量保證模型的準(zhǔn)確性和穩(wěn)定性,而采集大量的光譜數(shù)據(jù)需要很高的成本,可采用數(shù)據(jù)增強(qiáng)的方式擴(kuò)充數(shù)據(jù)集。

      基于以上背景,本文對(duì)茶葉光譜數(shù)據(jù)進(jìn)行預(yù)處理,分別采用聯(lián)合區(qū)間偏最小二乘法(siPLS)、連續(xù)投影算法(SPA)、競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(CARS)選取光譜特征波長(zhǎng),對(duì)特征波長(zhǎng)數(shù)據(jù)建立基于CNN的茶葉品種和等級(jí)的鑒別模型,最后使用平移法、線性疊加法、添加噪聲法對(duì)光譜數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng),驗(yàn)證特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型的穩(wěn)定性。

      1 實(shí)驗(yàn)部分

      1.1 樣品收集與制備

      市售的5種茶葉分別是龍井、雨花茶、碧螺春、金駿眉和鐵觀音,分別制備30個(gè)樣本共計(jì)150個(gè)樣本。將市售的4個(gè)不同等級(jí)的龍井茶葉,分別制備30個(gè)樣本,共計(jì)120個(gè)樣本。所有樣本低溫避光儲(chǔ)藏,具體信息如表1所示。實(shí)驗(yàn)前,將不同品種和等級(jí)的茶葉樣品粉碎成粉末,并通過(guò)100目篩后,取茶葉粉末2 g壓片制成樣品。

      表1 5個(gè)品種和4個(gè)等級(jí)茶葉樣品信息Table 1 Sample information of five varieties and four grades of tea

      1.2 近紅外光譜采集

      實(shí)驗(yàn)使用美國(guó)PerkinElmer Lambda 950紫外-可見(jiàn)近紅外分光光度計(jì),對(duì)壓片樣品進(jìn)行漫反射光譜掃描,波長(zhǎng)范圍800~2 500 nm,設(shè)置間隔為1 nm,每個(gè)樣品進(jìn)行3次光譜采集,取3次采集光譜的均值作為該樣品的光譜。維持室溫在25 ℃左右,相對(duì)濕度保持在45%~50%,測(cè)試前儀器預(yù)熱3 min以保證儀器的穩(wěn)定性。

      1.3 光譜預(yù)處理

      由于檢測(cè)器檢測(cè)到的光譜信號(hào)不僅包含樣品信息,還有各種儀器干擾信息,這些干擾信息會(huì)影響所建立模型穩(wěn)定性和可靠性,因此有必要在數(shù)據(jù)處理前對(duì)采集的光譜數(shù)據(jù)進(jìn)行合理的處理[24],從而減弱甚至消除非目標(biāo)因素對(duì)光譜信息的影響。本文用小波分析(WT)算法對(duì)光譜數(shù)據(jù)進(jìn)行平滑去噪預(yù)處理。

      1.4 特征波長(zhǎng)選擇

      1.4.1 siPLSsiPLS是一種常用的特征變量篩選方法,是聯(lián)合同一次區(qū)間劃分后的子區(qū)間建立的PLS模型,最終篩選出精度較高的特征變量。為了得到最佳的篩選結(jié)果,需要對(duì)子區(qū)間的劃分?jǐn)?shù)及聯(lián)合區(qū)間數(shù)進(jìn)行優(yōu)化,以交互驗(yàn)證均方根誤差(Root Mean Square Error of Cross Validation,RMSECV)為評(píng)判標(biāo)準(zhǔn),Bias是檢驗(yàn)樣品的預(yù)測(cè)值與真實(shí)值之間的整體平均偏差。

      1.4.2 SPASPA是一種使矢量空間共線性最小化的前向變量選擇算法,在有效信息獲取和降低共線信息的研究中取得了較好的效果。通過(guò)投影方式選取線性關(guān)系最小的波長(zhǎng)組合,從光譜信息中尋找含有最低冗余信息的變量組,使得變量之間的共線性達(dá)到最小,同時(shí)保留原始數(shù)據(jù)的絕大部分特征,被選取的特征波長(zhǎng)物理意義明確,具有很強(qiáng)的解釋能力,因此,可以有效地提高建模的速度以及模型的穩(wěn)定性。

      1.4.3 CARSCARS算法利用自適應(yīng)重加權(quán)采樣手段選出PLS模型中回歸系數(shù)絕對(duì)值相對(duì)較大的波長(zhǎng)點(diǎn),去除權(quán)重相對(duì)較小的波長(zhǎng)點(diǎn),并使用RMSECV值最低的子集,可以有效地尋找到變量的最優(yōu)組合。

      1.5 模型的方法及評(píng)價(jià)指標(biāo)

      1.5.1 CNNCNN是深度學(xué)習(xí)中最經(jīng)典的模型之一,它巧妙的減少了參數(shù)數(shù)量并且達(dá)到了全連接神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)不了的效果。CNN的基本結(jié)構(gòu)通常由卷積層、池化層和全連接層三個(gè)部分組成,具體細(xì)節(jié)又可以分為濾波器、步長(zhǎng)、卷積操作和池化操作等。由于近紅外光譜是一維信號(hào),因此采用的卷積核為一維卷積核。池化是一種非線性的降采樣方法,主要是對(duì)卷積層輸出的特征值進(jìn)行降維,減少運(yùn)算規(guī)模。目前,池化方式主要分為最大值池化和平均值池化兩種方式,本工作則采用最大池化法對(duì)模型進(jìn)行降采樣處理。為了防止過(guò)擬合現(xiàn)象,本模型選擇交叉熵函數(shù)(Cross-entropy)與模型權(quán)重系數(shù)L2正則化的結(jié)合作為模型的損失函數(shù)(Loss function)。

      (1)

      其中

      (2)

      式中,zi為第i個(gè)節(jié)點(diǎn)的輸出值;C為輸出節(jié)點(diǎn)的個(gè)數(shù),即分類的類別個(gè)數(shù);p(i)是輸出的概率值;W為模型權(quán)重;λ為正則化參數(shù)。

      1.5.2 模型評(píng)價(jià)指標(biāo)本研究將識(shí)別準(zhǔn)確率(Accuracy)作為茶葉品種和等級(jí)鑒別模型的判別指標(biāo)。

      (3)

      其中,Ncorrect為測(cè)試集中預(yù)測(cè)正確的數(shù)量;Ntotal為測(cè)試集樣本總數(shù)量。

      2 結(jié)果與討論

      2.1 光譜分析

      用小波函數(shù)Daubechies的正交小波基Db3進(jìn)行光譜信號(hào)去噪,其中分解尺度為4。圖1為隨機(jī)選取某一樣本處理前后的光譜,從中可以看出平滑去噪效果明顯。

      圖1 隨機(jī)選取樣本的原始光譜和小波變換處理后的光譜Fig.1 Original spectrum of randomly selected samples and the spectrum after wavelet transform

      圖2(a)和(b)分別為5個(gè)不同茶葉品種和4個(gè)不同龍井茶等級(jí)經(jīng)預(yù)處理后的近紅外光譜??梢钥闯霾煌贩N和等級(jí)的茶葉光譜變化趨勢(shì)相似,如在1 400~1 500 nm,1 900~2 000 nm,2 200~2 400 nm范圍內(nèi)有強(qiáng)度不同的吸收峰,由吸收峰的位置結(jié)合茶葉化學(xué)組分分析,以上吸收峰依次為氨基酸(R-NH),茶多酚(=C-H),咖啡堿(-OH)類化合物。不同品種和等級(jí)茶葉的茶多酚、氨基酸和咖啡堿等物質(zhì)成分的含量有差異,這些差異是應(yīng)用近紅外光譜實(shí)現(xiàn)茶葉品種和等級(jí)快速檢測(cè)的光譜信息基礎(chǔ)。要進(jìn)一步找到與茶葉更為密切的特征波長(zhǎng),需要利用化學(xué)計(jì)量學(xué)方法對(duì)隱含特征波長(zhǎng)進(jìn)一步挖掘[25]。

      圖2 5種茶葉預(yù)處理后的平均光譜(a)和4個(gè)等級(jí)龍井茶葉預(yù)處理后的平均光譜(b) Fig.2 Average spectra of 5 kinds of tea after pretreatment(a) and average spectra of 4 grades of Longjing tea after pretreatment(b)

      2.2 特征波長(zhǎng)選擇

      2.2.1 siPLS特征波長(zhǎng)選擇以5種茶葉光譜數(shù)據(jù)為例,4:1劃分訓(xùn)練集和測(cè)試集,經(jīng)反復(fù)比較,當(dāng)劃分區(qū)間數(shù)為20,聯(lián)合區(qū)間數(shù)為4,對(duì)應(yīng)選取的子區(qū)間的波數(shù)范圍為1 215~1 300 nm,1 500~1 585 nm,1 800~1 885 nm,2 200~2 285 nm波長(zhǎng)區(qū)間,一共340個(gè)波長(zhǎng)變量,最優(yōu)波長(zhǎng)區(qū)間如圖3(a)所示。此時(shí)測(cè)試集的RMSECV最小為0.0435,相關(guān)系數(shù)r為0.9992,如圖3(b)所示。

      圖3 siPLS選取的最優(yōu)子區(qū)間(a)和相關(guān)系數(shù)及誤差(b) Fig.3 Optimal subinterval(a) and correlation coefficient and error(b) selected by siPLS

      2.2.2 SPA特征波長(zhǎng)選擇SPA在選取截取后的訓(xùn)練集光譜數(shù)據(jù)的特征波長(zhǎng)點(diǎn)時(shí),利用均方根誤差(Root Mean Square Error,RMSE)最小化原則選出均方根誤差的導(dǎo)數(shù)變小的過(guò)渡點(diǎn),在過(guò)渡點(diǎn)之前冗余信息被剔除。由圖4(a)可知最后選取的特征波長(zhǎng)數(shù)為15個(gè),RMSE為0.0634。圖4(b)為選取的15個(gè)特征波長(zhǎng),依次為912、1 186、1 506、1 621、1 734、1 877、1 902、1 937、2 024、2 185、2 216、2 327、2 376、2 409、2 452 nm,這些波長(zhǎng)基本都在茶葉光譜的吸收峰附近。

      圖4 SPA特征波長(zhǎng)選取個(gè)數(shù)(a)和選取的特征波長(zhǎng)(b)Fig.4 Number of SPA characteristic wavelengths selected(a) and selected characteristic wavelengths(b)

      2.2.3 CARS特征波長(zhǎng)選擇對(duì)預(yù)處理后的訓(xùn)練集光譜數(shù)據(jù)使用CARS進(jìn)行特征波長(zhǎng)選擇,經(jīng)反復(fù)嘗試,本實(shí)驗(yàn)將蒙特卡羅采樣次數(shù)設(shè)定為50,采用5折交叉驗(yàn)證。由圖5(a)可知,隨著取樣運(yùn)行次數(shù)的增加,選取變量的數(shù)量逐步遞減。由圖5(b)可知,RMSECV值先緩慢遞減后遞增。RMSECV值遞減,說(shuō)明種茶葉光譜數(shù)據(jù)中部分無(wú)用的信息被剔除,RMSECV值遞增,說(shuō)明茶葉光譜數(shù)據(jù)中有部分重要信息被剔除。當(dāng)RMSECV值達(dá)到最小時(shí),各變量的回歸系數(shù)如圖5(c)中豎線處,此時(shí)的采樣運(yùn)行次數(shù)是17,RMSECV=0.014,CARS提取的最優(yōu)波長(zhǎng)點(diǎn)數(shù)量為19。所選取的特征波長(zhǎng)依次為891、972、1 190、1 233、1 421、1 463、1 537、1 549、1 635、1 689、1 735、1 748、1 901、1 967、1 973、2 004、2 112、2 134、2 219 nm。

      圖5 CARS特征波長(zhǎng)選取取樣變量數(shù)(a)、RMSECV(b)和回歸系數(shù)路徑(c) Fig.5 CARS characteristic wavelength selection sampling variable number(a),RMSECV(b) and regression coefficient path(c)

      2.3 基于CNN的茶葉品種和等級(jí)鑒別

      2.3.1 CNN搭建在建模之前先對(duì)光譜數(shù)據(jù)集進(jìn)行劃分,按照4∶1劃分訓(xùn)練集和測(cè)試集,并采用5折交叉驗(yàn)證,輸出為模型的平均正確率。CNN通常由卷積層(Convolutional layer)、池化層(Pooling layers)與全連層(Fully connected layers,F(xiàn)C)等構(gòu)成。卷積層用于提取特征,池化層可以減小卷積層提取的特征維數(shù),從而加速神經(jīng)網(wǎng)絡(luò)收斂,全連接層可將網(wǎng)絡(luò)前端輸出的特征還原給輸出層,最后由輸出層輸出分類結(jié)果。對(duì)特征波長(zhǎng)選取后的光譜數(shù)據(jù),搭建了5層的卷積神經(jīng)網(wǎng)絡(luò),包括了3個(gè)卷積層和2個(gè)全連接層,具體實(shí)現(xiàn)過(guò)程如圖6所示,卷積層均使用大小為1×3×1的卷積核(kernel),步長(zhǎng)(stride)設(shè)置為1,池化方式采用最大池化(Max Pooling,MP),卷積層的卷積核數(shù)量(kernel number)分別為32、64和128,將卷積運(yùn)算后的光譜數(shù)據(jù)輸入到全連接層,兩個(gè)全連接層的神經(jīng)元個(gè)數(shù)分別為256和512個(gè)(以siPLS提取的茶葉特征波長(zhǎng)數(shù)據(jù)為例,SPA和CARS結(jié)構(gòu)與之相同)。

      圖6 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.6 Convolution neural network structure diagram

      2.3.2 CNN訓(xùn)練與測(cè)試CNN的訓(xùn)練和優(yōu)化依賴于損失函數(shù),損失函數(shù)計(jì)算預(yù)測(cè)值和真實(shí)值之間的誤差,通過(guò)反向傳播算法將誤差從最后一層反向傳播至網(wǎng)絡(luò)各層并更新權(quán)值。更新后的參數(shù)繼續(xù)參與訓(xùn)練,循環(huán)往復(fù),直到損失函數(shù)值達(dá)到最小,即達(dá)到了最終訓(xùn)練的目的。損失函數(shù)下降采用Adam優(yōu)化器[26],選擇訓(xùn)練過(guò)程中最佳梯度下降方向,可加速模型的收斂。學(xué)習(xí)率(learning-rate)初始化為0.01,dropout設(shè)置為0.5,迭代次數(shù)設(shè)置為500后開(kāi)始訓(xùn)練。如果測(cè)試集損失值相比上一個(gè)訓(xùn)練周期沒(méi)有下降,則經(jīng)過(guò)50個(gè)周期后停止訓(xùn)練,以防止過(guò)擬合,不同模型在茶葉品種和等級(jí)鑒別的結(jié)果如圖7所示。

      圖7(a)、7(b)為全光譜結(jié)合卷積神經(jīng)網(wǎng)絡(luò)建模結(jié)果,訓(xùn)練集損失值(loss)和測(cè)試集損失值(val_loss)在訓(xùn)練過(guò)程中迅速下降,模型為過(guò)欠擬合狀態(tài),模型的準(zhǔn)確度較低。經(jīng)過(guò)特征波長(zhǎng)選取后,相比圖7(c)、7(d) 的siPLS+CNN模型和圖7(e)、7(f)的SPA+CNN模型,圖7(g)、7(h)的CARS+SPA模型測(cè)試集精度更高,模型訓(xùn)練效果更好。

      圖7 全光譜品種鑒別結(jié)果(a)、全光譜等級(jí)鑒別結(jié)果(b)、siPLS+CNN品種鑒別結(jié)果(c)、siPLS+CNN等級(jí)鑒別結(jié)果(d)、SPA+CNN品種鑒別結(jié)果(e)、SPA+CNN等級(jí)鑒別結(jié)果(f)、CARS+CNN品種鑒別結(jié)果(g)、CARS+CNN等級(jí)鑒別結(jié)果(h)Fig.7 Full spectra variety identification results(a),full spectra grade identification results(b),siPLS+CNN variety identification results(c),siPLS+CNN grade identification results(d),SPA+CNN variety identification results(e),SPA+ CNN grade identification results(f),CARS+CNN variety identification results(g),CARS+CNN grade identification results(h)

      表2為采用不同特征提取方法結(jié)合CNN模型對(duì)5種茶葉和4個(gè)茶葉等級(jí)分類檢測(cè)的結(jié)果,在全光譜范圍類,卷積神經(jīng)網(wǎng)絡(luò)模型在茶葉品種和等級(jí)鑒別的精度僅有66.7%和75%,這是由于全光譜中含有許多無(wú)用信息且變量數(shù)過(guò)多。經(jīng)過(guò)特征波長(zhǎng)提取后的光譜數(shù)據(jù)再結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型,在茶葉品種和等級(jí)的鑒別上可以實(shí)現(xiàn)更好的檢測(cè)精度,其中siPLS+CNN對(duì)品種和等級(jí)區(qū)分分別達(dá)到了91.67%和93.33%的準(zhǔn)確率,SPA+CNN提高到95.83%和96.67%的準(zhǔn)確率,CARS+CNN將準(zhǔn)確率進(jìn)一步提升到97.72%和98.67%。

      表2 特征提取及卷積神經(jīng)網(wǎng)絡(luò)建模結(jié)果Table 2 Results of feature extraction and convolution neural network modeling

      表3為特征提取結(jié)合支持向量機(jī)(Support vector machine,SVM)、K近鄰(K-nearest neighbor,KNN)、極端梯度提升(Extreme gradient boosting,Xgboost)、隨機(jī)森林(Random Forest,RF)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)模型在茶葉品種和等級(jí)的鑒別結(jié)果(僅列舉CARS特征提取方法),模型參數(shù)均已調(diào)到最優(yōu),其中CARS+Xgboost模型表現(xiàn)最好,在品種和等級(jí)鑒別分別實(shí)現(xiàn)91.56%和93.33%的正確率,但和特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)果仍有差距。

      表3 特征提取結(jié)合其他分類模型結(jié)果Table 3 Results of feature extraction combined with other classification models

      2.3.3 模型穩(wěn)定性驗(yàn)證針對(duì)機(jī)器學(xué)習(xí)模型所需樣本量大的問(wèn)題,本文采用平移法、添加噪聲法和線性疊加法三種數(shù)據(jù)增強(qiáng)的方法對(duì)原始的光譜數(shù)據(jù)進(jìn)行擴(kuò)充。圖8為隨機(jī)選取的鐵觀音茶葉原始光譜通過(guò)不同方法的數(shù)據(jù)增強(qiáng)結(jié)果,圖8(a)為平移法生成的光譜數(shù)據(jù),將原始光譜的橫坐標(biāo)隨機(jī)左右移動(dòng)1~5 nm實(shí)現(xiàn)。圖8(b)為通過(guò)線性疊加法生成光譜數(shù)據(jù),將兩個(gè)隨機(jī)樣本光譜數(shù)據(jù)求和之后再除以比例生成。圖8(c)為添加噪聲法生成的光譜數(shù)據(jù),通過(guò)添加1~20 dB的高斯白噪聲得到。

      圖8 平移法(a)、線性疊加法(b)和添加噪聲法(c)Fig.8 Translation method(a),linear superposition method(b) and noise addition method(c)

      利用以上3種方法將原始光譜5個(gè)不同品種和4個(gè)等級(jí)的茶葉各擴(kuò)充500個(gè)光譜數(shù)據(jù),將增強(qiáng)的光譜數(shù)據(jù)和原始光譜數(shù)據(jù)混合建模,按照4∶1的比例劃分訓(xùn)練集和測(cè)試集,采用5折交叉驗(yàn)證,CARS+CNN模型的分類結(jié)果如表4所示(僅列舉CARS+CNN模型結(jié)果)。CARS+CNN模型在原始光譜的茶葉品種和等級(jí)的鑒別準(zhǔn)確率為97.72%和98.67%,通過(guò)表4的結(jié)果可知,擴(kuò)充后的數(shù)據(jù)集在CARS+CNN的建模結(jié)果和原始光譜結(jié)果非常接近,平移法和線性疊加法對(duì)模型的精度略有提升,而添加噪聲法使模型精度略有下降??傊珻ARS+CNN模型在三種不同數(shù)據(jù)增強(qiáng)方法擴(kuò)充的數(shù)據(jù)集都實(shí)現(xiàn)了和原始光譜建模相近的結(jié)果,說(shuō)明了原始光譜建立的CARS+CNN模型具有很好的穩(wěn)定性。

      表4 數(shù)據(jù)增強(qiáng)的卷積神經(jīng)網(wǎng)絡(luò)建模結(jié)果Table 4 Data-enhanced convolutional neural network modeling results

      3 結(jié)論

      本文利用近紅外光譜技術(shù),通過(guò)對(duì)光譜數(shù)據(jù)進(jìn)行特征提取,對(duì)選取后特征數(shù)據(jù)建立卷積神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了茶葉品種和等級(jí)的鑒別。其中SPA+CNN對(duì)茶葉品種和等級(jí)識(shí)別率分別達(dá)95.83%和96.67%,CARS+CNN對(duì)茶葉品種和等級(jí)識(shí)別率分別達(dá)97.72%和98.67%,為后續(xù)相應(yīng)裝置的研發(fā)提供了模型支持。同時(shí),特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型在茶葉品種和等級(jí)鑒別結(jié)果優(yōu)于傳統(tǒng)的分類模型。本文使用平移法、線性疊加法、添加噪聲法對(duì)光譜數(shù)據(jù)集進(jìn)行數(shù)據(jù)增強(qiáng),驗(yàn)證了特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型的穩(wěn)定性。因此,特征提取結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的方法,可以實(shí)現(xiàn)近紅外光譜茶葉品種和等級(jí)的高精度鑒別,為茶葉品種和等級(jí)的快速鑒別提供幫助,減少專業(yè)人員的感官評(píng)審工作量,可作為傳統(tǒng)化學(xué)檢測(cè)法的有效補(bǔ)充。

      猜你喜歡
      特征提取波長(zhǎng)光譜
      HPLC-PDA雙波長(zhǎng)法同時(shí)測(cè)定四季草片中沒(méi)食子酸和槲皮苷的含量
      基于三維Saab變換的高光譜圖像壓縮方法
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      雙波長(zhǎng)激光治療慢性牙周炎的療效觀察
      Bagging RCSP腦電特征提取算法
      日本研發(fā)出可完全覆蓋可見(jiàn)光波長(zhǎng)的LED光源
      星載近紅外高光譜CO2遙感進(jìn)展
      便攜式多用途光波波長(zhǎng)測(cè)量?jī)x
      基于MED和循環(huán)域解調(diào)的多故障特征提取
      苦味酸與牛血清蛋白相互作用的光譜研究
      湖南省| 城步| 沐川县| 海林市| 鸡西市| 罗甸县| 宿迁市| 韩城市| 上高县| 尼木县| 长兴县| 武隆县| 弥渡县| 日照市| 武夷山市| 综艺| 大理市| 峨眉山市| 靖安县| 阆中市| 新巴尔虎左旗| 额尔古纳市| 章丘市| 天全县| 德阳市| 蓬安县| 呼伦贝尔市| 汤原县| 颍上县| 元阳县| 孝昌县| 泽州县| 高平市| 玉树县| 宁城县| 清流县| 甘肃省| 河东区| 衡阳市| 桐庐县| 平定县|