• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      高光譜成像的非煙物質(zhì)分類識(shí)別研究

      2022-07-06 08:59:44李智慧梅吉帆李輝李嘉康盧敏瑞王芳張騰健堵勁松洪偉齡徐大勇
      中國(guó)煙草學(xué)報(bào) 2022年3期
      關(guān)鍵詞:煙葉波長(zhǎng)預(yù)處理

      李智慧,梅吉帆,李輝,李嘉康,盧敏瑞,王芳,張騰健,堵勁松,洪偉齡,徐大勇*

      高光譜成像的非煙物質(zhì)分類識(shí)別研究

      李智慧1,梅吉帆1,李輝1,李嘉康1,盧敏瑞2,王芳2,張騰健2,堵勁松1,洪偉齡3,徐大勇1*

      1 中國(guó)煙草總公司鄭州煙草研究院,河南鄭州市高新區(qū)楓楊街2號(hào) 450001;2 福建武夷煙葉有限公司,福建南平市邵武市紫金大道1號(hào) 354000;3 福建中煙工業(yè)有限公司技術(shù)中心,福建省廈門市集美區(qū)濱水路298號(hào) 361021

      【】利用高光譜成像技術(shù)和機(jī)器學(xué)習(xí)方法對(duì)煙葉中的非煙物質(zhì)進(jìn)行分類識(shí)別?!尽渴褂每梢?jiàn)—近紅外高光譜成像技術(shù),采用歸一化(Normalization)、標(biāo)準(zhǔn)正態(tài)變化(SNV)、多元散射校正(MSC)、一階導(dǎo)數(shù)(FD)、卷積平滑(SG)對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,通過(guò)連續(xù)投影變換(SPA)和主成分載荷(PCA loadings)進(jìn)行特征波長(zhǎng)選擇,并應(yīng)用隨機(jī)森林(RF)、Softmax和支持向量機(jī)(SVM)建立分類模型?!尽縎NV為最佳光譜預(yù)處理方法,SPA選擇特征波長(zhǎng)建立的SVM模型為最優(yōu)模型,訓(xùn)練集和測(cè)試集正確率分別為99.82%和99.47%?!尽扛吖庾V成像技術(shù)結(jié)合SPA-SVM模型可以有效分類識(shí)別煙葉中的非煙物質(zhì)。

      高光譜成像;非煙物質(zhì);連續(xù)投影算法;特征波長(zhǎng);支持向量機(jī);分類

      非煙物質(zhì)俗稱雜物,指煙葉中非煙草類物質(zhì)[1],通常在采收、烘烤、收購(gòu)等環(huán)節(jié)混入,影響煙葉原料的使用價(jià)值和卷煙產(chǎn)品質(zhì)量。其中,石頭、金屬、玻璃等非煙物質(zhì)會(huì)損壞加工設(shè)備、危害操作人員身體健康,塑料,橡膠,尼龍等化工制品類非煙物質(zhì)燃燒后產(chǎn)生有害氣體,嚴(yán)重影響消費(fèi)者身體健康[2-4]。目前,工業(yè)企業(yè)主要采用人工除雜、風(fēng)選除雜、金屬探測(cè)除雜和光電除雜等方法[5]去除生產(chǎn)中混入的非煙物質(zhì)。但上述除雜方法均存在不足,人工除雜工作量大、易疲勞、受限于操作人員技術(shù)熟練程度,風(fēng)選除雜和金屬探測(cè)除雜只能剔除與煙葉比重相差大、有磁性的非煙物質(zhì),光電除雜不易識(shí)別顏色和質(zhì)地與煙葉相似的非煙物質(zhì),如黃色紙板、其他植物葉子等[6-8]。因此,開(kāi)發(fā)一種能夠同時(shí)識(shí)別多種非煙物質(zhì)的在線檢測(cè)方法,具有重要的現(xiàn)實(shí)意義和應(yīng)用需求。

      高光譜成像技術(shù)是一種將圖像和光譜結(jié)合的測(cè)量技術(shù),以連續(xù)和窄帶光譜記錄目標(biāo)區(qū)域的發(fā)射或者反射輻射能量,包含了像素級(jí)分辨率的空間和光譜特征信息,廣泛應(yīng)用于遙感、農(nóng)業(yè)、食品安全、環(huán)境檢測(cè)等領(lǐng)域[9]。高光譜圖像包含了上百個(gè)波段地物特征光譜信息和空間圖像信息,構(gòu)成了高光譜圖像的三維數(shù)據(jù)立方。采用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法分析高光譜數(shù)據(jù)的光譜和圖像空間的特征信息可以有效地進(jìn)行地物識(shí)別和分類[10]。近年來(lái),高光譜成像技術(shù)已成功應(yīng)用到煙草病蟲(chóng)害監(jiān)測(cè)[11-13]、煙葉化學(xué)成分含量分析[14-18]等方面。王梅等[19]研究了不同病害程度煙葉的高光譜特征,建立了煙葉病害程度診斷模型。Frederico等[20]采用偏最小二乘方法分析煙葉近紅外高光譜數(shù)據(jù),建立了煙葉常規(guī)化學(xué)成分含量的模型,具有良好的精度。Marcelo等[21]利用近紅外高光譜成像技術(shù),利用支持向量機(jī)判別分析開(kāi)發(fā)了烤煙和白肋煙的分級(jí)系統(tǒng),實(shí)現(xiàn)了在線判定煙葉質(zhì)量。Luis Rodríguez-Cobo等[22]通過(guò)分析了煙葉中10種非煙物質(zhì)的高光譜數(shù)據(jù),建立了分層時(shí)間記憶范式的非煙物質(zhì)分類方法。Conde等[23]采用光譜成像技術(shù)和神經(jīng)網(wǎng)絡(luò)方法實(shí)現(xiàn)了對(duì)煙葉原料混入的雜物分類。以上研究結(jié)果表明,兼具光譜波段多、高空間分辨率特點(diǎn)的高光譜成像技術(shù)完全能夠?qū)崿F(xiàn)非煙物質(zhì)的分類和識(shí)別。

      目前,國(guó)內(nèi)采用高光譜成像技術(shù)進(jìn)行非煙物質(zhì)識(shí)別的應(yīng)用研究相對(duì)較少。工業(yè)企業(yè)在打葉復(fù)烤生產(chǎn)線、片煙切絲前仍存在其他除雜方法無(wú)法識(shí)別的小尺寸、理化性質(zhì)接近的非煙物質(zhì)。本研究確定了高光譜圖像數(shù)據(jù)最佳預(yù)處理方法,利用機(jī)器學(xué)習(xí)方法建立全光譜波段和特征波長(zhǎng)的非煙物質(zhì)分類模型,以識(shí)別工業(yè)生產(chǎn)中混入的非煙物質(zhì),提升煙葉純凈度,為開(kāi)發(fā)工業(yè)非煙物質(zhì)的儀器設(shè)備提供理論依據(jù)和數(shù)據(jù)支撐。

      1 材料與方法

      1.1 樣品

      供試煙葉和非煙物質(zhì)樣本均由福建武夷煙葉有限公司提供,煙葉品種為紅花大金元,等級(jí)為C3F。生產(chǎn)線常見(jiàn)且影響較大的5種非煙物質(zhì),分別為塑料匝繩、尼龍布、麻繩、紙片、植物葉子。非煙物質(zhì)樣本的尺寸約為3 cm×3 cm,去除表面污漬以保證采集的像元光譜接近其真實(shí)像元光譜。

      1.2 高光譜數(shù)據(jù)采集

      高光譜成像系統(tǒng)主要包含消色差鏡頭(HSIA- OLE23)可見(jiàn)—近紅外高光譜相機(jī)(GaiaField-V10E- AZ4)、電動(dòng)移動(dòng)平臺(tái)、4個(gè)50 W的鹵素?zé)?、SpecView圖像采集軟件和計(jì)算機(jī)等??梢?jiàn)-近紅外高光譜相機(jī)光譜采集范圍為362~1008 nm,光譜分辨率為2.6 nm,共計(jì)256個(gè)波段,采集參數(shù)通過(guò)SpecView軟件控制,設(shè)置相機(jī)曝光時(shí)間為11 ms,調(diào)節(jié)電動(dòng)移動(dòng)臺(tái)的推掃速度為1.35 cm/s。在暗箱系統(tǒng)環(huán)境下進(jìn)行整個(gè)高光譜數(shù)據(jù)的采集,并且采用4個(gè)50 W鹵素?zé)粽{(diào)節(jié)光源強(qiáng)度,避免圖像飽和度過(guò)高和外界環(huán)境干擾。高光譜數(shù)據(jù)采集后,需要對(duì)采集的高光譜數(shù)據(jù)進(jìn)行黑白板校正,以消除光照強(qiáng)度和相機(jī)暗電流帶來(lái)的噪聲影響。通過(guò)采集99%標(biāo)準(zhǔn)校正白板獲取白板標(biāo)定圖像,通過(guò)遮擋鏡頭獲取黑板標(biāo)定圖像,由公式(1)對(duì)采集的高光譜圖像進(jìn)行校正。

      其中,R為校正后的高光譜圖像,I為原始樣品高光譜圖像,B為黑板高光譜圖像,W為白板高光譜圖像。

      1.3 高光譜數(shù)據(jù)預(yù)處理

      獲取的高光譜圖像一共包含了256個(gè)維度的煙葉、非煙物質(zhì)和背景的圖譜信息。首先選擇高光譜圖像的感興趣區(qū)(Region Of Interest, ROI)光譜數(shù)據(jù)和對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,降低背景信息干擾和數(shù)據(jù)處理的復(fù)雜性。ROI的選取步驟為:(1)對(duì)比樣品區(qū)域和背景區(qū)域像素點(diǎn)的光譜值,發(fā)現(xiàn)751 nm波段圖像的背景與樣品光譜值差異最大,選取該波段圖像作為掩膜數(shù)據(jù),利用最大類間方差法進(jìn)行二值化構(gòu)建掩膜;(2)在掩膜圖像中,樣品區(qū)域變?yōu)?,而背景區(qū)域變?yōu)?。利用構(gòu)造好的掩膜圖像對(duì)原始高光譜圖像進(jìn)行掩膜,只保留樣品區(qū)域信息。圖1給出了700 nm、546 nm和435 nm 3個(gè)波長(zhǎng)合成偽彩圖的煙葉ROI提取過(guò)程,其中圖1(c)紅色部分為選擇的ROI。

      注:(a)偽彩圖;(b)751 nm灰度圖;(c)選取的感興趣區(qū)。

      高光譜數(shù)據(jù)的采集會(huì)受到儀器狀態(tài)、檢測(cè)環(huán)境、操作水平等因素的干擾,本實(shí)驗(yàn)采用歸一化(Normalization)、標(biāo)準(zhǔn)正態(tài)變換(Standard Normal Variate, SNV)、多元散射校正(Multivariate Scattering Correction, MSC)、一階導(dǎo)數(shù)(First Derivative, FD)和Savitzky-Golay(SG)分別對(duì)ROI的光譜進(jìn)行預(yù)處理操作,降低外界環(huán)境的影響,提高數(shù)據(jù)信噪比。

      Normalization預(yù)處理可以消除指標(biāo)之間的量綱影響;SNV可以去除樣品表面分布不均、顆粒散射而產(chǎn)生的噪聲影響;MSC可以降低由于漫反射導(dǎo)致的光譜數(shù)據(jù)差異,增強(qiáng)與有效成分所對(duì)應(yīng)的光譜信息;FD能夠去除光譜曲線基線漂移,并使光譜曲線變化更加顯著;SG利用平滑處理結(jié)合合適的多項(xiàng)式次數(shù)和平滑移動(dòng)窗口數(shù),對(duì)移動(dòng)窗口內(nèi)的光譜特征進(jìn)行數(shù)據(jù)擬合,以消除基線漂移、傾斜等噪聲,本研究中多項(xiàng)式次數(shù)設(shè)置為5,平滑移動(dòng)窗口數(shù)設(shè)置為9。

      1.4 特征波長(zhǎng)提取

      采用隨機(jī)抽樣的方法提取預(yù)處理后ROI內(nèi)所有像素點(diǎn)的光譜數(shù)據(jù),獲取每類樣品ROI內(nèi)500個(gè)像元光譜反射率值作為500個(gè)樣本,煙葉樣本和5種非煙物質(zhì)共計(jì)3000個(gè)樣本。采用Kennard-stone法將樣本以3:1的比例劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集和測(cè)試集的樣本數(shù)量分別為2250個(gè)和750個(gè)。

      為了降低高光譜中冗余信息對(duì)數(shù)據(jù)建模的影響,避免維數(shù)災(zāi)難,進(jìn)一步提高模型精度和時(shí)效性。運(yùn)用主成分載荷(Principal Component Analysis loadings, PCA loadings)和連續(xù)投影算法(Successive Projections Algorithm,SPA)對(duì)測(cè)試集數(shù)據(jù)進(jìn)行特征波長(zhǎng)提取。PCA loadings可以反映主成分與原始光譜波段間的相關(guān)性,根據(jù)波長(zhǎng)在不同主成分下的載荷系數(shù)不同,載荷系數(shù)越大,該波段對(duì)主成分的貢獻(xiàn)率越大,選取主成分載荷系數(shù)圖中的具有局部極小值、極大值的波長(zhǎng)作為特征波[24]。SPA是一種使光譜數(shù)據(jù)矩陣冗余度最小化的前向波長(zhǎng)選擇算法,通過(guò)連續(xù)投影分析數(shù)據(jù),選擇具有最低共線性的變量組合作為特征波長(zhǎng)[25]。

      1.5 分類模型的建立與評(píng)價(jià)

      隨機(jī)森林(Random Forest, RF)作為一種集成學(xué)習(xí)算法,通過(guò)構(gòu)建多棵決策樹(shù),組合多棵決策樹(shù)的建模結(jié)果共同得出最終預(yù)測(cè)結(jié)果,具有運(yùn)算速度快,對(duì)異常值和噪聲有很好的容忍度,在處理大量數(shù)據(jù)表現(xiàn)好等優(yōu)點(diǎn)[26]。經(jīng)對(duì)比不同子樹(shù)數(shù)量的性能后,本研究最終選擇RF模型的子樹(shù)數(shù)量為150。Softmax分類器是邏輯回歸在多分類問(wèn)題上的擴(kuò)展,與只能進(jìn)行二分類的邏輯回歸分類不同,結(jié)果以概率的形式解決多分類問(wèn)題[27]。Softmax作為一種有監(jiān)督分類器,在分類時(shí)計(jì)算量小,速度快,可與多種淺層、深層神經(jīng)網(wǎng)絡(luò)結(jié)合。本研究對(duì)Softmax模型的正則化參數(shù)選擇L2,通過(guò)網(wǎng)格搜索算法選擇合適的損失函數(shù)優(yōu)化算法和正則化系數(shù)C,其調(diào)參范圍分別為{newton-cg, lbfgs, sag, liblinear}和10-5~105。支持向量機(jī)(Support Vector Machine, SVM)是通過(guò)找出最大決策邊界,實(shí)現(xiàn)對(duì)數(shù)據(jù)進(jìn)行分類的分類器,采用核函數(shù),將數(shù)據(jù)向高維空間映射時(shí)并不增加計(jì)算法復(fù)雜性,可克服特征多、非線性、小樣本的問(wèn)題[28]??紤]到像素點(diǎn)光譜數(shù)據(jù)的非線性,本研究選擇rbf作為SVM模型的核函數(shù),通過(guò)網(wǎng)格搜索算法選擇合適的正則化系數(shù)C和核系數(shù)γ來(lái)優(yōu)化模型,正則化系數(shù)C和核系數(shù)γ的調(diào)參范圍分別為10-5~105、10-5~103。

      本研究分別使用RF、Softmax、SVM機(jī)器學(xué)習(xí)方法建立了不同光譜預(yù)處理方法的煙葉和非煙物質(zhì)分類模型,以分類模型在訓(xùn)練集和測(cè)試集內(nèi)部的平均正確率作為評(píng)價(jià)指標(biāo),以確定最佳預(yù)處理方法和最優(yōu)分類模型。

      2 結(jié)果與討論

      2.1 煙葉和非煙物質(zhì)的平均反射光譜

      對(duì)光譜數(shù)據(jù)信噪比進(jìn)行評(píng)價(jià),光譜范圍在400 nm前和1000 nm后的數(shù)據(jù)信噪比較低,因此選取光譜范圍為400~1000 nm的數(shù)據(jù)進(jìn)行后續(xù)分析,共計(jì)236個(gè)波段。將每類500個(gè)樣品光譜取均值得到煙葉非煙物質(zhì)的平均光譜反射率。煙葉與非煙物質(zhì)的平均光譜曲線如圖2所示,塑料匝繩和尼龍布在590 nm處具有反射峰,故基于此可與煙葉區(qū)分。煙葉、植物葉子、紙制品和麻繩作為植物類或植物類制品有著相似的光譜波形,在420 nm處有吸收谷,500~700 nm反射率呈現(xiàn)上升趨勢(shì),在950 nm處有小的反射率峰存在,但是在某些波段范圍反射率存在較為明顯的差異,即6類別樣本類間光譜特性差異較大。

      圖2 煙葉和非煙物質(zhì)的平均反射光譜

      2.2 樣品主成分分析

      主成分分析通過(guò)正交變換將線性相關(guān)的變量組合成新的相互無(wú)關(guān)的新變量,可獲取不同類別樣品的主成分得分分布,定性判斷不同類別樣本的可分性。對(duì)煙葉和非煙物質(zhì)的反射光譜數(shù)據(jù)主成分分析可知,前3主成分的貢獻(xiàn)率分別為80.36%,12.92%,5.83%,累積貢獻(xiàn)率超過(guò)了99%,表明前3主成分能夠包含絕大部分的原始光譜信息。6類樣品在前3主成分的得分分布如圖3所示??梢钥闯?,同一類別的分布較廣泛,但煙葉和非煙物質(zhì)各自分別聚集在一起,進(jìn)一步說(shuō)明煙葉和非煙物質(zhì)具有良好的可分性,可利用高光譜成像技術(shù)進(jìn)行有效地識(shí)別。

      圖3 六類樣品在前3主成分得分分布圖

      2.3 高光譜數(shù)據(jù)預(yù)處理結(jié)果

      基于5種預(yù)處理方法的種分類模型結(jié)果如表1所示,基于不同預(yù)處理建立的煙葉和非煙物質(zhì)分類模型,平均分類正確率均達(dá)到了96%,因此利用高光譜成像技術(shù)對(duì)煙葉和非煙物質(zhì)進(jìn)行分類識(shí)別是可行的。在幾種預(yù)處理方法中,采用SNV預(yù)處理建立的分類模型在訓(xùn)練集和測(cè)試集的平均分類正確率均為最高,故可以得出相比原始光譜和其他預(yù)處理方法,SNV的預(yù)處理方法為最優(yōu)。因此在后續(xù)的高光譜數(shù)據(jù)分析中,選擇SNV預(yù)處理方法對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,以降低噪聲影響,提高數(shù)據(jù)的有效性。

      表1 基于不同預(yù)處理光譜的模型識(shí)別結(jié)果

      Tab.1 Model classification results based on different spectral pretreatments

      2.4 特征波長(zhǎng)的選擇

      在訓(xùn)練集數(shù)據(jù)利用PCA loadings進(jìn)行特征波長(zhǎng)的選擇。圖4為主成分1(PC1),主成分2(PC2),主成分3(PC3)的權(quán)重系數(shù)曲線圖,其中的波峰、波谷表明對(duì)應(yīng)的波長(zhǎng)占主要貢獻(xiàn)。為了確保特征波長(zhǎng)的選擇更加可靠,如果在3條曲線中占2個(gè)及以上的波峰或波谷,則選擇其為特征波長(zhǎng)。如圖5所示,544 nm和582 nm在3條曲線各自都對(duì)應(yīng)波峰或波谷,說(shuō)明了以上2個(gè)波段能夠反映6類樣品光譜信息的差異;440 nm、486 nm和518 nm在PC1和PC2的權(quán)重曲線里對(duì)應(yīng)有2個(gè)波峰或波谷;由于660 nm對(duì)應(yīng)1個(gè)波峰,且PC2和PC3在該波段存在較大曲線斜率的變化,故選取其為特征波長(zhǎng);3條曲線均在803 nm后變化變小,故將803 nm作為特征波長(zhǎng)。因此,共篩選出7個(gè)特征波長(zhǎng)為440 nm、486 nm、518 nm、544 nm、582 nm、660 nm和803 nm。

      圖4 PC1,PC2和PC3的載荷系數(shù)圖

      利用SPA將SNV預(yù)處理后的光譜數(shù)據(jù)降低波長(zhǎng)變量維度,選取特征波長(zhǎng)組合的原則是均方根誤差(Root Mean Square Error, RMSE)最低時(shí)對(duì)應(yīng)的波長(zhǎng)變量組合。不同變量集的RMSE值如圖5所示,當(dāng)波長(zhǎng)變量小于6時(shí),RMSE值下降趨勢(shì)明顯,當(dāng)波長(zhǎng)變量大于6時(shí),RMSE值在最小值附近趨于穩(wěn)定。因此,所選出的6個(gè)波長(zhǎng)變量對(duì)應(yīng)的波長(zhǎng)即為選定的特征波長(zhǎng)。圖6展示了基于煙葉光譜曲線波長(zhǎng)算法選擇的結(jié)果,其中波長(zhǎng)選擇索引分別為46、59、75、113、158、228,對(duì)應(yīng)的特征波長(zhǎng)為513 nm、545 nm、585 nm、680 nm、796 nm、980 nm。

      圖5 均方根誤差隨SPA中特征波長(zhǎng)數(shù)變化曲線

      圖6 SPA特征波長(zhǎng)選擇結(jié)果

      2.5 建模結(jié)果與分析

      基于PCA loadings和SPA算法篩選出的特征波長(zhǎng)作為輸入變量,采用RF、Softmax以及SVM分別建立各自的分類模型,并與全光譜數(shù)據(jù)的分類模型進(jìn)行比較。以訓(xùn)練集和測(cè)試集各自內(nèi)部的平均正確率來(lái)評(píng)價(jià)模型的優(yōu)劣。

      表2 各分類模型的判別分析結(jié)果

      Tab.2 Discrimination results of various classification models

      不同特征提取方法基于3種算法的識(shí)別精度如表2所示,根據(jù)測(cè)試集的識(shí)別結(jié)果,各模型的平均準(zhǔn)確率均較高,分類模型準(zhǔn)確率均在98.53%以上。基于SVM模型的測(cè)試集識(shí)別準(zhǔn)確率均高于RF和SoftMax模型,說(shuō)明基于SVM建立的識(shí)別模型為最優(yōu)模型。SPA-RF、SPA-Softmax和SPA-SVM模型測(cè)試準(zhǔn)確率均不低于PCA loadings-RF、PCA loadings-Softmax和PCA loadings-SVM,表明基于SPA篩選的6個(gè)特征波長(zhǎng)更能反映煙葉與非煙物質(zhì)的光譜信息的差異,是優(yōu)于PCA loadings的特征波長(zhǎng)選擇方法。對(duì)比9種建模方法可以看出,未經(jīng)變量選擇的SVM分類模型性能最優(yōu),訓(xùn)練集正確率達(dá)到了100%,測(cè)試集正確率達(dá)到了99.6%。但是該方法輸入變量多,模型相對(duì)復(fù)雜。相比經(jīng)SPA變量選擇后,建立的SVM模型訓(xùn)練集和測(cè)試集的識(shí)別正確率分別為99.82%,99.47%,識(shí)別正確率與全光譜變量建立的SVM模型差異較小,且輸入變量?jī)H為6個(gè),減少了97.5%的變量數(shù)。采用SPA提取特征波長(zhǎng),去除了全光譜波長(zhǎng)中自相關(guān)性高的波長(zhǎng),提高了模型的運(yùn)算速度,保持判別正確率的同時(shí)降低了模型的復(fù)雜度,因此將SPA-SVM作為最優(yōu)模型。

      2.6 降維模型可視化檢測(cè)

      為了可視化待測(cè)樣品分類結(jié)果,評(píng)價(jià)降維模型識(shí)別效果,利用SPA-SVM降維模型對(duì)預(yù)測(cè)圖進(jìn)行像素級(jí)分類,結(jié)果如圖7所示。圖7b中紅色部分為煙葉,其絕大部分像元被正確分類,SPA-SVM降維模型將待分類對(duì)象識(shí)別為各自的類別,煙葉與非煙物質(zhì)能較好的地區(qū)分,但也存在一些像元被誤識(shí)別,特別是煙葉輪廓處,其原因可能是輪廓處像元是煙葉和背景的混合像元,背景和煙葉像元光譜的重合疊加導(dǎo)致光譜的相似性,從而導(dǎo)致誤分類。從圖2可以看出,煙葉與紙制品的平均光譜波形十分相似,并且選擇的6個(gè)特征波段只有440 nm具有區(qū)分度,故導(dǎo)致了煙葉某些像元誤識(shí)別為紙制品。麻繩一部分像素點(diǎn)的誤識(shí)別成植物葉子可能是由于麻繩較細(xì)且形態(tài)有較大的突起,光分布不均勻和同一樣本到探測(cè)器距離的變化,從而導(dǎo)致同一樣品光譜的可變性增大,造成誤識(shí)別的發(fā)生。從表3也可以看出,降維模型在測(cè)試集數(shù)據(jù)上存在將個(gè)別的煙葉像元和植物葉子判別為紙制品、麻繩判別為植物葉子,側(cè)面解釋了待測(cè)數(shù)據(jù)可視化圖里出現(xiàn)誤識(shí)別像元的原因??傮w來(lái)看,可視化結(jié)果較好,基于特征波長(zhǎng)建立的降維模型,識(shí)別煙葉和非煙物質(zhì)類別具有可行性。

      注:圖7a為煙葉和5種非煙物質(zhì)的偽彩色圖像;圖7b為分類結(jié)果可視化圖像。

      表3 SPA-SVM模型測(cè)試集混淆矩陣

      Tab.3 Confusion matrix of test set based on SPA-SVM model

      續(xù)表3

      真實(shí)類別True labels預(yù)測(cè)類別Predicted label 植物葉子Plant leaf紙制品Paper product麻繩Hemp rope尼龍Nylon塑料匝繩Plastic rope煙葉Tobacco leaf總計(jì)total預(yù)測(cè)準(zhǔn)確Accurate prediction準(zhǔn)確率/%Accuracy 麻繩Hemp rope 124 124124100 尼龍Nylon 125 125125100 塑料匝繩Plastic rope 125 125125100 煙葉Tobacco leaf 123123123100 總計(jì)total12512512512512512575074699.47

      3 結(jié)論

      本研究利用可見(jiàn)-近紅外高光譜成像技術(shù),采用5種方法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,結(jié)果表明SNV預(yù)處理方法最好。利用PCA-loadings和SPA算法選擇特征波長(zhǎng),基于全波長(zhǎng)和特征波長(zhǎng)變量建立非煙物質(zhì)的RF、SoftMax及SVM分類模型,結(jié)果顯示基于全光譜、PCA-loadings和SPA建立的RF,SoftMax和SVM模型的測(cè)試集和測(cè)試集均高于98.5%,說(shuō)明煙葉與非煙物質(zhì)具有較好的可分性?;谌庾V建立的分類模型均略優(yōu)于基于PCA-loadings和SPA建立的分類模型,SPA建立模型均略優(yōu)于PCA-loadings建立的分類模型。經(jīng)SPA進(jìn)行變量篩選后建立的SVM模型,保證較好正確率的同時(shí)極大地降低了模型運(yùn)算量。同時(shí)SPA-SVM模型在驗(yàn)證圖像數(shù)據(jù)的檢測(cè)結(jié)果可視化證明,基于SPA-SVM模型對(duì)煙葉和非煙物質(zhì)進(jìn)行分類識(shí)別具有極強(qiáng)的可行性,為特征光譜成像儀器開(kāi)發(fā)提供了理論基礎(chǔ)和技術(shù)支持。

      [1] 張長(zhǎng)華,趙紅楓,胡偉,等. 煙葉原料中主要非煙物質(zhì)的成因分析[J]. 中國(guó)煙草科學(xué),2013, 34(1): 90-93.

      ZHANG Changhua, ZHAO Hongfeng, HU Wei, et al. Origin of impurities in tobacco leave[J]. Chinese Tobacco Science, 2013, 34(1): 90-93.

      [2] 劉玉蘭,熊應(yīng)偉,楊生南,等. 談低次煙葉凈化的重要性[J]. 煙草科技,1986(3): 26-27.

      LIU Yulan, XIONG Yingwei, YANG Shengnan, et al. On the importance of low-grade tobacco purification[J]. Tobacco Science & Technology, 1986(3): 26-27.

      [3] 顧健偉. 煙葉復(fù)烤企業(yè)非煙物質(zhì)控制[J]. 南方農(nóng)業(yè),2014, 8(18): 190-192.

      GU Jianwei. Controlling of non-tobacco related material in tobacco redrying enterprises[J]. South China Agriculture, 2014, 8(18): 190-192.

      [4] 齊永杰,李群嶺,徐文兵,等. 論煙葉中非煙物質(zhì)的來(lái)源與控制[J]. 農(nóng)業(yè)與技術(shù),2015, 35(13): 189-191.

      QI Yongjie, LI Qunling, XU Wenbing, et al. On the source and control of non-tobacco related material in tobacco leaves[J]. Agriculture and Technology, 2015, 35(13): 189-191.

      [5] 劉配文,溫圣賢. 打葉復(fù)烤等環(huán)節(jié)中非煙雜物的控制措施[J]. 作物研究,2013, 27(S1): 51-53.

      LIU Peiwen, WEN Shengxian. Control measures of non-tobacco related material in threshing and redrying[J]. Crop Research, 2013, 27(S1): 51-53.

      [6] 楊俊杰,陶文華. 基于激光分揀技術(shù)的煙草異物剔除系統(tǒng)[J]. 機(jī)械制造與自動(dòng)化, 2019, 48(6):214-216.

      YANG Junjie, TAO Wenhua. Tobacco sorting system based on laser sorting technology[J].Electrical automation,2019, 48(6): 214- 216.

      [7] Garcia-Allende P B, Conde O M, Mirapeix J, et al. Quality control of industrial processes by combining a hyperspectral sensor and Fisher's linear discriminant analysis[J]. Sensors & Actuators B Chemical, 2008, 129(2): 977-984.

      [8] Mehl P M, Chen Y R, Kim M S, et al. Development of hyperspectral imaging technique for the detection apple surface defects and contaminations[J]. Journal of Food Engineering, 2004, 61(1): 67-81.

      [9] Adebayo S E, Hashim N, Abdan K, et al. Application and potential of backscattering imaging techniques in agricultural and food processing[J]. Journal of Food Engineering, 2016(169): 155.

      [10] Wang C, Liu B, Liu L, et al. A review of deep learning used in the hyperspectral image analysis for agriculture[J]. Artificial Intelligence Review, 2021, 54(3): 5205-5253.

      [11] 喬紅波,蔣金煒,程登發(fā), 等. 煙蚜為害特征的高光譜比較[J]. 昆蟲(chóng)知識(shí),2007(1): 57-61.

      QIAO Hongbo, JIANG Jinwei, CHENG Dengfa, et al. Comparison of hyperspectral characteristics in tobacco aphid damage[J]. Chinese Bulletin of Entomology, 2007(1): 57-61.

      [12] Qga B, Li S, Tz C, et al. Early detection of tomato spotted wilt virus infection in tobacco using the hyperspectral imaging technique and machine learning algorithms[J]. Computers and Electronics in Agriculture, 2019(167): 168-169.

      [13] Prabhakar M, Prasad Y G, Desai S, et al. Hyperspectral remote sensing of yellow mosaic severity and associated pigment losses in Vigna mungo using multinomial logistic regression models[J]. Crop Protection, 2013, 45: 132-140.

      [14] 李向陽(yáng),于建軍,劉國(guó)順. 利用光譜反射率預(yù)測(cè)烤煙葉片煙堿含量[J]. 農(nóng)業(yè)工程學(xué)報(bào),2008(8): 169-173.

      LI Xiangyang, YU Jianjun, LIU Guoshun. Predicting leaf nicotine content of flue-cured tobacco using hyperspectral reflectance[J]. Transactions of the Chinese Society of Agricultural Engineering, 2008(8): 169-173.

      [15] Sun J, Zhou X, Wu X H, et al. Identification of moisture content in tobacco plant leaves using outlier sample eliminating algorithms and hyperspectral data[J]. Biochemical and Biophysical Research Communications, 2016, 471(1): 226-232.

      [16] Yu K Q, Fang S Y, Zhao Y R. Heavy metal Hg stress detection in tobacco plant using hyperspectral sensing and data-driven machine learning methods[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2020, 245: 118-917.

      [17] Jia F F, Liu G S, Liu D S, et al. Comparison of different methods for estimating nitrogen concentration in flue-cured tobacco leaves based on hyperspectral reflectance[J]. Field Crops Research, 2013, (150): 108-114.

      [18] Li X Y, Liu G S, Yang Y F, et al. Relationship between hyperspectral parameters and physiological and biochemical indexes of flue-cured tobacco leaves[J]. Agricultural Sciences in China, 2007, 6(6): 665-672.

      [19] 王梅. 發(fā)病煙草的高光譜特征及其病害程度診斷模型研究[D]. 山東農(nóng)業(yè)大學(xué),2013.

      WANG Mei. Hyperspectral Characteristics and Diagnostic Motels of Diseases Tobacco[D]. Shandong Agricultural University, 2013.

      [20] Frederico L.F. Soares, Marcelo C.A. Marcelo, Liliane M.F. Porte, et al. Inline simultaneous quantitation of tobacco chemical composition by infrared hyperspectral image associated with chemometrics[J]. Microchemical Journal, 2019, 151: 104225.

      [21] Marcelo M, Soares F, Ardila J A, et al. Fast inline tobacco classification by near-Infrared hyperspectral imaging and supporting vector machines-discriminant analysis[J]. Analytical Methods, 2019(11): 19661-975.

      [22] Rodriguez-Cobo, Luis & Garcia-Allende, P. Beatriz & Cobo, et al. Raw Material Classification by Means of Hyperspectral Imaging and Hierarchical Temporal Memories. Sensors Journal, IEEE. 2012(12): 2767-2775.

      [23] PB García-Allende, Conde O M, Cubillas A M, et al. New raw material discrimination system based on a spatial optical spectroscopy technique[J]. Sensors & Actuators A Physical, 2007, 135(2): 605-612.

      [24] Jiang J B, Qiao X J, Li H. Use of near-infrared hyperspectral images to identify moldy peanuts[J]. Journal of Foiod Engineering, 2016, 169: 284-290.

      [25] 洪涯,洪添勝,代芬, 等. 連續(xù)投影算法在砂糖橘總酸無(wú)損檢測(cè)中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2010, 26(S2): 380-384.

      HONG Ya, HONG Tiansheng, DAI Fen, et al. Successive projections algorithm for variable selection in nondestructive measurement of citrus total acidity[J]. Transactions of the Chinese Society of Agricultural Engineering, 2010, 26(S2): 380-384.

      [26] Breiman L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.

      [27] 蔣怡,黃平,董秀春,等. 基于Softmax分類器的小春作物種植空間信息提取[J]. 西南農(nóng)業(yè)學(xué)報(bào), 2019, 32(8): 1880-1885.

      JIANG Yi, HUANG Ping, DONG Xiuchun, et al. Spatial information extraction of spring crops based on softmax classifier[J]. Southwest China Journal of Agricultural Sciences, 2019, 32(8): 1880-1885.

      [28] Tao D L, Xiao Z T, Zhang F F, et al. Cloth defect classification method based on SVM[J]. International Journal of Digital Content Technology & Its Applications, 2013, 7(3): 614-622.

      Research on classification and recognition of non-tobacco related material (NTRM) based on hyperspectral imaging technology

      LI Zhihui1, MEI Jifan1, LI Hui1, LI Jiakang1, LU Minrui2, WANG Fang2, ZHANG Tengjian2, DU Jinsong1, HONG Weiling3, XU Dayong1*

      1 Zhengzhou Tobacco Research Institute of CNTC, Zhengzhou 450001, China;2 Fujian Wuyi Leaf Tobacco Co., Ltd., Nanping 354000, China;3 Technology Center, China Tobacco Fujian Industrial Co., Ltd., Xiamen 361021, China

      The NTRM in tobacco leaves were recognized and classified using hyperspectral imaging technology and machine learning. Hyperspectral imaging system was used to collect spectral data of 400~1000 nm band tobacco leaves and NTRM. Five preprocessing methods were used to preprocess the original spectra, and standard normal variate (SNV) was selected as the best preprocessing method. Successive projection algorithm (SPA) and Principal component analysis loadings (PCA loadings) were used to screen out 6 characteristic wavelengths. Random forest (RF), Softmax and support vector machine (SVM) were employed to establish identification models based on characteristic wavelength and full spectrum. The results showed that SVM model of the full spectrum had the best recognition results, and the recognition accuracy of samples in the calibration set and test set were 100% and 99.6%, respectively. SPA method was superior to PCA loadings algorithm, and identification rates of SPA-SVM model calibration set and test set were 99.82% and 99.47% respectively. Hyperspectral imaging combined with SPA-SVM model demonstrate the efficient classification and recognition of NTRM in tobacco leaves.

      hyperspectral imaging; non-tobacco related material; successive projections algorithm; characteristic wavelength; support vector machine; classification

      Corresponding author. Email:xdyong@126.com

      福建中煙工業(yè)有限責(zé)任公司科技項(xiàng)目“卷煙產(chǎn)品及原料高光譜特征分析與應(yīng)用技術(shù)研究”(D2020248)

      李智慧(1997—),碩士研究生,主要研究方向:煙草物料高光譜成像技術(shù)檢測(cè),Tel:15139486607,Email:690638340@qq.com

      徐大勇(1982—),Tel:13526654802,Email:xdyong@126.com

      2021-08-19;

      2022-04-21

      李智慧,梅吉帆,李輝,等. 高光譜成像的非煙物質(zhì)分類識(shí)別研究[J]. 中國(guó)煙草學(xué)報(bào),2022,28(3). LI Zhihui, MEI Jifan, LI Hui, et al. Research on classification and recognition of non-tobacco related material (NTRM) based on hyperspectral imaging technology[J]. Acta Tabacaria Sinica, 2022, 28(3). doi:10.16472/j.chinatobacco.2021.T0146

      猜你喜歡
      煙葉波長(zhǎng)預(yù)處理
      HPLC-PDA雙波長(zhǎng)法同時(shí)測(cè)定四季草片中沒(méi)食子酸和槲皮苷的含量
      關(guān)于新形勢(shì)下煙葉生產(chǎn)可持續(xù)發(fā)展的思考
      活力(2019年15期)2019-09-25 07:21:56
      煙葉主要真菌病害的發(fā)生與防治
      基于預(yù)處理MUSIC算法的分布式陣列DOA估計(jì)
      雙波長(zhǎng)激光治療慢性牙周炎的療效觀察
      日本研發(fā)出可完全覆蓋可見(jiàn)光波長(zhǎng)的LED光源
      淺談PLC在預(yù)處理生產(chǎn)線自動(dòng)化改造中的應(yīng)用
      絡(luò)合萃取法預(yù)處理H酸廢水
      便攜式多用途光波波長(zhǎng)測(cè)量?jī)x
      基于自適應(yīng)預(yù)處理的改進(jìn)CPF-GMRES算法
      凤冈县| 石台县| 廉江市| 涞源县| 门头沟区| 沂水县| 和平县| 三门峡市| 五莲县| 通城县| 钦州市| 芮城县| 陇西县| 廊坊市| 延吉市| 金平| 卫辉市| 乌鲁木齐县| 乳山市| 紫金县| 崇文区| 武宁县| 集安市| 离岛区| 静宁县| 昭平县| 会昌县| 林芝县| 菏泽市| 西藏| 莱阳市| 双鸭山市| 武威市| 广德县| 礼泉县| 新泰市| 班玛县| 台州市| 珠海市| 清涧县| 二连浩特市|