收稿日期:2023-06-21
基金項(xiàng)目:浙江省“尖兵”“領(lǐng)雁”重點(diǎn)科技計(jì)劃項(xiàng)目(2022C04039)
作者簡(jiǎn)介:班兆軍(1980-),男,遼寧大石橋人,博士,教授,主要從事農(nóng)產(chǎn)品采后品質(zhì)及標(biāo)準(zhǔn)化研究。(E-mail)banzhaojun@zust.edu.cn
摘要: 本研究使用近紅外高光譜成像技術(shù)獲取蘋(píng)果的高光譜數(shù)據(jù),對(duì)蘋(píng)果糖度、酸度指標(biāo)進(jìn)行無(wú)損檢測(cè)。針對(duì)高光譜數(shù)據(jù)量大、信息冗余多的特點(diǎn),分別采用標(biāo)準(zhǔn)化(Standardization,SS)、標(biāo)準(zhǔn)正態(tài)變換(Standard normal variate,SNV)、最小二乘平滑濾波(Savitzky-Golay smoothing filtering,SG)和多元散射校正(Multiplicative scatter correction,MSC)對(duì)蘋(píng)果的光譜數(shù)據(jù)進(jìn)行預(yù)處理。針對(duì)高光譜圖像波段多的特點(diǎn),分別采用連續(xù)投影(Successive projections algorithm,SPA)算法、競(jìng)爭(zhēng)性自適應(yīng)加權(quán)重(Competitive adaptive reweighted sampling,CARS)算法和隨機(jī)蛙跳(Random frog,RF)算法選取蘋(píng)果的特征波長(zhǎng)。對(duì)提取的特征波長(zhǎng)分別用支持向量機(jī)(Support vector machine,SVM)模型、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)模型和基于深度學(xué)習(xí)的定量光譜數(shù)據(jù)分析(DeepSpectra)模型對(duì)蘋(píng)果的糖酸比進(jìn)行預(yù)測(cè)。結(jié)果表明,基于深度學(xué)習(xí)的定量光譜數(shù)據(jù)分析(DeepSpectra)模型預(yù)測(cè)的正確率達(dá)到93.70%,有較高的精確度,可以較好地對(duì)蘋(píng)果糖酸比進(jìn)行預(yù)測(cè)。本研究將高光譜成像技術(shù)與基于深度學(xué)習(xí)的定量光譜數(shù)據(jù)分析模型相結(jié)合,實(shí)現(xiàn)了無(wú)損檢測(cè)蘋(píng)果糖酸比。
關(guān)鍵詞: 高光譜;蘋(píng)果;糖酸比;無(wú)損檢測(cè)
中圖分類(lèi)號(hào): S661.1 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1000-4440(2024)08-1446-09
Non-destructive detection method of apple quality based on hyperspectral and deep learning
BAN Zhaojun1, GAO Xuanxiang1, MA Yiheng1, ZHANG Shuang1, FANG Chenyu1, WANG Junbo2,ZHU Yi2
(1.School of Biological and Chemical Engineering, Zhejiang University of Science and Technology/Zhejiang Provincial Key Laboratory of Chemical and Biological Processing Technology of Farm Products/Zhejiang Provincial Collaborative Innovation Center of Agricultural Biological Resources Biochemical Manufacturing, Hangzhou 310023, China;2.Aksu Youneng Agricultural Technology Co., Ltd., Aksu 843100, China)
Abstract: The hyperspectral data of apples were obtained by using near-infrared hyperspectral imaging technology, and the indexes of sugar content and acidity were detected nondestructively. For the characteristics of large amount of hyperspectral data and information redundancy, standardization (SS), standard normal variate (SNV), Savitzky-Golay smoothing filtering (SG) and multiplicative scatter correction (MSC) were used to preprocess the spectra of apples. According to the characteristic of hyperspectral images with many bands, successive projections algorithm (SPA), competitive adaptive reweighted sampling (CARS) algorithm and random frog (RF) algorithm were used to select the characteristic wavelengths of apples. Support vector machine (SVM) model, convolutional neural networks (CNN) model and quantitative spectral data analysis based on deep learning (DeepSpectra) model were used to predict the sugar-acid ratio of apples. The results showed that the prediction accuracy of DeepSpectra model was 93.70%, which had high accuracy and could be used to predict the sugar-acid ratio of apples. In this study, hyperspectral imaging technology and DeepSpectra model were combined to realize the non-destructive detection of the sugar-acid ratio of apples.
Key words: hyperspectral;apple;sugar acid ratio;nondestructive testing
蘋(píng)果是人們?nèi)粘I钪凶畛R?jiàn)的水果之一,它富含維生素和無(wú)機(jī)鹽,而且價(jià)格實(shí)惠,口感酸甜[1]。此外,蘋(píng)果還含有大量的鉀、鐵、鈣等營(yíng)養(yǎng)元素,是最有營(yíng)養(yǎng)的水果之一[2]。蘋(píng)果含糖量的高低決定了人們對(duì)蘋(píng)果口感的評(píng)價(jià)以及營(yíng)養(yǎng)價(jià)值的評(píng)估,含糖量是衡量蘋(píng)果品質(zhì)的主要指標(biāo),因此在分級(jí)環(huán)節(jié)快速無(wú)損檢測(cè)蘋(píng)果的含糖量十分關(guān)鍵[3]。蘋(píng)果品質(zhì)可以分為內(nèi)在品質(zhì)與外在品質(zhì),其中蘋(píng)果的內(nèi)在品質(zhì)包括蘋(píng)果的糖度、酸度、糖酸比、硬度、含水率等,這些指標(biāo)可以判定蘋(píng)果的營(yíng)養(yǎng)成分、口感及儲(chǔ)存時(shí)間。但對(duì)蘋(píng)果的內(nèi)在品質(zhì)的檢測(cè)會(huì)對(duì)果實(shí)造成破壞,且檢測(cè)效率較低。
近紅外光譜分析方法是一種檢測(cè)蘋(píng)果內(nèi)在品質(zhì)的手段,可以快速、無(wú)損、便捷地檢測(cè)蘋(píng)果內(nèi)在品質(zhì)[4-7]。高光譜成像技術(shù)是將成像技術(shù)與光譜技術(shù)相結(jié)合,檢測(cè)二維幾何空間及一維光譜信息,從中提取出高光譜分辨率的連續(xù)、窄波段的圖像數(shù)據(jù)。高光譜成像技術(shù)可以用于杧果、梨、柿子等水果品質(zhì)的快速無(wú)損分析、分級(jí)以及生產(chǎn)監(jiān)控、質(zhì)量控制等方面[8-10]。近年來(lái),高光譜成像技術(shù)被用于蘋(píng)果內(nèi)在品質(zhì)的檢測(cè)。Fernando等[11]利用高光譜成像技術(shù)對(duì)Red Delicious、Golden Delicious和Jonagold 3種蘋(píng)果的可溶性固體含量和硬度進(jìn)行了檢測(cè),發(fā)現(xiàn)在融合了高光譜數(shù)據(jù)特征和圖像特征后,可以更有效地提高偏最小二乘回歸(PLS)模型的準(zhǔn)確度。馮迪[7]將標(biāo)準(zhǔn)正態(tài)變換(SNV)與二階導(dǎo)數(shù)(SD)這2種預(yù)處理方法相結(jié)合,并用連續(xù)投影算法(SPA)提取其中的特征波段,最后采用經(jīng)過(guò)優(yōu)化的反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)搭建高光譜數(shù)據(jù)與蘋(píng)果硬度之間的回歸模型。
深度學(xué)習(xí)技術(shù)不僅可以提取出更多的深層特征,還可以將一維光譜特征與二維空間特征相結(jié)合。將深度學(xué)習(xí)方法應(yīng)用于光譜數(shù)據(jù)分析,可以減少對(duì)專(zhuān)家經(jīng)驗(yàn)和已有知識(shí)的依賴(lài),讓人們能夠更精確、更有層次地從原始光譜數(shù)據(jù)的信息中提取出有效信息。Acquarelli等[12]提出了具有一個(gè)卷積層的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,利用10個(gè)數(shù)據(jù)集驗(yàn)證該模型的精度,并在原始光譜數(shù)據(jù)和經(jīng)過(guò)預(yù)處理的光譜數(shù)據(jù)上同時(shí)應(yīng)用了該模型。
在上述研究中均提取了不同的特征波長(zhǎng),但特征波長(zhǎng)的有效性尚未得到確認(rèn)[13]。此外,大部分研究集中于預(yù)測(cè)蘋(píng)果糖度,對(duì)蘋(píng)果酸度和糖酸比預(yù)測(cè)的研究較少,缺少蘋(píng)果品質(zhì)與酸度之間的關(guān)系的考慮[7,11]。本研究采用高光譜成像技術(shù)對(duì)蘋(píng)果進(jìn)行高光譜成像,提取蘋(píng)果赤道面上感興趣區(qū)域(Region of interest,ROI)的光譜數(shù)據(jù),從而獲得光譜曲線。對(duì)蘋(píng)果光譜數(shù)據(jù)進(jìn)行預(yù)處理,并評(píng)估各種數(shù)據(jù)預(yù)處理方法的效果,選取合適的光譜數(shù)據(jù)預(yù)處理方法。進(jìn)一步通過(guò)對(duì)比特征波長(zhǎng)提取方法的優(yōu)化情況,選取較好的特征波長(zhǎng)提取手段,最后采用支持向量機(jī)(SVM)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)和基于深度學(xué)習(xí)的定量光譜數(shù)據(jù)分析處理(DeepSpectra)優(yōu)化預(yù)測(cè)模型,選取決定系數(shù)(R2)較大、均方根誤差(RMSE)較小的模型預(yù)測(cè)蘋(píng)果糖酸比。本研究擬將高光譜分析方法與深度學(xué)習(xí)技術(shù)相結(jié)合,以期快速、準(zhǔn)確、無(wú)損地預(yù)測(cè)蘋(píng)果糖度、酸度、糖酸比,為蘋(píng)果內(nèi)在品質(zhì)無(wú)損檢測(cè)的研究提供參考。
1 材料與方法
1.1 試驗(yàn)材料
選取新疆阿克蘇地區(qū)紅旗坡農(nóng)場(chǎng)中12年樹(shù)齡的蘋(píng)果樹(shù),采摘無(wú)病蟲(chóng)害、無(wú)機(jī)械損傷的阿克蘇富士蘋(píng)果220個(gè),平均果重233.42 g,平均果徑77.41 mm,擦去蘋(píng)果表面果霜、果蠟,依次編號(hào)。利用Kennard-Stone算法[14]將蘋(píng)果以4∶1的比例分成校正集和預(yù)測(cè)集,。校正集蘋(píng)果176個(gè),預(yù)測(cè)集蘋(píng)果44個(gè)。
1.2 儀器與設(shè)備
PAL-BX|ACID1 Master Kit便攜式糖酸一體機(jī)(日本愛(ài)拓公司產(chǎn)品),Resonon Pika KC2成像光譜儀(北京理加聯(lián)合科技有限公司產(chǎn)品),線性移動(dòng)平臺(tái),安裝塔,照明裝置,云臺(tái),NB單相電流智能檢測(cè)儀,GST36U12-P1JW電源供感器(中國(guó)臺(tái)灣明緯公司產(chǎn)品),DMX-J-SA-17步進(jìn)電機(jī)(美國(guó)阿卡斯公司產(chǎn)品),acA1920-155um面陣相機(jī)(德國(guó)巴斯勒公司產(chǎn)品)(圖1)。
1.3 光譜采集
采集400~1 000 nm波段的蘋(píng)果光譜信息。設(shè)置光譜分辨率為1.3 nm,幀頻率為20.0 Hz,曝光時(shí)間為20.0 ms,平臺(tái)的運(yùn)行速率達(dá)到355 pps,增益(Gain)達(dá)到3 dB,且蘋(píng)果和攝像機(jī)之間的距離設(shè)置為20.0 cm。在所拍攝到的蘋(píng)果光譜圖像中,選取位于蘋(píng)果赤道面附近的150×150個(gè)像素點(diǎn)大小的感興趣區(qū)域(ROI),提取其中的光譜數(shù)據(jù)。為了減少光線分布不均勻,準(zhǔn)確測(cè)量出被測(cè)物體的相對(duì)反射率,在對(duì)蘋(píng)果進(jìn)行光譜信息采集前,使用黑白板校正光譜信息[15],按照公式(1)計(jì)算蘋(píng)果的高光譜數(shù)據(jù):
Rλ,n=Sλ,n-Dλ,nWλ,n-Dλ,n(1)
式中,R為經(jīng)過(guò)黑白板校正的蘋(píng)果高光譜數(shù)據(jù);S為未經(jīng)黑白板校正的蘋(píng)果原始光譜數(shù)據(jù);W為黑暗環(huán)境下采集的光譜數(shù)據(jù);D為全反射環(huán)境下采集的光譜數(shù)據(jù);λ為λ波長(zhǎng);n為像素。
1.4 可溶性固形物含量、可滴定酸含量測(cè)定及糖酸比計(jì)算
在蘋(píng)果樣品赤道面三處等角度切10 mm×10 mm×10 mm果肉,放入手動(dòng)榨汁器中,擠壓獲取果汁,使用PAL-BX|ACID1 Master Kit便攜式糖酸一體機(jī)測(cè)量所測(cè)蘋(píng)果的可溶性固形物(SS)含量和可滴定酸(TA)含量,重復(fù)測(cè)量3次,取平均值[16]。按公式(2)計(jì)算蘋(píng)果的糖酸比(RST):
RST=SS/TA(2)
式中,RST為糖酸比;SS為可溶性固形物含量(%);TA為可滴定酸含量(%)。
1.5 光譜數(shù)據(jù)預(yù)處理
采用標(biāo)準(zhǔn)正態(tài)變換(SNV)、多元散射校正(MSC)、最小二乘平滑濾波(SG)和標(biāo)準(zhǔn)化(SS)對(duì)蘋(píng)果光譜數(shù)據(jù)進(jìn)行預(yù)處理,可以減少背景干擾、光線干擾和噪聲干擾等,剔除冗余無(wú)效信息,增加精準(zhǔn)率[17]。分別利用原始光譜數(shù)據(jù)(RW)以及標(biāo)準(zhǔn)正態(tài)變換(SNV)、多元散射校正(MSC)、最小二乘平滑濾波(SG)和標(biāo)準(zhǔn)化(SS)預(yù)處理后的光譜數(shù)據(jù)建立偏最小二乘回歸模型(PLS)。選取其中R2較大且均方根誤差(RMSE)較小的方案為較優(yōu)方案。評(píng)價(jià)指標(biāo)R2和RMSE計(jì)算方法分別如公式(3)和公式(4)所示:
R2=1-∑Nn=1(y︿n-yn)2∑Nn=1(yn-y—)2(3)
RMSE= ∑Nn=1(yn-y︿n)2N(4)
式中,R2為決定系數(shù);RMSE為均方根誤差;yn為蘋(píng)果糖酸比的真實(shí)值;y︿n為蘋(píng)果糖酸比的預(yù)測(cè)值;y—為蘋(píng)果糖酸比的真實(shí)值的平均數(shù);N為數(shù)據(jù)集中蘋(píng)果的個(gè)數(shù)。
1.6 特征波長(zhǎng)的提取
在高光譜數(shù)據(jù)中蘊(yùn)含著大量化學(xué)信息和物理信息,所以高光譜數(shù)據(jù)具有高維性和同線性問(wèn)題。光譜數(shù)據(jù)中相關(guān)性弱的信息會(huì)延長(zhǎng)建模所需的時(shí)間,降低整個(gè)模型的精度[18-19],所以需要提取光譜數(shù)據(jù)的特征波長(zhǎng),使預(yù)測(cè)模型更加精確。選用連續(xù)投影(SPA)算法[20]、競(jìng)爭(zhēng)性自適應(yīng)加權(quán)重(CARS)算法[21]和隨機(jī)蛙跳(RF)算法[22]分別提取高光譜數(shù)據(jù)的特征波長(zhǎng),并使用提取出的特征波長(zhǎng)建立PLS模型進(jìn)行效果的對(duì)比。采用CARS算法,設(shè)置蒙特卡羅采樣次數(shù)為500次,交叉驗(yàn)證對(duì)折次數(shù)為10。RF算法是基于后啟發(fā)式粒子群算法,結(jié)合可逆跳轉(zhuǎn)馬爾科夫鏈蒙特卡羅算法優(yōu)勢(shì)而優(yōu)化出的一種特征變量提取算法,其迭代過(guò)程更加簡(jiǎn)單直觀,它以計(jì)算出的服從穩(wěn)態(tài)分布的馬爾科夫鏈為基礎(chǔ)來(lái)計(jì)算變量的選擇概率[22] 。為了減少RF算法在建模中所產(chǎn)生的隨機(jī)性,設(shè)定最大迭代為3 000次,初始蛙群數(shù)量設(shè)置為6,最大主成分?jǐn)?shù)為10。
1.7 預(yù)測(cè)模型的建立
深度學(xué)習(xí)是一種數(shù)據(jù)驅(qū)動(dòng)的方法,采用端到端的特征提取方法,可以在數(shù)據(jù)集中提取出所需要的隱含特征[23-24]。深度學(xué)習(xí)通過(guò)使用多層神經(jīng)網(wǎng)絡(luò)作為結(jié)構(gòu)來(lái)獲取多個(gè)抽象、復(fù)雜的數(shù)據(jù)集特征[25]。選用支持向量機(jī)(SVM)[26]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)[27]和基于深度學(xué)習(xí)的定量光譜數(shù)據(jù)分析處理(DeepSpectra)[28]建立預(yù)測(cè)模型,輸入經(jīng)過(guò)處理的數(shù)據(jù)集來(lái)訓(xùn)練模型,不斷調(diào)整模型的超參數(shù)獲取最優(yōu)模型,通過(guò)對(duì)比R2和RMSE評(píng)估不同預(yù)測(cè)模型的效果。
在SVM模型中,使用網(wǎng)格搜索的方法確定核函數(shù)的懲罰系數(shù)和核寬度參數(shù),懲罰系數(shù)的優(yōu)化范圍為[1,10,50,100],核寬度參數(shù)的優(yōu)化范圍為[1×10-8,1×108]。在CNN模型中,使用了2個(gè)卷積層,1個(gè)全連接層和1個(gè)輸出層,卷積層1有8個(gè)大小為7且步進(jìn)為3的卷積核,卷積層2含有12個(gè)大小分別為1、3、5且步進(jìn)為2的卷積核。在DeepSpectra模型中,使用了3個(gè)卷積層,1個(gè)拉伸層,1個(gè)全連接層和1個(gè)輸出層,卷積層1有8個(gè)大小為7且步進(jìn)為3的卷積核,卷積層2有16個(gè)大小分別為1、3且步進(jìn)為2的卷積核,卷積層3有16個(gè)大小分別為1、3、5且步進(jìn)為1的卷積核,并且利用初始模塊(Inception)在第二層卷積層與第三層卷積層之間進(jìn)行并行連接,使模型的深度更深、寬度更寬[29],這樣可以在數(shù)據(jù)集中提取到更加抽象的復(fù)雜特征,進(jìn)而優(yōu)化所構(gòu)建的光譜分析預(yù)測(cè)模型的擬合效果。
2 結(jié)果與分析
2.1 原始光譜數(shù)據(jù)
在蘋(píng)果的高光譜圖像中提取的所有蘋(píng)果原始光譜數(shù)據(jù)如圖2所示。由圖2可以看出,所有蘋(píng)果的光譜曲線整體趨勢(shì)基本一致,在蘋(píng)果光譜曲線上光譜波段為386.82~1 004.50 mm,在670 nm和960 nm波長(zhǎng)附近有明顯的特征峰,670 nm波長(zhǎng)附近的特征峰是葉綠素的吸收峰[30],720 nm波長(zhǎng)附近的特征峰與氮含量有關(guān)[31],960 nm波長(zhǎng)附近的特征峰來(lái)自O(shè)-H鍵的伸縮振動(dòng),與水分子的結(jié)構(gòu)有關(guān)[32-34]。
2.2 蘋(píng)果糖酸比的描述統(tǒng)計(jì)
利用PAL-BX|ACID1 Master Kit便攜式糖酸一體機(jī)測(cè)定蘋(píng)果的可溶性固形物含量、可滴定酸含量,并計(jì)算糖酸比。從圖3和表1可以看出,蘋(píng)果的糖酸比為35.38~88.24,糖酸比的均值、中值都在52.50左右,糖酸比大致符合正態(tài)分布。
2.3 光譜預(yù)處理
如圖4所示,使用預(yù)處理后的光譜數(shù)據(jù)和原始光譜數(shù)據(jù)(RW)分別建立偏最小二乘回歸(PLS)模型,可以更好地分析光譜預(yù)處理的效果。由表2可知,SS、SNV、SG和MSC這4種光譜預(yù)處理方法可能會(huì)在對(duì)原始光譜預(yù)處理的過(guò)程中丟失一些重要信息,影響到所建模型的預(yù)測(cè)準(zhǔn)確性。與其他預(yù)處理方法相比,MSC預(yù)處理后的光譜數(shù)據(jù)的模型預(yù)測(cè)精度較高,其校正集的決定系數(shù)(R2C)達(dá)到0.791 7,均方根誤差(RMSEC)為0.602 3;預(yù)測(cè)集的決定系數(shù)(R2p)達(dá)到了0.794 9,均方根誤差(RMESP)為0.599 7。因此可以得出MSC預(yù)處理效果最佳。
2.4 光譜特征波長(zhǎng)的提取
2.4.1 SPA算法提取特征波長(zhǎng) 使用SPA算法對(duì)特征波長(zhǎng)進(jìn)行提取,由圖5可知,當(dāng)所選的特征波長(zhǎng)數(shù)量為20時(shí)交叉驗(yàn)證均方根誤差(RMSECV)最小,因此提取20個(gè)特征波長(zhǎng),分別為418.43 nm、451.41 nm、479.17 nm、495.05 nm、548.10 nm、570.70 nm、618.65 nm、644.02 nm、668.08 nm、670.76 nm、680.13 nm、681.47 nm、686.82 nm、692.18 nm、733.77 nm、825.34 nm、830.74 nm、913.33 nm、947.30 nm、993.59 nm。
2.4.2 CARS算法提取特征波長(zhǎng) 使用CARS算法對(duì)特征波長(zhǎng)進(jìn)行提取,如圖6所示,隨著蒙特卡羅采樣次數(shù)從1增加到500,所選特征波長(zhǎng)的數(shù)量從462個(gè)減少到1個(gè),在第238次采樣時(shí)RMSECV最小。使用CARS算法提取出的特征波長(zhǎng)有34個(gè),分別為407.89 nm、414.47 nm、465.94 nm、487.11 nm、509.62 nm、521.55 nm、522.88 nm、537.48 nm、538.80 nm、588.00 nm、589.33 nm、603.98 nm、605.32 nm、622.65 nm、685.48 nm、697.54 nm、728.39 nm、745.86 nm、794.31 nm、868.61 nm、871.31 nm、878.08 nm、880.79 nm、913.33 nm、917.41 nm、929.63 nm、944.58 nm、950.02 nm、970.43 nm、971.79 nm、992.23 nm、994.96 nm、996.32 nm、999.05 nm。
2.4.3 RF算法提取特征波長(zhǎng) 使用RF算法對(duì)特征波長(zhǎng)進(jìn)行提取,如圖7所示,選擇概率為0~0.35。大多數(shù)變量的選擇概率較低,僅有少數(shù)變量能夠顯著識(shí)別出特征波長(zhǎng),取RMSE最低為0.118,這一區(qū)間內(nèi)包含30個(gè)特征波長(zhǎng),分別為389.46 nm、396.04 nm、397.35 nm、398.67 nm、399.98 nm、401.30 nm、402.62 nm、410.52 nm、413.16 nm、417.11 nm、421.06 nm、426.34 nm、428.97 nm、430.29 nm、435.57 nm、436.89 nm、456.69 nm、458.01 nm、459.34 nm、467.26 nm、469.91 nm、473.88 nm、673.43 nm、688.16 nm、688. 16 nm、689.50 nm、690.84 nm、694.86 nm、697.54 nm、1 004.50 nm。這些波長(zhǎng)的選擇概率較高,這表明這些波長(zhǎng)對(duì)建模的影響也較大。
2.4.4 特征波長(zhǎng)提取效果與分析 利用多元散射校正預(yù)處理后的光譜數(shù)據(jù),比較未經(jīng)過(guò)特征波長(zhǎng)提取的全波段PLS模型和使用3種特征波長(zhǎng)提取法提取的特征波長(zhǎng)PLS模型。由表3可以看出,與全波段PLS模型相比,經(jīng)過(guò)SPA算法和RF算法提取的特征波長(zhǎng)PLS模型(SPA-PLS、RF-PLS模型)校正集的R2C和預(yù)測(cè)集的R2p均較低,校正集的RMSEC和預(yù)測(cè)集的RMSEP較高,表明SPA-PLS和RF-PLS模型去除了一些具有高度相關(guān)性的有效區(qū)域,導(dǎo)致預(yù)測(cè)性能略差。而經(jīng)過(guò)CARS算法提取的特征波長(zhǎng)PLS模型(CARS-PLS模型)的相關(guān)波段變量數(shù)僅占全波段PLS模型的7.36%,但是經(jīng)過(guò)CARS算法提取的特征波長(zhǎng)模型校正集的R2C是0.854 4,校正集的RMSEC為0.552 3,預(yù)測(cè)集的R2p為0.835 0,預(yù)測(cè)集的RMSEP為0.574 0。表明經(jīng)過(guò)CARS算法提取的特征波長(zhǎng)PLS模型去除了相關(guān)性低的區(qū)域,大大降低了模型的冗余度,并有效地保持了有效區(qū)域,減少檢測(cè)時(shí)間,因此,選擇CARS算法作為特征波長(zhǎng)最佳提取方法。
2.5 預(yù)測(cè)模型對(duì)比
如表4所,DeepSpectra模型的效果要優(yōu)于PLS、SVM、CNN。DeepSpectra模型的R2C為0.945 2,RMSEC為0.387 4,R2p為0.937 0,RMSEP為0.427 0。DeepSpectra模型的RMSEP比其他3個(gè)模型平均低9.16%。同時(shí),預(yù)測(cè)集的R2p比其他3個(gè)模型平均高6.17%。
3 結(jié)論
比較各預(yù)處理方法可以看出, MSC預(yù)處理效果更加優(yōu)異,預(yù)測(cè)集的R2p為0.794 9,RMESP為0.599 7。比較全波段PLS模型與3種特征波長(zhǎng)提取方法提取的特征波長(zhǎng)PLS模型的效果可以看出,CARS算法提取的特征波長(zhǎng)PLS模型效果優(yōu)于全波段PLS模型, R2p達(dá)到0.835 0,RMESP為0.574 0,因此,選用CARS算法進(jìn)行光譜數(shù)據(jù)的特征波長(zhǎng)提取。將PLS模型與3種不同的預(yù)測(cè)模型進(jìn)行對(duì)比,發(fā)現(xiàn)DeepSpe5927f04abe4550be35287940cbe8aacf7e7e62643842be6e9771a3137225dd60ctra模型預(yù)測(cè)集的R2p達(dá)到0.937 0,RMSEP為0.427 0,相較于其他3種預(yù)測(cè)模型,DeepSpectra模型決定系數(shù)更大,均方根誤差更小,可以更好預(yù)測(cè)蘋(píng)果的糖酸比。本研究為基于高光譜和深度學(xué)習(xí)的蘋(píng)果內(nèi)在品質(zhì)無(wú)損檢測(cè)提供了更多參考。
參考文獻(xiàn):
[1] 彭彥昆,孫 晨,趙 苗. 蘋(píng)果品質(zhì)動(dòng)態(tài)無(wú)損感知及分級(jí)機(jī)器手系統(tǒng)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2022,38(16):293-303.
[2] 姜 宏. 煙臺(tái)蘋(píng)果化學(xué)成分分析及果實(shí)品質(zhì)的初步評(píng)價(jià)[D]. 煙臺(tái):煙臺(tái)大學(xué),2014.
[3] 孟慶龍,尚 靜,黃人帥,等. 蘋(píng)果可溶性固形物的可見(jiàn)/近紅外無(wú)損檢測(cè)[J]. 食品與發(fā)酵工業(yè),2020,46(16):205-209.
[4] 郭志明. 基于近紅外光譜及成像的蘋(píng)果品質(zhì)無(wú)損檢測(cè)方法和裝置研究[D]. 北京:中國(guó)農(nóng)業(yè)大學(xué),2015.
[5] 樊書(shū)祥. 基于可見(jiàn)/近紅外光譜及成像技術(shù)的蘋(píng)果可溶性固形物檢測(cè)研究[D]. 楊凌:西北農(nóng)林科技大學(xué),2016.
[6] 查啟明. 基于高光譜成像技術(shù)的蘋(píng)果硬度、水分及可溶性固形物含量的無(wú)損檢測(cè)研究[D]. 南京:南京農(nóng)業(yè)大學(xué),2017.
[7] 馮 迪. 基于高光譜成像蘋(píng)果外觀與內(nèi)部多指標(biāo)檢測(cè)研究[D]. 沈陽(yáng):沈陽(yáng)農(nóng)業(yè)大學(xué),2017.
[8] SIVAKUMAR S, QIAO J, WANG N, et al. Detecting maturity parameters of mango using hyperspectral imaging technique[C]//ASABE. Annual international meeting of the american society of agricultural and biological engineers. Michigan,USA:ASABE, 2009.
[9] 韓如冰. 水果碰傷、糖度和貨架期的高光譜成像技術(shù)檢測(cè)[D]. 南昌:華東交通大學(xué),2018.
[10]SANDRA M, CRISTINA B, JOS B, et al. Astringency assessment of persimmon by hyperspectral imaging[J]. Postharvest Biology and Technology,2017,125:35-41.
[11]FERNANDO M, RENFU L, DIWAN A, et al. Integrated spectral and image analysis of hyperspectral scattering data for prediction of apple fruit firmness and soluble solids content[J]. Postharvest Biology and Technology,2011,62(2):149-160.
[12]ACQUARELLI J, VAN LAARHOVEN T, GERRETZEN J, et al. Convolutional neural networks for vibrational spectroscopic data analysis[J]. Analytica Chimica Acta,2017,954:22-31.
[13]張保華,黃文倩,李江波,等. 基于高光譜成像技術(shù)和MNF檢測(cè)蘋(píng)果的輕微損傷[J]. 光譜學(xué)與光譜分析,2014,34(5):1367-1372.
[14]KANDPAL L M, LOHUMI S, KIM M S, et al. Near-in-frared hyperspectral imaging system coupled with multivariate methods to predict viabiliy and vigor in muskmelon seeds[J]. Sensors & Actuators B:Chemical,2016,229:534-544.
[15]袁旭林. 基于高光譜成像技術(shù)的蘋(píng)果糖度無(wú)損檢測(cè)系統(tǒng)研究[D]. 濟(jì)南:山東大學(xué),2021.
[16]劉燕德,吳明明,孫旭東,等. 黃桃表面缺陷和可溶性固形物光譜同時(shí)在線檢測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(6):289-295.
[17]張金龍. 基于高光譜成像技術(shù)檢測(cè)柿果貨架期的研究[D]. 晉中:山西農(nóng)業(yè)大學(xué),2015.
[18]YANG Q, SUN D W, CHENG W W. Development of simplified models for nondestructive hyperspectral imaging monitoring of TVB-N contents in cured meat during drying process[J]. Journal of Food Engineering,2017,192:53-60.
[19]HE H J, SUN D W. Toward enhancement in prediction of Pseudomonas counts distribution in salmon fillets using NIR hyperspectral imaging[J]. LWT-Food Science and Technology,2015,62(1):11-18.
[20]ARAUJO M C U, SALDANHA T C B, GALVAO R K H, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J]. Chemometrics and Intelligent Laboratory Systems,2001,57(2):65-73.
[21]LI H, LIANG Y, XU Q, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta,2009,648 (1):77-84.
[22]CHEN J Y, LI G H. Prediction of moisture content of wood using Modified Random Frog and VIS-NIR hyperspectral imaging[J]. Infrared Physics & Technology,2020,105:103225.
[23]LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature,2015,521(7553):436-444.
[24]REICHSTEIN M, CAMPSVALLS G, STEVENS B, et al. Deep learning and process understanding for data-driven Earth system science[J]. Nature,2019,566(7743):195-204.
[25]BI Y, YUAN K, XIAO W, et al. A local pre-processing method for near-infrared spectra, combined with spectral segmentation and standard normal variate transformation[J]. Analytica Chimica Acta,2016,909:30-40.
[26]王立國(guó),趙 亮,劉丹鳳. SVM在高光譜圖像處理中的應(yīng)用綜述[J]. 哈爾濱工程大學(xué)學(xué)報(bào),2018,39(6):973-983.
[27]周飛燕,金林鵬,董 軍. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào),2017,40(6):1229-1251.
[28]ZHANG X L, LIN T, XU J F, et al. DeepSpectra:an end-to-end deep learning approach for quantitative spectral analysis[J]. Analytica Chimica Acta,2019,1058:48-57.
[29]SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions[C]//IEEE. 2015 IEEE conference on computer vision and pattern recognition (CVPR). Boston,USA:IEEE,2015.
[30]WANG J, WANG J, CHEN Z, et al. Development of multi-cultivar models for predicting the soluble solid content and firmness of European pear (Pyrus communis L.) using portable VIS-NIR spectroscopy[J]. Sensors (Switzerland),2017,129:143-151.
[31]YU X, LU Q. Deep-learning-based regression mode and hyperspectral imaging for rapid detection of nitrogen concentration in oilseed rape (Brassica napuss L.) leaf[J]. Chemometrics and Intelligent Laboratory Systems,2018,172:188-193.
[32]YU K Q, ZHAO Y R,LIU Z Y, et al. Application of visible and near-infrared hyperspectral imaging for detection of defective features in loquat[J]. Food and Bioprocess Technology,2014,7(11):3077-3087.
[33]孫世鵬,彭 俊,李 瑞,等. 基于近紅外高光譜圖像的冬棗損傷早期檢測(cè)[J]. 食品科學(xué),2017,38(2):301-305.
[34]廉孟茹,張淑娟,任 銳,等. 基于高光譜技術(shù)的鮮食水果玉米含水率無(wú)損檢測(cè)[J]. 食品與機(jī)械,2021,37(9):127-132.
(責(zé)任編輯:成紓寒)
江蘇農(nóng)業(yè)學(xué)報(bào)2024年8期