王紅軍
黎鄒鄒
黎源鴻
(華南農(nóng)業(yè)大學工程學院,廣東 廣州 510642)
?
基于高光譜技術的馬鈴薯外部品質檢測
王紅軍
黎鄒鄒
黎源鴻
(華南農(nóng)業(yè)大學工程學院,廣東 廣州 510642)
為了快速無損檢測馬鈴薯外部品質,研究采用高光譜成像技術對馬鈴薯外部品質分級。選取合格、發(fā)芽、綠皮、孔洞4種馬鈴薯外部特征,獲取光譜數(shù)據(jù),采用不同預處理方法對光譜數(shù)據(jù)進行處理,并分別建立偏最小二乘判別模型,結果顯示采用標準正態(tài)變量變換法(SNV)獲得的模型效果最優(yōu)。對預處理后的光譜數(shù)據(jù)利用連續(xù)投影算法(SPA)及加權權重法(WWM)分別優(yōu)選出了13個和9個特征波段,對兩種不同方法得出的特征波段分別建立了支持向量機判別模型,結果顯示兩種方法對預測集的判別準確率均達到了100%,WWM-SVM判別模型對校正集的交叉驗證率為99.5%,高于SPA-SVM判別模型的交叉驗證率。利用高光譜成像技術結合SPA-SVM和WWM-SVM對馬鈴薯外部品質進行分級具有可行性。
高光譜成像技術;馬鈴薯;連續(xù)投影算法;加權權重法;支持向量機
馬鈴薯是人類四大糧食作物之一,僅次于水稻、小麥、玉米[1]。中國是世界上種植馬鈴薯面積最大的國家,實現(xiàn)馬鈴薯的主糧化,也是中國今后必然的戰(zhàn)略選擇[2]。然而目前中國的馬鈴薯質量不高,商品利用率低,一個很大的問題就是沒有對馬鈴薯進行嚴格的分級[3]。
傳統(tǒng)的分級方法主要為人工識別,依據(jù)人自身的經(jīng)驗判斷,雖然正確率非常高,但是效率低,勞動強度大。高光譜技術是近年來高速發(fā)展的一門新的技術,它是光譜技術與圖像技術的有機結合[4]。利用高光譜技術既可以檢測農(nóng)產(chǎn)品的大小[5]、損傷[6-9],也可以對農(nóng)產(chǎn)品糖度、硬度等其他內(nèi)部成分進行定量分析[10-13]。洪添勝等[14]基于高光譜圖像技術,利用人工神經(jīng)網(wǎng)絡建立了雪花梨含糖量和含水率的預測模型,結果顯示預測值和實際值的相關系數(shù)分別為0.996,0.94;單佳佳等[15]結合高光譜圖像處理和光譜分析方法,實現(xiàn)了蘋果內(nèi)部品質和外部品質的同時檢測;Zhu等[16]以高光譜成像技術結合判別分析方法對6個品種小麥單粒種子進行了識別,取得了較好結果。在馬鈴薯檢測方面,周竹等[17]通過缺陷及合格樣本的高光譜圖像,采用主成分分析法確定了5個特征波段并結合波段比算法和均勻二次差分算法,使缺陷識別率達到了95.65%;高海龍等[18]分別采集了正對、側對及背對相機的三種馬鈴薯的透射和反射的高光譜圖像,對所獲取圖像使用兩次IC分析,并建立相應的PLS-DA識別模型,結果表明正對相機的透射圖像的準確率最高,最后利用子窗口排列分析算法進一步優(yōu)化了PLS-DA識別模型,使得損傷總體的識別率達到了97.39%。
目前利用高光譜技術對馬鈴薯外部品質的檢測主要集中在利用馬鈴薯的高光譜圖像結合圖像處理技術分割出缺陷區(qū)域,對于缺陷種類的判別比較復雜[12]。本研究主要基于馬鈴薯外部不同特征的光譜數(shù)據(jù)之間的差別,比較不同預處理方法及不同特征波段的選取方法建立判別模型的效果,并且提出一種基于主成分分析法選擇特征波段的改進算法,將改進算法結合支持向量機進行試驗數(shù)據(jù)分析,旨在為馬鈴薯外部品質的無損檢測提供參考。
1.1 馬鈴薯樣本
所用的馬鈴薯樣本均采購自廣東省廣州市長湴果蔬市場,品種為費烏瑞它。按照馬鈴薯等級規(guī)格[19],選取240個馬鈴薯,其中外部損傷(發(fā)芽、綠皮、孔洞)各60個,合格60個。將樣本經(jīng)過簡單處理進行高光譜圖像的獲取,圖1為4種外部品質的馬鈴薯樣本的高光譜圖像。
圖1 4種品質的馬鈴薯樣本(510 nm圖像)Figure 1 Four qualities of potato samples(510 nm image)
1.2 儀器設備
試驗使用北京卓立漢光公司研發(fā)的Zo-lix-HyperSIS高光譜成像系統(tǒng)見圖2。硬件主要由成像光譜儀(含CCD攝像頭)、光源、暗箱、電移動載物臺、驅動電機和裝有圖像采集卡的計算機等組成,光譜儀的測量范圍為370~1 000 nm,采樣間隔為1.2 nm。利用HyperSIS高光譜成像系統(tǒng)配套的SpectraSENS-V3.0軟件采集高光譜數(shù)據(jù),設定曝光時間為5 ms,平臺移動速度為12 mm/s,掃描距離為200 mm。研究中用到的數(shù)據(jù)分析軟件有Envi 4.7、Unscrambler 9.7、Excel 2007、Matlab 2014a。
圖2 高光譜成像系統(tǒng)Figure 2 Hyperspectral imaging system
1.3 方法
1.3.1 高光譜圖像的采集 全部樣本在開始采集圖像前需要預先進行校正處理。分別通過蓋住相機鏡頭獲取全黑圖像和采集標準背板圖像獲取白圖像,最終通過式(1)得到校正后的光譜圖像(R):
(1)
式中:
R0——獲得的原始高光譜圖像,Lux;
D——全黑圖像,Lux;
W——反射率為99%的白圖像,Lux;
R——校正后的圖像,Lux。
1.3.2 感興趣區(qū)域光譜的獲取 選取經(jīng)過校正的高光譜圖像中感興趣區(qū)域的光譜平均值作為該樣本的光譜反射值,每個感興趣區(qū)域的像素值范圍在20~120。高光譜圖像在采集范圍內(nèi)的首端和末端存在較大的噪音,去掉首端和末端噪音大的波段,確定450~950 nm的光譜及圖像用于后續(xù)分析,得到了圖3所示的各缺陷馬鈴薯在450~950 nm的平均光譜曲線圖。
圖3 4種品質馬鈴薯樣本光譜曲線Figure 3 Four qualities of potato sample spectral
由圖3可知,各缺陷馬鈴薯樣本的平均光譜曲線差別較大,其中合格、發(fā)芽、孔洞馬鈴薯樣本的平均光譜在450~950 nm呈現(xiàn)遞增趨勢,并且合格馬鈴薯樣本平均光譜一直大于發(fā)芽、孔洞馬鈴薯樣本平均光譜;綠皮馬鈴薯樣本的平均光譜起伏比較大,在680 nm左右處呈現(xiàn)明顯波谷,并在720 nm左右超過合格馬鈴薯樣本的平均光譜值。
1.3.3 波段選取方法 光譜數(shù)據(jù)量一般比較大,雖然能夠更多地體現(xiàn)對象的屬性特征,但是也會在一定程度上造成數(shù)據(jù)的冗余,給后續(xù)的分析處理帶來一定的麻煩。在利用光譜數(shù)據(jù)建立數(shù)學模型時,一般要先進行特征波段的選取。SPA算法是一種新興的波長選取方法[20],能夠有效消除眾多波長變量之間的共線性影響,是一種特征變量前向選擇算法。
本研究采用了連續(xù)投影算法(successive projections algorithm,SPA)和一種基于主成分分析法的改進算法來選取特征波段。
2.1 光譜數(shù)據(jù)預處理
高光譜數(shù)據(jù)采集過程中,光源分布不均以及各種噪聲和誤差的存在都會對光譜數(shù)據(jù)產(chǎn)生一定的影響。在利用獲取的光譜數(shù)據(jù)建模前必須進行光譜預處理,本試驗采用了無處理、移動平滑(MAS)、Savitzky Golay平滑、中值濾波平滑(MFS)、歸一化、一階導數(shù)、二階導數(shù)、多元散射校正(MSC)、標準正態(tài)變量校正(SNV)、中心化(MC)10種方法對原始光譜數(shù)據(jù)進行預處理。將240個樣本按照K-stone算法[21]選取192個樣本作為建模集,剩余48個樣本作為預測集,其中每個品種建模集48個,預測集12個。通過Unscrambler 9.7軟件建立192個建模集樣本的偏最小二乘判別模型,采用全交叉驗證,利用剩余的48個預測集樣本進行預測,結果見表1。
表1 不同預處理方法的最小二乘判別模型結果
Table 1 Partial least squares discriminant model results of different pretreatment methods
預處理方法預測樣本數(shù)/個判別正確個數(shù)/個正確率/%R2均方根誤差(RMSE)無484695.80.9350.283移動平滑484695.80.9350.285SG平滑484797.90.9380.280中值濾波484593.80.9350.286歸一化484797.90.9160.333一階導數(shù)481225.00.9370.281二階導數(shù)481225.00.8920.367多元散射484695.80.9190.318標準正態(tài)4848100.00.9380.278中心化4848100.00.9350.286
由表1可知,不同預處理方法對判別結果有不同的影響,不同方法建立的模型的決定系數(shù)(R2)基本上都能達到0.9 以上,其中一階導數(shù)、二階導數(shù)進行處理后判別的正確率均為25%,這可能是進行導數(shù)處理后引進了較大的噪聲,對判別模型產(chǎn)生了不利影響;標準正態(tài)化和中心化預處理的判別率均達到了100%,考慮到標準正態(tài)化預處理的決定系數(shù)(R2)更大為0.938,均方根誤差更小,所以本試驗采用標準正態(tài)化來對光譜進行預處理。
2.2 基于主成分的聚類分析
由圖4可知,4種不同缺陷的馬鈴薯樣本明顯分成4類,其中合格馬鈴薯樣本主要聚集在第一象限內(nèi),發(fā)芽馬鈴薯樣本主要集中在坐標原點附近,綠皮馬鈴薯樣本主要位于第四象限,孔洞馬鈴薯樣本主要聚集于橫坐標軸的左側,沿坐標軸上下分布,說明PC1、PC2對4種缺陷的馬鈴薯有較好的聚類作用。
圖4 第一、二主成分得分圖Figure 4 Scores scatter plot of PC1 and PC2
2.3 特征波長的選取
利用SPA算法對4種經(jīng)過光譜預處理后的缺陷馬鈴薯光譜數(shù)據(jù)進行特征波長的選取,所得結果見圖5。由圖5(a)可知,當特征波段數(shù)量為13時,RMSE的值較小且隨波段數(shù)的增加也沒有明顯變化。由圖5(b)可知,特征波段所對應的波段的位置從matlab得出的結果集中可獲取,選擇(450,556,563,590,653,725,764,832,844,846,856,863,868 nm)這13個特征波段進行后續(xù)建模分析。
圖5 SPA算法特征波段選擇結果Figure 5 SPA algorithm feature band selection results
主成分分析法是高光譜數(shù)據(jù)降維以及特征波長選擇中常用的方法之一[22]。它的基本思路為:先對光譜數(shù)據(jù)進行主成分分析,得出各主成分的貢獻率,根據(jù)貢獻率選擇主成分或者主成分對應的權重曲線圖來選擇特征波段。經(jīng)過前面的主成分分析可知馬鈴薯不同缺陷光譜數(shù)據(jù)的第一、二主成分的總貢獻率為97%,因此考慮用第一、二成分的權重曲線圖來選取特征波段,圖6為第一、二主成分權重載荷圖。 根據(jù)圖6在選擇特征波段時常用的思路為分別選擇第一、二主成分權重曲線的極值點對應的波段作為特征波段,本試驗提出了一種加權權重法(WWM),考慮到每個主成分的貢獻率不同,提出式(2):
(2)
式中:
P——最終權重值;
劉少奇因勢利導接著說,要做到赤白區(qū)間物資交換,除了籌集物資,還要運輸物資。前者已有外貿(mào)局在做,后者誰來做呢?當然是我們工會做最合適。一來我們有充足的人力,二來我們有大量的木船、獨輪車等工具,三來我們還有豐富的運輸工作經(jīng)驗。況且我們這里有贛江這條河流貫通赤白區(qū),河道運輸比陸路運輸不僅運量大,而且自身消耗少、周轉速度快。所以,我們應該下大力氣做好河道運輸工作,為反封鎖斗爭作出我們工會應有的貢獻。
C1、C2——第一、二主成分貢獻率;
ω1、ω2——第一、二主成分各波段的權重值。
圖6 第一、二主成分權重載荷圖Figure 6 The loading plot of PC1 and PC2
由于在選擇特征波段時只關注權重值的數(shù)值大小,所以給權重值加了絕對值。對圖6利用式(2)進行變換,得到加權權重載荷圖見圖7。選取上述加權權重載荷曲線的極值點以及首尾波段總共9個波段作為特征波段,從圖7中可以看出這9個特征波段分別為450,547,559,581,680,697,714,844,951 nm。經(jīng)過上述連續(xù)投影算法(SPA)和加權權重法(WWM)分別選擇了13個和9個波段作為特征波段。
2.4 基于特征波長的判別模型
特征波段作為訓練數(shù)據(jù),選擇徑向基(RBF)核函數(shù)為核函數(shù)類型,結合交叉驗證和網(wǎng)格搜索,讓c和g在一定范圍內(nèi)取值來尋找最優(yōu)參數(shù)c和g,利用優(yōu)化后的c和g再來訓練模型并對48個預測集樣本進行預測,所得結果見表2。由表2可知,兩種特征波段的選取方法建立的支持向量機判別模型預測集的準確率均達到了100%,其中WWM-SVM判別模型的交叉驗證準確率為99.5%高于SPA-SVM判別模型的96.9%,模型的適用性更強,并且 WWM方法得到的特征波段數(shù)量要少于SPA,建立模型的時間短,綜合評價WWM-SVM判別模型優(yōu)于SPA-SVM判別模型。
圖7 加權權重載荷圖Figure 7 Weighted loading plot
表2 支持向量機判別模型結果Table 2 Results of SVM discrimination model
本試驗以馬鈴薯的4種不同缺陷為研究對象,采用高光譜成像技術獲取4種缺陷馬鈴薯感興趣區(qū)域的光譜數(shù)據(jù),采用不同預處理方法,利用全波段數(shù)據(jù)建立偏最小二乘判別模型,根據(jù)均方根誤差(RMSEP)、決定系數(shù)(R2)以及預測準確率選擇標準正態(tài)變量變換法(SNV)為最優(yōu)預處理方法。采用連續(xù)投影算法并提出了一種加權權重法來選取特征波段,分別選取了13個波段和9個波段作為特征波段。
針對不同特征波段的選取方法,分別建立兩個支持向量機判別模型,結果顯示兩個判別模型的預測集的判別準確率均達到了100%,而WWM-SVM判別模型的交叉驗證準確率為99.5%高于SPA-SVM判別模型的96.9%,綜合分析WWM-SVM判別模型優(yōu)于SPA-SVM判別模型,也說明了利用高光譜技術對馬鈴薯外部缺陷檢測是可行的。
[1] 李小平. 馬鈴薯機械化生產(chǎn)現(xiàn)狀及發(fā)展對策[J]. 青海農(nóng)林科技, 2015(2): 111-112.
[2] 謝建華. 我國馬鈴薯生產(chǎn)現(xiàn)狀及發(fā)展對策[J]. 中國農(nóng)技推廣, 2007, 23(5): 4-7.
[3] 周伶俐, 胥成剛, 周耀建. 馬鈴薯質量缺陷原因分析及防范措施[J]. 現(xiàn)代農(nóng)業(yè)科技, 2010(22):132-133.
[4] 馬本學, 應義斌, 饒秀勤, 等. 高光譜成像在水果內(nèi)部品質無損檢測中的研究進展[J]. 光譜學與光譜分析, 2009, 29(6): 1 611-1 615.
[5] 程國首, 郭俊先, 石砦, 等. 基于高光譜圖像技術的新疆紅富士蘋果重量預測[J]. 新疆農(nóng)業(yè)大學學報, 2011, 34(3): 249-252.
[6] DIWAN P, ARIANA, LU Ren-fu, et al. Near-infrared hyperspectral reflectance imaging for detection of bruises on picking cucumber[J]. Computer and Electronics in Agricultures, 2006, 53(1): 60-70.
[7] 趙杰文, 劉劍華, 陳全勝, 等. 利用高光譜圖像技術檢測水果輕微損傷[J]. 農(nóng)業(yè)機械學報, 2008, 39(1): 106-109.
[8] BARANOWSKI P, MAZUREK W, WOZNIAK J, et al. Detection of early bruises in apples using hyperspectral data and thermal imaging[J]. Journal of Food Engineering, 2012, 110(3): 345-355.
[9] LI Jiang-bo, RAO Xiu-qin, YING Yi-bin. Development of algorithms for detecting citrus canker based on hyperspectral reflectance imaging[J]. Journal of The Science of Food and Agriculture, 2012, 92(1): 125-134.
[10] 郭恩有, 劉木華, 趙杰文, 等. 臍橙糖度的高光譜圖像無損檢測技術[J]. 農(nóng)業(yè)機械學報, 2008, 39(5): 91-93, 103.
[11] ZHAO Jie-wen, CHEN Quan-sheng, VITTAYAPADUNG S, et al. Determination of apple firmness using hyperspectral imaging technique and multivariate calibrations [J].Transactions of the CSAE, 2009, 25(11): 226-231.
[12] 周竹, 李小昱, 高海龍, 等. 馬鈴薯干物質含量高光譜檢測中變量選擇方法比較[J]. 農(nóng)業(yè)機械學報, 2012, 43(2): 128-133, 185.
[13] RAJKUMAR P, WANG Ning, EIMASRY G, et al. Studies on banana fruit quality and maturity stages using hyperspectral imaging[J]. Journal of Food Engineering, 2012, 108(1): 194-200.
[14] 洪添勝, 喬軍, MICHAEAL O Ngadi, 等. 基于高光譜圖像技術的雪花梨品質無損檢測[J]. 農(nóng)業(yè)工程學報, 2007,23(2): 151-155.
[15] 單佳佳, 彭彥昆, 王偉, 等. 基于高光譜成像技術的蘋果內(nèi)外部品質同時檢測[J]. 農(nóng)業(yè)機械學報, 2011, 42(3): 140-144.
[16] ZHU Da-zou, WANG Kun, PAN Bin-shuang, et al. Identification of Wheat Cultivars Based on the Hyperspectral Image of Single Seed[J]. Journal of Nanoelectronics and Optoelectronics, 2012, 7: 167-172.
[17] 周竹, 李小昱, 陶海龍, 等. 基于高光譜成像技術的馬鈴薯外部缺陷檢測[J]. 農(nóng)業(yè)工程學報, 2012, 28(21): 221-228.
[18] 高海龍, 李小昱, 徐森淼, 等. 透射和反射高光譜成像的馬鈴薯損傷檢測比較研究[J]. 光譜學與光譜分析, 2013, 33(12): 3 366-3 371.
[19] 中華人民共和國農(nóng)業(yè)部. NY/T 1066—2006 馬鈴薯等級規(guī)格[S]. 北京: 中國農(nóng)業(yè)出版社, 2006.
[20] ARAUJO M C U, SALDANHA T C B, GALVAO R K H, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J]. Chemometrics and Intelligent Laboratory Systems, 2001, 57: 65-73.
[21] WU Wei, WALCZAK B, MASSART D L, et al. Artificial neural networks in classification of NIR spectral data: design of the training set[J]. Chemometrics and Intelligent Laborary System, 1996, 33(1): 35-46.
[22] 吳佳, 湯全武, 史崇升, 等. 馬鈴薯品質無損檢測技術研究進展[J]. 食品與機械, 2014, 30(3): 257-271.
Detection of potato external quality based on hyperspectral technology鄧建猛DENG Jian-meng
WANGHong-jun
LIZou-zou
LIYuan-hong
(CollegeofEngineering,SouthChinaArgriculturalUniversity,Guangzhou,Guangdong510642,China)
In order to detect the external quality of potato quickly, the hyperspectral imaging technology was used. Potato with germination and other three kinds of common defects were studied. The partial least-squares discriminant model were built after different pretreatment methods for spectral data processing. The results showed that pretreatment method of SNV was the best. 13 and 9 feature bands were selected after using successive projections algorithm (SPA) and weighted weight method (WWM) for spectral data preprocessed. The support vector machine (SVM) discriminant model were established for both SPA and WWM. Our results also showed that the two methods to predict the set of discriminant accuracy reached 100%. WWM-SVM discriminant model of calibration set of cross validation rate was 99.5%, higher than that of the SPA-SVM discriminant model. The study demonstrated the feasibility of using hyperspectral imaging technology combined with WWM-SVM and SPA-SVM for potato external quality grading.
hyperspectral imaging technology; potato; successive projection algorithm; weighted weight method; support vector machine
廣東省科技計劃項目(編號:2016A010102013)
鄧建猛,男,華南農(nóng)業(yè)大學在讀碩士研究生。
王紅軍(1966-),女,華南農(nóng)業(yè)大學教授,博士,碩士生導師。E-mail: xtwhj@scau.edu.cn
2016—10—31
10.13652/j.issn.1003-5788.2016.11.027