李成吉,張淑娟,任 銳,廉孟茹,池江濤,穆炳宇,孫雙雙
(山西農(nóng)業(yè)大學(xué)工學(xué)院,山西晉中 030801)
核桃是世界四大堅果之一,含有豐富的優(yōu)質(zhì)脂肪、蛋白質(zhì)、碳水化合物,以及磷、鈣、鐵、鉀等礦物元素和維B、維C、維E等,是重要的木本糧油產(chǎn)品,被認(rèn)為是天然營養(yǎng)補品[1]。由于環(huán)境因素和人為因素的影響,核桃在生長、采摘、運輸及貯藏過程中容易產(chǎn)生缺陷[2]。根據(jù)標(biāo)準(zhǔn)GB/T 20398—2006《核桃堅果質(zhì)量等級》,核桃的外部出現(xiàn)黑斑是缺陷的主要特征之一[3],這不僅會影響外觀品質(zhì),還會因吸濕產(chǎn)生霉變。因此需要一種快速、準(zhǔn)確識別核桃黑斑的方法。
高光譜成像技術(shù)具有分辨率高、多波段、圖譜合一等優(yōu)點,廣泛應(yīng)用于農(nóng)產(chǎn)品無損檢測研究中。程帆等人[4]使用高光譜技術(shù)對病害早期脅迫下黃瓜葉片中過氧化物酶活性進(jìn)行研究,結(jié)果表明RF-PLSR模型具有最佳預(yù)測效果,預(yù)測集相關(guān)系數(shù)為0.816,均方根誤差為11.235。曹曉峰等人[5]基于高光譜技術(shù)結(jié)合特征波長和光譜指數(shù)對冬棗成熟度進(jìn)行可視化判別,結(jié)果表明根據(jù)SPA和CARS選擇的特征波長和引入SIs建立的PLS-DA模型判別精度分別為97.27%,95.45%,98.18%。何嘉琳等人[6]利用高光譜成像技術(shù)對靈武長棗維C含量的無損檢測方法進(jìn)行研究,結(jié)果表明基于CARS建立的PLS模型效果最優(yōu)。
試驗以正常核桃和黑斑核桃為研究對象,利用高光譜成像系統(tǒng)采集樣本光譜和圖像信息,從光譜和圖像2個方面對核桃黑斑缺陷進(jìn)行識別,為黑斑核桃在線檢測提供理論依據(jù)。
試驗樣本為山西汾陽“禮品2號”核桃,人工挑選質(zhì)地均勻的正常核桃和黑斑核桃各80個,利用Kennard-Stone算法[7]將樣本按3∶1分為校正集和預(yù)測集,其中校正集各60個,預(yù)測集各20個。
試驗采用北京卓立公司開發(fā)的“蓋亞”高光譜分選儀對樣本進(jìn)行光譜圖像信息采集,儀器主要由光譜相機、4個35W溴鎢燈、移動平臺、暗箱、計算機組成,采集波長范圍為900~1 700 nm。采集信息前需調(diào)節(jié)曝光時間和平臺移動速度,防止因信息過度飽和而出現(xiàn)失真現(xiàn)象。經(jīng)過試驗,設(shè)置曝光時間為20 ms,平臺移動速度為1.5 cm/s,樣本與鏡頭距離為22 cm。
區(qū)域生長算法(Region grow)[8]是一種串行區(qū)域分割的圖像分割方法,其基本思想是將具有相似性質(zhì)的像素集合起來構(gòu)成區(qū)域。根據(jù)同一物體區(qū)域內(nèi)像素的相似性質(zhì)來聚集像素點,從初始區(qū)域開始,將相鄰的具有同樣性質(zhì)的像素或其他區(qū)域歸并到目前的區(qū)域中,從而逐步增長區(qū)域,直至沒有可以歸并的點或其他小區(qū)域為止。
使用ENVI提取感興趣區(qū)域功能,分別提取正常核桃外殼和黑斑核桃黑斑區(qū)域的光譜信息,然后求取平均光譜。
不同區(qū)域平均光譜圖見圖1。
由圖1可知,正常核桃和黑斑核桃平均光譜曲線有很大差別。在1 400 nm之前,正常核桃反射率大于黑斑核桃,在1 400 nm之后,正常核桃反射率低于黑斑核桃,這有利于后續(xù)判別模型的建立。
主成分分析(Principalcomponentanalysis,PCA)[9]是一種去除波段之間多余信息、將多波段信息壓縮到比原波段更有效的少數(shù)幾個轉(zhuǎn)換波段的方法。該方法不但可以避免信息間的互相重疊,而且通過數(shù)據(jù)簡化,提取最具代表性的變量子集,且變量之間互不相關(guān)。
前6個主成分的累計貢獻(xiàn)率見表1。
表1 前6個主成分的累計貢獻(xiàn)率
由表1可知,前5個主成分的累計貢獻(xiàn)率已達(dá)99.90%,因此選用前5個主成分信息進(jìn)行后續(xù)研究。
偏最小二乘回歸法(PLS)[10]是一種線性回歸模型,其核心思想是把觀測到的數(shù)據(jù)分成多個部分,每部分?jǐn)?shù)據(jù)進(jìn)行不同權(quán)重的線性組合后可用來表示該區(qū)域的相應(yīng)值。
根據(jù)提取的前5個主成分信息,建立PLS判別模型。樣本分別賦值作為判別依據(jù),將正常核桃賦值為1,黑斑核桃賦值為2,以0.5為最大偏離值。
PLS模型預(yù)測結(jié)果見圖2。
由圖2可知,正常核桃和黑斑核桃的識別率均為100%,說明基于光譜信息可以實現(xiàn)對黑斑核桃的檢測。
由于光譜信息的前5個主成分累計貢獻(xiàn)率較高,提取黑斑核桃樣本前5個主成分圖像。
黑斑核桃5個主成分圖見圖3。
由圖3可知,PC-1圖樣本和背景相差最明顯,PC-2圖樣本黑斑區(qū)域被凸顯出來,而PC-3~PC-4圖噪聲較大,難以處理。
黑斑識別關(guān)鍵步驟見圖4。
首先對PC-1圖進(jìn)行掩膜(Mask)處理,然后運用“Canny”算子分割出樣本邊緣,再對邊緣進(jìn)行填充,最后對圖像進(jìn)行取反,生成模板圖像;對PC-2圖采用區(qū)域生長算法(Region grow) 提取黑斑區(qū)域圖;最后將模板圖像與黑斑區(qū)域圖進(jìn)行合并。
按照上述方法,對黑斑核桃進(jìn)行圖像識別,均取得較好效果,列舉10個黑斑樣本識別效果圖。
識別效果圖見圖5。
基于高光譜成像技術(shù)從光譜和圖像2個角度對黑斑核桃進(jìn)行判別和識別。采用PCA對光譜數(shù)據(jù)進(jìn)行壓縮,提取前5個主成分,建立PLS判別模型,模型對正常和黑斑核桃判別率均為100%。提取前5個主成分圖像,分別對第1個主成分圖像和第2個主成分圖像進(jìn)行掩膜、“Canny”算子、圖像填充、區(qū)域生長算法(Region grow) 提取模板圖像和黑斑區(qū)域,以實現(xiàn)對黑斑的識別。結(jié)果表明,基于高光譜成像技術(shù)可以實現(xiàn)對黑斑核桃的檢測識別,為開發(fā)黑斑核桃在線檢測設(shè)備提供理論依據(jù)。