摘 要:針對(duì)香腸中硝酸鹽含量,提出基于高光譜的無損快速檢測(cè)。采集400~1 000 nm范圍內(nèi)45 組香腸樣品高光譜數(shù)據(jù),進(jìn)行主成分分析(principal component analysis,PCA),擇優(yōu)選取主成分圖像3(principal component 3,PC3)作為研究對(duì)象,并得到4 個(gè)特征波長(zhǎng),分別為402.47、483.04、642.27、961.82 nm。通過特征波長(zhǎng)與波譜對(duì)比,最終采用800~950 nm范圍內(nèi)的波長(zhǎng)進(jìn)行亞硝酸鹽定量分析建模。結(jié)合樣品感興趣區(qū)域平均光譜和理化檢驗(yàn)結(jié)果,采用偏最小二乘回歸和遺傳算法優(yōu)化的人工神經(jīng)網(wǎng)絡(luò)進(jìn)行定量分析建模。結(jié)果顯示:偏最小二乘回歸模型的決定系數(shù)R2為0.899,交互驗(yàn)證均方根誤差(root mean square error of cross-validation,RMSECV)為0.291,遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)模型的決定系數(shù)R2為0.918,RMSECV為0.365,隨著樣品數(shù)增多,神經(jīng)網(wǎng)絡(luò)的建模效果會(huì)越來越優(yōu)于偏最小二乘回歸建模。
關(guān)鍵詞:亞硝酸鹽;高光譜技術(shù);偏最小二乘法;遺傳算法;人工神經(jīng)網(wǎng)絡(luò)算法
Abstract: This paper proposes a rapid and nondestructive method based on hyperspectral imaging system to detect the nitrite content in sausages. Firstly, the hyperspectral data in the wavelength range of 400–1 000 nm of 45 sausage samples were obtained and analyzed by principal component analysis. The third principal component (PC3) was selected for investigation, and four characteristic wavelengths were obtained, i.e. 402.47, 483.04, 642.27 and 961.82 nm. Furthermore, by combing the characteristic wavelengths and spectra, the data in the wavelength range of 800–950 nm were definitively chosen to build the models for quantitative analysis of nitrite in sausages based on the average spectra obtained from the region of interest (ROI) and chemical measurements using partial least squares regression (PLSR) and genetic algorithm (GA)-optimized back propagation neural network (BPNN). Results showed that the determination coefficient (R2) and root mean square error of cross-validation (RMSECV) of the PLSR model were 0.899 and 0.291, respectively, whereas those of the BPNN model were 0.918 and 0.365, respectively. As the number of samples increased, the BPNN model was increasingly superior to the PLSR model.
Key words: nitrite; hyperspectal imaging system; partial least squares (PLS); genetic algorithm (GA); neural network
DOI:10.15922/j.cnki.rlyj.2016.12.005
中圖分類號(hào):TS201.6 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-8123(2016)12-0022-06
引文格式:
陳曉東, 郭培源. 基于主成分分析法提取高光譜圖像特征檢測(cè)香腸亞硝酸鹽含量[J]. 肉類研究, 2016, 30(12): 22-27. DOI:10.15922/j.cnki.rlyj.2016.12.005. http://rlyj.cbpt.cnki.net
CHEN Xiaodong, GUO Peiyuan. Detection of nitrite in sausages based on feature extraction of hyperspectral images using principal component analysis[J]. Meat Research, 2016, 30(12): 22-27. (in Chinese with English abstract) DOI:10.15922/j.cnki.rlyj.2016.12.005. http://rlyj.cbpt.cnki.net
香腸在我國(guó)有著悠久的歷史,在生產(chǎn)以及貯存過程中,香腸難免會(huì)出現(xiàn)質(zhì)量問題,人們食用此類香腸會(huì)引發(fā)健康問題。亞硝酸鹽作為肉制品護(hù)色劑,適量使用可以增加肉的風(fēng)味和起到防腐劑作用[1]。但是如果含量超標(biāo),成人食用0.3~0.5 g即可引起中毒,3 g可導(dǎo)致死亡,因此國(guó)家對(duì)肉類中的亞硝酸鹽含量嚴(yán)格限制在
0.03 g/kg。目前檢測(cè)方法主要是通過理化方法進(jìn)行,這種檢測(cè)方法雖然檢測(cè)精確度高,但是檢測(cè)周期長(zhǎng),檢測(cè)流程繁瑣,對(duì)檢測(cè)環(huán)境要求高,不利于大眾檢測(cè)。
高光譜檢測(cè)技術(shù)結(jié)合了圖像技術(shù)和光譜技術(shù),有快速、圖譜合一、無損等特點(diǎn)[2-4]。高光譜檢測(cè)可使用400~1 000 nm的波段。國(guó)內(nèi)外研究者Haff[5]、Polder[6]、張雷蕾[7]、Barbin[8]、陳全勝[9]等分別已利用高光譜技術(shù)對(duì)芒果果蠅侵染程度、西紅柿品質(zhì)、水果品質(zhì)、豬肉新鮮度、鮮肉顏色、豬肉嫩度等進(jìn)行過研究,都達(dá)到了預(yù)期檢測(cè)效果?;谝陨涎芯浚緦?shí)驗(yàn)提出基于高光譜及主成分特征與香腸亞硝酸鹽含量的相關(guān)性研究,擬構(gòu)建一種對(duì)香腸亞硝酸含量的快速檢測(cè)方法。
1 材料與方法
1.1 材料與試劑
本次實(shí)驗(yàn)樣品購(gòu)于北京家樂福超市。樣品為保質(zhì)期6 個(gè)月的不同生產(chǎn)日期的廣味香腸,共45 根,其中距離生產(chǎn)日期1 個(gè)月內(nèi)的25 根,距離生產(chǎn)日期3 個(gè)月以內(nèi)的10 根,接近過期的10 根。對(duì)樣品進(jìn)行拆封并置于保鮮袋中,之后放于冰箱中保存等待檢測(cè)。
1.2 儀器與設(shè)備
高光譜成像系統(tǒng)主要由光譜儀、電荷耦合器件(charge coupled device,CCD)相機(jī)、傳送裝置、PC計(jì)算機(jī)、暗箱等幾部分組成。為了保證光譜采集環(huán)境的穩(wěn)定性,整個(gè)采集過程在暗箱中進(jìn)行。高光譜圖像是一個(gè)三維的數(shù)據(jù)矩陣(x,y,l),其中(x,y)代表兩維的空間維度,l代表一維的光譜維度[10],檢測(cè)原理是香腸所含不同品質(zhì)對(duì)應(yīng)不同化學(xué)組成和物理特性,體現(xiàn)在高光譜某一特征峰可以表示亞硝酸鹽的物質(zhì)屬性及含量,從而可以通過分析光譜信息實(shí)現(xiàn)香腸中亞硝酸鹽的定性或定量檢測(cè)[11]。
1.3 方法
1.3.1 高光譜數(shù)據(jù)采集
將樣品從保鮮袋中取出置于水平移動(dòng)臺(tái)上,依次對(duì)45 個(gè)樣品進(jìn)行高光譜數(shù)據(jù)采集,采集時(shí)要保持采集環(huán)境的穩(wěn)定,光譜采集范圍是400~1 000 nm,采樣分辨率為5 nm,傳送速率為100 mm/s,總共得到128 個(gè)波段。
采集過程中考慮到外界環(huán)境影響及光源因素,需要對(duì)光譜進(jìn)行黑白校正[12]。即掃描標(biāo)準(zhǔn)白板得到全白圖像W,關(guān)閉相機(jī)快門得到全黑圖像B,利用R=(I-B)/(W-B)
進(jìn)行黑白校正,其中I為原始圖像,R為校正后的圖像??紤]底板對(duì)整個(gè)光譜分析的影響,采用感興趣區(qū)域(region of interest,ROI)工具對(duì)原始光譜圖像進(jìn)行剪切。
1.3.2 主成分分析
主成分分析可以達(dá)到去除波段冗余信息、數(shù)據(jù)降維目的[13]。每個(gè)主成分圖像都是由原波段線性組合,根據(jù)各波段權(quán)系數(shù)即可得到相應(yīng)的主成分圖像(principal component image,PCI)的特征波長(zhǎng),按式(1)計(jì)算。
1.3.5 偏最小二乘法建模
偏最小二乘回歸(partial least squares regression,PLS)是對(duì)一般最小二乘回歸(ordinary least squares regression,OLS)的擴(kuò)展,它集主成分分析與多因變量多自變量回歸建模于一體,一次計(jì)算后可實(shí)現(xiàn)預(yù)測(cè)建模和簡(jiǎn)化多變量系統(tǒng)[16]。PLS建立自變量的潛變量關(guān)于因變量的潛變量的線性回歸建模,間接反映自變量與因變量的關(guān)系,自變量與因變量分別按式(3)、(4)計(jì)算。
PLS分別應(yīng)用X和Y的潛變量,采取迭代方法,每一次迭代調(diào)整ta、ua使之到最后殘差矩陣中的元素絕對(duì)值近似為0。
1.3.6 遺傳算法(genetic algorithm,GA)優(yōu)化的人工神經(jīng)網(wǎng)絡(luò)建模
BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播的多層前饋網(wǎng)絡(luò)。通過梯度下降法學(xué)習(xí)規(guī)則,通過反向傳播不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值使網(wǎng)絡(luò)達(dá)到最優(yōu)[17-22]。本次實(shí)驗(yàn)中神經(jīng)網(wǎng)絡(luò)建模使用35 組樣品作為訓(xùn)練集,10 組樣品作為驗(yàn)證集。
GA通過模擬進(jìn)化論自然選擇和生物遺傳機(jī)理,運(yùn)用交叉、變異等方法來尋找種群中的最優(yōu)解。本實(shí)驗(yàn)中使用遺傳算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)中的權(quán)值和閾值,尋找最優(yōu)解并輸送到神經(jīng)網(wǎng)絡(luò)中進(jìn)行樣本預(yù)測(cè)。
2 結(jié)果與分析
2.1 光譜圖譜信息
對(duì)45 個(gè)香腸樣品圖像進(jìn)行主成分分析,根據(jù)方差累計(jì)貢獻(xiàn)率排列,取前4 幅圖像進(jìn)行研究,如圖4所示。
根據(jù)主成分分析特點(diǎn),選擇各波段權(quán)重系數(shù)最大的幾個(gè)波段作為特征波長(zhǎng)進(jìn)行香腸亞硝酸鹽含量研究。通過主成分分析得到以下4 個(gè)特征波長(zhǎng),分別為band7、band23、band54、band114,對(duì)應(yīng)的波長(zhǎng)分別為402.47、483.04、642.27、961.82 nm。
2.3 樣品感興趣區(qū)域光譜的提取
ROI工具可以從原圖像中提取所要研究亞硝酸鹽對(duì)象的區(qū)域[23],分別對(duì)45 組樣品提取如下感興趣區(qū)域,其中
1組樣品選取的感興趣區(qū)域如圖5所示。
2.4 理化實(shí)驗(yàn)結(jié)果
檢測(cè)樣品分為3 類,即距離生產(chǎn)日期1個(gè)月內(nèi)的25 組,距離生產(chǎn)日期3 個(gè)月以內(nèi)的10 組,接近過期的10 組。經(jīng)過理化實(shí)驗(yàn),測(cè)得45 組樣品亞硝酸鹽含量信息如表1所示。
由表1可知,理化實(shí)驗(yàn)測(cè)得樣本亞硝酸鹽含量最小為1.40 mg/kg,為距離生產(chǎn)日期最近的一組樣品,最大是3.93 mg/kg,為接近過期的一組樣品;理化實(shí)驗(yàn)標(biāo)準(zhǔn)偏差為91.87%。實(shí)驗(yàn)結(jié)果表明,隨著放置時(shí)間的增長(zhǎng),香腸中亞硝酸鹽含量也隨著增加。
2.5 圖譜對(duì)比
由圖7可知,含有亞硝酸鹽樣品在900 nm附近有明顯的吸收峰(實(shí)線譜線Y),而未檢出亞硝酸鹽的樣品(<1 mg/kg)則沒有(虛線譜線N)。實(shí)驗(yàn)表明,900 nm附近的吸收峰可能是由香腸中亞硝酸鹽引起的。由光譜曲線可以看出低波段(400~450 nm)和高波段(950~1 000 nm)附近的噪音特別大,不利于樣品定量分析,600~800 nm的光譜曲線無明顯吸收,對(duì)定量分析的結(jié)果也不夠精確,因此,結(jié)合特征波長(zhǎng)和波譜對(duì)比結(jié)果,選用800~950 nm這一波段作為特征波段,以此來對(duì)香腸中亞硝酸鹽含量進(jìn)行定量分析[24]。
2.6 光譜預(yù)處理
圖8和圖9分別為預(yù)處理前的光譜以及經(jīng)過一階導(dǎo)數(shù)+矢量歸一化預(yù)處理后的光譜。
2.7 偏最小二乘建模分析
偏最小二乘建模過程中使用35 組樣品作為校正集進(jìn)行建模,10 組樣本作為驗(yàn)證集進(jìn)行檢驗(yàn)?zāi)P偷臏?zhǔn)確性,最終得到亞硝酸鹽預(yù)測(cè)模型交叉檢驗(yàn)如圖10所示。
2.8 人工神經(jīng)網(wǎng)絡(luò)建模分析
通過主成分分析以及波譜圖比較得到150 nm長(zhǎng)度的定量分析波長(zhǎng)范圍,系統(tǒng)采樣分辨率為5 nm,因此可以得到30 個(gè)長(zhǎng)波的反射率數(shù)據(jù),由此設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò),輸入節(jié)點(diǎn)為30 個(gè),隱藏節(jié)點(diǎn)5 個(gè),輸出節(jié)點(diǎn)1 個(gè)。30 個(gè)輸入節(jié)點(diǎn)分別對(duì)應(yīng)30 個(gè)波長(zhǎng)的反射率,輸出為亞硝酸鹽含量值。網(wǎng)絡(luò)結(jié)構(gòu)如圖11所示。
權(quán)值根據(jù)選擇概率進(jìn)行交叉、變異,閾值優(yōu)化方法與權(quán)值方法相同,最后得到的閾值權(quán)值送入網(wǎng)絡(luò)中使用。得到回歸分析圖如圖12所示。訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)、檢驗(yàn)數(shù)據(jù)以及所有數(shù)據(jù)的回歸性能和復(fù)相關(guān)系數(shù)r,其中總體數(shù)據(jù)的復(fù)相關(guān)系數(shù)r為0.958,決定系數(shù)
R2為0.918。
根據(jù)式(5)可算得RMSECV為0.365。
2.9 樣本預(yù)測(cè)
使用2 種模型分別對(duì)驗(yàn)證集的10 組樣本進(jìn)行預(yù)測(cè)分析結(jié)果如表2所示。
由表2可知,雖然在輸入樣本為35 組的時(shí)候,在預(yù)測(cè)結(jié)果上PLS所建模型要略優(yōu)于GA-BP網(wǎng)絡(luò)所建立模型,但是在輸入樣本為45 組時(shí),GA-BA所建模型預(yù)測(cè)效果顯著提升,且明顯優(yōu)于PLS所建模型。2 種模型所預(yù)測(cè)的結(jié)果皆在可以接受的范圍內(nèi),證明高光譜可以滿足檢測(cè)香腸中亞硝酸鹽含量的需求。
3 結(jié) 論
本實(shí)驗(yàn)通過對(duì)香腸的高光譜圖像及光譜數(shù)據(jù)采集,對(duì)45 組樣品圖像進(jìn)行了主成分分析,根據(jù)方差累計(jì)貢獻(xiàn)率排列,按照波段權(quán)重系數(shù)提取特征波長(zhǎng),分別采用偏最小二乘回歸建模及遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)建模,實(shí)驗(yàn)結(jié)果表明,在多樣本的情況下,神經(jīng)網(wǎng)絡(luò)的建模效果明顯優(yōu)于偏最小二乘回歸建模。隨著訓(xùn)練樣本數(shù)的增多,其效果更加明顯,基于高光譜及主成分特征提取的香腸亞硝酸鹽含量檢測(cè)方法是可行的。
參考文獻(xiàn):
[1] 趙靜, 王娜, 馮敘橋, 等. 蔬菜中硝酸鹽和亞硝酸鹽檢測(cè)方法的研究進(jìn)展[J]. 食品科學(xué), 2014, 35(8): 42-49. DOI:10.7506/spkx1002-6630-201408008.
[2] 彭彥昆, 張雷蕾. 農(nóng)畜產(chǎn)品品質(zhì)安全高光譜無損檢測(cè)技術(shù)進(jìn)展和趨勢(shì)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2013, 44(4): 137-145. DOI:10.6041/j.issn.1000-1298.2013.04.025.
[3] 張令標(biāo), 何建國(guó), 王松磊, 等. 高光譜成像技術(shù)在肉品無損檢測(cè)中的應(yīng)用及進(jìn)展[J]. 河南工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)), 2014, 35(1): 100-105.
[4] 李江波, 饒秀勤, 應(yīng)義斌. 農(nóng)產(chǎn)品外部品質(zhì)無損檢測(cè)中高光譜成像技術(shù)的應(yīng)用研究進(jìn)展[J]. 光譜學(xué)與光譜分析, 2011, 31(8): 2021-2026. DOI:10.3969/j.issn.1673-1328.2014.27.031.
[5] HAFF R P, SARANWONG S, THANPASE W, et al. Automatic image analysis and spot classification for detection of fruit fly infestation in hyperspectral images of mangoes[J]. Postharvest Biology and Technology, 2013, 86(8): 23-28.
[6] POLDER G, van der HEIJDEN G W A M, YOUNG I T. Spectral image analysis for measuring ripeness of tomatoes[J]. Transactions of the Asae Online, 2002, 45(4): 1155-1161.
[7] 張雷蕾, 李永玉, 彭彥昆, 等. 基于高光譜成像技術(shù)的豬肉新鮮度評(píng)價(jià)[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2012, 28(7): 254-259. DOI:10.3969/j.issn.1002-6819.2012.07.042.
[8] BARBIN D F, SUN D W, SU C. NIR hyperspectral imaging as non-destructive evaluation tool for the recognition of fresh and frozen-thawed porcine longissimus dorsi muscles[J]. Innovative Food Science and Emerging Technologies, 2013, 18(18): 226-236.
[9] 陳全勝, 張燕華, 萬新民, 等. 基于高光譜成像技術(shù)的豬肉嫩度檢測(cè)研究[J]. 光學(xué)學(xué)報(bào), 2010(9): 2602-2607
[10] 馬驥, 曲佳歡, 孫大文, 等. 高光譜成像在食品質(zhì)量評(píng)估方面的研究進(jìn)展與應(yīng)用(二)[J]. 肉類研究, 2012, 26(4): 42-48.
[11] 洪添勝, 喬軍, WANG Ning, 等. 基于高光譜圖像技術(shù)的雪花梨品質(zhì)無損檢測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2007, 23(2): 151-155. DOI:10.3321/j.issn:1002-6819.2007.02.030.
[12] SHETTY N, GISLUM R. Quantification of fructan concentration in grasses using NIR spectroscopy and PLSR[J]. Field Crops Research, 2011, 120(120): 31-37.
[13] 張凱華, 臧明伍, 王守偉, 等. 基于光譜技術(shù)的畜禽肉新鮮度評(píng)價(jià)方法研究進(jìn)展[J]. 肉類研究, 2016, 30(1): 30-35. DOI:10.15922/j.cnki.rlyj.2016.01.007.
[14] 中華人民共和國(guó)衛(wèi)生部. GB 5009.33—2010 食品安全國(guó)家標(biāo)準(zhǔn)食品中亞硝酸鹽和硝酸鹽的測(cè)定[S]. 北京: 中國(guó)標(biāo)準(zhǔn)出版社, 2010: 149-153.
[15] 葉鶯, 陳崇幗, 林熙. 偏最小二乘回歸的原理及應(yīng)用[J]. 海峽預(yù)防醫(yī)學(xué)雜志, 2005, 11(3): 3-6. DOI:10.3969/j.issn.1007-2705.2005.03.002.
[16] 劉碩, 郭培源, 楊昆程, 等. 基于高光譜圖像技術(shù)的臘腸酸價(jià)含量檢測(cè)[J]. 食品工業(yè)科技, 2016, 37(5): 287-291; 297.
[17] 劉歡, 姜峰, 于國(guó)強(qiáng), 等. 遺傳-神經(jīng)網(wǎng)絡(luò)方法在炸藥撞擊感度預(yù)測(cè)中的應(yīng)用研究[J]. 火工品, 2010(6): 42-45. DOI:10.3969/j.issn.1003-1480.2010.06.012.
[18] 王立國(guó), 魏芳潔. 結(jié)合遺傳算法和蟻群算法的高光譜圖像波段選擇[J]. 中國(guó)圖象圖形學(xué)報(bào), 2013, 18(2): 235-242. DOI:10.11834/jig.20130216.
[19] WANG W, LI C, TOLLNER E W, et al. Shortwave infrared hyperspectral imaging for detecting sour skin (Burkholderia cepacia): infected onions[J]. International Journal of Food Engineering, 2012, 109(1): 38-48.
[20] 陳學(xué)杰, 呂柏權(quán), 武冬冬. 基于神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)的智能控制優(yōu)化算法[J]. 工業(yè)控制計(jì)算機(jī), 2015(1): 49-50. DOI:10.3969/j.issn.1001-182X.2015.01.022.
[21] 馬永杰, 云文霞. 遺傳算法研究進(jìn)展[J]. 計(jì)算機(jī)應(yīng)用研究, 2012, 29(4): 1201-1206. DOI:10.3969/j.issn.1001-3695.2012.04.001.
[22] 湯素麗, 羅宇鋒. 人工神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展與應(yīng)用[J]. 電腦開發(fā)與應(yīng)用, 2009, 22(10): 59-61. DOI:10.3969/j.issn.1003-5850.2009.10.025.
[23] 田有文, 王曉娟. 基于高光譜圖像技術(shù)的農(nóng)產(chǎn)品品質(zhì)無損檢
測(cè)[J]. 農(nóng)機(jī)化研究, 2009, 31(10): 220-222. DOI:10.3969/j.issn.1003-188X.2009.10.063.
[24] 黃文倩, 陳立平, 李江波, 等. 基于高光譜成像的蘋果輕微損傷檢測(cè)有效波長(zhǎng)選取[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2013, 29(1): 272-277.
[25] 孫俊, 金夏明, 毛罕平, 等. 基于高光譜圖像光譜與紋理信息的生菜氮素含量檢測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2014, 30(10): 167-173. DOI:10.3969/j.issn.1002-6819.2014.10.021.