宗 婧,黃志軒,陳曉宇,陳 達(dá)
(1.天津大學(xué)精密儀器與光電子工程學(xué)院,天津 300072;2.中國(guó)民航大學(xué)飛機(jī)防火及應(yīng)急研究所,天津 300300)
近年來(lái),隨著乳品消費(fèi)量的大幅增加,乳品安全已經(jīng)引起全社會(huì)的高度關(guān)注。其中,乳粉作為大眾食品原料,在全球經(jīng)濟(jì)貿(mào)易中占有重要地位。受經(jīng)濟(jì)利益驅(qū)使的乳粉摻假行為具有一定的普遍性,嚴(yán)重地?fù)p害了人民的利益,甚至危及嬰幼兒的生命健康[1-3]。我國(guó)目前的食品安全檢測(cè)標(biāo)準(zhǔn)方法僅僅針對(duì)已知危害物質(zhì)制定其限量標(biāo)準(zhǔn)。然而,由于新型化學(xué)性有害物質(zhì)層出不窮,不法商販為逃避監(jiān)管,有可能使用其他可替代化學(xué)品,不可能逐一建立檢測(cè)標(biāo)準(zhǔn)。因此,針對(duì)可能存在未知摻雜物的乳粉,發(fā)展新型、高效的非定向篩查技術(shù),成為食品安全領(lǐng)域的一大緊迫需求。
目前常用的乳粉檢測(cè)手段主要基于色譜、質(zhì)譜技術(shù),如高效液相色譜法、氣相色譜-質(zhì)譜聯(lián)用法等[4-7],通常是通過(guò)盡可能多的搜集化學(xué)品的信息,構(gòu)建大數(shù)據(jù)庫(kù),以覆蓋乳粉中未知化合物的檢測(cè)。基于色譜和質(zhì)譜的分析方法,雖然靈敏度高,但其需要繁瑣的前處理工序,對(duì)檢測(cè)人員要求高,對(duì)儀器成本要求高,不適宜用作大規(guī)模的快速篩查[8-10],而更適合作為篩查后的確證方法使用。
在各類檢測(cè)技術(shù)中,基于光譜的檢測(cè)技術(shù),具有檢測(cè)速度快、無(wú)損、操作簡(jiǎn)單、高通量等優(yōu)點(diǎn)[3,11-13]。其中,拉曼光譜譜峰指紋特異性好,富含豐富的光譜信息,為后續(xù)化學(xué)計(jì)量學(xué)分析奠定了良好的基礎(chǔ),十分適用于乳粉的非定向篩查。然而,乳粉摻雜行為大部分是通過(guò)添加含氮化合物提升其表觀蛋白質(zhì)含量[13-14],通常摻雜濃度很低,且因不需要特殊設(shè)備和培訓(xùn),其混合方式通常是干法混合[15],因此存在混合不均勻的現(xiàn)象。傳統(tǒng)的拉曼光譜技術(shù),僅采集樣品單點(diǎn)數(shù)據(jù)或多點(diǎn)數(shù)據(jù)取平均值,而忽略了乳粉樣本的非均勻異質(zhì)性[16],因此極易錯(cuò)過(guò)低濃度摻雜物質(zhì),從而降低其檢測(cè)靈敏度。
針對(duì)摻雜乳粉上述特點(diǎn),引入拉曼高光譜成像技術(shù)用于乳粉安全性的檢測(cè),該技術(shù)有效結(jié)合微區(qū)分析和大面積掃描的特性,可同時(shí)獲取包括位置信息和光譜信息的三維數(shù)據(jù)立方體[17]。目前,一些文獻(xiàn)報(bào)道了拉曼近紅外光譜成像技術(shù)在藥品和食品的摻假診斷中的應(yīng)用,然而這些方法往往只能實(shí)現(xiàn)特定摻雜物的定向篩查,即針對(duì)某種已知摻雜物建立其定性、定量的化學(xué)計(jì)量學(xué)方法,而并未將這些光譜成像技術(shù)應(yīng)用于非定向篩查領(lǐng)域,因此難以全面覆蓋食品中的未知摻雜物。如Chao Kuanglin等[18]使用摻雜物標(biāo)準(zhǔn)譜出峰位置的強(qiáng)度值結(jié)合最優(yōu)閾值畫出二值成像圖。Fu Xiaping等[19]通過(guò)光譜角測(cè)量(spectral angle mapping,SAM)、光譜相關(guān)性度測(cè)量和歐式距離測(cè)量等光譜相似性分析方法,比較被測(cè)物的每個(gè)像素點(diǎn)的光譜與純摻雜物光譜的相似度,從而證明高光譜技術(shù)結(jié)合光譜相似性分析可以有效地檢測(cè)食品中的摻雜物。Lohumi等[20]使用單變量、多變量和光譜角制圖等方法,針對(duì)摻雜物作出成像圖,并根據(jù)摻雜像素點(diǎn)的數(shù)量進(jìn)行辣椒粉的定量分析。Qin Jianwei等[10,21-22]在拉曼成像技術(shù)領(lǐng)域發(fā)表了很多的工作成果,其中,常使用被測(cè)物特征單波長(zhǎng)信息畫出拉曼強(qiáng)度圖,并結(jié)合強(qiáng)度閾值法畫出被測(cè)摻雜物的二值圖,再通過(guò)摻雜像素點(diǎn)的個(gè)數(shù)定量分析摻雜質(zhì)量。然而,在真實(shí)的乳粉摻雜鑒別應(yīng)用中,各類摻雜物質(zhì)種類繁多,定向篩查方法難以通過(guò)窮舉法實(shí)現(xiàn)全面檢查。因此,急需發(fā)展一種通用的非定向篩查方法,用于彌補(bǔ)傳統(tǒng)拉曼高光譜成像技術(shù)在乳粉質(zhì)量安全檢測(cè)中的不足。
本研究發(fā)展了一種基于移動(dòng)窗口光譜角制圖的拉曼高光譜成像方法(moving spectral angle mapping Raman hyperspectral imaging method,MWSAM-RHIM),以實(shí)現(xiàn)乳粉安全的非定向篩查。在MWSAM-RHIM中,利用改進(jìn)的移動(dòng)窗口光譜角制圖算法,借助高光譜位置信息與光譜信息合一的特性,將乳粉中未知摻雜物的識(shí)別問(wèn)題轉(zhuǎn)化為奇異像素點(diǎn)的識(shí)別問(wèn)題,設(shè)置合理閾值,構(gòu)建二值圖像,進(jìn)而可視化、非定向的識(shí)別摻雜乳粉。實(shí)驗(yàn)中,首先采集正常乳粉高光譜數(shù)據(jù),確定了MWSAMRHIM中正常乳粉判定閾值,并進(jìn)一步使用驗(yàn)證樣本驗(yàn)證此方法的準(zhǔn)確性和有效性。
脫脂乳粉(25 種) 雀巢(中國(guó))研發(fā)公司;尿素(99%,生物技術(shù)級(jí))、三聚氰酸(98%)、硫脲(分析純,99%) 上海麥克林生化科技有限公司;滑石粉 商丘市亮峰衛(wèi)生用品有限公司;小麥粉(特級(jí),金 龍魚) 益海嘉里食品營(yíng)銷有限公司。
本實(shí)驗(yàn)使用實(shí)驗(yàn)室自行搭建的拉曼高光譜成像裝置,并為此裝置開發(fā)了操作軟件,將BIOS-105T-304GS型(日本Sigma Koki公司)二維位移平臺(tái)控制器與便攜式拉曼光譜儀一同控制,實(shí)現(xiàn)了拉曼光譜儀與位移平臺(tái)的聯(lián)用。此裝置所用便攜式拉曼光譜儀的激光器功率為100 mW,波長(zhǎng)785 nm,CCD波數(shù)范圍為200~2 200 cm-1, 采集的每條拉曼光譜數(shù)據(jù)為1h 1 024波長(zhǎng)點(diǎn)陣列。在實(shí)驗(yàn)中,設(shè)置單點(diǎn)采集積分時(shí)間為600 ms,激光功率為100 mW,將高光譜采集區(qū)域設(shè)置為30 mmh 30 mm,將二維位移平臺(tái)步長(zhǎng)設(shè)置為0.3 mm,則可以采集100h 100共10 000 個(gè)像素點(diǎn)的拉曼光譜數(shù)據(jù),其空間分辨率為0.3 mm(30 mm范圍內(nèi)100 個(gè)像素點(diǎn))。最終可以得到每個(gè)乳粉樣品的100h 100h 1 024的拉曼高光譜三維數(shù)據(jù)立方體,其中100h 100表示在采集平面X-Y軸方向的采樣點(diǎn)數(shù),而1 024是每個(gè)像素點(diǎn)的拉曼光譜數(shù)據(jù)點(diǎn)數(shù)(Z軸)。
在光譜數(shù)據(jù)處理中,使用Matlab R2016a軟件進(jìn)行計(jì)算。移動(dòng)窗口光譜角制圖算法,根據(jù)算法原理自行編寫。
1.3.1 樣品分組
實(shí)驗(yàn)設(shè)置6 組驗(yàn)證樣品,用來(lái)驗(yàn)證MWSAM-RH的有效性。其中,第1組為陰性樣本,第2~6組為人為配制的摻雜陽(yáng)性樣本。具體分別為:第1組為雀巢中國(guó)研發(fā)公司提供的15 個(gè)按照國(guó)標(biāo)生產(chǎn)的脫脂乳粉;第2~4組分別采用尿素、三聚氰酸、硫脲摻雜樣品15 個(gè),按照質(zhì)量分?jǐn)?shù)梯度0.1%~5%混合入脫脂乳粉中;第5~6組分別采用滑石粉、小麥粉摻雜樣品15 個(gè),按照質(zhì)量分?jǐn)?shù)梯度0.1%~15%混合入脫脂乳粉中。具體摻雜樣品摻雜濃度見表1。
1.3.2 摻雜樣品制備
按照表1配制驗(yàn)證樣品中的5 組陽(yáng)性摻雜樣品,每個(gè)樣品20 g。具體制樣步驟:1)將摻雜化學(xué)品采用研缽進(jìn)行研磨;2)研磨后過(guò)200 目的篩子,使其2 種混合體系的顆粒度盡可能一致;3)將摻雜物質(zhì)倒入乳粉中,用玻璃棒攪拌至肉眼觀察已均勻后,使用XW-80A渦流混合儀混合5 min,之后再用玻璃棒輔助移入樣品杯,以確保奶粉中摻假顆粒的均勻性。
表 1 摻雜樣品的配制Table 1 Preparation of adulterated samples at different concentrations
1.3.3 MWSAM-RHIM原理
乳粉是復(fù)雜的有機(jī)物體系,其拉曼光譜具有強(qiáng)烈的熒光背景[24]。摻雜的乳粉,其摻雜物位點(diǎn)的拉曼光譜會(huì)含有摻雜物的光譜信息,因此,摻雜乳粉的拉曼光譜相較于純?nèi)榉酃庾V存在畸變。本研究基于此現(xiàn)象,將被測(cè)物質(zhì)光譜與純脫脂乳粉光譜進(jìn)行對(duì)比,計(jì)算其相似度,通過(guò)設(shè)置合理閾值,達(dá)到非定向篩查的目的。
光譜角制圖算法,最早由Kruse等[25]在1993年提出,是一種常用的計(jì)算光譜相似性的方法,在高光譜和成像領(lǐng)域應(yīng)用廣泛[26-31]。通過(guò)計(jì)算參考光譜與分析光譜的矢量夾角大小度量光譜間的相似性,夾角越小,兩光譜越相似[25]。之前常被用于定向篩查方法,通過(guò)計(jì)算被測(cè)物質(zhì)與已知某摻雜物的純物質(zhì)光譜的光譜相似性,檢測(cè)是否含有此種摻雜物[19]。而本實(shí)驗(yàn)用其作為非定向篩查的手段,將被測(cè)物光譜與純?nèi)榉酃庾V進(jìn)行比較。傳統(tǒng)的光譜角制圖算法如式(1)所示[28]:
式中:xr為參考光譜;X為分析光譜;DSAM(X)為求得的夾角。其值越小,代表與參考光譜的匹配越緊密,相似性越高。
傳統(tǒng)的SAM,使用整條光譜進(jìn)行對(duì)比,而通常乳粉摻雜物的含量偏低,且拉曼光譜指紋特異性較好,摻雜物可能僅在幾個(gè)波數(shù)范圍內(nèi)出現(xiàn)很小的尖峰,因此用單條光譜比對(duì),容易出現(xiàn)摻雜物信息淹沒(méi)在大部分相似的脫脂乳粉信息中的情況,從而產(chǎn)生假陽(yáng)性的問(wèn)題。針對(duì)此問(wèn)題,本研究提出了移動(dòng)窗口光譜角制圖方法,通過(guò)添加移動(dòng)窗口,將整條光譜切分為很多段進(jìn)行對(duì)比,從而可以提取更多細(xì)節(jié)光譜信息,提升其檢測(cè)靈敏度。
利用計(jì)算光譜相似性原理進(jìn)行檢測(cè),其閾值設(shè)置的合理性尤為重要。如果設(shè)置過(guò)于嚴(yán)格的閾值,則可能出現(xiàn)假陽(yáng)性的誤判,而設(shè)置過(guò)于寬松的閾值,則會(huì)出現(xiàn)假陰性的誤判。在本方法中,利用正常奶粉數(shù)據(jù)自行比對(duì)計(jì)算,得到乳粉的光譜相似性信息。將正常乳粉比對(duì)后矢量角最大,即最不相似的值設(shè)置為閾值,大于此閾值則認(rèn)作異常光譜。
將上述算法與拉曼高光譜相結(jié)合,建立MWSAMRHIM,可以利用高光譜特性,大面積獲取乳粉信息的同時(shí),獲取到微區(qū)的精細(xì)信息,再通過(guò)移動(dòng)窗口光譜角制圖算法,計(jì)算每個(gè)像素點(diǎn)與正常奶粉光譜的相似性,從而判斷該像素點(diǎn)是否摻雜,最終得知此樣品是否為摻雜樣品。MWSAM-RHIM計(jì)算了兩個(gè)向量間的余弦角[28],使用角度表示兩個(gè)向量在方向上的差異,這一特點(diǎn)十分適用于分析乳粉這一含有強(qiáng)烈熒光背景的物質(zhì)的拉曼光譜,此方法省略了有機(jī)物拉曼光譜常規(guī)的去除熒光背景的預(yù)處理步驟,大大提升了計(jì)算速度。
1.3.4 MWSAM-RHIM參數(shù)設(shè)置
在實(shí)踐中,MWSAM-RHIM首先需要設(shè)置窗口。由于本研究使用的便攜式拉曼光譜儀提供200~2 200 cm-1共1 024 個(gè)變量。使用半窗寬為100,步長(zhǎng)為50的移動(dòng)窗口,可以得到17 個(gè)窗口。其次,需要為每個(gè)窗口設(shè)置判定閾值。由于不同批次、不同品牌的脫脂乳粉具有不同的基質(zhì)特性,為保證此方法可以覆蓋絕大多數(shù)脫脂乳粉,選用10 種正常乳粉計(jì)算閾值。具體為,使用MWSAM-RHIM計(jì)算10 種正常乳粉同一窗口光譜兩兩之間的相似度。每個(gè)樣品因?yàn)楹?0 000 個(gè)像素點(diǎn)的光譜數(shù)據(jù),所以最終得到10 000h 10 000的相似度數(shù)據(jù)。為避免個(gè)別奇異點(diǎn)對(duì)閾值的影響,將全部數(shù)據(jù)排序,找到前10 個(gè)最大值取平均,作為此兩種奶粉光譜的最大夾角,即最不相似值。用此方法對(duì)全部10 種乳粉進(jìn)行計(jì)算,可以得到共計(jì)55 組相似度數(shù)據(jù),再選擇此55 組中的前10 個(gè)最大值的平均值,即為正常乳粉間差異的最大范圍,將此范圍作為正常脫脂乳粉的判定閾值。17 個(gè)窗口全部使用上述方法計(jì)算,最終產(chǎn)生17 個(gè)判定閾值。
1.3.5 MWSAM-RHIM檢測(cè)未知樣品
采集未知待測(cè)樣品的高光譜數(shù)據(jù),計(jì)算每個(gè)像素點(diǎn)的每個(gè)窗口待測(cè)樣品與正常奶粉的光譜角大小,并與先前建立的判定閾值作對(duì)比。如果有任一窗口的光譜角超出閾值,則判定該像素點(diǎn)為摻雜像素,標(biāo)記為1;如果在閾值范圍內(nèi),則判定該像素點(diǎn)為正常像素,標(biāo)記為0。待測(cè)樣品只要存在摻雜的像素點(diǎn),則認(rèn)為其為摻雜樣品。在此基礎(chǔ)上,結(jié)合像素點(diǎn)的位置和標(biāo)記,畫出包含定位信息的二值圖,得到待測(cè)樣品的摻雜二值圖像。MWSAM-RHIM的具體流程如圖1所示。
圖 1 基于移動(dòng)窗口光譜角制圖的拉曼高光譜成像方法流程圖Fig. 1 Flowchart of MWSAM-RHIM
1.3.6 方法評(píng)價(jià)指標(biāo)
作為一種定性方法,采用識(shí)別率作為此方法的評(píng)價(jià)指標(biāo)[3,32]。計(jì)算公式為:
式中:TP為陽(yáng)性樣本被正確識(shí)別為陽(yáng)性的數(shù)量;TN為陰性樣本被正確識(shí)別為陰性的數(shù)量;FN為陽(yáng)性樣本被錯(cuò)誤識(shí)別為陰性樣本的數(shù)量;FP為陰性樣本被錯(cuò)誤識(shí)別為陽(yáng)性樣本的數(shù)量。TP+FN即為全部陽(yáng)性樣本的數(shù)量,而TN+FP為全部陰性樣品的數(shù)量。
使用1.3.2節(jié)方法計(jì)算得到的17 個(gè)窗口的閾值分別為:0.192、0.152、0.112、0.127、0.164、0.187、0.183、0.130、0.158、0.181、0.190、0.195、0.155、0.137、0.135、0.158、0.172。
圖 2 MWSAM-RHIM的摻雜脫脂乳粉二值成像圖Fig. 2 MWSAM-RHIM binary images of adulterated skim milk samples
在計(jì)算出閾值之后,將未知樣品與正常乳粉進(jìn)行對(duì)比,將超出閾值的像素點(diǎn)設(shè)置為1,沒(méi)有超出的設(shè)置為0。在一共17 個(gè)窗口中,只要有其中某一窗口有超出閾值的像素點(diǎn),則認(rèn)為此為摻雜像素點(diǎn)。使用此方法畫出可視化的摻雜二值成像圖(空間分辨率0.3 mm),如圖2和圖3所示。圖2表示了此方法可以在0.1%摻雜的條件下,檢測(cè)出尿素、三聚氰酸、硫脲和滑石粉的摻雜情況,并可視化的標(biāo)注出摻雜像素點(diǎn)的位置。圖3則以滑石粉為例,顯示了隨著摻雜質(zhì)量分?jǐn)?shù)的升高,摻雜像素點(diǎn)數(shù)量也同時(shí)升高,在摻雜15%時(shí),所有像素點(diǎn)都含有摻雜物質(zhì)信號(hào)。
圖 3 摻雜不同質(zhì)量分?jǐn)?shù)滑石粉的脫脂乳粉MWSAM-RHIM二值成像圖Fig. 3 MWSAM-RHIM binary images of talcum powder adulterated skim milk powders
表 2 基于MWSAM-RHIM非定向篩查模型識(shí)別率預(yù)測(cè)結(jié)果評(píng)價(jià)Table 2 Classification rates of MWSAM-RHIM predicted results
本實(shí)驗(yàn)使用含有15 個(gè)正常脫脂乳粉(陰性樣本)和含有共計(jì)75 個(gè)摻雜樣品(陽(yáng)性樣本)計(jì)算此方法的識(shí)別率,從而驗(yàn)證此方法的有效性,并將結(jié)果見表2。結(jié)果表明,MWSAM-RHIM其陰性和陽(yáng)性樣本識(shí)別率(特異性)均達(dá)到了93.3%,證明其非定向篩查的準(zhǔn)確識(shí)別率可滿足實(shí)際乳粉工業(yè)檢測(cè)需求。另外,5 組摻雜不同質(zhì)量分?jǐn)?shù)梯度的摻雜物的樣品被用來(lái)驗(yàn)證此方法的最低可檢出質(zhì)量分?jǐn)?shù),結(jié)果如表3所示。結(jié)果證明,其針對(duì)尿素、三聚氰酸、硫脲和滑石粉的最低可檢出質(zhì)量分?jǐn)?shù)為0.1%,完全可以滿足乳粉質(zhì)量安全真實(shí)性鑒別的需求;但其對(duì)小麥粉的最低可檢出質(zhì)量分?jǐn)?shù)僅達(dá)到3%,其原因是純小麥粉的拉曼光譜,其熒光信號(hào)很強(qiáng),且不具有特征峰。證明此方法對(duì)某些不具備特征峰的摻雜物,在其低質(zhì)量分?jǐn)?shù)下,存在靈敏度不足的問(wèn)題,應(yīng)在以后針對(duì)此問(wèn)題繼續(xù)發(fā)展新型的非定向篩查方法。
表 3 基于MWSAM-RHIM非定向篩查最低可檢出 質(zhì)量分?jǐn)?shù)模型預(yù)測(cè)結(jié)果評(píng)價(jià)Table 3 MWSAM-RHIM predicted results of lowest detectable concentrations
本研究提出了一種基于移動(dòng)窗口光譜角制圖的拉曼高光譜成像方法,該方法借助拉曼高光譜成像技術(shù),將乳粉中未知摻雜物的識(shí)別問(wèn)題轉(zhuǎn)化為拉曼高光譜奇異像素點(diǎn)的識(shí)別問(wèn)題;借助移動(dòng)窗口光譜角制圖算法,找出與正常脫脂乳粉相似度差距大于閾值的像素點(diǎn),有效的彌補(bǔ)了傳統(tǒng)的定向篩查方法中無(wú)法遍歷所有摻雜物的問(wèn)題。實(shí)驗(yàn)結(jié)果表明,MWSAM-RHIM能較準(zhǔn)確地識(shí)別乳粉的陰性樣品和陽(yáng)性樣本,以可視化的方式實(shí)現(xiàn)乳粉真?zhèn)蔚姆嵌ㄏ蚝Y查,并為其他食品體系的非定向篩查提供了一種新思路。