夏 啟,黃志軒,鮑 蕾,卜漢萍,陳 達
(1.天津大學精密儀器與光電子工程學院,天津 300072;2.雀巢研發(fā)(中國)有限公司雀巢食品安全研究院,北京 100016;3.中國民航大學 民航熱災害防控與應急重點實驗室,天津 300300)
奶粉產(chǎn)品作為人類日常飲食中重要的組成部分,富含人類所需多種營養(yǎng)物質,對于嬰幼兒成長以及中老年人健康具有重要的食用價值[1-3],其消費群體日趨龐大。我國奶粉市場體量大且發(fā)展迅猛,奶粉消費量高達數(shù)百萬噸,年復合增長率穩(wěn)定在14.5%左右。然而,奶粉摻雜問題一直影響我國乳制品市場的健康發(fā)展,并多次出現(xiàn)三聚氰胺、大頭奶粉等食品安全事件[4-6],嚴重危及消費者的健康安全,并在相當長的一段時間內(nèi)重創(chuàng)我國乳制品產(chǎn)業(yè)的消費者信心。因此,如何快速甄別奶粉原料中的摻雜問題,成為食品安全領域亟待解決的關鍵技術之一。
目前常用的奶粉摻雜檢測方法主要依賴于色譜法[7-8]和質譜法[9-10],并按照國標[11]進行特定摻雜物的實驗室分析。然而,這些常規(guī)方法往往需要繁瑣的步驟、復雜的儀器,導致其單次樣品檢測時間長[12],難以滿足數(shù)以百萬噸計的奶粉摻雜檢測需求。近年來,隨著光譜技術的快速發(fā)展,光譜技術以其無需復雜樣本制備、可實現(xiàn)原位檢測等優(yōu)點[13-16],為乳粉摻雜檢測提供了高效的新手段。在各種光譜技術中,拉曼成像技術同時具備高光譜分辨率和高空間分辨率等突出優(yōu)點,可以對奶粉這一非均勻體系進行空間上無偏掃描,以此準確捕捉微區(qū)的精細信息,進而為非均勻體系的摻雜檢測提供精準信息。因此,拉曼成像技術在復雜的摻雜場景下具備良好的準確性和可靠性[17-19]。然而,拉曼光譜信號通常較弱,易受到噪聲信號干擾[20-21],傳統(tǒng)的拉曼成像技術通常需要較長的積分時間以提升信號的信噪比,造成拉曼成像速度慢、效率低,往往采集一張拉曼成像譜圖需要幾十分鐘乃至數(shù)小時[21]。因此,拉曼成像速度將直接影響到相關技術在乳粉摻雜檢測領域的實際應用。
為了進一步提升拉曼成像速度,其核心在于有效去除短時采樣信號中存在的大量噪聲干擾。常用的濾噪算法包括DWT法[22-23]、Savitzky-Golay卷積平滑濾波算法等[24],其中,DWT法通過在小波域內(nèi)將信號分解為高頻噪聲和低頻本征信號,并剔除高頻信號達到提高信噪比的目的。然而,拉曼本征信號與噪聲信號在小波頻段下不一定完全可分,使得DWT往往易造成光譜失真問題,限制了后期乳粉摻雜檢測的準確性。與此同時,SG卷積平滑濾波算法同樣存在信息丟失問題。近年來,隨著深度卷積神經(jīng)網(wǎng)絡算法的快速發(fā)展,相關算法被證明具有可靠的信號去噪能力[25],其在拉曼光譜去噪的應用也被嘗試[26]。然而,目前已有的深度卷積神經(jīng)網(wǎng)絡算法仍不能同時兼顧保真度和去噪能力,無法滿足實際乳粉摻雜檢測需求。
為解決目前奶粉拉曼成像速度慢這一關鍵性問題,本實驗創(chuàng)新型性提出一種自編碼收縮神經(jīng)網(wǎng)絡(selfencode shrinkage neural network,SSNN)重構的奶粉摻雜快速拉曼成像檢測方法。該方法通過SSNN準確地捕捉短時拉曼圖像中的本征信息,進而幾乎不丟失保真度地重構出高信噪比拉曼圖像信號,高效完成了低信噪比拉曼成像信號的光譜預處理任務。通過SSNN重構后,本實驗有機地結合多元線性回歸技術對奶粉摻雜完成定量分析。計算結果表明,該算法在多種摻雜奶粉檢測中均得到了理想的定量檢測效果,且分析速度較傳統(tǒng)的拉曼成像方法提升了30 倍。因此,本方法可高效滿足目前市場對奶粉摻雜快速檢測的實際需求,同時也為其他非均勻體系摻雜檢測提供一種新方法。
正常奶粉為市場購買的20種品牌的純凈奶粉,使用的非法奶粉添加劑包括尿素、滑石粉、麥芽糖糊精、淀粉、乳清粉和三聚氰胺共6種。在每種純凈奶粉的不同區(qū)域隨機抽取5 份樣本,共得到純奶粉樣本100 個。將添加劑加入奶粉基質制作摻雜奶粉樣本,摻雜量在1.0%~15%之間,共15 個梯度,間隔為1.0%。每個梯度下,隨機選取3種奶粉作為基質,制作3 份具有不同奶粉基質的摻雜樣本,共得到摻雜奶粉樣本270 個,所得摻雜樣本均通過在渦輪混合器進行均勻混合。
所得樣本被分成3 組:訓練組、測試組和獨立驗證組,具體分組方式見表1。實驗中網(wǎng)絡模型在訓練集上進行多次訓練,且每次訓練迭代后在測試集上進行測試,最終所得的模型采用獨立驗證集驗證。由表1可知,驗證集中的摻雜物種類完全獨立于訓練集和測試集,可用于驗證模型的泛化能力。
表1 樣本集組成Table 1 Composition of different sample sets
采用自搭建的背向式散射拉曼光譜成像系統(tǒng)完成拉曼圖像的采集,其中光譜儀的光譜分辨率為4 cm-1,光譜波段范圍為200~2 000 cm-1,激光功率為100 mW,顯微成像平臺信號的最小移動步長分辨率為1 mm。
1.3.1 訓練光譜集制備
首先需要建立訓練數(shù)據(jù)集。由于模型的最終目標是將短積分時間拉曼光譜重構為長積分時間拉曼光譜,因此訓練數(shù)據(jù)集中需要包含大量短積分時間光譜與長積分時間光譜的數(shù)據(jù)對,以引導模型進行參數(shù)優(yōu)化。訓練數(shù)據(jù)集的具體制備過程如下,對訓練奶粉集中每個奶粉樣本分別進行50 mm×50 mm區(qū)域內(nèi)共2 500 點的掃描,每個樣本點共進行4 次掃描,其中3 次掃描的積分時間為20 ms,一次掃描的積分時間為600 ms,600 ms積分時間光譜作為該采樣點的參考光譜,參考光譜分別與對應的3 條20 ms積分時間的低信噪比光譜構成數(shù)據(jù)對。通過反復采集不同樣本、不同區(qū)域數(shù)據(jù),最終所得訓練數(shù)據(jù)集共包括1 125 000 組光譜對,數(shù)據(jù)量龐大,足夠支撐模型訓練。
1.3.2 數(shù)據(jù)增強
鑒于實際可能存在的摻雜物種類繁多、摻雜濃度復雜,雖然本實驗準備了多種常見添加物且覆蓋了一定的摻雜濃度范圍,但仍無法遍歷實際檢測中可能遇到的所有摻雜情況。為使最終模型適用于訓練集之外的未知摻雜行為,具有較強的泛化能力,本方法在進行建模之前,對訓練數(shù)據(jù)集進行了兩種方式的數(shù)據(jù)增強:1)摻雜物特征峰強度與摻雜濃度呈正比,為模擬更多摻雜濃度下的摻雜樣本光譜,對訓練數(shù)據(jù)集中單條光譜的光譜強度上添加整體波動,波動值范圍在其最大光譜強度的-1%~1%之間;2)不同摻雜物的拉曼特征峰位置不同,訓練集中的特征峰位置模式具有一定的局限性,為使得最終模型對于不同位置的特征峰均能進行重構,將單條光譜進行波數(shù)上的隨機平移,平移范圍為[-100~100]波數(shù)之間,建立具有更多特征峰位置的訓練數(shù)據(jù)集。值得注意的是,對于每組數(shù)據(jù)對中的兩條拉曼光譜需要進行相同的隨機變動以確保其對應關系,因為拉曼光譜與強度的正比關系,不同積分時間下拉曼光譜的強度按照同一比例變化不會影響其對應關系。
1.3.3 數(shù)據(jù)歸一化
在所得數(shù)據(jù)集中,不同積分時間下光譜強度具有一定的差別,積分時間越長光譜整體強度越大,訓練數(shù)據(jù)集中低信噪比光譜的積分時間與其參考光譜的積分時間相差30 倍,對應光譜強度比也約為30,這種差異不利于模型訓練,容易導致模型訓練過程難以擬合,且本身拉曼光譜強度數(shù)值較大,容易造成模型在收斂過程中的梯度爆炸,因此在進行模型訓練前必須對數(shù)據(jù)集進行歸一化,為避免數(shù)據(jù)集中少數(shù)異常點對歸一化結果的影響,本方法采用平均值歸一化法,具體過程描述如下,首先分別統(tǒng)計長積分時間和短積分時間下各自所得到光譜的全局平均強度(global mean intensity,GMI),記錄低信噪比光譜全局平均強度為GMIlow,記錄參考光譜的全局平均強度為GMIref,之后將訓練集中的每條數(shù)據(jù)除以其對應的GMI,最終訓練數(shù)據(jù)集被歸一化到一個較小的范圍且低信噪比光譜與其參考光譜數(shù)值接近。
1.3.4 重構網(wǎng)絡
重構網(wǎng)絡的任務是將輸入的短積分時間低信噪比光譜重構為長積分時間高信噪比光譜,如圖1所示,該方法將重構網(wǎng)絡按照網(wǎng)絡功能分兩個部分:1)將低信噪比光譜映射為光譜特征的特征提取模塊;2)根據(jù)光譜特征生成高信噪比光譜的生成模塊。為了同時兼顧重構光譜信噪比與保真度兩個重要指標,本實驗采用了一種SSNN模型,通過在訓練任務中加入自編碼學習環(huán)節(jié),該網(wǎng)絡模型可以提取與長積分時間信號高度相關的本征特征,同時網(wǎng)絡結構中采用旁路動態(tài)收縮結構,實現(xiàn)了噪聲信號的自適應剔除,提高了模型的抗干擾能力。
圖1 重構網(wǎng)絡示意圖Fig. 1 Structure of the reconstructive model
1.3.4.1 自編碼訓練任務
重構模型的根本任務是使經(jīng)過模型映射后,得到的輸出光譜與參考光譜高度相似,直接進行重構任務的訓練存在一定難度,主要在于如何捕捉與長積分時間光譜高相關的特征,同時避免噪聲特征的干擾。為了解決該難題,采用兩步訓練法對重構模型進行訓練,訓練方法如下所述:第1步,采用訓練目標為“參考光譜-參考光譜”的自編碼學習,該過程中模型的輸入為參考光譜,通過編碼重構過程,模型期望其輸出光譜與輸入光譜高度相同,自編碼學習可以使得網(wǎng)絡中的特征提取模塊對學習目標的本征特征更加敏感,從而避免對光譜中噪聲信號特征的學習,使得重構模型得到較好的預訓練參數(shù);第2步,在自編碼學習得到的模型參數(shù)基礎上,進行目標為“低信噪比光譜-參考光譜”的重構學習,該過程模型的輸入為低信噪比光譜,輸出為參考光譜。兩步訓練的目標不同,但網(wǎng)絡結構相同,且第2步中網(wǎng)絡繼承第1步的網(wǎng)絡參數(shù)。
1.3.4.2 收縮網(wǎng)絡
此外,本研究采用收縮網(wǎng)絡提高模型對噪聲的抗干擾能力,收縮網(wǎng)絡是建立在傳統(tǒng)軟閾值方法[27-28]的基礎上。軟閾值方法采用抑制一部分輸入抑制同時激活另一部分輸入的方式對輸入進行收縮,軟閾值函數(shù)如式(1)所示:
式中:x為軟閾值函數(shù)的輸入;T為軟閾值的激活閾值,軟閾值方法因為不存在特征空間上的階躍效應,可以避免重構信號出現(xiàn)局部抖動,被證明可以提高模型對噪聲的穩(wěn)定性。由軟閾值公式可見,軟閾值將輸入的整體區(qū)間向內(nèi)進行了收縮,因此采用軟閾值激活函數(shù)的網(wǎng)絡被稱為收縮網(wǎng)絡。收縮神經(jīng)網(wǎng)絡結合了軟閾值方法對噪聲的穩(wěn)健性,將軟閾值作為網(wǎng)絡的激活函數(shù)代替?zhèn)鹘y(tǒng)的Relu激活函數(shù)[29],Relu函數(shù)如式(2)所示,
通過對比式(1)和式(2)容易見得,軟閾值激活相對Relu多了一個激活區(qū)域,實現(xiàn)了雙邊激活,且激活空間可調,使得模型表達能力更強。然而,軟閾值中的激活區(qū)間難以確定,通常需要大量的實驗進行優(yōu)化,且確定后無法對數(shù)據(jù)進行自適應。針對該問題,采用收縮層結構(圖2),其中f對應式(1)的軟閾值激活,通過旁路結構結合上一層所得特征自動生成n個激活閾值T,其中n為上一層的特征個數(shù),該結構實現(xiàn)了針對對輸入自適應的激活過程,且各特征之間的激活區(qū)間相互獨立。
圖2 收縮層結構示意圖Fig. 2 Structure of the shrinkage layer
1.3.5 摻雜定量模型建立
經(jīng)過重構網(wǎng)絡得到的高信噪比光譜最終被用來建立定量模型,定量模型的建立過程為首先對重構光譜采用自適應迭代重加權懲罰最小二乘法(adaptive iterative reweighted penalized least squares,airPLS)去除基線[30],之后采用偏最小二乘(partial least squares,PLS)建立去基線后的光譜與濃度之間的多元線性回歸模型[31]。
實驗中重構網(wǎng)絡采用Pytorch(1.4.0)框架編寫,在制備的訓練集上完成網(wǎng)絡參數(shù)訓練,訓練采用L1Loss函數(shù)作為loss函數(shù),L1Loss函數(shù)如式(3)所示:
其中:ypred為模型的輸出光譜;yref為參考光譜;n為樣本點。訓練中首先完成50 個周期的參考光譜自編碼學習,之后在自編碼學習得到的模型參數(shù)基礎上進行重構學習,訓練中均采用Adam(lr=0.01,β1=0.9)迭代器,batch_size=20。最終得到可以將低信噪比光譜重構為高信噪比光譜的SSNN,其對純奶粉光譜的重構效果如圖3所示。
圖3 純奶粉拉曼光譜Fig. 3 Raman spectra of pure milk powder
由圖3可以看到,重構光譜去除了低信噪比光譜中的噪聲信號,與參考光譜有高相似性,初步證明該方法可以通過短時采樣光譜重構出長時采樣光譜,極大縮短了奶粉的拉曼成像時間。
為對重構網(wǎng)絡性能進行進一步合理的驗證,采用得到的模型對驗證集上得到的短時光譜進行重構,并對重構光譜質量評估。該網(wǎng)絡的根本目的是提高信號的信噪比和保真度,本實驗分別采用信噪比指標PSNR和重構光譜與參考光譜之間平均絕對誤差(mean absolute error,MAE)對信噪比和保真度進行評價。作為對照,實驗中同時采用小波變換(discrete fourier transform,DWT)方法和傳統(tǒng)卷積網(wǎng)絡(convolutional neural network,CNN)方法對相同光譜進行重構,其中DWT中采用db5小波,傳統(tǒng)神經(jīng)網(wǎng)絡方法采用在本實驗網(wǎng)絡結構上去掉旁路的網(wǎng)絡結構,激活函數(shù)為Relu激活,且不采用自編碼對其進行訓練。
信噪比評價指標為峰值信噪比(peak signal to noise ratio,PSNR),計算方法如式(4)所示:
20 ms積分時間下得到光譜與不同方法重構得到光譜的信噪比如表2所示。
表2 光譜PNSR對比Table 2 Comparison of the PNSR of different spectra
保真度MAE評估是在歸一化后的光譜數(shù)據(jù)上進行,其計算公式如下:
20 ms積分時間下得到光譜與不同方法重構得到光譜的MAE如表3所示。
表3 MAE對比Table 3 Comparison of the MAE of different spectra
通過對比可知,SSNN在信噪比和保真度上都高于其他兩種方法,且與傳統(tǒng)神經(jīng)網(wǎng)絡的對比可知,該網(wǎng)絡的設計也進一步提高了光譜去噪的效果。
在重構的高質量光譜數(shù)據(jù)基礎上,對摻雜奶粉構建定量模型,以驗證采用重構光譜進行奶粉中摻雜物定量分析的可行性。摻雜樣本中分別添加三聚氰胺、乳清粉、淀粉,這3 類樣本均不包含在建模數(shù)據(jù)中。在建模過程中,首先采用airPLS方法去除光譜基線,之后采用PLS方法進行建模。先后對比采用小波分解重構光譜模型和采用CNN重構光譜模型的效果,相關對比結果如表4所示。采用SSNN重構后的光譜數(shù)據(jù)在建模中得到與參考光譜幾乎相同的效果,證明其最大程度地保留了與本征信號有關的光譜信息,而采用小波分解重構的光譜雖然在信噪比上得到了提高,但其定量建模效果差,證明該方法無法完全重構出本征光譜信息,丟失了保真度。此外,本實驗提出的方法相對傳統(tǒng)卷積神經(jīng)網(wǎng)絡也提升了定量分析的效果,進一步證明了通過自編碼學習和收縮結構可以提高檢測模型對噪聲的抗干擾能力,提高了模型的定量檢測準確度。在實驗過程中也發(fā)現(xiàn),對于乳清粉摻雜樣本,采用20 ms積分時間基本無法完成定量模型的建立(R2為0.239),且經(jīng)過DWT方法處理后也無法達到理想的建模效果(R2為0.434),而采用SSNN對于乳清粉的定量檢測提升效果尤為顯著,這是由于乳清粉與奶粉有較多相似的成分,其在拉曼光譜上與奶粉的差異較小,因此噪聲對其建模影響相對更大。每種摻雜奶粉均進行了10 次重復定量分析,最終經(jīng)過SSNN重構后,定量模型R2偏差為0.001。該結果再一次證明了該方法在奶粉摻雜檢測中的可行性。
表4 采用不同光譜數(shù)據(jù)集建立定量模型的R2對比Table 4 Comparison of the R2 of quantitative models with different spectra sets
為驗證該方法在非均勻摻雜奶粉檢測中的有效性,對具有特定摻雜區(qū)域的奶粉樣本進行摻雜物定位檢測。分別將含有乳清粉、淀粉、滑石粉、麥芽糖糊、尿素、三聚氰胺的摻雜量為0.3%的均勻摻雜奶粉裝入漏斗,并借助一定的模具在6 份正常奶粉的檢測面上進行摻雜,形成具有特定形狀的摻雜區(qū)域,6種不同摻雜物分別采用形如字母“A”到字母“F”的摻雜區(qū)域。采用兩種方式對所得非均勻樣本進行摻雜物定位分析:1)采用20 ms積分時間的原始拉曼圖像直接進行摻雜物定量分析;2)使用SSNN對20 ms積分時間拉曼圖像重構后進行摻雜物定量分析。根據(jù)兩種方法所得的檢測結果分別對樣本點進行標記,其中摻雜樣本點被標記為白色,正常樣本點被標記為黑色,兩種方法所得的檢測效果對比如圖4所示。在20 ms積分時間下得到的原始數(shù)據(jù)由于檢測結果受到了嚴重的噪聲干擾,基本無法復現(xiàn)設定的摻雜區(qū)域;而采用SSNN重構信號進行分析后,設定的摻雜區(qū)域能夠被清晰地重現(xiàn)。對于乳清粉的摻雜物定位效果提升最為明顯,該結果與均勻摻雜定量檢測實驗中結果一致。此結果證明了SSNN方法在非均勻奶粉檢測中的可行性。另外,該實驗從數(shù)據(jù)采集到結果分析的全流程耗時不到2 min,且可以通過采用更小的掃描區(qū)域進一步提升檢測速度。
圖4 非均勻奶粉摻雜檢測效果Fig. 4 Results of detection of non-homogeneous adulterated milk powder samples
選擇三聚氰胺作為典型摻雜物,對SSNN方法的重復性進行驗證。取摻雜量為0.3%、0.5%、0.7%、0.9%、1.1%、1.3%和1.5%的三聚氰胺摻雜奶粉,連續(xù)7 d采用按照2.3節(jié)方法所得的三聚氰胺定量模型進行定量分析,結果如表5所示,證明SSNN方法具有良好的重復性。同時,相對于傳統(tǒng)三聚氰胺檢測方法[6],SSNN可以檢測奶粉中較低含量的三聚氰胺(檢出限為0.3%),且采用拉曼成像方式可以覆蓋更大的樣本區(qū)域,在實際檢測中具有更高的可靠性。
表5 三聚氰胺定量檢測重復性實驗結果Table 5 Repeatability for quantitative detection of melamine
針對奶粉摻雜快速檢測需求,提出并驗證了一種基于自編碼收縮網(wǎng)絡驅動的奶粉摻雜快速拉曼成像檢測方法。該方法借助一種新型的SSNN準確捕捉低信噪比拉曼圖像中的本征信號,在幾乎不丟失分析精度的同時,成功地將奶粉摻雜拉曼成像檢測速度提高了近30 倍,而幾乎不損失其定量精度,其對多種摻雜物所的定量檢測模型R2均達到了0.95以上。實驗結果表明,該方法能充分滿足奶粉摻雜快速檢測的實際需求,同時也為其他非均勻體系中的檢測任務提供了一種超快檢測方案。