劉 靜, 杜廣全, 管 驍
(1.上海海事大學信息工程學院,上海 201306;2.上海理工大學醫(yī)療器械與食品學院,上海 200093)
果蔬脆片在保持原有風味的基礎上盡可能保持果蔬的營養(yǎng)成分,同時又具備口感酥脆、綠色天然,便于貯存等特點,滿足了消費者對果蔬脆片營養(yǎng)方便、天然低脂、高膳食纖維等需求[1]。隨著人們對健康問題越來越多的重視,低脂低熱量食品在市場上尤為受到關注。因此,一系列非油炸果蔬脆片干燥加工技術應運而生,主要有變溫壓差膨化干燥技術、真空冷凍干燥技術、微波真空干燥技術等[2 - 4]。自上世紀80年代以來,美國農(nóng)業(yè)部東部研究中心、中國農(nóng)業(yè)科學院農(nóng)產(chǎn)品加工研究所、山東農(nóng)業(yè)大學等研究團隊對蘋果脆片的加工進行了較多的研究,這些研究基本側重于工藝參數(shù)的優(yōu)化和不同干燥方式對產(chǎn)品某種特性的影響,不同的研究者對蘋果脆片的品質(zhì)情況定位也不同,進而選擇不同的測定指標來反映產(chǎn)品的最終品質(zhì)狀況[5 - 6]。同時傳統(tǒng)檢測方法制樣繁瑣、檢測費時費工,且需專業(yè)人士操作,難以實現(xiàn)快速無損監(jiān)控加工過程中蘋果脆片品質(zhì)變化情況。目前,近紅外光譜技術憑借其快速簡便、無損綠色和易實時在線檢測等優(yōu)點被廣泛應用于果品品質(zhì)檢測研究[7]。因此,本文將基于果蔬脆片的近紅外光譜信息,運用智能機器學習方法建立蘋果脆片的智能客觀的品質(zhì)預測模型,從而實現(xiàn)快速無損評判。
基于當前的果蔬脆片品質(zhì)評價研究現(xiàn)狀,本文中選取水分、總酸、總糖、可溶性固形物、硬度五個屬性作為品質(zhì)評價指標。根據(jù)果蔬脆片水分含量應小于5%的國家標準,選取蘋果脆片為研究對象,結合最新的果蔬脆片研究成果和支持向量機機器學習方法,以蘋果脆片近紅外光譜吸收值的數(shù)據(jù)樣本為訓練樣本,根據(jù)不同紅外光譜吸收值的數(shù)據(jù)特征信息,產(chǎn)生不同的映射關系,然后通過蘋果脆片紅外光譜吸收值來預測蘋果脆片的各項品質(zhì)指標,以期完成對果蔬脆片各項品質(zhì)指標的評價。
Antais II型傅里葉變換近紅外光譜分析儀(美國,Thermo Fisher公司);Ta.XT2i/50型物性分析儀(英國,Stable Micro System公司)。
實驗所用蘋果原材料均選自不同產(chǎn)地、不同批次的產(chǎn)品,均采購于當?shù)卮笮娃r(nóng)場和超市,隨機挑選24個大小相似、無機械損傷的蘋果進行清洗、削皮等預處理,并將其均勻切片至5 mm,置于0.5%抗壞血酸鈉溶液中浸泡30 min,然后將蘋果薄片放入65 ℃減壓干燥箱進行干燥處理6 h,每隔1 h進行取樣測定,共得到144組蘋果切片樣本。
水分的測定:直接干燥法,參考文獻[8];可溶性固形物的測定:折射儀法,參考文獻[9];總糖的測定:蒽酮比色法;可滴定酸的測定:指示劑滴定法,參考文獻[10];硬度的測定:采用質(zhì)構分析法(Texture Profile Analysis,TPA)測定。物性分析儀參數(shù)設置:測試速度1.0 mm/s,測前速度和測后速度1.0 mm/s,數(shù)據(jù)采集速率200次/s,壓縮距離80%,探頭為P/1S。儀器自動測定應力的變化,給出應力時間變化曲線。硬度值等于曲線中力的峰值,單位為g,值越大表明產(chǎn)品越硬。
近紅外光譜分析儀儀器參數(shù)設置:分辨率為8 cm-1,光譜范圍為10 000~4 000 cm-1,掃描次數(shù)為64次。開機預熱30 min后先進行背景掃描,消除背景對光譜信息的影響,再用積分球固體采集模塊對樣本進行光譜掃描。每組樣本測量5次,取平均值作為該樣本的典型光譜,數(shù)據(jù)采集軟件為OMNIC。
本文將采用支持向量機這一機器學習技術對近紅外光譜數(shù)據(jù)進行建模,它通常在處理小樣本、非線性、模糊性等特征的數(shù)據(jù)時表現(xiàn)出很強的高維辨識能力。支持向量機通過核函數(shù)實現(xiàn)非線性函數(shù)擬合,可有效解決樣本高維和計算復雜度之間的矛盾,同時選擇不同的核函數(shù)就構成不同的支持向量機。實驗中發(fā)現(xiàn),核函數(shù)參數(shù)和懲罰系數(shù)在很大程度上決定了支持向量機的學習和泛化能力,為此本試驗中將多次對最優(yōu)懲罰系數(shù)和最優(yōu)核函數(shù)參數(shù)進行調(diào)整,以期取得更接近于實際情況的水分預測效果[11 - 12]。
利用支持向量機建立回歸模型對蘋果脆片不同時刻的各項品質(zhì)指標進行回歸擬合。假設蘋果脆片不同時刻的品質(zhì)指標與其對應的紅外光譜吸收值相關,即把蘋果脆片近紅外光譜吸收值作為對應時刻品質(zhì)指標的自變量,此時刻的品質(zhì)指標作為因變量。支持向量機采用的核函數(shù)是徑向基函數(shù)(RBF)K(xi,xj)=exp(-‖xi-xj‖2)/g2。支持向量機建模的具體執(zhí)行步驟如下:
(1)根據(jù)模型假設選定自變量和因變量:即把蘋果脆片近紅外光譜吸收值作為對應時刻品質(zhì)指標(如水分含量)的自變量,此時刻的水分含量作為因變量。
(2)數(shù)據(jù)預處理:根據(jù)蘋果脆片近紅外光譜吸收值數(shù)據(jù)樣本的特點,判斷出數(shù)據(jù)樣本不需要進行降維和歸一化處理,只需將144組近紅外光譜數(shù)據(jù)分為測試集和訓練集,可用隨機函數(shù)隨機選取總數(shù)據(jù)的四分之三(108組)作為訓練集,剩下的四分之一(36組)作為測試集。
(3)交叉驗證選擇回歸的最優(yōu)懲罰系數(shù)和最優(yōu)核函數(shù)參數(shù):在支持向量機回歸問題中,交叉驗證返回的是交叉檢驗下的平均分類均方根誤差和平均相關系數(shù),我們這里選擇的交叉驗證次數(shù)為5次,使用回歸參數(shù)尋優(yōu)函數(shù)進行參數(shù)尋優(yōu),得出最佳的懲罰系數(shù)和最優(yōu)核函數(shù)參數(shù)。
(4)利用步驟(3)得到的最佳的懲罰系數(shù)和最優(yōu)核函數(shù)參數(shù)來訓練支持向量機,將最佳的懲罰系數(shù)和最優(yōu)核函數(shù)參數(shù)代入到RBF核函數(shù),使用訓練函數(shù)在支持向量機中對訓練集進行建模,得到訓練模型。
(5)對測試集集進行擬合預測,即使用第四步中構造的模型,將其帶入到預測函數(shù)中,對測試集進行預測擬合,并得出擬合預測指標平均均方根誤差和平均相關系數(shù)。
本實驗所用的蘋果脆片近紅外光譜吸收值數(shù)據(jù)樣本為24個蘋果脆片樣本在6個時間節(jié)點觀測值,共144條近紅外光譜吸收值記錄,每條紅外光譜吸收值記錄了蘋果脆片在某時間節(jié)點下在10 000~4 000 cm-1的范圍內(nèi)蘋果脆片近紅外光譜的吸收值,按照上述紅外光譜的采集方法,得到部分蘋果樣品在預先設定的6個時間節(jié)點的紅外光譜吸收值數(shù)據(jù)如表1所示。
表1 蘋果脆片近紅外光譜數(shù)據(jù)
本實驗把蘋果脆片近紅外光譜吸收值作為對應時刻品質(zhì)指標的自變量,此時刻的各項品質(zhì)指標(水分含量)作為因變量,根據(jù)近紅外光譜吸收值來回歸預測此時刻的水分含量。蘋果脆片在加工過程中,按照上述各項品質(zhì)指標的測定方法來獲取水分,總酸,總糖,可溶性固形物,硬度等各項品質(zhì)評價指標的部分變化情況如表2所示。
表2 蘋果脆片品質(zhì)評價指標數(shù)據(jù)
(續(xù)表2)
No.Water content(%)Total acid(mmol/100g)Total sugar(%)Soluble solids(%)Hardness(g)2-46.8312.1344.612.64108.02-54.2410.9167.303.78650.82-63.6811.2545.963.121210.93-170.585.7515.491.03105.83-254.985.8621.171.22047.53-338.9110.2934.792.54203.03-414.0113.9634.112.63993.63-57.3115.5859.833.76637.93-65.5615.4549.023.17404.24-174.682.426.910.44149.94-251.255.4824.641.43095.44-322.769.1729.422.03280.04-47.1113.2653.813.44770.24-55.2515.7647.152.66411.74-64.2515.2537.912.77575.85-175.994.2113.001.04076.05-265.826.3120.591.32949.35-348.2415.0725.131.63232.45-435.2514.6249.702.94451.25-517.6317.3951.862.96684.45-64.7716.5950.743.48919.7
利用上述執(zhí)行步驟(3)交叉驗證進行參數(shù)尋優(yōu)可得到最優(yōu)懲罰系數(shù)c為27.8576,最優(yōu)核函數(shù)參數(shù)g為0.0039,將兩參數(shù)代入到構造好的回歸模型,即可進行果蔬脆片各項品質(zhì)指標的回歸預測。
圖1 水分含量預測結果分布圖Fig.1 The Prediction of water content distribution
樣本測試集的水分含量擬合結果如圖1所示,擬合預測過程得出擬合預測指標均方誤差(MSE)為0.0057,相關系數(shù)R2為93.81%。從擬合結果圖可以看出,受系統(tǒng)誤差,環(huán)境因素和預測模型參數(shù)設置等眾多因素的影響,個別預測數(shù)據(jù)和原始數(shù)據(jù)有較大差異,但這些誤差仍在合理的范圍波動之內(nèi),對水分這一指標的整體品質(zhì)評價不會造成過多的影響,并且絕大部分回歸預測數(shù)據(jù)的分布大致與原始數(shù)據(jù)相符,相關系數(shù)(R2)達到93.81%,表明我們的模型構造基本良好,對水分這一指標的整體評價在有效范圍之內(nèi),對果蔬脆片的品質(zhì)評價具有一定的指導作用。
本文以蘋果脆片為研究對象,以水分含量這一品質(zhì)評價為代表,對其進行了模型的構建與預測,對于總酸、總糖、可溶性固形物、硬度等其他果蔬脆片的品質(zhì)評價指標的預測,本模型同樣適用,并且預測結果良好,對于果蔬脆片的綜合品質(zhì)評價同樣具有一定的指導作用,其預測方法與水分含量預測方法類似,只需把學習樣本數(shù)據(jù)中的水分含量數(shù)據(jù)換成相應的其他品質(zhì)評價指標的數(shù)據(jù)即可。
本文選取蘋果脆片為研究對象,結合支持向量機機器學習方法,以搜集到的蘋果脆片近紅外光譜吸收值的數(shù)據(jù)樣本為基礎,根據(jù)不同蘋果樣本、不同時序的紅外光譜吸收值的數(shù)據(jù)特征信息,產(chǎn)生不同的映射關系,將某一樣本在某一時刻的紅外光譜吸收值映射到對應樣本在對應時刻品質(zhì)指標。然后利用支持向量機的方法對這些紅外光譜吸收值的數(shù)據(jù)樣本進行訓練,從而建立了支持向量機模型,在模型建立過程中多次對最優(yōu)懲罰系數(shù)c和最優(yōu)核函數(shù)參數(shù)g進行調(diào)整,以期取得更接近于實際情況的品質(zhì)指標的預測效果,最終尋得最優(yōu)懲罰系數(shù)c為27.8576,最優(yōu)核函數(shù)參數(shù)g為0.0039。該模型擬合預測過程中的平均相關系數(shù)達到93.81%。蘋果脆片的各項評價指標大致與原始數(shù)據(jù)相符,表明我們的模型構造良好,對于果蔬脆片的評價體系具有一定的指導性意義,可以科學有效的幫助價格決策者對果蔬脆片進行品質(zhì)評價。