姚 森,李 濤,劉鴻高,李杰慶,*,王元忠*
野生食用菌富含多糖、蛋白質、維生素、膳食纖維和多種礦質元素,經常食用可以增強免疫力、促進人體新陳代謝,能夠有效預防和治療腫瘤、痢疾、水腫等疾病,兼具食藥用價值[1-3]。其味道鮮美,口感細膩,已遠銷歐美等國家,極具開發(fā)價值[4-5]。云南被稱為“食用菌王國”,種類繁多,分布廣泛,因生長環(huán)境不同,其代謝產物種類及含量發(fā)生變化,導致同種類不同產地食用菌品質存在差異[6]。對其進行產地鑒別,為食用菌資源開發(fā)與利用提供參考依據,同時為野生食用菌的質量評價提供基礎。
目前,對食用菌鑒別分析方法除了簡單的形態(tài)學方法外,光譜法和分子生物法應用較廣泛[7-8]。Li Yan等[9]采用紫外光譜法結合化學計量學對3 個不同產地野生茯苓進行快速鑒別,結果表明其紫外光譜具有指紋特性,結合聚類分析可準確區(qū)分不同產地茯苓;Lian Bin等[10]采用分子生物法,根據內轉錄間隔區(qū)(internal transcribed spacer,ITS)設計引物,成功鑒別區(qū)分了美味牛肝菌(Boletus edulis Bull.)和其他蘑菇。單一的光譜技術對樣品信息提取率低,容易受到其他因素(CO2、H2O等)干擾;分子生物法需要昂貴的儀器設備,不適宜推廣應用。
數據融合技術將多種儀器獲得的數據進行優(yōu)化、整合,豐富樣品信息,實現儀器間的互補,獲得更全面、可靠的數據,結合化學計量學構建判別模型,對樣品進行系統的分析[11-13]。數據融合分為初級融合、中級融合和高級融合,初級數據融合是將不同儀器獲得的數據進行簡單的串聯,形成更全面的數據集[14];中級融合也稱為特征級融合是將不同來源的數據經過特征提取,并對選取的特征變量(如主成分、變量在投影方向的重要程度等)進行整合,去除干擾信息,從而獲得更加豐富、系統的數據集[15-16];高級融合亦被稱作決策級融合,通過兩個或兩個以上分類模型得出最優(yōu)鑒別結果[17-18]。在已有的研究中,僅有10%的融合技術采用了高級數據融合[19]。在本研究中,采用初級融合和中級融合技術已經達到了預期效果,無須對高級融合技術進行進一步研究。
本實驗采用紫外光譜法和紅外光譜法,紫外指紋圖譜技術根據峰形、吸收波長、吸光度等差異,結合化學計量學方法可用于分析物質間差異具有操作簡便、快速、整體性強、成本低等特點[20-21];紅外光譜能有效反映出樣品的組分特征,是一種綜合性檢測方法,廣泛應用于食品質量控制、物種鑒別等方面,具有快速、簡便、樣品用量少等優(yōu)點[22-23]。通過二階導數(second derivative,2D)、標準正態(tài)變量(standard normal variate,SNV)、多元散射校正(multiplicative scatter correction,MSC)、Savitzky-Golay平滑(15點平滑)等方法對原始光譜數據進行優(yōu)化處理,采用偏最小二乘判別分析(partial least square discriminant analysis,PLS-DA)和支持向量機(support vector machine,SVM)分析比較紫外光譜、紅外光譜和數據融合技術對不同產地絨柄牛肝菌的區(qū)分效果,構建快速、有效鑒別牛肝菌產地的方法,同時為食品質量監(jiān)控提供理論基礎和科學依據。
實驗所用5 個產地絨柄牛肝菌(B. tomentipes Earle.)采自云南省和四川省,所有樣品均由云南農業(yè)大學農學與生物技術學院劉鴻高博士鑒定為絨柄牛肝菌,共96份,樣品詳細信息見表1。
表1 牛肝菌樣品信息Table 1 Information about B. tomentipes samples
UV-2550型紫外-可見分光光度計 日本島津公司;Frontier型傅里葉變換紅外光譜儀(配備氘化硫酸三甘肽晶體檢測器) 美國Perkin Elmer公司;SY3200-T型超聲波清洗儀 上海聲源超聲波儀器設備有限公司;YP-2型壓片機 上海市山岳科學儀器有限公司;FW-100型高速粉碎機 天津市華鑫儀器廠;80目標準篩盤浙江上虞市道墟五四儀器廠。
樣品采集后清洗干凈,50 ℃恒溫烘干,粉碎后過80 目標準篩,貯存?zhèn)溆?。準確稱取0.1 g牛肝菌樣品粉末置于試管中,加入10 mL氯仿溶劑,30 ℃條件下超聲提取30 min,3 層濾紙過濾,取清液置于石英比色皿中備用。紫外-可見分光光度計預熱30 min后對樣品提取液進行紫外光譜掃描,重復掃描2 次,取平均光譜,掃描間隔1 nm。掃描前使用氯仿溶液進行基線掃描。
按1∶100的比例,準確稱量(1.5±0.2)mg牛肝菌樣品和(150±20)mg溴化鉀粉末,放入瑪瑙研缽充分混合研磨成細粉,將細粉倒入壓制磨具中壓制成厚度均勻的薄片。將紅外光譜儀預熱30 min后進行樣品測定,樣品重復測定2 次,取平均光譜;掃描前使用空白樣本扣除CO2和H2O的干擾。
傅里葉變換紅外光譜儀和紫外-可見分光光度計在采集光譜信息時,會受背景噪音、散光等干擾信息[24-25]。為消除無關信息干擾,紅外原始光譜通過OMNIC 8.0軟件進行平均光譜、自動基線校正、縱坐標歸一化等預處理,紫外原始光譜采用UV probe 2.34軟件進行平滑等預處理;同時,采用2D、SNV、MSC和Savitzky-Golay平滑(15 點平滑)分別對兩種光譜進行優(yōu)化處理。
原始光譜經預處理后,選取具有指紋特性的光譜信息進行串聯,形成一個包含大量變量的獨立數據矩陣,完成低級融合。采用SIMCA-P+13.0軟件對紅外光譜和紫外光譜數據分別進行PLS-DA,提取特征變量,變量在投影方向的重要程度(variables important in projection,VIP)表示變量對分類效果的貢獻大小。當VIP值大于1時,表明該值對應的變量對區(qū)分效果的影響較大,能夠代表樣品的整體信息[26],整合兩種光譜數據的VIP值大于1的波段,進行中級融合。為了消除融合過程中受量綱干擾,在數據融合前進行歸一化處理。
SIMCA-P+13.0軟件對光譜數據進行2D、SNV、MSC、Savitzky-Golay平滑等優(yōu)化處理;Origin 8.0軟件對圖形進行優(yōu)化;通過SIMCA-P+13.0軟件和MATLAB R2014a軟件分別進行PLS-DA和SVM判別分析,建立鑒別模型,比較分類結果。
在樣品紫外光譜采集過程中,容易受到溶劑、儀器、環(huán)境等外部因素的干擾,采用UV probe 2.34軟件對紫外圖譜進行平滑等預處理。由于在190~250 nm波長內干擾嚴重,400 nm以后無明顯特征吸收峰,且牛肝菌紫外光譜的特征吸收峰集中在250~400 nm波長范圍內,因此選取250~400 nm波段的151 個變量作為樣品信息用于區(qū)分牛肝菌產地。如圖1所示,在250~400 nm范圍內5 個不同產地絨柄牛肝菌樣品的光譜圖峰形相似度高,在250~350 nm區(qū)間有明顯的特征吸收峰,265、273、283、295 nm附近為樣品共有峰,表明不同地區(qū)牛肝菌的化學組分相似。5 個不同產地絨柄牛肝菌樣品的峰強、峰位和峰面積存在差異,尤其在250~300 nm區(qū)間差異明顯,具有指紋特性,能夠作為區(qū)分不同地區(qū)絨柄牛肝菌的依據。
圖1 絨柄牛肝菌平均紅外光譜Fig. 1 Average UV absorption spectra of B. tomentipes
釆用OMNIC 9.0軟件對96 份牛肝菌紅外光譜進行平滑、基線校正和縱坐標歸一化等預處理。牛肝菌紅外光譜在4 000~400 cm-1波段內有明顯的特征吸收峰,具有指紋特性,可以用于牛肝菌的鑒別分析。樣品預處理后的紅外指紋圖譜如圖2所示,不同產地絨柄牛肝菌的紅外光譜較為相似,共有峰波數大致相同,紅外光譜在3 325 cm-1附近的強吸收峰歸屬為蛋白質、多糖、纖維素等O—H伸縮振動或者是蛋白質中N—H伸縮振動;2 927 cm-1附近吸收峰主要為多糖、蛋白質等甲基對稱伸縮振動;在1 547、1 453、1 402、1 375、1 259、1 081 cm-1及1 029 cm-1等波數附近有明顯吸收峰,但不同產地樣品的吸收峰強度有差異。1 547 cm-1附近吸收峰為C=O伸縮振動,為蛋白質酰胺I帶;1 453 cm-1附近歸屬為亞甲基的彎曲振動;1 402、1 375 cm-1及1 259 cm-1等附近為多糖、蛋白質等的C—O—H彎曲振動和亞甲基的變形振動;1 081、1 029 cm-1附近分別為糖類的C—O和C—C伸縮振動;1 000~600 cm-1波段有多個弱吸收峰,主要為糖類異構體的特征峰[4,27]。
圖2 絨柄牛肝菌平均紅外光譜Fig. 2 Average FTIR spectra of B. tomentipes
通過篩選VIP值得到對預測能力貢獻大的變量,是一種常用的提取潛在變量方法,光譜技術結合VIP篩選已經在食品鑒別分析方面得到廣泛應用[28-29]。采用SIMCA 13.0軟件紫外光譜和紅外光譜數據進行PLS-DA,對紫外光譜和紅外光譜分別進行2D+Savitzky-Golay平滑(15 點平滑)和2D+SNV+MSC優(yōu)化處理,并提取VIP值大于1的波段。圖3和圖4中a、b分別代表預處理后光譜指紋圖譜和VIP值大于1的波段,由圖3a和圖4a可知,經預處理后,圖譜的特征吸收峰更加明顯,圖譜平滑,噪音減?。粓D3b和圖4b表示該波段對鑒別絨柄牛肝菌產地具有較大貢獻,可以代表牛肝菌整體化學信息,選取對應的變量作為特征變量進行中級融合。
圖3 預處理后紫外光譜VIP得分圖Fig. 3 Scores plot for VIP of UV spectra after preprocessing
圖4 預處理后紅外光譜VIP得分圖Fig. 4 Scores plot for VIP of IR spectra after preprocessing
光譜技術結合PLS-DA法已被廣泛應用于飲料、食用油等食品檢測和質量評價[30-32]。采用PLS-DA對絨柄牛肝菌產地進行鑒別分析,隨機選取32 個絨柄牛肝菌樣品(約樣品量的1/3)作為預測集,其余64 個樣品作為訓練集。對紫外光譜、紅外光譜、初級融合和中級融合數據分別建立PLS-DA判別模型。如表2所示,紅外光譜、紫外光譜、初級融合和中級融合數據級分別建立PLSDA模型,對絨柄牛肝菌產地的預測正確率為56.25%、56.25%、62.50%和81.25%。紫外光譜和紅外光譜技術對未知產地牛肝菌的分類效果相同,且紫外光譜技術建立模型更加穩(wěn)定。初級數據融合技術對不同產地牛肝菌的分類正確率高于單獨的紫外光譜技術和紅外光譜技術,表明初級融合技術豐富了光譜數據,獲得了更加完整的光譜信息,增加了分類正確率。中級數據融合訓練集和預測集的正確率分別達到98.44%和81.25%,正確率高于單一光譜技術,分類效果優(yōu)于初級融合,表明中級融合技術建立的判別模型比單獨光譜技術和初級融合技術更穩(wěn)定、可靠。
數據集來源 正確率/%訓練集 預測集紅外光譜 92.19 56.25紫外光譜 93.75 56.25初級融合 93.75 62.50中級融合 98.44 81.25
SVM判別模型在材料鑒別[33]、食品分析[34]等領域應用廣泛,在本研究中,SVM建模選取訓練集和預測集的方法同2.4節(jié),基于紅外光譜、紫外光譜、低級融合和中級融合數據分別建立SVM判別模型。如圖5所示,4 種方法分別有3、11、4、1 個樣品區(qū)分錯誤,表明紫外光譜技術建立SVM模型對絨柄牛肝菌產地鑒別效果最差,中級融合技術建立SVM模型對絨柄牛肝菌產地分類效果最佳。
圖5 SVM對測試集的實際分類和預測分類Fig. 5 Actual and SVM predicted categories of the test set samples
訓練集正確率代表模型的穩(wěn)定性和可靠性,預測集正確率代表模型對不同產地牛肝菌的區(qū)分效果。如表3所示,產地預測正確率分別為90.63%、65.63%、87.50%和96.88%。此外,4 個數據集建模的訓練集正確率皆為96.88%,表明4 個模型的穩(wěn)定性高;初級融合對不同產地的預測正確率高于單個紫外光譜技術,低于單獨的紅外光譜技術,表明初級融合豐富了光譜數據,同時簡單的數據串聯將無效信息相互疊加,降低分類正確率;中級融合的分類正確率高于初級融合,證明中級融合在整合數據過程中去除了無效信息,避免兩種光譜信息的互相干擾,提高分類正確率。比較表2和表3可知,采用中級融合技術建立SVM判別模型,模型穩(wěn)定、可靠,對不同產地牛肝菌鑒別效果最佳。
表3 SVM對不同數據集的分類結果Table 3 Prediction accuracy of SVM based on different data matrixes
采用紅外光譜法和紫外光譜法采集不同產地絨柄牛肝菌的光譜信息,選擇2D+Savitzky-Golay平滑(15 點平滑)和2D+SNV+MSC預處理方法分別對樣品紅外光譜和紫外光譜進行優(yōu)化處理,減少噪音干擾。對優(yōu)化后的光譜數據進行初級融合,并通過PLS-DA提取VIP大于1的波段進行中級數據融合。通過PLS-DA和SVM判別分析分別建立分類鑒別模型,并比較紅外光譜、紫外光譜、低級融合和中級融合技術對不同產地絨柄牛肝菌的鑒別效果。結果顯示:中級數據融合建立PLS-DA和SVM判別模型對未知樣品產地的預測正確率分別為81.25%、96.88%,鑒別效果優(yōu)于其他技術,表明中級融合對不同產地牛肝菌區(qū)分效果最佳,且SVM判別模型與PLS-DA模型相比更加穩(wěn)定、可靠。中級融合技術結合SVM建立鑒別模型,能夠準確、有效區(qū)分不同產地絨柄牛肝菌,為快速鑒別野生食用菌提供有效方法,對食品評價具有重要意義。
參考文獻:
[1] 李濤, 王元忠, 李榮春. 絨柄牛肝菌子實體營養(yǎng)成分分析[J]. 食用菌學報, 2008, 15(4): 70-72. DOI:10.3969/j.issn.1005-9873.2008.04.013.
[2] CHEUNG P C K. The nutritional and health benefits of mushrooms[J].Nutrition Bulletin, 2010, 35(4): 292-299. DOI:10.1111/j.1467-3010.2010.01859.x.
[3] RADZKI W, SLAWINSKA A, JABLONSKA-RYS E, et al.Antioxidant capacity and polyphenolic content of dried wild edible mushrooms from Poland[J]. International Journal of Medicinal Mushrooms, 2014, 16(1): 65-75. DOI:10.1615/IntJMedMushr.v16.i1.60.
[4] 楊天偉, 張霽, 史云東, 等. 紅外光譜結合多元統計分析快速鑒別不同種類牛肝菌[J]. 食品科學, 2015, 36(24): 116-121. DOI:10.7506/spkx1002-6630-201524020.
[5] WANG X M, ZHANG J, WU L H, et al. A mini-review of chemical composition and nutritional value of edible wild-grown mushroom from China[J]. Food Chemistry, 2014, 151: 279-285. DOI:10.1016/j.foodchem.2013.11.062.
[6] LI Y, ZHANG J, LI T, et al. Geographical traceability of wild Boletus edulis based on data fusion of FT-MIR and ICP-AES coupled with data mining methods (SVM)[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2017, 177: 20-27. DOI:10.1016/j.saa.2017.01.029.
[7] 楊天偉, 李濤, 張霽, 等. 不同產地, 種類牛肝菌的紫外光譜鑒別分析[J]. 食品工業(yè), 2015, 36(9): 208-212.
[8] 楊天偉, 李濤, 張霽, 等. 不同產地絨柄牛肝菌紫外指紋圖譜鑒別分析[J]. 食品工業(yè)科技, 2015, 36(9): 301-305. DOI:10.13386/j.issn1002-0306.2015.09.057.
[9] LI Y, ZHANG J, ZHAO Y L, et al. Characteristic fingerprint based on low polar constituents for discrimination of Wolfiporia extensa according to geographical origin using UV spectroscopy and chemometrics methods[J]. Journal of Analytical Methods in Chemistry,2014, 2014: 519424. DOI:10.1155/2014/519424.
[10] LIAN B, ZANG J P, HOU W G, et al. PCR-based sensitive detection of the edible fungus Boletus edulis from rDNA ITS sequences[J].Electronic Journal of Biotechnology, 2008, 11(3): 102-109.DOI:10.4067/S0717-34582008000300011.
[11] KHALEGHI B, KHAMIS A, KARRAY F O, et al. Multisensor data fusion: a review of the state-of-the-art[J]. Information Fusion, 2013,14(1): 28-44. DOI:10.1016/j.inffus.2011.08.001.
[12] VERA L, ACE?A L, GUASCH J, et al. Discrimination and sensory description of beers through data fusion[J]. Talanta, 2011, 87: 136-142.DOI:10.1016/j.talanta.2011.09.052.
[13] WU Z, XU E, LONG J, et al. Comparison between ATR-IR, Raman,concatenated ATR-IR and Raman spectroscopy for the determination of total antioxidant capacity and total phenolic content of Chinese rice wine[J]. Food Chemistry, 2016, 194: 671-679. DOI:10.1016/j.foodchem.2015.08.071.
[14] PIZARRO C, RODRíGUEZ-TECEDOR S, PéREZ-DELNOTARIO N, et al. Classification of Spanish extra virgin olive oils by data fusion of visible spectroscopic fingerprints and chemical descriptors[J]. Food Chemistry, 2013, 138(2): 915-922. DOI:10.1016/j.foodchem.2012.11.087.
[15] DEARING T I, THOMPSON W J, RECHSTEINER C E, et al.Characterization of crude oil products using data fusion of process raman, infrared, and nuclear magnetic resonance (NMR) spectra[J].Applied Spectroscopy, 2011, 65(2): 181-186.
[16] BIANCOLILLO A, BUCCI R, MAGRì A L, et al. Data-fusion for multiplatform characterization of an Italian craft beer aimed at its authentication[J]. Analytica Chimica Acta, 2014, 820: 23-31.DOI:10.1016/j.aca.2014.02.024.
[17] DI ANIBAL C V, CALLAO M P, RUISáNCHEZ I.1H NMR and UV-visible data fusion for determining Sudan dyes in culinary spices[J].Talanta, 2011, 84(3): 829-833. DOI:10.1016/j.talanta.2011.02.014.
[18] DOESWIJK T G, SMILDE A K, HAGEMAN J A, et al. On the increase of predictive performance with high-level data fusion[J].Analytica Chimica Acta, 2011, 705(1): 41-47. DOI:10.1016/j.aca.2011.03.025.
[19] BORRàS E, FERRé J, BOQUé R, et al. Data fusion methodologies for food and beverage authentication and quality assessment: a review[J]. Analytica Chimica Acta, 2015, 891: 1-14. DOI:10.1016/j.aca.2015.04.042.
[20] MARTINS A R, TALHAVINI M, VIEIRA M L, et al. Discrimination of whisky brands and counterfeit identification by UV-Vis spectroscopy and multivariate data analysis[J]. Food Chemistry, 2017, 229: 142-151.DOI:10.1016/j.foodchem.2017.02.024.
[21] PAULI E D, BRUNS R E, SCARMINIO I S. UV-Vis spectral fingerprinting and chemometric method applied to the evaluation of Camellia sinensis leaves from different harvests[J]. Analytical Methods, 2016, 8(41): 7537-7544. DOI:10.1039/C6AY02462A.
[22] ZHAO Y L, ZHANG J, JIN H, et al. Discrimination of Gentiana rigescens from different origins by Fourier transform infrared spectroscopy combined with chemometric methods[J]. Journal of AOAC International, 2015, 98(1): 22-26. DOI:10.5740/jaoacint.13-395.
[23] QI L M, ZHANG J, ZUO Z T, et al. Determination of iridoids in Gentiana rigescens by infrared spectroscopy and multivariate analysis[J]. Analytical Letters, 2017, 50(2): 389-401. DOI:10.1080/00 032719.2016.1178757.
[24] 姚森, 張霽, 李杰慶, 等. 利用FTIR和化學計量學對牛肝菌親緣關系的研究[J]. 河南農業(yè)科學, 2017, 46(1): 110-115. DOI:10.15933/j.cnki.1004-3268.2017.01.020.
[25] LI Y, ZHANG J, LI T, et al. Ultraviolet spectroscopy used to fingerprint five wild-grown edible mushrooms (Boletaceae) collected from Yunnan, China[J]. Journal of Spectroscopy, 2016, 2016: 7813405.DOI:10.1155/2016/7813405.
[26] CHONG I G, JUN C H. Performance of some variable selection methods when multicollinearity is present[J]. Chemometrics and Intelligent Laboratory Systems, 2005, 78(1): 103-112. DOI:10.1016/j.chemolab.2004.12.011.
[27] FAGHIHIAN H, SABOKROOH E. Immobilization of ligands on surfactant coated alumina for removal of cations[J]. Iranian Journal of Chemistry and Chemical Engineering, 2012, 31(4): 1-9.
[28] LAWAETZ A J, CHRISTENSEN S M U, CLAUSEN S K, et al. Fast,cross cultivar determination of total carotenoids in intact carrot tissue by Raman spectroscopy and partial least squares calibration[J]. Food Chemistry, 2016, 204: 7-13. DOI:10.1016/j.foodchem.2016.02.107.
[29] OUSSAMA A, ELABADI F, PLATIKANOV S, et al. Detection of olive oil adulteration using FT-IR spectroscopy and PLS with variable importance of projection (VIP) scores[J]. Journal of the American Oil Chemists’Society, 2012, 89(10): 1807-1812. DOI:10.1007/s11746-012-2091-1.
[30] MA H, WANG J, CHEN Y, et al. Rapid authentication of starch adulterations in ultrafine granular powder of Shanyao by near-infrared spectroscopy coupled with chemometric methods[J]. Food Chemistry,2017, 215: 108-115. DOI:10.1016/j.foodchem.2016.07.156.
[31] BONA E, MARQUETTI I, LINK J V, et al. Support vector machines in tandem with infrared spectroscopy for geographical classification of green arabica coffee[J]. LWT-Food Science and Technology, 2017,76: 330-336. DOI:10.1016/j.lwt.2016.04.048.
[32] LI X, XU K, ZHANG Y, et al. Optical determination of lead chrome green in green tea by Fourier transform infrared (FT-IR) transmission spectroscopy[J]. PLoS ONE, 2017, 12(1): e0169430. DOI:10.1371/journal.pone.0169430.
[33] BALABIN R M, SAFIEVA R Z, LOMAKINA E I. Gasoline classification using near infrared (NIR) spectroscopy data: comparison of multivariate techniques[J]. Analytica Chimica Acta, 2010, 671(1):27-35. DOI:10.1016/j.aca.2010.05.013.
[34] POULADZADEH P, SHIRMOHAMMADI S, BAKIROV A, et al.Cloud-based SVM for food categorization[J]. Multimedia Tools and Applications, 2015, 74(14): 5243-5260. DOI:10.1007/s11042-014-2116-x.