胡翼然,李杰慶,劉鴻高,范茂攀,*,王元忠
(1.云南農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,云南 昆明 650201;2.云南農(nóng)業(yè)大學(xué)農(nóng)學(xué)與生物技術(shù)學(xué)院,云南 昆明 650201;3.云南省農(nóng)業(yè)科學(xué)院藥用植物研究所,云南 昆明 650200)
牛肝菌(Boletaceae)是一種大型真菌,富含多糖、蛋白質(zhì)、氨基酸、維生素、礦物質(zhì)、膳食纖維等營養(yǎng)物質(zhì)[1],且有抗癌、抗氧化、抗腫瘤、抗疲勞等治療功效[2],受廣大消費(fèi)者的喜愛。云南省地處低緯,海拔高差大、干濕季分明、光熱資源充足,為野生牛肝菌生長發(fā)育提供了適宜的生長環(huán)境[3]。云南省野生牛肝菌種類豐富,已知種類約有244 種,可食用種類占59%(144 種)[4]。在可食用野生牛肝菌中,部分野生牛肝菌具有毒性,如食用加工方法不當(dāng),易導(dǎo)致食物中毒[5],如華麗牛肝菌[6]、小美牛肝菌[7]、絨柄牛肝菌[6]等。新鮮野生牛肝菌外貌相似,即使是有經(jīng)驗(yàn)的專家學(xué)者,也很難快速、準(zhǔn)確識別其種類,同時(shí)野生食用菌不易保存,常被制成干片銷售,進(jìn)一步增加了辨識難度。目前,國內(nèi)外野生牛肝菌混雜現(xiàn)象屢屢發(fā)生[8-9],嚴(yán)重威脅消費(fèi)者的身體健康,急需一種準(zhǔn)確、快速、廉價(jià)的常見野生食用牛肝菌種類鑒別技術(shù)。
傳統(tǒng)鑒別方法如對形態(tài)特征法、動物檢驗(yàn)法等,此類方法操作簡單、準(zhǔn)確性低、主觀因素影響大,鑒別能力不足[10]。傳統(tǒng)化學(xué)檢測方法如紫外光譜法[11]、高效液相色譜法[12]、電感耦合等離子體-原子發(fā)射光譜法[13]、電子鼻技術(shù)[14]等,上述方法耗時(shí)、費(fèi)用昂貴、操作難度大,不能實(shí)現(xiàn)快速、廉價(jià)的種類鑒別。傅里葉變換中紅外光譜法具有操作簡單、速度快捷、成本低廉的特點(diǎn),近年來,化學(xué)指紋圖譜結(jié)合數(shù)理統(tǒng)計(jì)學(xué)廣泛應(yīng)用于種類鑒別研究[15-17]。
雖然傅里葉變換中紅外光譜表征樣品的化學(xué)信息全面,但其中存在大量干擾信息和無效信息,反而會導(dǎo)致模型分類性能下降,故研究不同信息挖掘方法對野生牛肝菌種類鑒別具有重要意義。目前,對牛肝菌光譜信息挖掘主要集中在不同預(yù)處理方法對模型分類效果的影響[18-19]。因此,本實(shí)驗(yàn)采用預(yù)處理及不同特征變量提取方法(主成分、變量重要性、變量投影重要性),挖掘中紅外光譜有效信息,結(jié)合支持向量機(jī)(support vector machine,SVM)建立判別模型,比較模型分類效果,探索野生牛肝菌種類鑒別方法,為野生食用菌鑒別和質(zhì)量控制提供參考依據(jù)。
8 種827 個(gè)云南常見野生牛肝菌樣本:于2011—2014年采買于云南省,經(jīng)云南農(nóng)業(yè)大學(xué)劉鴻高教授鑒定為華麗牛肝菌、灰褐牛肝菌、栗色牛肝菌、美味牛肝菌、絨柄牛肝菌、雙色牛肝菌、小美牛肝菌和皺蓋疣柄牛肝菌(圖1、表1)。
溴化鉀(分析純) 天津風(fēng)船化工科技有限公司。
圖1 牛肝菌樣品圖Fig. 1 Pictures of boletus samples
表1 牛肝菌種類信息Table 1 Information about boletus samples tested in this study
Frontier傅里葉變換中紅外光譜儀 美國Perkin Elmer公司;FW-100型高速粉碎機(jī) 浙江華鑫儀器廠;YP-2型壓片機(jī) 上海山岳科學(xué)儀器有限公司;80 目標(biāo)準(zhǔn)篩盤 浙江紹興市道墟五四儀器廠;AR1140型電子分析天平 上海升隆電子科技有限公司。
1.3.1 樣品前處理
樣品前處理模擬干片的制備,樣品采集后去除土樣等雜質(zhì),用純凈水清洗干凈,置于50 ℃烘箱烘干至質(zhì)量恒定,研磨成粉過80 目標(biāo)準(zhǔn)篩盤,分別儲存于自封袋中,保存于避光處。
1.3.2 傅里葉變換中紅外光譜采集
?。?.5±0.2)mg野生牛肝菌樣品和(150±20)mg KBr粉末在研缽中磨細(xì)混勻,再將細(xì)粉倒入磨具中壓成薄片。先掃描溴化鉀空白片作為基線,再掃描各樣品片。掃描波數(shù)范圍4 000~400 cm-1,分辨率4 cm-1,信號累計(jì)掃描次數(shù)16 次,每個(gè)樣本重復(fù)掃描3 次,取平均光譜。
1.3.3 SVM算法
SVM是一種基于非線性映射的二分類監(jiān)督學(xué)習(xí)方法,利用核函數(shù)將向量投影到高維特征空間,建立最優(yōu)超平面,對樣本分類。本研究在Matlab中使用LIBSVM包構(gòu)建SVM,核函數(shù)為徑向基函數(shù),利用網(wǎng)格搜索算法(grid search,GS)尋找最優(yōu)參數(shù)組合懲罰因子(C)和核參數(shù)(g),交叉驗(yàn)證次數(shù)k設(shè)置為10;懲罰參數(shù)步進(jìn)距離、核參數(shù)步進(jìn)距離、步進(jìn)間隔距離均設(shè)置為0.5。該算法是基于一對多全分區(qū)的二叉樹支持向量機(jī),算法原理如圖2所示,該算法分類速度和正確率高。
圖2 基于字母順序排列的SVM流程圖Fig. 2 Flow chart of SVM classification in the alphabetical order
C是懲罰因子,代表SVM算法對異常點(diǎn)的重視程度,影響模型的分類精度。C越大訓(xùn)練集誤差越小,C過大容易導(dǎo)致過擬合;C越小訓(xùn)練集誤差越大,C過小容易欠擬合;C過大或過小都會導(dǎo)致模型泛化能力減弱。g是核函數(shù)半徑,代表數(shù)據(jù)映射到高維特征空間后的分布,影響模型的分類訓(xùn)練速度。g越大,支持向量越少,速度越快;g越小,支持向量越多,速度越慢。利用GS尋找最優(yōu)參數(shù)C和g,GS是窮舉搜索,建立一個(gè)三維坐標(biāo)系,將待搜索參數(shù)C和g依次排列于X軸(log2C)和Y軸(log2g),形成帶網(wǎng)格的坐標(biāo)系,坐標(biāo)系上每一個(gè)點(diǎn)代表一種參數(shù)組合,將不同參數(shù)組合的交叉驗(yàn)證精確度依次排列于Z軸,最終選取交叉驗(yàn)證精度最高的(C、g)組合[20]。當(dāng)C的范圍在[2-2, 24]且g的范圍在[2-4, 24]之間,模型擬合度高。
1.4.1 預(yù)處理方法
中紅外光譜數(shù)據(jù)中重疊的譜帶和各種噪聲信號,會降低模型的識別能力。對光譜數(shù)據(jù)進(jìn)行預(yù)處理可以減少干擾信息和噪音同時(shí)提高模型的適應(yīng)性,增強(qiáng)模型的預(yù)測能力。本實(shí)驗(yàn)采用多元散射校正(multiplicative scatter correction,MSC)結(jié)合多項(xiàng)式平滑法對光譜數(shù)據(jù)進(jìn)行預(yù)處理。MSC能有效去除紅外光譜中散射和粒徑的乘性干擾[21]。多項(xiàng)式平滑法是SG平滑與導(dǎo)數(shù)處理的結(jié)合,可以消除光譜中的高頻噪音及位移變化,通過平滑點(diǎn)數(shù)、導(dǎo)數(shù)階數(shù)、多項(xiàng)式次數(shù)3 個(gè)參數(shù)調(diào)節(jié)。平滑能夠衰減噪聲信號,保持光譜數(shù)據(jù)特征信息。導(dǎo)數(shù)處理可以消除基線漂移,加強(qiáng)光譜特征,但也會放大噪音信號。本實(shí)驗(yàn)的平滑點(diǎn)數(shù)為15,導(dǎo)數(shù)階數(shù)為1(1D),多項(xiàng)式次數(shù)為2。
為避免樣本之間的量綱影響,利用歸一化把數(shù)據(jù)映射在[-1, 1]之間,從而加快模型收斂速度,增強(qiáng)模型精度[22]。利用Kennard-Stone(K-S)算法將數(shù)據(jù)集(827)分為70%的訓(xùn)練集(549)和30%的測試集(278),K-S算法通過計(jì)算樣品間歐氏距離,對樣本從遠(yuǎn)到近依次排序,從而保證選取樣本代表性強(qiáng)同時(shí)避免隨機(jī)選擇的不可重復(fù)性[23]。
1.4.2 提取特征變量方法
主成分(principal component,PC)通過偏最小二乘回歸算法將數(shù)據(jù)降維成互不線性相關(guān)的多組PC,特征值代表PC能解釋原始數(shù)據(jù)的方差大小,特征值越大能解釋的方差越多。提取特征值大于1的PC為特征變量[24]。
特征重要性(feature importance,F(xiàn)I),通過隨機(jī)森林算法得到各變量的FI,根據(jù)FI依次排列變量,用10折交叉驗(yàn)證對波長點(diǎn)進(jìn)行迭代篩選,提取有效變量作為特征變量[25]。
變量投影重要性指標(biāo)(variable importance in projection,VIP)值表示自變量對模型擬合程度的重要性,VIP值越高波長點(diǎn)對標(biāo)簽的解釋能力越強(qiáng)[26],提取VIP大于1的波長點(diǎn)為特征變量。
從圖3a可以看出,原始光譜(raw extracted spectra,RAW)中有6 處明顯的光譜峰。3 200~3 600 cm-1之間是羥基伸縮振動區(qū),3 386 cm-1附近是O—H和N—H的伸縮振動。2 932 cm-1與N—H、CH2和CH3的伸縮振動有關(guān)。1 645 cm-1是酰胺I帶和的C=O伸縮振動,可能與蛋白質(zhì)有關(guān)。1 645 cm-1附近可能是亞硝基的N=O伸縮振動和酰胺II帶C—N、N—H的伸縮振動,可能與蛋白質(zhì)和殼聚糖有關(guān)。1 411 cm-1附近是C—H和O—H的彎曲振動有關(guān),可能與多糖有關(guān)。在900~1 200 cm-1附近之間是多糖區(qū)域,1 080 cm-1與醚、酯等含氧化合物的C—O伸縮振動有關(guān),可能與β-葡聚糖有關(guān);1 022 cm-1附近與醇、酚的C—O伸縮振動有關(guān)。900 cm-1以下是指紋圖譜區(qū),可能與多糖結(jié)構(gòu)有關(guān)[27-28]。圖2b為8 種野生牛肝菌經(jīng)MSC+SG+1D處理后的中紅外平均光譜圖,有18 處明顯的光譜峰,集中在3 569、3 348、3 213、3 102、2 952、2 891、1 682、1 562、1 476、1 336、1 269、1 177、1 095、1 042、902、816、734、628 cm-1附近??赡茉蚴墙?jīng)MSC+SG+1D預(yù)處理后,中紅外圖譜的乘性干擾、噪音及無效信息被大幅去除,光譜特征被加強(qiáng)。
圖3 8 種牛肝菌平均光譜圖Fig. 3 Average mid-infrared spectra of Boletus samples from eight species
比較圖3中8 種野生牛肝菌的中紅外平均光譜圖。8 種野生牛肝菌均有相似的峰形、峰數(shù)、峰位,表明這8 種野生牛肝菌有相似的化學(xué)成分。華麗牛肝菌和小美牛肝菌相較于其他牛肝菌吸光度更高,其余6 種野生牛肝菌的吸光度有微小差異,表明這8 種野生牛肝菌的化學(xué)成分含量不同。利用中紅外光譜圖對8 種野生牛肝菌進(jìn)行可視化分析,可以看出不同種類野生牛肝菌存在差異,因此需進(jìn)一步結(jié)合數(shù)理統(tǒng)計(jì)學(xué)鑒別種類。
RAW模型是由827 個(gè)樣品×1 867 個(gè)變量組成的數(shù)據(jù)矩陣,如圖4a1所示,基于GS選出原始中紅外光譜最優(yōu)參數(shù)組合(C=2.62×105,g=3.81×10-6),分類結(jié)果如圖4a2所示,有3 個(gè)樣品分類錯(cuò)誤,其中1 個(gè)栗色牛肝菌被分類為美味牛肝菌,2 個(gè)雙色牛肝菌分別被分類為栗色牛肝菌和美味牛肝菌。原始數(shù)據(jù)經(jīng)MSC+SG+1D處理后,形成由827 個(gè)樣品×1 839 個(gè)變量組成的數(shù)據(jù)矩陣,如圖4b1所示,基于GS選出最優(yōu)參數(shù)組合(C=90.5,g=3.45×10-4),分類結(jié)果如圖4b2所示,有1 個(gè)分類錯(cuò)誤,其中1 個(gè)栗色牛肝菌被分類為小美牛肝菌。研究表明,原始數(shù)據(jù)結(jié)合SVM建立判別模型,CRAW大于24,gRAW小于2-4,模型過擬合風(fēng)險(xiǎn)大,經(jīng)預(yù)處理后去建立模型,CMSC+SG+1D小于CRAW,gMSC+SG+1D小于gRAW,模型擬合能力增加,但CMSC+SG+1D大于24,gMSC+SG+1D小于2-4,過擬合風(fēng)險(xiǎn)依然大。根據(jù)模型的混淆矩陣,可以計(jì)算出靈敏度、特異性參數(shù)(表2),從保護(hù)消費(fèi)者身體健康的角度,不允許有毒牛肝菌錯(cuò)分類為無毒牛肝菌,即鑒別野生牛肝菌種類要有高靈敏度,本實(shí)驗(yàn)根據(jù)靈敏度判斷模型分類性能,靈敏度越高模型分類性能越高。
圖4 參數(shù)選擇圖和SVM分類結(jié)果Fig. 4 Parameter selection and SVM classification results
預(yù)處理后的光譜效果較好,評價(jià)SVM模型性能的測試集分類結(jié)果如表2所示。與RAW相比,基于MSC+SG+1D預(yù)處理后光譜建立的模型相比,模型過擬合風(fēng)險(xiǎn)降低,分類精度更加準(zhǔn)確,研究結(jié)果證實(shí)了粉末樣品存在噪音和干擾因子,影響模型的分類性能。該預(yù)處理方法可去除干擾因子及增強(qiáng)光譜特征,但模型擬合度不理想,需進(jìn)一步深入挖掘光譜信息。
表2 不同數(shù)據(jù)集SVM模型參數(shù)值Table 2 Parameters of SVM models established by different data mining methods
圖5 特征變量提取方法Fig. 5 Comparison of feature variable extraction methods
圖6 參數(shù)選擇圖和SVM分類結(jié)果圖Fig. 6 Parameter selection and SVM classification results
RAW-PC模型是由827 個(gè)樣品×10 個(gè)變量形成的數(shù)據(jù)矩陣,如圖5a1所示,挖掘原始數(shù)據(jù)信息,總的提取了628 個(gè)PC,前10 個(gè)PC大于1,篩選前10 個(gè)PC為特征變量,如圖6a1所示,基于GS選出最優(yōu)參數(shù)組合(C=2,g=0.176),圖6a2有15 個(gè)樣品分類錯(cuò)誤,其中2 個(gè)華麗牛肝菌分別被錯(cuò)誤分類到灰褐牛肝菌和小美牛肝菌,3 個(gè)灰褐牛肝菌被錯(cuò)誤分類為絨柄牛肝菌,2 個(gè)絨柄牛肝菌被錯(cuò)誤分類為栗色牛肝菌,3 個(gè)雙色牛肝菌被錯(cuò)誤分類為1 個(gè)栗色牛肝菌和2 個(gè)美味牛肝菌,1 個(gè)小美牛肝菌被錯(cuò)誤分類為華麗牛肝菌,1 個(gè)皺蓋疣柄牛肝菌被錯(cuò)誤分類為美味牛肝菌。RAW-PC模型擬合程度高,分類性能弱,可用于野生牛肝菌種類鑒別。
RAW-FI模型是由827 個(gè)樣品×157 個(gè)變量形成的數(shù)據(jù)矩陣,如圖5b1所示,挖掘原始數(shù)據(jù)信息,區(qū)域I 1 867~157,錯(cuò)誤率不斷降低,代表負(fù)面信息被去除;區(qū)域II 157~97,錯(cuò)誤率在同一水平上下浮動,代表無效信息被去除;區(qū)域III 157~97,錯(cuò)誤率大幅上升,代表有效信息被去除;提取特征重要性最高的前157 個(gè)變量建立模型。如圖6b1所示,基于GS選出最優(yōu)參數(shù)組合(C=9.27×104,g=3.45×10-4)分類結(jié)果如圖6b2所示,有7 個(gè)分類錯(cuò)誤,其中1 個(gè)華麗牛肝菌被錯(cuò)誤分類為灰褐牛肝菌,3 個(gè)灰褐牛肝菌被錯(cuò)誤分類為2 個(gè)栗色牛肝菌和1 個(gè)雙色牛肝菌,2 個(gè)栗色牛肝菌被錯(cuò)誤分類為1 個(gè)灰褐牛肝菌和1 個(gè)絨柄牛肝菌,1 個(gè)雙色牛肝菌被錯(cuò)誤分類為栗色牛肝菌。RAW-FI模型的擬合程度低,過擬合風(fēng)險(xiǎn)大,不適結(jié)合SVM用于野生牛肝菌種類鑒別。
RAW-VIP模型是由827 個(gè)樣品×641 個(gè)變量形成的數(shù)據(jù)矩陣,如圖5c1所示,挖掘原始數(shù)據(jù)信息,按VIP排列,前641 個(gè)VIP大于1,篩選前641 個(gè)VIP為特征變量,如圖6c1所示,基于GS選出最優(yōu)參數(shù)組合(C=4.63×104,g=6.1×10-5),圖6c2有5 個(gè)樣品分類錯(cuò)誤,其中1 個(gè)華麗牛肝菌分別被錯(cuò)誤分類到灰褐牛肝菌,1 個(gè)栗色牛肝菌被錯(cuò)誤分類為華麗牛肝菌,3 個(gè)雙色牛肝菌被錯(cuò)誤分類為2 個(gè)栗色牛肝菌和1 個(gè)絨柄牛肝菌。RAW-VIP模型擬合程度低,分類性能弱,不適結(jié)合SVM用于野生牛肝菌種類鑒別。
提取特征變量挖掘光譜信息后模型擬合度變好(表2)。與RAW相比,基于提取特征變量建立光譜的模型與RAW光譜建立的模型相比,模型過擬合風(fēng)險(xiǎn)均降低,分類精度均更加準(zhǔn)確,研究結(jié)果證實(shí)了光譜信息中存在大量無效信息,混淆了算法對有效特征的識別,減弱了模型的分類性能。實(shí)驗(yàn)中3 種提取特征變量方法均不同程度去除了非有效信息,增加了模型擬合度,但效果不理想。模型RAW-FI、RAW-VIP過擬合風(fēng)險(xiǎn)大,原因是這兩種方法基于波長點(diǎn)挖掘數(shù)據(jù),可能將噪音等負(fù)面信息誤判為特征變量;模型RAW-FI、RAW-VIP過擬合風(fēng)險(xiǎn)小,原因是該方法基于波長整體挖掘數(shù)據(jù),可能減弱了負(fù)面信息和有效信息的影響,導(dǎo)致相較于其他模型擬合度高,分類性能弱。需進(jìn)一步深入挖掘光譜信息。
圖7 參數(shù)選擇圖和SVM分類結(jié)果圖Fig. 7 Parameter selection and SVM classification results
MSC+SG+1D-PC模型是由827 個(gè)樣品×39 個(gè)變量形成的數(shù)據(jù)矩陣,如圖7a1所示,基于GS選出最優(yōu)參數(shù)組合(C=2.83,g=0.354)。如圖5a2所示,預(yù)處理與PC組合挖掘數(shù)據(jù)信息,總的提取了137 個(gè)PC,提取前32 個(gè)PC為特征變量。分類結(jié)果如圖7a2所示,有3 個(gè)分類錯(cuò)誤,其中1 個(gè)灰褐牛肝菌被錯(cuò)誤分類為栗色牛肝菌,1 個(gè)美味牛肝菌被錯(cuò)誤分類為皺蓋疣柄牛肝菌,1 個(gè)雙色牛肝菌被錯(cuò)誤分類為小美牛肝菌。MSC+SG+1D-PC模型的擬合程度高,分類性能強(qiáng),可用于野生牛肝菌種類鑒別。
MSC+SG+1D-FI模型是由827 個(gè)樣品×959 個(gè)變量形成的數(shù)據(jù)矩陣,如圖7b1所示,基于GS選出最優(yōu)參數(shù)組合(C=4,g=1.56×10-2),如圖5b2所示,預(yù)處理與FI組合挖掘數(shù)據(jù)信息,提取FI最高的前959 個(gè)變量是最優(yōu)變量。分類結(jié)果如圖7b2所示,有2 個(gè)分類錯(cuò)誤,其中1 個(gè)灰褐牛肝菌被錯(cuò)誤分類為雙色牛肝菌,1 個(gè)雙色牛肝菌被錯(cuò)誤分類為小美牛肝菌。MSC+SG+1D-FI模型的擬合程度高,分類性能強(qiáng),可用于野生牛肝菌種類鑒別。
MSC+SG+1D-VIP模型是由827 個(gè)樣品×780 個(gè)變量形成的數(shù)據(jù)矩陣,如圖7c1所示,基于GS選出最優(yōu)參數(shù)組合(C=256,g=2.44×10-4),如圖5c2所示,預(yù)處理與VIP組合挖掘數(shù)據(jù)信息,提取VIP大于1的前780 個(gè)變量。分類結(jié)果如圖7c2所示,有1 個(gè)分類錯(cuò)誤,1 個(gè)雙色牛肝菌被錯(cuò)誤分類為小美牛肝菌。MSC+SG+1D-FI模型的擬合程度相較于RAW-VIP有了顯著提高,但不適結(jié)合SVM用于野生牛肝菌種類鑒別。
預(yù)處理組合特征變量方法挖掘數(shù)據(jù)后的分類效果較好(表2)。與RAW、MSC+SG+1D、RAW-PC、RAWFI、RAW-VIP相比,基于預(yù)處理組合特征變量方法建立光譜的模型,模型擬合度高、分類性能好,研究結(jié)果證實(shí)了預(yù)處理與特征變量組合方法可以大幅減少非有效信息,增強(qiáng)有效信息,起協(xié)同作用達(dá)到準(zhǔn)確鑒別的目的。
為驗(yàn)證數(shù)據(jù)挖掘方法的可靠性和泛用性,相同條件結(jié)合偏最小二乘判別算法(partial least squaresdiscrimination algorithm,PLS-DA)建立判別模型。如表3所示,各PLS-DA模型交叉驗(yàn)證均方根誤差(root mean square error of cross validation,RMSECV)大于預(yù)測均方根誤差(root mean square error of prediction,RMSEP)且數(shù)值均較小,表明模型擬合良好[29]。特征變量FI與預(yù)處理組合的方法,模型擬合度高,分類性能最優(yōu)。
表3 不同數(shù)據(jù)集PLS-DA模型參數(shù)值Table 3 Parameters of PLS-DA models established by different data mining methods
對比表2和表3分析不同算法的模型參數(shù)。PLS-DA模型靈敏度在59.8%~93.0%之間,SVM模型靈敏度在92.2%~99.3%之間,研究表明,SVM算法的分類能力優(yōu)于PLS-DA。但Wang Yuanyuan等[30]對靈芝的中紅外光譜鑒別研究中有相反的結(jié)論,PLS-DA模型分類性能優(yōu)于SVM模型,原因可能是其樣本量少(120),本研究中樣本量更大(827),研究表明,SVM模型更適用于大樣本種類鑒別。預(yù)處理與特征變量組合方法挖掘光譜信息能力最強(qiáng),對模型分類效果提升最大,研究表明,該方法適用范圍廣。
采用傅里葉變換中紅外光譜法測定8 種827 個(gè)野生牛肝菌子實(shí)體的紅外光譜,分析牛肝菌的化學(xué)信息。采用預(yù)處理、提取特征變量(PC、FI、VIP)及兩者組合等方法挖掘樣品光譜信息,提高模型分類效果,結(jié)果表明:預(yù)處理組合特征變量對模型信息挖掘能力最強(qiáng),結(jié)合SVM建立判別模型,模型擬合好,分類精度高,實(shí)現(xiàn)了8 種野生牛肝菌的準(zhǔn)確、快速鑒別,可以為野生牛肝菌種類鑒別的提供參考。