唐 英 張思維 張芷柔 陳 瑤
湖南工業(yè)大學(xué)生命科學(xué)與化學(xué)學(xué)院 湖南 株洲 412007
百合(藥材)為百合科植物卷丹、百合或細(xì)葉百合的干燥肉質(zhì)鱗葉[1],富含多糖類、生物堿類、甾體皂苷類、黃酮類以及酚類化合物等多種化學(xué)成分[2],具有止咳平喘、抗氧化、抗抑郁、抗腫瘤、抗真菌、降血糖、免疫調(diào)節(jié)等多種藥理作用及養(yǎng)陰潤肺、清心安神等保健功效[1,3],被廣泛應(yīng)用于臨床中藥配方和中成藥。百合通常被加工成粉末狀產(chǎn)品,從外觀上難以辨別其品質(zhì)優(yōu)劣[4]。個別不良商家趁機(jī)往純百合粉末中摻入一定量廉價淀粉(如土豆淀粉、紅薯淀粉、小麥淀粉和玉米淀粉等)出售,更有甚者直接用淀粉類產(chǎn)品冒充純百合粉出售,以此謀取暴利,從而導(dǎo)致市面上的百合粉質(zhì)量良莠不齊。因此,探究快速有效鑒別百合粉中摻假摻偽問題的方法具有重要意義。
目前,近紅外光譜[5-6]、薄層色譜[1,7]、氣相色譜[8-9]、液相色譜[10-13]和質(zhì)譜[14]等指紋圖譜方法已被應(yīng)用于中藥摻假檢測。然而,近紅外光譜靈敏度和精度不夠高,且易受環(huán)境因素影響。色譜和質(zhì)譜的樣品前處理通常比較復(fù)雜、耗時。與上述方法相比,熒光光譜具有分析速度快、樣本制備簡單、成本低、靈敏度高等優(yōu)點。但傳統(tǒng)的基于單一激發(fā)光譜或發(fā)射光譜的熒光光譜所具有的光譜信息量有限,有時不足以用于復(fù)雜樣品的分析。激發(fā)-發(fā)射矩陣(excitationemission matrix,EEM)熒光光譜可以獲取矩陣數(shù)據(jù),比傳統(tǒng)熒光光譜包含更多的信息。因此,激發(fā)-發(fā)射矩陣熒光光譜與先進(jìn)的模式識別方法相結(jié)合,已被廣泛用于諸多領(lǐng)域的分類和真?zhèn)舞b別。
本研究采用激發(fā)-發(fā)射矩陣熒光光譜構(gòu)建百合的熒光指紋特征圖譜,結(jié)合主成分分析-線性判別分析(principal component analysis-linear discriminant analysis,PCA-LDA)和偏最小二乘-判別分析(partial least squares-discriminant analysis,PLS-DA)兩種化學(xué)模式識別方法,對百合中摻假粉末(精制淀粉、土豆淀粉、玉米淀粉和紅薯淀粉)的種類進(jìn)行快速檢測和分類,用于快速鑒別摻假百合,為辨別市面上摻偽摻假的百合藥材提供一種新方法。
2.1.1 樣品準(zhǔn)備
本研究收集了純百合樣品12 份,均來自湖南省湘西土家族苗族自治州龍山縣的龍雨百合。精制淀粉、土豆淀粉、玉米淀粉和紅薯淀粉4 種淀粉作為摻假物,各采購1 袋。現(xiàn)共有16 份樣品。將所有樣品放入烘干箱,在60 ℃下干燥6 h,烘干后用80 目篩進(jìn)行篩分,把粉末分類裝入塑封袋中并標(biāo)記相應(yīng)名稱,常溫儲存在干燥箱中備用。
2.1.2 實驗試劑及儀器
本研究所使用的試劑為無水乙醇(分析純,國藥集團(tuán)化學(xué)試劑有限公司)、純水;儀器為離心機(jī)(Super Mini Dancer,生工生物工程(上海)股份有限公司);F-7100 熒光分光光度計(日本日立集團(tuán)),在個人計算機(jī)上搭配軟件FL Solution 4.0 使用。
2.1.3 百合的預(yù)處理方法
準(zhǔn)確稱取25 mg 純百合粉末于2 mL 離心管中,加1 mL 體積分?jǐn)?shù)為60%的乙醇水溶液進(jìn)行溶解。將溶液超聲提取10 min,然后在4000 r/min 轉(zhuǎn)速下離心5 min,即得到純百合原液。取100 μL 原液上清液于另一2 mL 離心管中,加入乙醇水溶液稀釋至1 mL,即稀釋10 倍,得純百合待測樣。
2.2.1 測試參數(shù)
隨機(jī)選取1 份純百合樣品,按上述預(yù)處理方法制備純百合待測樣后,放入熒光分光光度計中,在測試電壓為600 V、掃描速度為30 000 nm/min、響應(yīng)時間為自動調(diào)節(jié)、激發(fā)波長范圍為200~700 nm、發(fā)射波長范圍為200~750 nm、激發(fā)和發(fā)射步長均為10 nm、激發(fā)和發(fā)射狹縫寬度均為5 nm 的條件下進(jìn)行全波長掃描,保存圖譜和文本數(shù)據(jù)(TXT 格式)。且后續(xù)所有樣品測試均按本節(jié)中已確定的參數(shù)設(shè)定值統(tǒng)一進(jìn)行。
2.2.2 萃取劑濃度
現(xiàn)行藥典中采用甲醇作為萃取劑。本研究考慮到實驗安全性和綠色環(huán)保性,改用無水乙醇為萃取劑,并用純水配制成體積分?jǐn)?shù)分別為100%、90%、80%、70%、60%、50%、0%的乙醇水溶液。隨機(jī)選取1 份純百合樣品,向7 個2 mL 離心管中放入準(zhǔn)確稱取的25 mg 粉末,分別加入1 mL 不同濃度的乙醇水溶液。超聲10 min、離心5 min,得7 份純百合原液。使用與原液樣品所用濃度相同的乙醇水溶液于另外7個2 mL 離心管中稀釋10 倍,共得7 份純百合待測樣。掃描測試無水乙醇空白樣和7 份純百合待測樣,保存圖譜和文本數(shù)據(jù)。
2.2.3 稀釋倍數(shù)
稀釋過程中,通過調(diào)整純百合原液上清液與萃取劑的比例來達(dá)到稀釋10 倍、50 倍和100 倍的效果。隨機(jī)選取1 份純百合樣品,向3 個2 mL 離心管中放入準(zhǔn)確稱取的25 mg 粉末,各自加入1 mL 萃取劑(取上步優(yōu)化最優(yōu)結(jié)果)。超聲10 min、離心5 min,得3 份純百合原液。稀釋過程:取100, 20, 10 μL 原液上清液,于另外3 個2 mL 離心管中,將其分別稀釋至1 mL,得3 份不同稀釋比例(10, 50, 100 倍)的純百合待測樣。掃描測試萃取劑空白樣和3 份待測樣,保存圖譜和文本數(shù)據(jù)。
2.2.4 樣品質(zhì)量
隨機(jī)選取1 份純百合樣品,在前述優(yōu)化過程中所得的最優(yōu)條件下進(jìn)行預(yù)處理。向3 個2 mL 離心管中分別放入準(zhǔn)確稱取的20, 25, 30 mg 純百合及1 mL 萃取劑;超聲10 min 和離心5 min,得3 份純百合原液,稀釋得3 份不同濃度的純百合待測樣。掃描測試萃取劑空白樣和3 份待測樣,保存圖譜和文本數(shù)據(jù)。
在上一步實驗中,所有條件均已優(yōu)化完畢,本步實驗所使用純百合樣品及4 種淀粉摻假物樣品均按優(yōu)化后的最優(yōu)條件進(jìn)行預(yù)處理和掃描測試,確保熒光光譜圖和文本數(shù)據(jù)的準(zhǔn)確性和高精確度。
2.3.1 純百合樣品
現(xiàn)有12 份純百合樣品,對12 份樣品進(jìn)行標(biāo)準(zhǔn)預(yù)處理后,掃描測試萃取劑空白樣和12 份純百合樣品,保存圖譜和文本數(shù)據(jù)。
2.3.2 摻假的百合樣品
現(xiàn)有精制淀粉、土豆淀粉、玉米淀粉、紅薯淀粉4 種淀粉作為摻假物,均按標(biāo)準(zhǔn)百合預(yù)處理辦法配制淀粉摻假物原液,然后使用同一種方法配制淀粉摻假物標(biāo)準(zhǔn)樣。完成制備1 mL 純百合原液和1 mL 淀粉摻假物原液后,取500 μL 純百合原液上清液于10 mL 離心管中,再加入體積分?jǐn)?shù)為60%的乙醇水溶液至5 mL,即稀釋10 倍,得1 份純百合標(biāo)準(zhǔn)樣;同樣,取600 μL 淀粉摻假物原液上清液于10 mL 離心管中,再加萃取劑稀釋10 倍,得1 份淀粉摻假物標(biāo)準(zhǔn)樣。取一定體積的純百合標(biāo)準(zhǔn)樣和淀粉摻假物標(biāo)準(zhǔn)樣,按不同體積比進(jìn)行梯度混合,得到摻假物體積分?jǐn)?shù)為10%~100%,間隔為10%,具體如表1 所示。4 種淀粉摻假物的不同體積分?jǐn)?shù)摻假樣品均制備3 份,共可制得120 份摻假試樣。掃描測試萃取劑空白樣和120份百合摻假樣品,保存圖譜和文本數(shù)據(jù)。
表1 純百合樣品與摻假物樣品混合比例表Table 1 Mixing ratio table of pure lily samples and adulterate samples
2.3.3 新?lián)郊侔俸蠘悠?/p>
現(xiàn)用另一批次購買的玉米淀粉作為摻假物,均按標(biāo)準(zhǔn)百合預(yù)處理辦法配制玉米淀粉原液,然后使用同一種方法配制玉米淀粉標(biāo)準(zhǔn)樣。完成制備1 mL 純百合原液和1 mL 玉米淀粉原液后,取500 μL 純百合原液上清液于10 mL 離心管中,加入體積分?jǐn)?shù)為60%乙醇水溶液稀釋10 倍,得1 份純百合標(biāo)準(zhǔn)樣;再取600 μL 玉米淀粉原液上清液于10 mL 離心管中,加萃取劑稀釋10 倍,得1 份淀粉摻假物標(biāo)準(zhǔn)樣。取一定體積的純百合標(biāo)準(zhǔn)樣和玉米淀粉標(biāo)準(zhǔn)樣,按摻假物體積分?jǐn)?shù)分別為0%, 20%, 40%, 60%, 80%, 100%進(jìn)行混合,共得6 份百合+新玉米淀粉摻假樣。用該6份樣品對模型進(jìn)行外部驗證。
化學(xué)模式識別方法是化學(xué)計量學(xué)的重要分支,按照是否已知樣本的類別,可被分為有監(jiān)督的模式識別(判別分析)和無監(jiān)督的模式識別(聚類分析)兩類。本研究所使用的方法中,PCA 屬于無監(jiān)督的模式識別一類,而LDA 和PLS-DA 則屬于有監(jiān)督的模式識別一類[15]。
2.4.1 主成分分析-線性判別分析
PCA 是一種常用的降維統(tǒng)計方法,借助構(gòu)造適當(dāng)?shù)膬r值函數(shù),對較高精度的多維變量系統(tǒng)進(jìn)行降維處理,使之轉(zhuǎn)換為一維系統(tǒng),以提高計算效率和降低數(shù)據(jù)復(fù)雜度,更加簡潔地展示主要變量之間的關(guān)系。PCA 不僅能降低所研究數(shù)據(jù)空間的維數(shù)、表示多維數(shù)據(jù)的圖形,還能篩選回歸變量、構(gòu)造回歸模型,用較少的計算量獲得選擇最佳變量子集合的效果。
LDA 是一種經(jīng)典的線性學(xué)習(xí)方法。通過使用統(tǒng)計學(xué)、模式識別和機(jī)器學(xué)習(xí)等方法,尋求能夠代表兩類物體或事件特征的線性組合,用于區(qū)分它們或者將其特征化。該線性組合可以用作分類器,更普遍的是用于降維處理,使后續(xù)分類能夠更加高效實現(xiàn)。
PCA-LDA 是將 PCA 和LDA 兩者結(jié)合,通常用于提取有價值的信息并減少數(shù)據(jù)矩陣的維數(shù)[16],更有利于尋找到解釋數(shù)據(jù)的最佳變量線性組合。
2.4.2 偏最小二乘-判別分析
PLS 是一種數(shù)學(xué)優(yōu)化技術(shù)。當(dāng)預(yù)測矩陣較觀測矩陣包含更多變量或者X值中具有多重共線性時,PLS回歸模型的適用性特別高。PLS 通過投影預(yù)測變量和觀測變量到一個新空間來尋找線性回歸模型。不僅如此,PLS 的優(yōu)勢還有區(qū)分系統(tǒng)信息與噪聲的能力較強(qiáng)(有利于降低噪聲的影響)、更易于說明每一個自變量的回歸系數(shù)等。
DA 是一種統(tǒng)計判別和分類技術(shù)。它是在一定數(shù)量樣本的一個分組變量和相應(yīng)的其他多元變量的已知信息基礎(chǔ)上,確定分組與其他多元變量信息所屬的樣本進(jìn)行判別分組。
PLS 和DA 兩者結(jié)合的優(yōu)勢在于其強(qiáng)大的解釋能力:所需的樣本數(shù)量較少;一定程度上降低變量間多重共線性所造成的影響等。
2.4.3 軟件與參數(shù)
本研究所有數(shù)據(jù)處理均在MATLAB R2020b 環(huán)境中完成。PCA-LDA 與PLS-DA 算法則是通過classification-toolbox 5.1 工具箱來完成。
純百合樣品和百合摻假樣品共有132 份,按照純百合樣品、精制淀粉摻假樣品、紅薯淀粉摻假樣品、土豆淀粉摻假樣品和玉米淀粉摻假樣品5 類進(jìn)行劃分,建立5 個子樣本集,每個子樣本集中需要包含后續(xù)進(jìn)行數(shù)據(jù)處理需要的所有樣本數(shù)據(jù)信息。
樣本集包括前述5 個子樣本集,采用隨機(jī)抽樣的方法進(jìn)行劃分,隨機(jī)選取97 份樣品(包含所有類別)作為訓(xùn)練集,用于構(gòu)建模型、選擇最優(yōu)參數(shù)并初步評估構(gòu)建的分類模型性能;剩余35 份樣品(包含所有類別)則作為驗證集,進(jìn)一步評估構(gòu)建的分類模型性能,額外配制的6 個樣本則作為預(yù)測集,對分類模型進(jìn)行外部驗證。
以計算所得的模型正確分類率(correct classification rate,CCR)作為分類模型的整體性能評估指標(biāo)[17]。CCR 的計算方法為
式中:n為正確分類的樣本數(shù);m為樣本總數(shù)。采用基于訓(xùn)練集的十折百葉窗交叉驗證(cross verification,CV)得到的最佳CCR 確定模型的復(fù)雜度參數(shù),如PCA-LDA 的主成分?jǐn)?shù)(PCs)和PLSDA 的潛在變量數(shù)(LVs),在此基礎(chǔ)上對PCA-LDA和PLS-DA 模型進(jìn)行優(yōu)化。
3.1.1 測試參數(shù)
純百合樣品全波長掃描的熒光光譜圖見圖1。
圖1 純百合樣品全波長掃描熒光光譜圖Fig. 1 Full wavelength scanning fluorescence spectrogram of pure lily samples
由圖1 可知,儀器掃描波長范圍可精簡至激發(fā)波長(EX)為200~460 nm、發(fā)射波長(EM)為260~570 nm。為提高結(jié)果的精確度,掃描速度降低至12 000 nm/min、激發(fā)和發(fā)射步長均減小至5 nm,測試電壓、響應(yīng)時間、激發(fā)和發(fā)射狹縫寬度維持原值不變。
3.1.2 萃取劑濃度
根據(jù)圖1 譜圖結(jié)果,7 份純百合待測樣的熒光強(qiáng)度最高值都在激發(fā)波長為270 nm、發(fā)射波長為350 nm(簡述為EX/EM 270/350)和EX/EM 340/410 兩點處附近波動,故選取7 份待測樣在這兩點處的熒光強(qiáng)度作圖(見圖2)。
圖2 純百合樣品萃取劑濃度-熒光強(qiáng)度關(guān)系圖Fig. 2 Relationship between extractant concentration and fluorescence intensity in pure lily samples
由圖2 可知,當(dāng)EX/EM 340/410 時,熒光強(qiáng)度最高值對應(yīng)的乙醇水溶液體積分?jǐn)?shù)為60%;而當(dāng)EX/EM 270/350 時,熒光強(qiáng)度最高值對應(yīng)的乙醇水溶液體積分?jǐn)?shù)為50%。
通過比較無水乙醇空白樣及乙醇水溶液體積分?jǐn)?shù)為50%待測樣的原始譜圖可知,在EX/EM 270/350 處有重疊峰出現(xiàn),即此處的熒光信號強(qiáng)度推測是無水乙醇和百合的組合值(詳細(xì)介紹見下文3.2.1節(jié))。結(jié)合在EX/EM 340/410 處的熒光強(qiáng)度數(shù)據(jù)比較可知,熒光強(qiáng)度最高的乙醇水溶液體積分?jǐn)?shù)應(yīng)為60%,故選用60%乙醇水溶液作為標(biāo)準(zhǔn)萃取劑。
3.1.3 稀釋倍數(shù)
根據(jù)圖1 譜圖結(jié)果,3 份純百合待測樣的熒光強(qiáng)度最高值都在EX/EM 275/350 和EX/EM 340/415 兩點處附近波動,故選取3 份待測樣在這兩點處的熒光強(qiáng)度作圖(見圖3)。由圖3 可以看出,當(dāng)稀釋倍數(shù)為10 倍時,在兩點處熒光強(qiáng)度都最高,且遠(yuǎn)高于稀釋倍數(shù)為50 倍和100 倍的熒光強(qiáng)度,故選用稀釋10倍作為純百合樣品的標(biāo)準(zhǔn)稀釋倍數(shù)。
圖3 純百合樣品稀釋倍數(shù)-熒光強(qiáng)度關(guān)系圖Fig. 3 Relationship between dilution ratio and fluorescence intensity in pure lily samples
3.1.4 樣品質(zhì)量
根據(jù)圖1 譜圖結(jié)果,3 份純百合待測樣的熒光強(qiáng)度最高值都在EX/EM 280/350 和EX/EM 385/420 兩點處附近波動,故選取3 份待測樣在這兩點處的熒光強(qiáng)度作圖(見圖4)。由圖4 可以看出,當(dāng)樣品質(zhì)量為25 mg 時,在兩點處熒光強(qiáng)度都最高,所以應(yīng)該選定25 mg 作為標(biāo)準(zhǔn)樣品質(zhì)量。
圖4 純百合樣品質(zhì)量-熒光強(qiáng)度關(guān)系圖Fig. 4 Relationship between sample weight and fluorescence intensity in pure lily samples
3.2.1 純百合樣品
圖5 為純百合樣品及60%乙醇水溶液(萃取劑)的熒光光譜圖。對比圖5a 和圖5b 可以看出,百合常在EX/EM 280/355 和EX/EM 340/425 兩點處附近有極強(qiáng)的熒光信號。需要注意的是,百合在EX/EM280/355的熒光信號與60%乙醇水溶液的熒光信號有一定程度上的重疊,因此該點的熒光信號強(qiáng)度應(yīng)該考慮為百合與萃取劑共同作用的結(jié)果,且不能認(rèn)為是簡單疊加。此外,該點處的熒光物質(zhì)可能為生物堿、蛋白質(zhì)和氨基酸等;EX/EM 340/425 處的熒光物質(zhì)可能為皂苷類和多糖類化合物等。
圖5 萃取劑和純百合樣品的EEM 熒光等高線圖Fig. 5 EEM fluorescence contour maps of extractant and pure lily samples
每個純百合樣品都是53×63(激發(fā)波長數(shù)×發(fā)射波長數(shù))的矩陣數(shù)據(jù)。由熒光峰的位置可知,百合所含的內(nèi)源熒光團(tuán)的位置、強(qiáng)度、形狀均大致相同,為接下來利用化學(xué)模式識別方法進(jìn)行分類提供了重要依據(jù)。由此可建立百合的熒光指紋特征圖譜。
3.2.2 淀粉摻假物樣品
4 種摻假物(精制淀粉、紅薯淀粉、土豆淀粉、玉米淀粉)的熒光光譜圖如圖6 所示。
圖6 淀粉摻假物EEM 熒光等高線圖Fig. 6 EEM fluorescence contour maps of starch adulterants
對比圖6 與圖5b 可以明顯看出,4 種淀粉摻假物在EX/EM 340/425 處附近均沒有明顯的、強(qiáng)烈的熒光信號;而在EX/EM 280/355 處的熒光信號都較為雜亂,熒光峰的個數(shù)也不盡相同,并不像圖5b 中純百合樣品的圖像,有一個排布規(guī)律且信號強(qiáng)烈的熒光峰團(tuán)。因此,4 種淀粉摻假物與百合的熒光峰個數(shù)、位置、形狀和強(qiáng)度等不同,為接下來的分類提供了極大的可能性。
3.2.3 摻假的百合樣品
以玉米淀粉摻假純百合樣品為例,摻假體積分?jǐn)?shù)0~100%、間隔10%,得到玉米淀粉摻假樣品的熒光光譜圖如圖7 所示。由圖可以看出,隨著摻假物濃度的增大,百合含量不斷降低,百合在EX/EM 280/355和EX/EM 340/425 兩點處的熒光峰逐漸發(fā)生變化。EX/EM 280/355 處的熒光信號有一定程度的減弱,且熒光峰位置漸漸下移,不斷靠近瑞利散射處,熒光團(tuán)形狀大面積縮小,信號強(qiáng)度也減弱較多。而EX/EM 340/425 處的熒光團(tuán)變化過程更為明顯,熒光團(tuán)的形狀不斷縮減,且熒光強(qiáng)度隨之減弱。由此推斷,這兩點處熒光峰的變化將成為百合摻假判別的重要依據(jù)。
圖7 不同含量玉米淀粉摻假樣品EEM 熒光等高線圖Fig. 7 EEM fluorescence contour line maps of corn starch adulterated samples with different content
圖8~10 分別為精制淀粉、紅薯淀粉和土豆淀粉摻假樣品的EEM 熒光等高線圖,均與上述玉米淀粉摻假樣品變化情況大致相同。
圖8 不同含量精制淀粉摻假樣品EEM 熒光等高線圖Fig. 8 EEM fluorescence contour line maps of refined starch adulterated samples with different content
圖9 不同含量紅薯淀粉摻假樣品EEM 熒光等高線圖Fig. 9 EEM fluorescence contour line maps of sweet potato starch adulterated samples with different content
3.3.1 分類模型的構(gòu)建
百合的摻假分類樣本共分為5 類:純百合(A)、百合+精制淀粉(B)、百合+紅薯淀粉(C)、百合+土豆淀粉(D)和百合+玉米淀粉(E)。采用PCA-LDA 和PLS-DA 兩種化學(xué)模式識別方法,在前面建立的百合EEM 熒光指紋特征圖譜基礎(chǔ)上,對純百合及4 種不同類型的摻假百合樣品建立摻假判別模型。首先,基于CV 得到的CCR 來優(yōu)化PCA-LDA模型的主成分?jǐn)?shù)(PCs)和PLS-DA 模型的潛變量數(shù)(LVs)。當(dāng)PCs為9 時,PCA-LDA 模型可以獲得最佳結(jié)果,其交叉驗證的CCR 為94.9%;當(dāng)LVs為15 時,PLS-DA 模型可以獲得最佳結(jié)果,其交叉驗證的CCR 為95.9%。然后,這兩個模型將用于驗證訓(xùn)練集(train set)樣本和測試集(test set)樣本,結(jié)果如表2 所示。
表2 PCA-LDA 和PLS-DA 模型的最優(yōu)參數(shù)及交叉驗證、訓(xùn)練集和測試集的正確分類率Table 2 The optimal parameters of PCA-LDA and PLS-DA models and CCRs of CV, train and test sets
由表2 中測試集的CCR 可以看出,兩個模型的分類效果都比較好,CCR 都高于97%,體現(xiàn)出這兩個模型在辨別百合真?zhèn)紊系膬?yōu)秀能力,尤其是PCALDA 模型的CCR 為100.0%,說明所有摻假樣品全部判別成功。
另外,表3 為PCA-LDA 和PLS-DA 兩種模型對訓(xùn)練集的混淆矩陣。
表3 PCA-LDA 和PLS-DA 模型獲得的訓(xùn)練集混淆矩陣Table 3 Confusion matrix of train set obtained by PCA-LDA and PLS-DA models
由表3 可以看出,PLS-DA 模型的測試集分類效果較好,全部分類成功。PCA-LDA 模型的訓(xùn)練集雖略有錯誤,將2 個純百合樣品分類為玉米淀粉摻假樣品、2 個精制淀粉摻假樣品分類為純百合樣品,但誤差仍在可接受范圍內(nèi)。且經(jīng)對照樣品編號發(fā)現(xiàn),分類錯誤樣品的淀粉摻假物體積分?jǐn)?shù)均不超過20%。當(dāng)?shù)矸蹞郊傥餄舛容^低時,百合摻假樣品與純百合樣品的熒光光譜較為相近,因此判別的過程中出現(xiàn)了失誤。
圖11 為基于PLS-DA 模型所有LVs的得分值使用t-SNE 降維處理的可視圖。圖中每一個點代表一個純百合或摻假百合樣品,同類型點聚集越密,不同類型點距離越遠(yuǎn)則分類效果越好。由此可以看出,純百合樣品和不同類型的摻假百合樣品之間存在相對較高的分散度,表明PLS-DA 分類模型具有良好的分類性能。
圖11 PLS-DA 模型中所有LVs 得分值的樣本可視化結(jié)果圖Fig. 11 The visualization results of lily adulterated samples based on all LVs of PLS-DA
3.3.2 分類模型的準(zhǔn)確性驗證
本研究使用額外制備的6 個新樣本(百合+玉米淀粉摻假樣)來檢驗分類模型的實際應(yīng)用能力,結(jié)果如表4 所示,其中包含5 個摻入不同濃度玉米淀粉的百合樣本(E)和1 個純百合樣本(A)。
表4 PCA-LDA 和PLS-DA 模型對新百合摻假樣本的分類結(jié)果Table 4 Classification results of new lily adulterated samples by PCA-LDA and PLS-DA models
由表4 可知,在摻假體積分?jǐn)?shù)不低于20%的情況下,PCA-LDA 和PLS-DA 模型均能獲得100%的正確分類率。且在實際生活中,非法商販為了獲取較高利潤,往往在百合中摻入大劑量的淀粉。由此可以看出,這兩種分類模型都具有一定的實際應(yīng)用能力,有望在百合甚至其它中藥材、食品等領(lǐng)域的摻假辨別分析中得到廣泛應(yīng)用,從而保障消費者的合法權(quán)益,以及提高用藥安全性。
本研究采用EEM 熒光光譜法結(jié)合PCA-LDA、PLS-DA 兩種化學(xué)模式識別方法的方式對百合摻假試樣進(jìn)行了研究?;诩儼俸虾? 種摻假百合(百合+精制淀粉、百合+紅薯淀粉、百合+土豆淀粉、百合+玉米淀粉)的EEM 熒光指紋特征圖譜建立的兩個摻假判別分析模型都具有較高的正確分類率,PCA-LDA 模型訓(xùn)練集的CCR 為95.9%,PLS-DA 模型訓(xùn)練集的CCR 甚至高達(dá)100.0%,且兩個模型還能對新?lián)郊俚? 個百合樣本進(jìn)行準(zhǔn)確分類,CCR 均為100%。以上結(jié)果表明,兩個模型皆可用于百合的快速檢測及真?zhèn)舞b定,從而進(jìn)一步完善百合質(zhì)量評價體系。