申晨曦,杜晨暉,李震宇,李愛平,秦雪梅,閆 艷,
(1.山西大學中醫(yī)藥現(xiàn)代研究中心,山西 太原 030006;2.山西中醫(yī)藥大學中藥學院,山西 太原 030619)
酸棗仁(Ziziphi spinosae Semen)為鼠李科植物酸棗(Ziziphus jujubaMill. var.spinosa(Bunge) Hu ex H. F.Chou)的干燥成熟種子[1],具有“養(yǎng)心補肝,寧心安神,斂汗,生津”的功效,是中醫(yī)臨床養(yǎng)心安神的首選藥物[2]。酸棗仁是國家衛(wèi)生和計劃生育委員會最早頒布的“既是食品又是中藥材物質(zhì)”的中藥材之一。由于其采收成本高,臨床需求量大,價格不斷攀升。市場上利用同科同屬植物滇刺棗(Ziziphus mauritianaLam.)的干燥成熟種子——理棗仁(Ziziphi mauritianae Semen)冒充酸棗仁和摻偽現(xiàn)象越來越多。作為酸棗仁最常見的偽品,理棗仁亦“具有寧心安神、除煩斂汗之功效”,作為云南地方習用品,早在1974年已被收入《云南省藥品標準》[3]。
近年來,學術界對酸棗仁和理棗仁的鑒別方法也進行了大量研究,如性狀鑒別[4]、顯微鑒別[5]、理化鑒別[6-8]和DNA分子生物鑒別[9]等方法。以上方法為酸棗仁與理棗仁的真?zhèn)舞b別提供了科學基礎,但存在一定局限性,如性狀鑒別只適用于外觀未破損的樣品鑒別,顯微鑒別需要具有豐富鑒別經(jīng)驗的專業(yè)人員進行真?zhèn)纹返蔫b別。然而理棗仁的外觀與酸棗仁極相似,不易區(qū)別,特別是打粉后或入中成藥后,難以區(qū)分和鑒定。為避免將廉價的理棗仁混入酸棗仁,以次充好,亟需建立一種快速、靈敏、準確的以理棗仁粉末形式摻偽酸棗仁粉末的鑒別方法。
植物代謝組學是代謝組學的一個重要分支。氫核磁共振(1H nuclear magnetic resonance,1H NMR)是植物代謝組學中常用的研究測試工具[10],具有樣品預處理簡單,對樣品無損害、檢測時間短、重復性好等優(yōu)勢。1H NMR代謝組學技術可獲得復雜混合體系中高通量的化學成分信息,包括化學位移和信號響應等,但是,同時各種化學成分信號的重疊也使得圖譜變得十分復雜,僅靠肉眼觀察只能獲得有限的數(shù)據(jù)信息。多元統(tǒng)計分析能夠從復雜的數(shù)據(jù)中最大限度的提取信息,反映樣本分組的整體差異性[11],具有很好的應用性。常用的多元統(tǒng)計分析方法包括無監(jiān)督識別模式的主成分分析(principal component analysis,PCA)、有監(jiān)督模式的偏最小二乘法-判別分析(partial least squares-discriminant analysis,PLS-DA)和PLS回歸分析[12-13]。特別是應用多元統(tǒng)計分析方法建立的數(shù)學模型,能從未知樣品的1H NMR圖譜中預測樣品的性質(zhì)等信息,適合于中藥材及飲片摻假的判別。
課題組前期采用1H NMR代謝組學技術對黃芪、款冬等中藥材[14-17]進行了質(zhì)量評價。另有研究采用1H NMR代謝組學技術對茶油、老陳醋、咖啡、蜂蜜和啤酒等食品進行了質(zhì)量優(yōu)劣評價[18-28]。本研究利用1H NMR代謝組學技術獲得酸棗仁和理棗仁的化學信息,并結合PLS法對酸棗仁粉末摻偽比例進行鑒別研究。首先表征和分析酸棗仁、理棗仁和酸棗仁粉末摻假樣品的1H NMR譜圖。然后利用PLS對譜圖的分段積分數(shù)據(jù)矩陣進行分析,建立酸棗仁粉末摻偽定量模型,進而對模型進行檢驗。最后,通過PLS模型預測未知樣本的摻偽比例。該方法從整體的角度出發(fā),以1H NMR結合多元統(tǒng)計分析應用于酸棗仁粉末摻偽的鑒別工作中,旨在為酸棗仁的定性分析提供一種新的思路,同時也為酸棗仁及以酸棗仁粉末入藥的保健食品的質(zhì)量評價提供一條新途徑。
酸棗仁和理棗仁分別采購于河北安國藥材市場、昆明菊花村藥材市場和山西振東道地藥材有限公司,經(jīng)山西中醫(yī)藥大學杜晨暉副教授鑒定酸棗仁為Z. jujubavar.spinosa的干燥成熟種子,理棗仁為Z. mauritianaLam.的干燥成熟種子。共收集50 批樣品,酸棗仁(25 批)和理棗仁(25 批),樣品保存于山西大學中醫(yī)藥現(xiàn)代研究中心。
重水 美國Norell公司;氘代甲醇、三甲基硅烷丙酸鈉鹽 青島騰龍微波科技有限公司;氘代氫氧化鈉瑞士Armar公司。
600 MHz Avance III1H NMR 瑞士Bruker公司;Neofuge 13R高速冷凍離心機 上海力申科學儀器有限公司;RE-52A旋轉(zhuǎn)蒸發(fā)儀 上海亞榮生化儀器廠;pH計 奧豪斯儀器有限公司。
1.3.1 樣品制備
25 批酸棗仁樣品(酸棗仁1~25)各稱取50 g,分別粉碎,過3號篩(50 目),即得25 批酸棗仁粉末樣品。25 批理棗仁樣品(理棗仁1~25)各稱取50 g,分別粉碎,過3號篩,即得25 批理棗仁粉末樣品。從25 批酸棗仁粉末樣品中隨機選取6 批,并從25 批理棗仁粉末樣品中隨機選取6 批。將所選酸棗仁粉末(n=6)中分別摻入不同質(zhì)量比(5%、10%、20%、40%、60%、80%)的理棗仁粉末(n=6),共36 個摻偽樣品,樣品信息見表1。
表 1 實驗樣品信息Table 1 Information about pure and mixed samples of ZSS and ZMS tested in this study
精密稱取以上粉末樣品各200 mg,置于10 mL離心管中,分別加蒸餾水及甲醇各1.5 mL,氯仿3 mL;旋渦混勻1 min;超聲提取25 min;3 500 r/min離心25 min,上層為甲醇水相(水溶性部分),下層為氯仿相;將甲醇水層移至25 mL圓底燒瓶中,減壓濃縮至干,氯仿層棄去。測定前用氘代甲醇400 μL與含有緩沖鹽的重水(KH2PO4溶于氘代水中,以1 mol/L氘代氫氧化鈉溶液調(diào)節(jié)pH值至6,含0.01%磷酸三鈉(trisodium phosphate,TSP))400 μL進行溶解,移至1.5 mL離心管中,離心10 min(13 000 r/min),移取上清液600 μL于5 mm核磁管中,待測。
1.3.2 樣品1H NMR測試條件
樣品在25 ℃、600 MHz1H NMR上測定,測定頻率600.13 MHz,掃描范圍為δ-5~15,掃描次數(shù)64 scans,采用Noesygppr1d序列壓制水峰,用氘代甲醇進行鎖場,內(nèi)標為TSP。
1.3.3 數(shù)據(jù)處理
將測得的各樣品自由衰減信號導入MestReNova(version 8.0.1, Mestrelab Research, Santiago de Compostlla,Spain)軟件并將圖譜以TSP(0.00)定標,進行相位調(diào)整和基線校正。然后以0.01分段對化學位移區(qū)間δ0.72~9.15進行分段積分,其中對水峰區(qū)域δ4.68~4.92和殘余甲醇峰δ3.34~3.38不進行積分,積分數(shù)據(jù)采用峰面積歸一化處理。
1.3.4 精密度實驗和重復性實驗
取編號為酸棗仁1樣品,按照1.3.1節(jié)方法制備樣品,并按照1.3.2節(jié)方法連續(xù)測定6 次,將6 次所測圖譜分別按照1.3.3節(jié)方法進行數(shù)據(jù)處理,得到6 組積分面積數(shù)據(jù),依據(jù)夾角余弦法,采用夾角余弦公式,計算6 張譜圖之間的夾角余弦值,考察儀器的精密度。取編號為酸棗仁1樣品粉末,按照1.3.1節(jié)方法平行制備6 份樣品,并按照1.3.2節(jié)下方法測定,將6 個所測圖譜分別按照1.3.3節(jié)方法進行數(shù)據(jù)處理,得到6 組積分面積數(shù)據(jù),計算6 份樣品之間的夾角余弦值,考察制備方法的精密度[29]。夾角余弦值(cosθ)計算公式如下:
式中:Xi為樣品X的第i個峰的相對積分值;Yi為樣品Y的第i個峰的相對積分值。1.3.5 多元統(tǒng)計分析
1.3.5.1 PCA和PLS-DA
將歸一化后的數(shù)據(jù)導入SIMCA-P 13.0(Umetrics,瑞典)軟件進行PCA和PLS-DA。PCA不能忽略組內(nèi)誤差和消除無關的隨機誤差,因此需要進一步采用有監(jiān)督的PLS-DA,減小組內(nèi)差異,擴大組間差異,以實現(xiàn)酸棗仁及其偽品的準確鑒別。
1.3.5.2 PLS預測模型的構建
在收集的樣品中隨機選取其中20 批酸棗仁(酸棗仁1、酸棗仁3~21)、21 批理棗仁(理棗仁1~21)及24 批摻偽樣品(摻偽1~4、摻偽7~10、摻偽13~16、摻偽19~22、摻偽25~28、摻偽31~34)構成訓練集,共65 組強度積分值數(shù)據(jù);余下的4 批酸棗仁(酸棗仁22~25)、4 批理棗仁(理棗仁22~25)和12 批酸棗仁摻偽樣品(摻偽5~6、摻偽11~12、摻偽17~18、摻偽23~24、摻偽29~30、摻偽35~36)組成測試集,共20 組強度積分值數(shù)據(jù)。
基于PLS原理[20],按照樣本類別特征賦予訓練集樣本分類變量值,作為因變量(Y變量)。首先將酸棗仁賦值為1,摻偽5%理棗仁賦值1.05,摻偽10%理棗仁賦值1.1,摻偽20%理棗仁賦值1.2,摻偽40%理棗仁賦值1.4,摻偽60%理棗仁賦值1.6,摻偽80%理棗仁賦值1.8,理棗仁賦值為2。然后將訓練集數(shù)據(jù)導入SIMCA-P 13.0軟件中,采用pareto(帕雷托)換算對訓練集65 個積分強度值數(shù)據(jù)矩陣進行標準化,歸一化的強度積分值作為自變量(X變量)。采用PLS法將標準化的數(shù)據(jù)矩陣X變量與類別變量(Y變量)進行線性回歸,建立預測模型。
將測試集樣品的數(shù)據(jù)代入經(jīng)過檢驗的模型,計算得到各樣品的類別變量預測值P,并將預測值與訓練集得出的鑒別范圍比對,對測試集樣品進行鑒別。
圖1A為同一樣品連續(xù)測定6 次所得圖譜,按照1.3.3節(jié)方法進行數(shù)據(jù)處理,得到6 組積分面積數(shù)據(jù),計算6 張譜圖之間的夾角余弦值分別為1.000、0.997、0.999、0.998、0.998、0.997,計算值均在0.99以上,表明儀器精密度良好。圖1B為相同條件下同一批次酸棗仁平行制備6 份實驗所得圖譜,按照1.3.3節(jié)方法進行圖譜處理,得到6 組積分面積數(shù)據(jù),計算6 份樣品之間的夾角余弦值分別為1.000、0.998、0.998、0.993、0.998、0.999,計算值均在0.99以上,表明制備方法精密度良好。這為定性鑒別酸棗仁和理棗仁提供了穩(wěn)定可靠的分析條件。
圖 1 儀器精密度實驗和重復性實驗1H NMR譜圖Fig. 1 1H NMR spectra showing instrumental precision and repeatability
圖 2 酸棗仁、摻偽樣品及理棗仁1H NMR(δ 0~3)譜圖Fig. 2 1H NMR (δ 0–3) spectra of ZSS, ZMS and their mixtures
由圖1可知,酸棗仁樣品的1H NMR譜圖,大致可以分為脂肪區(qū)(δ0.00~3.00)、糖類化合物區(qū)(δ3.00~6.00)和芳香區(qū)(δ6.00~9.00)。通過比較酸棗仁、理棗仁及酸棗仁粉摻偽樣品的1H NMR譜圖,脂肪區(qū)出現(xiàn)變化較大的信號。通過對化學位移、耦合常數(shù)J、HMDB數(shù)據(jù)庫和文獻數(shù)據(jù)以及1H-1H化學位移相關譜的分析,鑒定出5 個變化較為明顯的物質(zhì)[30]。分別為化合物1纈氨酸(δ=1.01,d,J=7.2 Hz;δ=1.07,d,J=7.2 Hz)、化合物2乳酸(δ=1.33,d,J=6.6 Hz)、化合物3丙氨酸(δ=1.49,d,J=7.2 Hz)、化合物4γ-氨基丁酸(δ=2.31,t,J=7.2 Hz)、化合物5半胱氨酸(δ=3.05,s)。隨著酸棗仁粉摻偽比例的增加,觀察到5 個特征峰的信號強度逐漸減弱(圖2)。表明酸棗仁粉末較偽品含有更高的氨基酸類成分。
在進行PCA之前,通過Hotelling’sT2Range算法判斷異常樣本。當T2超過臨界值時,說明該樣本與其他樣本間存在較大的差異。如圖3所示,樣品中存在一個異常值(酸棗仁2),應作為異常點剔除,剩余85 個樣品用于下一步的模型建立。
圖 3 酸棗仁粉及摻偽樣品的Hotelling’s T2 Range圖Fig. 3 Hotelling’s T2 Range plots of pure and adulterated samples
圖 4 剔除異常點后酸棗仁粉及摻偽樣品的PCA得分圖Fig. 4 PCA score plot for pure and adulterated samples after elimination of outliers
從圖4可知,酸棗仁粉和摻偽樣品的分類情況。前5 個主成分共解釋了72.4%的方差,酸棗仁和摻偽樣品在t[2]軸上有較好區(qū)分。大部分酸棗仁樣品在t[2]軸的下部,大部分摻偽樣品在t[2]軸的上部,由于化學成分的相似性,摻偽比例較低的樣品與酸棗仁有部分的重疊,隨著摻偽比例的增加,樣品的分布在t[1]軸上呈從右到左的分布。
無監(jiān)督模式識別的PCA無法判斷未知樣品,且存在與研究目的無關的組內(nèi)誤差以及隨機誤差,不利于分組信息的準確性。為確定分組樣品的差異,進一步采用有監(jiān)督模式識別的PLS-DA。其分析過程中可以消除眾多化學信息中相互重疊的部分,使得分析數(shù)據(jù)更加準確可靠[26]。
為準確識別摻偽樣品,首先將25 個理棗仁樣品和36 個摻偽樣品歸為一類,酸棗仁作為另一類,建立PLSDA模型。如圖5A~C所示,當摻偽比例分別為5%、10%和20%時,酸棗仁粉和摻偽品有部分交叉。當摻偽比例不低于40%時(圖5D),酸棗仁粉和摻偽品在t[1]軸上可以完全分開。隨著摻偽比例的增加,酸棗仁樣品所在區(qū)域和摻偽品所在區(qū)域間的距離逐漸增加(圖5E~G)。為進一步驗證該模型的可靠性,采用排列實驗法對圖5D中對應的PLS-DA模型進行驗證。通過200 次隨機改變類別變量Y的排列順序,得到累計貢獻率R2和預測能力Q2。其中排列實驗模型的R2回歸線和Q2回歸線與縱軸的截距分別為0.474和-0.483,最右端鑒別模型的原始Q2值大于左邊任何一個Y變量隨機排列模型的Q2值(圖6),說明所構建的PLS-DA模型沒有出現(xiàn)過擬合現(xiàn)象,且有較好預測能力,顯示模型可靠。
圖 5 酸棗仁和不同比例摻偽品的PLS-DA圖Fig. 5 Score plots of PLS-DA for pure ZSS and adulterated samples
圖 6 排列實驗對PLS-DA模型的可靠性驗證Fig. 6 Validation of PLS-DA model by permutation test
為更準確地檢測實際摻偽比例,進一步采用PLS法,建立摻假量預測回歸模型。訓練集均方根誤差(root mean square error of estimation,RMSEE)、預測集均方根誤差(root mean square error of prediction,RMSEP)和訓練集相關系數(shù)(R2)可以評價PLS模型,R2越大,RMSEE和RMSEP越小,說明模型的準確性和精確度越高。本研究訓練集由65 個樣品構成(酸棗仁樣品20 個、理棗仁樣品21 個,摻偽樣品24 個),共獲得802 個強度積分變量,構成65×802的數(shù)據(jù)矩陣。利用PLS對其進行分析,建立模型。以訓練集的真實值為橫坐標,預測值為縱坐標,繪制的散點圖(圖7)。訓練集模型中R2為0.986 5,大于0.98,RMSEE為0.077 0。利用PLS預測模型對訓練集的類別變量進行計算。由表2可知,酸棗仁粉的計算值范圍為0.86≤P≤1.15;摻偽5%理棗仁的預測值范圍為1.00≤P≤1.18;摻偽10%理棗仁的預測值范圍為1.06≤P≤1.18;摻偽20%理棗仁的預測值范圍為1.15≤P≤1.33;摻偽40%理棗仁的預測值為1.39≤P≤1.47;摻偽60%理棗仁的預測值為1.51≤P≤1.69;摻偽80%理棗仁的預測值范圍為1.68≤P≤1.75,理棗仁粉的計算值范圍為1.93≤P≤2.07。
圖 7 訓練集和驗證集真實值和預測值關系圖Fig. 7 Plot of true values versus estimated values for training set and validation set
表 2 訓練集的真實值和預測值Table 2 True values and estimated values for training set samples
表 3 測試集的真實值和預測值Table 3 True values and estimated values for validation set samples
為進一步檢驗PLS模型,將酸棗仁粉及不同比例摻偽品的測試集樣品代入訓練集創(chuàng)建的PLS模型中(圖7),預測結果見表3。測試集RMSEP為0.058 200。RMSEE和RMSEP值均接近于0,說明模型可靠,可準確預測摻假理棗仁的量。測試集的預測結果P值表明,酸棗仁粉摻偽5%和10%時,與酸棗仁粉預測值有交叉,無法準確預測其含量。當摻偽比例達到20%時,樣品計算所得P值除摻偽36號樣品稍有偏差其余樣本的P值均在在所建立模型的P值范圍之內(nèi)。說明該模型具有較好的預測和評價未知樣品摻偽量的能力。摻偽36號樣品為摻偽80%,與模型中的P值較為接近。
本研究利用1H NMR代謝組學技術獲得了酸棗仁粉及不同比例摻偽品的化學信息。直觀分析顯示纈氨酸、乳酸、丙氨酸、γ-氨基丁酸、半胱氨酸5 個氨基酸成分隨著摻偽比例的增加表現(xiàn)出信號強度逐漸減弱的趨勢。PCA表明摻偽比例較低的樣品與酸棗仁有部分的重疊。PLS-DA顯示,當摻偽比例不低于40%時,酸棗仁粉和摻偽品沿t[1]軸完全分開。在此基礎上,通過PLS模型可準確預測摻假酸棗仁粉中理棗仁的摻入量。1H NMR結合PLS-DA和PLS可以預測酸棗仁粉摻假量,具有分析時間短、可控性強、準確性高等優(yōu)點,可實現(xiàn)未知樣本的準確判別,對于酸棗仁和理棗仁的鑒別及摻偽區(qū)分有明顯優(yōu)勢。該方法特別適合于性狀鑒別和薄層色譜等方法難以實現(xiàn)的酸棗仁藥材真?zhèn)舞b別。在后續(xù)研究中,應增加樣本量,對本鑒別模型數(shù)據(jù)擴充,使鑒別結果具有代表性,為酸棗仁及含酸棗仁的復方制劑質(zhì)量評價提供一種新方法和新途徑。