樊雙喜,鐘其頂,黃占斌,楊彤輝
1 (中國(guó)礦業(yè)大學(xué)(北京) 化學(xué)與環(huán)境工程學(xué)院,北京,100083) 2(中國(guó)食品發(fā)酵工業(yè)研究院,北京,100015) 3(全國(guó)食品發(fā)酵標(biāo)準(zhǔn)化中心,北京,100015)
葡萄酒的品質(zhì)主要取決于釀酒葡萄,由于葡萄種植具有比較明顯的區(qū)域性特征,葡萄產(chǎn)地的氣候和土壤等生態(tài)環(huán)境同樣也會(huì)影響葡萄酒質(zhì)量[1]。地理標(biāo)志是目前國(guó)際上通行的對(duì)酒類產(chǎn)品進(jìn)行管理的辦法,用于突出某一葡萄酒產(chǎn)地的特點(diǎn),防止假冒偽劣葡萄酒產(chǎn)品。經(jīng)過(guò)多年的發(fā)展,我國(guó)對(duì)昌黎、沙城以及昌吉實(shí)施了原產(chǎn)地域產(chǎn)品/地理標(biāo)志產(chǎn)品保護(hù)[2]。然而,據(jù)報(bào)道,在中國(guó)葡萄酒行業(yè)存在許多利益驅(qū)動(dòng)的虛假產(chǎn)地葡萄酒欺詐事件,例如通過(guò)舊瓶裝新酒、仿造酒標(biāo)等手段冒充具有高價(jià)值產(chǎn)區(qū)的葡萄酒[3],嚴(yán)重?fù)p害了中國(guó)葡萄酒市場(chǎng)的聲譽(yù)。因此,迫切需要開(kāi)發(fā)能夠準(zhǔn)確驗(yàn)證葡萄酒原產(chǎn)地的技術(shù)[4]。
目前用于原產(chǎn)地葡萄酒分析的方法較多,例如氣相色譜(GC)與質(zhì)譜(MS)聯(lián)用[5-6]、高效液相色譜法(HPLC)[7-8]、電感耦合等離子體質(zhì)譜儀(inductively coupled plasma mass spectrometry,ICP-MS)[9-11]、近紅外線(near infra-red,NIR)和中紅外線(middle infra-red,MIR)光譜[12-14]、穩(wěn)定同位素[15-18]、核磁共振光譜(nuclear magnetic resonance,NMR)[19],以及以上不同方法的組合[20-23]。利用葡萄酒特征組分(香氣、類黃酮、有機(jī)酸、氨基酸、多酚、無(wú)機(jī)元素、同位素等)和多元統(tǒng)計(jì)分析技術(shù)結(jié)合,能夠?qū)崿F(xiàn)葡萄酒產(chǎn)地、品種和年份的判別。然而,特定特征組分檢測(cè)技術(shù)在當(dāng)代的食品安全與質(zhì)量檢測(cè)中具有一定的局限性,比如食品中蓄意摻假物質(zhì)的手段層出不窮,尤其對(duì)于某些未知化學(xué)結(jié)構(gòu)的添加物的樣品,無(wú)法通過(guò)對(duì)特定目標(biāo)化合物的定向檢測(cè)達(dá)到區(qū)分的目的[24]。相對(duì)于目標(biāo)檢測(cè)技術(shù)而言,非目標(biāo)檢測(cè)技術(shù)經(jīng)過(guò)多年的發(fā)展,已經(jīng)在食品及原料的溯源分析、摻假檢測(cè)等相關(guān)領(lǐng)域進(jìn)行了比較深入的研究。非目標(biāo)檢測(cè)技術(shù)是以樣品的整體化學(xué)或生物學(xué)信息為基礎(chǔ),通過(guò)分析化學(xué)、細(xì)胞和分子生物學(xué)等技術(shù)手段與多元統(tǒng)計(jì)學(xué)相結(jié)合來(lái)綜合評(píng)判與分析食品特征[25],其中多元統(tǒng)計(jì)分析手段主要包括主成分分析(principal component analysis, PCA)、線性判別(linear discrimination analysis, LDA)、聚類分析(cluster analysis, CA)、偏最小二乘法 ( partial least squares, PLS)、正交偏最小二乘法判別分析(orthogonal partial least squares discriminant analysis, OPLS-DA)、K臨近算法(k-nearest neighbors, KNN)、神經(jīng)網(wǎng)絡(luò)(artificial neural networks, ANN)等。
非目標(biāo)一維核磁共振氫譜(1H NMR)技術(shù)作為一種快速、簡(jiǎn)單、無(wú)損檢測(cè)方法,在葡萄酒產(chǎn)地驗(yàn)證以及特征分析領(lǐng)域顯得越來(lái)越重要[19,26]。本研究首次采用非目標(biāo)指紋圖譜(1H NMR)結(jié)合PCA和LDA多元統(tǒng)計(jì)分析手段,初步建立了沙城、昌黎和昌吉三大特色原產(chǎn)地葡萄酒的驗(yàn)證模型,探討了以非目標(biāo)1H NMR技術(shù)實(shí)現(xiàn)葡萄酒原產(chǎn)地溯源的可行性。
本實(shí)驗(yàn)所有葡萄酒樣品均由企業(yè)提供。2010~2015年,從沙城、昌黎和昌吉葡萄酒原產(chǎn)地不同葡萄酒企業(yè)共收集224個(gè)葡萄酒樣品,其中沙城101個(gè)(赤霞珠26個(gè)、玫瑰蜜9個(gè)、蛇龍珠15個(gè)、白玉霓 29個(gè)、龍眼 21個(gè)、霞多麗1個(gè)),昌黎60個(gè)(赤霞珠49個(gè)、玫瑰蜜2個(gè)、蛇龍珠9個(gè)),昌吉63個(gè)(赤霞珠44個(gè)、霞多麗6個(gè)、蛇龍珠9個(gè)、雷司令2個(gè)、味兒多和西拉各1個(gè))。所有葡萄酒樣品均存放在4 ℃冰箱避光冷藏。葡萄酒樣品均為單一葡萄品種,沒(méi)有混合其他葡萄品種。所有收集的葡萄酒樣品均符合沙城、昌黎和昌吉葡萄酒地理標(biāo)志產(chǎn)品國(guó)家標(biāo)準(zhǔn)的規(guī)定[2]。
疊氮化鈉(超級(jí)純,NaN3, Merck, Germany);3-(三甲基硅基)氘代丙酸鈉(TSP)和KH2PO4(98%,Merck, Germany);重水(D2O,98%,Merck, Germany);NaOH和HCl(99%,Sigma-Aldrich,USA);核磁共振波譜儀(400 MHz,Bruker,Germany);pH計(jì) (SevenCompactTMS210,Mettler-Toledo, Switzerland);渦流振蕩器(Biosan Ltd, Latvia);5 mm 帶帽NMR測(cè)試管(Wilmad Labglas Inc, USA)。
采用重水(D2O),疊氮化鈉(NaN3),0.1% 3-(三甲基硅基)氘代丙酸鈉(TSP),1 mol/L KH2PO4配制磷酸鹽緩沖液。采用H3PO4或KH2PO4準(zhǔn)確調(diào)節(jié)磷酸鹽緩沖液的pH值至2.0。100 μL磷酸鹽緩沖液加入900 μL葡萄酒,采用渦流振蕩器振蕩30 s 混合均勻,然后用2 mol/L 的NaOH或HCl準(zhǔn)確調(diào)整混合物的pH值至3.0±0.02。準(zhǔn)確取600 μL的混合物轉(zhuǎn)移到5 mm NMR測(cè)試管,測(cè)試管之后采用一維核磁共振氫譜(1H NMR)技術(shù)進(jìn)行檢測(cè)。
一維核磁共振氫譜(1H NMR)檢測(cè)一般實(shí)驗(yàn)流程包括調(diào)諧和匹配、溫度控制、鎖定、勻場(chǎng)、選擇序列、參數(shù)設(shè)置以及最后樣品檢測(cè)。其中調(diào)諧和匹配、溫度控制、鎖定及勻場(chǎng)過(guò)程均可實(shí)現(xiàn)高度自動(dòng)化,操作簡(jiǎn)單。儀器實(shí)驗(yàn)條件設(shè)置:檢測(cè)溫度(300±0.2) K。采用5 mm1H/D 探頭,1H NMR的共振頻率為400.27 MHz,Bruker Top Spin 2.1軟件用于1H NMR圖譜數(shù)據(jù)的采集, 檢測(cè)信號(hào)時(shí)間3.984 6 s,延遲時(shí)間4.0 s,每次自由感應(yīng)衰減掃描次數(shù)為16,空掃描次數(shù)為4,譜寬15.1 ppm,采樣點(diǎn)數(shù)為65 536 (64 K),譜線加寬因子為0.3 Hz。以3-(三甲基硅基)氘代丙酸鈉(TSP,δ=0)作為內(nèi)標(biāo),化學(xué)位移的單位(ppm)。標(biāo)準(zhǔn)的脈沖序列(NOESYGPPS) 用于乙醇 (δ=1.2 ppm和3.6 ppm)和水(δ=4.8 ppm)的信號(hào)抑制,有效地減弱了水峰和乙醇峰對(duì)檢測(cè)的干擾。樣品檢測(cè)前,需要等待5 min用來(lái)平衡溫度。
采用MestReNova 9.1軟件(Mestrelab Research S.L., MestReNova (Mnova) NMR,USA) 首先對(duì)1H NMR圖譜進(jìn)行傅里葉變換,基線矯正、調(diào)整相位。然后對(duì)1H NMR圖譜峰化學(xué)位移偏移進(jìn)行校正對(duì)齊,最后對(duì)圖譜進(jìn)行分段積分,其值作為之后多元統(tǒng)計(jì)分析的輸入變量。為了便于數(shù)據(jù)處理,同一產(chǎn)地葡萄酒樣品分為一組。多元統(tǒng)計(jì)分析包括無(wú)監(jiān)督主成分分析(PCA)和有監(jiān)督線性判別分析(LDA)。
PCA作為多元探索性數(shù)據(jù)降維分析的第一步,根據(jù)解釋1H NMR數(shù)據(jù)集內(nèi)95%方差來(lái)確定主成分矩陣。主成分得分矩陣作為L(zhǎng)DA的輸入變量,由于主成分之間相互正交,因此可以避免1H NMR數(shù)據(jù)集里的初始變量之間高度共線性問(wèn)題。LDA可以實(shí)現(xiàn)因變量組間差異的最大化,組內(nèi)樣品距離的最小化, 提高模型的有效性和解析能力[27]。PCA和 LDA數(shù)據(jù)分析均由R軟件3.2.3版本[28]處理完成。PCA和LDA分析采用的R軟件具體的數(shù)據(jù)包分別是mdatools[29]和 mass[30]。PCA和LDA分析之前,所有數(shù)據(jù)由R軟件采用帕累托(Pareto)方法進(jìn)行標(biāo)準(zhǔn)化。應(yīng)用帕累托方法即每個(gè)變量除以其標(biāo)準(zhǔn)差(SD)的平方根,這有利于降低數(shù)據(jù)矩陣中變量具有很大的數(shù)值的相對(duì)重要性而不增加基線噪聲[31-32]。
隨后采用重復(fù)雙隨機(jī)交叉驗(yàn)證[33]和留一交叉驗(yàn)證方法[34],對(duì)建立的PCA/LDA模型的有效性進(jìn)行驗(yàn)證,均由R軟件編程完成。
所有224個(gè)葡萄酒樣品采用核磁共振一維氫譜(1H NMR)進(jìn)行測(cè)定。不同產(chǎn)地之間葡萄酒樣品記錄的氫譜看起來(lái)非常相似。由于采用標(biāo)準(zhǔn)的脈沖序列(NOESYGPPS)用于水(4.8 ppm)以及乙醇(1.2 ppm, 3.6 ppm)信號(hào)壓制,葡萄酒中微量成分的信號(hào)強(qiáng)度得到了明顯提高。將所有葡萄酒樣品的核磁共振氫譜疊加,發(fā)現(xiàn)一些氫譜出現(xiàn)了基線較大的偏移,可能是由于水和乙醇的抑制不當(dāng),pH調(diào)節(jié)不準(zhǔn)確,系統(tǒng)誤差或其他原因造成[35]。因此,需要對(duì)這些葡萄酒樣品進(jìn)行重復(fù)測(cè)定,以保證數(shù)據(jù)質(zhì)量的可靠性。
在保證圖譜數(shù)據(jù)質(zhì)量的基礎(chǔ)上,對(duì)1H NMR圖譜的主要葡萄酒代謝物/成分(氨基酸、糖、有機(jī)酸、乙醇)進(jìn)行了歸屬。通過(guò)葡萄酒加入相應(yīng)的化學(xué)物質(zhì)標(biāo)品可以進(jìn)一步驗(yàn)證主要代謝物的歸屬是否正確。本研究提供了一個(gè)典型中國(guó)紅葡萄酒1H NMR圖譜,并且在圖譜上給出了葡萄酒主要代謝物/成分的共振信號(hào)(見(jiàn)圖1)。
圖1 一個(gè)典型的標(biāo)有主要葡萄酒代謝物的中國(guó)紅葡萄酒1H NMR圖譜(其中果糖、葡萄糖和甘油信號(hào)出現(xiàn)在3~4.2 ppm高度重疊區(qū)域)Fig.1 One typical 1H NMR spectrum of a Chinese red wine with given resonance signals of the major wine metabolites/ ingredients (highly overlapped signals of fructose,glucose as well as glycerol occur in the range of 3.0-4.2 ppm)
由于樣品pH值微小的變化會(huì)造成1H NMR圖譜峰化學(xué)位移偏移[31],本研究葡萄酒氫譜一些典型峰信號(hào)出現(xiàn)的化學(xué)位移偏移如圖2所示。
圖2 葡萄酒樣品一維核磁共振疊加氫譜化學(xué)位移在(1.95~2.05)ppm及(3.73~3.76)ppm區(qū)域?qū)R前后[(A)-(B)、(C)-(D)]的比較Fig.2 Comparison of raw and aligned 1H NMR spectra of wine samples: Raw (A) and aligned (C)1H NMR spectra in the region (1.95-2.05) ppm; Raw (B) and aligned (D) 1H NMR spectra in the region 3.73-3.76 ppm
適當(dāng)?shù)姆寤瘜W(xué)位移偏移校正對(duì)齊對(duì)隨后的多元變量分析至關(guān)重要?;瘜W(xué)位移偏移會(huì)引起化學(xué)計(jì)量學(xué)模型樣本錯(cuò)誤的分組。為了解決這一問(wèn)題,至今為止已經(jīng)報(bào)道了多種峰化學(xué)位移校正對(duì)齊方法[35]。MestReNova采用的是分段對(duì)齊的方法,該方法能夠允許用戶采用交互式頁(yè)面,靈活的選擇峰化學(xué)位移校正對(duì)齊的區(qū)域。每段的平均圖譜作為參考圖譜進(jìn)行對(duì)齊,依次進(jìn)行下去,直到得到滿意的1H NMR圖譜。圖2-A和圖2-B采用分段對(duì)齊后的圖譜分別如圖2-C和圖2-D所示。由圖2可知,分段對(duì)齊方法較好的解決了1H NMR圖譜峰化學(xué)位移的偏移問(wèn)題。在MestReNova完成1H NMR圖譜整個(gè)峰化學(xué)位移對(duì)齊以及分段積分之后,整個(gè)1H NMR圖譜被細(xì)分為多個(gè)區(qū)域,每個(gè)區(qū)域所有點(diǎn)的積分值累加起來(lái)可以抽象的代表整個(gè)原始圖譜[36],這些代表性的區(qū)域積分值作為接下來(lái)建模的輸入變量,從而實(shí)現(xiàn)對(duì)每1H NMR圖譜約60 000個(gè)高共線性數(shù)據(jù)點(diǎn)的有效降維。
選取了0.01, 0.015, 0.02, 0.025, 0.03, 0.035 和0.04 ppm作為每個(gè)分段積分的區(qū)域?qū)挾热≈?,結(jié)果表明0.02 ppm能夠保持足夠的數(shù)據(jù)分辨率和最大限度地減少圖譜信息的損失。由于1H NMR中的水和乙醇信號(hào)的區(qū)域與本研究調(diào)查的問(wèn)題無(wú)關(guān),所以這些區(qū)域被排除在外。分段積分的有效區(qū)域是在0.8~9.5 ppm(其中不包含被特定脈沖序列壓制極度變形的水峰δ(H2O)=4.65~5.10 ppm) 和乙醇峰(δ(CH3)=1.05~1.21 ppm,δ(CH2)=3.60~3.72 ppm),分段積分后能夠獲得大約400個(gè)分段積分值,這些分段積分值作為之后多元統(tǒng)計(jì)分析的輸入變量。
在化學(xué)計(jì)量學(xué)數(shù)據(jù)分析之前,對(duì)所有的葡萄酒樣品進(jìn)行是否變質(zhì)篩查。葡萄酒樣品會(huì)由于不恰當(dāng)?shù)膬?chǔ)存條件以及超過(guò)葡萄酒本身的貨架期而導(dǎo)致變質(zhì)或腐敗[36]。通過(guò)疊加所有葡萄酒樣品的核磁共振氫譜,結(jié)果發(fā)現(xiàn)一些葡萄酒樣品圖譜在2.07 ppm處的乙酸信號(hào)峰的絕對(duì)積分值明顯高于其他大多數(shù)葡萄酒樣品。因此,對(duì)這些葡萄酒樣品需要仔細(xì)檢查以發(fā)現(xiàn)潛在的變質(zhì)。根據(jù)GB15037—2006規(guī)定,葡萄酒的揮發(fā)性酸的最大值為1.2 g/L。基于外部標(biāo)準(zhǔn)的PULCON(pulse-length-based concentration)[37]方法對(duì)所有葡萄酒樣品中的乙酸含量進(jìn)行定量。24個(gè)葡萄酒樣品(10個(gè)赤霞珠,2個(gè)玫瑰蜜,9個(gè)蛇龍珠,3個(gè)霞多麗)乙酸含量已經(jīng)超過(guò)1.2 g/L,因此在做進(jìn)一步的統(tǒng)計(jì)分析之前需要排除這些樣品。
然而GODELMANN等[37]直接刪除乙酸信號(hào)峰建模,在本研究中則是保留了乙酸信號(hào)峰(乙酸含量低于1.2 g/L),與PAPOTTI等[38]有關(guān)于葡萄酒產(chǎn)地研究的1H NMR圖譜前處理相一致。本研究很好地保持了非目標(biāo)指紋圖譜方法特點(diǎn),而不是預(yù)先忽略乙酸或其他腐敗參數(shù)對(duì)結(jié)果的影響。盡管乙酸與葡萄產(chǎn)地幾乎沒(méi)有關(guān)聯(lián),并且在隨后建立的產(chǎn)地PCA/LDA模型時(shí)發(fā)現(xiàn),乙酸信號(hào)峰區(qū)域并沒(méi)有對(duì)產(chǎn)地的區(qū)別能力有重要貢獻(xiàn)。
主成分分析同時(shí)也稱主分量分析,利用降維的思想,通過(guò)線性變換把多指標(biāo)轉(zhuǎn)為少數(shù)幾個(gè)綜合指標(biāo),且綜合指標(biāo)不相關(guān),這些新的綜合指標(biāo)按照方差依次遞減的順序排列[39]。
將1H NMR譜圖進(jìn)行峰對(duì)齊、分段積分等數(shù)據(jù)預(yù)處理操作后,將紅、白葡萄酒數(shù)據(jù)導(dǎo)入R數(shù)據(jù)分析軟件中,通過(guò)主成分分析,將紅葡萄酒和白葡萄酒進(jìn)行區(qū)分。由主成分分析可得圖3。
圖3 沙城(SC)、昌黎(CL)和昌吉(CJ)葡萄酒樣品主成分1(PC1)和主成分2(PC2)得分圖Fig.3 The score plot of principal component 1 (PC1) and principal component 2 (PC2) for the wine samples of Shacheng, Changli and Changji
圖3初步反映了昌吉、昌黎和沙城葡萄酒樣品在PC1(Comp 1)和PC2(Comp 2)組成的二維坐標(biāo)體系中的無(wú)監(jiān)督的分組情況,同時(shí)也可以得到PCA模型前兩個(gè)主成分解釋數(shù)據(jù)的方差累積貢獻(xiàn)率約為80%,PC1占總變量的71.28%。PC2占總變量的8.23%。同時(shí)根據(jù)Kaiser準(zhǔn)則,方差累積貢獻(xiàn)率超過(guò)80%,表明PCA模型具有顯著的實(shí)際意義。通過(guò)對(duì)圖3進(jìn)一步觀察發(fā)現(xiàn),昌黎葡萄酒樣品聚集的較為分散,昌吉和沙城兩個(gè)產(chǎn)地的葡萄酒樣品區(qū)域仍然會(huì)有較大程度的重疊,結(jié)果表明PCA模型無(wú)法實(shí)現(xiàn)對(duì)葡萄酒產(chǎn)地進(jìn)行區(qū)分。
為了解決PCA無(wú)法區(qū)分來(lái)自昌黎、 沙城以及昌吉產(chǎn)地的葡萄酒樣品,引入了LDA方法進(jìn)行數(shù)據(jù)分析。由于1H NMR圖譜原始數(shù)據(jù)既有對(duì)分類起作用的差異變量,同時(shí)又包含了大量對(duì)分類無(wú)作用的變量,變量之間也存在高度共線性問(wèn)題[40]。為了解決這一難題,本研究采用PCA所得的解釋1H NMR數(shù)據(jù)集內(nèi)95.8%方差確定的相互獨(dú)立的10個(gè)主成分,作為L(zhǎng)DA的輸入變量。通過(guò)PCA/LDA建立的線性判別函數(shù)能夠使這樣具有高維(多變量)、小樣本數(shù)據(jù)分類可視化效果最大化。由PCA/LDA線性判別函數(shù)1和2得分圖4可以看出,城葡萄酒樣品組內(nèi)的離散的程度減少,組間的區(qū)分更加清晰,表明PCA/LDA模型能夠很好地對(duì)沙城、昌黎以及昌吉產(chǎn)地葡萄酒進(jìn)行有效的區(qū)分。
圖4 PCA/LDA模型對(duì)昌黎(C)、昌吉(X)和沙城(S)葡萄酒樣品線性判別函數(shù)(LD 1)和線性判別函數(shù)(LD 2)得分圖Fig.4 The score plot of linear discriminant function 1 and linear discriminant function 2 of PCA/LDA for the wine samples of Changli (C), Changji (X) and Shacheng (S)
在實(shí)際數(shù)據(jù)分析過(guò)程中PCA/LDA模型通常容易產(chǎn)生過(guò)擬合現(xiàn)象,從而得到較好的分類判別效果的假象。多元統(tǒng)計(jì)模型的驗(yàn)證對(duì)于任何指紋圖譜的方法的評(píng)估和評(píng)價(jià)至關(guān)重要[41]。為此本研究分別采用了內(nèi)部留一交叉驗(yàn)證方法和外部重復(fù)雙隨機(jī)交叉驗(yàn)證來(lái)評(píng)價(jià)PCA/LDA模型分類結(jié)果的可靠性。圖5直觀解釋了兩種驗(yàn)證方法的關(guān)鍵步驟。
圖5 PCA/LDA模型驗(yàn)證方法Fig.5 The validation methods of PCA/LDA model
第一步采用內(nèi)部留一交叉驗(yàn)證的方法評(píng)價(jià)PCA/LDA模型的性能。廣泛運(yùn)用的留一交叉驗(yàn)證方法的原理是:假設(shè)數(shù)據(jù)集有N個(gè)樣本,隨機(jī)選取N-1個(gè)樣本作為訓(xùn)練樣本,剩下的1個(gè)樣本作為測(cè)試樣本。這樣每個(gè)樣品將會(huì)被模型預(yù)測(cè)1次,因此得到的N個(gè)分類結(jié)果可以用來(lái)保守的衡量模型的分類性能。表1總結(jié)了采用內(nèi)部交叉驗(yàn)證的PCA/LDA模型的昌黎、沙城和昌吉葡萄酒整個(gè)數(shù)據(jù)集分類結(jié)果。
表1 內(nèi)部留一交叉驗(yàn)證的PCA/LDA模型對(duì)沙城、昌黎和昌吉葡萄酒整個(gè)數(shù)據(jù)集分類結(jié)果Table 1 Classification results of PCA/LDA models usinginternal leave one-out cross validation (LOOCV) forthe wines from Shacheng, Changli and Changji (entire data sets)
重復(fù)雙隨機(jī)交叉驗(yàn)證主要的原理是首先將原始完整數(shù)據(jù)集采用隨機(jī)分層抽樣方式(注:本研究隨機(jī)分層重復(fù)抽樣100次),將原始數(shù)據(jù)集分為兩部分:(1)80%數(shù)據(jù)作為訓(xùn)練集用于建模;(2)20%數(shù)據(jù)作為外部驗(yàn)證集用于預(yù)測(cè)。由于對(duì)整個(gè)數(shù)據(jù)集隨機(jī)外部驗(yàn)證集抽樣100次,于是就得到了100個(gè)不同的外部驗(yàn)證集。對(duì)這100個(gè)外部驗(yàn)證集樣本正確分類率的平均值、標(biāo)準(zhǔn)偏差、中位數(shù)以及中位數(shù)的絕對(duì)標(biāo)準(zhǔn)偏差進(jìn)行統(tǒng)計(jì)分析(見(jiàn)表2),用這4項(xiàng)指標(biāo)評(píng)估模型的有效性。正確分類率的平均值及中位數(shù)這2個(gè)指標(biāo)數(shù)值越接近1、標(biāo)準(zhǔn)偏差以及中位數(shù)絕對(duì)標(biāo)準(zhǔn)偏差值越小,表明建立的模型正確分類能力越強(qiáng)。從表2可以看出,模型外部驗(yàn)證集昌黎和昌吉葡萄酒樣本正確分類率的平均值和中位數(shù)均大于0.7,沙城葡萄酒樣本正確分類率的平均值和中位數(shù)均高于0.9,平均值及中位數(shù)相對(duì)應(yīng)的標(biāo)準(zhǔn)偏差均較小,且3個(gè)產(chǎn)地正確分類率的平均值與中間值統(tǒng)計(jì)學(xué)上無(wú)顯著性差異(p>0.05), 以上結(jié)果表明重復(fù)雙隨機(jī)交叉驗(yàn)證能夠充分表明建立的PCA/LDA模型的有效性。
表2 重復(fù)雙隨機(jī)交叉驗(yàn)證外部驗(yàn)證集正確分類率的平均值、標(biāo)準(zhǔn)偏差、中位數(shù)以及中間值絕對(duì)偏差Table 2 The mean, the standard deviation (SD), themedian and the median absolute deviation (MAD) ofcorrect classification rate for the external validation set ofrepeated double random cross validation
本文探討了非目標(biāo)1H NMR指紋圖譜技術(shù)結(jié)合多元統(tǒng)計(jì)分析手段對(duì)昌黎、沙城和昌吉葡萄酒產(chǎn)地驗(yàn)證技術(shù)的可行性。研究結(jié)果表明,PCA/LDA模型能夠?qū)崿F(xiàn)葡萄酒產(chǎn)地比較好的區(qū)分,進(jìn)一步表明1H NMR指紋圖譜技術(shù)可以作為一項(xiàng)非常有效的驗(yàn)證葡萄酒產(chǎn)地真實(shí)性手段。建立的相關(guān)非目標(biāo)1H NMR指紋圖數(shù)據(jù)庫(kù)能夠推動(dòng)我國(guó)葡萄酒產(chǎn)地真實(shí)性溯原制度的建立與完善,進(jìn)一步保障葡萄酒市場(chǎng)穩(wěn)定健康發(fā)展,維護(hù)消費(fèi)者的合法權(quán)益。
然而,本研究依然存在一些缺陷,例如,昌黎、沙城和昌吉收集的大多數(shù)是赤霞珠葡萄酒樣品;同時(shí)由于各大產(chǎn)地種植的葡萄品種及規(guī)模不一樣,造成了每個(gè)葡萄酒產(chǎn)地收集到的葡萄酒樣品品種及數(shù)量差別較大,這對(duì)建立產(chǎn)地識(shí)別模型提出了挑戰(zhàn)。在未來(lái)的研究中,應(yīng)該收集更多具有代表性的,如不同品種、不同年份、不同產(chǎn)地且來(lái)源真實(shí)可靠的葡萄酒樣品,以保障建立一個(gè)更加真實(shí)可靠的非目標(biāo)1H NMR指紋圖數(shù)據(jù)庫(kù)。
[1] SEN I,TOKATLI F.Authenticity of wines made with economically important grape varieties grown in Anatolia by their phenolic profiles[J].Food Control,2014,46(46):446-454.
[2] 地理標(biāo)志產(chǎn)品保護(hù)規(guī)定[J].中國(guó)質(zhì)量技術(shù)監(jiān)督,2005(9):14-15.
[3] BALESTRINI P,GAMBLE P.Country-of-origin effects on Chinese wine consumers[J].British Food Journal,2006,108(5):396-412.
[4] 吳浩,靳保輝,陳波,等.葡萄酒產(chǎn)地溯源技術(shù)研究進(jìn)展[J].食品科學(xué),2014,35(21):306-314.
[5] 秦麗娜,倪元穎,梁方華,等.利用香氣成分識(shí)別葡萄酒品種和產(chǎn)地的初步研究[J].釀酒科技,2008(2):40-44;46.
[6] 王方,王偉,張春婭,等.赤霞珠干紅葡萄酒產(chǎn)地識(shí)別的研究[J].中外葡萄與葡萄酒,2008(1):4-7.
[7] GARCIA-PARILLA M C.Differentiation of wine vinegars based on phenolic composition[J].Journal of Agricultural and Food Chemistry,1997,45(9):3 487-3 492.
[8] 莫寅斌.賀蘭山東麓地區(qū)葡萄酒指紋圖譜的研究[D].楊凌:西北農(nóng)林科技大學(xué),2009.
[9] GEANA I,IORDACHE A,IONETE R,et al.Geographical origin identification of Romanian wines by ICP-MS elemental analysis[J]. Food Chemistry,2013,138(2-3):1 125-1 134.
[10] GREENOUGH J D,MALLORY-GREENOUGH L M,FRYER B J.Geology and wine 9:regional trace element fingerprinting of Canadian wines[J].Geoscience Canada,2005,32(3):129-137.
[11] COETZEE P P,VANHAECKE F.Classifying wine according to geographical origin via quadrupole-based ICP-mass spectrometry measurements of boron isotope ratios[J].Analytical and Bioanalytical Chemistry,2005,383(6):977-984.
[12] ARANA I,JAREN C,ARAZURI S.Maturity,variety and origin determination in white grapes (VitisviniferaL.) using near infrared reflectance technology[J].Journal of Near Infrared Spectroscopy,2005,13(1):349-357.
[13] PICQUE D,CATTENOZ T,CORRIEU G,et al.Discrimination of red wines according to their geographical origin and vintage year by the use of mid-infrared spectroscopy[J].Sciences Des Aliments,2005,25(3):207-220.
[14] FERN NDEZ K,AGOSIN E.Quantitative analysis of red wine tannins using Fourier-transform mid-infrared spectrometry[J].Journal of Agricultural and Food Chemistry,2007,55(18):7 294-7 300.
[15] CAMIN F,BONER M,BONTEMPO L,et al.Stable isotope techniques for verifying the declared geographical origin of food in legal cases[J].Trends in Food Science and Technology,2017,61:176-187.
[16] PAOLANARANJO R D D,BARONI M V,PODIO N S,et al.Fingerprints for main varieties of Argentinean wines:terroir differentiation by inorganic, organic, and stable isotopic analyses coupled to chemometrics[J].Journal of Agricultural and Food Chemistry, 2011,59(14):7 854-7 865.
[17] DUTRA S,ADAMI L,MARCON A,et al.Determination of the geographical origin of Brazilian wines by isotope and mineral analysis[J].Analytical and Bioanalytical Chemistry,2011,401(5):1 575-1 580.
[18] GEANA E I,POPESCU R,COSTINEL D,et al.Verifying the red wines adulteration through isotopic and chromatographic investigations coupled with multivariate statistic interpretation of the data[J].Food Control,2016,62:1-9.
[19] GODELMANN R,FANG F,HUMPFER E,et al.Targeted and non-targeted wine analysis by1H NMR spectroscopy combined with multivariate statistical analysis.Differentiation of important parameters:grape variety,geographical origin,year of vintage[J].Journal of Agricultural and Food Chemistry,2013,61(23):5 610-5 619.
[20] SELIH V S,SALA M,DRGAN V.Multi-element analysis of wines by ICP-MS and ICP-OES and their classification according to geographical origin in Slovenia[J].Food Chemistry,2014,153(153):414-423.
[21] 薛潔,蔣露.SNIF-NMR和IRMS技術(shù)在原產(chǎn)地葡萄酒鑒定中的應(yīng)用[J].食品與發(fā)酵工業(yè),2011,37(10):154-158.
[22] 蔣露,薛潔,林奇,等.SNIF-NMR和IRMS技術(shù)在葡萄酒質(zhì)量評(píng)價(jià)中的初步研究[J].食品與發(fā)酵工業(yè),2008,34(11):139-143.
[23] JIANG W,XUE J,LIU X,et al.The application of SNIF-NMR and IRMS combined with C, H and O isotopes for detecting the geographical origin of Chinese wines[J].International Journal of Food Science and Technology,2015,50(3):774-781.
[24] 俞良莉,陸維盈,劉潔,等.食品非目標(biāo)性檢測(cè)技術(shù)[J].食品科學(xué)技術(shù)學(xué)報(bào),2016,34(6):1-6.
[25] 俞良莉,王碩,孫寶國(guó).食品安全化學(xué)[M].上海:上海交通大學(xué)出版社,2014:283.
[26] DU Y Y,BAI G Y,ZHANG X,et al.Classification of wines based on combination of1H NMR spectroscopy and principal component analysis[J].Chinese Journal of Chemistry,2007,25(7):930-936.
[27] MARDIA K V, KENT J T, BIBBY J M.Multivariate analysis[M].San Diego:London Academic Press,1979.
[28] R Core Team.R:A language and environment for statistical computing.https://www.R-project.org/.
[29] KUCHERYAVSKIY S.mdatools: multivariate data analysis for chemometrics.https://CRAN.R-project.org/package=mdatools.
[30] VENABLES W,RIPLEY B,VENABLES W,et al.Modern Applied Statistics with S[M].4th ed. Berlin:Springer,2002.
[31] CRAIG A,CLOAREC O,HOLMES E,et al.Scaling and normalization effects in NMR spectroscopic metabonomic data sets[J]. Analytical Chemistry,2006,78(7):2 262-2 267.
[32] WINNING H,ROLDAN-MARIN E,DRAGSTED L O,et al.An exploratory NMR nutri-metabonomic investigation reveals dimethyl sulfone as a dietary biomarker for onion intake[J].Analyst,2009,134(11):2 344-2 351.
[33] FILZMOSER P,LIEBMANN B,VARMUZA K.Repeated double cross validation.Journal of Chemometrics[J].Journal of Chemometrics,2009,23(4):160-171.
[34] STONE, M.Cross-validatory choice and assessment of statistical predictions[J].Journal of the Royal Stastical Society.Series B (Methodological),1974,36(2): 111-147.
[35] VU T N,LAUKENS K.Getting your peaks in line:a review of alignment methods for NMR spectral data[J].Metabolites,2013,3(2): 259-276.
[36] ESSLINGER S,RIEDL J,FAUHL-HASSEK C.Potential and limitations of non-targeted fingerprinting for authentication of food in official control[J].Food Research International,2014,60(6):189-204.
[37] GODELMANN R,KOST C,PATZ C D,et al.Quantitation of compounds in wine using1H NMR spectroscopy:description of the method and collaborative study[J].Journal of AOAC International,2016,99(5):1 295-1 304.
[38] PAPOTTI G,BERTELLI D,GRAZIOSI R,et al.Application of one-and two-dimensional NMR spectroscopy for the characterization of protected designation of origin Lambrusco wines of Modena[J].Jounal of Agriculture and Food Chemistry,2013,61(8):1 741-1 746.
[39] 曾祥燕,趙良忠,孫文兵,等.基于PCA和BP神經(jīng)網(wǎng)絡(luò)的葡萄酒品質(zhì)預(yù)測(cè)模型[J].食品與機(jī)械,2014,30(1):40-44.
[41] RIEDL J,ESSLINGER S,FAUHL-HASSEK C.Review of validation and reporting of non-targeted fingerprinting approaches for food authentication[J].Analytica Chimica Acta,2015,885:17-32.