唐洪玉,周 琳,陳義安
(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)
釀酒葡萄和葡萄酒成分間的典型性相關(guān)分析
唐洪玉,周 琳,陳義安**
(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)
根據(jù)釀酒葡萄與葡萄酒的理化指標(biāo),按“逐步降維,保留信息”的思想建立模型,把原來(lái)多個(gè)變量劃為幾個(gè)綜合指標(biāo),并對(duì)這些綜合指標(biāo)進(jìn)行研究,以簡(jiǎn)化問(wèn)題的求解過(guò)程;因釀酒葡萄和葡萄酒質(zhì)量間的內(nèi)在聯(lián)系及變化規(guī)律具有隨機(jī)性、理化指標(biāo)信息過(guò)大,先進(jìn)行變量替換,分別選取15個(gè)、8個(gè)綜合變量替代原變量,再對(duì)醞釀葡萄與醞釀葡萄酒主成分分析,最后進(jìn)行典型相關(guān)分析。
降維;主成分分析;典型相關(guān)分析;變量替換
目前,對(duì)葡萄酒的鑒別主要采用感官評(píng)定法。傳統(tǒng)的產(chǎn)品感官評(píng)價(jià)主要依靠品評(píng)專(zhuān)家的個(gè)人經(jīng)驗(yàn)來(lái)完成,品評(píng)專(zhuān)家必須具有大量的行業(yè)背景知識(shí)和豐富的品評(píng)經(jīng)驗(yàn)。但品評(píng)結(jié)果的主觀(guān)性較強(qiáng),且品評(píng)過(guò)程時(shí)間長(zhǎng),費(fèi)用大,成本較高,不利于大批量樣本的感官品評(píng)。由于葡萄酒的化學(xué)成分復(fù)雜,也可借助化學(xué)計(jì)量學(xué)的方法對(duì)其進(jìn)行區(qū)分。化學(xué)計(jì)量學(xué)方法即通過(guò)定量分析葡萄酒中多種化學(xué)物質(zhì)的含量,再對(duì)數(shù)據(jù)進(jìn)行多元統(tǒng)計(jì)分析,從而達(dá)到對(duì)樣品進(jìn)行鑒別的目的。這種方法比感官評(píng)定更加客觀(guān)、公正。葡萄酒作為許多歐洲國(guó)家的一種重要的商品,國(guó)外對(duì)這種鑒別方法已經(jīng)作了較多的研究。但是,對(duì)化學(xué)成分進(jìn)行準(zhǔn)確的定性定量分析較困難且過(guò)程復(fù)雜。葡萄酒的成分有1 000多種,并且它們之間存在著復(fù)雜的關(guān)系。因此,采用科學(xué)的方法使存在于這些復(fù)雜關(guān)系的問(wèn)題簡(jiǎn)單化,進(jìn)而更加清楚地了解它們之間的關(guān)系,多元統(tǒng)計(jì)方法無(wú)疑可以為葡萄酒的質(zhì)量控制、預(yù)測(cè)、預(yù)報(bào)、區(qū)分提供一種有效的途徑。多元統(tǒng)計(jì)分析中主成分分析和典型性相關(guān)分析數(shù)學(xué)工具能把眾多的描述語(yǔ)轉(zhuǎn)化為較少的、綜合性較強(qiáng)的描述語(yǔ),并且能夠反映出原來(lái)多個(gè)描述語(yǔ)的信息,從而篩選出科學(xué)合理的描述特性。
考慮到釀酒葡萄與葡萄酒的理化指標(biāo)數(shù)量過(guò)多,利用主成分分析的降維思想,尋找少數(shù)幾個(gè)綜合變量(原變量的線(xiàn)性組合)對(duì)替代原變量,將原兩組變量的關(guān)系化為少數(shù)幾對(duì)綜合變量的關(guān)系。于是分別建立釀酒葡萄與葡萄酒的理化指標(biāo)的向量矩陣,由于指標(biāo)信息大,于是對(duì)它們進(jìn)行了變量替換,并建立了典型性相關(guān)分析模型;應(yīng)用Matlab軟件先對(duì)醞釀葡萄與醞釀葡萄酒進(jìn)行主成分分析,分別選取與主成分個(gè)數(shù)相同的綜合變量替代原變量,然后再進(jìn)行典型相關(guān)分析。
(1)兩組評(píng)酒員對(duì)葡萄酒的質(zhì)量評(píng)估是權(quán)威公正的,不摻雜個(gè)人情感因素。
(2)在醞釀葡萄過(guò)程中,每種樣品的原材料不發(fā)生替換。
(3)釀酒葡萄、葡萄酒的各種指標(biāo)測(cè)量值是完全可信的。
(4)葡萄酒的質(zhì)量只與外觀(guān)、香氣、口感、平衡整體有關(guān)。
(5)假設(shè)每一個(gè)樣品酒源自同一個(gè)品酒組的平均評(píng)分都是來(lái)自同一個(gè)總體的樣本,服從正態(tài)分布,且每個(gè)總體之間相互獨(dú)立。
(6)假設(shè)兩個(gè)品酒組分別對(duì)紅葡萄酒、白葡萄酒的品均分具有方差齊性,若用σ21表示甲組品酒員給每個(gè)紅葡萄酒樣品平均分的方差,σ22表示乙組品酒員給每個(gè)紅葡萄酒樣品平均分的方差,即:σ21=σ22。
Xj:表示紅葡萄酒第j個(gè)指標(biāo)的值(j=1,2, 31);Xij:表示紅葡萄酒的第i個(gè)品種的第j個(gè)指標(biāo)值;zk:為紅葡萄酒新的指標(biāo)值(k<j);A:標(biāo)準(zhǔn)化后的紅葡萄的典型相關(guān)系數(shù);B:標(biāo)準(zhǔn)化后的白葡萄的典型相關(guān)系數(shù); R:釀酒紅葡萄和紅葡萄酒的理性指標(biāo)之間的相關(guān)性。
釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系,表面上無(wú)法看出它們的關(guān)系。但釀酒葡萄、葡萄酒的理化指標(biāo)均可以建立向量矩陣,于是考慮從這兩個(gè)向量矩陣間尋找關(guān)系。典型性相關(guān)分析[1]是研究?jī)山M變量相關(guān)關(guān)系的一種統(tǒng)計(jì)方法,它的思想與主成分分析模型[2]相類(lèi)似,以“逐步降維,減少變量”的思想為中心,尋找?guī)讉€(gè)綜合變量來(lái)替代原有的多個(gè)變量,與本題所要解決的問(wèn)題相融合,于是建立典型性相關(guān)分析模型。
首先,對(duì)醞釀葡萄與葡萄酒進(jìn)行主成分分析,分別選取15個(gè)與9個(gè)綜合變量替代原變量進(jìn)行典型相關(guān)分析[1]。設(shè)研究的醞釀葡萄與葡萄酒的兩組指標(biāo)變量分別為 X=(χ1,χ2, χp)T,(p=15);Y= (y1,y2, yq)T,(q=9)。分別對(duì)X、Y的每個(gè)指標(biāo),觀(guān)察n次,有:
分別對(duì)X,Y取行平均,得到樣品向量的平均值:
分析式(1)將發(fā)現(xiàn):在使得V,W的相關(guān)達(dá)最大的同時(shí),V和W的方差將達(dá)最小,這說(shuō)明按此準(zhǔn)則得到的典型成分V和W,對(duì)原變量組X和Y的代表性最差,它們無(wú)法更多地反映原變量組的變異信息。另一方面,因V,W任意線(xiàn)性組合的相關(guān)系數(shù)與V,W的相關(guān)系數(shù)相等,便使得相關(guān)系數(shù)最大的V=a'X和W=b'X并不唯一。故在典型相關(guān)分析解法[4]中附加了約束條件:
接下來(lái),在約束條件式(2)下,求出a、b,使得ρ(V,W)最大。于是做拉格朗日函數(shù)[5]:
對(duì)a求導(dǎo):
對(duì)b求導(dǎo):
再式(3)×a',式(4)×b'得:
而a'Σ 12b正是相關(guān)系數(shù)ρ(V,W),利用式(4)中的結(jié)論,可得:
由式(7)得:
將式(8)代入式(6)中,得:
由定義可知a'X,b'Y是X,Y的第一對(duì)典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱(chēng)為第一個(gè)典型相關(guān)系數(shù)。
最后利用MATLAB軟件[6]求出第一典型變量和典型相關(guān)系數(shù)。
5.1 主成分分析
采用主成分分析方法,先將釀酒葡萄的理化指標(biāo)進(jìn)行主成分分析,得到了紅白釀酒葡萄的15種主要相關(guān)成分,分別是氨基酸總量、花色苷、多酚氧化酶活力、DPPH自由基、總酚、單寧、葡萄總黃酮、總糖、還原糖、可溶性固形物、可滴定酸、固酸比、干物質(zhì)含量、果皮質(zhì)量和果皮顏色;對(duì)于葡萄酒的理化指標(biāo),用同樣的方法得到兩種葡萄酒的理化指標(biāo)的主要相關(guān)成分,其中紅葡萄酒的成分是花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積和色澤;白葡萄酒的成分是單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積和色澤。
5.2 典型性相關(guān)分析
第二步先將釀酒紅葡萄和紅葡萄酒進(jìn)行典型相關(guān)性分析,利用matlab軟件,使用指令[A,B,R]= canoncorr(χ,y),分別得到了矩陣A、B和R,其中A和B為標(biāo)準(zhǔn)化的紅葡萄、白葡萄的典型相關(guān)系數(shù),釀酒紅葡萄和紅葡萄酒的理性指標(biāo)之間的相關(guān)性為R,如表1、表2所示。
表1 釀酒紅葡萄和紅葡萄酒的理化指標(biāo)之間的相關(guān)性
由表1可以看出花色苷、單寧、總酚、酒總黃銅和白藜蘆醇相關(guān)性極強(qiáng),DPPH、色澤L*和色澤a*相關(guān)性較強(qiáng),色澤b*相關(guān)性較小,可以忽略。同樣的得出了釀酒白葡萄和白葡萄酒的理性指標(biāo)之間的相關(guān)性R:
表2 釀酒白葡萄和白葡萄酒的理化指標(biāo)之間的相關(guān)性
由表2可以看出單寧、總酚和酒總黃銅相關(guān)性極強(qiáng),白藜蘆醇、DPPH和色澤L*相關(guān)性較強(qiáng),色澤a*和色澤b*相關(guān)性較小,可以忽略。
[1]王俊,謝曉佳.基于層次分析法及可拓理論的露天采石場(chǎng)安全評(píng)價(jià)研究[J].重慶工商大學(xué)學(xué)報(bào):自然科學(xué)版,2013(6): 61-68
[1]高惠璇.典型相關(guān)與典型冗余分析[J].數(shù)理統(tǒng)計(jì)與管理,2002(1):56-64
[2]李新蕊.主成分分析、因子分析、聚類(lèi)分析的比較與應(yīng)用[J].山東教育學(xué)院報(bào),2007(6):1-4
[3]茆詩(shī)松,程依明,濮小龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2011
[4]楊俊英,楊洋,唐龍妹,等.典型相關(guān)分析[J].臨床薈萃,2006,21(1):52-53
[5]華東師范大學(xué).數(shù)學(xué)分析[M].北京:高等教育出版社,2010
[6]姜啟源,邢文訓(xùn),謝金星,等.大學(xué)數(shù)學(xué)實(shí)驗(yàn)[M].北京:清華大學(xué)出版,2005
Application of Typical Correlation Analysis to the Composition Analysis of Wine Grapes and Wine
TANG Hong-yu,ZHOU Lin,CHEN Yi-an
(School of Mathematics and Statistics,Chongqing Technology and Business University,Chongqing 400067,China)
According to physical and chemical indicators of wine grape and wine,the model is set up based on the idea of dimension reduction step by step and retaining the information to classify original multi-variable to several comprehensive indicators and to study these comprehensive indicators so as to simplify the solving process of the problems.Because the intrinsic connection and changing law between wine grapes and wine quality have randomness and because their physical and chemical indicators are too large,this paper firstly makes variable substitution by selecting 15 comprehensive variables and 8 comprehensive variables respectively to replace original variables,then conducts primary component analysis on wine grapes and wine and finally carries out typical correlation analysis.
dimension reduction;principal component analysis;variable substitution
O211
A
1672-058X(2014)01-0093-05
責(zé)任編輯:田 靜
2013-05-22;
2013-05-30.
唐洪玉(1990-),女,四川宜賓人,從事數(shù)學(xué)金融研究.
**通訊作者:陳義安(1969-),男,四川渠縣人,教授,從事應(yīng)用數(shù)學(xué)研究.E-mail:chenyian@ctbu.edu.com.