陳 錦
(廣西師范大學(xué) 電子工程學(xué)院,廣西 桂林 541004)
隨著人們生活水平的提高,葡萄酒的質(zhì)量需求也相應(yīng)的增加,因此葡萄酒的認(rèn)證和質(zhì)量評(píng)價(jià)也得到關(guān)注。對(duì)葡萄酒的質(zhì)量評(píng)價(jià),需要深入分析釀酒葡萄的理化指標(biāo)、葡萄酒的理化指標(biāo)、葡萄酒的質(zhì)量之間的聯(lián)系。因此本文根據(jù)三者的聯(lián)系建立了葡萄酒質(zhì)量評(píng)價(jià)的多元線性回歸模型。
在實(shí)際葡萄酒質(zhì)量的評(píng)價(jià)中,我們會(huì)選擇多組評(píng)酒員對(duì)葡萄酒樣品進(jìn)行評(píng)價(jià),因此我們需要對(duì)多組評(píng)酒員結(jié)果的顯著性差異的分析。本文介紹t檢驗(yàn)、F檢驗(yàn)、秩和檢驗(yàn)[1-2]3種顯著性差異分析模型。
(1)t檢驗(yàn)
(2)F檢驗(yàn)
(3) 秩和檢驗(yàn)
將觀察值由小到大排列,得到序列號(hào),即秩次。再將秩次代替原始數(shù)據(jù)按要求進(jìn)行秩和檢驗(yàn)。
設(shè)μA,μB,分別為兩組葡萄酒評(píng)分的均值,在水準(zhǔn)α=0.05下檢驗(yàn)假設(shè):H0∶μA=μB,H1∶μA≠μB,h為檢驗(yàn)結(jié)果。h=0表示A與B的總體差別不顯著;h=1表示A與B的總體差別顯著[3]。
葡萄酒有外觀分析,香氣分析,口感分析,平衡整體分析4個(gè)評(píng)分項(xiàng)目,將評(píng)酒員在不同評(píng)分項(xiàng)目的評(píng)分求和,每個(gè)項(xiàng)目總評(píng)分,求其方差:δ1,δ2,δ3,δ4。我們定義一個(gè)評(píng)價(jià)指標(biāo):
(1)
評(píng)價(jià)指標(biāo)η的值越小,評(píng)價(jià)結(jié)果越可信。
釀酒葡萄的質(zhì)量直接影響葡萄酒的質(zhì)量,因此我們通過葡萄酒的質(zhì)量可以分析釀酒葡萄的質(zhì)量,分析釀酒葡萄的質(zhì)量我們還可以通過釀酒葡萄本身的理化指標(biāo)進(jìn)行分析,所以我們通過釀酒葡萄的理化指標(biāo)和葡萄酒的質(zhì)量對(duì)釀酒葡萄進(jìn)行分級(jí)。
研究中我們采用了因子分析的方法,因子分析是一種比較好的分類方法,本文還建立了一種統(tǒng)計(jì)分級(jí)模型對(duì)釀酒葡萄進(jìn)行分類。
把釀酒葡萄的一級(jí)理化指標(biāo)作為一個(gè)公共因子,顯然釀酒葡萄的質(zhì)量是由葡萄的所有一級(jí)理化指標(biāo)來確定的,第i個(gè)釀酒葡萄的質(zhì)量為Zi,理化指標(biāo)為Fi。以主成分分析的統(tǒng)計(jì)方法分析影響葡萄品質(zhì)的主成分,通過相關(guān)性分析和聚類分析對(duì)影響葡萄品質(zhì)的指標(biāo)進(jìn)行研究,篩選出能夠客觀反映出葡萄品質(zhì)的簡化指標(biāo),為快速,準(zhǔn)確的判斷葡萄品質(zhì)打下基礎(chǔ)[4]。
Zi=ai1F1+ai2F2+…+aimFm+ui+
bui(i=1,2,…,n)
(2)
設(shè)置信區(qū)間為Ai=[ai,j,ai,j],第i等級(jí)i=1,2,3,…,n,第j個(gè)理化指標(biāo)j=1,2,3,…,m。定義一個(gè)覆蓋率為β,
(3)
我們規(guī)定,當(dāng)β滿足一定條件我們可求得樣品葡萄質(zhì)量的分類標(biāo)準(zhǔn)。
本文的實(shí)驗(yàn)數(shù)據(jù)來源于2012年全國大學(xué)生數(shù)學(xué)建模競賽A題葡萄酒評(píng)價(jià),根據(jù)建立的因子分析模型和統(tǒng)計(jì)分級(jí)模型,通過MATLAB軟件計(jì)算得出釀酒葡萄主要影響理化指標(biāo)見表1和釀酒葡萄的分級(jí)結(jié)果見表2、3。
研究分析葡萄酒質(zhì)量只和部分指標(biāo)的關(guān)聯(lián)較大,所以我們?nèi)サ粢恍╆P(guān)聯(lián)不大的指標(biāo)。用關(guān)聯(lián)較大的指標(biāo)來表示出葡萄酒的質(zhì)量。
表1釀酒葡萄主要影響理化指標(biāo)
Table1Winegrapemainlyaffectphysicalandchemicalindicators
葡萄種類釀酒葡萄主要影響理化指標(biāo)紅葡萄氨基酸總量,蛋白質(zhì),VC含量,花色苷,酒石酸,蘋果酸,檸檬酸總酚,白藜蘆醇白葡萄氨基酸總量,蛋白質(zhì),VC含量,花色苷,酒石酸,蘋果酸,檸檬酸多酚氧化酶活力,總酚,黃酮醇,總糖,PH值
表2紅葡萄的分級(jí)
Table2Classificationofredgrapes
樣品級(jí)別紅葡萄樣品號(hào)A級(jí)(樣品)2,3,8,20,23B級(jí)(樣品)5,6,9,11,22C級(jí)(樣品)1,12,17,19,21D級(jí)(樣品)10,13,14,15,16,18E級(jí)(樣品)4,7,24,25,26,27
表3白葡萄的分級(jí)
Table3Classificationofwhitegrapes
樣品級(jí)別白葡萄樣品號(hào)A級(jí)(樣品)3,11,16,23,27B級(jí)(樣品)9,10,13,17,24C級(jí)(樣品)1,2,8,19,22,25D級(jí)(樣品)6,14,20,21,26,28E級(jí)(樣品)4,5,7,12,15,18
影響葡萄酒樣品理化指標(biāo)的因素往往不止一個(gè),即多個(gè)葡萄理化指標(biāo),假設(shè)它們之間有如下的線性關(guān)系式:
y=β0+β1x1+…+βkxk+ε
(4)
其中y為可觀察的隨機(jī)變量,稱為因變量為非隨機(jī)的精確觀察的變量x1,x2,…,xk,稱為自變量或因子,β0,β1,β2,…βk為k+1個(gè)未知參數(shù),ε是隨機(jī)變量,一般假設(shè)Eε=0,Dε=σ2>0。
多元線性模型和回歸系數(shù)的檢驗(yàn)[5-6]:
(5)
在實(shí)際問題中,事先我們并不知道或者不能斷定隨機(jī)變量y與一組變量x1,x2,…xk之間確有線性關(guān)系y=β0+β1x1+…+βkxk+ε往往只是一種假設(shè),因此在求線性回歸方程之后,還須對(duì)求出的線性回歸方程同實(shí)際的觀測數(shù)據(jù)擬合效果進(jìn)行檢驗(yàn),可提出以下原假設(shè)
H0∶β0=β1=β2=…=βk=0
(6)
r檢驗(yàn)法:與一元回歸情形類似,y與x1,x2,…,xk線性相關(guān)的密切程度也可用回歸平方和U在總平方和Lyy中所占的比例大小來衡量,定義
(7)
為y與x1,x2,…,xk的多元相關(guān)系數(shù)或復(fù)相關(guān)系數(shù)。容易證明F與R有如下關(guān)系:
(8)
典型相關(guān)分析是研究兩組變量之間的相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法。典型相關(guān)分析首先在每一組變量的線性組合,使其具有最大相關(guān)性,然后再在每一組變量中找出第2對(duì)線性組合,使其與第1對(duì)線性組合不相關(guān),而第2對(duì)本身具有最大相關(guān)性,如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為止,這些綜合變量稱為典型變量[7]。
典型相關(guān)分析用X和Y的線性組合U=αTX,V=bT之間的相關(guān)來研究X和Y之間的相關(guān)性。其目的就是希望找到向量a和b,使ρ(U,V)最大,從而找到替代原始變量的典型變量U、V[8]。
典型相關(guān)系數(shù)的數(shù)學(xué)定義為:
(9)
由于隨機(jī)變量乘以常數(shù)不該變其相關(guān)系數(shù),為防止不必要的結(jié)果重復(fù)出現(xiàn),最好在其附加如下約束條件:
Var(U)=αT∑11a=1
Var(V)=αT∑22b=1
(10)
對(duì)2012年全國大學(xué)生數(shù)學(xué)建模競賽A題葡萄酒評(píng)價(jià)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行MATLAB仿真計(jì)算可得線性回歸多項(xiàng)式:
(11)
葡萄酒的理化指標(biāo)為ωi,i=1,2,…9,葡萄的理化指標(biāo)為gj,j=1,2,…9,則
ωi=bi0+bi1g1+bi2g2+…+bi13g13
以一個(gè)wi作為示例:
w1=200.36-0.01g2+2.71g3+2.29g4-
2.42g5+4.42g6+2.84g7+0.39g8-1.27g9+
0.52g10+0.62g11+0.04g12-45.49g13
由式11可以計(jì)算得出,白(紅)葡萄與白(紅)葡萄酒的理化指標(biāo)的多項(xiàng)式系數(shù)見表4、表5。
表4白葡萄與白葡萄酒的理化指標(biāo)的多項(xiàng)式系數(shù)
Table4Whitegrapesandwhitewinephysicalandchemicalindicatorsofthepolynomialcoefficients
YhYdYzYsYbYDYselYseaYsebXa0.11 0.50 0.34 0.20 0.33 0.40 -0.24 -0.10 0.36 Xd0.30 0.47 0.43 0.44 -0.01 0.38 -0.48 -0.03 0.05 Xvc-0.09 -0.09 -0.13 -0.10 -0.03 -0.12 0.12 0.11 -0.37 Xh0.92 0.72 0.77 0.71 0.20 0.67 -0.83 -0.35 -0.24 Xs0.03 0.28 0.27 0.16 0.22 0.24 -0.24 0.01 0.46 Xp0.69 0.30 0.35 0.27 -0.19 0.25 -0.35 -0.56 -0.31 Xl0.38 0.14 0.14 -0.08 -0.20 0.02 -0.25 -0.27 -0.02 Xz0.61 0.82 0.88 0.88 0.46 0.87 -0.75 -0.17 0.06 Xb-0.03 0.05 0.08 0.05 0.01 0.07 0.16 -0.45 -0.11
注:Xa—Xb:氨基酸總量、蛋白質(zhì)、VC含量、花色苷、酒石酸、蘋果酸、檸檬酸、總酚、白藜蘆醇;
Yh—Yseb:花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積(IV50) 1/IV50、色澤L*(D65)、色澤L*(D66)、色澤L*(D67)。
表5紅葡萄與紅葡萄酒的理化指標(biāo)的多項(xiàng)式系數(shù)
Table5Redgrapesandredwinephysicalandchemicalindicatorsofthepolynomialcoefficients
YhYdYzYsYbYDYselYseaYsebXa0.00 0.43 0.48 0.29 -0.22 0.21 -0.41 0.08 0.28 Xd0.00 0.36 0.42 0.60 -0.22 0.23 0.08 0.45 -0.13 Xvc0.00 -0.17 -0.10 -0.16 0.13 0.23 0.22 -0.09 -0.10 Xh0.00 -0.22 -0.30 -0.16 0.07 -0.18 -0.08 -0.12 0.07 Xs0.00 0.18 0.00 -0.19 -0.31 0.10 -0.25 -0.30 0.31 Xp0.00 0.05 0.12 0.47 -0.25 -0.12 0.10 0.38 -0.27 Xl0.00 0.25 0.08 0.16 -0.10 -0.05 -0.08 -0.23 0.16 Xdf0.00 -0.24 -0.40 -0.23 0.16 -0.37 0.01 -0.02 -0.05 Xz0.00 0.43 0.55 0.74 -0.14 0.42 0.12 0.40 -0.20 Xht0.00 0.41 0.39 0.61 -0.09 0.36 -0.20 0.00 0.24 Xzt0.00 0.36 0.32 -0.13 -0.37 0.24 -0.55 -0.21 0.54 Xph0.00 0.17 0.12 -0.17 -0.05 0.05 -0.28 -0.29 0.34
注:Xa-Xph氨基酸總量、蛋白質(zhì)、VC含量、花色苷、酒石酸、蘋果酸、檸檬酸多酚氧化酶活力、總酚、黃酮醇、總糖、PH值;
Yh-Yseb:花色苷、單寧、總酚、酒總黃酮、白藜蘆醇、DPPH半抑制體積(IV50) 1/IV50、色澤L*(D65)、色澤L*(D66)、色澤L*(D67)。
根據(jù)表4、表5相關(guān)系數(shù)建立的多項(xiàng)式,分析葡萄酒與葡萄的理化指標(biāo)之間的關(guān)系,由紅葡萄與紅葡萄酒理化指標(biāo)的相關(guān)系數(shù)表格分析可知,紅葡萄酒的花色苷理化指標(biāo)主要由紅葡萄的花色苷決定的,總酚由紅葡萄的總酚決定,紅葡萄酒的酒總黃酮主要來自于紅葡萄的總酚,紅葡萄酒的色澤主要由紅葡萄的蛋白質(zhì)、花色苷、蘋果酸影響的。通過白葡萄與白葡萄酒理化指標(biāo)的相關(guān)系數(shù)表格分析可知,白葡萄酒的花色苷不是來自白葡萄的,白葡萄酒的單寧主要由白葡萄里的氨基酸、總酚、黃酮酸決定,白葡萄酒的總酚主要來自于白葡萄,白葡萄酒里的酒總黃銅與白葡萄的蛋白質(zhì)、黃酮酸相關(guān),白葡萄酒得色澤主要由白葡萄里的總糖、蘋果酸決定。
本文建立了多元線性回歸模型,詳細(xì)研究了葡萄酒的評(píng)價(jià)、釀酒葡萄的分解以及葡萄酒與釀酒葡萄直接的聯(lián)系與影響。該模型可以推廣到食品產(chǎn)業(yè)對(duì)食品質(zhì)量檢測分析中,為提高食品生產(chǎn)質(zhì)量和食品質(zhì)量檢測精度提供了很好的方案。
參考文獻(xiàn):
[1] 王松桂.概率論與數(shù)理統(tǒng)計(jì)[M].北京:科學(xué)出版社,2011.
[2] 鄧薇.MTLAB函數(shù)速查手冊(cè)[M].北京:人民郵電出版社,2012.
[3] 謝輝.統(tǒng)計(jì)方法在葡萄理化指標(biāo)簡化中的應(yīng)用[J].新疆農(nóng)業(yè)科學(xué),2011,12(14):25-36.
[4] 聶繼云.白梨品質(zhì)評(píng)價(jià)指標(biāo)的聚類分析[J].中國果樹,2000,2(25):68-69.
[5] 張英莉.新疆天山北麓地區(qū)赤霞珠干紅葡萄酒香氣成分的分析[J].中外葡萄與葡萄酒,2011,24(14):225-227.
[6] 張鳳菊.數(shù)據(jù)差異顯著性檢驗(yàn)[J].農(nóng)機(jī)使用與維修,2012,4(5):26-30.
[7] 王金甲.基于物理化學(xué)性質(zhì)的葡萄酒質(zhì)量的可視化評(píng)價(jià)研究[J].燕山大學(xué)學(xué)報(bào),2011,3(4):124-128.
[8] 張路.典型相關(guān)分析應(yīng)用常見分析及處理[J].沈陽體育學(xué)院學(xué)報(bào),2010,30(5):12-18.