于紅斌,齊 娜,趙永進
(河南師范大學計算機與信息工程學院,河南 新鄉(xiāng) 453007)
葡萄酒是由新鮮葡萄或葡萄汁經(jīng)過酒精發(fā)酵而得到的一種飲料。其質(zhì)量的優(yōu)劣主要通過感官品嘗和對一系列理化指標的分析來確定。好品質(zhì)的葡萄酒必定外觀澄清透明、色澤自然悅目,具備葡萄的果香、發(fā)酵的酒香、陳釀的醇香,口感令人舒暢愉悅、各種香味細膩柔和,有層次感,余味綿長。這些品質(zhì)的鑒定主要依賴于品酒師的專業(yè)水平,而品酒師的感官又是很難用理化數(shù)據(jù)精確闡明的,葡萄酒品質(zhì)受品酒師的主觀影響難免產(chǎn)生誤差。另外葡萄酒最終的質(zhì)量和葡萄酒中各種成分密切相關,通過對葡萄酒各種成分理化數(shù)據(jù)的研究分析,加以人工品酒師的專業(yè)評判,必定可以相輔相成。
針對葡萄酒的理化數(shù)據(jù),可以采用近紅外光譜[7]和三維熒光光譜[1]等技術,然而這些技術需要復雜的化學計量學知識,解釋困難[1,7]。文獻[2]研究了葡萄酒各種成分之間的關系,但并沒有給出其與葡萄酒質(zhì)量之間的明確關系。文獻[3]結(jié)合多圖分析、支持向量機和神經(jīng)網(wǎng)絡多種方法提出了圖表示可視化分類方法,該方法依賴于其他多種方法,其在誤差和算法時間上并沒有明顯優(yōu)勢。
在UCI數(shù)據(jù)庫[4]中提供的葡萄酒數(shù)據(jù)有178組,葡萄酒分為3個等級,受13種成分的影響。數(shù)據(jù)分析上通??刹捎蒙窠?jīng)網(wǎng)絡、支持向量機和回歸分析等進行建模[5]。但葡萄酒的各成分不是孤立因素,這些成分相互作用,共同決定葡萄酒的最終質(zhì)量,因此可以首先對數(shù)據(jù)進行關聯(lián)分析,將處理后的數(shù)據(jù)應用于神經(jīng)網(wǎng)絡,提出了灰關聯(lián)分組神經(jīng)網(wǎng)絡模型,實驗表明,與經(jīng)典神經(jīng)網(wǎng)絡相比,算法精確度和算法效率都有了較大提高,同時還避免了經(jīng)典神經(jīng)網(wǎng)絡訓練過程中出現(xiàn)的不穩(wěn)定情況。
通過將灰關聯(lián)理論與神經(jīng)網(wǎng)絡相結(jié)合,對葡萄酒質(zhì)量進行分析。算法結(jié)構(gòu)如圖1所示。
圖1 灰關聯(lián)神經(jīng)網(wǎng)絡
算法首先將數(shù)據(jù)按灰關聯(lián)度分析,充分體現(xiàn)出數(shù)據(jù)之間的相互影響,然后根據(jù)具體的數(shù)據(jù)環(huán)境通過人為干預加強或弱化某些因子,從而使得結(jié)果更合理。
灰關聯(lián)分析是分析研究各因素之間關聯(lián)程度的一種有效方法,可分為單因子和多因子兩種情況。葡萄酒包含多種成分,可以通過灰關聯(lián)分析確定各個因子(葡萄酒成分)的關聯(lián)程度。
假設數(shù)據(jù)因子集為 X={xi|i=1,2,...,l},如果各個因子數(shù)列滿足下列條件,則稱X為灰關聯(lián)因子集:
(1)數(shù)列xi的數(shù)據(jù)xi(k)之間具有數(shù)值可比性,即指定的xi(k)與xi(t)之間的數(shù)值是可以比較的,或相等、或接近、或同數(shù)量級等;
(2)數(shù)列xi之間具有可接近性,即非平等性;
(3)數(shù)列xi之間同級性,及同為正(極大值)極性,或負(極小值)極性,或適中極性。
以灰關聯(lián)因子集中的一個因子xi(1≤i≤l)為參考數(shù)列,以任意因子xj∈X且xj≠xi為比較數(shù)列,則二者間的絕對差為:
得到的差數(shù)列為 Δij=(Δij(1),Δij(2),...,Δij(n)),則比較數(shù)列xj對參考數(shù)列xi在第k點的灰關聯(lián)為:
其中常數(shù)α為分辨率系數(shù),于是有xj對xi的灰關聯(lián)度為:
鑒于數(shù)據(jù)庫中提供的數(shù)據(jù)相對比較平穩(wěn),因此可以取 α 為 0.5[7]。
一般來說,因子集中各因子都不是孤立的,它們共同作用形成必然結(jié)果。以葡萄酒數(shù)據(jù)為例,葡萄酒的最終等級由13個主要成分決定,這些成分決定了葡萄酒的口感、香氣、色澤等,如葡萄酒中的總酚、檸檬酸、酒精度等對感官質(zhì)量有顯著影響[3],在葡萄酒的等級確定中占有重要位置。同時,各成分之間也會相互影響與制約,因此,需要分析成分之間的關聯(lián)性。要分析兩個或兩個以上變量之間的因果關系,通常會采用一些相關性分析方法,它不需要區(qū)分自變量和因變量,兩個或者多個變量之間是平等的關系,通過相關分析可以了解變量之間的關系密切程度。
在葡萄酒的感官質(zhì)量上,Total phenols(總酚)作用尤其突出[3]。因此,可以將Total phenols做為灰關聯(lián)因子集中的參考數(shù)列,找出和Total phenols密切相關的成分形成第一主成分集合,通過公式(1-3)分析文獻[4]中的數(shù)據(jù)得出與Total phenols關聯(lián)密切的成分,如表1所示。
表1 其他成分與Total phenols的灰關聯(lián)度
由表1得出第一主成分集合,由Total phenols和表1中前4種成分構(gòu)成。原數(shù)據(jù)集合剔除第一主成分后集合,剩下的成分中以Malic acid(蘋果酸)對葡萄酒的感官影響較大[2],同樣通過公式(1-3)得出與其關聯(lián)度較大的幾個成分形成第二主成分集合,如表2所示。
由表2分析,形成葡萄酒的第二主成分集合,即由Malic acid和表2中前3種構(gòu)成。原數(shù)據(jù)中不包含第一、二主成分集合的形成第三主成分集合,它們對葡萄酒的總體影響最小。
葡萄酒的質(zhì)量由各成分決定,通過數(shù)據(jù)分析,可以將葡萄酒的成分分成3類,每一類在葡萄酒的最終質(zhì)量中所占比例分別為ω1、ω2、ω3,則葡萄酒最終質(zhì)量可以由以下公式確定:
表2 其他成分與Malic acid的灰關聯(lián)度
式中,C1為第i種主成分集合中的各成分,且ω1+ω2+ω3=1,Q 為葡萄酒質(zhì)量,文獻[5]給定Q=1,2,3,式(4)中加號僅表示各成分的一種合成。
(1)將文獻[5]中數(shù)據(jù)進行歸一化處理,以消除量綱之間的影響。
(2)歸一化后數(shù)據(jù)按每種成分所屬主成分集合進行比例協(xié)調(diào),即將歸一化后數(shù)據(jù)乘以其所占比例。設定葡萄酒三類主成分在最終質(zhì)量中的所占比例為ω1=0.5、ω2=0.3、ω3=0.2。
(3)將數(shù)據(jù)引入BP神經(jīng)網(wǎng)絡進行訓練和測試。
構(gòu)建的BP神經(jīng)網(wǎng)絡采用4層架構(gòu),輸入層為數(shù)據(jù)處理后的13種成分,隱層兩層,各有4個隱單元,輸出層1個單元,為葡萄酒質(zhì)量等級(數(shù)據(jù)需歸一化)。網(wǎng)絡誤差設為0.001。在MATLAB下執(zhí)行該算法10次,將數(shù)據(jù)[4]中2/3數(shù)據(jù)進行訓練,1/3數(shù)據(jù)進行仿真測試。表3給出了文中方法與經(jīng)典神經(jīng)網(wǎng)絡,即直接使用歸一化數(shù)據(jù)而沒有進行成分關聯(lián)分析的神經(jīng)網(wǎng)絡的對比結(jié)果。
表3 灰關聯(lián)神經(jīng)網(wǎng)絡和經(jīng)典神經(jīng)網(wǎng)絡數(shù)據(jù)對比
從上表可以看出,文中提出的灰關聯(lián)神經(jīng)網(wǎng)絡性能和經(jīng)典神經(jīng)網(wǎng)絡相比,各方面都有了很大提高,特別是在網(wǎng)絡訓練時間上,避免了經(jīng)典神經(jīng)網(wǎng)絡出現(xiàn)的不穩(wěn)定現(xiàn)象(多次實驗發(fā)現(xiàn),網(wǎng)絡約有10%的不穩(wěn)定性,即會出現(xiàn)需要較長時間訓練達到約定誤差的情況),從而極大地縮短了訓練時間。
通過借鑒灰關聯(lián)分析理論,對葡萄酒的各個成分進行關聯(lián)度分析,將13種成分劃分為3組,每組數(shù)據(jù)根據(jù)實際生活中的感官質(zhì)量加以約定,從而使得數(shù)據(jù)的現(xiàn)實意義更加突出,通過神經(jīng)網(wǎng)絡測試表明,算法對葡萄酒的質(zhì)量等級劃分預測有較好的效果。同時,這種關聯(lián)分析策略也增加了數(shù)據(jù)之間關系的透明度,避免了對數(shù)據(jù)的盲目引用而造成的網(wǎng)絡不穩(wěn)定性。
[1]尹春麗,丁春暉.昌黎原產(chǎn)地干紅葡萄酒的三維熒光光譜特征研究[J].分析測試學報,2008,27(6):641-643.
[2]李運,李記明,姜忠軍.統(tǒng)計分析在葡萄酒質(zhì)量評價中的應用[J].釀酒科技,2009(4):79-82.
[3]王金甲,尹濤,李靜,等.基于物理化學性質(zhì)的葡萄酒質(zhì)量的可視化評價研究[J].燕山大學學報,2012,34(2):133-136.
[4]DONALD BREN SCHOOL OF INFORMATION AND COMPUTER DCIENCES,UNIVERSITY of CALIFORNIA.IRVINE,Center for Machine Learning and Intelligent Systems[DB/OL]:30 -Oct-199512:17[2013 -1 -9]http://archive.ics.uci.edu/ml/machine - learning -databases/wine.
[5]胡瑜,于寶堃,,許國,等.灰色神經(jīng)網(wǎng)絡在城市用水量預測中的應用[J].微電子學與計算機,2012,29(7):142 -145,149.
[6]王文莉,楊俊紅.基于灰色理論的鐵路客運量預測影響因素優(yōu)化[J].微電子學與計算機,2011,28(10):164 -167,172.
[7]于海燕.黃酒品質(zhì)和酒齡的近紅外光譜分析方法研究[D].杭州:浙江大學,2007.