何 琴, 黃保軍,程靜茹,王淑敏
(1.許昌學(xué)院化學(xué)化工學(xué)院,河南許昌 461000;2.河南省微納米能量儲(chǔ)存與轉(zhuǎn)換材料重點(diǎn)實(shí)驗(yàn)室,許昌學(xué)院表面微納米材料研究所,河南許昌 461000)
物質(zhì)定量構(gòu)效關(guān)系(Quantitative Structure-activity Relationship,QSAR)已經(jīng)成為化學(xué)、環(huán)境、生命、食品等學(xué)科研究中的一個(gè)前沿領(lǐng)域[1 - 3]。定量結(jié)構(gòu)色譜保留相關(guān)(Quantitative Structure Retention Relationship,QSRR)作為QSAR的一個(gè)重要分支,成為色譜領(lǐng)域中的有用技術(shù),用于解釋和預(yù)測各種物質(zhì)的色譜保留行為,在色譜科學(xué)領(lǐng)域越來越多地受到關(guān)注[4 - 6]。目前,QSRR方法在酒類香氣成分的分析中受到重視[7 - 9]。眾所周知,香氣成分大多以色譜-質(zhì)譜技術(shù)檢測,比較繁瑣[10,11]。QSRR法可以為預(yù)測香氣成分的保留行為提供一定的便利[12,13],在酒類香氣成分的分析、監(jiān)測、體系評(píng)價(jià)及預(yù)報(bào)方面具有巨大的優(yōu)勢,能夠解決酒類中傳統(tǒng)的化學(xué)研究方法難以解決的問題。因此,QSRR技術(shù)對(duì)于建立酒類香氣中化合物分子結(jié)構(gòu)與色譜保留之間的變化規(guī)律具有重要的意義。
本文以黑莓果酒香氣成分的分子連結(jié)性指數(shù)和電拓?fù)鋮?shù)作為神經(jīng)網(wǎng)絡(luò)輸入,色譜保留時(shí)間作為神經(jīng)網(wǎng)絡(luò)輸出,采用誤差反傳前向人工神經(jīng)網(wǎng)絡(luò)(BP-ANN)模型研究36種黑莓果酒香氣成分的結(jié)構(gòu)與保留時(shí)間的定量關(guān)系。同時(shí),采用內(nèi)外雙重檢驗(yàn)的辦法分析和檢驗(yàn)所得模型的穩(wěn)定性,以期為有關(guān)果酒香氣成分的研究奠定一定的基礎(chǔ)。
黑莓果酒香氣氣相色譜保留值實(shí)驗(yàn)數(shù)據(jù)來源于文獻(xiàn)報(bào)道[14],為了獲得QSRR模型,化合物必需使用精確的分子描述符來表征化合物的結(jié)構(gòu)信息[15,16]。本文使用兩種類型的結(jié)構(gòu)參數(shù)描述化合物:分子連接性指數(shù)和電性拓?fù)渲笖?shù)。
采用BP-ANN方法[4,17]建模,并與多元線性回歸(Multiple Linear Regressions,MLR)方法[4,18]進(jìn)行比較。
采用留一交叉檢驗(yàn)法(Leave-one-out Cross-validation,LOO-CV)和外部檢驗(yàn)相結(jié)合的方法對(duì)構(gòu)建的模型進(jìn)行檢驗(yàn)[19]。
BP-ANN模型的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為8×3×1,目標(biāo)函數(shù)為1e-4,學(xué)習(xí)速度為0.1,訓(xùn)練步長為10 000。在最優(yōu)條件下建立預(yù)測模型,經(jīng)檢驗(yàn)有較好的預(yù)測能力。
在最優(yōu)條件下用BP-ANN模型預(yù)測,預(yù)測值(Pre)、預(yù)測值與實(shí)驗(yàn)值(Exp)之間的殘差值(Res)如表1所示,其殘差分布圖見圖1,并將其與MLR法進(jìn)行了比較。由表1和圖1可見,BP-ANN模型預(yù)測值與實(shí)驗(yàn)值更加接近,殘差分布在-0.47~0.34之間,且大多接近于零;而MLR法的殘差分布在-4.32~2.23之間,分布更加零散,且絕對(duì)值較大。比較可知BP-ANN的預(yù)測值與實(shí)驗(yàn)值之間的殘差更小,說明BP-ANN模型預(yù)測保留時(shí)間更為準(zhǔn)確,擬合能力比MLR法更好。
表1 基于BP-ANN和MLR法的預(yù)測結(jié)果
采用留一交叉檢驗(yàn)和外部檢驗(yàn)檢驗(yàn)?zāi)P头€(wěn)健性和外部預(yù)測能力。兩種模型的相關(guān)分析如表2、圖2、圖3所示。BP-ANN模型線性相關(guān)系數(shù)R為0.9993,MLR模型相關(guān)系數(shù)R為0.9904,兩種模型相當(dāng)。基于BP-ANN模型的訓(xùn)練集留一交叉檢驗(yàn)相關(guān)系數(shù)RCV為0.9949,而基于MLR法的訓(xùn)練集留一交叉檢驗(yàn)相關(guān)系數(shù)RCV為0.9905,這說明兩種模型自相容能力相當(dāng)、穩(wěn)健性相當(dāng)。而基于BP-ANN模型的外部檢驗(yàn)相關(guān)系數(shù)Rext為0.9833、基于MLR法的外部檢驗(yàn)相關(guān)系數(shù)Rext為0.8937,說明BP-ANN法的泛化能力優(yōu)于MLR法。
表2 BP網(wǎng)絡(luò)模型和MLR模型的效果分析
采用BP-ANN對(duì)黑莓果酒香氣成分進(jìn)行了QSRR研究,BP-ANN模型預(yù)測值與實(shí)驗(yàn)值更加接近,殘差分布在-0.47~0.34之間,且大多接近于零;而MLR法的殘差分布在-4.32~2.23之間,分布更加零散,且絕對(duì)值較大。BP-ANN避免了傳統(tǒng)算法誤差偏大和計(jì)算繁瑣的弊端,模型具有自組織、自適應(yīng)和自學(xué)習(xí)能力,可很好地解決非線性預(yù)測問題,提高了預(yù)測的準(zhǔn)確性。而通過留一交叉檢驗(yàn)和外部檢驗(yàn)檢驗(yàn)了模型穩(wěn)健性和外部預(yù)測能力,兩種方法構(gòu)建的模型穩(wěn)健性相當(dāng),但是BP-ANN的外部預(yù)測能力更強(qiáng)。