陳 艷,堵錫華
(徐州工程學(xué)院化學(xué)化工學(xué)院,江蘇 徐州 221008)
酸橘果皮油揮發(fā)性成分色譜保留指數(shù)的構(gòu)效關(guān)系
陳 艷,堵錫華
(徐州工程學(xué)院化學(xué)化工學(xué)院,江蘇 徐州 221008)
在分子拓?fù)淅碚摰幕A(chǔ)上,計(jì)算68種酸橘果皮油揮發(fā)性成分化合物的3類拓?fù)渲笖?shù)值:價(jià)分子連接性指數(shù)(Xi)、分子形狀指數(shù)(Km)和電性拓?fù)錉顟B(tài)指數(shù)(En)。通過最佳子集回歸,建立酸橘果皮油揮發(fā)性成分定量結(jié)構(gòu)-色譜保留指數(shù)相關(guān)(QSRR)模型,所建模型的相關(guān)系數(shù)達(dá)到0.977,用該模型估算的平均相對(duì)誤差為3.13%。通過Jackknife法、交互檢驗(yàn)和外部檢驗(yàn)證明該模型具有總體穩(wěn)健性和良好的預(yù)測(cè)能力。結(jié)果表明:多種指數(shù)聯(lián)合能夠較全面地表征分子結(jié)構(gòu)特征,有效揭示影響化合物色譜保留時(shí)間的本質(zhì)因素。
酸橘;揮發(fā)性成分;色譜保留指數(shù);構(gòu)效關(guān)系
酸橘是柚子的變種,其風(fēng)味與柚子、橙子、檸檬、橘子等有很大的差異,果汁有較強(qiáng)的酸味,所以不能直接食用,但其果皮有特有的清爽香氣,可以添加在烤魚、烤肉、火鍋調(diào)料等食品中,能產(chǎn)生誘人的風(fēng)味。因此,研究酸橘果皮油的揮發(fā)性成分,對(duì)食品工業(yè)有很大的應(yīng)用價(jià)值[1-2]。楊榮華[1]用溶劑萃取法提取酸橘果皮的精油,用硅膠柱將果皮油分為碳?xì)浠衔锍煞趾秃趸衔锍煞?,并利用氣相色譜和色譜-質(zhì)譜連用系統(tǒng)分析了酸橘果皮油的揮發(fā)性成分,依據(jù)各成分的保留指數(shù),進(jìn)一步鑒定出68種揮發(fā)性成分,其中包括23種碳?xì)浠衔铩?5種含氧化合物。
分子定量結(jié)構(gòu)-色譜保留(quantitative structure-retention relationship,QSRR)是對(duì)色譜保留值與結(jié)構(gòu)定量關(guān)系進(jìn)行研究[3-5],對(duì)預(yù)測(cè)色譜保留值、選擇分離條件等具有重要意義[6],本研究利用Randic[7]和Kier[8]等提出的價(jià)分子連接性指數(shù)(Xi)、分子形狀指數(shù)(Km)[9]和Hall等[10-11]提出的電性拓?fù)錉顟B(tài)指數(shù)(En)關(guān)聯(lián)酸橘果皮油68種揮發(fā)性成分的保留指數(shù),建立QSRR預(yù)測(cè)模型。
1.1 數(shù)據(jù)的來源
68種酸橘皮油揮發(fā)性成分包括23種碳?xì)浠衔锖?5
種含氧化合物的保留指數(shù)引自文獻(xiàn)[1]。
1.23 種拓?fù)渲笖?shù)的計(jì)算
1.2.1 價(jià)分子連接性指數(shù)(Xi)
價(jià)分子連接性指數(shù)的核心是分子中原子的點(diǎn)價(jià),對(duì)于含有不飽和鍵和雜原子的分子,其點(diǎn)價(jià)為:
式中: Zi、Ziv分別為非氫原子i的總電子數(shù)、價(jià)電子數(shù),hi為與原子i直接鍵合的氫原子數(shù)。在分子隱氫圖的鄰接矩陣基礎(chǔ)上定義分子的價(jià)分子連接性指數(shù)(Xi)。
1.2.2 分子形狀指數(shù)(Km)
Kier定義烷烴分子的形狀指數(shù)為:
式中:m為形狀指數(shù)的階數(shù);nj為分子j中非氫原子數(shù);Pj為分子j中具有路徑(邊的數(shù)目)m的個(gè)數(shù)。
為了擴(kuò)展飽和烴的分子形狀指數(shù)的應(yīng)用范圍,Kier于上述公式中引入修正項(xiàng)j,分子j中原子i的修正值αi定義為:
式中:r為sp3雜化碳原子的原子半徑(r=77nm);ri為非sp3雜化碳原子或其他雜原子的原子半徑。
1.2.3 電性拓?fù)錉顟B(tài)指數(shù)
原子n的電性拓?fù)錉顟B(tài)指數(shù)可用式(6)計(jì)算:
式中:t為具有相同類型原子的個(gè)數(shù);In為分子中每個(gè)非氫原子的固有狀態(tài)值。
式中:Nn為原子n的電子層數(shù);δnv為原子n的Kier點(diǎn)價(jià)。
ΔIn是某原子(n)固有狀態(tài)In值在分子中受其他原子的影響產(chǎn)生的增量:
式中:rnj為原子n與原子j之間相隔的最短路徑數(shù)加1;∑是對(duì)分子中原子n以外的其他原子求和。
1.2.43 類拓?fù)渲笖?shù)的程序化計(jì)算
首先應(yīng)用Chem3D Ultra 9.0軟件分別構(gòu)建68個(gè)酸橘果皮油揮發(fā)性成分的分子結(jié)構(gòu),存為mol文件,然后在Matlab 7.1.0環(huán)境下,調(diào)用上述分子結(jié)構(gòu),應(yīng)用文獻(xiàn)[12-13]的方法編制程序,計(jì)算得到10種價(jià)分子連接性指數(shù),4種分子形狀指數(shù)和7種電性拓?fù)錉顟B(tài)指數(shù)(23種碳?xì)浠衔锖?5種含氧化合物所共有的原子類型),共有21個(gè)描述子。
1.3 定量結(jié)構(gòu)-保留指數(shù)相關(guān)分析方法
將每種化合物的21種描述子作為自變量X,相應(yīng)的色譜保留指數(shù)(RI)為因變量Y構(gòu)建數(shù)據(jù)集,應(yīng)用最佳子集回歸(Leaps-and-Bounds regression )選擇最佳變量組合,建立相應(yīng)QSRR模型。以逐一剔除法(LOO)交互檢驗(yàn)判斷其穩(wěn)定性與預(yù)測(cè)能力,同時(shí)引入Kubinyi函數(shù)(Kubinyi function,F(xiàn)IT)[14-15],其計(jì)算公式:
式中: y為化合物數(shù);b為變量數(shù)。FIT值越大,所建的模型越穩(wěn)定,預(yù)測(cè)能力越高。
2.1QSRR模型的建立
應(yīng)用SPSS 13.0統(tǒng)計(jì)分析軟件,就上述化合物數(shù)據(jù)集進(jìn)行多元統(tǒng)計(jì)分析,經(jīng)最佳變量子集回歸構(gòu)建QSRR模型見表1。對(duì)所得的不同模型進(jìn)行LOO交叉驗(yàn)證,即每次抽取68個(gè)化合物作為樣本,剔除1個(gè)化合物作為被預(yù)測(cè)對(duì)象,再由預(yù)測(cè)值與實(shí)驗(yàn)值進(jìn)行線性回歸,即得交叉驗(yàn)證系數(shù)(Q及Q2)。
表1 RI與Xi、Km及En的最佳變量子集回歸結(jié)果Table 1 Leaps-and-bounds regression between RI and Xi, Kmand En
由表1交叉驗(yàn)證系數(shù)和FIT的遞變規(guī)律,得出最佳六元數(shù)學(xué)模型:
RI = 152.309 + 211.966X1-265.468X5- 17.408K3-66.406E1-25.957E2- 21.557E5(n=68,R=0.977,R2= 0.954,Q2=0.944,Q=0.972,S=48.483,F(xiàn)=209.314) (10)
式中:n、R、R2、Q、Q2、S、F依次為樣本數(shù)、相關(guān)系數(shù)、判定系數(shù)、交叉驗(yàn)證系數(shù)、估計(jì)標(biāo)準(zhǔn)誤差及Fisher 檢驗(yàn)值。
表2 酸橘果皮油揮發(fā)性成分的拓譜指數(shù)和色譜保留指數(shù)Table 2 Retention indexes and topologic indexes of volatile compounds in sudachi peel oil
續(xù)表2
用模型(10)計(jì)算酸橘揮發(fā)性成分的色譜保留指數(shù)(表2),和文獻(xiàn)值基本吻合,平均相對(duì)誤差為3.13%。2.2模型穩(wěn)健性和預(yù)測(cè)能力的再檢驗(yàn)
用Jackknife法[16]對(duì)模型進(jìn)行穩(wěn)健性再檢驗(yàn)。每次從68個(gè)化合物中去掉化合物序數(shù)中個(gè)位分別是0,1,2,3,…,9的分子,剩余化合物為建模組,根據(jù)模型(10)的形式進(jìn)行回歸,重復(fù)10次,所得Jackknife的R值分別為0.976、0.980、0.976、0.975、0.976、0.977、0.975、0.978、0.977、0.978。其中R值最大為0.980最小值為0.975,相關(guān)系數(shù)均波動(dòng)不大,呈良好的正態(tài)分布,平均值為0.977,和模型(10)的相關(guān)系數(shù)一致,說明回歸模型具有可接受的總體穩(wěn)健性。
圖1 酸橘果皮油揮發(fā)組分色譜保留指數(shù)的計(jì)算值和文獻(xiàn)值相關(guān)圖Fig.1 Plot of calculated against previously reported values of retentionindexes volatile compounds in sudachi peel oil
一個(gè)好的QSRR模型除了具有良好的穩(wěn)健性以外,還必須具有對(duì)外部樣本的良好預(yù)測(cè)能力。為此,將68個(gè)化合物分為訓(xùn)練集和檢驗(yàn)集,以訓(xùn)練集建立模型,然后預(yù)測(cè)檢驗(yàn)集樣本。隨機(jī)抽取50個(gè)化合物作為訓(xùn)練集樣本,余下的18個(gè)化合物(表2中用*號(hào)標(biāo)記)作為外部檢驗(yàn)集樣本。對(duì)訓(xùn)練集進(jìn)行不同變量數(shù)的最佳變量選擇,結(jié)果表明,選擇的最佳變量子集與應(yīng)用全部68個(gè)化合物所得結(jié)果相同,即仍是X1、X5、E1、E2、E5、K3的組合,這說明50個(gè)訓(xùn)練集與68個(gè)化合物的整體數(shù)據(jù)集具有相同的QSRR規(guī)律,訓(xùn)練集模型的有關(guān)統(tǒng)計(jì)參數(shù)和整體數(shù)據(jù)所建的模型沒有顯著差異,用訓(xùn)練集所建最佳QSRR模型預(yù)測(cè)檢驗(yàn)集的色譜保留指數(shù)與文獻(xiàn)值基本吻合,平均相對(duì)誤差為3.10%。圖1是訓(xùn)練集和檢驗(yàn)集計(jì)算值和文獻(xiàn)值的相關(guān)圖。
2.3 酸橘果皮油揮發(fā)性成分色譜保留指數(shù)的本質(zhì)因素
化合物在色譜柱上的保留行為與化合物同固定相之間的相互作用有關(guān)。固定相一定時(shí),這種相互作用的大小直接與化合物的拓?fù)?、幾何和電性特征相關(guān)[17]。
進(jìn)入模型(10)的6個(gè)拓?fù)渲笖?shù)分3種:價(jià)分子連接性指數(shù)、分子形狀指數(shù)和電性拓?fù)錉顟B(tài)指數(shù)。這3種描述符恰恰反映了化合物分子的拓?fù)洹缀魏碗娦蕴卣?,所?種指數(shù)的聯(lián)合用于酸橘果皮油色譜保留指數(shù)擬合,能夠全面揭示影響保留指數(shù)的主要因素,所建模型獲得令人滿意的估算與預(yù)測(cè)結(jié)果。
本研究用3類拓?fù)渲笖?shù)對(duì)68個(gè)酸橘果皮油揮發(fā)性成分色譜保留指數(shù)進(jìn)行相關(guān)研究,通過最佳子集回歸建立了六元QSRR模型,所建模型不僅具有較高的相關(guān)系數(shù),而且通過Jackknife法檢驗(yàn),LOO交互檢驗(yàn)和外部檢驗(yàn)證明具有良好的穩(wěn)健性和預(yù)測(cè)能力,用該模型成功地預(yù)測(cè)了酸橘果皮油揮發(fā)性成分的保留指數(shù),為探索化合物的分離條件提供基礎(chǔ)數(shù)據(jù)。該研究表明多類拓?fù)渲笖?shù)聯(lián)合建立的數(shù)學(xué)模型能夠更為全面地揭示影響化合物某種性能的結(jié)構(gòu)因素,所以獲得較為理想的研究結(jié)果,對(duì)其他天然產(chǎn)物中揮發(fā)性組分的QSRR研究起到一定的指導(dǎo)作用。
[1]楊榮華. 酸桔果皮油揮發(fā)性成分的研究[J]. 食品科學(xué), 2001, 22(3): 71-73.
[2]楊榮華. 酸桔果皮油的特征香氣成分[J]. 無錫輕工大學(xué)學(xué)報(bào), 2000, 19(5): 475-478.
[3]陳艷, 馮長(zhǎng)君. 部分有機(jī)污染物氣相色譜保留指數(shù)的QSRR研究[J].計(jì)算機(jī)與應(yīng)用化學(xué), 2007, 24(10): 1404-1408.
[4]陳艷. 單硫醚氣相色譜保留指數(shù)的分子拓?fù)溲芯縖J]. 武漢理工大學(xué)學(xué)報(bào), 2007, 29(3): 82-85.
[5]陳艷, 馮長(zhǎng)君, 岳瑋. 脂肪醇生物活性和理化性質(zhì)的QSAR/QSPR[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào), 2009, 41(12): 209-212.
[6]楊學(xué)謹(jǐn), 李延?xùn)|, 王善偉, 等. 二茂鐵衍生物疏水參數(shù)的測(cè)定及其保留值與結(jié)構(gòu)定量關(guān)系的研究[J]. 色譜, 1996, 14(2): 86-90.
[7]RANDIC M. On characterization of molecular branching[J]. J Amer Chem Soc, 1975, 97(23): 6609-6615.
[8]KIER L B, HALL L H. Molecular connectivity in structure-activity analysis[M]. England: Research Studies Press, 1986.
[9]許祿, 胡昌玉. 應(yīng)用化學(xué)圖論[M]. 北京: 科學(xué)出版社, 2000: 149-162.
[10]HALL L H, KIER L B, BROWN B B. Molecular simmilarity based on novel atom-type electrotopological state indices[J]. J Chem Inf Comput Sci, 1995, 35(6): 1074-1080.
[11]HALL L H , KIER L B. Electrotopological state indices for atom types: a novel combination of electronic, topological, and valencestate information [J]. J Chem Inf Comput Sci, 1995, 35(6): 1039-1045.
[12]胡黔楠, 梁逸曾, 王亞麗, 等. 直觀隊(duì)列命名法的基本原理及其在矩陣與拓?fù)渲笖?shù)計(jì)算中的應(yīng)用[J]. 計(jì)算機(jī)與應(yīng)用化學(xué), 2003, 20(4): 386-390.
[13]張婷, 梁逸曾, 趙晨曦, 等. 基于分子結(jié)構(gòu)預(yù)測(cè)氣相色譜程序升溫保留指數(shù)[J]. 分析化學(xué), 2006, 34(11): 1607-1610.
[14]SAIZ-URRA L, GONZAEZ M P, TEIJEIRA M. 2D-autocorrelation descriptors for predicting cytotoxicity of naphthoquinone ester derivatives against oral human epidermoid carcinoma[J]. Bioorganic and Medicinal Chemistry, 2007, 15: 3565-3571.
[15]SAIZ-URRA L, GONZAEZ M P, TEIJEIRA M. QSAR studies about cytotoxicity of benzophenazines with dual inhibition toward both topoisomerases Ⅰ and Ⅱ: 3D-MoRSE descriptors and statistical considerations about variable selection[J]. Bioorganic and Medicinal Chemistry, 2006, 14: 7347-7358.
[16]DIETRICH W S, DREYER N D, HANSCH C. Confidence intervalestimators for parameters associated with quantitative structure/ activity relationship[J]. J Med Chem, 1980, 23: 1201-1205.
[17]林志華, 劉樹深, 李志良. 多氯代二苯并呋喃在不同色譜柱上的氣相色譜保留行為: 定量結(jié)構(gòu)-色譜保留關(guān)系(QSRR)的研究[J]. 色譜, 2001, 19(2): 116-123.
Quantitative Structure-Chromatographic Retention Time Relationship Analysis of Volatile Compounds in Sudachi Peel Oil
CHEN Yan,DU Xi-hua
(School of Chemistry and Chemical Engineering, Xuzhou Institute of Technology, Xuzhou 221008, China)
Based on the chemical topological theory, Kier , s molecular connectivity indexes (Xi ), molecular shape indexes (Km) and Hall’s electrotopological state indexes (En) of 68 volatile compounds found in sudachi peel oil were calculated. A model corresponding to the quantitative structure-retention index (RI) relationship (QSRR) of these volatile compounds was deduced by leaps-and-bounds regression, with a correlation coefficient (R) of 0.977. An average relative error of 3.13% for estimation with the model was observed. This model exhibited excellent stability and predictability evaluated by Jackknife method, leave-one-out (LOO) cross-validation and external validation procedure. The regression results indicate that the multi-kinds of topolagical index can characterize molecular structure and demonstrate the essential affecting factors of compound retention index.
sudachi;volatile components;retention index;quantitative structure-retention relationship (QSRR)
S666
A
1002-6630(2010)18-0312-05
2010-06-29
江蘇省自然科學(xué)基金項(xiàng)目(09KJD150012);徐州市科技計(jì)劃研究項(xiàng)目(XM08C015)
陳艷(1968—),女,教授,碩士,主要從事污染物、藥物和食品構(gòu)效關(guān)系研究。E-mail:chenyan681110@126.com