趙東霞, 馬 悅, 趙 健
(遼寧師范大學(xué) 化學(xué)化工學(xué)院, 遼寧 大連 116029)
應(yīng)用ABEEMσπ方法估算含有羥基的分子的pKa值
趙東霞, 馬 悅, 趙 健
(遼寧師范大學(xué) 化學(xué)化工學(xué)院, 遼寧 大連 116029)
使用B3LYP/6-311++G(d,p)方法,優(yōu)化獲得含有羥基的訓(xùn)練集分子的穩(wěn)定幾何結(jié)構(gòu),以HF/STO-3G方法所計(jì)算的Mulliken電荷為基準(zhǔn),采用線性回歸和最小二乘法調(diào)試出ABEEMσπ方法計(jì)算電荷所需要的參數(shù)(價(jià)態(tài)電負(fù)性χ*和價(jià)態(tài)硬度η*).探討擬合訓(xùn)練集分子中與羥基相連的C原子和與羥基的H原子的電荷差值與實(shí)驗(yàn)pKa值的線性方程.通過(guò)該線性方程和ABEEMσπ所計(jì)算的電荷,估算出一些含有羥基測(cè)試集分子的pKa值.這些分子包括了12個(gè)含有羥基的有機(jī)小分子;1個(gè)Tyr二肽、6個(gè)Ser二肽;質(zhì)子化和中性的Trp-cage蛋白質(zhì).使用ABEEMσπ方法所估算的pKa值與實(shí)驗(yàn)值很接近.因此,ABEEMσπ方法能快速估算其他含有羥基分子的pKa值.
原子-鍵電負(fù)性均衡原理;電荷;pKa;二肽;Trp-cage蛋白質(zhì)
1.1 原子-鍵電負(fù)性均衡模型(ABEEMσπ)
(1)
根據(jù)電負(fù)性均衡原理,在形成分子時(shí),由于各區(qū)域間的電子轉(zhuǎn)移和重新分布,調(diào)整后的各區(qū)域的有效電負(fù)性相等,并且等于分子電負(fù)性χmol,即
χa=χb=…=χn=χmol.
(2)
各個(gè)區(qū)域電荷的和為分子的電荷,即
qa+qb+…+qn=qmol.
(3)
將式(1)和式(2)以及電荷限制條件式(3)聯(lián)立,就能獲得分子各個(gè)區(qū)域的電荷.
1.2 計(jì)算細(xì)節(jié)
選取的訓(xùn)練集分子為a01~a10分子,測(cè)試集分子包括b01~b11,其中b10有2種不同構(gòu)象含有羥基的12個(gè)有機(jī)小分子、1個(gè)Tyr二肽和6個(gè)Ser二肽以及質(zhì)子化和中性的Trp-cage1蛋白質(zhì).使用Gaussian09[10]程序,用B3LYP/6-311++G(d,p)方法,優(yōu)化獲得訓(xùn)練集和測(cè)試集分子的穩(wěn)定幾何結(jié)構(gòu).使用HF/STO-3G計(jì)算訓(xùn)練集分子的Mulliken電荷,擬合確定ABEEMσπ參數(shù)(包括價(jià)態(tài)電負(fù)性χ*和價(jià)態(tài)硬度η*).使用ABEEMσπ參數(shù)獲得訓(xùn)練集分子的電荷分布.擬合得到訓(xùn)練集分子中與官能團(tuán)相關(guān)的原子電荷與pKa值的線性方程,進(jìn)而估算測(cè)試集分子的pKa值.
2.1 ABEEMσπ方法的參數(shù)
以HF/STO-3G方法所計(jì)算的訓(xùn)練集分子的Mulliken電荷為基準(zhǔn),調(diào)試出ABEEMσπ方法中所涉及新增位點(diǎn)的價(jià)態(tài)電負(fù)性χ*和價(jià)態(tài)硬度2η*參數(shù),列于表1中.
表1 訓(xùn)練集分子中新定義ABEEMσπ參數(shù)(價(jià)態(tài)電負(fù)性χ*和價(jià)態(tài)硬度2η*)
將表1中新定義的ABEEMσπ參數(shù)的標(biāo)號(hào)標(biāo)記在原子的右側(cè),示于圖1中.在ABEEMσπ程序中,
圖1 ABEEMσπ參數(shù)標(biāo)號(hào)示意圖
各個(gè)位點(diǎn)的標(biāo)號(hào)用6位數(shù)來(lái)表示,以106 257為例,標(biāo)號(hào)的第1位是1代表原子區(qū)域;第2和第3位分別代表原子序數(shù),例如06代表碳原子;第4位是2,代表以雙鍵的形式與其他原子相連,即碳原子的周圍有1個(gè)雙鍵;第5位和第6位一起表示新添加的標(biāo)號(hào),即57代表新添加的標(biāo)號(hào).
2.2 ABEEMσπ方法所計(jì)算的電荷
依據(jù)ABEEMσπ方法,使用已有的[5-7]和本文所擬合的ABEEMσπ參數(shù),計(jì)算出訓(xùn)練集分子和測(cè)試集分子的電荷分布.表2列出了ABEEMσπ所計(jì)算的電荷與從頭算電荷的線性方程的斜率k,截距b,線性相關(guān)系數(shù)R.
表2 訓(xùn)練集和測(cè)試集分子的ABEEMσπ與從頭算電荷的線性相關(guān)方程以及相關(guān)系數(shù)
從表2可以看出,b01~b11、1個(gè)Tyr和6個(gè)Ser的ABEEMσπ電荷與從頭算電荷線性方程的斜率在1.000 0左右,截距趨近于0,線性相關(guān)系數(shù)在0.96以上;質(zhì)子化和中性Trp-cage的ABEEMσπ電荷與從頭算電荷線性方程的斜率在1.100 0左右,截距趨近于0,線性相關(guān)系數(shù)在0.94以上.可以看出ABEEMσπ所計(jì)算的電荷與從頭算方法有很好的線性關(guān)系,說(shuō)明本文所擬合的ABEEMσπ參數(shù)是合理和可轉(zhuǎn)移的.
2.3 訓(xùn)練集分子中原子的電荷與pKa線性關(guān)系
表3 ABEEMσπ模型下,訓(xùn)練集分子的C原子和H原子的電荷
2.4 ABEEMσπ方法所估算的測(cè)試集分子pKa值
使用上述的方程和ABEEMσπ所計(jì)算的電荷,檢驗(yàn)了測(cè)試集分子的pKa值.測(cè)試集分子中與羥基相連的碳原子和羥基中氫原子的ABEEMσπ電荷以及pKa的預(yù)測(cè)值和實(shí)驗(yàn)值均列于表4中.
表4 ABEEMσπ模型下,測(cè)試集分子的C和H原子的電荷以及pKa值
從表4中可以看出,對(duì)于b01~b11中的含羥基的有機(jī)小分子,大部分分子的pKa估算值與實(shí)驗(yàn)值的誤差都在1.1以內(nèi),除了b01和b1001.b01的誤差為1.78,b1001的誤差為2.88,其原因是分子的結(jié)構(gòu)不同,所計(jì)算的電荷不同,從而所預(yù)測(cè)的pKa值不同.圖2中的b1001分子和b1002分子是同一種分子的2個(gè)不同構(gòu)象,其中,b1001分子中羥基上的氫原子偏向相鄰甲氧基中的氧原子,形成分子內(nèi)氫鍵,因此,分子中羥基上的H較難解離,所以pKa值較大.而b1002分子中羥基上的氫原子遠(yuǎn)離甲氧基中的氧原子及其孤對(duì)電子,不形成分子內(nèi)氫鍵,所以相比b1001分子而言,b1002分子羥基中的H更容易解離.使用ABEEMσπ電荷得到的pKa的預(yù)測(cè)值也可推算出b1002分子比b1001分子更容易解離,與分析結(jié)果一致.因此pKa值的大小還與羥基上H原子與其他原子的相互作用有關(guān),與氫原子所處的周圍環(huán)境有關(guān).
Tyr二肽的pKa估算值與實(shí)驗(yàn)值的誤差是0.26,二者非常接近.選取的Ser二肽的6個(gè)構(gòu)象中,Ser1二肽和Ser4二肽的pKa預(yù)測(cè)值遠(yuǎn)大于其他構(gòu)象的pKa.雖然沒(méi)有找到6個(gè)構(gòu)象對(duì)應(yīng)的pKa實(shí)驗(yàn)值,但是從結(jié)構(gòu)分析,可以得出Ser1和Ser4的羥基的H原子與分子肽鍵的O原子有氫鍵作用,不易解離出來(lái),pKa值較大.Ser4羥基的H原子與分子肽鍵的O原子的距離為0.197 91nm,其距離最近,氫鍵作用最大,它們間最難解離,pKa值應(yīng)該最大,這與估算結(jié)果相吻合.
圖2 部分測(cè)試集分子的結(jié)構(gòu)
對(duì)于質(zhì)子化的Trp-cage蛋白質(zhì)(含有304個(gè)原子)和中性的Trp-cage1蛋白質(zhì),主要估算了其中3個(gè)含有羥基的氨基酸的pKa值,分別是暴露于溶劑部分的Ser13,被埋藏于蛋白質(zhì)內(nèi)部的Ser14,及暴露于溶劑部分的Tyr3,結(jié)構(gòu)示于圖2中.Matasui等人[19]通過(guò)熱力學(xué)循環(huán)和動(dòng)力學(xué)模擬等方法預(yù)測(cè)出Trp-cage蛋白質(zhì)中Ser13、Ser14、Tyr3殘基的pKa值分別是14.69、20.80和10.10,從而判斷出這3種氨基酸解離能力的大小順序是Tyr3>Ser13>Ser14.從表4可以看出,Trp-cage和Trp-cage1蛋白質(zhì)中Tyr3、Ser13、Ser14的pKa預(yù)測(cè)值和Matasui等人[19]計(jì)算的pKa值很接近.對(duì)于質(zhì)子化的Trp-cage蛋白質(zhì)殘基,二者的pKa預(yù)測(cè)值誤差在1.00以內(nèi);對(duì)于中性的Trp-cage1蛋白質(zhì)殘基,二者的pKa預(yù)測(cè)值誤差在0.59以內(nèi).并且2種情況下氨基酸的pKa預(yù)測(cè)值大小順序均為T(mén)yr3
應(yīng)用ABEEMσπ方法對(duì)含羥基分子的pKa值進(jìn)行了預(yù)測(cè),得到的小分子和二肽分子的pKa預(yù)測(cè)值與實(shí)驗(yàn)值十分接近,蛋白質(zhì)中氨基酸殘基的pKa預(yù)測(cè)值與使用溶劑化能得到的結(jié)果相接近.因此,應(yīng)用ABEEMσπ方法可以快速、準(zhǔn)確的計(jì)算出分子中原子的電荷,進(jìn)而可以很好地估算含有羥基分子的pKa值.
[1] TISHMACK P A,BASHFORD D,HARMS E,et al.Use of 1H NMR spectroscopy and computer simulations to analyze histidine pKachanges in a protein tyrosine phosphatase:experimental and theoretical determination of electrostatic properties in a small protein[J].Biochemistry,1997,36(39):11984-11994.
[2] ALI S T,WKARAMAT S,WKA J,et al.Theoretical prediction of pKavalues of seleninic,selenenic,sulfinic and carboxylic acids by quantum-chemical methods[J].J Phys Chem A,2010,114(47):12470-12478.
[3] SCHüüRMANN G,COSSI M,BARONE V,et al.Prediction of the pKaof carboxylic acids using the ab initio continuum-solvation model PCM-UAHF[J].J Phys Chem A,1998,17(33):6706-6712.
[4] UGUR I,MARION A,PARANT S,et al.Rationalization of the pKavalues of alcohols and thiols using atomic charge descriptors and its application to the prediction of amino acid pKa′s[J].J Chem Inf Model,2014,54(8):2200-2213.
[5] WANG C S,YANG Z Z.Atom-bond electronegativity equalization method.II.Lone-pair electron model[J].J Chem Phys,1999,110(13):6189-6197.
[6] YAO C,YANG Z Z.General atom-bond electronegativity equalization method and its application in prediction of charge distributions in polypeptide[J].Chem Phys Lett,2000,316(3):324-329.
[7] ZHAO D X,LIU C,WANG F F,et al.Development of a polarizable force field using multiple fluctuating charges per atom[J].J Chem Theory Comput,2010,6(3):795-804.
[8] 楊忠志,劉嬌,宮利東,等.并行程序?qū)崿F(xiàn)ABEEMσπ模型電荷分布計(jì)算[J].遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,31(2):177-180.
[9] 宮利東,徐燕.應(yīng)用ABEEMσπ模型研究含氮雜環(huán)化合物的電荷分布[J].遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,31(1):64-66.
[10] FRISCH M J,TRUCKS G W,SCHLEGEL H B,et al.Gaussian 09[CP].Wallingford:Gaussian Inc,2009.
[11] ALBERT A,PHILLIPS J N.Ionization constants of heterocyclic substances.Part Ⅱ.Hydroxy-derivatives of nitrogenous six-membered ring-compounds[J].J Chem Soc,1956:1294-1304.
[12] BOLTON P D,HALL F M,REECE I H.Effects of substituents on the thermodynamic functions of ionisation of meta-substituted phenols[J].J Chem Soc B,1967:709-712.
[13] HAMANN S D,LINTON M.Influence of pressure on the ionization of substituted phenols[J].J Chem Soc Faraday T,1974,70(1):2239-2249.
[14] LIDE D R.CRC handbook of chemistry and physics[M].Boca Raton Florida:CRC Press,2006:87.
[15] KO H C,O′HARA W F,HU T,et al.Ionization of substituted phenols in aqueous solution[J].J Am Chem Soc,1964,86(5):1003-1004.
[16] TAKAHASHI S,COHEN L A,MILLER H K,et al.Calculation of the pKavalues of alcohols from .sigma.constants and from the carbonyl frequencies of their esters[J].J Org Chem,1971,36(9):1205-1209.
[17] V?LGYI G,RUIZ R,BOX K,et al.Potentiometric and spectrophotometric pKadetermination of water-insoluble compounds:validation study in a new cosolvent system[J].Anal Chim Acta,2007,583(2):418-428.
[18] THURLKILL R L,GRIMSLEY G R,SCHOLTZ J M,et al.pKvalues of the ionizable groups of proteins[J].Protein Sci,2006,15(5):1214-1218.
[19] MATASUI T,BABA T,WKAMIYA K,et al.An accurate density functional theory based estimation of pKavalues of polar residues combined with experimental data:from amino acids to minimal proteins[J].Phys Chem Chem Phys,2012,14(12):4181-4187.
Estimation of pKavalues of hydroxyl molecules by using ABEEMσπmethod
ZHAODongxia,MaYue,ZHAOJian
(School of Chemistry and Chemical Engineering, Liaoning Normal University, Dalian 116029, China)
The B3LYP/6-311++G(d,p) method is used to optimize a training set of small molecules with an OH group and to obtain their geometry structures.ABEEMσπparameters including the valence-state electronegativityχ*and the valence-state hardnessη*have been determined through a linear regression and least-square optimization procedure to reproduce HF/STO-3G Mulliken charge distribution for the molecules mentioned above.We have obtained the linear equation of the difference between C connected with OH group atomic charges and H atom with experimental pKa.ThepKavaluesoftestsetmoleculeswithOHgroupareestimatedbythislinearequation.ThesemoleculesincludetwelveorganicsmallmoleculeswithanOHgroup,oneTyrdipeptide,sixSerdipeptides,protonatedandneutralTrp-cageproteins.ThepKavaluesestimatedbyABEEMσπmethod are close to the experimental pKavalues.Thus,ABEEMσπmethod can be used to fast estimate pKavaluesoftheothermoleculescontainingOHgroup.
ABEEMσπ;charge;pKa;dipeptide;Trp-cage protein
2016-05-08 基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(21133005;21473083) 作者簡(jiǎn)介:趙東霞(1971-),女,河南長(zhǎng)垣人,遼寧師范大學(xué)教授,博士,博士生導(dǎo)師.
1000-1735(2017)01-0052-06
10.11679/lsxblk2017010052
O641.121
A