李媛媚, 周彥伊, 王 志, 開振鵬
有機(jī)氟化合物急性毒性全息定量構(gòu)效關(guān)系
李媛媚,周彥伊,王志,開振鵬
(上海應(yīng)用技術(shù)學(xué)院化學(xué)與環(huán)境工程學(xué)院,上海201418)
運(yùn)用分子全息定量構(gòu)效關(guān)系(HQSAR)方法研究有機(jī)氟化合物對(duì)大鼠和小鼠的急性毒性.選擇對(duì)小鼠毒性為研究對(duì)象,碎片長(zhǎng)度為4~7,碎片區(qū)分參數(shù)為原子類型、化學(xué)鍵類型、氫原子、氫鍵給體和受體時(shí),得到最佳模型(r2=0.978,q2=0.821).選擇對(duì)大鼠毒性為研究對(duì)象,碎片長(zhǎng)度為4~7,碎片區(qū)分參數(shù)為原子類型、連接性、氫原子和手性時(shí),得到最佳模型(r2=0.908,q2=0.605).研究結(jié)果表明,所建模型具有良好的擬合效果和較高的預(yù)測(cè)能力.
有機(jī)氟化合物;全息定量構(gòu)效關(guān)系;毒性預(yù)測(cè)
有機(jī)氟化合物由于其獨(dú)特的性質(zhì),已深入到生命科學(xué)、醫(yī)藥科學(xué)、材料科學(xué)等諸多學(xué)科,并在工業(yè)、醫(yī)學(xué)、航空航天以及國(guó)防等眾多領(lǐng)域得到廣泛應(yīng)用[1].隨著對(duì)有機(jī)氟化合物研究的深入,其毒性也越來越受到人們關(guān)注.由于有機(jī)氟化合物具有高能量C—F共價(jià)鍵,難以水解、光解、被微生物降解或被動(dòng)物體代謝,因此,其在環(huán)境中具有持久存在的特點(diǎn),并可通過食物鏈蓄積[2].
化合物毒性實(shí)驗(yàn)周期長(zhǎng)、費(fèi)用大,且很難得到準(zhǔn)確可靠的結(jié)果,無法通過實(shí)驗(yàn)方法得到所有化合物存在的風(fēng)險(xiǎn).目前,國(guó)內(nèi)學(xué)者和專家在有機(jī)化合物毒性評(píng)估方面越來越多地使用定量構(gòu)效關(guān)系(Quantitative Structure-activity Relationship,QSAR)方法[3-7].1996年,陳曦等[8]研究過計(jì)算機(jī)技術(shù)在有機(jī)氟農(nóng)藥構(gòu)效關(guān)系中的應(yīng)用;2003年,Martin等[9]對(duì)全氟酸在虹鱒魚組織的生物富集分布進(jìn)行了探討;2009年,李秀菊[10]也對(duì)氟苯衍生物做了QSAR和定量構(gòu)性關(guān)系(Quantitative Structure-property Relationship,QSPR)的研究,討論了氟苯衍生物對(duì)環(huán)境的影響和對(duì)人體健康的危害.全息定量構(gòu)效關(guān)系(Hologram Quantitative Structure-activity Relationship,HQSAR)[11]是一種新型的QSAR方法. 在HQSAR研究中,小分子的結(jié)構(gòu)被碎分為各種潛在的分子碎片,這些分子碎片的種類和數(shù)量信息經(jīng)過編碼,成為分子的指紋信息(全息),并作為HQSAR的描述符進(jìn)行統(tǒng)計(jì)分析.采用不同顏色對(duì)分子的各原子進(jìn)行編碼,以反映各原子對(duì)生物活性的貢獻(xiàn)大小,從而可以快速指導(dǎo)新配體的合成,這是HQSAR最大的優(yōu)點(diǎn)[12-14].本文利用HQSAR方法建立了有機(jī)氟化合物結(jié)構(gòu)與對(duì)大鼠和小鼠的急性毒性的定量構(gòu)效關(guān)系,為有機(jī)氟化合物毒性預(yù)測(cè)提供了新的QSAR模型.
1.1數(shù)據(jù)的收集
所有有機(jī)氟化合物的結(jié)構(gòu)和毒性數(shù)據(jù)均通過查找化合物毒性數(shù)據(jù)庫[http://chem.sis.nlm.nih. gov/chemidplus/]和文獻(xiàn)[15]得到,見表1、2.
表1 有機(jī)氟化合物對(duì)小鼠毒性的pIC50實(shí)驗(yàn)值和預(yù)測(cè)值Tab.1 Organic fluorine compounds pIC50experimental and predictive value of toxicityin mice
續(xù)表1(Continuing table 1)
續(xù)表1(Continuing table 1)
表2 有機(jī)氟化物對(duì)大鼠毒性的p IC50實(shí)驗(yàn)值和預(yù)測(cè)值Tab.2 Organic fluorine compounds p IC50experimental and predictive value of toxicity in rat
續(xù)表2(Continuing table 2)
續(xù)表2(Continuing table 2)
1.2數(shù)據(jù)結(jié)構(gòu)的搭建和幾何優(yōu)化
所有化合物分子結(jié)構(gòu)均用Sybyl X2.1軟件構(gòu)建,通過Minimize模塊優(yōu)化.采用Powell能量梯度法,選取Tripos力場(chǎng),加Gasteiger-Huckel電荷,收斂梯度設(shè)為0.21 kJ·(mol·nm)-1,迭代10 000次,得到化合物分子的最低能量構(gòu)象.
1.3有機(jī)氟化合物HQSAR模型的建立與優(yōu)化
HQSAR計(jì)算及偏最小二乘回歸分析(PLS)均采用Tripos公司的Sybyl X2.1分子軟件包完成.
在研究小鼠的模型中,本文在63種多氟化合物中隨機(jī)選擇了7種化合物作為測(cè)試集;而在研究大鼠的模型中,在54中多氟化合物中隨機(jī)選擇了7種化合物作為測(cè)試集,并且測(cè)試集的結(jié)構(gòu)和活性差異性與訓(xùn)練集相當(dāng);默認(rèn)的分子全息長(zhǎng)度(HL)分別為53、59、61、71、83、97、151、199、257、307、353、401,通過對(duì)碎片區(qū)分參數(shù)和碎片大小的改變來優(yōu)化.碎片區(qū)分參數(shù)是表示分子全息中所映射的拓?fù)浣Y(jié)構(gòu)參數(shù),分為原子類型(A),化學(xué)鍵類型(B),連接性(C),氫原子(HA),手性(Ch),氫鍵給體和受體(DA).其中,原子類型用來區(qū)分原子的種類;區(qū)分原子間所形成的的化學(xué)鍵差異則利用化學(xué)鍵類型;連接性可以區(qū)分碎片內(nèi)部原子雜化狀態(tài);手性可以顯示碎片中的原子手性以及化學(xué)鍵的立體化學(xué)信息;氫鍵給體和受體用來顯示碎片的氫鍵給體或受體情況.建立不同的碎片參數(shù)組合,選取不同碎片長(zhǎng)度(2~5、3~6、4~7、5~8、6~9、7~10),構(gòu)建HQSAR模型.
2.1小鼠HQSAR模型結(jié)果分析
2.1.1全息長(zhǎng)度的確定
系統(tǒng)給出的可選全息長(zhǎng)度為53~401范圍內(nèi)預(yù)定的12個(gè)素?cái)?shù):53、59、61、71、83、97、151、199、257、307、353、401,本文將12個(gè)全息長(zhǎng)度全部選定進(jìn)行計(jì)算.
2.1.2分子碎片參數(shù)的組合
本文嘗試了在默認(rèn)長(zhǎng)度(4~7)時(shí),有31種碎片區(qū)分參數(shù)的組合方式,結(jié)果見表3,最好的結(jié)果是A/B/HA/DA組合,選為小鼠HQSAR模型建立的參數(shù)組合.
Tab.3 表H3Q SA小R鼠 a碎nal片ysi類s 型of的 fraHgQmSeA ntR ty分pe析 in mice
2.1.3分子碎片長(zhǎng)度的確定
分子碎片長(zhǎng)度表示全息指紋中所含碎片的原子個(gè)數(shù),代表不同的分子結(jié)構(gòu)信息,分子全息的產(chǎn)生可以在不同碎片長(zhǎng)度下進(jìn)行[16-17].在確定了最優(yōu)分子碎片參數(shù)組合(A/B/HA/DA)后,改變碎片長(zhǎng)度進(jìn)行計(jì)算,以找到最優(yōu)的分子碎片長(zhǎng)度,結(jié)果見表4.由表可見,4~7為該模型最優(yōu)的分子碎片長(zhǎng)度.
2.1.4氟化合物對(duì)小鼠毒性的HQSAR模型
利用上述實(shí)驗(yàn)中得出的最優(yōu)參數(shù),運(yùn)用PLS方法,得到有機(jī)氟化合物對(duì)小鼠毒性的HQSAR模型.通過可視化的模型貢獻(xiàn)圖來指示分子中片段對(duì)多氟化合物毒性大小的影響,見圖1.由圖可見,在小鼠模型中,氟原子和氮原子同時(shí)存在時(shí)對(duì)化合物毒性貢獻(xiàn)最大,當(dāng)苯環(huán)連接三氟甲基和氨基時(shí),毒性增加尤其明顯.
表4 小鼠碎片長(zhǎng)度的HQSAR分析Tab.4 HQSAR analysis of fragment size in mice
圖1 小鼠最優(yōu)HQSAR模型活性貢獻(xiàn)圖Fig.1 Contribution map of optimal HQSAR model in mice
2.2大鼠HQSAR模型結(jié)果分析
2.2.1全息長(zhǎng)度的確定
與上文一樣,將12個(gè)全息長(zhǎng)度全部選定進(jìn)行大鼠HQSAR的計(jì)算.
2.2.2分子碎片參數(shù)的組合
本文嘗試了在默認(rèn)長(zhǎng)度(4~7)時(shí),28種碎片區(qū)分參數(shù)的組合方式,結(jié)果見表5,最好的結(jié)果是A/C/HA/Ch組合,選為大鼠HQSAR模型建立的參數(shù)組合.
2.2.3分子碎片長(zhǎng)度的確定
在確定了最優(yōu)分子碎片參數(shù)組合(A/C/HA/Ch)后,改變碎片長(zhǎng)度進(jìn)行計(jì)算,以找到最優(yōu)的分子碎片長(zhǎng)度,見表6.由表可見,4~7為該模型最優(yōu)的分子碎片長(zhǎng)度.
表5 大鼠碎片類型的HQSAR分析Tab.5 HQSAR analysis of fragment type in rat
表6 大鼠不同碎片長(zhǎng)度的HQSAR分析Tab.6 HQSAR analysis of fragment size in rat
2.2.4氟化合物對(duì)大鼠毒性的HQSAR模型
在大鼠模型中,與氮原子相連的氫原子被氟原子取代時(shí)對(duì)化合物毒性貢獻(xiàn)最大,三氟甲基與苯環(huán)相連毒性也較大可視化活性模型貢獻(xiàn)圖見圖2.苯環(huán)上的氯原子對(duì)毒性無影響,這說明在今后對(duì)有機(jī)氟化合物的設(shè)計(jì)上,可以在苯環(huán)上引入氯原子.
圖2 大鼠最優(yōu)HQSAR模型活性貢獻(xiàn)圖Fig.2 Contribution map of optimal HQSAR model in rat
2.3利用HQSAR模型進(jìn)行毒性預(yù)測(cè)
2.3.1HQSAR模型毒性預(yù)測(cè)能力驗(yàn)證
利用所建立的小鼠HQSAR模型,預(yù)測(cè)了用于建模的所有有機(jī)氟化合物的毒性和其他已知毒性實(shí)驗(yàn)值的2個(gè)化合物(見表1);并將預(yù)測(cè)值與實(shí)驗(yàn)值進(jìn)行線性回歸,R2=0.809 4,見圖3.同樣,利用所建立的大鼠HQSAR模型,預(yù)測(cè)了訓(xùn)練集的所有有機(jī)氟化合物的毒性和其他已知毒性實(shí)驗(yàn)值的3個(gè)化合物(見表2);并將預(yù)測(cè)值與實(shí)驗(yàn)值進(jìn)行線性回歸,R 2=0.886 2,見圖3.可以發(fā)現(xiàn),實(shí)驗(yàn)值與預(yù)測(cè)值相比相差不大,說明實(shí)驗(yàn)構(gòu)建的模型具備良好的預(yù)測(cè)能力.
圖3 有機(jī)氟化合物毒性pIC50的實(shí)驗(yàn)值與預(yù)測(cè)值線性關(guān)系Fig.3 Linear relationship between organic fluorine compounds toxicity pIC50experimental value and predictive value
2.3.2利用HQSAR模型預(yù)測(cè)未知毒性
本文利用此模型對(duì)已知結(jié)構(gòu)的未知毒性的有機(jī)氟化合物進(jìn)行毒性預(yù)測(cè),對(duì)有機(jī)氟化工常用的梭曼和甲基磺酰氟也進(jìn)行了毒性預(yù)測(cè).
由訓(xùn)練集和預(yù)測(cè)集的預(yù)測(cè)結(jié)果和所有63個(gè)化合物的毒性實(shí)測(cè)值和預(yù)測(cè)值的線性擬合圖(見圖3)發(fā)現(xiàn),實(shí)驗(yàn)值與預(yù)測(cè)值相比相差不大,說明實(shí)驗(yàn)構(gòu)建的模型具備良好擬合效果和較高預(yù)測(cè)能力.
對(duì)已知pIC50值的多氟化合物進(jìn)行預(yù)測(cè),結(jié)果顯示,得到的實(shí)驗(yàn)值與預(yù)測(cè)值相比相差不大,說明實(shí)驗(yàn)構(gòu)建的模型具備良好擬合效果和較高預(yù)測(cè)能力.再利用此模型對(duì)已知結(jié)構(gòu)的未知毒性多氟化合物進(jìn)行毒性預(yù)測(cè)(見表2),本文對(duì)(3,3,3-三氟丙基)二氯甲基硅烷、三氟乙酸乙酯進(jìn)行了毒性預(yù)測(cè).
本文用分子HQSAR方法分別對(duì)小鼠和大鼠進(jìn)行研究,其中HQSAR模型中,分別利用63種和54種多氟化合物的毒性數(shù)據(jù)對(duì)大鼠和小鼠兩種物種構(gòu)建模型,經(jīng)過研究不同碎片區(qū)分參數(shù)以及碎片大小對(duì)模型質(zhì)量的影響,尋找最優(yōu)模型,并對(duì)其預(yù)測(cè)能力進(jìn)行評(píng)估.
(1)在選擇小鼠作為研究對(duì)象進(jìn)行HQSAR研究時(shí),最佳模型的r2=0.978,q2=0.821,SEP=0.660,SEE=0.459,最佳主成分?jǐn)?shù)為6;在大鼠作為研究對(duì)象進(jìn)行HQSAR研究時(shí),最佳模型的r2=0.908,q2=0.605,SEP=1.478,SEE=1.113.
(2)得到大鼠和小鼠的HQSAR最優(yōu)模型后,對(duì)已知毒性數(shù)據(jù)和結(jié)構(gòu)的多氟化合物進(jìn)行毒性預(yù)測(cè)來驗(yàn)證所建HQSAR的預(yù)測(cè)能力,通過實(shí)驗(yàn)值與預(yù)測(cè)值的比較,發(fā)現(xiàn)兩者相差不大,說明本試驗(yàn)中所建模型具備很好的預(yù)測(cè)能力和可靠性.
(3)在最優(yōu)HQSAR的條件下,通過對(duì)原子著色查看每個(gè)原子對(duì)化合物毒性的貢獻(xiàn)率查看,在小鼠模型中氟原子和氮原子同時(shí)存在時(shí)對(duì)化合物毒性貢獻(xiàn)最大,且當(dāng)苯環(huán)上的碳與三氟甲基以及氨基相連時(shí)貢獻(xiàn)率增大.這說明在今后對(duì)化合物的設(shè)計(jì)上,應(yīng)該避免此類情況,這樣能明顯降低化合物的毒性;在大鼠模型中與氮原子相連的氫原子被氟原子取代時(shí)對(duì)化合物毒性貢獻(xiàn)最大,三氟甲基與苯環(huán)相連貢獻(xiàn)率也較大,苯環(huán)上的氯原子對(duì)毒性無影響,說明在今后對(duì)化合物的設(shè)計(jì)上,應(yīng)該在苯環(huán)上引入氯原子,這樣對(duì)化合物的毒性影響不大.
[1]Thayer A M.Fabulous flurine[J].C&E News,2006,84(23):29-30.
[2]Tomy G T,Budakowski W,Halldorson T,et al.Fluorinated organic compounds in an eastern Arctic marine food web[J].Environ Sci Technol,2004,38 (24):6475-6481.
[3]劉征濤.生態(tài)毒理學(xué)研究中分子構(gòu)效相關(guān)的應(yīng)用[J].環(huán)境科學(xué),2001,14(1):53-56.
[4]高潔喜,沈英娃,曹洪法.中國(guó)生態(tài)毒理學(xué)研究現(xiàn)狀[J].環(huán)境科學(xué)研究,1997,10(3):54-58.
[5]白迺彬.定量構(gòu)效關(guān)系(QSAR)在環(huán)境化學(xué)中的進(jìn)展與方法[J].環(huán)境科學(xué),1990,11(2):47-52.
[6]郭新竹,寧正祥.定量結(jié)構(gòu)-活性相關(guān)法及其在食品研究中的應(yīng)用前景[J].食品科學(xué),2001,22(12):34-38.
[7]張小廣,李紹軍,劉漫丹.混合蟻群算法及其用于有機(jī)毒性的QSAR研究[J].計(jì)算機(jī)與應(yīng)用化學(xué),2009,26(5):23-28.
[8]陳曦,王麗君,林學(xué)圃,等.計(jì)算機(jī)技術(shù)在有機(jī)氟農(nóng)藥構(gòu)效關(guān)系研究中的應(yīng)用[J].農(nóng)藥,1996,35(11):16-17.
[9]Martin J W,Mabury S A,Solomon K R,et al. Bioconcentration and tissue distribution of perfluorinated acids in rainbow trout(oncorhynchus mykiss)[J].Environmental Toxicology and Chemistry,2003,22(1):196-204.
[10]李秀菊.部分農(nóng)藥和氟苯衍生物的QSAR/QSPR研究[D].贛州:江西理工大學(xué),2009.
[11]朱少敏.苯的衍生物的HQSAR研究[J].南京大學(xué)學(xué)報(bào),2005,28(2):67-70.
[12]Winker D,Burden F.Holopraphic QSAR of benzodia-zepines[J].Quantiative Structure-activity Relationships,1998,7:224-231.
[13]Trossini G H G,Maltarollo V G,Schmidt T J. Hologram QSAR studies of antiprotozoal activities of sesquiterpene lactones[J].Molecules,2014,19(7):10546-10562.
[14]Tong W,Lowis D R,Perkins R,et al.Evaluation of quantitative structure-activity relationship methods for large-scale prediction of chemicals binding to the estrogen receptor[J].Journal of Chemical Information and Computer Sciences,1998,38(4):669-682.
[15]Bhhatarai B,Gramatica P.Per-and polyfluoro toxicity(LC50inhalation)study in rat and mouse using QSAR modeling[J].Chemical Research in Toxicology,2010,23(3):528-539.
[16]李華,張華北.3-吡啶基醚類化合物的分子全息QSAR研究[J].化學(xué)學(xué)報(bào),2005,63(11):1018-1022.
[17]Ugarkar A G,Ambre P K,Coutinho E C,et al. Extracting structural requirements for activity of GPR119 agonists:a hologram quantitative structure activity relationship(HQASR)study[J].Can J Chem,2014,92(7):670-676.
(編輯呂丹)
HQSAR on the Acute Toxicity of Organic Fluorine Compounds
LI Yuanmei,ZHOU Yanyi,WANG Zhi,KAI Zhenpeng
(School of Chemical and Environmental Engineering,Shanghai Institute of Technology,Shanghai 201418,China)
Organic fluorine compounds and their acute toxicities on rat and mice were studied by the molecular hologram quantitative structure activity relationship(HQSAR).The optimal model(r2= 0.978,q2=0.821)for mice,the fragment size was 4-7,the fragment distinction parameters were atom types,bond type,hydrogen atom,hydrogen bond donor and receptor.The fragment size was set as 4-7 and the fragment distinction parameters were set as atom types,connectivity,hydrogen atom and chirality in the optimal model(r2=0.908,q2=0.605)for rat.The highly predictable and statistically meaningful HQSAR models were obtained,which proved usefulness in the acute toxicity prediction of organic fluorine compounds.
organic fluorine compounds;hologram quantitative structureactivity relationship(HQSAR); to xicity prediction
R 914.5
A
1671-7333(2015)03-0212-09
10.3969/j.issn.1671-7333.2015.03.002
2014-10-29
國(guó)家自然科學(xué)基金青年基金資助項(xiàng)目(21402122);上海應(yīng)用技術(shù)學(xué)院引進(jìn)人才基金資助項(xiàng)目(YJ2013-52)
李媛媚(1991-),女,碩士生,主要研究方向?yàn)樾罗r(nóng)藥創(chuàng)制.E-mail:lymkitty@126.com
開振鵬(1981-),男,講師,博士,主要研究方向?yàn)橛?jì)算機(jī)輔助藥物設(shè)計(jì)、多肽、無脊椎動(dòng)物生理生化.E-mail:kaizp@sit.edu.cn