堵錫華,田 林,徐 艷,吳 瓊,陳 艷
(徐州工程學院 材料與化工學院,江蘇 徐州 221018)
二苯甲酮類化合物已在日用化工、醫(yī)藥、染料及其農(nóng)藥等領域得到廣泛應用[1-4].由于它對紫外光有很好的吸收能力,故常被用于防曬霜、護膚液等個人護理品(personal care products, 簡稱PCPs)中,是個人護理品中非常重要的一種化工原料,但如果這些產(chǎn)品中二苯甲酮類物質過度使用,會引起皮膚過敏、濕疹等不良反應,故我國化妝品衛(wèi)生標準中對防曬劑的種類和用量有嚴格的限制性規(guī)定[5].此外由于二苯甲酮的揮發(fā)性強、熱損失大,在固化膜中易遷移析出,產(chǎn)生毒性,經(jīng)過生物遷移累積到人體和生物體,可能導致遺傳毒性和內分泌的干擾效應[6].近年來,由于個人護理品和食品包裝膜等產(chǎn)品的用量增大,二苯甲酮類化合物被直接或間接排入水環(huán)境中,它們已成為一類新型的環(huán)境污染物,開始威脅人體健康和生態(tài)系統(tǒng),為此對二苯甲酮類化合物的粉塵或有機紫外防曬劑等的測定[7-8]、合成[9-10]、性質[11-12]及其毒性評價[13-14]研究逐漸受到相關學者的重視.
神經(jīng)網(wǎng)絡方法是一個集數(shù)學、計算機、統(tǒng)計學、化學等多學科交叉的研究方法,該法在化學[15]、食品科學[16]、農(nóng)業(yè)科學[17]、藥物化學[18]、毒理學[19]、建筑學[20]等相關領域得到廣泛應用.筆者在前期[21-23]工作基礎上,根據(jù)魏東斌等[24]檢測的14 種二苯甲酮類化合物對發(fā)光菌急性毒性值(EC50),按照梁逸曾等[25-26]相關研究編寫的計算應用程序,計算了文獻[24]所列14種具有代表性的二苯甲酮類化合物分子的分子連接性指數(shù),并利用MINITAB軟件中的最佳變量子集回歸方式,篩選了其中的2X,5Xc兩種指數(shù)作為神經(jīng)網(wǎng)絡的輸入層參數(shù),以二苯甲酮類化合物對發(fā)光菌急性毒性的EC50作為輸出層參數(shù),建構了二苯甲酮類化合物對發(fā)光菌急性毒性的神經(jīng)網(wǎng)絡預測模型,該模型具有高度相關性,所得預測值與文獻值吻合度也達到了令人滿意的結果,研究工作對環(huán)境中個人護理品含有的二苯甲酮類化合物殘留的生物毒性及其生態(tài)風險評估具有實際意義,可為防曬劑的綠色生產(chǎn)、合理使用和科學管理提供指導.
分子連接性指數(shù)是Kier等[27]改進了Randic提出的分枝指數(shù)而提出的一種根據(jù)分子的空間和電性結構信息的結構參數(shù).這里應用Chemoffice2005軟件勾畫了文獻[24]列出的14種二苯甲酮類化合物的分子結構,利用MATLAB軟件自編應用程序,調用14種二苯甲酮類化合物的分子結構,計算其分子連接性指數(shù),再采用MINITAB14.0統(tǒng)計分析應用軟件中的最佳變量子集回歸方式,統(tǒng)計分析二苯甲酮類化合物分子結構與其對發(fā)光菌急性毒性之間的相關關系,篩選了分子連接性指數(shù)中與急性毒性相關性最優(yōu)的2個變量2X,5Xc,分析結果見表1.
表1 pEC50與連接性指數(shù)mX的最佳變量子集回歸結果
(1)
其中:n為二苯甲酮類化合物的樣本總數(shù),b為多元回歸分析模型的變量數(shù),r2為回歸分析模型的決定系數(shù).根據(jù)式(1)計算所得FIT值越大,說明模型越穩(wěn)定.由于樣本數(shù)相對較少,按照樣本數(shù)/變量數(shù)必須≥5的要求,這里只能取2個變量,故選擇模型2,將14個二苯甲酮類化合物分子及其分子連接性指數(shù)的2X,5Xc值列于表2中.
注:帶*號的分子為設計的新分子.
將文獻[24]中列出的14種二苯甲酮類化合物對發(fā)光菌急性毒性與優(yōu)化篩選的2種分子連接性指數(shù)2X和5Xc進行回歸分析,得到的多元回歸方程為
pEC50=2.3652X-9.1525Xc+1.818,
(2)
利用式(2)對發(fā)光菌急性毒性值進行預測,所得預測值與文獻實驗值[24]之間有較大的誤差,兩者的相對平均誤差為13.87%,說明利用多元回歸方法預測毒性并不理想.
針對上述多元回歸方法預測結果不理想的問題,為提高預測二苯甲酮類化合物對發(fā)光菌急性毒性的準確性,需進一步采用神經(jīng)網(wǎng)絡方法進行研究,故先檢驗多元回歸模型的穩(wěn)定性,采用逐一剔除法進行檢驗,即每次剔除1個分子后進行建模,得到相應相關系數(shù),這樣共有14個相關系數(shù),見表3.由表3可以看出,14個相關系數(shù)值較為接近,平均值為0.874 8,與式(2)相吻合.
表3 Jackknifed相關系數(shù)的檢驗
將式(2)模型中使用的兩個變量2X和5Xc作為神經(jīng)網(wǎng)絡法中的輸入層節(jié)點,14種二苯甲酮類化合物對發(fā)光菌的急性毒性作為輸出層節(jié)點,并按照許祿等[29]的建議規(guī)則,要求符合1.4≤n/M<2.2,n為樣本的個數(shù),M為網(wǎng)絡總權重,M的計算式為
M=(Si+1)H+(H+1)So,
(3)
其中:Si,H,So為神經(jīng)網(wǎng)絡3層結構中的輸入層節(jié)點數(shù)、隱含層數(shù)及輸出層節(jié)點數(shù).這里采用了2個連接性指數(shù)作為輸入層節(jié)點,故Si=2; 二苯甲酮類化合物對發(fā)光菌的急性毒性作為輸出層節(jié)點,即So=1; 根據(jù)式(3)計算得到H為2,故這里神經(jīng)網(wǎng)絡結構采用2-2-1的結構方式.
為防止建模過程中的過擬合現(xiàn)象,將14個二苯甲酮類化合物分子分為3組:第1組為訓練集組(以每5個分子為1組,取其中第1,3,5個分子)、第2組為測試集組(每5個分子組中的第2個分子)、第3組為驗證集組(每5個分子組中的第4個分子),用MATLAB軟件中神經(jīng)網(wǎng)絡計算軟件進行計算分析,得到了預測二苯甲酮類化合物對發(fā)光菌急性毒性模型的總相關系數(shù)rt=0.998 3,3個集組的相關系數(shù)分別為:訓練集組的相關系數(shù)r1=0.999 1、測試集組的相關系數(shù)r2=0.999 9、驗證集組的相關系數(shù)r3=0.999 7,這里可以看出,模型總相關系數(shù)相比多元回歸方法得到了明顯提升,達到了0.99以上的優(yōu)級相關性,而且3個集組的相關系數(shù)與模型總相關系數(shù)較為接近,說明模型的穩(wěn)定性相對較好,利用該QSAR神經(jīng)網(wǎng)絡模型來預測二苯甲酮類化合物對發(fā)光菌急性毒性,計算得到的預測值與文獻值吻合度較為理想,兩者的相對平均誤差僅為1.60%,明顯優(yōu)于多元回歸方法的預測精度,說明神經(jīng)網(wǎng)絡法模型的預測能力優(yōu)于多元回歸分析法.將急性毒性的預測值與文獻值同樣列于表2中,將多元回歸法、神經(jīng)網(wǎng)絡法的預測值與文獻值的關系分別作雷達圖(見圖1,2),并將神經(jīng)網(wǎng)絡模型的權重和偏置列于表4.
圖1 多元回歸法雷達圖
圖2 神經(jīng)網(wǎng)絡法雷達圖
表4 神經(jīng)網(wǎng)絡模型的權重和偏置
通過計算14個二苯甲酮類化合物的分子連接性指數(shù),篩選了其中的2種指數(shù)與該化合物分子對發(fā)光菌急性毒性的相關性分析,建立了二苯甲酮類化合物對發(fā)光菌急性毒性預測的神經(jīng)網(wǎng)絡法模型,該毒性預測模型的總相關系數(shù)能達到0.998 3優(yōu)級相關,預測得到的毒性值與文獻[24]所得的值吻合度較高,相對平均誤差為1.60%.從表2可以看出,二苯甲酮類化合物分子的毒性大小,既與化合物分子本身的大小有關,還與連接的基團種類、基團性質、連接的位置、連接基團的數(shù)量多少有關,它們均能影響其毒性大小.如連接的羥基數(shù)越多毒性越大,且連接在2,3,4位,毒性會逐漸增大;如連接烷氧基、磺酸基等基團,則能使毒性減小.為此,筆者根據(jù)這一特性,設計了新的7個二苯甲酮化合物分子(見表2中15*-21*號分子),利用建構的神經(jīng)網(wǎng)絡預測毒性模型所得預測值與分子結構參數(shù)之間的關系,得到了這7個分子的毒性預測值,這些毒性預測值也列于表2中,這里可以看出,這些分子中,即使毒性最大的2-羥基-3-磺酸基-5-甲氧基-二苯甲酮(pEC50為0.565),其毒性值也明顯小于文獻[24]所列的14個二苯甲酮化合物的急性毒性,這里毒性最小的是2′-羥基-3-甲基-4-甲氧基-5-磺酸基-二苯甲酮(pEC50為0.111),可能與其吸電子的磺酸基對相近的甲基、甲氧基的影響較大有關,當然這里預測的毒性值還需要通過實驗來進行確證,但模型的建構對設計毒性低的新的化合物分子可起到重要的理論指導作用.
(1) 通過MINITAB應用程序優(yōu)化篩選了2個分子連接性指數(shù)作為結構描述子,與二苯甲酮類化合物對發(fā)光菌急性毒性具有高度的非線性相關性,建構的預測模型相關系數(shù)達到了0.998 3的高度相關,建立的神經(jīng)網(wǎng)絡毒性預測模型明顯優(yōu)于多元回歸法模型,利用神經(jīng)網(wǎng)絡模型預測得到的毒性值誤差明顯低于多元回歸分析法,相對平均誤差只有1.60%,充分說明二苯甲酮類化合物的連接性指數(shù)(mX)與生物急性毒性(EC50)之間具有良好的非線性關系.利用該神經(jīng)網(wǎng)絡模型,可以設計毒性低的新的二苯甲酮類化合物分子.
(2) 神經(jīng)網(wǎng)絡模型具有較好的預測能力.優(yōu)化篩選的分子連接性指數(shù)2X和5Xc能充分反映二苯甲酮類化合物的分子空間結構以及電性結構之間相關信息,它們能在一定程度上反映該類化合物對生物急性毒性大小變化的規(guī)律.
(3) 二苯甲酮類化合物分子苯環(huán)上連接的基團種類和數(shù)量、連接的位置對毒性影響較大.連接的羥基越多毒性越大,連接烷氧基和磺酸基則能使毒性變小.