余訓(xùn)爽
(長江大學(xué) 化學(xué)與環(huán)境工程學(xué)院,湖北 荊州 434023)
隨著人類社會對有機化合物需求的增大,它們給環(huán)境造成的危害或壓力隨之增加。每年新增的有機化合物種類繁多,有機化合物進入環(huán)境之前不可能逐一進行理化性質(zhì)/生物活(毒)性的測定,如能從現(xiàn)有的實驗數(shù)據(jù)探討科學(xué)的、精確的、可靠的方法預(yù)測新化合物的生物活(毒)性(QSAR),從而進行環(huán)境風(fēng)險評價,這樣不僅方便、經(jīng)濟,也可避免實際測定時帶來的二次污染。研究表明:QSAR在預(yù)測化合物生物活(毒)性方面扮演重要角色,成為環(huán)境、生命、毒理學(xué)等學(xué)科研究中的一個前沿領(lǐng)域[1-5]。在研究中,正辛醇/水分配系數(shù)(lgKOW)是最常見、最重要的理化參數(shù)。它反映有機物的親脂性。根據(jù)實驗測得的經(jīng)驗參數(shù)(辛醇-水分配系數(shù)、水中溶解度等)與相應(yīng)的性質(zhì)(如生物毒性、光解活性等)建立定量關(guān)系式。逐一測定各個有機化合物的理化參數(shù),現(xiàn)實是不可能的;另外實驗數(shù)據(jù)存在一定的誤差,用失真的數(shù)據(jù)直接建模,預(yù)測時可能會導(dǎo)致預(yù)測結(jié)果失敗。改變傳統(tǒng)處理系統(tǒng)信息方法,還以數(shù)據(jù)本來面目,從而提高模型的預(yù)測能力,是從事QSAR工作者必須考慮的問題。
灰色系統(tǒng)理論以 “部分信息已知、部分信息未知”的 “小樣本”、“貧信息”為研究對象,通過對“部分”已知的系統(tǒng)信息進行處理、分析、量化和建模[6]。從而實現(xiàn)處理數(shù)據(jù)不多的灰信息來揭示系統(tǒng)信息的特征和變化規(guī)律。本文將運用灰色理論對12種氯代苯的生物活(毒)性與其結(jié)構(gòu)參數(shù)的定量構(gòu)效關(guān)系進行研究。
GM(1,1)模型是1階的、單變量的模型。本文依據(jù)連續(xù)非等時空距 GM(1,1)灰色模型[5,7]建立灰色預(yù)測模型。其具體步驟如下:
設(shè)系統(tǒng)某行為特征的自變量x(k)和觀測值y(k)為:
相應(yīng)的1-AGO生成序列[6]為:
GM(1,1)模型的響應(yīng)函數(shù)為:
式(2)為GM(1,1)灰色預(yù)測模型的具體計算公式,且參數(shù)-a和b分別為模型的發(fā)展系數(shù)和灰色作用量,其值由最小二乘法求出。式(2)的還原值如下:
模型精度一般由均方差比值C和小誤差概率p共同確定:
其計算方法和模型精度等級參考文獻 [6]。模型精度等級分為Ⅳ級,Ⅰ級最好,Ⅳ級最差。
氯代苯分子的20℃、15min條件下使發(fā)光菌發(fā)光強度減少1/2時的濃度EC50(mol/L)、大型蚤的24h半致死濃度LC50值取自文獻 [8]、-lgKOW(正辛醇-水分配系數(shù))、-lgSW(水中的溶解度)、表面積(100nm2)TSA、分子體積(100 nm3)V、摩爾質(zhì)量(g/mol)M 和摩爾體積Vm(mL/mol)來自文獻 [9]。相關(guān)數(shù)據(jù)及灰色綜合關(guān)聯(lián)度(ρ)計算[6]結(jié)果見表1。
灰色綜合關(guān)聯(lián)度的大小不僅反映了Y(0)與X(0)相關(guān)的程度,同時也反映出Y(0)隨X(0)變化速率的接近程度。由表1可知-lgEC50或-lgLC50與-lgKOW的ρ最大,故將-lgKOW選擇為氯代苯分子結(jié)構(gòu)與生物活(毒)分析的灰變量。
將表1中9個或11個氯代苯分子的-lgEC50和-lgLC50分別與-lgKOW建模,其GM(1,1)灰色預(yù)測模型如下:
-lgEC50的灰色模型:
式(4)中,N、R2、SE、F和P依次為灰方程的樣本數(shù)、判定系數(shù)、標準偏差、Fischer檢驗值和P顯著性水平(下同)。
-lgLC50的灰色模型:
按式(4)和式(5)分別計算12多氯代苯-lgEC50或-lgLC50值、誤差和平均值,以及文獻的預(yù)測值、誤差和平均值與實驗值的比較列于表2中。
表1 氯代苯的化學(xué)結(jié)構(gòu)參數(shù)及灰色綜合關(guān)聯(lián)度Table1 Chemical structure parameters andρof chlorinated benzenes
表2 氯代苯的-lgEC50或-lgLC50的計算值(或預(yù)測值)Table2 Calculated value-lgEC50or-lgLC50of chlorinated benzenes(predicted value)
由表2中數(shù)據(jù)分別計算灰色模型(4)和(5)的S1、S2、均方差比值C和小誤差概率p,計算結(jié)果見表2。由表2可見,灰色模型(4)和(5)均為Ⅰ級(優(yōu)秀)。
本文灰色模型的F值>105,P=0.05水平上的顯著性檢驗<0.0005(本文P=0.0000),且都為單變量模型,因此模型從統(tǒng)計學(xué)的意義上講也是成立的,模型真實可靠。采用式(4)預(yù)測了不在灰色集中的1,3-二氯苯、1,3,5-三氯苯和五氯苯 的-lgEC50值,分 別 為 4.27(4.24)、4.58(4.55)和5.81(5.69),其預(yù)測結(jié)果與括號中的實驗值吻合程度好。因此,該灰色模型具有良好的預(yù)測能力和可靠性。
根據(jù)表2的數(shù)據(jù)分別計算本文和文獻 [8]的誤差,其結(jié)果見表3。
表3 誤差分析Table3 Error analysis
由表3可見,本文所建模型的誤差均好于文獻[8],可見建立的灰色模型優(yōu)于文獻 [8]的線性回歸模型。
借助灰色系統(tǒng)理論來研究有毒化合物的生物活(毒)性預(yù)測,具有一定探索的性質(zhì),有待更加深入、更具體地研究。其次,目前大量有毒化合物的結(jié)構(gòu)參數(shù)(如-lgKOW)被發(fā)表,為建立灰色模型預(yù)測有毒化合物的生物活(毒)性提供了方便,從而為判斷有毒化合物的環(huán)境歸宿和風(fēng)險性評價有重要指導(dǎo)意義。
[1]王連生,韓朔睽.有機污染化學(xué)進展 [M].北京:化學(xué)工業(yè)出版社,1998:7-154.
[2]解靜芳,郭煒鋒.色譜保留指數(shù)在預(yù)測氯苯類和氯酚類化合物對戈卑魚LC50中的應(yīng)用 [J].環(huán)境與健康雜志,2005,22(6):441-444.
[3]堵錫華.修正的分子連接性指數(shù)mL用于氯代苯、醇、酯的QSAR/QSRR研究 [J].分析測試學(xué)報,2003,22(5):18-22.
[4]秦正龍.鹵代芳烴對水生生物急性毒性的定量構(gòu)效關(guān)系研究 [J].環(huán)境污染治理技術(shù)與設(shè)備,2005,6(1):50-53.
[5]謝武明,胡勇有,劉煥彬,等.持久性有機污染物的環(huán)境問題與研究進展 [J].中國環(huán)境監(jiān)測,2004,20(2):58-61.
[6]劉思峰,黨輝國,方志耕,等.灰色系統(tǒng)理論及其應(yīng)用:第五版 [M].北京:科學(xué)出版社,2010.
[7]張 旭,謝修銀.持久性有機污染物多氯聯(lián)苯(PCBs)生物毒性的灰色理論研究 [J].長江大學(xué)學(xué)報:自然科學(xué)版,2009,6(1):41-43.
[8]周享春,趙元力,余訓(xùn)民.用氯代苯、烷基酚和醇類化合物氣相色譜保留指數(shù)預(yù)測其生物活(毒)性 [J].北京工商大學(xué)學(xué)報:自然科學(xué)版,2004,22(4):9-14.
[9]楊海浪.W*對氯代苯類分子理化參數(shù)的應(yīng)用研究[J].武漢科技學(xué)院學(xué)報,2004,17(3):67-71.