朱騰義 姜 越
(揚州大學環(huán)境科學與工程學院, 揚州 225127)
疏水性有機污染物大多會匯聚在水體沉積物中[1],隨著沉積物在環(huán)境介質(zhì)的遷移、轉(zhuǎn)化,其潛在毒性使有機污染物對整個生物圈都產(chǎn)生不可逆的影響.因此準確測定有機污染物的濃度有利于從整體上認識其在環(huán)境介質(zhì)中的分布及歸趨.而被動采樣是一種用于檢測水、沉積物、土壤、空氣或其他環(huán)境媒介中有機污染物濃度的強有力工具[2-3].被動采樣是以污染物在兩相間擴散的化學勢能梯度作為動力,用來測定污染物逸度的平衡采樣技術(shù)[4].常見的被動采樣器主要分為固相微萃取(solid phase microextraction,SPME)和半透膜(semipermeable membrane device,SPMD)[5]2種.SPME利用石英纖維表面不同性質(zhì)的涂層吸附不同類型的化合物.在測定非極性污染物時最常用的涂層是聚二甲基硅氧烷(PDMS).有機污染物在PDMS與水相中的分配系數(shù)(KPDMS-W)是權(quán)衡被動采樣器性能的重要指標[6].目前常用的實驗測定KPDMS-W值方法有靜態(tài)法和動態(tài)法2種.文獻[7-9]利用靜態(tài)法測定有機污染物的KPDMS-W值,其主要原理分為單點校正[7,10]和多點校正[11].靜態(tài)法的主要缺點是只考慮了SPME光纖與水相之間的兩相平衡,而忽略了化合物自身揮發(fā)或由于系統(tǒng)表面的吸附所引起的損失,從而造成了較大的測量誤差.動態(tài)法[12-13]則對上述問題進行了優(yōu)化,消除了部分誤差.然而,對于疏水性較強的化合物,系統(tǒng)表面的吸附所帶來的誤差仍不能忽略.同時,采樣器內(nèi)化合物的運輸取決于很多因素,包括采樣器固相內(nèi)部自由空隙體積的大小和固相碳鏈上節(jié)段遷移率等[2].目前有機污染物的KPDMS-W值均是通過繁瑣的實驗測得,費時且費力,因此,開發(fā)一種預測模型方法用來預測污染物的KPDMS-W值十分必要.
目前的預測方法主要有3種:① 分配系數(shù)法,即利用化合物的辛醇水分配系數(shù)間的關(guān)系式來計算KPDMS-W值;② 線性自由能關(guān)系(LFER)法;③ 理論線性溶解能關(guān)系(TLSER)法.由于化合物的辛醇水分配系數(shù)(Kow)常用于度量化合物的疏水性程度,因此利用待測物的KPDMS-W值與Kow值之間的關(guān)系來預測KPDMS-W值是一種主流的預測方法.該方法的優(yōu)點是,當分子量較小時,HOCs(如PAHs)的Kow值在3.36~6.50范圍內(nèi),Kow與KPDMS-W呈良好的正相關(guān)性.缺點是當分子量較大時HOCs(如PCBs)從水相向PDMS涂層的萃取過程主要是靠吸附而不是吸收,也就是說,Kow與KPDMS-W之間是非線性的.因此,針對疏水性較強的化合物,利用Kow值來預測化合物KPDMS-W值具有一定局限性.
另一種預測方法是利用計算機基于多參數(shù)線性自由能關(guān)系(pp-LFER)建立模型,優(yōu)點是通過理論計算得到分子描述符,提升了對實驗參數(shù)未知化學品的預測能力.它允許在完全脫離實驗測定的條件下,預測所感興趣的化合物的性質(zhì),實現(xiàn)了虛擬預測或計算機(in silico)預測技術(shù).缺點為pp-LFER預測模型缺少溶質(zhì)(化學品)相關(guān)的Abraham描述符(E、S、A、B、V).此外,由于缺少不同溫度下實驗數(shù)據(jù)的校準,pp-LFER模型對不同溫度下分配系數(shù)的預測仍然存在缺陷.
TLSER是在 LSER的基礎(chǔ)上通過理論計算代替LSER經(jīng)驗性描述符而建立起來的一種研究方法[14].這種研究方法可以彌補現(xiàn)有數(shù)據(jù)的缺失、減少實驗測試費用和評估實驗結(jié)果數(shù)據(jù)的不確定性,同時可以很好地定量化評價污染物對環(huán)境的影響,如陳景文等[15]應(yīng)用TLSER預測了部分鹵代芳烴的正辛醇/空氣分配系數(shù),朱騰義等[16]基于TLSER模型預測了部分有機污染物的LDPE膜/空氣分配系數(shù).多環(huán)芳烴(PAHs)和多氯聯(lián)苯(PCBs)因其來源多樣性廣以及對水生生物的毒性強而受到了國內(nèi)外很多學者的關(guān)注[17].本文以部分PAHs和PCBs的logKPDMS-W實測值為樣本,利用TLSER建立模型,對部分有機污染物KPDMS-W值進行預測與表征.
通過查閱文獻[18-21]并整理得到本次1個數(shù)據(jù)集共109種化合物的KPDMS-W實測值,其中包含了84個PCBs和25個PAHs.所建模型的泛化能力可通過將化合物劃分訓練集和驗證集進行體現(xiàn),在109種疏水性有機污染物中隨機選擇80%的化合物作為訓練集,剩余20%的化合物作為驗證集進行預測檢驗.
在計算分子結(jié)構(gòu)描述符前,首先利用ChemBio 3D Ultra 12.0軟件生成數(shù)據(jù)集中所有化合物的初始分子結(jié)構(gòu),其次,運行Minimize Energy將化合物最小能量化以模擬該化合物在自然界中最穩(wěn)定狀態(tài),利用MOPAC 2016模塊中的Mopac Interface PM7算法[22]對化合物結(jié)構(gòu)進行優(yōu)化并計算,從輸出文件中提取5個量化描述符(α,εb,εa,q-,q+),最后運行PaDEL-Descriptor[23]軟件得到各化合物的分子結(jié)構(gòu)描述符,提取其中McGowan特征體積描述符.
TLSER模型是基于LSER理論,同時結(jié)合量子化學方法提出和發(fā)展起來的一種理論模型[14],其表達式如下:
KPDMS-W=k+aV+bα+cεb+dq-+eεa+fq+
式中,V為分子McGowan體積;α為分子極化率[16];εb表征氫鍵堿度;εa表征氫鍵酸度[24];q-為分子最負的原子凈電荷;q+為分子最正的原子凈電荷;a、b、c、d、e和f為多元線性回歸系數(shù)[25];k為常數(shù)項.
(1)
(2)
(3)
(4)
采用基于模型本身驗證過程中計算得到的標準殘差δ和leverage值定義的Williams圖[17]表征預測模型的應(yīng)用域.δ、H、hi及警戒值h*的計算公式如下:
(5)
H=X(XTX)-1XT
(6)
(7)
h*=3(m+1)/n
(8)
(9)
式中,X為n×mn×m的矩陣,表征了模型中訓練集化合物的描述符空間;hi為第i個化合物的杠桿值;xii為第i個化合物分子結(jié)構(gòu)描述符的行向量;SEM為均值標準誤差.
最優(yōu)模型表達式為
logKPDMS-W=2.658V+51.89εb-3.11
(10)
圖1 logKPDMS-W實測值與預測值的擬合關(guān)系
如圖2所示,本文TLSER模型采用Williams圖來表征其應(yīng)用域.若有機污染物的標準殘差δ落在(-3.0,+3.0)以外,則認為該點是離群點.由圖2可見,模型中除一個化合物為離群點外其余所有化合物都在應(yīng)用域中,訓練集和驗證集中化合物的標準殘差|δ|≤3,且這些化合物的杠桿值h均小于警戒值h*=0.103,可見訓練集和驗證集都具有較高的代表性.而僅有一個離群點可能是由于該化合物實驗值本身存在誤差而偏離了本模型應(yīng)用域.因此TLSER模型能對應(yīng)用域內(nèi)其他有機污染物分配系數(shù)的logKPDMS-W值進行預測.
表1 數(shù)據(jù)集中化合物的logKPDMS-W值
注:*表示化合物為驗證集.
圖2 TLSER模型的Williams圖
TLSER模型中包含2個分子描述符,即McGowan特征體積V和氫鍵堿度εb.氫鍵是由價鍵和靜電2部分構(gòu)成[29],εb表征分子提供質(zhì)子或接受電子對的能力,在本模型中εb與logKPDMS-W值呈正相關(guān).因此,當溶質(zhì)分子作為氫鍵受體時,氫鍵堿度越小,與水的氫鍵相互作用越弱,logKPDMS-W值就越大,化合物分子也就更容易分配到被動采樣材料相中.
McGowan特征體積V表征空穴形成作用,系數(shù)為正值.由于水分子排列高度有序且凝聚性強[30],而PDMS空間位阻較大使其凝聚性較弱,故化合物在PDMS中形成空穴的能量遠小于其在水中形成空穴的能量.因此,化合物分子更容易通過空穴形成作用分配到采樣材料相中.
將本文構(gòu)建的TLSER模型與前人研究PAHs和PCBs的模型進行比較,結(jié)果見表2.由表可得,數(shù)據(jù)集中化合物數(shù)量的增多會引起模型預測能力的降低,且前人模型中描述符主要為Kow.前文提到,目前針對化學結(jié)構(gòu)相似化合物的Kow值在小范圍內(nèi)與KPDMS-W值呈良好的正相關(guān)關(guān)系,而在大范圍內(nèi)并沒有呈現(xiàn)良好的線性關(guān)系.因此,利用Kow作為描述符建立的模型,其預測能力不能滿足目前對其他化合物KPDMS-W值的預測需求.本模型利用2個參數(shù)(V和εb)彌補了Kow作為描述符的部分局限性,對同種化合物(如文獻[9]中的PCBs)有更高的擬合度,而且,數(shù)據(jù)集中化合物更加豐富,化合物的實測值跨度更大,應(yīng)用域也更加廣泛.同時,與文獻[33-34]中2種模型相比,本模型針對PAHs和PCBs這2類化合物進行了研究,補充了針對2類化合物KPDMS-W值的模型預測方法.因此,本模型與前人預測模型相比,優(yōu)點在于描述符數(shù)量少,數(shù)據(jù)集中化合物數(shù)量多且預測結(jié)果準確性高,具有良好的擬合優(yōu)度和預測能力.
表2 模型比較
1) 采用理論線性溶解能關(guān)系,構(gòu)建了PCBs和PAHs兩類共109種疏水性有機污染物PDMS膜水分配系數(shù)的預測模型.
3) 模型具有較少參數(shù)(V和εb)的同時包含更加豐富的數(shù)據(jù)集,化合物的實測值跨度大,應(yīng)用域廣泛,對PCBs和PAHs這2類化合物預測精度較高,可用于預測在應(yīng)用域范圍內(nèi)其他與這2類化合物結(jié)構(gòu)相似的有機污染物的KPDMS-W值.