王穎,馮承蓮,黃文賢,劉躍丹,馬燕,5,張瑞卿,吳豐昌,*
1. 北京師范大學(xué)水科學(xué)研究院,北京 100875 2. 中國(guó)環(huán)境科學(xué)研究院 環(huán)境基準(zhǔn)與風(fēng)險(xiǎn)評(píng)估國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京100012 3. 北京師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,北京 100875 4. 環(huán)境保護(hù)部華南環(huán)境科學(xué)研究所 廣東省水與大氣污染防治重點(diǎn)實(shí)驗(yàn)室,廣州510065 5. 青島理工大學(xué)環(huán)境與市政工程學(xué)院 生物環(huán)保與綠色化工研究中心,青島266033 6. 內(nèi)蒙古大學(xué)環(huán)境與資源學(xué)院,呼和浩特010021
物種敏感度分布的非參數(shù)核密度估計(jì)模型
王穎1,2,馮承蓮2,黃文賢3,劉躍丹4,馬燕2,5,張瑞卿6,吳豐昌2,*
1. 北京師范大學(xué)水科學(xué)研究院,北京 100875 2. 中國(guó)環(huán)境科學(xué)研究院 環(huán)境基準(zhǔn)與風(fēng)險(xiǎn)評(píng)估國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京100012 3. 北京師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,北京 100875 4. 環(huán)境保護(hù)部華南環(huán)境科學(xué)研究所 廣東省水與大氣污染防治重點(diǎn)實(shí)驗(yàn)室,廣州510065 5. 青島理工大學(xué)環(huán)境與市政工程學(xué)院 生物環(huán)保與綠色化工研究中心,青島266033 6. 內(nèi)蒙古大學(xué)環(huán)境與資源學(xué)院,呼和浩特010021
針對(duì)目前物種敏感度分布參數(shù)方法建模所存在的缺點(diǎn),首次提出基于非參數(shù)核密度估計(jì)方法的物種敏感度分布模型,并提出相應(yīng)的最優(yōu)窗寬和檢驗(yàn)方法。選用無(wú)機(jī)汞作為案例研究對(duì)象,利用非參數(shù)核密度估計(jì)方法和3種傳統(tǒng)參數(shù)模型分別推導(dǎo)了保護(hù)我國(guó)水生生物的無(wú)機(jī)汞的急性水質(zhì)基準(zhǔn)值。結(jié)果表明,非參數(shù)核密度估計(jì)方法在推導(dǎo)無(wú)機(jī)汞水質(zhì)基準(zhǔn)中的穩(wěn)健性和精確度都大大優(yōu)于傳統(tǒng)參數(shù)模型,能夠更好地構(gòu)建物種敏感度分布曲線(xiàn)。該方法的提出豐富了水質(zhì)基準(zhǔn)的理論方法學(xué),為更好地保護(hù)水生生物提供了有力的支撐。
無(wú)機(jī)汞;淡水水生生物;水質(zhì)基準(zhǔn);非參數(shù)核密度估計(jì);物種敏感度分布
物種敏感度分布法(species sensitivity distribution, SSD)是由Kooijman[1]提出的一種用來(lái)推導(dǎo)水質(zhì)基準(zhǔn)[2-3]和生態(tài)風(fēng)險(xiǎn)評(píng)價(jià)[4]的科學(xué)研究方法。該方法認(rèn)為不同的物種對(duì)相同污染物應(yīng)存在遵循某種概率分布的敏感度差異,并假設(shè)選擇的物種能夠代表給定生態(tài)系統(tǒng)的群落結(jié)構(gòu),具有隨機(jī)性,從而利用已知的毒性數(shù)據(jù)來(lái)擬合物種敏感度曲線(xiàn),進(jìn)而外推獲得保護(hù)95%物種的基準(zhǔn)值(hazardous concentration for 5% of species, HC5)或生態(tài)風(fēng)險(xiǎn)中受影響物種的比例(potentially affected fraction, PAF)[5]。很多學(xué)者圍繞物種敏感度分布的概率建模開(kāi)展了大量研究,傳統(tǒng)研究思路是假設(shè)物種毒性數(shù)據(jù)服從某種參數(shù)分布,再利用統(tǒng)計(jì)分布對(duì)毒性數(shù)據(jù)進(jìn)行概率擬合。目前通常用于物種敏感度分布推導(dǎo)HC5值的幾種參數(shù)模型包括log-normal[6]、log-logistic[7]、Burr Type III[8]、Weibull[9]、Gompertz[10]、Sigmoid[11]、Gaussian[12]、Exponential Growth[13]。
然而參數(shù)模型對(duì)數(shù)據(jù)有較強(qiáng)的基本假定,常常與實(shí)際存在較大的差距,大量的研究也表明,實(shí)際采集到的毒性數(shù)據(jù)通常偏離既定的假設(shè)統(tǒng)計(jì)分布,得到的SSD參數(shù)估計(jì)不能總是取得滿(mǎn)意的結(jié)果,而且也沒(méi)有對(duì)所有毒性數(shù)據(jù)普遍適用的參數(shù)分布[14],因此,依靠主觀假設(shè)的參數(shù)分布擬合方法不具有通用性,最終容易造成基準(zhǔn)推導(dǎo)值的失真。Posthuma[5]和Newman[10]分別提出了非參數(shù)的Monte Carlo和Bootstrap的方法構(gòu)建SSD模型,相對(duì)于參數(shù)方法能夠較客觀地反映真實(shí)毒性數(shù)據(jù)信息。但是,Monte Carlo模擬依然是建立在特定分布的基礎(chǔ)上[15],而對(duì)有異常值的樣本數(shù)據(jù),Bootstrap法會(huì)使得數(shù)據(jù)結(jié)果更失真[16],這都會(huì)造成模型的不確定性,而且Bootstrap法是基于一元統(tǒng)計(jì)得到危害濃度及其置信區(qū)間的分布[10],并不是全體物種的分布,因此為SSD模型建立統(tǒng)一的估計(jì)方法迫在眉睫。
非參數(shù)核密度估計(jì)是一種不需要先驗(yàn)信息,不依賴(lài)于總體分布及其參數(shù),完全以樣本數(shù)據(jù)為基礎(chǔ),對(duì)數(shù)據(jù)限制較為寬松,一般不事先假定變量之間的結(jié)構(gòu)關(guān)系,而是通過(guò)直接估計(jì)獲得結(jié)構(gòu)關(guān)系,能夠很好地?zé)o偏估計(jì)數(shù)據(jù)的分布特征的方法[17],天然具有穩(wěn)健性。崔恒建等[18]結(jié)合實(shí)例探討了非參數(shù)核密度估計(jì)在擬合直徑分布中的應(yīng)用。徐健君[19]成功地將非參數(shù)核密度估計(jì)方法應(yīng)用在岷江冷杉天然林直徑分布研究中。吳承禎等[20]應(yīng)用非參數(shù)核密度估計(jì)很好地描述了群落物種多度分布。
本文擬采用非參數(shù)核密度估計(jì)的模型構(gòu)建物種敏感度分布曲線(xiàn),并提出相應(yīng)的最優(yōu)窗寬和檢驗(yàn)方法。以無(wú)機(jī)汞為例,構(gòu)建了無(wú)機(jī)汞的非參數(shù)核密度估計(jì)物種敏感度分布曲線(xiàn),進(jìn)一步驗(yàn)證了該方法用于推導(dǎo)水質(zhì)基準(zhǔn)的準(zhǔn)確性和有效性。
1.1 物種敏感度分布原理
物種敏感度分布是指在結(jié)構(gòu)復(fù)雜的生態(tài)系統(tǒng)中,不同的物種對(duì)某一脅迫因素的敏感程度服從一定的概率分布,可以通過(guò)概率或者經(jīng)驗(yàn)分布函數(shù)來(lái)描述不同物種樣本對(duì)脅迫因素的敏感度差異[15]。通常計(jì)算基于給定樣本的隨機(jī)變量的分布密度函數(shù),可以利用參數(shù)估計(jì)和非參數(shù)估計(jì)2類(lèi)方法。參數(shù)估計(jì)中,往往假設(shè)數(shù)據(jù)分布符合某種特定的性態(tài),然后在目標(biāo)分布的函數(shù)族中確定特定的參數(shù)值,從而得到隨機(jī)變量的分布密度函數(shù)。目前SSD采取的估計(jì)方法主要是將已知物種的毒性數(shù)據(jù)值按照從大到小的順序排列,根據(jù)計(jì)算公式(1)[21]或(2)[13]計(jì)算每個(gè)物種的累積概率。
(1)
(2)
式中,p 為累積概率,i 為物種排序的等級(jí),最小的為1,最大等級(jí)為n ,即為物種總數(shù)。然后根據(jù)參數(shù)或非參數(shù)的方法求解累積概率分布函數(shù)。Kolmogorov-Smirnov(K-S)檢驗(yàn)用于檢驗(yàn)參數(shù)模型的實(shí)用性。每個(gè)模型通過(guò)曲線(xiàn)擬合后,計(jì)算出的均方根誤差(root mean square errors, RMSE)和判定系數(shù)(coefficients of determination, R2)用于描述參數(shù)模型的擬合程度;RMSE和誤差平方和(sum of squares for error, SSE)用于描述非參數(shù)模型的擬合程度。擁有最小RMSE值和最大R2值的參數(shù)模型被認(rèn)為是用于推導(dǎo)物種敏感度分布和水質(zhì)基準(zhǔn)值的最佳參數(shù)模型,擁有最小RMSE值和最小SSE值的非參數(shù)模型被認(rèn)為是用于推導(dǎo)物種敏感度分布和水質(zhì)基準(zhǔn)值的最佳非參數(shù)模型[22]。
1.2 物種敏感度分布的非參數(shù)核密度估計(jì)
非參數(shù)核密度估計(jì)是指在給定樣本后,僅從現(xiàn)有的樣本數(shù)據(jù)出發(fā),利用核密度函數(shù)估計(jì)的方法對(duì)其未知的總體密度函數(shù)的估計(jì)[23]。假設(shè)x1,x2,…xn是總體物種毒性數(shù)據(jù)X 獨(dú)立同分布n 個(gè)的樣本,X 的概率密度函數(shù)f(x) 未知,物種敏感度分布的非參數(shù)核密度估計(jì)為
(3)
其中,非參數(shù)核密度估計(jì)SSD使用的毒性數(shù)據(jù)樣本(通常選用半數(shù)效應(yīng)濃度或半數(shù)致死濃度EC50/LC50或無(wú)觀察效應(yīng)濃度NOEC)主要來(lái)自現(xiàn)有的數(shù)據(jù)庫(kù)及其各類(lèi)文獻(xiàn),經(jīng)過(guò)物種、暴露時(shí)間、效應(yīng)濃度的單位等數(shù)據(jù)篩選后獲得,過(guò)程符合物種敏感度分布法毒性數(shù)據(jù)的篩選原則[15]。同時(shí),根據(jù)統(tǒng)計(jì)學(xué)要求,非參數(shù)核密度估計(jì)通常建立在大樣本統(tǒng)計(jì)的基礎(chǔ)上[23],毒性數(shù)據(jù)樣本數(shù)量應(yīng)至少超過(guò)30個(gè)。
1.3 核函數(shù)和最優(yōu)窗寬的求取
一般先選定核函數(shù),再確定最優(yōu)窗寬。核函數(shù)K (x )通常選取關(guān)于原點(diǎn)對(duì)稱(chēng)并使得
(4)
常用的核函數(shù)有Parzen窗(Uniform)、三角(Triangle)、高斯(Gauss)、指數(shù)(Exponent)等。在獨(dú)立同分布的情況下,核密度估計(jì)量具有逐點(diǎn)漸近無(wú)偏性、一致漸進(jìn)無(wú)偏性和均方相合性等性質(zhì)[24]。不同的核函數(shù)代表距離分配各樣本點(diǎn)對(duì)密度貢獻(xiàn)的不同情況,通常用漸近積分均方誤差(AMISE)來(lái)度量[25]。根據(jù)Prakasa的研究[26]可知,滿(mǎn)足核函數(shù)條件下的高斯核函數(shù)、均勻核函數(shù)和Epanechnikov核函數(shù)等的最優(yōu)性幾乎一致。因此,本文選用式(5)的標(biāo)準(zhǔn)高斯核函數(shù)。
(5)
核估計(jì)的關(guān)鍵是選取合理窗寬hn,這將直接關(guān)系核估計(jì)的精度,通常需要經(jīng)過(guò)大量試驗(yàn)確定,當(dāng)窗寬確定時(shí),不同的核函數(shù)對(duì)估計(jì)的作用是等價(jià)的[27]。若采用高斯核函數(shù),則根據(jù)經(jīng)驗(yàn)法可得最優(yōu)窗寬為[28]
(6)
1.4 模型檢驗(yàn)
非參數(shù)核密度估計(jì)的物種敏感度分布模型采用K-S檢驗(yàn)與后驗(yàn)檢驗(yàn)的聯(lián)合檢驗(yàn)法,其中后驗(yàn)檢驗(yàn)指定量評(píng)估概率模型與數(shù)據(jù)觀測(cè)分布之間的差異,采用RMSE和SSE作為后驗(yàn)檢驗(yàn)指標(biāo)。通過(guò)K-S檢驗(yàn)認(rèn)為建立的模型分布成立,K-S檢驗(yàn)統(tǒng)計(jì)量越小說(shuō)明擬合優(yōu)度越高[29];RMSE和SSE越小,則說(shuō)明非參數(shù)核密度估計(jì)模型的擬合程度越高。
2.1 無(wú)機(jī)汞毒性數(shù)據(jù)獲取
汞(Hg)是重要的重金屬,也是受關(guān)注的有毒污染物,它在天然水體里主要以無(wú)機(jī)形態(tài)存在,主要搜集Hg2+對(duì)中國(guó)淡水水生生物的毒性數(shù)據(jù)。毒性數(shù)據(jù)來(lái)自美國(guó)環(huán)保局ECOTOX數(shù)據(jù)庫(kù)(http://cfpub.epa.gov/ecotox/)和中國(guó)知網(wǎng)(http://www/cnki/net/)收錄的文獻(xiàn),主要來(lái)自于參考文獻(xiàn)[21]。實(shí)驗(yàn)數(shù)據(jù)獲得的準(zhǔn)確性和可靠性均符合標(biāo)準(zhǔn)方法,具體篩選標(biāo)準(zhǔn)與文獻(xiàn)[30]相同。相同物種具有多個(gè)毒性數(shù)據(jù)的情況下,取其所有效應(yīng)濃度數(shù)據(jù)的幾何平均值,稱(chēng)為種平均急性值(species mean acute value, SMAVs)。收集到的無(wú)機(jī)汞的慢性毒性數(shù)據(jù)較少,不足以構(gòu)建物種敏感度曲線(xiàn),所以?xún)H使用無(wú)機(jī)汞的急性毒性數(shù)據(jù)作為案例研究。使用Matlab 2007b軟件進(jìn)行數(shù)據(jù)處理及模型構(gòu)建。
2.2 無(wú)機(jī)汞的非參數(shù)核密度估計(jì)的急性物種敏感度分布構(gòu)建
篩選出的Hg2+化合物急性毒性數(shù)據(jù)共90個(gè)物種,其中植物9種,脊椎動(dòng)物33種,包括魚(yú)類(lèi)26種,兩棲類(lèi)7種;無(wú)脊椎動(dòng)物48種,包括甲殼類(lèi)25種,其他無(wú)脊椎動(dòng)物23種,具體數(shù)據(jù)詳見(jiàn)表1。
表1 無(wú)機(jī)汞對(duì)中國(guó)淡水水生生物急性毒性數(shù)據(jù)
注:使用的數(shù)據(jù)全部來(lái)自于參考文獻(xiàn)[21]。
Note: All data used came from reference[21].
由表1可知,毒性數(shù)據(jù)范圍為0.32~35 041.94,標(biāo)準(zhǔn)差達(dá)到4 199.01,差異太大,需要對(duì)原始數(shù)據(jù)做對(duì)數(shù)化處理以減小數(shù)據(jù)之間的差異性,達(dá)到數(shù)據(jù)平滑的效果,使得計(jì)算結(jié)果擬合度更高;同時(shí)也為了更好地同其他參數(shù)模型進(jìn)行對(duì)比,因此在開(kāi)展分析之前先對(duì)數(shù)據(jù)做對(duì)數(shù)化處理。經(jīng)過(guò)處理后,采用高斯核函數(shù)對(duì)中國(guó)淡水水生生物的無(wú)機(jī)汞的急性毒性數(shù)據(jù)構(gòu)建非參數(shù)核密度估計(jì)的物種敏感度分布,根據(jù)窗寬的經(jīng)驗(yàn)公式計(jì)算窗寬h =0.3678,并對(duì)比4種其他的窗寬對(duì)擬合結(jié)果的影響(圖1)。發(fā)現(xiàn)h 確實(shí)為最優(yōu)窗寬,它從實(shí)際上兼顧了密度曲線(xiàn)的光滑性和模型的擬合優(yōu)度,由此,確定了無(wú)機(jī)汞的非參數(shù)核密度估計(jì)的物種敏感度分布模型如式(7)所示。
(7)
2.3 不同模型的對(duì)比
對(duì)收集到的中國(guó)淡水水生生物的Hg2+的毒性數(shù)據(jù)做對(duì)數(shù)化處理并通過(guò)正態(tài)檢驗(yàn)后,建立了物種敏感度分布的參數(shù)模型,并與非參數(shù)核估計(jì)模型進(jìn)行了對(duì)比。采用極大似然估計(jì)方法得到3種擬合較好的normal分布、logistic分布和sigmoid分布的參數(shù)模型的概率密度函數(shù),分布公式、估計(jì)值及模型檢驗(yàn)結(jié)果見(jiàn)表2,3種參數(shù)模型與非參數(shù)核估計(jì)模型的累積概率分布的對(duì)比見(jiàn)圖2。
從表1和圖2中可以得出,對(duì)于所研究的Hg2+的中國(guó)淡水水生生物的毒性數(shù)據(jù),所有模型均通過(guò)K-S檢驗(yàn),但本文提出的核密度估計(jì)模型與樣本數(shù)據(jù)的經(jīng)驗(yàn)分布K-S檢驗(yàn)統(tǒng)計(jì)量最小,P 值最大,達(dá)到0.8974,后驗(yàn)檢驗(yàn)指標(biāo)RMSE和SSE也達(dá)到最小,說(shuō)明擬合程度最好。進(jìn)一步印證較低毒性效應(yīng)值的擬
圖1 無(wú)機(jī)汞對(duì)中國(guó)淡水水生生物的急性毒性數(shù)據(jù)構(gòu)建非參數(shù)核密度估計(jì)的物種敏感度分布的不同窗寬的對(duì)比Fig. 1 Comparison among different bandwidth of species sensitivity distribution (SSDs) that is established by the non-parametric kernel density estimation for inorganic mercury to Chinese freshwater organisms
合程度,排序在前10%的物種的normal分布、logistic分布、sigmoid分布和非參數(shù)核密度估計(jì)模型的K-S檢驗(yàn)統(tǒng)計(jì)量分別是0.0281、0.0363、0.0310和0.0244,其中非參數(shù)核密度估計(jì)模型最小,擬合程度最好。因此,本文提出的核密度估計(jì)模型對(duì)所選取的生物毒性數(shù)據(jù)不作預(yù)先分布的假設(shè),對(duì)樣本數(shù)據(jù)表現(xiàn)出很好的適應(yīng)性,可以很好地彌補(bǔ)參數(shù)模型的缺陷,能夠以較高的精度通過(guò)統(tǒng)計(jì)檢驗(yàn),獲得最好的模擬效果。
另外,非參數(shù)核密度估計(jì)模型與Bootstrap法和Bootstrap回歸法不同,前者可以像參數(shù)法一樣獲得全體物種的累積概率密度分布情況,后兩者則是利用反復(fù)重抽樣得到的隨機(jī)替換樣本構(gòu)造經(jīng)驗(yàn)分布函數(shù)或特定參數(shù)模型,只能計(jì)算特定統(tǒng)計(jì)量的估計(jì)值及置信區(qū)間[31]。同時(shí),實(shí)驗(yàn)測(cè)得的毒性數(shù)據(jù)常常會(huì)出現(xiàn)異常值的情況,呈現(xiàn)偏態(tài),服從相對(duì)“尖峰厚尾”的近似正態(tài)分布,參數(shù)模型往往不能很好地對(duì)這樣的樣本數(shù)據(jù)進(jìn)行擬合;相反地,基于非參數(shù)核密度估計(jì)的SSD不需要先驗(yàn)信息,直接根據(jù)樣本數(shù)據(jù)擬合,較參數(shù)模型對(duì)樣本數(shù)據(jù)限制更為寬松,可以減少這些異常值點(diǎn)對(duì)SSD估計(jì)的影響,具有較好的穩(wěn)健性。
表2 各模型對(duì)對(duì)數(shù)化后的無(wú)機(jī)汞急性毒性數(shù)據(jù)的擬合結(jié)果
圖2 三種參數(shù)模型與非參數(shù)核密度估計(jì)模型的累積概率密度函數(shù)對(duì)比Fig. 2 Comparison between three parametric distributions and non-parametric kernel estimate model of cumulative probability density function
2.4 不同模型得到的全部物種的HC5值對(duì)比
通常以保護(hù)95%物種的污染物濃度作為安全閾值,即HC5。因此,由normal分布、logistic分布、sigmoid分布參數(shù)模型和非參數(shù)核密度估計(jì)模型分別計(jì)算得到的HC5值為3.46、3.83、3.72和2.14μg·L-1。查找原始樣本數(shù)據(jù),可以發(fā)現(xiàn),利用公式(2)計(jì)算得到的經(jīng)驗(yàn)分布5%的累積概率所對(duì)應(yīng)的樣本物種是甲殼類(lèi)棘爪網(wǎng)紋溞,其對(duì)應(yīng)急性毒性值為2.9 μg·L-1,因此,4種估計(jì)模型的偏差分別為19.38%、31.94%、28.30%和26.23%。其中,normal分布參數(shù)模型和非參數(shù)核密度估計(jì)模型的偏差較小。為了更好地比較這2個(gè)模型的擬合效果,圖3給出了這2種估計(jì)模型概率密度函數(shù)的對(duì)比。由圖中可知,非參數(shù)核密度估計(jì)模型能夠更好地反映物種毒性數(shù)據(jù)的總體變化趨勢(shì),更能反映樣本的內(nèi)在結(jié)構(gòu)特征。進(jìn)一步根據(jù)優(yōu)先選擇對(duì)于敏感物種毒性數(shù)據(jù)擬合較好的模型的原則[32],非參數(shù)核密度估計(jì)模型較參數(shù)模型而言,得到的HC5值更加可靠。
2.5 無(wú)機(jī)汞的急性水質(zhì)基準(zhǔn)對(duì)比
根據(jù)式(8)計(jì)算得到急性水質(zhì)基準(zhǔn)值,目前大部分研究使用的評(píng)價(jià)因子取值為2[33],本研究也采取相同的評(píng)價(jià)因子。
急性水質(zhì)基準(zhǔn)=急性HC5/AF
(8)
圖3 normal分布參數(shù)模型與非參數(shù)核密度估計(jì)模型概率密度函數(shù)的對(duì)比Fig. 3 Comparison between normal distribution and non-parametric kernel estimate model of probability density function
將本研究得到的基準(zhǔn)值同國(guó)內(nèi)不同學(xué)者的研究結(jié)果及其他國(guó)家的急性水質(zhì)基準(zhǔn)值進(jìn)行比較。張瑞卿等[21]使用Log-Slogistic3對(duì)物種急性毒性數(shù)據(jù)進(jìn)行擬合;孔祥臻等[34]用BurrⅢ分布對(duì)Hg的SSD進(jìn)行擬合;美國(guó)使用的是毒性百分?jǐn)?shù)排序法,假設(shè)物種毒性數(shù)據(jù)符合對(duì)數(shù)-三角分布;澳大利亞采用BurrⅢ模型進(jìn)行統(tǒng)計(jì)外推。表3給出了各研究推導(dǎo)出的急性水質(zhì)基準(zhǔn)對(duì)比結(jié)果。
表3 無(wú)機(jī)汞急性水質(zhì)基準(zhǔn)值對(duì)比
作為物種敏感度分布的重要組成部分,物種的組成和對(duì)污染物的敏感度能夠直接影響物種敏感度分布推導(dǎo)結(jié)果的準(zhǔn)確性,而不同生態(tài)系統(tǒng)中物種組成和物種敏感度與生物區(qū)密切相關(guān)[37]。例如,中國(guó)的魚(yú)類(lèi)代表種大多屬于鯉科,而北美大多數(shù)魚(yú)類(lèi)屬于鮭科。而本文主要選取的是代表中國(guó)廣大水體環(huán)境中的淡水物種區(qū)系,因此同美國(guó)和澳大利亞的基準(zhǔn)或標(biāo)準(zhǔn)值有所區(qū)別。但是,本研究與同是研究中國(guó)淡水水生生物的孔祥臻等[34]、張瑞卿等[21]和李會(huì)仙等[35]的研究結(jié)果差異較大,說(shuō)明非參數(shù)核密度估計(jì)模型與參數(shù)模型間的差異性確實(shí)存在。其中,孔祥臻等[34]使用的樣本物種僅為30種,數(shù)據(jù)集較小,因此存在較大的偏差,較難獲取準(zhǔn)確的參數(shù)估計(jì)值;張瑞卿等[21]使用的模型是log-sigmoid模型的一種變形,且其殘差平方和為0.0664,大于本研究的0.0488,李會(huì)仙等[35]使用的是荷蘭國(guó)立公共衛(wèi)生與環(huán)境研究院開(kāi)發(fā)的ETX2.0軟件[6],該軟件使用的是log-Normal模型,僅用Anderson-Darling統(tǒng)計(jì)量檢驗(yàn)了對(duì)分布的擬合情況,結(jié)果也較為粗糙(0.822<1.035),由此說(shuō)明非參數(shù)核密度估計(jì)模型比這2個(gè)參數(shù)模型的擬合更貼合樣本數(shù)據(jù),具有更高的準(zhǔn)確性。同時(shí),通過(guò)對(duì)比其他國(guó)家的基準(zhǔn)值可以發(fā)現(xiàn),非參數(shù)核密度估計(jì)模型推導(dǎo)出的急性基準(zhǔn)值更加貼近實(shí)際,但是目前其他國(guó)家還沒(méi)有利用非參數(shù)核密度估計(jì)模型對(duì)物種敏感度分布的研究結(jié)果。
2.6 模型的不確定性分析
實(shí)際物種毒性數(shù)據(jù)的有效性是模型確定的關(guān)鍵,因此樣本數(shù)據(jù)的收集十分重要。本研究中案例使用的數(shù)據(jù)未考慮無(wú)機(jī)汞在生物體內(nèi)的富集效應(yīng),也未考慮不同實(shí)驗(yàn)室數(shù)據(jù)的差異性。同時(shí),污染物的毒性受到多種環(huán)境因素影響,例如水體硬度等,但目前沒(méi)有足夠數(shù)據(jù)來(lái)定量研究環(huán)境因素的影響,本文的模型也沒(méi)有考慮環(huán)境因素。模型中核函數(shù)的窗寬估計(jì)依賴(lài)于具體的各物種毒性數(shù)據(jù),因此在實(shí)際中窗寬的確定是較困難的問(wèn)題,若h 太小會(huì)使擬合的物種敏感度分布曲線(xiàn)波動(dòng)較大,不能反映內(nèi)在規(guī)律;若h 太大則估計(jì)的物種敏感度分布曲線(xiàn)過(guò)于光滑,掩蓋了其內(nèi)在結(jié)構(gòu)特征。本研究選取高斯核函數(shù)及其經(jīng)驗(yàn)最優(yōu)帶寬建立了SSD分布,雖然得到了較好的結(jié)果,但仍可以根據(jù)擬合度和光滑度的實(shí)際情況對(duì)窗寬做適當(dāng)調(diào)整,以獲得更合適的分布密度。另外,非參數(shù)核密度估計(jì)通常建立在大樣本統(tǒng)計(jì)的基礎(chǔ)上,對(duì)小樣本的密度估計(jì)并不太理想,因此對(duì)物種毒性數(shù)據(jù)樣本較小(通常<30)的情況,需要對(duì)已構(gòu)建的物種敏感度分布的非參數(shù)核密度估計(jì)模型做一定補(bǔ)充與改進(jìn)。
本文提出的基于非參數(shù)核密度估計(jì)的物種敏感度分布模型既簡(jiǎn)單又靈活,具有很高的準(zhǔn)確性和有效性,并給出了最優(yōu)帶寬選取和模型聯(lián)合檢驗(yàn)方法。選取的無(wú)機(jī)汞的水生生物毒性數(shù)據(jù)的案例研究,驗(yàn)證了非參數(shù)核密度估計(jì)方法在推導(dǎo)水質(zhì)基準(zhǔn)中的穩(wěn)健性和適用性。該估計(jì)方法的提出豐富了水質(zhì)基準(zhǔn)的理論方法學(xué),為更好地保護(hù)水生生物提供了更有力的支撐,可以考慮廣泛應(yīng)用于物種敏感度分布推導(dǎo)水質(zhì)基準(zhǔn)中的研究。
[1] Kooijman S A L M. A safety factor for LC50values allowing for differences in sensitivity among species [J]. Water Research, 1987, 21(3): 269-276
[2] Canadian Council of Resource and Environment Ministers (CCME). A protocol for the Derivation of Water Quality Guidelines for the Protection of Auqtic Life [R]. Ottawa: CCME , 2007
[3] Australian and New Zealand Environment and Conservation Council and Agriculture and Resource Management Council of Australian and New Zealand (ANZECC, ARMCANZ). Peper No.4 Australian and New Zealand Guidelines for Fresh and Marine Water Quality [R]. Canberra: ANZECC, ARMCANZ, 2000
[4] US Environmental Protection Agency (US EPA). Guidelines for Ecological Risk Assessment [R]. Washington DC: US EPA, 1998
[5] Posthuma L, Suter II G, Traas T P. Species Sensitivity Distributions in Ecotoxicology [M]. Boca Raton FL: Lewis Publishers, 2002: 1-198
[6] Van Vlaardingen P L A, Traas P T, Wintersen A M, et al. Etx2. 0. A program to calculate hazardous concentrations and fraction affected, based on normally-distributed toxicity data. RIVM report (and software) 601501028/2004 [R]. Bilthoven: National Institute for Public Health and the Environment (RIVM), 2004
[7] Pennington D W. Extrapolating ecotoxicological measures from small data sets [J]. Ecotoxicology and Environmental Safety, 2003, 56(2): 238-250
[8] Shao Q. Estimation for hazardous concentrations based on NOEC toxicity data: An alternative approach [J]. Environmetrics, 2000, 11(5): 583-595
[9] Van Straalen N M. Threshold models for species sensitivity distributions applied to aquatic risk assessment for zinc [J]. Environmental Toxicology and Pharmacology, 2002, 11(3-4): 167-172
[10] Newman M C, Ownby D R, Mezin L C, et al. Applying species-sensitivity distributions in ecological risk assessment: Assumptions of distribution type and sufficient numbers of species [J]. Environmental Toxicology and Chemistry, 2000, 19(2): 508-515
[11] 曹宇靜, 吳豐昌. 淡水中重金屬鎘的水質(zhì)基準(zhǔn)制定[J]. 安徽農(nóng)業(yè)科學(xué), 2010, 38(3): 1378-1380, 1437
Cao Y J, Wu F C. Establishment of water quality criteria for cadmium in freshwater [J]. Journal of Anhui agriculture, 2010, 38(3): 1378-1380, 1437 (in Chinese)
[12] 吳豐昌, 馮承蓮, 曹宇靜, 等. 鋅對(duì)淡水生物的毒性特征與水質(zhì)基準(zhǔn)的研究[J]. 生態(tài)毒理學(xué)報(bào), 2011, 6(4): 367-382
Wu F C, Feng C L, Cao Y J, et al. Toxicity characteristic of zinc to freshwater biota and its water quality criteria [J]. Asian Journal of Ecotoxicology, 2011, 6(4): 367-382 (in Chinese)
[13] 吳豐昌, 馮承蓮, 張瑞卿, 等. 我國(guó)典型污染物水質(zhì)基準(zhǔn)研究[J]. 中國(guó)科學(xué): 地球科學(xué), 2012, 42(5): 665-672
Wu F C, Feng C L, Zhang R Q, et al. Derivation of water quality criteria for representative water-body pollutants in China [J]. Science in China: Earth Science, 2012, 42(5): 665-672 (in Chinese)
[14] 吳豐昌, 孟偉, 曹宇靜, 等. 鎘的淡水水生生物水質(zhì)基準(zhǔn)研究[J]. 環(huán)境科學(xué)研究, 2011, 24(2): 172-184
Wu F C, Meng W, Cao Y J, et al. Derivation of aquatic life water quality criteria for cadmium in freshwater in China [J]. Research of Environmental Science, 2011, 24(2): 172-184 (in Chinese)
[15] 陳波宇, 鄭斯瑞, 牛希成, 等. 物種敏感度分布及其在生態(tài)毒理學(xué)中的應(yīng)用[J]. 生態(tài)毒理學(xué)報(bào), 2010, 5(4): 491-497
Chen B Y, Zheng S R, Niu X C, et al. Species sensitivity distribution and its application in ecotoxicology [J]. Asian Journal of Ecotoxicology, 2010, 5(4): 491-497 (in Chinese)
[16] 潘海濤. Bootstrap方法在非參數(shù)核估計(jì)中的研究與應(yīng)用[J]. 統(tǒng)計(jì)與決策, 2010(23): 22-24
[17] Rosenblatt M. Remarks on some nonparametric estimates of a density function [J]. The Annals of Mathematical Statistics, 1956, 27(3): 832-837
[18] 崔恒建, 王雪峰. 核密度估計(jì)及其在直徑分布研究中的應(yīng)用[J]. 北京林業(yè)大學(xué)學(xué)報(bào), 1996, 18(2): 67-72
Cui H J, Wang X F. Property of kernel density estimation and application in the diameter distribution [J]. Journal of Beijing Forestry University, 1996, 18(2): 67-72 (in Chinese)
[19] 徐健君. 非參數(shù)核密度估計(jì)在岷江冷杉天然林直徑分布研究中的應(yīng)用[J]. 甘肅林業(yè)科技, 1999, 24(4): 22-24, 28
Xu J J. An application of non-parameter nucle-densiety estimation on research of diameter distribution of Abies f axoniana natural forest [J]. Journal of Gansu Forestry Science and Technology, 1999, 24(4): 22-24, 28 (in Chinese)
[20] 吳承禎, 洪偉, 吳繼林, 等. 兩種珍稀植物群落物種多度分布的核方法研究[J]. 熱帶亞熱帶植物學(xué)報(bào), 2000, 8(4): 301-307
Wu C Z, Hong W, Wu J L, et al. Studies on kernel density estimation of species abundance distribution in two communities of rare and endangered plants [J]. Journal of Tropical and Subtropical Botany, 2000, 8(4): 301-307 (in Chinese)
[21] 張瑞卿, 吳豐昌, 李會(huì)仙, 等. 應(yīng)用物種敏感度分布法研究中國(guó)無(wú)機(jī)汞的水生生物水質(zhì)基準(zhǔn)[J]. 環(huán)境科學(xué)學(xué)報(bào), 2012, 32(2): 440-449
Zhang R Q, Wu F C, Li H X, et al. Deriving aquatic water quality criteria for inorganic mercury in China by species sensitivity distributions [J]. Acta Scientiae Circumstantiae, 2012, 32(2): 440-449 (in Chinese)
[22] Liu Y D, Wu F C, Mu Y S, et al. Setting water quality criteria in China: Approaches for developing species sensitivity distributions for metals and metalloids [J]. Reviews of Environmental Contamination and Toxicology, 2014(230): 35-57
[23] 吳喜之. 非參數(shù)統(tǒng)計(jì)[M]. 北京: 中國(guó)統(tǒng)計(jì)出版社, 1999: 175-187
[24] 陳希孺, 柴根象. 非參數(shù)統(tǒng)計(jì)教程[M]. 上海: 華東師范大學(xué)出版社, 1993: 247-270
[25] 趙淵, 沈智健, 周念成, 等. 基于序貫仿真和非參數(shù)核密度估計(jì)的大電網(wǎng)可靠性評(píng)估[J]. 電力系統(tǒng)自動(dòng)化, 2008, 32(6): 14-19
Zhao Y, Shen Z J, Zhou N C, et al. Reliability assessment of bulk power systems utilizing sequential simulation and nonparametric kernel density estimation [J]. Autonation of Electric Power Systems, 2008, 32(6): 14-19 (in Chinese)
[26] Prakasa Rao B L S. Nonparametric Functional Estimation [M]. New York: Academic Press, 1983: 22-198
[27] Epanechnikov V A. Non-parametric estimation of a multivariate probability density [J]. Theory of Probability & Its Applications, 1969, 14(1): 153-158
[28] 李竹渝, 魯萬(wàn)波, 龔金國(guó). 經(jīng)濟(jì), 金融計(jì)量學(xué)中的非參數(shù)估計(jì)技術(shù)[M]. 北京: 科學(xué)出版社, 2007: 10-20
[29] 顏偉, 任洲洋, 趙霞, 等. 光伏電源輸出功率的非參數(shù)核密度估計(jì)模型[J]. 電力系統(tǒng)自動(dòng)化, 2013, 37(10): 35-40
Yan W, Ren Z Y, Zhao X, et al. Probabilistic photovoltaic power modeling based on nonparametric kernel density estimation [J]. Autonation of Electric Power Systems, 2013, 37(10): 35-40 (in Chinese)
[30] 吳豐昌, 馮承蓮, 曹宇靜, 等. 我國(guó)銅的淡水生物水質(zhì)基準(zhǔn)研究[J]. 生態(tài)毒理學(xué)報(bào), 2011, 6(6): 617-628
Wu F C, Feng C L, Cao Y J, et al. Aquatic life ambient freshwater quality criteria for copper in China [J]. Asian Journal of Ecotoxicology, 2011, 6(6): 617-628(in Chinese)
[31] Grist E P, Leung K M, Wheeler J R, et al, Better bootstrap estimation of hazardous concentration thresholds for aquatic assemblages [J]. Environmental Toxicology and Chemistry, 2002, 21(7): 1515-1524
[32] 吳豐昌. 水質(zhì)基準(zhǔn)理論與方法學(xué)及其案例研究[M]. 北京: 科學(xué)出版社, 2012: 77-87
[33] Van Sprang P A, Verdonck F A M, Vanrolleghem P A, et al. Probabilistic environmental risk assessment of zinc in Dutch surface waters [J]. Environmental Toxicology and Chemistry, 2004, 23(12): 2993-3002
[34] 孔祥臻, 何偉, 秦寧, 等. 重金屬對(duì)淡水生物生態(tài)風(fēng)險(xiǎn)的物種敏感性分布評(píng)估[J]. 中國(guó)環(huán)境科學(xué), 2011, 31(9): 1555-1562
Kong X Z, He W, Qin N, et al. Assessing acute ecological risks of heavy metals to freshwater organism by species sensitivity distributions [J]. China Environmental Science, 2011, 31(9): 1555-1562 (in Chinese)
[35] 李會(huì)仙, 張瑞卿, 吳豐昌, 等. 中美淡水生物區(qū)系中汞物種敏感度分布比較[J]. 環(huán)境科學(xué)學(xué)報(bào), 2012, 32(5): 1183-1191
Li H X, Zhang R Q, Wu F C, et al. Comparison of mercury species sensitivity distributions of freshwater biota in China and the United States [J]. Acta Scientiae Circumstantiae, 2012, 32(5): 1183-1191 (in Chinese)
[36] US EPA. National Recommended Water Quality Criteria [R]. Washington DC: Office of Research and Development, 2012
[37] Brock T, Arts G H P, Maltby L, et al. Aquatic risks of pesticides, ecological protection goals, and common aims in European Union legislation [J]. Integrated Environmental Assessment and Management, 2006, 2(4): e20-e46
◆
Non-Parametric Kernel Density Estimation of Developing Species Sensitivity Distributions
Wang Ying1,2, Feng Chenglian2, Huang Wenxian3, Liu Yuedan4, Ma Yan2,5, Zhang Ruiqing6, Wu Fengchang2,*
1. College of Water Sciences, Beijing Normal University, Beijing 100875, China 2. State Key Laboratory of Environmental Criteria and Risk Assessment, Chinese Research Academy of Environmental Science, Beijing 100012, China 3. School of Mathematical Sciences, Beijing Normal University, Beijing 100875, China 4. The Key Laboratory of Water and Air Pollution Control of Guangdong Province, South China Institute of Environmental Sciences, the Ministry of Environment Protection of PRC, Guangzhou 510065, China 5. Research Center of Environmental Biology and Green Chemistry, School of Environmental and Municipal Engineering, Qingdao Technological University, Qingdao 266033, China 6. College of Environment and Resources, Inner Mongolia University, Huhhot 010021, China
27 May 2014 accepted 4 July 2014
To address the inadequacies associated with parametric density estimations for species sensitivity distributions, we developed a new probabilistic model based on non-parametric kernel density estimation and proposed related optimal bandwidths and testing methods as well. With inorganic mercury as the target compound, the non-parametric kernel density estimation method and three conventional parametric density estimation methods were used to derive acute water quality criteria for protection of aquatic species in China. The results demonstrated that the new probabilistic model was superior over the conventional parametric density estimations in deriving water quality criteria for inorganic mercury, as well as in constructing species sensitivity distribution. The proposed method has enriched the methodological foundation for water quality criteria and provided solid support for protection of aquatic organisms.
inorganic mercury; freshwater organisms; water quality criteria; non-parametric kernel density estimation; species sensitivity distribution
環(huán)保公益項(xiàng)目(201309060;201409037) ;國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(41130743)
王穎(1989-),女,博士,研究方向?yàn)榄h(huán)境基準(zhǔn)與風(fēng)險(xiǎn)評(píng)估,E-mail: wy2012bnu@126.com;
*通訊作者(Corresponding author),E-mail: wufengchang@vip.skleg.cn
10.7524/AJE.1673-5897.20140527002
2014-05-27 錄用日期:2014-07-04
1673-5897(2015)1-215-10
X171.5
A
吳豐昌(1964—),男,博士,研究員,博士生導(dǎo)師,主要研究方向?yàn)楹次廴具^(guò)程、天然有機(jī)質(zhì)與水環(huán)境質(zhì)量基準(zhǔn)。
王穎, 馮承蓮, 黃文賢, 等. 物種敏感度分布的非參數(shù)核密度估計(jì)模型[J]. 生態(tài)毒理學(xué)報(bào), 2015, 10(1): 215-224
Wang Y, Feng C L, Huang W X, et al. Non-parametric kernel density estimation of developing species sensitivity distributions [J]. Asian Journal of Ecotoxicology, 2015, 10(1): 215-224(in Chinese)