郭 兵,楊 庭,肖成磊,王永林
(中海石油環(huán)保服務(天津)有限公司,天津 300457)
由于重金屬在土壤中的理化性質(zhì)比較穩(wěn)定且遷移性比較差,通過微生物或者其他手段無法將重金屬降解,因此,重金屬會在土壤中停留相當長的時間,累積到一定程度超過土壤的承載能力會破壞土壤結(jié)構(gòu)[1],影響土壤理化性質(zhì)和土壤中的微生物群落[2]。隨著工業(yè)社會的發(fā)展,重金屬對環(huán)境的污染程度越來越得到重視,重金屬可對自然環(huán)境和人體健康帶來損害[3~5]。環(huán)境中的各種重金屬來源[6]如表1所示,工業(yè)土壤中重金屬污染場地以As、Pb、Cd、Cr污染最為典型[7]。
表1 環(huán)境中重金屬污染來源Tab.1 Source of heavy metal pollution in the environment
對于重金屬污染地塊來說,重金屬修復技術(shù)的適用性是影響修復效果的關鍵因素[8],重金屬修復技術(shù)的篩選需要以場地條件、修復目標、修復要求為依據(jù)來確定。通過土壤檢測的重金屬濃度值可以初步判斷地塊內(nèi)不同區(qū)域內(nèi)重金屬污染程度,根據(jù)污染程度的不同對污染地塊進行分塊修復,地塊分塊區(qū)域的重金屬濃度的平均值和最大值,可作為分塊修復的依據(jù),同時也為后續(xù)篩選修復技術(shù)、確定重金屬修復藥劑使用量等提供支持,而重金屬污染區(qū)域內(nèi)重金屬的取樣并不能完全覆蓋到污染區(qū)域內(nèi)每層深度的每一個點,需根據(jù)已有的重金屬數(shù)據(jù)預測分塊區(qū)域內(nèi)重金屬濃度的最大值,重金屬污染區(qū)域的重金屬濃度具有概率分布的特性,因此,可采用數(shù)理統(tǒng)計中的極值理論方法評價重金屬污染區(qū)域內(nèi)的重金屬污染情況。1930年極值理論開始應用到洪水分析、地震分析、降雨量分析、極端氣候分析等領域[9],經(jīng)過專家學者對極致理論研究的深入,極值理論被應用金融與保險領域中的股票市場崩潰、債券市場癱瘓以及匯率市場危機、工程領域中金屬容器的腐蝕情況等[10~14]。1939年瑞典科學家Weibull在材料強度測度中首先用到了極值理論[15]。1958年Gumbel應用極值理論系統(tǒng)解釋了洪水統(tǒng)計、氣象異常觀察值等問題[16]。Fisher[17]提出了極值類型定理,即獨立分布的隨機變量的最大值通過線性變換后依分布收斂于某一非退化分布。故不論總體分布F(x)是何種形式,其極值分布必定屬于極值分布類型中的一種。
1.1 極值理論
極值統(tǒng)計用于研究隨機變量局部最小值或最大值的分布規(guī)律,其原理是對最小值或最大值數(shù)據(jù)進行極值統(tǒng)計,構(gòu)造出相關實際問題的數(shù)學分析模型,根據(jù)數(shù)學模型推斷最小極值或最大極值的估計值,作為解決實際問題的依據(jù)[18]。具體來說就是根據(jù)實際工程問題中最主要的檢測數(shù)據(jù),統(tǒng)計出最小值或最大值數(shù)據(jù)集合,將其擬合為極值分布類型中的一種,作為實際工程問題的數(shù)學分析模型,然后進行統(tǒng)計分析,推斷出極小值或極大值的估計值。
表2 極值分布匯總表Tab.2 Extreme value distribution summary table
用廣義極值(GEV)分布模型[19]將三參數(shù)極值Ⅱ型(Frechet(3P))分布和三參數(shù)極值Ⅲ型(Weibull(3P))分布模型統(tǒng)一成一種分布形式,當k>0時,F(xiàn)(x)表示Frechet(3P)分布;當k<0時,F(xiàn)(x)表示W(wǎng)eibull(3P)分布,只計算GEV分布的未知參數(shù)即可確定其分布類型,更加便于統(tǒng)計分析。
(1)
1.2 參數(shù)估計
各極值分布類型未知參數(shù)的常用參數(shù)估計方法主要有:矩估計法、概率權(quán)值法、線性最小二乘法、極大似然估計法等。
在此采用矩估計法來計算極值I型分布、兩參數(shù)極值Ⅱ型分布和兩參數(shù)極值Ⅲ型分布的未知參數(shù),采用概率權(quán)值法計算廣義極值分布的未知參數(shù)。
1.2.1 矩估計
假定Xi(i=1,2,3…)是一個完全樣本,由矩估計可以得到極值I型分布、兩參數(shù)極值Ⅱ型分布(Frechet(2P))和兩參數(shù)極值Ⅲ型分布的等式。極值I型分布(Weibull(2P))的期望和均方差分別為:
(2)
(3)
根據(jù)給定數(shù)據(jù),采用傳統(tǒng)的期望和均方差公式進行計算,再由式(2)和式(3)計算出極值I型分布未知參數(shù)μ和σ。
兩參數(shù)極值Ⅱ型分布的計算等式為:
(4)
(5)
兩參數(shù)極值Ⅲ型分布的計算等式為:
(6)
(7)
同理,根據(jù)式(4)和式(5)可以計算出兩參數(shù)極值Ⅱ型分布的未知參數(shù)β和α,根據(jù)式(6)和式(7)可以計算出兩參數(shù)極值Ⅲ型分布分布的未知參數(shù)β和α。
1.2.2 概率權(quán)值法
概率權(quán)值法應用簡單,且在參數(shù)估計中具有較好的計算效果。應用概率權(quán)值法可計算廣義極值分布的未知參數(shù),具體的計算方法史道濟[19]在《實用極值統(tǒng)計方法》中有詳細描述。
1.3 土壤重金屬濃度數(shù)據(jù)統(tǒng)計分析
1.3.1 實例分析
某重金屬砷污染地塊面積為125 478.2m2,在該地塊的場地調(diào)查過程中發(fā)現(xiàn),地塊大部分區(qū)域內(nèi)存在不同程度的重金屬砷污染。對該重金屬砷污染地塊進行詳細調(diào)查,測定污染區(qū)域內(nèi)的重金屬砷濃度,重金屬濃度數(shù)據(jù)較多,為了簡化數(shù)據(jù)模型,選擇重金屬污染比較嚴重的3塊區(qū)域(A區(qū)、B區(qū)和C區(qū)),將每塊區(qū)域分成12塊,并分別在0.5m、1.5 m和3.0 m深度處取重金屬砷濃度的最大值(部分檢測點位重金屬砷未檢出),最終A、B、C塊區(qū)域內(nèi)得到重金屬砷濃度數(shù)據(jù)34個(如表3所示)。
表3 重金屬砷濃度數(shù)據(jù)表
將地塊n個重金屬砷濃度數(shù)據(jù)按照從大到小的順序排列,其中第i個重金屬砷濃度數(shù)據(jù)對應的累計概率為:
重金屬砷濃度的經(jīng)驗分布圖的X軸為重金屬砷濃度數(shù)據(jù)xi,Y軸為重金屬砷濃度數(shù)據(jù)對應的累計概率yi。
根據(jù)上述重金屬砷濃度數(shù)據(jù),采用矩估計法計算得到Gumbel、Frechet(2P)和Weibull(2P)分布的α和β的值,采用概率權(quán)值法計算得到GEV分布的k、σ和μ的值(表4)。
表4 GEV、Gumbel、Frechet(2P)和Weibull(2P)分布的參數(shù)估計值
1.3.2 擬合優(yōu)度檢驗
擬合優(yōu)度檢驗是用于檢驗某種分布刻畫給定數(shù)據(jù)是否合適的方法[20]。常用方法為:作圖法、A-D檢驗、回歸方法、K-S檢驗法、Χ2檢驗等。其中,K-S檢驗法基于累積分布函數(shù),用以檢驗一個經(jīng)驗分布與某種理論分布或者兩種經(jīng)驗分布是否有顯著性差異。其原假設H:兩個數(shù)據(jù)分布一致或者數(shù)據(jù)符合理論分布。D=max|f(x)-g(x)|,當實際觀測值D>D(n,α),則拒絕H假設,否則則接受H假設,通過查表可以得到D(n,α)的值。作圖法可形象直觀地比較出經(jīng)驗分布與各極值分布的擬合效果,從而比較出與經(jīng)驗分布的擬合效果最好的極值分布形式。P-P散點圖可以檢驗數(shù)據(jù)是否符合指定的分布,當數(shù)據(jù)符合指定分布時,P-P圖中各點近分布在直線兩側(cè),與直線偏離程度越小,說明擬合效果越好。
根據(jù)對A、B、C區(qū)域重金屬砷濃度的參數(shù)估計可知,參數(shù)k<0,A、B、C區(qū)域重金屬砷濃度數(shù)據(jù)的GEV分布就是Weibull(3P)分布。根據(jù)對A、B、C區(qū)域數(shù)據(jù)的4種分布形式進行K-S檢驗的結(jié)果(表5)說明,3個污染區(qū)域重金屬砷濃度數(shù)據(jù)的經(jīng)驗分布均拒絕原假設,即重金屬砷濃度數(shù)據(jù)的經(jīng)驗分布均符合各極值分布類型。依據(jù)圖1~圖3可以判斷,廣義極值分布與3個污染區(qū)域重金屬砷濃度數(shù)據(jù)的經(jīng)驗分布的擬合效果最好。
圖1 GEV、Gumbel、Frechet(2P)、Weibull(2P)分布與經(jīng)驗分布對比圖(A區(qū))Fig.1 Comparison of GEV, Gumbel, Frechet (2P), Weibull (2P) distribution and empirical distribution (region A)
圖2 GEV、Gumbel、Frechet(2P)、Weibull(2P)分布與經(jīng)驗分布對比圖(B區(qū))Fig.2 Comparison of GEV, Gumbel, Frechet (2P), Weibull (2P) distribution and empirical distribution (region B)
圖3 GEV、Gumbel、Frechet(2P)、Weibull(2P)分布與經(jīng)驗分布對比圖(C區(qū))Fig.3 Comparison of GEV, Gumbel, Frechet (2P), Weibull (2P) distribution and empirical distribution (region C)
根據(jù)圖1~圖3,廣義極值分布與重金屬砷濃度數(shù)據(jù)的經(jīng)驗分布擬合效果最好。GEV分布形式中k參數(shù)的取值可以說明:A、B、C區(qū)重金屬砷濃度數(shù)據(jù)均服從Weibull(3P)分布。
由A、B、C區(qū)重金屬砷濃度數(shù)據(jù)的P-P散點圖(圖4~圖6)可知,A、B、C區(qū)重金屬砷濃度數(shù)據(jù)經(jīng)驗分布與廣義極值分布的P-P點均分布在直角坐標系中直線y=x的兩側(cè),其余類型的極
圖4 各極值分布累計概率與經(jīng)驗分布概率P-P散點圖(A區(qū))Fig.4 The P-P scatter plot for the cumulative probability of each extremum distribution and the probability of the empirical distribution (region A)
圖5 各極值分布累計概率與經(jīng)驗分布概率P-P散點圖(B區(qū))Fig.5 The P-P scatter plot for the cumulative probability of each extremum distribution and the probability of the empirical distribution (region B)
圖6 各極值分布累計概率與經(jīng)驗分布概率P-P散點圖(C區(qū))Fig.6 The P-P scatter plot for the cumulative probability of each extremum distribution and the probability of the empirical distribution (region C)
值分布與經(jīng)驗分布的P-P點相對于廣義極值分布來說偏離直線y=x的程度較大,再次驗證廣義極值分布與經(jīng)驗分布的擬合效果最好。
1.3.3 重金屬砷濃度極值預測
與A、B和C區(qū)重金屬砷濃度的經(jīng)驗分布擬合效果最優(yōu)的廣義極值分布表達式如式(8)、(9)和(10):
F(x) =exp[-(-0.1337x+4.9165)1.6748]
(8)
F(x) =exp[-(-0.1131x+4.7244)2.2873]
(9)
F(x) =exp[-(-0.01585x+1.3659)21.1506]
(10)
由此可以根據(jù)GEV分布形式預測不同概率下重金屬砷濃度最大值,A、B和C區(qū)重金屬砷濃度數(shù)據(jù)在不同概率下的重金屬砷濃度最大值如表6所示。
表6 不同概率下的重金屬砷濃度最大值Tab.6 The maximum concentration value of heavy metal arsenic under different probabilities (mg/kg)
2.1 極值分布理論的廣義極值分布(GEV)模型可以很好地表達Frechet(3P)和Weibull(3P)分布,且對重金屬砷濃度數(shù)據(jù)的擬合效果最好。
2.2 Gumbel分布、Frechet(2P)分布和Weibull(2P)分布的未知參數(shù)采用矩估計法計算得出,廣義極值分布的未知參數(shù)采用概率權(quán)值法計算得出。
2.3 K-S檢驗法可以判斷重金屬砷濃度數(shù)據(jù)的經(jīng)驗分布均符合各極值分布類型,作圖法可以形象直觀的判斷出廣義極值分布類型與經(jīng)驗分布的擬合效果最好,P-P散點圖法再次驗證重金屬砷濃度數(shù)據(jù)的經(jīng)驗分布與廣義極值分布模型的擬合效果最好。
2.4 通過已有的重金屬砷濃度數(shù)據(jù)可以計算出廣義極值分布形式的表達式,由此可以得出污染地塊內(nèi)不同區(qū)域重金屬砷濃度在不同概率下的最大值。