楊國華, 馮文新, 孟 博
(1.河南地礦職業(yè)學(xué)院,鄭州 450070;2.吉林大學(xué) 新能源與環(huán)境學(xué)院,長春 130021)
地下水中的氮來源廣泛,包括大氣、雨水、污水、土壤、含水層介質(zhì)、含氮化學(xué)物質(zhì)、糞便等[1-5],且氮在地下水中具有很強的遷移能力[6]。查明地下水氮濃度現(xiàn)狀,了解其成因并提出相應(yīng)的治理措施是十分重要的。目前地下水氮濃度調(diào)查往往通過水井獲取測試樣品,僅能得到有限個離散點的污染物濃度數(shù)據(jù)。要獲得地下水氮濃度的空間分布狀況,則需要通過空間插值手段來實現(xiàn)。ArcGIS軟件的地統(tǒng)計向?qū)Чδ芴峁┝硕喾N內(nèi)插方法,可分為確定性方法和地統(tǒng)計方法兩大類。確定性方法包括反距離權(quán)重法、徑向基函數(shù)法等;地統(tǒng)計方法包括克里金法、面插值法等[7]。
本文以中國東北某灌區(qū)的地下水氮濃度監(jiān)測數(shù)據(jù)為基礎(chǔ),分別使用反距離權(quán)重法、徑向基函數(shù)插值法、普通克里金法、簡單克里金法、泛克里金法、指示克里金法、析取克里金法及經(jīng)驗貝葉斯克里金法進行插值得到研究區(qū)的地下水氮濃度分布圖;在此基礎(chǔ)上通過比較交叉驗證方法獲取的插值預(yù)測誤差,對比不同插值方法在地下水氮濃度分析中的可行性。
東北某灌區(qū)總面積192.76 km2,整體地勢低平,東部略高,地面坡度1∶1 000~1∶2 000,區(qū)域內(nèi)高平原的海拔高度為55~65 m,河谷平原的海拔高度為53~54 m,發(fā)育有沼澤濕地。區(qū)內(nèi)第四紀(jì)以來一直處于間歇性下降,沉積了厚度較大(100~150 m)的第四系。地層沉積物顆粒松散,孔隙發(fā)育,為地下水的賦存創(chuàng)造了條件。
含水層由早中更新統(tǒng)至全新統(tǒng)組成。由于不同時代含水層之間沒有分布穩(wěn)定的隔水層,形成了統(tǒng)一的含水巖組,換算成涌水量變化范圍為100~5 000 m3/d。含水層上部大多覆蓋一層厚度為2~5 m的粉質(zhì)黏土,從高平原向河谷漫灘粉質(zhì)黏土由厚變薄,地下水類型由承壓水過渡到微承壓水至潛水,水位埋深受地貌控制:沖積河谷平原區(qū)水位埋深1~3 m,沖湖積高平原區(qū)水位埋深3~7 m。區(qū)域內(nèi),含水層厚度不均,沖湖積高平原含水層厚度為50~80 m,沖積河谷平原含水層厚度為20~30 m。
大氣降水通過部分表層粉質(zhì)黏土層較薄的區(qū)域形成的“天窗”補給地下水,河流入滲、農(nóng)田灌溉的渠系入滲和田間入滲,都對地下水有一定的補給作用。灌區(qū)內(nèi)地下水的水力坡度為1∶5 000~1∶10 000,地下水徑流運動遲緩,徑流方向基本與地形坡向一致,總體上由南東向北西方向徑流。灌區(qū)地下水主要以側(cè)向徑流、蒸發(fā)和人工開采等方式排泄。
2017年8月,在研究區(qū)共采集了35件地下水樣品(圖1、表1),采樣井平均深度34.22 m,取樣層位在第四系巨厚孔隙含水巖組上部,所有樣品均屬于淺層地下水。從表1中可以看出:區(qū)內(nèi)地下水品質(zhì)的空間變異性普遍較大?;谶@些采樣所獲得的離散點水質(zhì)信息,需要通過適當(dāng)?shù)牟逯捣椒ú拍塬@得區(qū)域上的水質(zhì)分布特征。
圖1 地下水采樣點位置圖Fig.1 Sampling points of groundwater
表1 地下水樣品檢測結(jié)果統(tǒng)計特征值Table 1 Statistical characteristic values from detected groundwater samples
若一種插值方法預(yù)測的值與采樣位置的測量值相同,則稱之為精確插值器。本文選用的反距離權(quán)重法和徑向基函數(shù)插值法均是精確插值器。
反距離權(quán)重法基于相近相似性原理,用待估點周圍鄰近采樣點的值貢獻(xiàn)權(quán)重與距離成反比對其值進行預(yù)測,距預(yù)測位置越近的測量值對預(yù)測值的影響越大[8]。該方法具有原理易懂、便于計算的優(yōu)點,不要求數(shù)據(jù)具有一定的分布規(guī)律,在氣溫[9]、降雨量[10]的空間插值,大氣[11]、地表水[12]、地下水[5]中的污染物濃度分析等領(lǐng)域中均有廣泛使用。但其插值結(jié)果受數(shù)據(jù)中的極值影響很大,往往會圍繞極值點形成“牛眼”使預(yù)測結(jié)果的準(zhǔn)確性降低,常用于進行精確插值前的預(yù)插值[8]。
徑向基函數(shù)插值法的基本思路是:插值表面必須通過每一個測得的采樣值,并使用可能己經(jīng)超出樣本數(shù)據(jù)范圍的觀測值來構(gòu)建具有漸變趨勢的平滑表面[13]。在土壤重金屬污染的預(yù)測中,一些學(xué)者的研究顯示應(yīng)用徑向基函數(shù)插值可以取得良好效果[14-15]。
克里金(Kriging)插值法是應(yīng)用于地下水模擬、土壤污染模擬、降水量模擬等領(lǐng)域最廣泛的插值方法[16],是一種常用的地質(zhì)統(tǒng)計格網(wǎng)化方法[2],當(dāng)數(shù)據(jù)點越多時,得到的內(nèi)插結(jié)果越可信[17-19]。
常用的克里金法包括如下幾類:①當(dāng)隨機變量x0的數(shù)學(xué)期望E(x0)對所有位置都是一個未知常數(shù)時,可采用普通克里金插值方法[19]。②當(dāng)隨機變量x0的數(shù)學(xué)期望E(x0)對所有位置都是一個已知的常數(shù)時,可采用簡單克里金插值方法[18]。③當(dāng)隨機變量x0的數(shù)學(xué)期望E(x0)是非平穩(wěn)、存在漂移時,可采用泛克里金插值法,充分利用數(shù)據(jù)點的空間相關(guān)性,并能有效解決數(shù)據(jù)邊界擴展問題[20]。④當(dāng)區(qū)域化變量不服從正態(tài)或?qū)?shù)正態(tài)分布時,可采用指示克里金方法,該方法無需對變量的分布形態(tài)做出假設(shè),但要求樣本數(shù)據(jù)滿足強平穩(wěn)性要求[21]。⑤當(dāng)待插值數(shù)據(jù)不符合正態(tài)分布規(guī)律時,也可使用經(jīng)驗貝葉斯克里金方法,該方法使用固有的隨機函數(shù)作為克里金模型,可對數(shù)據(jù)的趨勢進行校正,在處理地質(zhì)層面高程估計方面具有一定的優(yōu)越性[22],但處理速度相對其他克里金法較慢。
在選取的各種插值方法中,反距離權(quán)重法和徑向基函數(shù)法作為確定性插值方法,不要求數(shù)據(jù)具有一定的分布規(guī)律,可直接使用污染物濃度測量數(shù)據(jù)進行插值。各種克里金插值法(不包含經(jīng)驗貝葉斯克里金法)均需要數(shù)據(jù)在一定程度上符合正態(tài)分布的趨勢,因此如果數(shù)據(jù)不呈正態(tài)分布,應(yīng)對數(shù)據(jù)進行變換使其符合正態(tài)分布。
首先利用地統(tǒng)計向?qū)е械臄?shù)據(jù)探索功能對數(shù)據(jù)進行分析,檢驗數(shù)據(jù)分布,找出離群點,防止由于測量和輸入錯誤的離群值的存在影響半變異建模。本文使用的地下水氮濃度測量數(shù)據(jù)存在少量離群值,但均屬真實值,不應(yīng)去除;數(shù)據(jù)正態(tài)分布情況檢驗結(jié)果表明,研究區(qū)的地下水“三氮”污染物中,氨氮濃度較好地滿足正態(tài)分布規(guī)律,硝酸鹽氮和亞硝酸鹽氮濃度在進行了自然對數(shù)變換后更加符合正態(tài)分布規(guī)律(表2)。利用數(shù)學(xué)曲面模擬要素在空間上的分布規(guī)律及其變化趨勢,以此在建模中更準(zhǔn)確地模擬短程隨機變異。
表2 “三氮”測量數(shù)據(jù)分布偏度、峰度系數(shù)Table 2 Distribution of skewness and kurtosis coefficients of measurement data for three kinds of nitrogen
在誤差檢驗方面,采用交叉驗證的方法,比較不同插值方法的插值預(yù)測誤差中的平均值誤差、均方根誤差、標(biāo)準(zhǔn)化平均值誤差、標(biāo)準(zhǔn)均方根誤差和平均標(biāo)準(zhǔn)誤差。具體的評判標(biāo)準(zhǔn)為:當(dāng)平均值誤差和標(biāo)準(zhǔn)平均值誤差越接近0、標(biāo)準(zhǔn)均方根誤差越接近1、平均標(biāo)準(zhǔn)誤差和均方根誤差數(shù)值相差越小,表明插值結(jié)果精度越高。
采用7種插值方法得到了研究區(qū)氨氮濃度預(yù)測結(jié)果(圖2)。以GB/T 14848-93《地下水質(zhì)量標(biāo)準(zhǔn)》的5類水中氨氮含量標(biāo)準(zhǔn)作為圖中填充等值線的劃分界限。因區(qū)內(nèi)地下水氨氮濃度普遍較高,在Ⅴ類水氨氮質(zhì)量濃度(ρ)>0.5 mg/L的基礎(chǔ)上增加了>2.5 mg/L的等值線來區(qū)分污染的嚴(yán)重程度。不同的插值方法得到的插值結(jié)果圖大體是相似的,均可看出區(qū)內(nèi)的地下水氨氮污染狀況十分嚴(yán)重,除東部少數(shù)區(qū)域,絕大部分區(qū)域的地下水氨氮質(zhì)量濃度均高于0.5 mg/L,屬于Ⅴ類水,中南部的條帶狀區(qū)域內(nèi)氨氮質(zhì)量濃度可達(dá)2.5 mg/L以上。
圖2 研究區(qū)地下水氨氮濃度分布圖Fig.2 Spatial distribution of ammonium concentration in groundwater in the study area
以GB/T 14848-93《地下水質(zhì)量標(biāo)準(zhǔn)》的5類水中亞硝酸鹽氮含量標(biāo)準(zhǔn)為濃度等級界限,采用不同插值方法得到的研究區(qū)亞硝酸鹽氮濃度預(yù)測結(jié)果如圖3所示。簡單克里金法和指示克里金法的插值結(jié)果顯示區(qū)內(nèi)亞硝酸鹽氮濃度均基本處于Ⅱ類水標(biāo)準(zhǔn)。其余各種插值方法顯示的插值結(jié)果區(qū)別不大,即由西北向東南方向亞硝酸鹽氮濃度逐漸升高,大部分地區(qū)滿足Ⅰ類水標(biāo)準(zhǔn);東南部地區(qū)由泛克里金法顯示可達(dá)Ⅱ類水標(biāo)準(zhǔn),反距離權(quán)重法、徑向基函數(shù)法、普通克里金法和經(jīng)驗貝葉斯克里金法均顯示污染物濃度僅滿足Ⅳ類水標(biāo)準(zhǔn)。
圖3 研究區(qū)地下水亞硝酸鹽氮濃度分布圖Fig.3 Spatial distribution of nitrite nitrogen concentration in groundwater in study area
以GB/T 14848-93《地下水質(zhì)量標(biāo)準(zhǔn)》的5類水中亞硝酸鹽氮含量標(biāo)準(zhǔn)為濃度等級界限,采用不同插值方法得到的研究區(qū)硝酸鹽氮濃度預(yù)測結(jié)果如圖4。區(qū)內(nèi)地下水硝酸鹽氮濃度普遍符合Ⅰ類水標(biāo)準(zhǔn);除徑向基函數(shù)法和簡單克里金法,其他插值方法的預(yù)測結(jié)果均顯示南部少量區(qū)域的硝酸鹽氮濃度處于Ⅱ、Ⅲ類水標(biāo)準(zhǔn)。
圖4 研究區(qū)地下水硝酸鹽氮濃度分布圖Fig.4 Spatial distribution of nitrate nitrogen concentration in groundwater in study area
氨氮濃度各種插值方法的誤差統(tǒng)計值如表3所示。灌區(qū)內(nèi)地下水氨氮的濃度較好地符合正態(tài)分布規(guī)律,通過交叉檢驗誤差顯示出的插值精度普遍較好。根據(jù)誤差檢驗評判標(biāo)準(zhǔn):普通克里金法標(biāo)準(zhǔn)平均誤差最接近0,標(biāo)準(zhǔn)均方根誤差最接近1;簡單克里金法平均誤差最接近0;經(jīng)驗貝葉斯克里金法的均方根誤差與平均標(biāo)準(zhǔn)誤差最為接近。上述3種方法預(yù)測結(jié)果均顯示插值與測量值之間的差距小,得到了較為理想的插值結(jié)果。
表3 氨氮濃度插值檢驗誤差比較Table 3 Statistical error of different interpolation methods (ammonium)
亞硝酸鹽氮濃度各種插值方法的誤差統(tǒng)計值如表4。比較不同插值方法的檢驗誤差可以得出,普通克里金法和經(jīng)驗貝葉斯克里金法的平均誤差均很接近0;普通克里金法的標(biāo)準(zhǔn)平均誤差更接近0;經(jīng)驗貝葉斯克里金法的標(biāo)準(zhǔn)均方根誤差更接近1,且其平均標(biāo)準(zhǔn)誤差與均方根誤差最為接近。經(jīng)驗貝葉斯克里金法是通過估計基礎(chǔ)半變異函數(shù)來說明所引入的誤差;而其他克里金方法通過已知的數(shù)據(jù)位置計算半變異函數(shù),由于不考慮半變異函數(shù)估計的不確定性,其他克里金方法都低估了預(yù)測的標(biāo)準(zhǔn)誤差??紤]到以上情況,綜合判斷通過經(jīng)驗貝葉斯克里金法得到的亞硝酸鹽氮濃度插值結(jié)果精度最佳。
表4 亞硝酸鹽氮濃度插值檢驗誤差比較Table 4 Statistical error of different interpolation methods (nitrite)
硝酸鹽氮濃度各種插值方法的誤差統(tǒng)計值如表5。由表2可知硝酸鹽氮濃度測量數(shù)據(jù)分布不夠符合正態(tài)分布規(guī)律,在經(jīng)過對數(shù)變換后有所改善,但偏度系數(shù)仍然達(dá)到1.712。硝酸鹽氮的插值結(jié)果相比于氨氮、亞硝酸鹽氮,誤差相對較大。比較不同插值方法的檢驗誤差,可見經(jīng)驗貝葉斯克里金法的平均誤差較小、平均標(biāo)準(zhǔn)誤差最小、標(biāo)準(zhǔn)化均方根誤差最接近1、平均標(biāo)準(zhǔn)誤差與均方根誤差最為接近,與其他插值方法相比,經(jīng)驗貝葉斯克里金法插值精度更高。
表5 硝酸鹽氮濃度插值檢驗誤差比較Table 5 Statistical error of different interpolation methods (nitrate)
本文應(yīng)用ArcGIS軟件提供的插值方法對地下水氮濃度分布狀態(tài)進行分析,比較不同插值方法的檢驗誤差,可見當(dāng)?shù)叵滤獫舛葴y量數(shù)據(jù)較好地符合正態(tài)分布規(guī)律時,各種空間插值方法的預(yù)測精度均較高;當(dāng)數(shù)據(jù)空間變異性較大、不符合正態(tài)分布規(guī)律時,經(jīng)驗貝葉斯克里金法得到的插值結(jié)果往往優(yōu)于確定性插值方法和其他克里金插值方法。因此,在實際研究區(qū)域中,地下水污染物濃度的空間插值方法應(yīng)結(jié)合實測數(shù)據(jù)的特點進行選擇:污染物濃度的測量數(shù)據(jù)較好地符合正態(tài)分布規(guī)律時,考慮選擇操作簡便、運算速度快的插值方法即可;當(dāng)數(shù)據(jù)空間變異性較大、正態(tài)分布規(guī)律不顯著時,可優(yōu)先考慮選用經(jīng)驗貝葉斯克里金法,以提高結(jié)果的可靠性。
數(shù)據(jù)獲取不充分,在地學(xué)領(lǐng)域是普遍存在的問題[22],基于數(shù)據(jù)規(guī)律選擇適宜的空間插值方法只是解決問題的一種技術(shù)手段;加深對地下水污染成因與演化規(guī)律的理解和認(rèn)識,才是保障空間插值結(jié)果科學(xué)性的根本保障。下一步工作將研究如何把地下水污染形成與演化的主要控制因素(地質(zhì)條件、水文地質(zhì)條件等)納入空間插值體系中,以進一步提高插值結(jié)果的可靠性。