孟 奇,周金龍,賈瑞亮,曾妍妍
(新疆農(nóng)業(yè)大學(xué)水利與土木工程學(xué)院,新疆 烏魯木齊 830052)
?
基于主成分聚類分析的地下水化學(xué)分類方法
孟奇,周金龍,賈瑞亮,曾妍妍
(新疆農(nóng)業(yè)大學(xué)水利與土木工程學(xué)院,新疆 烏魯木齊 830052)
[摘要]根據(jù)新疆巴里坤縣漢水泉地區(qū)20組承壓水水樣的K+、Na+、Ca2+、Mg2+、SO42-、Cl-和HCO3-等7個(gè)化學(xué)指標(biāo)檢測(cè)數(shù)據(jù),采用舒卡列夫分類法進(jìn)行地下水水化學(xué)類型分類。結(jié)果顯示,部分同類型之間組分含量差異較大而不同類之間組分含量差異較小,分析認(rèn)為是舒卡列夫分類法劃分界限人為性太強(qiáng)導(dǎo)致的。因此,我們采用主成分聚類分析法代替舒卡列夫分類法,對(duì)水化學(xué)類型進(jìn)行分類。本文借助SPSS軟件進(jìn)行主成分分析,提取2個(gè)主成分,將主成分得分作為指標(biāo)進(jìn)行聚類分析,最終將20組水樣劃分為6類。主成分聚類法通過(guò)消除變量之間的相關(guān)性使結(jié)果更加客觀合理。
[關(guān)鍵詞]主成分分析;聚類分析;地下水化學(xué)分類
正確合理地劃分地下水化學(xué)類型有助于分析地下水化學(xué)特征及其成因。目前地下水水化學(xué)分類方法有多種,其中舒卡列夫分類法是應(yīng)用較為廣泛的方法之一,但是此方法存在一些不足。
漢水泉地區(qū)位于新疆維吾爾自治區(qū)巴里坤哈薩克自治縣北部,北部為大哈甫提克山、呼洪得雷山,南部為白依山。研究區(qū)內(nèi)海拔460~1 700 m,地形較平坦開(kāi)闊,地形坡降約為40‰~90‰,面積為1 482 km2[1]。該地區(qū)基本無(wú)人類工程活動(dòng),人類對(duì)地下水的擾動(dòng)很少。
本文采用主成分聚類分析,將漢水泉地區(qū)20組承壓水水樣劃分為6類,通過(guò)與舒卡列夫分類法比對(duì),發(fā)現(xiàn)該方法分類結(jié)果更加客觀準(zhǔn)確,對(duì)于其他研究區(qū)的地下水水化學(xué)分類也有一定參考價(jià)值。
1研究區(qū)水文地質(zhì)條件概況
漢水泉地區(qū)內(nèi)無(wú)常年性地表水流,研究區(qū)內(nèi)及附近分布零星的泉點(diǎn),以及在融雪季節(jié)和夏季暴雨過(guò)后在溝谷中可形成暫時(shí)性的地表水流。研究區(qū)第四系、新近系形成了許多層面裂隙、構(gòu)造斷裂和孔隙等空隙,為地下水的儲(chǔ)存、循環(huán)和運(yùn)移提供了良好的場(chǎng)所,賦存基巖裂隙水、第四系松散巖類孔隙潛水和新近系碎屑巖類孔隙裂隙承壓水。研究區(qū)內(nèi)地下水類型為多層結(jié)構(gòu),即上覆第四系松散巖類孔隙潛水,下伏碎屑巖類孔隙裂隙承壓水及基巖裂隙水。
研究區(qū)地下水補(bǔ)給來(lái)源為:山區(qū)為基巖裂隙水補(bǔ)給,平原區(qū)主要為大氣降水入滲、側(cè)向徑流補(bǔ)給。山區(qū)地下水主要以基巖裂隙泉水和側(cè)向徑流為主要排泄方式。平原區(qū)以蒸發(fā)、植被蒸騰、自流井溢出為主要排泄方式。
2 地下水化學(xué)分類方法對(duì)比
2.1舒卡列夫分類法
舒卡列夫分類方法是常用的地下水化學(xué)分類方法[2]。趙麗等(2015)通過(guò)對(duì)研究區(qū)部分表層土壤和地下水取樣進(jìn)行測(cè)試分析,結(jié)合舒卡列夫分類法對(duì)研究區(qū)地下水水化學(xué)類型進(jìn)行分類,對(duì)地下水進(jìn)行了質(zhì)量綜合評(píng)價(jià)并分析了污染原因,結(jié)果表明,研究區(qū)地下水質(zhì)量不容樂(lè)觀[3]。尹恒等(2012)對(duì)德陽(yáng)市城市規(guī)劃區(qū)地下水水樣水化學(xué)分析結(jié)果,在采用舒卡列夫分類法水化學(xué)分類的基礎(chǔ)上,對(duì)研究區(qū)地下水水化學(xué)特征以及空間分布進(jìn)行了探究[4]。陸海燕等(2014)在已有資料的基礎(chǔ)上運(yùn)用舒卡列夫分類法對(duì)通州-龍旺莊地區(qū)地下水水化學(xué)類型進(jìn)行劃分,對(duì)水質(zhì)演化規(guī)律進(jìn)行了探究并分析了水質(zhì)惡化的原因[5]。郭春艷等(2014)運(yùn)用舒卡列夫法在對(duì)唐山市平原區(qū)地下水進(jìn)行了基本分類的基礎(chǔ)上,通過(guò)對(duì)研究區(qū)化學(xué)組分的濃度和分布規(guī)律的研究,更進(jìn)一步探究了研究區(qū)地下水環(huán)境的影響因素,并為該研究區(qū)地下水資源保護(hù)及開(kāi)發(fā)利用提供了依據(jù)[6]。
舒卡列夫分類法采用地下水6種主要離子Na+(K+合并于Na+中)、Ca2+、Mg2+、SO42-、Cl-和HCO3-(CO32-合并于HCO3-中),以及TDS劃分地下水化學(xué)類型。規(guī)定含量大于25%毫克當(dāng)量的陰離子與陽(yáng)離子進(jìn)行組合,將地下水化學(xué)類型劃分為49類。周金龍等(2003)認(rèn)為:該方法依據(jù)25%毫克當(dāng)量的劃分帶有一定人為性,會(huì)對(duì)分類結(jié)果造成很大影響,導(dǎo)致分類不盡合理[7]。表1是采用舒卡列夫分類法對(duì)漢水泉地區(qū)20組承壓水地下水水樣的分類結(jié)果。
表1 漢水泉地區(qū)地下水舒卡列夫法分類結(jié)果
2~5類地下水化學(xué)組分均值和變異系數(shù)見(jiàn)表2。由表2可以看出:變異系數(shù)≤0.25占28.57%,變異系數(shù)0.25~0.50占60.71%,變異系數(shù)0.50~0.75占7.15%,變異系數(shù)0.75~1.00占3.57%;平均變異系數(shù)為0.33。除4類外,同一類型的地下水化學(xué)組分含量變異系數(shù)較大(一般>0.25)。由表2還可以看出:2類和3類、4類和5類地下水化學(xué)組分差異較小。由此說(shuō)明,舒卡列夫法分類結(jié)果在很大程度上達(dá)不到同類組分含量差異較小、不同類組分含量差異較大的分類目的[7]。
表2 舒卡列夫分類法不同類型各組分平均值和變異系數(shù)一覽表
注:由于HK24-2與HK14-1單獨(dú)分為一類(1類和6類),故未列入本表;斜線左側(cè)為組分的平均含量(毫克當(dāng)量/升),斜線右側(cè)為組分含量的變異系數(shù)。
2.2主成分聚類分類法
2.2.1主成分分析
主成分分析是將原來(lái)眾多具有相關(guān)性指標(biāo),重新組合成新的無(wú)相關(guān)的綜合指標(biāo)從而替代原來(lái)的指標(biāo)。選取漢水泉地區(qū)20組承壓水7個(gè)化學(xué)指標(biāo)(K+、Na+、Ca2+、Mg2+、SO42-、Cl-和HCO3-)進(jìn)行分析,選用數(shù)據(jù)單位為毫克當(dāng)量/升。通過(guò)運(yùn)用SPSS軟件因子分析模塊對(duì)數(shù)據(jù)進(jìn)行主成分分析,為聚類分析做準(zhǔn)備。
主成分分析過(guò)程如下:
1)數(shù)據(jù)相關(guān)性
根據(jù)數(shù)據(jù)生成的相關(guān)矩陣進(jìn)行檢驗(yàn),一般認(rèn)為相關(guān)系數(shù)多數(shù)大于0.3,則認(rèn)為適合做主成分分析[8]。由表3知大多相關(guān)系數(shù)大于0.3,相關(guān)性較強(qiáng),則可以做主成分分析。KMO(Kaiser-Meyer-Olkin)檢驗(yàn)統(tǒng)計(jì)量是用于比較變量間簡(jiǎn)單相關(guān)系數(shù)和偏相關(guān)系數(shù)的指標(biāo),一般認(rèn)為低于0.5是不適合做主成分分析[8]。本文計(jì)算KMO值為0.514,說(shuō)明原始指標(biāo)中存在共線性,選用的數(shù)據(jù)適合做主成分分析。以上兩種檢驗(yàn)都判斷該組數(shù)據(jù)可以做主成分分析。
表3 相關(guān)系數(shù)矩陣
2)主成分的選取
主成分選取采用累積貢獻(xiàn)率法,大多以累計(jì)方差貢獻(xiàn)率超過(guò)85%為標(biāo)準(zhǔn),但是在本文中,通過(guò)生成結(jié)果(表4)發(fā)現(xiàn)第三主成分與原始因子相關(guān)性不強(qiáng),故提取前兩個(gè)主成分,累積貢獻(xiàn)率為80.37%(表5),即前兩個(gè)主成分代表了原始成分的80.37%的信息量,其中第一主成分累積貢獻(xiàn)率為62.13%。
表4 因子荷載矩陣
表5 主成分特征值及方差貢獻(xiàn)率
通過(guò)本文數(shù)據(jù)分析,得出因子荷載矩陣(表4)。根據(jù)數(shù)據(jù)知,主成分1代替了原始數(shù)據(jù)中的K+、Na+、Ca2+、Cl-和SO42-,其中Mg2+和HCO3-載荷相對(duì)較低,即主成分1對(duì)其解釋度較低。主成分2代替了Mg2+和HCO3-。
3)主成分得分
主成分得分的計(jì)算方法:將表4中第i列的每個(gè)元素分別除以第i個(gè)特征根的平方根,得到第i個(gè)主成分系數(shù)(表6)。
表6 主成分系數(shù)
根據(jù)表6得出前兩個(gè)主成分y1和y2線性組合為:
y1=0.36x1+0.45x2+0.45x3+0.10x4+0.44x5+0.43x6-0.28x7;
y2=-0.07x1+0.13x2+0.06x3+0.75x4+0.24x5-0.18x6+0.57x7
其中:x1,x2,x3,x4,x5,x6, x7為對(duì)原始變量標(biāo)準(zhǔn)化后的變量。
原始變量標(biāo)準(zhǔn)化采用Z-Score標(biāo)準(zhǔn)化,然后通過(guò)上式計(jì)算出主成分得分(表7)[9,10]。
表7 主成分得分
圖1 主成分聚類分析樹(shù)狀圖
2.2.2 聚類分析
用主成分得分替代原始數(shù)據(jù)進(jìn)行樣品聚類。通過(guò)SPSS聚類模塊,對(duì)20組數(shù)據(jù)的進(jìn)行系統(tǒng)聚類分析。
聚類方法選用Ward法(離差平方和法)[11-13],必須選用歐式距離[14],將主成分分析中提取的兩個(gè)主成分得分作為聚類的新指標(biāo)。根據(jù)聚類分析的結(jié)果(圖1),將20個(gè)水樣點(diǎn)劃分為6類(表8)。(其中樣點(diǎn)HK14-1與HK22-1各自聚為一類,這兩個(gè)樣點(diǎn)的TDS分別為6139.8 mg/L與6414.3 mg/L,為其余樣點(diǎn)TDS的1.4~6.5倍)。
根據(jù)上述分類計(jì)算各類離子含量平均值及變異系數(shù)(表9)。1、2、3和6類地下水化學(xué)組分均值和變異系數(shù)見(jiàn)表9。由表8可以看出:變異系數(shù)≤0.25占71.43%,變異系數(shù)0.25~0.50占28.57%,變異系數(shù)0.50~0.75占0.00%,變異系數(shù)0.75~1.00占0.00%;平均變異系數(shù)為0.21。同一類型的地下水化學(xué)組分含量變異系數(shù)明顯小于舒卡列夫分類法劃分的同一類型的地下水化學(xué)組分含量變異系數(shù)。由表9還可以看出:各類地下水化學(xué)組分含量的差異明顯大于舒卡列夫分類法劃分的同一類型的地下水化學(xué)組分含量差異。
對(duì)比表9和表2的不同類型各組分平均值和變異系數(shù)發(fā)現(xiàn),主成分聚類分析法對(duì)地下水化學(xué)類型的劃分比較客觀合理。
表8 主成分聚類分析結(jié)果
表9 主成分聚類分析法不同類型各組分平均值和變異系數(shù)一覽表
注:同表2。
3 結(jié)語(yǔ)
比較主成分聚類分析法和舒卡列夫分類法對(duì)漢水泉地區(qū)承壓水水化學(xué)的分類結(jié)果,得出以下結(jié)論:
(1)舒卡列夫法分類法劃分地下水化學(xué)類型的界限人為性強(qiáng),在很大程度上達(dá)不到同類組分含量差異較小、不同類組分含量差異較大的分類目的。
(2)主成分聚類法通過(guò)消除了變量之間的相關(guān)性使結(jié)果更加客觀合理,同一類型的地下水化學(xué)組分含量變異系數(shù)明顯小于舒卡列夫分類法劃分的同一類型的地下水化學(xué)組分含量變異系數(shù),不同類型地下水化學(xué)組分含量的差異明顯大于舒卡列夫分類法劃分的不同類型的地下水化學(xué)組分含量差異。
參考文獻(xiàn)
[1] 吳霞,吳津蓉,李巧,等.新疆漢水泉地區(qū)地下水環(huán)境背景值計(jì)算[J].人民黃河.2015,(1):83-86,90.
[2] 張人權(quán),梁杏,靳孟貴,等.水文地質(zhì)學(xué)基礎(chǔ)(第六版)[M].北京:地質(zhì)出版社.2011:67.
[3] 趙麗,王同桂,鄧春光,等.重慶市西部地區(qū)淺層地下水化學(xué)特征及污染現(xiàn)狀分析[J].地下水.2015,(1):70-72.
[4] 尹恒,吳勇,高東東,等.德陽(yáng)市城市規(guī)劃區(qū)地下水化學(xué)特征分析[J].地下水.2012,(1):30-35.
[5] 陸海燕,楊帆,辛寶東,等.北京大興迭隆起隱伏巖溶水化學(xué)特征及水質(zhì)變化原因[J].南水北調(diào)與水利科技.2014, (5):155-159.
[6] 郭春艷,馬震,張兆吉,等.唐山市平原區(qū)淺層地下水環(huán)境特征研究[J].南水北調(diào)與水利科技.2014,12(4).
[7]周金龍,董新光,蘭衛(wèi)松.分步聚類分析方法劃分地下水水化學(xué)類型[J].新疆農(nóng)業(yè)大學(xué)學(xué)報(bào).2003,26(2):72-75.
[8] 管于.實(shí)用多元統(tǒng)計(jì)分析[M].杭州:浙江大學(xué)出版社.2011:188-213.
[9] 何曉群.多元統(tǒng)計(jì)分析(第三版)[M].北京:中國(guó)人民大學(xué)出版社.2012:129-135.
[10] 王曉鵬,曹廣超.基于多元統(tǒng)計(jì)和GIS的環(huán)境質(zhì)量評(píng)價(jià)研究[M].北京:科學(xué)出版社.2013:19.
[11] 呂晉,鄔紅娟,林濟(jì)東,等.主成分及聚類分析在水生態(tài)系統(tǒng)區(qū)劃中的應(yīng)用[J].武漢大學(xué)學(xué)報(bào):理學(xué)版.2005,51(4): 461-466.
[12] 蔣群,許光泉,梁修雨.主成分和聚類分析應(yīng)用于淮南礦區(qū)地下水水質(zhì)評(píng)價(jià)[J].能源環(huán)境保護(hù).2007,21(2):51-53.
[13] 魯守剛,鄧婭敏,張美雁,等. 基于多元統(tǒng)計(jì)分析的高砷地下水水化學(xué)特征研究——以內(nèi)蒙古杭錦后旗為例[J].中國(guó)農(nóng)村水利水電.2014,(12):179-182.
[14] 胡雷芳.五種常用系統(tǒng)聚類分析方法及其比較[J].浙江統(tǒng)計(jì).2007,(4):11-13.
Groundwater Chemical Classification Method Based on Principal Component Cluster Analysis
MENGQi,ZHOU Jin-long,JIA Rui-liang,ZENG Yan-yan
(College of Water Conservancy and Civil Engineering, Xinjiang Agricultural University, Urumqi 830052, Xinjiang)
Abstract:According to the determination result of seven chemical indexes including K+, Na+, Ca2+, Mg2+, SO42-, Cl- and HCO3- of 20 groups of confined groundwater samples in Hanshuiquan region of Balikun County in Xinjiang , Shkalev classification is applied to classification of hydrochemical types. Results show that the difference among the same type of samples is relative greater and the difference among different type of samples is relative smaller which is probably due to certain artificial factors of Shkalev classification which can lead to the inaccuracy of classification results. Therefore, principal component cluster analysis is applied to classification of hydrochemical types instead of Shkalev classification. Using principal component analysis with SPSS software,two principal components were extracted in our study. The 20 groups of samples were divided into six categories according to the principal components scores which are regarded as the metric of cluster analysis. The principal component cluster analysis eliminates the correlation between variables and makes the results more objective and reasonable.
Key words:Principal component analysis;cluster analysis and groundwater chemical classification
[收稿日期]2015-07-31
[基金項(xiàng)目]中國(guó)地質(zhì)調(diào)查局“西北地區(qū)主要城市地下水污染調(diào)查評(píng)價(jià)”(1212011220982)和新疆自治區(qū)水文學(xué)及水資源重點(diǎn)學(xué)科基金(xjswszyzdxk20101202)
[作者簡(jiǎn)介]孟奇(1989-),男,江蘇徐州人,在讀碩士研究生,主攻方向:地下水利用與保護(hù)。[通訊作者]周金龍(1964-),男,浙江龍游人,教授,主要從事灌區(qū)土壤水—鹽運(yùn)移監(jiān)測(cè)與模擬、干旱區(qū)地下水利用與保護(hù)等教學(xué)與科研工作。
[中圖分類號(hào)]P641.13
[文獻(xiàn)標(biāo)識(shí)碼]A
[文章編號(hào)]1004-1184(2016)01-0005-04