劉杰剛 徐新啟 時(shí)艷茹 虞青松 李 磊
(1.中國礦業(yè)大學(xué)資源與地球科學(xué)學(xué)院,江蘇省徐州市,221116;2.煤層氣資源與成藏過程教育部重點(diǎn)實(shí)驗(yàn)室,江蘇省徐州市,221116;3.淄博礦業(yè)集團(tuán)有限責(zé)任公司,山東省淄博市,257000)
多元統(tǒng)計(jì)分析模型在礦井突水水源判別中的應(yīng)用*
劉杰剛1,2徐新啟3時(shí)艷茹1虞青松1,2李 磊1,2
(1.中國礦業(yè)大學(xué)資源與地球科學(xué)學(xué)院,江蘇省徐州市,221116;2.煤層氣資源與成藏過程教育部重點(diǎn)實(shí)驗(yàn)室,江蘇省徐州市,221116;3.淄博礦業(yè)集團(tuán)有限責(zé)任公司,山東省淄博市,257000)
綜合運(yùn)用分層聚類、逐步判別分析方法的計(jì)算原理,依據(jù)岱莊煤礦出水點(diǎn)及含水層水樣的水質(zhì)分析資料,建立多元統(tǒng)計(jì)分析模型,進(jìn)行水質(zhì)相似度分析和主要出水水源判別。研究表明分層聚類方法能夠定量、直觀地反映各水源之間水質(zhì)的親疏關(guān)系;逐步判別分析法可以有效地判別突水點(diǎn)的類型歸屬,二者互為補(bǔ)充和驗(yàn)證。
多元統(tǒng)計(jì) 分層聚類 逐步判別 出水水源 岱莊煤礦
礦井水害事故多發(fā)且容易造成嚴(yán)重的損失,一旦發(fā)生礦井突水,首先應(yīng)該判斷突水水源,為治理和進(jìn)一步預(yù)防水害事故提供依據(jù)。礦井突水水源判別方法較多,其中水化學(xué)分析方法是一種快速、準(zhǔn)確、經(jīng)濟(jì)的水源判別方法,應(yīng)用多元統(tǒng)計(jì)的水化學(xué)分析在實(shí)踐中取得了大量的成果。本文應(yīng)用多元統(tǒng)計(jì)分析模型 (分層聚類和逐步判別分析)對(duì)淄博礦業(yè)集團(tuán)岱莊煤礦下組煤首采工作面出水水源水質(zhì)進(jìn)行了分析與判別,從而研究多元統(tǒng)計(jì)水化學(xué)判斷方法的適用性。
淄博礦業(yè)集團(tuán)岱莊煤礦下組煤首采工作面出水,隨后鉆進(jìn)的水文探查孔顯示出水量隨鉆進(jìn)深度增加而變大,最大達(dá)到105.3 m3/h。造成下組煤開采突水的水源可能有16#煤層的直接頂板十下灰?guī)r溶裂隙水、底板十三灰?guī)r溶裂隙水和奧陶系灰?guī)r巖溶水。針對(duì)不同含水層的防治方法不同,需要查明出水水源,從而進(jìn)一步提出治理方案。
工作面出水后,岱莊礦先后在出水巷道掘進(jìn)面取了5次水樣進(jìn)行水質(zhì)化驗(yàn)分析,又收集、整理了該礦十下灰水樣 (6個(gè))、十三灰水樣 (15個(gè))和奧灰水樣 (10個(gè))的相關(guān)水質(zhì)分析資料,見表1,以此為基礎(chǔ)進(jìn)行多元統(tǒng)計(jì)分析。
表1 含水層及出水點(diǎn)水質(zhì)分析成果表 (6大常規(guī)離子) mg·L-1
多元統(tǒng)計(jì)分析主要包括回歸分析、聚類分析、判別分析、因子分析等方法。本文選取礦井突水水源判別中廣泛運(yùn)用的分層聚類和逐步判別分析建立多元統(tǒng)計(jì)分析模型,見圖1。
首先通過分層聚類方法計(jì)算各含水層及出水點(diǎn)水質(zhì)之間的相似性程度并繪制譜系圖,從而反應(yīng)各類別之間水質(zhì)的親疏關(guān)系,判別各含水層以及出水點(diǎn)間的水力聯(lián)系;然后采用逐步判別分析方法,通過對(duì)不同含水層水質(zhì)特征組分含量的分析,建立不同水源的判別函數(shù),再利用判別函數(shù)對(duì)待定水源進(jìn)行識(shí)別,進(jìn)而判斷出水點(diǎn)所屬的含水層。
圖1 多元統(tǒng)計(jì)分析模型示意圖
分層聚類分析方法首先將樣品或指標(biāo)各視為空間中的一類,根據(jù)類與類之間的空間距離或相似程度將最相似的類合并為一類,然后再計(jì)算新類與其他類之間的相似程度,選擇最相似的類進(jìn)行合并,如此每合并一次就減少一類,不斷進(jìn)行這一過程,直到將所有樣品或指標(biāo)合并為一類為止。本文以不同水源以及出水點(diǎn)為變量,通過它們的屬性 (水質(zhì))比較,進(jìn)行水源的分類,屬于Q型聚類分析。
2.1.1 分析過程
設(shè)選取n個(gè)水質(zhì)樣本,其中每個(gè)樣本又包含m個(gè)水質(zhì)指標(biāo),則原始數(shù)據(jù)矩陣為:
式中:i——某個(gè)水質(zhì)樣本,1≤i≤n;
j——某種水質(zhì)指標(biāo),1≤j≤m;
xij——第i個(gè)樣本的第j種指標(biāo)含量。
(1)原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理。由于各水質(zhì)指標(biāo)數(shù)量級(jí)不同,需要對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使變量處于相同的量級(jí)。文中通過極差變化,將矩陣中的每一列都轉(zhuǎn)化成0到1間的值,標(biāo)準(zhǔn)化后的水質(zhì)含量zij為:
式中:max(xj)——第j種水質(zhì)指標(biāo)的最大值;
min(xj)——第j種水質(zhì)指標(biāo)的最小值。經(jīng)標(biāo)準(zhǔn)化處理后的矩陣記為:
(2)相似統(tǒng)計(jì)量。文中主要采用Q型聚類中的歐氏距離作為計(jì)算過程的相似統(tǒng)計(jì)量,空間樣本兩兩之間的歐氏距離為:
式中:i、k——代表兩個(gè)不同的樣本,1≤i,k≤n。
歐氏距離Dik越小,相似程度越好,其大小定量地表示出水樣之間的親疏程度。
(3)聚類方法。采用聚類分析中廣泛使用的類平均法中的組間連接法 (Between-groups linkage)進(jìn)行聚類,用兩個(gè)類別中元素兩兩之間的平均平方距離來定義兩個(gè)類別間的距離平方。
2.1.2 聚類分析結(jié)果
結(jié)合水質(zhì)指標(biāo)的重要性,選取K+Na+、Ca2+、Mg2+、Cl-、SO2-4、HCO-3六大常規(guī)離子的含量作為各水樣的變量。同一含水層各水質(zhì)指標(biāo)取平均值做為數(shù)據(jù)的有效性。采用SPSS軟件先進(jìn)行數(shù)據(jù)正規(guī)化 (Z scores)處理,然后采用類間連接法 (Between-groups linkage)進(jìn)行聚類分析。最后得出相似矩陣見表2,譜系圖見圖2。
表2 聚類分析相似性矩陣
圖2 聚類分析譜系圖
表2反應(yīng)了含水層及出水點(diǎn)兩兩之間的相似距離,距離越短,說明兩者越相似,反之,兩者差別越大。圖2直觀反應(yīng)各類別聚類的先后順序。從分析結(jié)果可以看出:十三灰和奧灰之間距離最小,譜系圖中首先聚為一類,水質(zhì)特征最為相似,可能存在水力聯(lián)系;奧灰和十下灰之間距離最大,水質(zhì)特征差別最大;出水點(diǎn)與三個(gè)含水層的水質(zhì)相似程度為:十三灰>奧灰>十下灰,與前人灰色關(guān)聯(lián)度分析結(jié)果一致。分層聚類分析定量的反應(yīng)了水源之間的水質(zhì)親疏關(guān)系。
逐步判別分析是通過建立判別函數(shù),分析樣品所屬類型的一種方法。進(jìn)行判別分析時(shí),如果把所有的變量都代入判別函數(shù),不僅計(jì)算量大,而且變量間的不獨(dú)立性可能使計(jì)算的精度變低,此外,這些變量對(duì)區(qū)分各個(gè)母體所起的作用不盡相同,判斷能力有大有小。逐步判別分析主要是根據(jù)所給數(shù)據(jù)中每個(gè)變量在各類判別式中的重要性來挑選出判別效果最優(yōu)的變量進(jìn)入判別式,然后再從判別式中去除那些因?yàn)樾伦兞康倪x入而失去判別效果的變量,最終在判別式中只保留那些對(duì)母體判別能力較強(qiáng)的變量。
2.2.1 分析過程
(1)突水水源判別指標(biāo)的選取。綜合考慮離子的重要性以及數(shù)據(jù)的有效性,結(jié)合前人的研究成果,選取 K+Na+、Ca2+、Mg2+、Cl-、SO2-4、HCO-3六大常規(guī)離子作為變量,見表1。
(2)判別變量的篩選和判別函數(shù)的建立。利用SPSS軟件剔除了Ca2+、Mg2+、Cl-、HCO-34種判別能力較差的預(yù)測(cè)變量,而篩選出了K+Na+、SO2-4兩個(gè)判別能力較強(qiáng)的預(yù)測(cè)變量進(jìn)入判別函數(shù),最終得出該礦下組煤3個(gè)充水水源在Fisher準(zhǔn)則下的逐步判別函數(shù)。
把待判水樣的K+Na+、SO2-4的實(shí)際濃度值代入3個(gè)方程中,計(jì)算出相應(yīng)函數(shù)值并比較,最后把水樣劃歸為函數(shù)值最大的含水層。
(3)判別效果的檢驗(yàn)。將參與構(gòu)建判別函數(shù)的31個(gè)水樣分別代入判別函數(shù)中進(jìn)行回判檢驗(yàn),結(jié)果見表3。
從表3可以看出,回判檢驗(yàn)的正確率為83.9%,判別效果較好,可以利用判別函數(shù)對(duì)未知水樣進(jìn)行判別。
表3 判別函數(shù)的回判檢驗(yàn)結(jié)果
2.2.2 逐步判別分析結(jié)果
將出水點(diǎn)水樣K+Na+和SO2-4水質(zhì)含量代入3個(gè)判別函數(shù)方程中,計(jì)算出函數(shù)值并進(jìn)行比較,結(jié)果見表4。
通過判別函數(shù)比較,5個(gè)待判水樣全部屬于十三灰水,逐步判別結(jié)果顯示主要出水水源為十三灰水。
表4 出水點(diǎn)逐步判別分析結(jié)果
通過上述兩種多元統(tǒng)計(jì)方法的分析,兩者均證明了出水點(diǎn)的水質(zhì)和十三灰的水質(zhì)最接近,分析結(jié)果一致,得到了互相驗(yàn)證的目的,而且與前人灰色關(guān)聯(lián)分析和水質(zhì)模型分析結(jié)果相一致,說明判別結(jié)果準(zhǔn)確,有一定的說服力。
多元統(tǒng)計(jì)分析模型中,分層聚類強(qiáng)調(diào)親疏關(guān)系,實(shí)現(xiàn)了定性和定量分析的有機(jī)結(jié)合,為水源分析判斷提供了客觀的數(shù)學(xué)依據(jù);逐步判別分析強(qiáng)調(diào)類型歸屬,計(jì)算過程簡(jiǎn)單易行、構(gòu)建的模型穩(wěn)定,優(yōu)于其它判別模型。二者對(duì)水源判別各有所長,互為補(bǔ)充和檢驗(yàn),可以更加準(zhǔn)確地分析水源,防止水源分析中出現(xiàn)誤差。
[1]熊偉,崔光磊.貝葉斯判別分析在礦井突水水源預(yù)測(cè)中的應(yīng)用 [J].中國煤炭,2012(11)
[2]楊永國,黃福臣.非線性方法在礦井突水水源判別中的應(yīng)用 [J].中國礦業(yè)大學(xué)學(xué)報(bào),2007(3)
[3]楊海軍,王廣才.煤礦突水水源判別與水量預(yù)測(cè)方法綜述 [J].煤田地質(zhì)與勘探,2012(3)
[4]李燕,徐智敏等.礦井突水水源判別方法概述 [J].煤炭技術(shù),2010(11)
[5]周健,史秀志,王懷勇.礦井突水水源識(shí)別的距離判別分析模型 [J].煤炭學(xué)報(bào),2010(2)
[6]修中標(biāo),魏延雙等.聚類分析在礦井水源判別中的應(yīng)用 [J].煤礦安全,2008 (2)
[7]杜強(qiáng),賈麗艷.SPSS統(tǒng)計(jì)分析從入門到精通 [M].北京:人民郵電出版社,2011
[8]王心義,徐濤等.距離判別法在相似礦區(qū)突水水源識(shí)別中的應(yīng)用 [J].煤炭學(xué)報(bào),2011(8)
Application of multivariate statistical analysis model to identification of water inrush source in coal mines
Liu Jiegang1,2,Xu Xinqi3,Shi Yanru1,Yu Qingsong1,2,Li Lei1,2
(1.School of Resource and Earth Science,China University of Mining and Technology,Xuzhou,Jiangsu 221116,China;2.Key Laboratory of Coalbed Methane Resource and Reservoir Formation History,Ministry of Education,Xuzhou,Jiangsu 221116,China;3.Zibo Mining Group Co.,Ltd.,Zibo,Shandong 257000,China)
The comprehensive utilization of the calculation principal ofhierarchical clustering and stepwise discrimination,the multivariate statistical analysis model was set up to analyze the similarity of water quality and discriminate the source of water inrush according to the position of water inrush and the information of water quality in the aquifer in Daizhuang Coal Mine.The research showed that the hierarchical clustering method can quantitatively and visually reflect the close or distant relationship of water quality from different sources,and the stepwise discrimination analysis can effectively discriminate the type of water inrush position.Therefore,they are in complementary and verifiable relationship for each other.
multivariate statistical analysis,hierarchical clustering,stepwise discrimination,source of water inrush,Daizhuang Coal Mine
TD745.21
A
*項(xiàng)目資助:“十二五”期間江蘇省一級(jí)學(xué)科重點(diǎn)學(xué)科建設(shè)項(xiàng)目資助 (蘇孝研 〔2011〕14號(hào))
劉杰剛 (1989-),男,漢族,四川綿陽人,碩士研究生,主要從事煤與油氣地質(zhì)方面的研究工作。
(責(zé)任編輯 張艷華)