陳永春,徐 翀,陸春輝
(1.安徽大學(xué),安徽 合肥230088;2.煤礦生態(tài)環(huán)境保護(hù)國(guó)家工程實(shí)驗(yàn)室,安徽淮南232001)
準(zhǔn)確判別礦井突水水源是煤礦防治水工作中至關(guān)重要的一步。多孔介質(zhì)中地下水化學(xué)組分與含水層本身特性息息相關(guān),利用水化學(xué)組分,借助相關(guān)理論結(jié)合軟件方法對(duì)突水水源進(jìn)行判別成為研究熱點(diǎn)之一。如利用多元統(tǒng)計(jì)分析中的數(shù)量化理論建立水源判別的線性模型,對(duì)地下水水樣進(jìn)行歸類判別[1];二級(jí)模糊綜合評(píng)判模型進(jìn)行礦井突水水源判別[2];利用灰色關(guān)聯(lián)分析對(duì)牛西礦采集水樣進(jìn)行研究,以實(shí)現(xiàn)對(duì)含水層的補(bǔ)給水源進(jìn)行快速判別[3]。其外,還應(yīng)用神經(jīng)網(wǎng)絡(luò)方法[4]、可拓識(shí)別模型[5]以及Bayes逐步判別方法[6]等進(jìn)行水源判別分析,都取得一定的判別效果。近年來(lái),一些學(xué)者將距離判別法應(yīng)用于礦井突水水源識(shí)別,結(jié)果表明,它不僅具有較強(qiáng)的判別能力,且模型簡(jiǎn)單且錯(cuò)判率低,而得到了一定認(rèn)可[7][8]。本文通過(guò)三個(gè)不同礦區(qū)的水質(zhì)數(shù)據(jù)分析,采用距離判別方法進(jìn)行突水水源識(shí)別,并與Bayes逐步判別和模糊綜合評(píng)判法進(jìn)行了對(duì)比分析,對(duì)其可靠性和準(zhǔn)確性進(jìn)行了分析,為礦井突水水源判別一定的提供參考。
距離判別分析基本原理是根據(jù)已知的若干樣本特征信息,建立判別函數(shù)對(duì)未知樣本進(jìn)行類型判別,通過(guò)樣品與總體間的距離遠(yuǎn)近,判定其歸屬類別。
1)馬氏距離。距離判別分析中的距離通常指馬氏距離。設(shè)總體G={X1,X1,…,Xm}T為m維總體,其中,樣本Xi={x1,x2,…,xm}T,令 μ1=E(Xi)(i=1,2,…,m),則總體均值向量為μ ={μ1,μ2,…,μm}T。總體 G 的協(xié)方差矩陣為:
設(shè)X,Y是從總體G中抽取的兩個(gè)樣本,則X與Y之間的平方馬氏距離為:
樣本X與總體G的馬氏距離的平方定義為:
2)多個(gè)總體的距離判別。設(shè)有g(shù)個(gè)m維總體G1,G2,…,Gg,均值向量分別為 μ1,μ2,…,μg,協(xié)方差矩陣分別為 Σ1,Σ2,…,Σg,則樣本X到各組的平方馬氏距離是:
表1 潘二礦區(qū)水樣樣本及回判結(jié)果
在淮南潘二礦采集了35個(gè)不同含水層的樣本,其中31個(gè)已知樣本數(shù)據(jù),4個(gè)待判水樣,如表1所示,其井田充水水源為新生界底部松散層水、二疊系砂巖裂隙水、太原組灰?guī)r水和奧陶系灰?guī)r水等,此處分為三類即松散層水(19個(gè)樣本)、砂巖水(7個(gè)樣本)和灰?guī)r水(5個(gè)樣本),模型輸出結(jié)果分別為I、II、III。在山西河池礦區(qū)采集23個(gè)水樣,其中樣本數(shù)據(jù)20個(gè),待判樣本3個(gè),如表2所示,水源類型分別為4至6煤頂水(8個(gè)樣本)、奧灰水(6個(gè)樣本)、6煤底至奧灰水(5個(gè)樣本)、白堊系水(1個(gè)樣本),模型輸出結(jié)果分別為 I、II、III、IV。同時(shí)利用文獻(xiàn)[1]提供的焦作礦區(qū)水樣數(shù)據(jù),共39個(gè)樣本,其中35個(gè)樣本數(shù)據(jù),待判樣本4個(gè),水樣來(lái)源于4個(gè)主要含水層,即二灰和奧陶紀(jì)含水層、八灰含水層、頂板砂巖含水層和第四系含水層(砂礫石成分以石灰?guī)r為主),模型輸出結(jié)果分別為 I、II、III、IV。
表2 河池礦區(qū)水樣樣本及回判結(jié)果
研究表明不同礦井突水水源的化學(xué)特征均有其特殊性,從而能夠?qū)ζ渥R(shí)別的特征離子也各不相同[1],為了保證所建立判別模型的可靠性,選擇合適的建模變量至關(guān)重要。此處參照已有研究結(jié)論,首先對(duì)三種水樣均選取Ca2+(x1)、Mg2+(x2)、K++Na+(x3)、SO42-(x4)、Cl-(x5)、HCO3
-(x6)為判別因子,進(jìn)行水源距離判別分析。
此處假定各類總體的協(xié)方差矩陣相等,分別對(duì)各水樣樣本數(shù)據(jù)進(jìn)行訓(xùn)練,建立判別函數(shù)。
首先對(duì)潘二礦區(qū)水樣進(jìn)行判別,,然后對(duì)樣本數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)后,可得判別函數(shù)如下:
W12(x1,x2,x3,x4,x5,x6)= - W21(x1,x2,x3,x4,x5,x6)=0.927 4 –0.000 903 2x1+0.245 3x2 -0.010 39x3+0.000 702 6x4 -0.000 466 9x5+0.010 98x6
W13(x1,x2,x3,x4,x5,x6)= - W31(x1,x2,x3,x4,x5,x6)=18.328 6 – 0.108 2x1 +0.321 1x2 - 0.038 03x3 +0.000 706 5x4 -0.014x5+0.026 65x6
W23(x1,x2,x3,x4,x5,x6)= - W32(x1,x2,x3,x4,x5,x6)=17.401 2 – 0.107 2x1+0.075 74x2 -0.027 64x3+0.000 038 57x4 -0.014 45x5+0.015 68x6
河池礦區(qū)水樣樣本判別函數(shù)如下:
W12x1,x2,x3,x4,x5,x6)= - W21(x1,x2,x3,x4,x5,x6)=14.678 6+0.188 8x1 -0.504x2 -0.036 28x3+0.000 4176x4 -0.045 15x5+0.041 33x6
W13(x1,x2,x3,x4,x5,x6)= - W31(x1,x2,x3,x4,x5,x6)=1.246 6 -0.034 16x1 -0.022 69x2 -0.029 65x3+0.002 564x4-0.012 63x5+0.005 92x6
W14(x1,x2,x3,x4,x5,x6)= - W41(x1,x2,x3,x4,x5,x6)=14.678 6+0.188 8x1 -0.504 x2 -0.036 28x3+0.000 4176x4 -0.045 15x5+0.041 33x6
W23(x1,x2,x3,x4,x5,x6)= - W32(x1,x2,x3,x4,x5,x6)=-13.432 -0.154 7x1+0.526 7x2 -0.065 92x3+0.002 146x4-0.057 77x5+0.035 41x6
W24(x1,x2,x3,x4,x5,x6)= - W42(x1,x2,x3,x4,x5,x6)=-17.624 9 - 0.188 2x1+0.639 5x2 - 0.017 69x3 +0.000 8665x4 -0.039 76x5+0.040 09x6
W34(x1,x2,x3,x4,x5,x6)= - W43(x1,x2,x3,x4,x5,x6)=-4.193 -0.033 48x1+0.112 8x2 -0.048 23x3+0.003 013x4-0.018 01x5+0.004 68x6
文獻(xiàn)[1]提供的焦作礦區(qū)水樣判別函數(shù)如下:
W12(x1,x2,x3,x4,x5,x6)= - W21(x1,x2,x3,x4,x5,x6)=-2.362 1+0.038 79x1 -0.215 8x2 -0.523 4x3+0.245 9x4 -0.050 04x5 -0.023 97x6
W13(x1,x2,x3,x4,x5,x6)= - W31(x1,x2,x3,x4,x5,x6)=14.117 7 -0.031 58x1 -0.052 28x2 -0.223 3x3 -0.265 1x4+0.117 5x5 -0.005 885 x6
W14(x1,x2,x3,x4,x5,x6)= - W41(x1,x2,x3,x4,x5,x6)=18.548 1+0.021 55x1 -0.227 1x2+0.089 71x3 -0.548 6x4+0.266 8x5 -0.014 92x6
W23(x1,x2,x3,x4,x5,x6)= - W32(x1,x2,x3,x4,x5,x6)=16.479 9 - 0.070 37x1 - 0.268 x2+0.3x3 - 0.511 1x4+0.067 52x5+0.018 08x6
W24(x1,x2,x3,x4,x5,x6)= - W42(x1,x2,x3,x4,x5,x6)=20.910 3 -0.017 24x1 -0.442 9x2+0.613 2x3 -0.794 5x4+0.216 8x5+0.009 041 x6
W34(x1,x2,x3,x4,x5,x6)= - W43(x1,x2,x3,x4,x5,x6)=4.430 4+0.053 13x1 - 0.174 8x2+0.313 x3 - 0.283 4x4+0.149 3x5 -0.009 042 x6
判別模型的可靠性可通過(guò)對(duì)已知分類樣本的回判準(zhǔn)確率進(jìn)行驗(yàn)證[9]。如表1所示,潘二礦回判準(zhǔn)確率較好,除樣本25誤判外,其余均與實(shí)際情況符合,說(shuō)明建立的潘二礦區(qū)距離判別模型是合理的。焦作礦區(qū)水樣回判正確率也較好,除樣本5誤判為IV類外,其余均與實(shí)際符合,這與文獻(xiàn)[4]的分析結(jié)論也基本一致。而如表2所示,河池礦區(qū)樣本數(shù)據(jù)回判準(zhǔn)確率卻較差,如樣本1,3,6,14,18,19均出現(xiàn)了誤判,說(shuō)明河池礦區(qū)距離判別函數(shù)模型不能滿足應(yīng)用要求。對(duì)河池礦區(qū)水樣數(shù)據(jù)初步分析認(rèn)為可能是樣本數(shù)據(jù)中選取的判別因子差異性不強(qiáng),造成誤判率較高,此處樣本數(shù)據(jù)個(gè)數(shù)不變,增加總硬度(x7)、堿度(x8)、PH值(x9)和礦化度(x10)為判別因子,考察是否能夠改善距離判別模型準(zhǔn)確性。重新進(jìn)行水樣樣本數(shù)據(jù)訓(xùn)練,建立判別函數(shù)如下:
W12(x1,x2,x3,x4,x5,x6)= - W21(x1,x2,x3,x4,x5,x6)=220.2+5 605.34x1 -9 474.6x2 -358.28x3 -358.3x4 -358.12x5 -358.1x6 -2 389.2x7+0.384 8x8 -18.9x9+358.08x10
W13(x1,x2,x3,x4,x5,x6)= - W31(x1,x2,x3,x4,x5,x6)=-4.574+363.68x1 - 614.84x2 -23.253x3 -23.223x4 - 23.251x5 -23.254x6 - 154.99x7 - 0.048 59x8+1.167 8x9+23.2481x10
W14(x1,x2,x3,x4,x5,x6)= - W41(x1,x2,x3,x4,x5,x6)=220.2+5 605.34x1 -9 474.6x2 -358.28x3 -358.3x4 -358.12x5 -358.1x6 -2 389.2x7+0.384 8x8 -18.9x9+358.08x10
W23(x1,x2,x3,x4,x5,x6)= - W32(x1,x2,x3,x4)= - 195.15 -5 241.64x1 - 8 859.78x2+335.05x3 - 335.11x4+334.86x5+334.85x6
W24(x1,x2,x3,x4,x5,x6)= - W42(x1,x2,x3,x4)= - 431.34 -8 375.42x1 -14 157.2x2+535.34x3+535.56x4+535.05x5+535.01x6
W34(x1,x2,x3,x4,x5,x6)= - W43(x1,x2,x3,x4)= - 218.02 -3 133.77x1 -5 297.43x2+200.31x3+200.46x4+200.17x5-200.18x6
利用樣本數(shù)據(jù)重新進(jìn)行回判檢驗(yàn),樣本8誤判為III類,樣本19誤判為I類,其余均與實(shí)際相符,總體回判準(zhǔn)確率為90%,說(shuō)明增加判別因子后,建立的距離判別模型準(zhǔn)確性得到明顯改善,可以應(yīng)用于水源判別。
利用前面建立的距離判別模型對(duì)未知水源進(jìn)行判別,除河池礦區(qū)水樣外,判別因子均為Ca2+(x1)、Mg2+(x2)、K++Na+(x3)、SO4
2-(x4)、Cl-(x5)、HCO3-(x6)。如表3和表4所示分別為潘二礦區(qū)、焦作礦區(qū)水樣判別結(jié)果,表中同時(shí)列出了用Bayes逐步判別法、模糊綜合評(píng)判法得到的判別結(jié)果??梢钥闯霾捎镁嚯x判別法得到的結(jié)果與Bayes逐步判別法完全相同,而模糊評(píng)判法對(duì)潘二礦區(qū)水樣樣本2則出現(xiàn)了誤判。
表3 潘二礦區(qū)抽取水樣判別結(jié)果
表4 焦作礦區(qū)抽取水樣判別結(jié)果
由表3和表4可以看出,距離判別法、Bayes判別法與模糊綜合評(píng)判均具有較高的判別準(zhǔn)確率,說(shuō)明這些判別模型完全可以應(yīng)用于這兩個(gè)礦區(qū)的水源判別。
以 Ca2+(x1)、Mg2+(x2)、K++Na+(x3)、SO42-(x4)、Cl-(x5)、HCO-3(x6)、總硬度(x7)、堿度(x8)、PH 值(x9)和礦化度(x10)為判別因子,對(duì)河池礦區(qū)待判水樣進(jìn)行判別分析,具體結(jié)果如表5所示。樣本3出現(xiàn)了誤判,實(shí)際為I類,判別為IV類,經(jīng)分析可能是樣本3水樣混入了奧灰水所致。
表5 河池礦區(qū)抽取水樣判別結(jié)果
另外,判別因子不變,利用Bayes逐步判別法和模糊綜合評(píng)判法對(duì)河池礦區(qū)水樣進(jìn)行了判別分析,結(jié)果如表6所示??梢钥闯鼍嚯x判別法與Bayes逐步判別得到的結(jié)論完全一致,而與模糊綜合評(píng)判法差別較大。為了檢驗(yàn)?zāi):C合評(píng)判模型對(duì)河池礦區(qū)水樣判別的準(zhǔn)確性,利用樣本數(shù)據(jù)進(jìn)行了回判檢驗(yàn),發(fā)現(xiàn)樣本 1、2、3、4、6、7、9、16、18、19 均出現(xiàn)了誤判,可以看出在增加了特征判別因子的情況下,距離判別模型和Bayes逐步判別模型對(duì)于河池礦區(qū)水樣判別表現(xiàn)了較好的準(zhǔn)確率和穩(wěn)定性,而模糊綜合評(píng)判模型準(zhǔn)確率仍較差,無(wú)法應(yīng)用于此礦區(qū)水樣判別。
表6 河池礦區(qū)抽取水樣判別結(jié)果
(1)距離判別方法可應(yīng)用于礦井突水水源的判別預(yù)測(cè),一般情況下利用六大基本離子建立的距離判別分析模型具有較強(qiáng)的判別能力,即可滿足應(yīng)用要求,但對(duì)一些六大基本離子類間特異性不強(qiáng)的水樣,則需要增加特征判別因子,重新訓(xùn)練樣本數(shù)據(jù),建立距離判別分析模型,以增強(qiáng)模型判別準(zhǔn)確率和可靠性。
(2)以上三個(gè)礦區(qū)水樣判別分析表明,距離判別法表現(xiàn)出了較好的穩(wěn)定性和可靠性,與Bayes?逐步判別法判別準(zhǔn)確率相同,而高于模糊綜合評(píng)判法。從而在選取合適的判別因子的前提下,利用距離判別分析法可實(shí)現(xiàn)礦井突水水源的準(zhǔn)確判別。
(3)相比于其它較為成熟的方法,距離判別法在礦井突水水源中的應(yīng)用尚處于探索階段,如何針對(duì)不同類型的突水水源、選擇合適的判別因子以保證判別準(zhǔn)確率,仍需要進(jìn)一步深入研究。
[1]張?jiān)S良,張子戌,彭蘇萍.數(shù)量化理論在礦井突(涌)水水源判別中的應(yīng)用[J].中國(guó)礦業(yè)大學(xué)學(xué)報(bào),2003,32(3):251 -254.
[2]余克林,楊永生,章臣平.模糊綜合評(píng)判法在判別礦井突水水源中的應(yīng)用[J].金屬礦山,2007,3:47-50
[3]關(guān)英斌,鄭建,豐成.灰色關(guān)聯(lián)分析在牛西礦水源判別中的應(yīng)用[J].河北工程大學(xué)學(xué)報(bào),2011,28(1):81-84
[4]徐忠杰,楊永國(guó),湯琳.神經(jīng)網(wǎng)絡(luò)在礦井水源判別中的應(yīng)用[J].煤礦安全,2007(2):4 -6.
[5]張瑞鋼,錢(qián)家忠,馬雷.可拓識(shí)別方法在礦井突水水源判別中的應(yīng)用[J].煤炭學(xué)報(bào),2009,34(1):33-38
[6]張春雷,錢(qián)家忠,趙衛(wèi)東.Bayes方法在礦井突水水源判別中的應(yīng)用[J].煤田地質(zhì)與勘探,2010,38(4):34 -37
[7]王心義,徐濤,黃丹.距離判別法在相似礦區(qū)突水水源識(shí)別中的應(yīng)用[J].煤炭學(xué)報(bào),2011,36(8):1354-1358
[8]周健,史秀志,王懷勇.礦井突水水源識(shí)別的距離判別分析模型[J].煤炭學(xué)報(bào),2010,35(2):278 -282
[9]梅長(zhǎng)林,范金城.數(shù)據(jù)分析方法[M].北京:高等教育出版社,2006.