李長興,辛程鵬,李回貴,劉義磊
(1.貴州工程應(yīng)用技術(shù)學(xué)院礦業(yè)工程學(xué)院,貴州 畢節(jié) 551700; 2.中國礦業(yè)大學(xué)(北京)應(yīng)急管理與安全工程學(xué)院,北京 100083)
煤與瓦斯突出是在地應(yīng)力和瓦斯的共同作用下突然從煤體或巖體內(nèi)向巷道和采掘空間拋出大量煤巖和瓦斯的異常動力現(xiàn)象,具有極強(qiáng)的破壞性,給煤炭企業(yè)造成了巨大的經(jīng)濟(jì)損失和人員傷亡[1]。隨著我國煤礦機(jī)械化開采水平的提高和采掘深度的延深,煤與瓦斯突出現(xiàn)象日趨更加嚴(yán)重[2]。近年來,國內(nèi)外學(xué)者對煤與瓦斯突出預(yù)測做了大量的研究工作,提出了多種有效的預(yù)測方法,這些方法極大地推動了煤與瓦斯突出預(yù)測研究工作的快速發(fā)展,如綜合指標(biāo)法、神經(jīng)網(wǎng)絡(luò)法、電磁輻射法、灰色理論法、免疫遺傳法、可拓聚類法等[3-8]。由于煤與瓦斯突出極其復(fù)雜,突出預(yù)測的敏感指標(biāo)和臨界值很難確定,目前對突出發(fā)生的機(jī)理也尚不能完全掌握,因此,如何對煤與瓦斯突出準(zhǔn)確無誤地進(jìn)行預(yù)測預(yù)報成為了煤礦安全開采中的關(guān)鍵一環(huán)。筆者基于數(shù)理統(tǒng)計分析理論,利用逐步判別法對影響煤與瓦斯突出的指標(biāo)進(jìn)行篩選,建立煤與瓦斯突出的Fisher判別分析模型。從雜亂無章的突出實(shí)例數(shù)據(jù)中來尋求它們之間的內(nèi)在聯(lián)系,用直觀的數(shù)學(xué)方法來反映總體間的差異性,以尋求一種能夠判定新樣本總體類別歸屬問題的最優(yōu)方法,從而有效地對煤與瓦斯突出危險性進(jìn)行判別預(yù)測。
Fisher判別法的基本思想就是將高維特征向量空間投影到低維空間。該方法的基本思路就是將n維空間中的某一個點(diǎn)x=(x1,x2,x3,…,xn)轉(zhuǎn)換為一維函數(shù)y(x):y(x)=∑Cjxj,然后利用該一維函數(shù)把n維空間中的所有已知類別總體和求知類別歸屬的樣本數(shù)據(jù)都轉(zhuǎn)換成一維數(shù)據(jù),再根據(jù)樣本數(shù)據(jù)點(diǎn)之間的親疏程度來判定未知樣本數(shù)據(jù)點(diǎn)的歸屬類別。通過降維,根據(jù)組間距離最大、組內(nèi)距離最小的原則確定的判別分析函數(shù)不僅能將新的樣本進(jìn)行判別分類,而且能獲取非常高的判別效率。
ei=E(y|Gi)=a′μ(i),i=1,2,…,k
(1)
(2)
令:
(3)
(4)
B0相當(dāng)于一元方差分析中的組間差,E0相當(dāng)于組內(nèi)差。令μ′為式(5)。
(5)
則可得Δ(a)=B/E=a′Ba/a′Ea。很顯然,B,E均為非負(fù)定陣,Δ(a)的極大值為方程|B-λE|=0的最大特征根,取a為對應(yīng)于λ1的特征向量即為判別函數(shù)的系數(shù),即可求出判別函數(shù)。由數(shù)學(xué)知識可知,特征根的個數(shù)m是不會超過min(k-1,p)個的,由此可構(gòu)造出m個判別函數(shù),為式(6)。
yl(x) =c(l)Tx,l= 1,2,…,m
(6)
對于每一個判別函數(shù)必須要用一個指標(biāo)pi來其衡量判別能力,其中pi可定義為式(7)。
(7)
m0個判別函數(shù)y1,y2,…,ym0的判別能力定義為式(8)。
(8)
(9)
j=1,2,…,k。由此可得判別規(guī)則,見式(10)。
(10)
在判別分析問題中,影響判別能力的變量很多,且影響程度大小不一。如果把主要變量誤剔除,那么建立的判別函數(shù)其判別效果一定不佳;但判別變量很多而又不加剔除地全部被選入會造成在求解逆矩陣時計算精度下降。選取國內(nèi)典型突出礦區(qū)的30個突出實(shí)例(收集自不同礦井的同一組煤層,且工程地質(zhì)條件類似),其中20個作為訓(xùn)練樣本(表1),另外10個作為待判樣本(表5)。采用逐步判別分析法[11]對影響煤與瓦斯突出的敏感指標(biāo)進(jìn)行逐步判別篩選,由于收集到的突出實(shí)例中常用的敏感指標(biāo)最大鉆屑量Smax、鉆屑解吸指標(biāo)K1和Δh2等數(shù)據(jù)缺失,故采用其他5個敏感指標(biāo)(即瓦斯壓力、放散初速度、堅固性系數(shù)、煤體破壞類型和埋藏深度,分別用x1、x2、x3、x4、x5表示)進(jìn)行逐步判別篩選,其中煤體破壞類型分為5類:1(非破壞煤)、2(破壞煤)、3(強(qiáng)烈破壞煤)、4(粉碎煤)、5(全粉煤)。取F進(jìn)=5.0,F(xiàn)出=3.5作為逐步判別停止的臨界值。若某一變量F≥5.0時,則表明該變量判別能力顯著,需將其加入到判別模型中;若某一變量F≤3.5時,則表明該變量判別能力微弱,應(yīng)將其剔除出判別模型。重復(fù)以上過程,直至計算到既沒有變量加入也無變量被剔除,逐步判別分析過程才算結(jié)束。由于篇幅所限,對于逐步判別篩選判別因子的具體步驟不再詳述。最終從給定的5個評價指標(biāo)中將堅固性系數(shù)x3、煤體破壞類型x4剔除出突出判別函數(shù),將瓦斯壓力x1、瓦斯放散初速度x2、埋藏深度x5選入作為突出判別因子。
表1 樣本數(shù)據(jù)及分類結(jié)果Table 1 Sample data and discriminant results
根據(jù)多元統(tǒng)計方差分析原理,定義A為樣本數(shù)據(jù)點(diǎn)的組內(nèi)離差平方和,T為樣本數(shù)據(jù)點(diǎn)的總離差平方和,此時有:Λ=|A|/|T|,要對某一變量的判別能力的顯著性進(jìn)行分析,可按下面步驟來操作。
判別函數(shù)中假設(shè)已有q個變量,記X*,若考慮是否有必要添加變量Xj,可通過計算偏威爾克斯統(tǒng)計量,見式(11)。
(11)
式中,Λ(X*,Xj)為X*與Xj的威爾克斯統(tǒng)計量??梢宰C明,見式(12)。
Fα(k-1,n-k-q)
(12)
即F進(jìn)=Fα(k-1,n-k-q),如果有F≥F進(jìn),則表明變量Xj判別能力顯著,在判別函數(shù)中相應(yīng)地有必要增加變量Xj。針對判別函數(shù)中已有的q個變量X*,如若存在有對判別能力不顯著的變量,則需將其剔除出判別函數(shù)。如考慮變量Xk是否可從判別函數(shù)中剔除,記剔除Xk的變量組為X*(k),則有式(13)。
Fα(k-1,n-k-q+1)
(13)
此時,若有F≤Fα(k-1,n-k-q+1)=F出,則說明變量Xk的判別能力不顯著,需要把Xk從X*中剔除掉。重復(fù)以上引入和剔除變量的過程,直到既不能將新變量引入,又不能把已選入判別函數(shù)的變量剔除掉為止,至此便可用已選入的變量來構(gòu)建判別分析函數(shù)。
根據(jù)以上計算公式,取F進(jìn)=5.0,F(xiàn)出=3.5作為逐步判別停止的臨界值。重復(fù)以上過程,直至計算到既沒有變量加入也無變量被剔除,逐步判別分析過程才算結(jié)束。由于篇幅所限,對于逐步判別篩選判別因子的具體步驟不再詳述。最終從給定的5個評價指標(biāo)中將堅固性系數(shù)x3、煤體破壞類型x4剔除出突出判別函數(shù),將瓦斯壓力x1、瓦斯放散初速度x2、埋藏深度x5選入作為突出判別因子。
《防治煤與瓦斯突出規(guī)定》指出[12],在進(jìn)行煤與瓦斯突出危險性鑒定時,給出的礦井鑒定結(jié)果是否為突出礦井,而對突出礦井的突出類別大小沒有給出。研究表明[13],對于有些礦井其各項(xiàng)突出指標(biāo)值并沒有超過其臨界值,但也有可能會發(fā)生煤與瓦斯突出;根據(jù)突出時拋出煤的重量不同將突出分為4類:Ⅰ-無突出、Ⅱ-小型突出(50 t以下)、Ⅲ-中型突出(50~100 t)、Ⅳ-大型突出(100 t以上)。根據(jù)上面所述建模過程,將表1中所列出的20組煤與瓦斯突出實(shí)例作為學(xué)習(xí)訓(xùn)練樣本建立Fisher判別模型,經(jīng)訓(xùn)練學(xué)習(xí)并計算可得到表2中各個Fisher判別函數(shù)的系數(shù),因此建立的判別函數(shù)分別為:y1=2.217x1+0.151x2-0.007x5-2.578;y2=0.551x1-0.19x2+0.012x5-5.894;y3=-0.4x1+0.266x2+0.004x5-3.661。
表3為各判別函數(shù)特征值及組質(zhì)中心值。從表3中給出的方差百分比可知:第1個判別函數(shù)方差的貢獻(xiàn)率為77.2%,說明此函數(shù)可以解譯77.2%的樣品信息,利用該函數(shù)能夠?qū)^大部分樣品類屬進(jìn)行判別;第2個判別函數(shù)方差的貢獻(xiàn)率為14.4%,說明該函數(shù)可以解譯14.4%的樣品信息;第3個判別函數(shù)方差貢獻(xiàn)率為8.4%。當(dāng)利用第1個判別函數(shù)對樣本屬類無法作出明確判斷時,可分別依次使用第2個判別函數(shù)和第3個判別函數(shù)來對樣本分屬類別進(jìn)行判斷。從3個判別函數(shù)的累積方差貢獻(xiàn)率為100%可知,當(dāng)把3個判別函數(shù)聯(lián)合起來使用時,可以完成對所有樣品分屬類別的判斷。
表2 Fisher判別式函數(shù)系數(shù)Table 2 Coefficient of Fisher discriminant function
表3 判別函數(shù)方差貢獻(xiàn)率及組中心值Table 3 Discriminant function variance contribution rate and group center value
為了考察上述所求判別函數(shù)的準(zhǔn)確度,可采用計算其誤判率的檢驗(yàn)方法。通常采用以樣本數(shù)據(jù)回代估計的方法來計算誤判率,即把所有訓(xùn)練樣本重新作為新樣本代入構(gòu)建的判別函數(shù)中,根據(jù)判別準(zhǔn)則對其類別歸屬進(jìn)行判別,并用被誤判的樣本個數(shù)與所有訓(xùn)練樣本個數(shù)的比值來代表誤判率,誤判率越低表明建立的模型判別效果越好。對20組訓(xùn)練樣本進(jìn)行回代估計檢驗(yàn),其回判結(jié)果見表4。圖1是利用第1判別函數(shù)和第2判別函數(shù)對樣本進(jìn)行類別分組的示意圖,從圖中可清晰地看出,絕大部分樣本都集中在各自所屬類別的組中心值附近,組均值和組間離差大,組內(nèi)離差較小,20組樣本的聚合程度及分離效果均非常明顯。
表4 樣本數(shù)據(jù)及分類結(jié)果Table 4 Sample data and discriminant results
注:“*”為誤判樣本
從表4中給出的判別結(jié)果可知,20個突出訓(xùn)練樣本回判后只有1個訓(xùn)練樣本出現(xiàn)判別結(jié)果與實(shí)際不相符的情況,其誤判率僅為5.0%。出現(xiàn)判別錯誤的樣本為編號9,它的實(shí)際突出類別為Ⅲ,結(jié)果利用所建立的判別函數(shù)將其突出類型判為Ⅰ。出現(xiàn)這種誤判的情況,可能跟數(shù)據(jù)采集點(diǎn)的地質(zhì)條件和人的因素有關(guān)。另外,從圖1也可清楚地看出,編號9的樣本處在突出類別Ⅰ和類別Ⅲ的交界處,很容易引起誤判。因此,在實(shí)際突出判別應(yīng)用時,需密切結(jié)合突出地點(diǎn)的地質(zhì)條件,以保證煤與瓦斯突出判別的準(zhǔn)確性。從誤判率可見,F(xiàn)isher-逐步判別分析方法能夠有效地對煤與瓦斯突出進(jìn)行判別預(yù)測,而且方法簡單可靠,準(zhǔn)確率高。
圖1 第1判別函數(shù)和第2判別函數(shù)分組Fig.1 Groups of the first and second discriminant function
利用建立好的Fisher判別分析模型對選取的另外10個突出實(shí)例進(jìn)行突出危險性判識,見表5。將各實(shí)例的判別因子數(shù)值逐一分別代入第1判別函數(shù)、第2判別函數(shù)和第3判別函數(shù),得到3個判別函數(shù)值,得到的3個函數(shù)值形成的是一個空間坐標(biāo)位置,根據(jù)該坐標(biāo)位置點(diǎn)與各組中心值坐標(biāo)位置點(diǎn)間的距離(即歐式距離)最小原則便可對待測樣本的類別歸屬進(jìn)行判別預(yù)測。以編號為1的樣本為例,先利用3個判別函數(shù)計算出的函數(shù)值分別為0.85、-1.88、0.07,然后計算空間坐標(biāo)點(diǎn)(0.85,-1.88,0.07)與各類中心值之間的歐式距離分別為2.89、0.99、4.90、3.92,由于與第Ⅱ中心值間的歐式距離最短,因此將該樣本的突出類別判別為Ⅱ類。依此類推,可對其它樣本的類別歸屬進(jìn)行判別預(yù)測,判別結(jié)果見表5。結(jié)果表明:10個突出實(shí)例的判別結(jié)果與實(shí)際情況完全一致,判別正確率達(dá)100%。因此,在實(shí)際應(yīng)用中,可根據(jù)所建立的Fisher-逐步判別分析模型對煤與瓦斯突出進(jìn)行有效地預(yù)測。
Fisher-逐步判別分析模型用于煤與瓦斯突出預(yù)測,是建立在對已有煤與瓦斯類型特征規(guī)律訓(xùn)練學(xué)習(xí)的基礎(chǔ)上,訓(xùn)練學(xué)習(xí)樣本的代表性及數(shù)量對煤與瓦斯突出的準(zhǔn)確判別預(yù)測極其重要。因此,利用該判別模型進(jìn)行煤與瓦斯突出預(yù)測時需注意以下問題:①在對學(xué)習(xí)樣本進(jìn)行篩選時應(yīng)優(yōu)先考慮常用的突出預(yù)測敏感指標(biāo);②所建立的判別模型適用于煤層地質(zhì)條件和采煤技術(shù)工藝類似的待預(yù)測區(qū)域,在實(shí)際工程應(yīng)用過程中,可根據(jù)現(xiàn)場工程地質(zhì)情況,盡可能選取具有代表性的實(shí)例和判別能力顯著的指標(biāo);③在不增加計算負(fù)擔(dān)的前提下,應(yīng)盡可能增加樣本數(shù)量以提高判別模型的準(zhǔn)確性。
表5 待判樣本數(shù)據(jù)及判別分類結(jié)果Table 5 Sample data to be determined and classification results
1) 為減弱非敏感指標(biāo)對煤與瓦斯突出預(yù)測結(jié)果的干擾,利用逐步判別法對影響突出的5項(xiàng)評價指標(biāo)進(jìn)行篩選,選取對突出判別能力影響顯著的瓦斯壓力、瓦斯放散初速度和埋藏深度3個敏感指標(biāo)作為判別因子。通過篩選,最大限度地避免了非顯著性指標(biāo)的加入而影響計算精度和判別結(jié)果,同時,也削弱了評價不同指標(biāo)對煤與瓦斯突出影響程度的隨意性和主觀性,一定程度上反映了各指標(biāo)對突出影響的差異性。
2) 基于多元統(tǒng)計分析理論,建立了煤與瓦斯突出預(yù)測的Fisher-逐步判別分析模型。利用所構(gòu)建的判別模型對20組煤與瓦斯突出實(shí)例數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)得出相應(yīng)的判別函數(shù),用回代估計的方法進(jìn)行逐一驗(yàn)證,誤判率僅為5%。將建立的判別模型對10組突出實(shí)例進(jìn)行判別預(yù)測,判別結(jié)果與實(shí)際情況完全吻合,正確率為100%,F(xiàn)isher-逐步判別分析模型是一種有效的煤與瓦斯突出預(yù)測方法。
3) Fisher-逐步判別分析模型用于煤與瓦斯突出預(yù)測,是建立在對已有煤與瓦斯類型特征規(guī)律訓(xùn)練學(xué)習(xí)的基礎(chǔ)上,有一定的適用范圍,在實(shí)際應(yīng)用過程中需綜合考慮待預(yù)測區(qū)域的煤層地質(zhì)條件及開采技術(shù)工藝等。