李長興,關金鋒,李回貴,辛程鵬
(1.貴州工程應用技術學院礦業(yè)工程學院,貴州 畢節(jié) 551700;2.中國礦業(yè)大學(北京)應急管理與安全工程學院,北京 100083)
煤與瓦斯突出是煤體中儲藏的應力能和瓦斯能在極短的時間內失穩(wěn)釋放并向生產空間拋出大量瓦斯和煤巖的現象,是煤礦生產過程中最嚴重的災害之一[1]。隨著我國煤礦開采機械化水平的提高和開采深度的加深,煤與瓦斯突出礦井的數量和突出強度都呈逐年加大的趨勢[2]。國內外學者在煤與瓦斯突出預測工作中進行了大量探索,提出了神經網絡法、模糊數學法、電磁輻射法、灰色理論法、混沌時間序列法、免疫遺傳法、災變級數法等[3-11],這些方法在突出預測中取得了很大成效,但也存在一些不足,如灰色理論法中灰數的白化和模糊數學法中的隸屬度確定均很困難,電磁輻射法的電磁輻射信號和混沌時間序列法的現場監(jiān)測數據易受到干擾,免疫遺傳法和災變級數法計算復雜且丟失信息較多等,這些都會造成預測的結果失準。由于煤與瓦斯突出極其復雜且機理尚未可知,突出預測的敏感指標和臨界值又很難確定,因此如何準確地對煤與瓦斯突出進行預測是煤礦安全開采中遇到的最大困難之一。筆者基于數理統(tǒng)計分析理論,采用逐步判別法對影響煤與瓦斯突出的指標進行篩選,建立煤與瓦斯突出的Bayes-判別分析模型。從雜亂無章的突出實例數據中尋求各因素與突出之間的內在聯系,用直觀的數學方法來反映總體間的類別差異,從而有效地對煤與瓦斯突出進行預測。
判別分析法近年來在社會學、經濟管理學及自然科學中得到了廣泛應用,Bayes判別分析法是其中最具代表性的一種。Bayes判別分析法的基本思想[12]是假設對所要研究的事物已經有了一定程度的認識,常用先驗概率來對這種認識進行描述;然后抽取其中一個樣本對已有的這種認識(先驗概率分布)進行修正,進而得到后驗概率分布。各種推斷統(tǒng)計都是基于后驗概率分布來進行的。
設有k個總體G1,G2,…,Gk,其密度分布函數分別為f1(x),f2(x),…,fk(x),各總體的先驗概率分布為q1,q2,…,qk。在對樣品x判定歸屬哪一總體時,可以根據貝葉斯公式計算樣品x來自Gi總體的后驗概率,見式(1)。
(1)
(2)
式中,L(j/i)為損失函數,它表示把屬于總體Gi的樣品錯判為總體Gj的損失。顯然式(2)是錯判的平均損失。
當j=i時,L(Gj/x)=0;當j≠i時,L(Gj/x)>0。建立的判別準則見式(3)。
(3)
若滿足式(3),則判定樣品x歸屬總體Gj。由于L(Gj/x)不易確定,故常假設各種錯判的損失均相等,見式(4)。
(4)
因此,使后驗概率P(Gj/x)最大和使錯判的平均損失E(Gj/x)最小是等價的,見式(5)。
(5)
在實際中往往遇到的總體服從正態(tài)分布,因此下面給出n元正態(tài)總體的Bayes判別分析法[13]。
1) 判別函數的導出。由Bayes判別分析法原理可知,使用Bayes判別分析法作判別分析時,首先要知道待判總體的密度分布函數和先驗概率分布。一般可用待判樣品頻率qi=mi/m來代替先驗概率,或令各總體先驗概率相同,即Σ=Σ1=Σ2=…=Σk,那么n元正態(tài)分布密度函數見式(6)。
(6)
式中,Σ(i)和μ(i)分別為總體Gi的協方差陣和均值向量。把fi(x)代入P(Gi/x)的函數表達式中,在計算使P(Gi/x)最大的i時,由于不論i取值為何式中分母都是常數,故有式(7)。
(7)
取對數并將與i無關項去掉后,則判別函數可簡化為式(8)。
(8)
式中,i=1,2,…,k,那么判別規(guī)則變?yōu)槭?9)。
(9)
(10)
(11)
合并后的樣本協方差陣為式(12)。
(12)
3) 計算后驗概率。在進行判別分類計算時,主要根據y(Gi/x)的大小,其次是根據后驗概率P(Gi/x)。但知道y(Gi/x)的大小后,便可計算出P(Gi/x),見式(13)。
(13)
因y(Gi/x)=ln(qifi(x))-Δ(x),其中Δ(x)是ln(qifi(x))中與i無關的項。故有式(14)。
(14)
根據式(14)可知,使y(Gj/x)最大的j必然也會使P(Gi/x)為最大。因此,只需將樣本x代入到判別函數式中,分別計算y(Gi/x),i=1,2,…,k。其判別規(guī)則即為式(15)。
(15)
若滿足式(15),則把樣本x歸屬到Gj總體中。
為了考察上述所建立的判別準則與判別函數的準確度,可采用計算誤判率的檢驗方法。通常以樣本數據回代估計的方法來計算誤判率,具體計算方法如下所述。
通過挖掘整合行業(yè)內外資源,開發(fā)形成“油氣技術”專題,涉及勘探、開發(fā)、煉化、管道、工程及銷售等專業(yè)領域,涵蓋油氣行業(yè)上下游業(yè)務。
(16)
在判別分析問題中,影響判別能力的變量很多,且影響程度大小不一。如果把主要的變量誤剔除,那么建立的判別函數其判別效果一定不佳。但判別變量很多而又不加剔除地全部被選入所構建的判別函數,不僅會造成計算量大的后果,還會因變量間的相關度低而使得在求解逆矩陣時計算精度下降,反而會因對判別不起作用的指標過多而干擾判別結果。因此,在進行煤與瓦斯突出預測判別時需對判別因子進行篩選。筆者搜集選取國內某一典型突出礦區(qū)的28個突出實例(收集自不同礦井的同一組煤層,該層煤的變質程度為1/3焦煤,且工程地質條件類似),其中20個作為訓練樣本(表1),另外8個作為待判樣本(表4)。采用逐步判別分析法[14-15]對影響煤與瓦斯突出的敏感指標進行逐步判別篩選,由于收集到的突出實例中常用的敏感指標S、K1和Δh2等數據缺失,故采用其他8個敏感指標(瓦斯壓力、放散初速度、堅固性系數、煤體破壞類型、開采深度、軟分層厚度、瓦斯含量、煤層傾角,分別用x1、x2、x3、x4、x5、x6、x7、x8表示)作為逐步判別因子,其中煤體破壞類型分為5類:非破壞煤、破壞煤、強烈破壞煤、粉碎煤和全粉煤。逐步判別分析法篩選判別因子的方法如下所述。
根據多元統(tǒng)計方差分析原理,定義A為樣本數據點的組內離差平方和,T為樣本數據點的總離差平方和,此時有:Λ=|A|/|T|,要對某一變量的判別能力的顯著性進行分析,操作步驟如下所述。
判別函數中假設已有q個變量,記X*,若考慮是否有必要添加變量Xj,可通過計算偏威爾克斯統(tǒng)計量,見式(17)。
(17)
式中,Λ(X*,Xj)為X*與Xj的威爾克斯統(tǒng)計量。可以證明式(18)。
Fα(k-1,n-k-q)
(18)
表1 訓練樣本數據及判別結果Table 1 Training sample data and discriminant results
即F進=Fα(k-1,n-k-q),如果有F>F進,則表明變量Xj判別能力顯著,在判別函數中相應地有必要增加變量Xj。針對判別函數中已有的q個變量X*,如若存在有對判別能力不顯著的變量,則需將其剔除出判別函數。如考慮變量Xk是否可從判別函數中剔除,記剔除Xk的變量組為X*(k),見式(19)。
(19)
此時,若有F 根據以上計算公式,取F進=3.84,F出=2.71作為逐步判別停止的判據。若某一變量F≥3.84時,則表明該變量判別能力顯著,需將其加入到判別模型中;若某一變量F≤2.71時,則表明該變量判別能力微弱,應將其剔除出判別模型。重復以上過程,直至計算到既沒有變量加入也無變量被剔除,逐步判別分析過程才算結束。最終利用逐步判別法經過4步計算從給定的8個變量指標中將瓦斯壓力x1、放散初速度x2、軟分層厚度x6選入作為突出判別因子,將堅固性系數x3、煤體破壞類型x4、開采深度x5、瓦斯含量x7、煤層傾角x8剔除出判別模型。由于篇幅所限,對逐步判別篩選判別因子的具體計算步驟不再詳述。 根據上面所述建模過程,選取表1中所列的20個煤與瓦斯突出實例數據作為訓練學習樣本建立Bayes判別模型?!斗乐蚊号c瓦斯突出規(guī)定》指出[16],在進行煤與瓦斯突出危險性鑒定時,給出的礦井鑒定結果只有是否為突出礦井,而對突出礦井的突出類別大小沒有給出。另外研究表明[7],對于有些礦井其各項突出指標值并沒有超過臨界值,但也有可能會發(fā)生煤與瓦斯突出。根據突出時拋出煤的重量不同將突出分為4類:Ⅰ-無突出、Ⅱ-小型突出(50 t以下)、Ⅲ-中型突出(50~100 t)、Ⅳ-大型突出(100 t以上)。將這4個突出類別分別作為Bayes判別函數的4個正態(tài)總體G1,G2,G3,G4。根據上述Bayes判別函數求解的過程,經訓練學習便可得出Bayes判別函數,判別函數各項系數見表2。因此,所建立的煤與瓦斯突出預測Bayes判別函數分別見式(20)~(23)。 y1=6.661x1+0.556x2+1.817x6-9.951 (20) y2=9.12x1+1.667x2+1.245x6-24.252 (21) y3=3.86x1+0.954x2+3.729x6-13.987 (22) y4=15.954x1+0.886x2+3.608x6-41.887 (23) 表2 Bayes判別函數分類系數Table 2 Classification coefficient of Bayes discriminant function 對20個訓練樣本進行回代估計檢驗,分別根據Bayes函數值y和后驗概率值P(Gi/x)確定訓練樣本的回判結果,見表3。由表3可知,20個突出訓練樣本回判后的判別結果與實際情況完全相符,其誤判率為0。從誤判率來看,Bayes-逐步判別分析方法能夠有效地對煤與瓦斯突出進行判別預測,而且方法簡單可靠,準確率高。 表3 訓練樣本回判結果Table 3 Feedback results for training sample 利用上述建立的Bayes判別分析模型對該典型突出礦區(qū)的另外8個突出實例進行突出類型判別預測,判別結果見表4。為了便于對比分析,表4同時列出了對判別因子不進行篩選而全部引入判別函數的判別分類結果。由表4可知,利用Bayes-逐步判別法得到的判別結果與實際情況完全吻合,判別正確率達100%;而單純利用Bayes判別法得到的判別結果中有2個是錯誤的,誤判率為25%。為進一步考察Bayes-逐步判別法判識結果的準確性和可靠性,對8個突出實例進行了回代估計,結果見表5。由表5可知,根據Bayes函數值和后驗概率回判的結果與實際情況完全一致,誤判率為0。由此說明,建立的Bayes-逐步判別分析模型可以有效、準確地對煤與瓦斯突出進行預測。 Bayes-逐步判別分析模型用于煤與瓦斯突出預測,是建立在對已有煤與瓦斯類型特征規(guī)律訓練學習的基礎上,訓練學習樣本的代表性及數量對煤與瓦斯突出的準確判別預測極其重要。因此利用該判別模型進行煤與瓦斯突出預測時需注意以下問題:①在對學習樣本進行篩選時應優(yōu)先考慮常用的突出預測敏感指標;②所建立的判別模型適用于煤層地質條件和采煤技術工藝類似的待預測區(qū)域,在實際工程應用過程中,可根據現場工程地質情況,盡可能選取具有代表性的實例和判別能力顯著的指標;③在不增加計算負擔的前提下,應盡可能增加樣本數量以提高判別模型的準確性。 表4 待判樣本數據及判別結果Table 4 Sample data to be determined and classification results 表5 待判樣本回判結果檢驗Table 5 Test of the feedback results to be determined 1) 為減弱非敏感判別指標對煤與瓦斯突出預測結果的干擾,利用逐步判別法對影響突出的8個變量指標進行篩選,選取出對突出判別能力影響顯著的瓦斯壓力、瓦斯放散初速度和軟分層厚度3個敏感指標作為判別因子。通過篩選,最大限度地避免了非顯著性指標加入判別模型而影響計算精度和判別結果,同時,也削弱了評價不同指標對煤與瓦斯突出影響程度的隨意性和主觀性,一定程度上反映了各指標對突出影響的差異性。 2) 基于多元統(tǒng)計分析理論,建立了煤與瓦斯突出預測的Bayes-判別分析模型。利用所構建的判別模型對20個煤與瓦斯突出實例數據進行訓練學習得出相應的Bayes判別函數,用回代估計的方法進行逐一驗證,結果誤判率為0。將建立的判別模型對8個突出實例進行判別預測,判別結果與實際情況完全吻合,正確率達100%。因此,所建立的Bayes-逐步判別分析模型判別準確度高,是一種有效的煤與瓦斯突出預測方法。 3) 構建的Bayes-逐步判別分析模型有一定的適用范圍,在實際應用過程中需綜合考慮待預測區(qū)域的煤層地質條件及開采技術工藝等。2.2 Bayes判別函數的建立
2.3 Bayes判別效果顯著性檢驗
3 工程應用
4 結 論