金洪偉,周 捷
(西安科技大學安全科學與工程學院,陜西 西安 710054)
近年來,綜合機械化的采煤方式在我國得到了不斷推廣,此方式雖增加了掘進效率,但也增加了巷道中的瓦斯涌出量,為瓦斯爆炸等事故的發(fā)生埋下了隱患。因此,煤礦瓦斯涌出量的準確預測對井下安全生產(chǎn)具有重要作用[1]。20世紀80年代,俄羅斯學者首次提出在采煤時須進行瓦斯涌出量預測;英國學者Greedya[2]首創(chuàng)艾黎法,基于時間和開采技術來預測煤礦瓦斯涌出量。我國最先提出的第一類傳統(tǒng)的煤礦瓦斯涌出量預測方法是基于數(shù)據(jù)統(tǒng)計分析的礦山統(tǒng)計法,如1959年煤科總院撫順分院第一次在淮南礦務局謝家集二礦應用礦山統(tǒng)計法預測了深部礦井瓦斯涌出量[3]。第二類傳統(tǒng)的煤礦瓦斯涌出量預測方法是分源預測法,如戴永祿[4]應用分源預測法預測了煤層瓦斯涌出量,并將該法與趨勢面法進行了對比;李曉華等[5]運用分源預測法實現(xiàn)了煤礦瓦斯涌出量的動態(tài)分析;張占國等[6]提出利用分源預測法預測經(jīng)“立體”預抽瓦斯方法治理后的煤層瓦斯涌出量。但是,由于煤層地質(zhì)條件和自然因素的不同,這兩類傳統(tǒng)的煤礦瓦斯涌出量預測方法在實際操作中具有一定的局限性。瓦斯地質(zhì)數(shù)學模型法是近年來國內(nèi)外學者提出的一種新的煤礦瓦斯涌出量預測方法,該方法通過建立包括原始瓦斯含量、煤層厚度等在內(nèi)的多參數(shù)數(shù)學模型來預測煤礦瓦斯涌出量,如張子戌等[7]首次提出利用瓦斯地質(zhì)數(shù)學模型法來預測礦井瓦斯涌出量。此外,Dong[8]提出了瓦斯排放時間序列方法,并將其作為回歸函數(shù)建立了高斯過程回歸模型,結果表明該方法的預測結果準確、可靠;董曉雷等[9]提出利用最小二乘支持向量機(LS-SVM)方法來預測煤礦瓦斯涌出量;Li等[10]分析了煤礦瓦斯涌水量的復雜非線性特征,提出了基于自組織數(shù)據(jù)挖掘的煤礦瓦斯涌水量預測方法;景國勛等[11]研究認為對于基本符合線性規(guī)律的數(shù)據(jù),灰色模型較一元線性回歸模型對煤礦瓦斯涌出量的預測精度更高;Liang等[12]提出在考慮瓦斯涌出源以及流固耦合過程的條件下,通過建立動態(tài)瓦斯預測模型來對煤礦瓦斯涌出量進行預測將具有更高的準確性;Booth等[13]研究認為現(xiàn)有的瓦斯排放預測的局限性,可以通過改進的空間數(shù)據(jù)集得出的預測結果以及包含基本物理和能量相關原理的技術來解決。
綜上研究可知,近年來運用瓦斯地質(zhì)數(shù)學模型法來預測煤礦瓦斯涌出量的預測方法已成為主要發(fā)展趨勢,多因素分析會為煤礦瓦斯涌出量預測提供豐富的信息,但由于所選參數(shù)的量綱不一致,會使監(jiān)控數(shù)據(jù)不具可比性,從而導致預測精度低,且也增加了問題的復雜性,給分析帶來不便。因此,如何科學、合理地將多因素整合為較少的幾個因素,并消除量綱的影響,對提高預測精度至關重要。針對上述問題,本文采用無量綱數(shù)據(jù)并運用主成分分析與多元回歸分析相結合的方法來預測煤礦瓦斯涌出量。
主成分分析(Principal Component Analysis,PCA)是利用降維的思想,將多個變量以線性組合的形式轉(zhuǎn)化為少數(shù)幾個綜合變量(即主成分),各主成分之間相互獨立,并具有反映變量的絕大部分信息的能力。該方法不但克服了單一指標不能準確預測煤礦瓦斯涌出量變化趨勢的問題,而且將復雜的影響因素簡化為幾個主成分,實現(xiàn)了降維分析,并簡化了復雜問題,能得到更為科學、準確的預測信息。
R語言主成分分析法的基本步驟[14]如下:
(1) 求得相關系數(shù)矩陣:采用相關系數(shù)矩陣進行主成分分析。
(2) 提取主成分:采用R語言中的psych包對相關系數(shù)矩陣提取主成分,本文要求主成分對變量的解釋率達到90%以上,由此決定提取的主成分個數(shù)。
(3) 主成分旋轉(zhuǎn):采取Varimax最大方差正交旋轉(zhuǎn)法進行主成分旋轉(zhuǎn)。
(4) 獲取主成分得分:利用主成分旋轉(zhuǎn)后得到的主成分得分系數(shù)矩陣A與無量綱化處理后的原始數(shù)據(jù)轉(zhuǎn)置后形成的矩陣B相乘,求得主成分得分。
R語言是一款應用比較廣泛且允許進行二次開發(fā)的編程語言,主要應用于統(tǒng)計學上相關的分析計算,并且可以很直觀地將分析計算結果展現(xiàn)于命令窗口。由于主成分分析中很多的理論分析可以較容易地利用R語言來實現(xiàn),并且利用R語言建立主成分分析預測模型的操作過程簡便、靈活,因此本文選擇R語言作為模型建立的工具。
本文通過對煤礦瓦斯涌出量的影響因素進行分析,選用文獻[15]中某煤礦18個月收集到的18組瓦斯涌出量以及各影響因素原始數(shù)據(jù)作為分析對象,其中第1~10組數(shù)據(jù)為試驗數(shù)據(jù),第11~18組數(shù)據(jù)為驗證數(shù)據(jù),詳見表1。
表1 某煤礦瓦斯涌出量以及各影響因素原始數(shù)據(jù)統(tǒng)計表
在多指標評價體系中,由于各評價指標的性質(zhì)不同,通常具有不同的量綱,如果直接采用原始數(shù)據(jù)進行分析,當各指標間的數(shù)值相差較大時,就會突出數(shù)值較高的指標在綜合分析中的作用,相對削弱數(shù)值較低指標的作用。因此,為了保證結果的準確性,需要對各影響因素數(shù)據(jù)進行無量綱化處理,從而解決數(shù)據(jù)的可比性問題。本文采用數(shù)據(jù)標準化中的正規(guī)化方法對各影響因素數(shù)據(jù)進行無量綱化處理,即對每列數(shù)據(jù)x1,x2,…,xn進行變換:
其中:
某煤礦瓦斯涌出量以及各影響因素經(jīng)無量綱化處理后的原始數(shù)據(jù)見表2。
表2 某煤礦瓦斯涌出量以及各影響因素經(jīng)無量綱化處理后的原始數(shù)據(jù)統(tǒng)計表
首先,依據(jù)第1.2節(jié)R語言主成分分析法的步驟,采用R軟件psych包中的principal()函數(shù)進行主成分分析,其分析結果見表3。
表3 主成分分析結果統(tǒng)計表
注:PC為旋轉(zhuǎn)之前的主成分。
由表3可見,在提取4個主成分后,所提取的主成分因子的累計方差解釋率可達90%以上。
然后,采用R軟件中的Varimax最大方差正交旋轉(zhuǎn)法進行主成分旋轉(zhuǎn),目的是使一系列主成分載荷矩陣變得更容易解釋,盡可能對主成分數(shù)據(jù)去噪,使得每個主成分只由一組有限的變量來解釋。表4為主成分經(jīng)旋轉(zhuǎn)后各項指標的得分值。
表4 主成分旋轉(zhuǎn)后結果統(tǒng)計表
注:RC為旋轉(zhuǎn)之后的主成分。
對比表3和表4可知,主成分經(jīng)旋轉(zhuǎn)后的累計方差解釋率沒有發(fā)生變化(94%),只有各主成分對方差的解釋度發(fā)生了改變,使各主成分的方差解釋度最大程度地趨于相同,起到了主成分數(shù)據(jù)去噪的作用。
最后,利用principal()函數(shù)中的“score=TRUE”命令,得到各主成分的得分系數(shù),見表5。
表5 主成分的得分系數(shù)
由表5可見,主成分1主要包括煤層原始瓦斯含量、煤層埋藏深度、煤層厚度、推進速度、采高、采出率和開采強度;主成分2主要包括煤層傾角和鄰近層厚度;主成分3主要包括鄰近層層間距和工作面長度;主成分4包括鄰近層瓦斯含量。
綜上分析可見,主成分分析降低了煤礦瓦斯涌出量影響因素的維數(shù),從而減少了后續(xù)多元回歸模型計算輸入變量的個數(shù),降低了建立煤礦瓦斯涌出量預測模型的難度,同時保留了原始指標數(shù)據(jù)94%的信息,為更準確地預測煤礦瓦斯涌出量提供了保障。
經(jīng)第1.2節(jié)R語言主成分分析法步驟(4)的運算,即將主成分旋轉(zhuǎn)后得到的主成分得分系數(shù)矩陣A(見表5)與無量綱化處理后的原始數(shù)據(jù)(見表2)轉(zhuǎn)置后形成的矩陣B相乘,得到各主成分得分數(shù)據(jù), 見表6。 其中,第1~14組數(shù)據(jù)為試驗數(shù)據(jù), 第15~18組數(shù)據(jù)為驗證數(shù)據(jù)。本文采用多元回歸分析作為煤礦瓦斯涌出量的預測方法,如多元線性函數(shù)、多元冪函數(shù)、多元指數(shù)函數(shù)、多元對數(shù)函數(shù)[16]等,并利用MATLAB軟件對各主成分得分進行多元回歸分析,通過比較標準差(RMSE)和決定系數(shù)(R2)來選取煤礦瓦斯涌出量與各主成分之間的最優(yōu)函數(shù)關系式,各種形式函數(shù)關系式的擬合結果見表7。
表6 主成分得分數(shù)據(jù)統(tǒng)計表
表7 某煤礦瓦斯涌出量與各主成分之間的函數(shù)關系式擬合結果
由表7可知, 多元線性函數(shù)關系式的決定系數(shù)R2最高(0.988)、標準差RMSE最小(0.189),因此得到煤礦瓦斯涌出量與各主成分之間的最優(yōu)函數(shù)關系式為
y=5.49+0.29F1-0.15F2+0.10F3-0.007F4
采用上述多元線性函數(shù)關系式,并根據(jù)表6中各組驗證數(shù)據(jù)對某煤礦瓦斯涌出量進行預測,其預測結果及其相對誤差見表8。
表8 某煤礦瓦斯涌出量預測結果及其相對誤差
由表8可知,在4組驗證數(shù)據(jù)中,某煤礦瓦斯涌出量的預測值與實際值的相對誤差最小值為0.13%,最大值為2.85%,平均值為1.99%,4組驗證數(shù)據(jù)的相對誤差均在3%以下,表明該預測模型的預測精度較高。
由于井田地質(zhì)構造等客觀因素的影響,其預測結果會不可避免地偏離實際值,但本文建立的煤礦瓦斯涌出量預測模型的預測誤差在合理范圍內(nèi),表明該方法可以作為煤礦瓦斯涌出量的預測方法。
(1) 本文提出對影響煤礦瓦斯涌出量各主要因素進行無量綱化處理的方法,該方法使用無量綱量來描述客觀規(guī)律,解決了數(shù)據(jù)量綱不一而使監(jiān)測數(shù)據(jù)不具可比性、且導致預測精度低的問題。
(2) 主成分分析法能有效地將眾多煤礦瓦斯涌出量的影響因素進行降維簡化,將原始數(shù)據(jù)中的12個指標簡化為4個主成分,該方法大大減少了建立預測模型時輸入影響因素的數(shù)量,降低了建模時的難度。
(3) 經(jīng)過主成分分析后得到的4個主成分,其中主成分1包括煤層原始瓦斯含量、煤層埋藏深度、煤層厚度、推進速度、采高、采出率和開采強度;主成分2包括煤層傾角和鄰近層厚度;主成分3包括鄰近層層間距和工作面長度;主成分4包括鄰近層瓦斯含量。經(jīng)主成分分析選取的煤礦瓦斯涌出量預測指標,包含了原始數(shù)據(jù)樣本90%以上的信息,從而保障了煤礦瓦斯涌出量預測模型的準確建立。
(4) 經(jīng)計算,在4組驗證數(shù)據(jù)中,某煤礦瓦斯涌出量的預測值與實際值的相對誤差最小值為0.13%,最大值為2.85%,平均值為1.99%,表明原始數(shù)據(jù)經(jīng)無量綱化處理后,采用主成分分析與多元線性回歸分析相結合的方法構建的煤礦瓦斯涌出量預測模型的預測精度較高。