王佳信,周宗紅,李克鋼,王海泉,付自國,李曉飛
(1.昆明理工大學(xué) 國土資源工程學(xué)院,昆明 650093;2.中南大學(xué) 資源與安全工程學(xué)院,長沙 410083)
沖擊地壓是指存儲在井巷或工作面周圍巖體中的彈性應(yīng)變能,由于瞬時釋放而產(chǎn)生劇烈破壞的礦山動力現(xiàn)象。在煤礦生產(chǎn)活動中,一旦發(fā)生沖擊地壓,還可能誘發(fā)煤塵、瓦斯爆炸、火災(zāi)以及水災(zāi)等一系列次生災(zāi)害[1-2]。隨著淺部煤炭資源開采殆盡,國內(nèi)外礦山相繼進(jìn)入深部開采,沖擊地壓的礦井?dāng)?shù)目越來越多,沖擊地壓災(zāi)害問題越來越突出。目前,國內(nèi)外專家普遍認(rèn)為,煤礦沖擊地壓問題是全世界采煤國家面臨的共同難題,因此,沖擊地壓危險(xiǎn)性等級評價顯得尤為重要,是有效防治沖擊地壓的重要基礎(chǔ)[3-7]。
近年來,沖擊地壓危險(xiǎn)性預(yù)測預(yù)報(bào)方法概括起來主要有:理論計(jì)算、現(xiàn)場監(jiān)測以及區(qū)域性早期評價。理論計(jì)算中具有代表性是“載荷三帶”理論模型[8-9],這類方法可以對沖擊地壓危險(xiǎn)性程度進(jìn)行定量分析,但影響各個采場的采動壓力眾多,目前尚沒有固定的計(jì)算公式,主要依賴于經(jīng)驗(yàn),主觀性較強(qiáng)?,F(xiàn)場監(jiān)測主要通過監(jiān)測數(shù)據(jù)的變化規(guī)律所釋放出的前兆信息對沖擊地壓危險(xiǎn)性進(jìn)行預(yù)測預(yù)報(bào),如電磁輻射[10]、鉆屑法[11]、微震法[12-13]以及地音法[14]等,該類方法所監(jiān)測數(shù)據(jù)往往離散型的,數(shù)據(jù)容易缺失,沖擊地壓前兆信息嚴(yán)重缺乏,此外,臨界指標(biāo)的確定是難題。區(qū)域性早期評價主要指多參量綜合評價,如FDA(Fisher Discriminant Analysis)模型[15]、CPM(Catastrophe Progression Method)模型[16]以及BDA(Bayes Discriminant Analysis)模型[17],該類方法從不同側(cè)面反映影響沖擊地壓危險(xiǎn)性不確定因素,但需要大量沖擊地壓危險(xiǎn)性評價資料。沖擊地壓作為一種復(fù)雜非線性動力學(xué)現(xiàn)象,其機(jī)理復(fù)雜、影響因素多,沖擊地壓危險(xiǎn)性評價還待于進(jìn)一步研究,正因如此,應(yīng)尋求多種方法結(jié)合辨識沖擊地壓危險(xiǎn)性等級。
本文提出一種R型因子分析和概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)的沖擊地壓危險(xiǎn)性等級評價模型;PNN是在徑向基神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上融合Bayes 決策理論以及密度函數(shù)估計(jì),但是PNN徑向基函數(shù)還保留徑向基神經(jīng)網(wǎng)絡(luò)中常采用的高斯函數(shù)?;诖耍墨I(xiàn)[18]采用Alpha穩(wěn)定分布改進(jìn)PNN樣本層中徑向基函數(shù);而文獻(xiàn)[19]則利用遺傳算法獲取模式層矢量最佳數(shù)目及匹配的平滑因子參數(shù)集,以上的改進(jìn)都取得了一定的成果。本文借簽一種多元統(tǒng)計(jì)方法:R型因子分析。采用R型因子析法對沖擊地壓危險(xiǎn)性評價指標(biāo)數(shù)據(jù)進(jìn)行壓縮和特征信息提取,即用少數(shù)變量盡可能多地反映原有的變量信息,保證原信息損失小且變量數(shù)目盡可能少,解決了指標(biāo)信息重疊問題,此外,經(jīng)R型因子分析處理后的因子得分?jǐn)?shù)據(jù)(新樣本數(shù)據(jù))PNN模型樣本層中基函數(shù)有更好的表達(dá)。以此為基礎(chǔ),利用因子得分?jǐn)?shù)據(jù)建立沖擊地壓危險(xiǎn)性等級評價PNN模型,并以重慶硯石臺煤礦沖擊地壓實(shí)例驗(yàn)證模型的可行性。此外,因子分析在工程領(lǐng)域內(nèi)應(yīng)用較少,其應(yīng)用主要體現(xiàn)在指標(biāo)權(quán)重的確定上,目前,對于沖擊地壓危險(xiǎn)性等級評價至今還鮮見文獻(xiàn)報(bào)道;文章采用R型因子分析對指標(biāo)降維同時,采用R型因子分析對沖擊地壓危險(xiǎn)性等級進(jìn)行定性評價。
因子分析是主成分分析的推廣和發(fā)展,由相關(guān)性矩陣依賴關(guān)系出發(fā),將具有錯綜復(fù)雜關(guān)系的多個變量(或樣品)綜合為數(shù)量較少幾個因子的一種多元統(tǒng)計(jì)分析方法。常用的因子分析由兩種,一種是R型因子分析(對象為變量),另外一種是Q型因子分析(對象為樣品);本文采用R型因子分析。
設(shè)n個原始變量X1,X2,,Xn,n個變量可由m個因子F1,F(xiàn)2,,F(xiàn)m與一個n×m階的系數(shù)矩陣A的乘積再加上一個特殊因子ε=(ε1,ε2,,εn)表示(n≥m)
(1)
式中:F1,F(xiàn)2,,F(xiàn)n為m個公因子;εi為變量Xi(i=1,2,,n)所獨(dú)有的特殊因子,它們都是不可觀測的隱變量,稱aij(i=1,2,,n;j=1,2,,m,n)為變量Xi在公因子Fi上是載荷,它反映公因子對變量的重要程度,對解釋公因子具有重要的作用。
對式(1)作如下假設(shè):
①公因子彼此不相關(guān),且具有單位方差,即E(F)=0m×1,var(F)=Im×m;
③公因子和特殊因子彼此不相關(guān),即cov(F,ε)=0m×n。
為了消除指標(biāo)產(chǎn)生的不可公度性,在進(jìn)行因子分析前需對指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,具體做法為
(2)
限于篇幅,本文不再列出因子分析的具體步驟,其具體步驟見文獻(xiàn)[20-21]。
PNN是一種基于徑向基函數(shù)和經(jīng)典的概率密度估計(jì)原理而建立的神經(jīng)網(wǎng)絡(luò)[22],其網(wǎng)絡(luò)結(jié)構(gòu)見圖1,PNN的算法步驟為
圖1 概率神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of probabilistic neural network
首先,將待測樣本向量X輸入輸入層,其中神經(jīng)元數(shù)目與樣本維數(shù)相等。樣本層(部分學(xué)者稱為模式層)計(jì)算待測樣本向量X與訓(xùn)練樣本間的距離,該層每個節(jié)點(diǎn)單元的輸出計(jì)算為
f(X,Wi)=exp[-(X-Wi)T(X-Wi)/2δ2]
(3)
式中:X為待測樣本向量;Wi為輸入層到樣本層的權(quán)重;δ為平滑參數(shù)。
然后,對求和層進(jìn)行某類的概率密度函數(shù)(Probability Density Function,PDF)求和,由Parzen窗(即 kernel函數(shù))方法可得各類PDF估計(jì)
(4)
式中:fa(X)為a類的概率密度函數(shù)值;Xai為i個訓(xùn)練樣本向量;s訓(xùn)練樣本個數(shù);r為待測樣本向量X和訓(xùn)練樣本向量Xai維數(shù)。
最后,競爭層輸出各類概率密度函數(shù),概率最大值的那一類為1,其他類別為0。
沖擊地壓危險(xiǎn)性等級評價的R型因子分析和PNN模型技術(shù)路線,如圖 2 所示,主要評價步驟如下:①采用R型因子分析對指標(biāo)數(shù)據(jù)進(jìn)行降維處理;②將R型因子分析后的因子得分?jǐn)?shù)據(jù)作為PNN輸入層,建立沖擊地壓危險(xiǎn)性等級評價的PNN模型;③設(shè)置徑向基函數(shù)的擴(kuò)展系數(shù),采用SPREAD表示;④得出沖擊地壓危險(xiǎn)性等級評價結(jié)果。
根據(jù)硯石臺煤礦30多年的動力現(xiàn)象資料,并結(jié)合周健等、文暢平以及代高飛的研究成果,選取煤厚(X1)、傾角(X2)、埋深(X3)、構(gòu)造情況(X4)、傾角變化(X5)、煤厚變化(X6)、瓦斯?jié)舛?X7)、頂板管理(X8)、卸壓(X9)以及響煤炮聲(X10)等 10 個影響因素作為沖擊地壓的評價指標(biāo)。其中,X4,X5,X6,X8,X9以及X10等狀態(tài)參量指標(biāo)需要進(jìn)行數(shù)量化處理(見表1),其數(shù)量化參考文獻(xiàn)[23],并將硯石臺煤礦沖擊地壓分為微沖擊、弱沖擊、中等沖擊和強(qiáng)沖擊4類,分別用G1,G2,G3和G4表示,其學(xué)習(xí)樣本見表2和表3。
圖2 R型因子分析的PNN沖擊地壓評價模型技術(shù)路線Fig.2 Technology Roadmap of rock burst evaluation model of PNN based on R-type factor analysis
采用SPSS統(tǒng)計(jì)軟件(自動執(zhí)行指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化)對表2中35個樣本10個指標(biāo)數(shù)據(jù)進(jìn)行因子分析,其中,主因子數(shù)目的確定,要求盡量提取多的信息且又能夠達(dá)到降維目的。在不知道考慮幾個公共因子的情況下,一般優(yōu)先考慮較多的公因子,然后根據(jù)結(jié)果再減少因子數(shù),但此過程過于繁瑣。Mardia給出不同公共主因子數(shù),所應(yīng)具備最少的原始變量數(shù)之間的關(guān)系(見表4);國內(nèi)學(xué)者常采用累積方差貢獻(xiàn)率大于85%(部分學(xué)者采用70%~80%)來確定主因子數(shù)目。文章首先將主因子個數(shù)定為5進(jìn)行因子分析。因子分析的總方差解釋見表5。由表5可以看出,經(jīng)最大方差法旋轉(zhuǎn)以后,前5個因子變量的特征值均大于1,前5個主因子累積方差貢獻(xiàn)率為 89.633%,包含原有指標(biāo)數(shù)據(jù)信息89.633%,提取前5個主因子較為合適。
表1 沖擊地壓危險(xiǎn)性等級評價及定性指標(biāo)賦值Tab.1 Classification of rock burst risk evaluation and qualitative index assignment
表2 樣本表Tab.2 Training samples
表3 沖擊地壓發(fā)生地點(diǎn)Tab.3 Location of rockburst
主因子載荷表征的是主因子與原始變量之間的相關(guān)系數(shù),主因子載荷矩陣旋轉(zhuǎn)之后載荷系數(shù)(見表6)更接近1或者0,這樣得到的主因子能夠更好的解釋和命名變量。結(jié)合貢獻(xiàn)率與正負(fù)相關(guān)性作用,由表6可以看出,第一主因子F1與指標(biāo)X4,X8,X9和X10顯著正相關(guān),因此,F(xiàn)1綜合構(gòu)造情況、頂板管理、卸壓以及響煤炮聲等指標(biāo)信息。第二主因子F2與指標(biāo)X2和X5顯著正相關(guān),F(xiàn)2綜合傾角和傾角變化指標(biāo)信息,F(xiàn)2可稱為傾角因子。第三主因子F3與X6和X7變量存在明顯正相關(guān)性,因此,F(xiàn)3綜合了煤厚變化和瓦斯?jié)舛戎笜?biāo)信息。第四主因子F4僅與X3顯著正相關(guān),F(xiàn)4可稱為埋深因子。第五主因子F5僅與X1顯著正相關(guān),F(xiàn)5可稱為煤厚因子。
表4 主因子數(shù)與原始變量數(shù)關(guān)系Tab.4 The relationship between the number of principal factors and the number of original variables
(5)
(6)
(7)
(8)
(9)
將表2中樣本數(shù)據(jù)標(biāo)準(zhǔn)化,然后,將處理后數(shù)據(jù)代入式(5)~式(9)進(jìn)行主因子得分?jǐn)?shù)據(jù)的計(jì)算(見表8)。根據(jù)主因子得分?jǐn)?shù)據(jù)。目前,許多專家采用主成分分析得分圖反映對象與指標(biāo)之間關(guān)系[24],因子分析作為主成分分析的推廣,同樣可采用主因子得分圖反映對象與指標(biāo)之間關(guān)系,作出F1與F2間主因子得分散點(diǎn)圖(見圖3)。
結(jié)合由圖3和表6可以看出,主因子F1與F2分別包含原來信息量的31.595%和20.676%;編號為16~22,26~28,30,33,和35的13個樣本分布在F1和F2第一象限(正向區(qū)間),第一、二主因子得分較大,這13個樣本的煤層傾角較大,多以急傾斜煤層為主,傾角變化較大,構(gòu)造情況較為復(fù)雜,頂板管理較差,支護(hù)差甚至無支護(hù),卸壓效果差,有的甚至無卸壓措施,響煤炮聲較多,這與表2中指標(biāo)實(shí)際情況大體一致,可以大致分析這13個樣本的沖擊地壓多以中等沖擊~強(qiáng)沖擊地壓為主。第四象限中5,6,7,9,12,14,15,23,31,32和34等11個樣本分布在F1的正向區(qū)間和F2的負(fù)向區(qū)間;表明這11個樣本構(gòu)造較為復(fù)雜,頂板管理較差,支護(hù)差甚至無支護(hù),卸壓效果一般,有的甚至無卸壓措施,響煤炮聲較多,煤層傾角多以傾斜為主,傾角變化較小,有的甚至無變化,這11個樣本的沖擊地壓多以微沖擊~中沖擊地壓為主。10,11和13等3個樣本分布在F1的負(fù)向區(qū)間和F2的正向區(qū)間(第二區(qū)間),表明這3個樣本的煤層傾角較大,多以急傾斜煤層為主,且傾角變化較大,構(gòu)造較為簡單,頂板管理較好,卸壓效果較好,響煤炮聲整體偏較少,個別樣本的響煤炮聲多,這3個樣本多以弱沖擊~中等沖擊地壓為主。第三區(qū)間包含了1,2,3,4,8,24,25和29等8個樣本分布在F1和F2第三區(qū)間,且落在第一主因子F1和第二主因子F2的負(fù)向區(qū)間,這8個樣本構(gòu)造較為簡單,頂板支護(hù)較好,卸壓效果較好,大部分無響煤炮聲,響煤炮聲整體偏較少,傾角較小,多以緩傾斜為主,傾角變化較小,這8個樣本多以微沖擊~弱等沖擊地壓為主。
表5 特征值及其貢獻(xiàn)率Tab.5 Eigenvalues and variances
表6 旋轉(zhuǎn)后因子載荷矩陣Tab.6 Factor loading matrix after rotation
表7 因子得分系數(shù)矩陣Tab.7 Coefficient matrix of factor scores
圖3 主因子F1和F2得分散點(diǎn)圖Fig.3 Scatter plot of principal factor scores of F1 and F2
以上分析可以看出,F(xiàn)1和F2得分散點(diǎn)圖可以為沖擊地壓危險(xiǎn)性定性分析提供一種很好的思路,F(xiàn)1和F2主要包含原始數(shù)據(jù)6個指標(biāo)和52.271%信息。除F1和F2,F(xiàn)1和F3以外,其余主因子間得分散點(diǎn)圖難以對沖擊地壓危險(xiǎn)性進(jìn)行定性分析,只能對反映指標(biāo)變化趨勢,原因在于:其余主因子間主要包含原始數(shù)據(jù)指標(biāo)個數(shù)和原有信息較少(小于50%),限于篇幅,本文將不再列出進(jìn)行具體分析。
采用綜合評價函數(shù)對35個樣本沖擊地壓危險(xiǎn)性等級進(jìn)行綜合評價,其綜合評價函數(shù)為
(10)
式中:η1,η2,η3,η4和η5分別為主因子F1,F(xiàn)2,F(xiàn)3,F(xiàn)4和F5各自方差貢獻(xiàn)率,0.896 33為累積方差貢獻(xiàn)率。
將式(5)~式(9)代入式(10)得到
(11)
由表5表8和式(10)可以計(jì)算得出綜合主因子得分值(見表9),將綜合主因子得分值在等距d=[0.905 8+0.887 8]/4=0.448 4下分為4種類型沖擊地壓。第一類沖擊地壓:微沖擊地壓,其綜合主因子得分值取值范圍為[-0.887 8,-0.439 4),該區(qū)間包括1~4,6,8,19和25號等8個樣本,結(jié)合表2可以看出,除6和8號樣本被劃分到微沖擊類外,其余樣本的評價結(jié)果與實(shí)際情況一致。第二類沖擊地壓:弱沖擊地壓,其綜合主因子得分值取值范圍為[0.439 4,-0.009),該區(qū)間包括5,7,10和24號樣本,除10號樣本被劃分到弱沖擊類外,5,7和24號樣本評價結(jié)果與實(shí)際情況一致。第三類沖擊地壓:中等沖擊地壓,其綜合主因子得分值取值范圍為[-0.009,0.457 4),該區(qū)間包括9~15,20~23,26~28和30~35號樣本,20~23,26,28,30和33號樣本的評價結(jié)果與實(shí)際存在一定偏差外,其余樣本的評價與實(shí)際情況一致。第四類沖擊地壓:強(qiáng)沖擊地壓,其綜合主因子得分取值范圍[0.457 4,0.905 8],區(qū)間包括16,17,18和19號樣本,從表2可以看出,評價結(jié)果與實(shí)際情況一致。
表9 綜合主因子得分及其排名Tab.9 Comprehensive the principal factor scores and their rankings
對表2進(jìn)行R型因子分析,采用5個主因子得分?jǐn)?shù)據(jù)(見表8)作為新的樣本數(shù)據(jù)(包含原始數(shù)據(jù)信息的89.633%)進(jìn)行概率神經(jīng)網(wǎng)絡(luò)仿真。沖擊地壓危險(xiǎn)性等級評價只是一個理論結(jié)果,為了簡明描述沖擊地壓危險(xiǎn)性等級,文章將PNN模型競爭層神經(jīng)元的期望輸出值設(shè)置為1(G1),2(G2),3(G3)和4(G4)。其中,G1,G2,G3和G4代表沖擊地壓危險(xiǎn)性等級。
此外,為檢驗(yàn)PNN模型泛化能力,保證沖擊地壓危險(xiǎn)性等級評價結(jié)果的可靠性,應(yīng)避免主觀地選取訓(xùn)練樣本多、測試樣本少的情況。將表7中35個樣本構(gòu)造5種不同的情況進(jìn)行學(xué)習(xí),即將訓(xùn)練樣本與測試樣本個數(shù)比分別設(shè)為31∶4,29∶6,27∶8,25∶10和23∶12進(jìn)行學(xué)習(xí),以探討訓(xùn)練樣本個數(shù)對PNN模型預(yù)測精度影響。其中,SPREAD的值設(shè)置為0.5,以保證沖擊地壓危險(xiǎn)性等級得到準(zhǔn)確的評價。與此同時,將未經(jīng)因子分析的樣本數(shù)據(jù)(見表2)同樣構(gòu)造上述5種情況進(jìn)行學(xué)習(xí)。
限于篇幅,僅列出訓(xùn)練與測試樣本個數(shù)比為31∶4的學(xué)習(xí)情況(圖4~圖7)。由圖4和圖5可以看出,指標(biāo)數(shù)據(jù)經(jīng)因子分析降維處理后,PNN模型對1~31號樣本進(jìn)行訓(xùn)練,判別無錯誤,32~35號測試樣本中34和35號樣本判別錯誤,判別結(jié)果與實(shí)際情況相比,其相對誤差均為33.33%,35個樣本判別結(jié)果與實(shí)際結(jié)果的平均相對誤差為1.90%;經(jīng)因子分析后的PNN模型其正判率為94.29%。由圖6和圖7可以計(jì)算出,未經(jīng)因子分析的樣本數(shù)據(jù)(即原始數(shù)據(jù)),PNN模型仿真結(jié)果中訓(xùn)練樣本判別無錯誤,4個測試樣本中,32,34和35號樣本判別錯誤,判別結(jié)果與實(shí)際情況相比,其相對誤差分別為-66.67%,-66.67%和-33.33%,35個樣本的判別結(jié)果與實(shí)際結(jié)果的平均相對誤差為-4.76%;未經(jīng)因子分析后的PNN模型其正判率為91.43%。經(jīng)因子分析后的PNN模型其預(yù)測精度同比提高了3.13%。
為進(jìn)行比較,表2中列出FDA模型、CPM模型以及BDA模型的評價結(jié)果。由表2可以看出,經(jīng)因子分析后的PNN模型,其判別結(jié)果與FDA模型、CPM模型以及BDA模型的評價結(jié)果基本一致。PNN模型對訓(xùn)練與測試樣本個數(shù)比分別為31∶4,29∶6,27∶8,25∶10和23∶12的學(xué)習(xí)統(tǒng)計(jì)結(jié)果見圖8和表10和表11。由圖8可以看出,隨著訓(xùn)練樣本個數(shù)的減少,PNN模型的預(yù)測精度越來越低;由圖8及表10和表11可以看出,經(jīng)因子分析降維后的PNN 模型,比采用原始指標(biāo)數(shù)據(jù)建立的PNN模型更優(yōu);經(jīng)因子分析PNN模型評價結(jié)果與實(shí)際沖擊地壓發(fā)生情況對照如表 2所示。從表2可以看出,經(jīng)因子分析PNN模型評價結(jié)果與實(shí)際情況較為一致,說明因子分析后PNN模型在沖擊地壓危險(xiǎn)性等級評價中是可行的。
圖4 經(jīng)因子分析沖擊地壓樣本1#~31#訓(xùn)練和誤差結(jié)果Fig.4 Training effects and the error results of rock burst samples 1#-31# by factor analysis
圖5 經(jīng)因子分析沖擊地壓樣本32#~35#測試效果Fig. 5 Test results of rock burst samples 32#-35# by factor analys1is
圖6 未經(jīng)因子分析沖擊地壓樣本1#~31#訓(xùn)練和誤差結(jié)果Fig.6 Training effects and the error results of rock burst samples 1#-31# without factor analysis
圖7 未經(jīng)因子分析沖擊地壓樣本32#~35#測試效果Fig. 7 Test results of rock burst samples 32#-35# without factor analys1is
圖8 訓(xùn)練樣本數(shù)對PNN模型的影響Fig.8 Effect of training samples on PNN model
(1)表2中35組樣本數(shù)據(jù)適合采用因子分析?
因子分析作為主成分析的推廣,同樣可采用KMO(Kaiser Meyer Olkin)統(tǒng)計(jì)量和Bartlett P球形檢驗(yàn)作為判別因子分析使用條件(見表12)。采用SPSS軟件得到KMO和 Bartlett 檢驗(yàn)結(jié)果(見表13)。由表12和表13可以看出,本文采用因子分析對表2中35個樣本10個指標(biāo)數(shù)據(jù)進(jìn)行降維處理是可行的。
(2)SPREAD的參數(shù)值影響著PNN模型的預(yù)測精度,SPREAD值越小,對函數(shù)的逼近越精確,SPREAD值越大,模型預(yù)測誤差越大,其默認(rèn)值為1。針對表10和表11的評價結(jié)果,本文將PNN模型參數(shù)值設(shè)置為0.5,使得PNN模型評價效果達(dá)到最優(yōu)。以表8(主因子得分?jǐn)?shù)據(jù))中35個樣本數(shù)據(jù)進(jìn)行學(xué)習(xí),采用1~31 號樣本作訓(xùn)練,32~35樣本作測試,將SPREAD值設(shè)為1.5,以檢驗(yàn)PNN模型的可靠性(圖9和圖10);由圖9和圖10可以看出,當(dāng)SPREAD值為1.5時,模型正判率為91.43%,可見,經(jīng)因子分析后的PNN模型在沖擊地壓危險(xiǎn)性等級評價中是可行的。
表10 經(jīng)因子分析后PNN模型的5種學(xué)習(xí)情況Tab.10 Five learning situations of PNN model by factor analysis
表11 未經(jīng)因子分析PNN模型的5種學(xué)習(xí)情況Tab.11 Five learning situations of PNN model without factor analysis
表12 KMO 和 Bartlett 的檢驗(yàn)標(biāo)準(zhǔn)Tab.12 Test standard of KMO and Bartlett
表13 KMO 和 Bartlett 的檢驗(yàn)結(jié)果Tab.13 Result of KMO and Bartlett test
圖9 SPREAD值為1.5下PNN模型訓(xùn)練和誤差結(jié)果Fig.9 Training effects and the error results when the value of SPREAD is 1.5
(3)從R型因子分析-PNN耦合模型仿真結(jié)果來看,一些樣本的評價結(jié)果與實(shí)際存在一定的偏差,可能的原因是:①樣本容量有限,指標(biāo)的選取以及量化還不夠合理,使得R型因子分析-PNN耦合模型的評價結(jié)果與實(shí)際存在一定的偏差。②根據(jù)錢鳴高等的研究,拋出煤量在10~50 t,震級在1~2級的沖擊地壓定義為中等沖擊;拋出煤量在50 t以上,震級在2級以上的沖擊地壓定義為強(qiáng)等沖擊。從表2表3可以看出,34*號樣本位于3 605 N 段切割眼,噴出煤巖50 t,理論上來看,沖擊地壓類型定義為為強(qiáng)沖擊地壓。但實(shí)際工程中,針對噴出煤巖噸數(shù)的測定,可能因方法自身的局限性,研究人員在對測量值取舍時,猶豫再三,往往從安全的角度出發(fā),導(dǎo)致沖擊地壓等級評價偏高。此外,35*號樣本評價過高,但從工程安全角度來說,評價結(jié)果是可以接受的。
圖10 SPREAD值為1.5下PNN模型測試效果Fig.10 Test results of PNN model when the value of SPREAD is 1.5
(4)不同的變量尺度會對因子分析評價結(jié)果產(chǎn)生影響,因?yàn)樽兞砍叨鹊淖兓瘯淖冏兞康姆讲詈途?。為了消除變量產(chǎn)生的不可公度性,因子分析中采用標(biāo)準(zhǔn)化、均值化或極差變化等方法對變量進(jìn)行無量綱化處理,實(shí)際上,所有無量綱化都會導(dǎo)致指標(biāo)數(shù)據(jù)信息的損失,這可通過數(shù)學(xué)得到證明。以均值化為例,設(shè)原始數(shù)據(jù)矩陣X=(Xij)n×p,無量綱化得到矩陣Z=(Zij)n×p,
其中,均值化公式為
(12)
(13)
(5)因子分析后的指標(biāo)數(shù)據(jù)(因子得分?jǐn)?shù)據(jù)),PNN模型中高斯函數(shù)有更好的表達(dá),即因子得分?jǐn)?shù)據(jù)更多服從正態(tài)分布(正態(tài)分布的概率密度函數(shù)是高斯函數(shù)的一個實(shí)例)。
文章對原始指標(biāo)數(shù)據(jù)和因子得分?jǐn)?shù)據(jù)進(jìn)行正態(tài)性分析,首先提出統(tǒng)計(jì)假設(shè):H0為指標(biāo)數(shù)據(jù)服從正態(tài)分布;H1為指標(biāo)數(shù)據(jù)不服從正態(tài)分布。
采用SPSS軟件計(jì)算得到正態(tài)性檢驗(yàn)結(jié)果,如表14和表15所示,概率P>0.05時,不能拒絕原檢驗(yàn)假設(shè)H0,認(rèn)為指標(biāo)數(shù)據(jù)服從正態(tài)分布。由表14和表15可以看出,原始數(shù)據(jù)中X2和X3指標(biāo)數(shù)據(jù)服從正態(tài)分布,假設(shè)每組指標(biāo)數(shù)據(jù)攜帶的信息均等,原始數(shù)據(jù)中有20%的數(shù)據(jù)服從正態(tài)分布;若不考慮因子分析后指標(biāo)信息的損失,因子得分?jǐn)?shù)據(jù)中有60%數(shù)據(jù)數(shù)據(jù)服從正態(tài)分布,也就是說,因子分析后指標(biāo)數(shù)據(jù)高斯函數(shù)有更好的數(shù)學(xué)表達(dá)。
值得一提的是,沖擊地壓不僅受地質(zhì)條件和開采技術(shù)條件的影響,而且還受Ⅱ 類開采技術(shù)條件(例如爆破作業(yè)、巷幫擴(kuò)修、推采速率以及工作面停復(fù)產(chǎn)等)的影響[26],使得沖擊地壓機(jī)理及危險(xiǎn)性等級評價成為一項(xiàng)艱難課題,沖擊地壓危險(xiǎn)性評價還有待于進(jìn)一步研究和探討。
表14 原始數(shù)據(jù)正態(tài)性檢驗(yàn)結(jié)果(P值)Tab.14 Normality test results of original data(P value)
表15 主因子得分?jǐn)?shù)據(jù)正態(tài)性檢驗(yàn)的P值結(jié)果Tab.15 Normality test results of principal factor scores(P value)
(1)沖擊地壓危險(xiǎn)性等級評價模型——R型因子分析和概率網(wǎng)絡(luò)模型,PNN過程簡單,總收斂于Bayes優(yōu)化解,穩(wěn)定性高,不需要確定模型的隱含層,樣本追加能力強(qiáng),訓(xùn)練樣本可直接賦值給網(wǎng)絡(luò),訓(xùn)練時間僅略大于數(shù)據(jù)讀取的時間,不存在局部最優(yōu)值,可容忍一些判別錯誤的樣本。
(2)采用R型因子分析對沖擊地壓10個指標(biāo)進(jìn)行降維處理,提取5個新的綜合指標(biāo),盡可能多地保留原始變量的信息,而且提取的綜合指標(biāo)彼此獨(dú)立,解決了指標(biāo)信息重疊以及多重共線性問題,此外,降維后的指標(biāo)數(shù)據(jù),PNN模型中高斯函數(shù)有更廣泛的數(shù)學(xué)表達(dá),進(jìn)一步提高PNN模型預(yù)測精度。
(3)重慶硯石臺煤礦沖擊地壓危險(xiǎn)性等級評價結(jié)果表明:指標(biāo)數(shù)據(jù)經(jīng)R型因子分析降維后,5種不同學(xué)習(xí)情況下PNN模型仍具有較好的評價效果,其正判率分別為94.29%,88.57%,88.57%,85.71%和82.86%;說明R型因子分析和PNN模型結(jié)合在沖擊地壓危險(xiǎn)性等級評價中是可行的。