柴敬, 劉義龍, 王安義, 屈世甲, 歐陽(yáng)一博
(1.西安科技大學(xué) 能源學(xué)院, 陜西 西安 710054; 2.西安科技大學(xué) 西部礦井開(kāi)采及災(zāi)害防治教育部 重點(diǎn)實(shí)驗(yàn)室, 陜西 西安 710054; 3.西安科技大學(xué) 通信與信息工程學(xué)院, 陜西 西安 710054; 4.天地(常州)自動(dòng)化股份有限公司, 江蘇 常州 213015)
煤炭開(kāi)采過(guò)程破壞了巖層間原始的應(yīng)力平衡狀態(tài),在重力影響下,巖體會(huì)產(chǎn)生新的應(yīng)力場(chǎng),通常稱(chēng)為礦壓顯現(xiàn)。劇烈的礦壓會(huì)誘發(fā)巷道變形失穩(wěn)、瓦斯突出、沖擊地壓等地質(zhì)災(zāi)害,為煤礦生產(chǎn)帶來(lái)巨大的損失[1-2]。因此,為減少地質(zhì)災(zāi)害的發(fā)生,掌握礦壓顯現(xiàn)的規(guī)律并對(duì)礦壓進(jìn)行有效預(yù)測(cè)和控制是煤礦安全生產(chǎn)的重要課題之一。
近年來(lái),分布式光纖傳感技術(shù)[3-5]的興起有效解決了礦壓難以監(jiān)測(cè)的問(wèn)題。但是,由于采動(dòng)過(guò)程中巖層變形具有隨機(jī)性、非線(xiàn)性的特點(diǎn),導(dǎo)致礦壓規(guī)律難以預(yù)測(cè)。為解決該問(wèn)題,許多學(xué)者采用光纖傳感器監(jiān)測(cè)的光纖頻移值對(duì)礦壓顯現(xiàn)規(guī)律進(jìn)行表征。王潤(rùn)沛[6]基于光纖平均頻移變化度表征礦壓的原理,結(jié)合機(jī)器學(xué)習(xí)算法對(duì)礦壓進(jìn)行預(yù)測(cè)。鞏師鑫等[7]基于液壓支架工作阻力數(shù)據(jù)表征礦壓的原理,采用MRDA FLPEM(流形正則域適應(yīng)函數(shù)鏈接預(yù)測(cè)誤差)集成算法預(yù)測(cè)了綜采工作面礦壓。趙毅鑫等[8]利用液壓支架阻力數(shù)據(jù)分析了大采高工作面的礦壓顯現(xiàn)規(guī)律并采用深度學(xué)習(xí)算法預(yù)測(cè)了礦壓。常峰[9]基于工作面頂板礦壓數(shù)據(jù),采用遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)了綜采工作面頂板的來(lái)壓規(guī)律。李澤萌[10]采用LSTM(Long Short-Term Memory,長(zhǎng)短期記憶網(wǎng)絡(luò))模型對(duì)支架阻力數(shù)據(jù)表征的礦壓進(jìn)行預(yù)測(cè)。趙銘生等[11]基于工作面綜采條件下的礦壓破壞深度實(shí)測(cè)數(shù)據(jù),采用遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)模型對(duì)礦壓破壞深度進(jìn)行預(yù)測(cè)。上述研究在數(shù)據(jù)完整情況下對(duì)礦壓顯現(xiàn)規(guī)律進(jìn)行了有效預(yù)測(cè),但礦井環(huán)境惡劣,傳感器采集的數(shù)據(jù)存在缺失現(xiàn)象,導(dǎo)致無(wú)法準(zhǔn)確預(yù)測(cè)礦壓顯現(xiàn)規(guī)律。因此,本文以義馬煤業(yè)(集團(tuán))有限責(zé)任公司千秋煤礦為工程背景,搭建三維相似物理模型,在假設(shè)光纖下半部分?jǐn)?shù)據(jù)丟失的前提下,引入GRU(Gated Recurrent Unit,門(mén)控循環(huán)單元)和LSTM預(yù)測(cè)模型,對(duì)缺失的光纖頻移值進(jìn)行對(duì)比預(yù)測(cè),使用預(yù)測(cè)效果較優(yōu)的缺失值填補(bǔ)光纖頻移值數(shù)據(jù)缺失位置。將填補(bǔ)后的光纖頻移值數(shù)據(jù)轉(zhuǎn)換為能表征礦壓規(guī)律的光纖平均頻移變化度數(shù)據(jù),引入極端梯度提升(eXtreme Gradient Boosting,XGBoost)[12]模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比預(yù)測(cè),得到較適合的礦壓預(yù)測(cè)模型。
根據(jù)千秋煤礦的地質(zhì)特征及構(gòu)造(表1)搭建三維相似物理模型,如圖1所示。模型幾何相似比為1∶400,容重相似比為1∶1.6,尺寸為3 600 mm×2 000 mm×2 000 mm(長(zhǎng)×寬×高)。模型中上覆巖層厚度為174 mm,模擬煤層厚度為60 mm,底板厚度為200 mm。在模型上方均勻放置載荷共計(jì)3.4 kPa的沙袋。自開(kāi)切眼位置從左至右進(jìn)行掘進(jìn),工作面推進(jìn)步距為40 mm,推進(jìn)總長(zhǎng)為2 400 mm。
在相似物理模型中埋設(shè)分布式光纖傳感器,建立光纖數(shù)據(jù)監(jiān)測(cè)系統(tǒng),如圖2所示。該系統(tǒng)由光纖傳感器、NBX-6055應(yīng)力分析儀及計(jì)算機(jī)組成。在模型中部等間距布設(shè)3條垂直光纖Fv1,F(xiàn)v2,F(xiàn)v3,光纖數(shù)據(jù)采樣間隔為10 mm,有效長(zhǎng)度為1 740 mm。在模擬工作面掘進(jìn)時(shí),光纖受到巖層內(nèi)部變形力的作用發(fā)生頻移,通過(guò)NBX-6055應(yīng)力分析儀將光信號(hào)轉(zhuǎn)換為電信號(hào)后,傳輸?shù)接?jì)算機(jī),最后使用計(jì)算機(jī)軟件實(shí)現(xiàn)對(duì)光纖數(shù)據(jù)的解析和存儲(chǔ),采集到的數(shù)據(jù)以.bat格式存放。為了便于處理,將數(shù)據(jù)遷移至excel表格中,數(shù)據(jù)結(jié)構(gòu)為174×60的矩陣形式,行代表整條光纖各個(gè)位置的數(shù)據(jù),列代表工作面的推進(jìn)距離。
表1 覆巖結(jié)構(gòu)及物理力學(xué)參數(shù)Table 1 Rock structure and physical and mechanical parameters
圖1 三維相似物理模型Fig.1 3D similar physical model
根據(jù)光纖傳感原理可知,在消除溫度因素影響后,布里淵頻移值與應(yīng)變存在線(xiàn)性關(guān)系。布里淵頻移值的變化是傳感光纖對(duì)巖體變形破裂過(guò)程中信息變化的反映。巖層產(chǎn)生的變形越明顯,光纖所受應(yīng)力越大,光纖監(jiān)測(cè)系統(tǒng)測(cè)得的布里淵頻移值變化也越大;當(dāng)巖層產(chǎn)生的變形不明顯時(shí),光纖監(jiān)測(cè)系統(tǒng)測(cè)得的布里淵頻移值變化小。基于上述巖層變形引起的光纖頻移值變化規(guī)律,文獻(xiàn)[13-16]提出了一種利用光纖平均頻移變化度表征礦壓的方法,即將光纖平均頻移變化度曲線(xiàn)中的“尖峰”位置作為上覆巖層礦壓顯現(xiàn)的判斷指標(biāo)。光纖平均頻移變化度公式為
(1)
圖2 光纖監(jiān)測(cè)系統(tǒng)Fig.2 Optical fiber monitoring system
GRU模型是基于RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))預(yù)測(cè)模型和LSTM預(yù)測(cè)模型的改進(jìn)模型,既解決了RNN模型中由于共享系數(shù)矩陣導(dǎo)致的梯度彌散和梯度爆炸的問(wèn)題,也解決了LSTM中內(nèi)部單元結(jié)構(gòu)冗余的問(wèn)題。這使得GRU模型在運(yùn)算速度上優(yōu)于LSTM模型,且對(duì)小樣本數(shù)據(jù)集的預(yù)測(cè)精度更高。
GRU模型內(nèi)部單元主要由重置門(mén)和更新門(mén)組成,如圖3所示。重置門(mén)可以令當(dāng)前神經(jīng)元的隱藏狀態(tài)遺忘與預(yù)測(cè)不相關(guān)的信息。更新門(mén)用于更新當(dāng)前時(shí)刻該神經(jīng)單元記憶有效信息的程度,更新門(mén)的值越大說(shuō)明記憶的有效信息越多。
GRU模型內(nèi)部各部分運(yùn)算表達(dá)式為
r=σ(Wrxt+Brht-1)
(2)
z=σ(Wzxt+Bzht-1)
(3)
g=tanh(Wgxt+Bgrht-1)
(4)
ht=(1-z)ht-1+zg
(5)
圖3 GRU網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 GRU network topology
式中:r為重置門(mén);σ為sigmoid激活函數(shù),表示神經(jīng)元的激活率;Wr,Br,Wz,Bz,Wg,Bg分別為重置門(mén)、更新門(mén)和候選隱藏狀態(tài)的上一時(shí)刻輸出及當(dāng)前時(shí)刻輸入所對(duì)應(yīng)的權(quán)重矩陣;xt為t時(shí)刻的輸入;ht-1為t-1時(shí)刻的輸出;z為更新門(mén);g為候選隱藏狀態(tài);ht為t時(shí)刻的輸出。
XGBoost是在上一次模型預(yù)測(cè)的基礎(chǔ)上加入一顆新樹(shù),然后去擬合前面樹(shù)的預(yù)測(cè)結(jié)果與真實(shí)值之間的殘差從而形成新模型,并將新模型作為下次模型學(xué)習(xí)的基礎(chǔ),以此提升模型的預(yù)測(cè)精度。其函數(shù)為
(6)
XGBoost使用的目標(biāo)函數(shù)為
(7)
(8)
采用平均絕對(duì)誤差MR和平均相對(duì)誤差MA作為模型預(yù)測(cè)效果的評(píng)價(jià)指標(biāo)。
(9)
(10)
式中C為參與評(píng)估的樣本數(shù)。
為選取較優(yōu)模型進(jìn)行缺失值處理,對(duì)LSTM和GRU模型的預(yù)測(cè)效果進(jìn)行對(duì)比。采用掘進(jìn)至2 320 mm的光纖頻移值數(shù)據(jù)作為GRU和LSTM模型的數(shù)據(jù)集,將數(shù)據(jù)集按照7∶3的比例劃分為訓(xùn)練集和測(cè)試集。設(shè)預(yù)測(cè)步長(zhǎng)為1,將均方誤差函數(shù)作為損失函數(shù),批尺寸為3,迭代次數(shù)為20。
LSTM和GRU模型的損失函數(shù)分別如圖4、圖5所示??煽闯鲈诘^(guò)程中,LSTM模型在7次迭代后收斂過(guò)程平穩(wěn),GRU模型在5次迭代后收斂過(guò)程平穩(wěn),訓(xùn)練集損失函數(shù)和測(cè)試集損失函數(shù)均達(dá)到平穩(wěn)狀態(tài),說(shuō)明GRU模型的收斂速度比LSTM模型的收斂速度快。
圖4 LSTM模型損失函數(shù)Fig.4 LSTM model loss function
圖5 GRU模型損失函數(shù)Fig.5 GRU model loss function
LSTM和GRU模型對(duì)Fv1光纖下半部分?jǐn)?shù)據(jù)反歸一化后的預(yù)測(cè)結(jié)果如圖6所示??煽闯?種預(yù)測(cè)模型都能準(zhǔn)確預(yù)測(cè)出光纖下半部分頻移數(shù)據(jù)。為衡量模型的表現(xiàn)能力,計(jì)算真實(shí)值和預(yù)測(cè)值的誤差可得:LSTM模型的平均相對(duì)誤差為15.63%,平均絕對(duì)誤差為17.43 MHz,GRU模型的平均相對(duì)誤差為10.84%,平均絕對(duì)誤差為9.78 MHz。說(shuō)明GRU模型的精度比LSTM模型的精度高。因此,使用GRU模型對(duì)缺失值進(jìn)行回歸預(yù)測(cè)可得到更優(yōu)效果。
為了評(píng)估GRU模型的泛化能力,假設(shè)工作面掘進(jìn)至1 320 mm時(shí)出現(xiàn)缺失現(xiàn)象,導(dǎo)致在后續(xù)監(jiān)測(cè)過(guò)程中,光纖監(jiān)測(cè)的下半部分光纖頻移值數(shù)據(jù)均缺失,采用GRU模型進(jìn)行多次預(yù)測(cè),將預(yù)測(cè)結(jié)果填補(bǔ)至缺失位置,如圖7所示。與光纖原始頻移數(shù)據(jù)(圖8)對(duì)比可知,使用GRU模型預(yù)測(cè)的光纖數(shù)據(jù)與原始光纖頻移數(shù)據(jù)曲線(xiàn)基本一致,說(shuō)明GRU模型具有良好的泛化能力。
圖6 LSTM和GRU模型的預(yù)測(cè)結(jié)果Fig.6 The prediction results of LSTM and GRU models
圖7 光纖預(yù)測(cè)數(shù)據(jù)整合Fig.7 The optical fiber prediction data integration
圖8 光纖原始頻移數(shù)據(jù)Fig.8 The optical fiber raw frequency shift data
為了驗(yàn)證XGBoost模型在預(yù)測(cè)礦壓規(guī)律上的優(yōu)越性,采用傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型與XGBoost模型對(duì)礦壓進(jìn)行對(duì)比預(yù)測(cè)。將完整的光纖頻移值轉(zhuǎn)換為能表征礦壓現(xiàn)象的光纖平均頻移變化度曲線(xiàn),如圖9所示。根據(jù)光纖平均頻移變化度“尖峰”可以表征礦壓的原理,對(duì)“尖峰”進(jìn)行標(biāo)注,在工作面掘進(jìn)過(guò)程中,共出現(xiàn)14次來(lái)壓現(xiàn)象。
圖9 Fv1光纖平均頻移變化度曲線(xiàn)Fig.9 The average frequency shift curve of Fv1 optical fiber
基于混沌理論[17]對(duì)光纖平均頻移變化度數(shù)據(jù)進(jìn)行相空間重構(gòu),通過(guò)自相關(guān)法得到最佳延遲時(shí)間τ和嵌入維數(shù)v。經(jīng)實(shí)驗(yàn)得到當(dāng)v=3,τ=1時(shí),模型達(dá)到最優(yōu)狀態(tài)。設(shè)P為根據(jù)嵌入維數(shù)v建立的輸入數(shù)據(jù)集,Q為根據(jù)延遲時(shí)間τ建立的輸出數(shù)據(jù)集,數(shù)據(jù)集形式為
(11)
式中p為數(shù)據(jù)集中的數(shù)據(jù)。
將經(jīng)過(guò)相空間重構(gòu)的數(shù)據(jù)集按照4∶1的比例劃分為訓(xùn)練集和測(cè)試集,將訓(xùn)練集代入模型進(jìn)行學(xué)習(xí),測(cè)試集用來(lái)評(píng)估模型預(yù)測(cè)效果。
采用網(wǎng)格搜索算法對(duì)XGBoost模型中樹(shù)的深度和數(shù)量等超參數(shù)進(jìn)行最優(yōu)化,當(dāng)樹(shù)的深度為6、樹(shù)的數(shù)量為60時(shí),可使模型性能達(dá)到最優(yōu)。XGBoost模型和BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果如圖10所示??煽闯鯴GBoost模型能準(zhǔn)確預(yù)測(cè)出測(cè)試集中所有出現(xiàn)“尖峰”的位置,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)模型只預(yù)測(cè)出2處“尖峰”的位置,說(shuō)明XGBoost模型的預(yù)測(cè)效果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果。
計(jì)算可得BP神經(jīng)網(wǎng)絡(luò)模型的平均絕對(duì)誤差為34.42 MHz,平均相對(duì)誤差為23.01%,XGBoost模型的平均絕對(duì)誤差為13.60 MHz,平均相對(duì)誤差為9.45%,XGBoost模型誤差小于BP神經(jīng)網(wǎng)絡(luò)模型,說(shuō)明XGBoost模型預(yù)測(cè)礦壓的準(zhǔn)確率優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型。
圖10 XGBoost模型和BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果Fig.10 Prediction results of XGBoost model and BP neural network model
為驗(yàn)證使用GRU模型預(yù)測(cè)缺失值的有效性和采用XGBoost模型預(yù)測(cè)礦壓的泛化性,將預(yù)測(cè)出來(lái)的缺失數(shù)據(jù)填補(bǔ)到缺失位置,形成“完整”的光纖頻移值數(shù)據(jù),將其轉(zhuǎn)換為光纖頻移變化度數(shù)據(jù)后,再使用XGBoost模型進(jìn)行預(yù)測(cè),實(shí)驗(yàn)結(jié)果如圖11所示??煽闯鼋?jīng)缺失值填補(bǔ)后,采用XGBoost模型依然可以準(zhǔn)確預(yù)測(cè)出“尖峰”位置。對(duì)XGBoost 模型預(yù)測(cè)出來(lái)的數(shù)據(jù)與真實(shí)數(shù)據(jù)間的誤差進(jìn)行統(tǒng)計(jì),可得平均絕對(duì)誤差為13.74 MHz,平均相對(duì)誤差為9.48%。與使用XGBoost模型預(yù)測(cè)完整光纖的效果相差不大。綜上所述,使用GRU模型可對(duì)缺失的光纖數(shù)據(jù)進(jìn)行有效預(yù)測(cè),且XGBoost模型在其他數(shù)據(jù)集中的表現(xiàn)良好。
圖11 替換數(shù)據(jù)預(yù)測(cè)Fig.11 Replacement data prediction
(1) 通過(guò)LSTM和GRU模型對(duì)光纖下半部分?jǐn)?shù)據(jù)進(jìn)行預(yù)測(cè)。結(jié)果表明,2種模型均可準(zhǔn)確預(yù)測(cè)出光纖下半部分的數(shù)據(jù),且GRU模型準(zhǔn)確性較LSTM模型準(zhǔn)確性高。
(2) 基于表征礦壓規(guī)律的相似物理模型實(shí)驗(yàn)測(cè)得的光纖頻移數(shù)據(jù),使用XGBoost模型對(duì)模擬工作面推進(jìn)下的礦壓進(jìn)行預(yù)測(cè),可準(zhǔn)確預(yù)測(cè)出測(cè)試集中所有出現(xiàn)“尖峰”的位置,其平均絕對(duì)誤差為13.60 MHz,平均相對(duì)誤差為9.45%。
(3) 通過(guò)多次采用GRU模型預(yù)測(cè)其他掘進(jìn)次數(shù)的光纖下半部分?jǐn)?shù)據(jù),用預(yù)測(cè)結(jié)果替換原始監(jiān)測(cè)結(jié)果,重新計(jì)算光纖平均頻移變化度,經(jīng)歸一化、相空間重構(gòu)后代入XGBoost模型進(jìn)行預(yù)測(cè)。結(jié)果表明,替換后的數(shù)據(jù)能準(zhǔn)確預(yù)測(cè)出周期來(lái)壓,與原始結(jié)果基本吻合,其平均絕對(duì)誤差為13.74 MHz,平均相對(duì)誤差為9.48%。