李海濤,張海寬,齊慶新
(1.煤炭科學(xué)研究總院有限公司 深地科學(xué)研究院,北京 100013;2.煤炭資源高效開采與潔凈利用國家重點實驗室,北京 100013)
煤礦沖擊地壓具有發(fā)生突然、破壞猛烈的特點[1-4],會造成巷道大范圍破壞甚至人員傷亡,是對于煤礦安全生產(chǎn)威脅最為嚴(yán)重的災(zāi)害之一,基于可靠數(shù)據(jù)提升沖擊危險性預(yù)測的準(zhǔn)確性,對于有效防治沖擊地壓具有十分重要的意義。目前,學(xué)者們主要通過將多類型數(shù)據(jù)進(jìn)行權(quán)重融合[5-11]以實現(xiàn)對于目標(biāo)區(qū)域危險性的評價。
微震監(jiān)測以其較大的空間覆蓋能力和相對高質(zhì)量的監(jiān)測數(shù)據(jù),為煤礦沖擊危險性分析預(yù)測提供了可靠的支撐[12-14]。在對礦井中危險災(zāi)害的分析和預(yù)測研究方面,相關(guān)研究利用微震監(jiān)測數(shù)據(jù)的時序、地點、能量和應(yīng)力等數(shù)據(jù)對機(jī)器學(xué)習(xí)算法或其他算法進(jìn)行訓(xùn)練,然后預(yù)測礦井中的危險災(zāi)害。竇林名等[15]以微震為主,通過選取沖擊變形能、時序集中度、時空擴(kuò)散性等13 個監(jiān)測預(yù)警指標(biāo),搭建了集成微震、應(yīng)力、鉆屑等多種監(jiān)測手段的沖擊礦壓風(fēng)險智能判識與多參量監(jiān)測預(yù)警云平臺;YIN 等[16-17]利用應(yīng)力、扭矩、體積、應(yīng)力變化等微震監(jiān)測數(shù)據(jù)基于集成算法和神經(jīng)網(wǎng)絡(luò)算法對沖擊地壓的預(yù)測進(jìn)行了研究,并取得了較好的效果。相關(guān)礦井中危險災(zāi)害分析和研究很少考慮危險災(zāi)害的前兆信息、時空特性和發(fā)生機(jī)理等信息,且多數(shù)礦井中僅有時序、地點和能量等監(jiān)測數(shù)據(jù),這些方法無法在實際工程中廣泛使用。
基于微震監(jiān)測數(shù)據(jù)對礦井中沖擊地壓發(fā)生機(jī)理的研究中,學(xué)者們通過對礦區(qū)整體微震活動時空分布特征的研究認(rèn)為微震參數(shù)的變化規(guī)律可作為預(yù)測地壓災(zāi)害的前兆特征[18]。袁瑞甫等[19]研究了煤柱型沖擊地壓微震信號分布特征后,總結(jié)了沖擊地壓發(fā)生前有一段微震活躍期、靜默期、和發(fā)生地點集中等沖擊地壓發(fā)生的前兆信息。相關(guān)機(jī)理研究可以為分析和預(yù)測方法中數(shù)據(jù)集特征的建立提供一定依據(jù),從而提高基于機(jī)器學(xué)習(xí)算法對礦井中危險災(zāi)害的分析預(yù)測的準(zhǔn)確率和泛用性。
與沖擊地壓對應(yīng)的微震事件樣本量極為有限,而常規(guī)微震事件雖然樣本體量大,但往往缺乏訓(xùn)練標(biāo)簽,均無法支撐機(jī)器學(xué)習(xí)模型的應(yīng)用。為此,通過跟蹤某礦井微震事件及其對應(yīng)的礦壓顯現(xiàn)特征,并將能夠產(chǎn)生明顯震感或動力顯現(xiàn)特征的微震事件標(biāo)注為“危險事件”,以此獲得含標(biāo)簽的大體量微震數(shù)據(jù)集;并進(jìn)一步針對無法準(zhǔn)確判定某次微震事件危險性的問題,考慮沖擊地壓的發(fā)生機(jī)制和前兆信息,基于深度學(xué)習(xí)模型提出了分析礦井中微震危險性的方法。該方法主要分為3 個步驟:選取分析特征;建立數(shù)據(jù)集和處理不平衡樣本;訓(xùn)練和測試基于深度學(xué)習(xí)的分析模型,將該模型用于分析某礦井微震監(jiān)測數(shù)據(jù)取得了較好的效果,同時大量實驗驗證了該模型具備了較好的泛化能力。
考慮沖擊地壓的前兆信息,基于CNN-GRU 模型(卷積神經(jīng)網(wǎng)絡(luò)[20]-門控循環(huán)單元模型[21])提出了利用微震監(jiān)測數(shù)據(jù)分析沖擊危險性的方法(卷積神經(jīng)網(wǎng)絡(luò)-門控循環(huán)單元模型)。
由于多數(shù)礦井微震監(jiān)測數(shù)據(jù)的特征主要包括時間、地點、能量,因此考慮沖擊地壓發(fā)生的前兆信息[15,18-19],建立了微震事件的時序集中度、2 次微震事件時間間隔、空間密集度、能量和能量集中度5 個分析特征。
根據(jù)相關(guān)研究,沖擊地壓等礦井動力災(zāi)害發(fā)生前有一段明顯的微震活躍期,這是因為圍巖正在與外界發(fā)生能量交換,圍巖結(jié)構(gòu)處于非穩(wěn)態(tài)的調(diào)整期,這一性質(zhì)用時序集中度表示為:
在大能量的危險事件發(fā)生前,微震活動會出現(xiàn)較短的平靜時期,一般稱為靜默期,但不同危險事件的靜默期長短相差較大,靜默期可用本次微震時間與上次微震時間間隔表示ΔT。
微震事件的空間分布與微裂隙在巖體內(nèi)部空間的發(fā)生發(fā)展過程相對應(yīng),因此分析微震事件的空間分布規(guī)律變化對于了解巖體穩(wěn)定性有重要作用,在沖擊地壓等危險事件發(fā)生前微震的空間密集度會明顯上升,可表示為:
礦山中沖擊地壓的發(fā)生時,巷道周圍圍巖體中的壓力由穩(wěn)態(tài)增加至極限值,會造成巖體內(nèi)能量突然釋放,能量是分析礦山?jīng)_擊地壓等危險事件的重要特征。同時,建立了能量集中度指標(biāo)來反映沖擊地壓發(fā)生前的能量變化和微震分布情況,計算公式如下:
由于幾種監(jiān)測數(shù)據(jù)的數(shù)值大小不一,在分析指標(biāo)建立之后需對能量指標(biāo)進(jìn)行標(biāo)準(zhǔn)化進(jìn)行處理,公式為:
式中:xi、yi為標(biāo)準(zhǔn)化處理前后的第i 個數(shù)據(jù)值;n 為監(jiān)測事件總數(shù)。
對數(shù)據(jù)集建立和處理步驟為:①根據(jù)分析特征和微震監(jiān)測事件的危險性建立初始數(shù)據(jù)集;②在時間尺度上將初始數(shù)據(jù)集分為訓(xùn)練集、驗證集和測試集;③對分割后的每個數(shù)據(jù)集進(jìn)行樣本不平衡性的處理。上述步驟的順序和處理方法不可改變,如果對樣本的不平衡處理出現(xiàn)在分割數(shù)據(jù)集之前,或不在時間尺度上而是隨機(jī)分割數(shù)據(jù)集,會出現(xiàn)模型在訓(xùn)練集或驗證集上效果極好,但在真實數(shù)據(jù)的測試集上效果極差的現(xiàn)象。
分析框架中的數(shù)據(jù)集以根據(jù)微震監(jiān)測數(shù)據(jù)建立的分析特征為數(shù)據(jù)集特征,以微震事件的危險性作為標(biāo)簽建立數(shù)據(jù)集??紤]到各個監(jiān)測數(shù)據(jù)的數(shù)量級不同,需對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,訓(xùn)練模型中使用的損失函數(shù)為交叉熵,因此對標(biāo)簽進(jìn)行One-Hot 編碼處理。
對于不同礦井或同一礦井的不同開采地點,微震監(jiān)測數(shù)據(jù)對應(yīng)的地質(zhì)環(huán)境是不同的,部分沖擊地壓等危險事件的分析模型在測試集上效果很好卻很難直接應(yīng)用。因此,為模擬現(xiàn)實工程的直接應(yīng)用情況,本框架將數(shù)據(jù)集在時間尺度上分為訓(xùn)練集、驗證集和測試集3 個部分,將訓(xùn)練集數(shù)據(jù)輸入到模型中進(jìn)行訓(xùn)練,在驗證集上對訓(xùn)練的結(jié)果進(jìn)行評價,選取性能最好的模型直接應(yīng)用到測試集中驗證模型的泛化性能。
開采過程中危險事件對應(yīng)的微震監(jiān)測數(shù)據(jù)數(shù)量要遠(yuǎn)遠(yuǎn)小于不危險事件,所以在訓(xùn)練模型之前需要處理不平衡數(shù)據(jù)。目前,從數(shù)據(jù)角度出發(fā)的不平衡數(shù)據(jù)處理方法主要有采樣和數(shù)據(jù)合成方法。其中采樣可分為從少數(shù)類樣本中隨機(jī)采樣來增加新的樣本的上采樣方法和從多數(shù)類樣本中隨機(jī)選擇少量樣本,再合并原有少數(shù)類樣本作為新的訓(xùn)練數(shù)據(jù)集的下采樣方法。數(shù)據(jù)合成方法是利用已有樣本生成更多樣本,這類方法在小數(shù)據(jù)場景下有很多成功案例,其方法包括合成少數(shù)類過采樣技術(shù)(SMOTE[22])和自適應(yīng)合成方法(ADASYN[23]),SMOTE 算法的對少數(shù)類樣本進(jìn)行分析并根據(jù)少數(shù)類樣本通過人工合成新樣本然后添加到數(shù)據(jù)集中,其改進(jìn)算法包括Borderline-SMOTE[24]等;ADASYN 主要思想是根據(jù)數(shù)據(jù)分布情況為不同的少數(shù)類樣本生成不同數(shù)量的新樣本。根據(jù)對礦山微震監(jiān)測數(shù)據(jù)的研究,礦山監(jiān)測數(shù)據(jù)中危險事件分布位置呈現(xiàn)分散且分布于非危險事件之間的特點,因此主要使用對采樣數(shù)據(jù)添加擾動的上采樣方法處理不平衡數(shù)據(jù)集。
近些年來卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像視覺領(lǐng)域取得了巨大的成功,CNN 是1 個深度學(xué)習(xí)框架,其靈感來自于貓的大腦視覺皮層[25]。CNN 的體系結(jié)構(gòu)可以有所不同,通常由幾個卷積層、激活層組成,在計算機(jī)視覺領(lǐng)域一般也包含池化層或全連接層,其作用是保證卷積神經(jīng)網(wǎng)絡(luò)模型對圖片分類任務(wù)的平移不變性,由于每組數(shù)據(jù)有限,因此構(gòu)建的CNN 結(jié)構(gòu)中只有卷積層和激活層。卷積層的作用是提取數(shù)據(jù)中的代表性特征,多個卷積核存在于1 個卷積層中,也被稱為濾波器。該濾波器類似于1 個滑動窗口,它在數(shù)值矩陣中以特定的步幅來回移動。在對濾波器和數(shù)值矩陣進(jìn)行卷積運算后,可以得到圖像的初始特征圖,并將其發(fā)送到卷積層的激活函數(shù)中。卷積核運算示意如圖1。
圖1 卷積核運算示意Fig.1 Schematic diagram of convolution kernel operation
通常在特征提取之后會引入正則化方法,來加快網(wǎng)絡(luò)訓(xùn)練和收斂速度,防止模型梯度爆炸和過擬合,目前主流方法有批正則化[26](Batch Normalization)和Dropout[27]方法。將提取的特征輸入到激活函數(shù)中來為卷積神經(jīng)網(wǎng)絡(luò)中加入非線性因素,卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)中使用的激活函數(shù)為Relu[28]函數(shù),其公式如下:
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)對于序列數(shù)據(jù)的處理擁有巨大的優(yōu)勢,因為其實一類以序列數(shù)據(jù)為輸入,在序列的演進(jìn)方向進(jìn)行遞歸且所有節(jié)點(循環(huán)單元)按鏈?zhǔn)竭B接的遞歸神經(jīng)網(wǎng)絡(luò)。長短期記憶網(wǎng)絡(luò)(LSTM)[29]和門控循環(huán)單元(GRU)[21]是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的主要變種(目前也有學(xué)者認(rèn)為GRU 是LSTM 的變種),考慮到參數(shù)的數(shù)量和計算效果,在構(gòu)建模型中選取門控循環(huán)單元(GRU)。
單個門控循環(huán)單元(GRU)結(jié)構(gòu)如圖2。
圖2 門控循環(huán)單元結(jié)構(gòu)Fig.2 Door control cycle unit structure
重置門和更新門的輸入均為當(dāng)前時間步輸入Xt與上一時間步隱藏狀態(tài)Ht-1,輸出由激活函數(shù)為Sigmoid 函數(shù)的全連接層計算得到。Sigmoid 函數(shù)、重置門Rt和更新門Zt的計算如下:
式中:Wxr、Wxz、Whr、Whz為權(quán)重參數(shù);br、bz為偏差參數(shù);h 為隱藏單元個數(shù);Xt為給定時間步t 的小批量輸入;Ht-1為上一時間步的隱藏狀態(tài)。
將當(dāng)前時間步重置門的輸出與上一時間步隱藏狀態(tài)做元素乘法(符號為⊙)。如果重置門中元素值接近0,那么意味著重置對應(yīng)隱藏狀態(tài)元素為0,即丟棄上一時間步的隱藏狀態(tài)。如果元素值接近1,那么表示保留上一時間步的隱藏狀態(tài)。然后,將按元素乘法的結(jié)果與當(dāng)前時間步的輸入連結(jié),再通過含激活函數(shù)tanh 的全連接層計算出候選隱藏狀態(tài),其所有元素的值域為[-1,1]。具體來說,tanh 激活函數(shù)和時間步t 的候選隱藏狀態(tài)的公式為:
隨著計算機(jī)視覺相關(guān)研究的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的聯(lián)合神經(jīng)網(wǎng)絡(luò)(CNN-RNN)在圖像字幕領(lǐng)域取得了較大進(jìn)展,其主要通過卷積神經(jīng)網(wǎng)絡(luò)對圖像的空間結(jié)構(gòu)和相關(guān)信息進(jìn)行特征提取,然后將提取的特征輸入到RNN 網(wǎng)絡(luò)中生成對應(yīng)圖片信息相關(guān)的解釋。受圖像字幕領(lǐng)域的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)啟發(fā),對于微震數(shù)據(jù)相關(guān)特征的分析首先利用卷積神經(jīng)網(wǎng)絡(luò)對分析特征進(jìn)行信息提取和信息融合等操作,然后以提取的特征作為初始隱藏狀態(tài),將分類特征作為輸入?yún)?shù)。
建立的CNN-GRU 聯(lián)合卷積神經(jīng)網(wǎng)絡(luò),主要由5 層卷積神經(jīng)網(wǎng)絡(luò)層、5 個門控循環(huán)單位結(jié)構(gòu)和2 層全連接層構(gòu)成,由于輸入的分析特征尺寸較小所以設(shè)計的模型較為簡單且卷積神經(jīng)網(wǎng)絡(luò)中沒有pooling 層,該模型在實驗中取得效果最好。在CNN 模型輸入中可將4 個分析特征視為4 個特征或1 個特征的4 個數(shù)據(jù),主要使用前者輸入,CNN 模型結(jié)構(gòu)中1×1 卷積主要起到信息升維度和跨通道融合的作用,3×3 和2×2 卷積主要起到增加同一通道的信息交流的作用。即使增加模型的層數(shù)也不會提升模型在測試集上的效果,且會出現(xiàn)網(wǎng)絡(luò)退化現(xiàn)象,即層數(shù)增加反而導(dǎo)致模型的訓(xùn)練效果和測試效果均下降。參考ResNet[30]和DenseNet[31]網(wǎng)絡(luò)結(jié)構(gòu),即使模型加入恒等映射,在測試集上的效果也未提升。
使用某煤礦礦井的微震監(jiān)測數(shù)據(jù)對建立的分析框架進(jìn)行驗證,該微震監(jiān)測數(shù)據(jù)包括從2017 年1 月到2018 年7 月的13 583 條數(shù)據(jù),監(jiān)測內(nèi)容包括微震發(fā)生時間、地點和能量,在13 583 條數(shù)據(jù)中強(qiáng)震動對應(yīng)的危險事件數(shù)量為114。首先根據(jù)微震監(jiān)測數(shù)據(jù)計算時序集中度、空間密集度、時間間隔和能量作為數(shù)據(jù)集特征,以是否發(fā)生危險事件作為標(biāo)簽,然后在時間尺度上按照50%、20%和30%的數(shù)量將數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集。時序集中度和空間密集度需要根據(jù)前n 次微震事件的數(shù)據(jù)進(jìn)行計算,取n=1,2,…,30,建立30 組數(shù)據(jù)集。為模擬模型的直接應(yīng)用情況,然后對訓(xùn)練集和驗證集的聯(lián)合數(shù)據(jù)集、測試集分別數(shù)據(jù)不平衡處理,使測試集的數(shù)據(jù)不與其他數(shù)據(jù)集有交叉,考慮到對危險事件預(yù)測的重要性設(shè)定了3 個測試集,分別為單獨危險事件的測試集、單獨不危險事件的測試集和混合事件測試集,混合事件測試集中使用上采樣加擾動的方法使兩種事件的樣本數(shù)量幾乎相同。使用CNN-GRU模型計算,需要計算的參數(shù)為3 446 個,模型中使用Adam 優(yōu)化器和Cross Entropy Loss 損失函數(shù),學(xué)習(xí)率為0.01。最后將處理的數(shù)據(jù)輸入到CNN-GRU 模型中,得到的30 組計算結(jié)果如圖3。
圖3 CNN-GRU 模型在融合前n 次微震事件數(shù)據(jù)的測試結(jié)果(n=1,2,…,30)Fig.3 Test results of n microseismic event data of CNN-GRU model before fusion(n=1,2,…,30)
通過計算結(jié)果可以看出,模型在不同數(shù)據(jù)集上達(dá)到最高準(zhǔn)確率時,所對應(yīng)的n 不同:①當(dāng)n=8 時模型在混合事件測試集上取得最佳效果,準(zhǔn)確率為79.72%,該模型在危險事件數(shù)據(jù)集上準(zhǔn)確率為81.98%,在非危險事件測試集上準(zhǔn)確率為76.11%,此時模型在驗證集準(zhǔn)確率為79.05%(因驗證集和測試集都未參與訓(xùn)練,所以模型在測試集上的準(zhǔn)確率高于驗證集是合理的),這與模型在混合測試集上的準(zhǔn)確率相近,說明該模型的遷移效果極好;②模型在非危險數(shù)據(jù)集上的最高準(zhǔn)確率出現(xiàn)在n=19時,準(zhǔn)確率為94.96%,但此模型在危險數(shù)據(jù)集上的準(zhǔn)確率0,其在混合測試集上的表現(xiàn)最差,這可能和監(jiān)測數(shù)據(jù)的分布有關(guān);③而當(dāng)n=1 時,模型在非危險數(shù)據(jù)集上準(zhǔn)確率僅為4.39%,而在危險數(shù)據(jù)集上的準(zhǔn)確率為99.09%。這是因為對微震事件的危險性進(jìn)行分析是二分類任務(wù),在不能準(zhǔn)確確定閾值的情況下,當(dāng)1 個模型將更多的事件分為危險事件時,其在危險數(shù)據(jù)集上的準(zhǔn)確率就更高,在不危險數(shù)據(jù)集上的準(zhǔn)確率就更低,反之亦然。模型在混合測試集上的結(jié)果在進(jìn)行微震事件危險性的分析時更具有參考意義。
使用單獨CNN 和單獨GRU 模型對2 節(jié)中煤礦礦井的微震監(jiān)測數(shù)據(jù)進(jìn)行分析,分析流程除了神經(jīng)網(wǎng)絡(luò)模型不同外其他均相同。2 個模型訓(xùn)練過程中均使用Adam 優(yōu)化器和Cross Entropy Loss 損失函數(shù),CNN 模型參數(shù)總數(shù)為1 384 個,GRU 模型參數(shù)總數(shù)為412 個。取n=1,2,…,30,建立30 組數(shù)據(jù)集,CNN-GRU 模型、CNN 模型和GRU 模型融合前n 次微震事件數(shù)據(jù)的測試結(jié)果對比如圖4。
圖4 3 種模型在測試集上的效果對比Fig.4 Comparison of the effects of three models on test sets
通過圖4 可以發(fā)現(xiàn):當(dāng)n 變化時(除去n=18時),GRU 模型在全部測試集上的表現(xiàn)都相對穩(wěn)定,不同CNN 模型在測試集上的性能變化很大,但最高準(zhǔn)確率大于GRU 模型的最高準(zhǔn)確率;多數(shù)情況下,GRU 模型在混合數(shù)據(jù)集上的性能表現(xiàn)好于CNN 模型,這主要是因為構(gòu)建的數(shù)據(jù)集中每個樣本包含數(shù)據(jù)量很少,CNN 模型不能充分發(fā)揮其數(shù)據(jù)信息的融合和提取能力,而GRU 模型可以對樣本數(shù)據(jù)的時序進(jìn)行分析。
在大多數(shù)情況下CNN-GRU 模型在混合數(shù)據(jù)集上的效果好于GRU 模型,其原因主要如下:①在GRU 模型基礎(chǔ)上聯(lián)合CNN 模型,增加了神經(jīng)網(wǎng)絡(luò)模型參數(shù)和激活函數(shù),從而增加了神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜程度、非線性和泛化能力;②雖然不能充分發(fā)揮其優(yōu)勢,但在CNN-GRU 模型中,CNN 模型仍然融合和提取了樣本數(shù)據(jù)的一部分信息,有助于GRU和全連接網(wǎng)絡(luò)對樣本進(jìn)行分類。
CNN-GRU 模型繼承了2 種單獨模型的優(yōu)點,其在混合測試集上的表現(xiàn)相對穩(wěn)定且準(zhǔn)確率是極高的;CNN-GRU 模型最高準(zhǔn)確率為79.72%(n=8),略小于CNN 模型的最高準(zhǔn)確率80.04%(n=25)。此時CNN-GRU 模型在危險數(shù)據(jù)集和非危險數(shù)據(jù)集上取得的準(zhǔn)確率相差不大,分別為76.11%和81.92%;而CNN 模型在危險和非危險數(shù)據(jù)集上準(zhǔn)確率為68.59%和90.53%,可見CNN 模型對于危險事件的信息提取能力較差??紤]到礦井中對危險微震事件分析準(zhǔn)確的重要性,認(rèn)為CNN-GRU 模型在分析微震危險性方面是性能最好的。
當(dāng)n=8 時CNN-GRU 模型、CNN 模型和GRU模型的訓(xùn)練損失如圖5。收斂速度快慢和模型損失從小到大依次是CNN-GRU 模型、CNN 模型、GRU模型,這可能是因為在訓(xùn)練時CNN-GRU 模型計算參數(shù)最多而GRU 模型訓(xùn)練參數(shù)最少。經(jīng)過對比分析發(fā)現(xiàn)在分析方法框架中,CNN-GRU 模型取得效果最好,GRU 模型參數(shù)最少且計算效果較好,證明GRU 模型的參數(shù)使用效率最高。
圖5 數(shù)據(jù)集特征融合前8 次微震事件數(shù)據(jù)時各模型在訓(xùn)練時損失值Fig.5 The loss value of each model during training when the data set features are fused with the data of the previous 8 micro-seismic events
在以往基于機(jī)器學(xué)習(xí)(深度學(xué)習(xí))對沖擊地壓預(yù)測的研究中,多數(shù)學(xué)者忽略微震監(jiān)測數(shù)據(jù)的時空特性或前兆特征,且相關(guān)研究中也很少將數(shù)據(jù)集分為訓(xùn)練集、測試集和驗證集3 個部分,這也導(dǎo)致了模型完成訓(xùn)練后的泛化能力不能得到很好的保障。為分析方法中根據(jù)微震前兆特征對數(shù)據(jù)處理的重要性,將前8 次微震監(jiān)測數(shù)據(jù)的時間、能量和地點(x,y,z)作為1 個樣本的特征(尺寸為[5,8]),在時間尺度上按照5∶2∶3 的數(shù)量比例將數(shù)據(jù)集分為訓(xùn)練集、測試集和驗證集3 個部分,事件的危險性作為標(biāo)簽。使用如圖4 的CNN-GRU 模型(輸入特征尺寸和中間參數(shù)尺寸有修改)對微震危險事件進(jìn)行分析,在驗證集(危險事件與非危險事件混合)上的最高準(zhǔn)確率為97.33%,但在混合測試集上準(zhǔn)確率為49.79%,在危險事件測試集上準(zhǔn)確率為98.81%,在非危險測試集上準(zhǔn)確率為0。盡管該模型在驗證集上取得了極高的準(zhǔn)確率,但在混合測試集和危險事件測試集上準(zhǔn)確率極差,說明不考慮微震前兆特征的危險性分析方法的泛化性能很差,分析的結(jié)果不具有參考意義。
1.1 節(jié)構(gòu)建了4 個分析指標(biāo),為證明基于學(xué)習(xí)方法分析微震數(shù)據(jù)中危險事件規(guī)律的可行性,根據(jù)以往相關(guān)研究選取微震監(jiān)測事件的時空擴(kuò)散性ds、時間信息熵Q1、總應(yīng)力當(dāng)量Q32作為額外特征,相關(guān)計算公式如下:
使用CNN-GRU 模型,取n=1,2,…,30 時各指標(biāo)組合的訓(xùn)練模型在混合測試集上的最佳效果通過對比發(fā)現(xiàn),能量對于分析本次微震事件的危險性是十分重要的,盡管當(dāng)指標(biāo)組合為時序集中度QT、時間間隔ΔT、能量E、能量密集度QE時模型準(zhǔn)確率為80.16%,但其在危險和非危險數(shù)據(jù)集上表現(xiàn)效果相差較大,因此認(rèn)為時序集中度QT、時間間隔ΔT、空間密集度E、能量密集度QE、時空擴(kuò)散性QR對分析微震事件都是有貢獻(xiàn)的;時空擴(kuò)散性ds和時間信息熵Q1對于該礦井中微震危險性分析影響不大;Q32特征甚至?xí)?yán)重影響對微震事件危險性的準(zhǔn)確分析。
以上分析和比較證明,在可用微震監(jiān)測數(shù)據(jù)較少的情況下,結(jié)合微震前兆特征對監(jiān)測數(shù)據(jù)進(jìn)行處理,可以明顯提高微震危險性分析的準(zhǔn)確率。對于統(tǒng)一模型不同分析特征組合會取得不同的效果,有些分析特征會對模型的性能產(chǎn)生負(fù)面影響,所以在建立分析特征時需要充分分析危險災(zāi)害的發(fā)生機(jī)理和前兆信息。
根據(jù)礦井中微震監(jiān)測信息對危險事件進(jìn)行分析是十分復(fù)雜的,這主要是因為對礦井中危險事件的發(fā)生規(guī)律缺乏清晰的認(rèn)知,首先基于深度學(xué)習(xí)方法對礦井中危險事件的發(fā)生的規(guī)律性進(jìn)行研究,然后根據(jù)已有研究成果和計算結(jié)果討論深度學(xué)習(xí)模型研究微震監(jiān)測數(shù)據(jù)中危險事件的可行性。
訓(xùn)練的CNN-GRU 聯(lián)合模型在混合測試集上的最高準(zhǔn)確率是79.72%,表明該模型可以遷移應(yīng)用到其他礦井或同一礦井的不同地點中。若將標(biāo)簽設(shè)置為隨機(jī)產(chǎn)生,且取n=8,其它分析步驟不變,該分析方法得到的模型在驗證集上最高準(zhǔn)確率為52.30%,在混合測試集上的準(zhǔn)確率為50.68%,這一特征間接證明了,對于具體礦井,其微震事件的發(fā)生是有一定規(guī)律可循的,是可以被學(xué)習(xí)的。
通過不同模型在3 種測試集上的準(zhǔn)確率對比發(fā)現(xiàn),絕大多數(shù)情況下模型在危險事件測試集上的準(zhǔn)確率最高(多數(shù)在85%以上),在混合數(shù)據(jù)集上的準(zhǔn)確率次之,在危險事件數(shù)據(jù)集上的準(zhǔn)確率最低。這可能主要是因為原始監(jiān)測數(shù)據(jù)中非危險事件的數(shù)量要遠(yuǎn)遠(yuǎn)大于危險事件的數(shù)量,訓(xùn)練數(shù)據(jù)可以包含非危險事件的全部類型,在訓(xùn)練過程中模型會抓取到礦井中非危險事件的發(fā)生規(guī)律;而危險事件發(fā)生的數(shù)量極少,訓(xùn)練數(shù)據(jù)甚至是全部監(jiān)測數(shù)據(jù)都不能包含危險事件的全部類型。這也說明了礦井中危險事件與微震之間是有一定規(guī)律的,利用深度學(xué)習(xí)方法分析微震事件的危險性是可行的。
1)考慮礦井沖擊地壓發(fā)生的前兆信息,基于CNN-GRU 模型提出了一種微震危險性分析方法;在研究某礦山微震監(jiān)測數(shù)據(jù)過程中,該方法首先根據(jù)微震前兆特征選取時序集中度、時間間隔、空間密集度、能量和能量集中度作為分析特征;然后建立初始數(shù)據(jù)集,在時間尺度上將數(shù)據(jù)集分為訓(xùn)練集、驗證集和測試集,并分別處理不平衡樣本;最后使用訓(xùn)練集訓(xùn)練CNN-GRU 模型,將在驗證集取得最好效果的模型用于測試,取得了79.72%的準(zhǔn)確率。
2)不同模型進(jìn)行對比分析結(jié)果顯示GRU 模型在測試集上表現(xiàn)穩(wěn)定,而CNN 模型表現(xiàn)不穩(wěn)定但最高準(zhǔn)確率要高于GRU 模型取得的最高準(zhǔn)確率,CNNGRU 模型擁有在測試集上表現(xiàn)穩(wěn)定且取得了最好效果的優(yōu)點;在對3 種模型的訓(xùn)練損失對比中,CNN-GRU 模型收斂速度最快且最終損失最小。
3)該方法對分析特征的建立進(jìn)行研究后發(fā)現(xiàn),能量對于微震事件的危險性分析極其重要。不考慮微震前兆特征,而直接使用原始數(shù)據(jù)進(jìn)行樣本不平衡處理,并對CNN-GRU 模型進(jìn)行訓(xùn)練,最終的模型在驗證集上雖然準(zhǔn)確率較高,但在測試集上準(zhǔn)確率極低,而且通過對不同分析特征組合的研究也說明建立正確的分析特征對CNN-GRU 模型準(zhǔn)確率的影響很大。
4)對微震監(jiān)測數(shù)據(jù)集的標(biāo)簽進(jìn)行隨機(jī)生成,然后利用該方法對隨機(jī)生成標(biāo)簽的數(shù)據(jù)進(jìn)行分析后取得的效果極差,證明了在選取合適分析特征的基礎(chǔ)上,利用深度學(xué)習(xí)方法對沖擊危險狀態(tài)進(jìn)行分析是可靠的。