武俊峰,成燕峰,梁燕華,張 芳,郭旭飛
(1.黑龍江科技大學 電氣與控制工程學院, 哈爾濱150022; 2.哈爾濱理工大學 自動化學院, 哈爾濱150080)
沖擊地壓是一種對煤礦安全有重大威脅的煤巖動力災害[1]。尹增德等[2]在對沖擊地壓預測研究中提出,沖擊地壓受多個非線性因素影響,傳統(tǒng)的預測方法有很大的局限性。研究沖擊地壓預測,確定各指標的危險等級及危險指數(shù)非常重要,其涉及沖擊地壓指標的模糊集合劃分。傳統(tǒng)的沖擊地壓危險等級確定方法依據(jù)現(xiàn)有經(jīng)驗知識,需要煤礦方面的專家進行鑒定,造成對經(jīng)驗知識有極大的依賴性,且容易出現(xiàn)較大誤差。模糊C均值聚類(FCM)算法對分析數(shù)據(jù)實際分布情況研究尤為突出。劉志國[3]在對模糊C均值聚類算法研究中指出,將物理或抽象對象的集合分組成多個類的過程稱為聚類。聚類分析是統(tǒng)計學的一個分支[4],在對數(shù)據(jù)分析方面起著重要的作用。聚類算法主要用于對大量數(shù)據(jù)分析處理上[5],而沖擊地壓的研究恰好與之對應。嚴加展等[6]指出,聚類分析與模糊理論相結合,更符合實際的數(shù)據(jù)分布情況。常赟杰等[7]研究表明,F(xiàn)CM算法是一種基于目標函數(shù)的聚類算法,聚類過程與帶約束的優(yōu)化問題相類似。劉來權等[8]指出,F(xiàn)CM算法是一類無監(jiān)督學習的算法,將數(shù)據(jù)點歸入相似類之中。
由于FCM算法相較與其他算法簡單,在計算機上容易實現(xiàn),與K均值聚類算法不同,具有模糊性以及不確定性,更加適合于實際應用,有著和希爾伯特空間構造緊密聯(lián)系的目標函數(shù),相比于其他目標函數(shù)擁有更嚴密的數(shù)學根基。筆者使用模糊C均值聚類算法確定沖擊地壓指標的模糊區(qū)間及其危險等級,建立標準模型庫,將新數(shù)據(jù)通過模糊模型識別中歐氏貼近度方法與標準模型庫匹配,預測沖擊地壓危險,解決沖擊地壓危險等級的確定對經(jīng)驗知識的依賴性,使其更符合實際,可靠性更強。
在對沖擊地壓預測研究中,其各項評價指標(三軸抗壓強度、能量、峰值頻率)與危險等級之間均為正相關關系,即隨著各指標的評價對象值越高,沖擊地壓危險等級越高。而對沖擊地壓預測,判斷其危險等級非常重要。
假設數(shù)據(jù)集X={x1,x2,…,xn}有p個評價指標和n個評價對象,F(xiàn)CM算法將數(shù)據(jù)樣本集X劃分為c類,假設有c個聚類中心H={h1,h2,…,hc},F(xiàn)CM算法模型[6]:
(1)
(2)
式中:uij——隸屬度xj屬于聚類中心hi的程度;
U——由屬于每一個數(shù)據(jù)樣本的程度組成的模糊劃分矩陣,U=(uij)c×n;
m——用于調(diào)整模糊劃分矩陣模糊度的權重指數(shù);
‖xj-hi‖2——樣本間的相似性度量。
FCM算法的計算過程[7]可以描述如下:
(1)給定固定聚類數(shù)c,模糊系數(shù)m(通常從1.5到2.5),最大迭代次數(shù)T;閾值η(通常從0.001到0.010),初始化模糊劃分矩陣,滿足式(2)。
(2)根據(jù)式(3)更新集群中心H={h1,h2,…,hc},
(3)
(3)根據(jù)式(4)更新模糊劃分矩陣U=(uij)c×n,
(4)
(4)計算目標函數(shù)J(X,U,H)。若J(X,U,H)≤η或者迭代次數(shù)已經(jīng)達到最大值T,算法停止并輸出結果,否則重復步驟(2)。
采用模糊識別的方法將一組新數(shù)據(jù)g1×s與FCM算法得到的聚類中心Vc×s相匹配,得出g1×s所屬的沖擊地壓危險等級。為了確定g1×s與Vc×s中哪一個最貼近,需要對其貼近度進行比較。貼近度是兩個模糊向量接近程度的度量。設μkh是模糊向量的貼近度,滿足μkh∈[0,1],當μkh越小,2個模糊向量越疏遠,反之則越接近。計算新數(shù)據(jù)g1×s和標準模型庫Vc×s的貼近度,選其貼近度最大值,對應的沖擊地壓危險等級即為預測等級。
歐氏距離dkh計算公式為
(5)
式中:s——指標數(shù);
xig——待測樣本g的第i個屬性歸一化值;
xih——第h類樣本中心向量的第i個屬性歸一化值。
貼近度μkh計算公式為
μkh=1-dkh。
(6)
通過實驗采集數(shù)據(jù),實驗樣品取自煤礦具有沖擊傾向性的巖石。實驗設備是由SH-Ⅱ聲發(fā)射系統(tǒng)以及ROCK600-50三軸實驗儀組成,設備如圖1所示。實驗的固定靜水壓力為5 MPa,ROCK600-50三軸實驗儀加載速度為1.5 MPa/min,SH-Ⅱ聲發(fā)射系統(tǒng)傳感器的頻段設為20~110 kHz,數(shù)據(jù)每1 μs采集一次,門檻值為40 dB。
圖1 實驗設備Fig. 1 Experimental equipment
利用FCM算法[8]對影響沖擊地壓的抗壓強度、能量、峰值頻率劃分危險等級,確定各指標的危險等級以及其對應的模糊集合,再運用模糊模型識別中貼近度的方法與模型庫相匹配,預測沖擊地壓危險程度。每個指標均選取150個實驗數(shù)據(jù)作為研究對象。
由于各影響沖擊地壓的指標衡量單位有差異,且數(shù)量級差別很大。因此,對其進行歸一化處理非常重要,可避免小數(shù)值信息被掩埋于大數(shù)值樣本里,歸一化處理公式:
(7)
式中:Xk——為指標值;
Xmax——指標最大值;
Xmin——指標最小值。
根據(jù)式(7)對三軸抗壓強度σ、能量E、峰值頻率f數(shù)據(jù)歸一化處理后,歸一化三軸抗壓強度σg、歸一化能量Eg、歸一化峰值頻率fg結果,如表1所示。
表1 歸一化處理數(shù)據(jù)
通過Matlab軟件對三軸抗壓強度、能量、峰值頻率進行FCM算法的仿真及貼近度預測實驗,選前140組數(shù)據(jù)進行FCM算法分類實驗[9-11],建立標準模型庫,后10組數(shù)據(jù)中隨機選取一組數(shù)據(jù)作為測試數(shù)據(jù)。將沖擊地壓分為四個危險等級,分別為無沖擊危險、弱沖擊危險、中等沖擊危險、強沖擊危險,因此,F(xiàn)CM算法的固定聚類數(shù)c=4。令模糊系數(shù)m=2,該參數(shù)會影響FCM算法的性能;最大迭代次數(shù)T=100,閾值η=0.001,若FCM算法對指標數(shù)據(jù)重復計算100次或者聚類誤差小于0.001,獲得最優(yōu)結果。
2.2.1 三軸抗壓強度
抗壓強度仿真結果數(shù)據(jù)見圖2,σ1表示三軸抗壓強度歸一化數(shù)據(jù),σ6表示聚類中心,σ2、σ3、σ4、σ5分別表示聚類中心所對應的數(shù)據(jù)集。
圖2 抗壓強度仿真結果Fig. 2 Compressive strength simulation result
聚類中心為σ6=[0.114,0.377,0.644,0.907];其中,數(shù)據(jù)集σ2對應沖擊地壓危險等級為無危險,根據(jù)數(shù)據(jù)集確定模糊集合為[0,0.24];數(shù)據(jù)集σ3對應沖擊地壓危險等級為弱危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.24,0.50];數(shù)據(jù)集σ4對應沖擊地壓危險等級為中等危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.50,0.77];數(shù)據(jù)集σ5對應沖擊地壓危險等級為強危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.77,1.00]。
2.2.2 能量
能量仿真結果數(shù)據(jù)見圖3,E1表示能量歸一化數(shù)據(jù),E6表示聚類中心,E2、E3、E4、E5分別表示聚類中心所對應的數(shù)據(jù)集。
圖3 能量仿真結果Fig. 3 Energy simulation result
聚類中心為E6=[0.001,0.277,0.489,0.971];數(shù)據(jù)集E2對應沖擊地壓危險等級為無危險,根據(jù)數(shù)據(jù)集確定模糊集合為[0,0.01];數(shù)據(jù)集E3對應沖擊地壓危險等級為弱危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.01,0.37];數(shù)據(jù)集E4對應沖擊地壓危險等級為中等危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.37,0.60];數(shù)據(jù)集E5對應沖擊地壓危險等級為強危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.60,1.00]。
2.2.3 峰值頻率
峰值頻率仿真結果數(shù)據(jù)見圖4,f1表示峰值頻率歸一化數(shù)據(jù),f6表示聚類中心,f2、f3、f4、f5分別表示聚類中心所對應的數(shù)據(jù)集。
聚類中心為f6=[0.001,0.271,0.645,0.939];數(shù)據(jù)集f2對應沖擊地壓危險等級為無危險,根據(jù)數(shù)據(jù)集確定模糊集合為[0,0.04];數(shù)據(jù)集f3對應沖擊地壓危險等級為弱危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.04,0.40];數(shù)據(jù)集f4對應沖擊地壓危險等級為中等危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.40,0.70];數(shù)據(jù)集f5對應沖擊地壓危險等級為強危險,根據(jù)數(shù)據(jù)集確定模糊集合為(0.70,1.00]。
圖4 峰值頻率仿結果Fig. 4 Simulation resule of peak frequency
由三軸抗壓強度、能量和峰值頻率的仿真可得,標準模型庫為
隨機選取一組新數(shù)據(jù)
(1)采用FCM算法研究了沖擊地壓各指標數(shù)據(jù)的分布,得出應力與聲發(fā)射中最具代表性的特征抗壓強度、能量、峰值頻率作為表征沖擊地壓指標,確定了危險等級劃分以及與之對應的模糊區(qū)間,為預測沖擊地壓提供了理論參考。
(2)結合FCM算法和歐氏貼近度,解決了沖擊地壓危險等級確定對經(jīng)驗知識的依賴性。該模型預測對象的沖擊地壓危險等級,最大貼近度值為0.944,確定其危險等級為強沖擊危險,與實際相符,說明該模型可靠性強,可以有效預測沖擊地壓。