姜安龍,戚玉亮
(1.南昌航空大學 土木建筑學院,江西 南昌,330063;2.同濟大學 地下建筑與工程系,上海,200092;3.上海交通大學 土木工程系,上海,200030)
數(shù)據(jù)挖掘(Data mining)是一門交叉學科,融合了數(shù)據(jù)庫、人工智能、機器學習、統(tǒng)計學等多個領域的理論和技術,它是知識發(fā)現(xiàn)KDD(Knowledge discovery in database)中進行知識學習的階段,是KDD的核心[1]。地下工程圍巖穩(wěn)定性影響因素眾多,許多研究者對圍巖穩(wěn)定性的影響因素進行了研究[2?6]。大部分研究是從經驗出發(fā)直接得出主要的影響因素,有些是通過定性分析得出。雖然得出的圍巖穩(wěn)定性分類的影響因素在多數(shù)情況下能與實際情況較吻合,但是,缺乏對這些因素的定量化表示和解釋。使用數(shù)據(jù)挖掘技術從大量的工程實例數(shù)據(jù)中進行知識發(fā)現(xiàn),找出蘊含在其中的內在關系,進而應用于相似條件下的工程穩(wěn)定性判別非常有意義。馮夏庭等[7]將數(shù)據(jù)挖掘方法應用到地下硐室圍巖穩(wěn)定性判別知識的自學習中,提出了可以考慮負屬性的一種新的數(shù)據(jù)挖掘方法,它從硐室圍巖穩(wěn)定性的實例數(shù)據(jù)中挖掘出知識,并將得到的知識輸入專家系統(tǒng),進行不確定性推理,對圍巖的穩(wěn)定性進行合理的判別。數(shù)據(jù)挖掘中的粗糙集理論(Rough sets)是Pawlak在1982年提出的[8?9]。它的突出優(yōu)點是不需要預先給定某些特征或屬性的數(shù)量描述,如統(tǒng)計學中的概率分布、模糊集理論中的隸屬函數(shù)等,而是直接從給定問題的描述集合出發(fā),通過不可分辨關系和不可分辨類確定問題的近似域,找出問題中的內在規(guī)律。粗糙集理論已在許多領域中得到很好的應用,但在巖土工程領域的應用尚缺乏研究[10]。人工神經網(wǎng)絡(Artificial neural network)具有模擬人類形象思維的能力,在建立非線性、經驗型知識仿真模型方面具有強大的功能和無比的優(yōu)越性。Back-propagation neural network(簡稱 BP神經網(wǎng)絡)是前向網(wǎng)絡的核心部分,體現(xiàn)了人工神經網(wǎng)絡的精華。然而,傳統(tǒng) BP算法收斂速度慢,容錯性差,結果不唯一。雖然提出了很多改進算法,如附加動量法、自適應學習速率法、彈性BP法、共軛梯度法、Levenberg-Marquardt等,但是,均未完全解決上述問題。Yasdi[11]較早地采用粗糙集和神經網(wǎng)絡的組合學習方法來研究不確定性、不精確的信息,雖然二者的結合能較好地提高整體分類效率和精簡規(guī)則的依賴因子,但是仍存在很多問題,以至于并不能應用到實踐中。在此,本文作者在前人研究的基礎上[11?15],利用粗糙集理論和神經網(wǎng)絡各自的優(yōu)勢,提出了粗糙?BP神經網(wǎng)絡方法,并成功應用于地下工程圍巖穩(wěn)定性判別中。
粗糙集理論的知識表達系統(tǒng)(也稱信息決策系統(tǒng))定義為:S=(U, A, V, F)。其中:U為一個非空有限對象(元組)集合,稱為論域;A為對象的屬性集合,分為2個不相交的子集,即條件屬性 C和決策屬性 D,Va為屬性a的值域;F是一個函數(shù),即U×A→V為一個映射函數(shù),它為每個對象的屬性賦予一個屬性值,對于每個屬性子集R?A,不可分辨關系為[16]:
顯然,Ind(R)是一個等價關系,在不產生混淆的情況下可以用R代替Ind(R)。關系等價族R中所有不可約去的關系稱為核,由它構成的集合稱為R的核集,記成core(R)。
根據(jù)山東兗州礦區(qū)煤巷信息數(shù)據(jù)庫[17],整理了137條回采巷道的圍巖穩(wěn)定性數(shù)據(jù)集,組成知識表達系統(tǒng)的論域U。決策系統(tǒng)的條件屬性={特殊地點,煤層埋深,煤層傾角,煤層厚度,采煤方法,護巷煤柱,煤體強度,巷道層位,基本頂類別,直接頂類別};決策屬性={巷道穩(wěn)定性}。
為了表達簡明扼要,進行如下假設。
特殊地點為c1,其屬性值為:
煤體強度為c7(單位MPa),其屬性值為:
按上面的評定標準對論域U進行離散化處理后,生成的決策表如表1所示。
知識表達系統(tǒng)中的屬性并不同等重要,有些甚至是冗余的,因此,必須對屬性進行約簡,尋求不含多余屬性并保證分類正確的最小屬性集。需要注意的是:C的最小屬性集一般不唯一,而要找到所有的最小屬性集是一個NP問題,在大多數(shù)應用中,沒有必要找到所有的最小屬性集。通過屬性約簡刪除多余屬性后,獲取的規(guī)則重復項較多,規(guī)則的概括能力差,因此,必須對論域進行規(guī)則簡化,挖掘出數(shù)據(jù)中隱含的決策知識,作為依據(jù),進而精選樣本集,克服 BP神經網(wǎng)絡訓練結果不唯一的缺點。具體過程如下。
(1)首先進行依賴度分析。將決策表調入粗糙集數(shù)據(jù)分析程序[16],調用函數(shù)“Pos(C, D, X)”,計算C與D 之間的依賴程度γ(C , D )輸出比率為 1 ,說明決策屬性完全依賴于條件屬性C(C→D),也就是說,條件屬性C能準確地區(qū)分決策屬性等價集。
(3)規(guī)則化簡。由于條件屬性2,4和5屬于冗余屬性,所以將其刪除。基于約簡的最小屬性集建立新的決策表:1—特殊地點;2—煤層傾角;3—護巷煤柱;4—煤體強度;5—巷道層位;6—基本頂類別;7—直接頂類別,決策屬性={巷道穩(wěn)定性}不變。此時,決策表中會產生重復的對象,取R=C使用函數(shù)“Ind(R)”找出重復項,然后從決策表中將其刪除,最后剩余94條規(guī)則。采用識別矩陣法,調用函數(shù)“Val_red(R,D)”對決策表的規(guī)則進行化簡,消除冗余項,如圖2所示,最終獲得63條判別規(guī)則如表2所示。表2中:“Inf”代表與屬性值無關。對獲取的規(guī)則進行分析,可以揭示數(shù)據(jù)中潛在的規(guī)律,如表2中的第1條規(guī)則“0 0 Inf 1 1 0 Inf 1”,說明當巷道非在特殊地點,煤層傾角很小(小于 5°),與留設的保護煤柱寬度無關;煤體強度大于20 MPa,巷道沿煤層頂板掘進,基本頂來壓不明顯,與直接頂類別無關,巷道處于穩(wěn)定狀態(tài)。這是符合工程實際的。提取的規(guī)則基本反映了兗州礦區(qū)圍巖穩(wěn)定性的判別規(guī)則,與工程實際情況較吻合。
表1 決策表Table1 Decision table
圖1 屬性的約簡求核Fig.1 Attribute reduction for core
表2 決策規(guī)則Table2 Decision rules
圖2 規(guī)則化簡Fig.2 Rule reduction
訓練樣本使用規(guī)則化簡后剩余94條樣本,各屬性重要度的計算可以通過調用函數(shù)“SGF(A,R,D,X)”得到,從而可以對圍巖穩(wěn)定性影響因素的程度進行比較,當對其進行歸一化處理時,可以反映出各屬性權重。由于數(shù)據(jù)隱含63條知識,所以,BP神經網(wǎng)絡隱含層神經元的節(jié)點數(shù),設計采用2層隱含層神經元個數(shù)為8×8的結構,這樣可以完全包含這63條知識,傳遞函數(shù)采用S型的對數(shù)函數(shù)logsig(N)。輸入層節(jié)點數(shù)為7,輸出層節(jié)點數(shù)為 1,輸出層的傳遞函數(shù)采用purelin(N)函數(shù),網(wǎng)絡拓撲結構如圖3所示。使用MATLAB神經網(wǎng)絡工具箱(NNtool)對設計好的神經網(wǎng)絡進行訓練。訓練得到的均方誤差曲線如圖4所示??梢姡河柧毥Y果十分理想;經過23步訓練,其均方誤差達到8.322 27×10?31,網(wǎng)絡很平滑地收斂于全局極小值。
從前述的兗礦煤巷信息數(shù)據(jù)庫中另選 10組樣本對網(wǎng)絡進行測試,測試結果如表3所示。從表3可以看出:真實情況與辨識結果的絕對誤差相當小,神經網(wǎng)絡的辨識結果與工程勘察的結果較吻合,從而證明該網(wǎng)絡的預測精度較高,能很好地滿足工程應用的需要。
圖3 BP神經網(wǎng)絡的結構Fig.3 Structure of BP neural network
表3 測試樣本Table3 Test samples
圖4 訓練過程的均方誤差曲線Fig.4 Curve of mean squared error in process of training
(1)提出的粗糙-BP神經網(wǎng)絡圍巖穩(wěn)定性判別方法,充分發(fā)揮了粗糙集理論與 BP神經網(wǎng)絡的優(yōu)點,彌補了各自的缺點。
(2)采用粗糙集分析程序挖掘的決策規(guī)則與兗州礦區(qū)圍巖穩(wěn)定性判別規(guī)則較吻合;由于規(guī)則簡明清晰,建立的圍巖穩(wěn)定性分類 BP神經網(wǎng)絡模型不但能夠使網(wǎng)絡全局逼近于最小值,避免陷入局部極小點,而且為隱含層神經元節(jié)點數(shù)的確定提供了依據(jù)。
(3)由于粗糙集理論具有很強的容錯能力,使得神經網(wǎng)絡的容錯能力也得到加強。因此,將粗糙集理論與神經網(wǎng)絡相結合應用于圍巖穩(wěn)定性判別,不但是有效可行的,而且具有廣闊的應用前景。
[1]Fayyad U, Stolorz P.Data mining and KDD: promise and challenges[J].Future Generation Computer Systems, 1997,13(2/3): 99?115.
[2]YANG Ying-jie, ZHANG Qing.The application of neural networks to rock engineering systems(RES)[J].International Journal of Rock Mechanics and Mining Science, 1998, 35(6):727?745.
[3]Leu S S, Chen C N, Chang S L.Data mining for tunnel support stability: neural network approach[J].Automation in Construction, 2001, 10(4): 429?441.
[4]ZHU Wei-shen, LI Shu-cai, LI Shu-chen, et al.Systematic numerical simulation of rock tunnel stability considering different rock conditions and construction effects[J].Tunnelling and Underground Space Technology, 2003, 18(5): 531?536.
[5]Durand F, Vargas E A, Vaz L E.Applications of numerical limit analysis (NLA)to stability problems of rock and soil masses[J].International Journal of Rock Mechanics and Mining Sciences,2006, 43 (3): 408?425.
[6]宮鳳強, 李夕兵, 高科.地下工程圍巖穩(wěn)定性分類的突變級數(shù)法研究[J].中南大學學報: 自然科學版, 2008, 39(5):1081?1086.GONG Feng-qiang, LI Xi-bing, GAO Ke.Catastrophe progression method for stability classification of underground engineering surrounding rock[J].Journal of Central South University: Science and Technology, 2008, 39(5): 1081?1086.
[7]馮夏庭, 馬平波.基于數(shù)據(jù)挖掘的地下硐室圍巖穩(wěn)定性判別[J].巖石力學與工程學報, 2001, 20(3): 206?209.FENG Xia-ting, MA Ping-bo.Identifying stability of underground openings based on data mining[J].Chinese Journal of Rock Mechanics and Engineering, 2001, 20(3), 206?209.
[8]Pawlak A.Rough sets[J].International Journal of Information and Computer Science, 1982, 11(1): 341?356.
[9]譚旭, 陳英武, 王楨珍.廣義相似關系下的不完備信息系統(tǒng)粗糙集模型[J].中南大學學報: 自然科學版, 2009, 40(5):1360?1366.TAN Xu, CHEN Ying-wu, WANG Zhen-zhen.Rough set model based on general similarity relation in incomplete information systems[J].Journal of Central South University: Science and Technology, 2009, 40(5): 1360?1366.
[10]代春艷.粗糙集理論及其應用發(fā)展綜述[J].重慶工商大學學報, 2004, 21(6), 575?579.DAI Chun-ye.A survey on rough set theory and its application[J].Journal of Chongqing Technol Business University: Natural Science Edition, 2004, 21(6): 575?579.
[11]Yasdi R.Combining rough sets learning-and neural learning-method to deal with uncertain and imprecise information[J].Neurocomputing, 1995, 7(1): 61?70.
[12]XIAO Zhi, YE Shi-jie, ZHONG Bo, et al.BP neural network with rough set for short term load forecasting[J].Expert Systems with Application, 2009, 36(1): 273?279.
[13]Swiniarski R W, Hargis L.Rough sets as a front end of neural-networks texture classifiers[J].Neurocomputing, 2001,31(1/4): 85?102.
[14]LI Ren-pu, WANG Zheng-ou.Mining classification rules using rough sets and neural networks[J].European Journal of Operational Research, 2004, 157(2): 439?448.
[15]Mak B, Munakata T.Rule extraction from expert heuristics: A comparative study of rough sets with neural networks and ID3[J].European Journal of Operational Research, 2002, 136(1):212?229.
[16]薛定宇, 陳陽泉.高等應用數(shù)學問題的 MATLAB求解[M].北京: 清華大學出版社, 2004: 377?380.XUE Ding-yu, CHEN Yang-quan.The Solution of High Application in Mathematic Problem[M].Beijing: Press of Tsinghua University, 2004: 377?380.
[17]王磊.基于人工神經網(wǎng)絡的煤巷圍巖穩(wěn)定性分類系統(tǒng)[D].青島: 山東科技大學資源與環(huán)境工程學院, 2005: 10?50.WANG Lei.The stability classification system for the surrounding rocks in mining roadway based on ANN method[D].Qingdao: Shandong University of Science and Technology.College of Resources and Environmental Engineering, 2005:10?50.