熊睿
(江西銅業(yè)集團(tuán)東同礦業(yè)有限責(zé)任公司, 江西 撫州市 331800)
礦石一般埋于地表以下,開采礦石會(huì)引起地表沉降,給安全生產(chǎn)帶來(lái)隱患。充填采礦法具有較低的貧化率和較高的回采率,能夠充分利用現(xiàn)有資源,并且能夠在一定范圍內(nèi)控制地表的沉陷及控制地壓等[1],所以充填采礦法在工程中的使用較為普遍[2]。為了科學(xué)合理地評(píng)價(jià)充填效果,有必要對(duì)地表下沉系數(shù)進(jìn)行快速準(zhǔn)確的預(yù)測(cè),為下一步的合理施工提供科學(xué)依據(jù),特別是地表存在重要的基礎(chǔ)設(shè)施或文物保護(hù)時(shí),地表下沉系數(shù)的預(yù)測(cè)尤為重要。影響地表下沉的原因很多,各個(gè)因素與下沉系數(shù)之間的關(guān)系不是簡(jiǎn)單的線性關(guān)系[3]。目前較為常見的地表下沉系數(shù)計(jì)算方法包括神經(jīng)網(wǎng)絡(luò)、概率積分、數(shù)值模擬等[3-10]。而其中使用較普遍的是神經(jīng)網(wǎng)絡(luò)模型,雖然預(yù)測(cè)精度較高,但是需要大量的測(cè)試數(shù)據(jù)才能保證預(yù)測(cè)的準(zhǔn)確率,而且容易陷入局部極小點(diǎn)。而與神經(jīng)網(wǎng)絡(luò)類似的SVM,其訓(xùn)練模式采用優(yōu)化技術(shù)及數(shù)學(xué)方式,因而在處理小樣本、非線性數(shù)據(jù)領(lǐng)域具有較強(qiáng)優(yōu)勢(shì)[11-14],可以避免前者的結(jié)構(gòu)選擇和局部極小點(diǎn)的問題。因此,本文通過3種尋優(yōu)算法,包括網(wǎng)格參數(shù)、GA、PSO來(lái)優(yōu)化參數(shù),建立更合適的SVM模型,并類比分析采用以上方法所得到的不同參數(shù)值,評(píng)估其預(yù)測(cè)結(jié)果的準(zhǔn)確性,確定最適合地表下沉系數(shù)預(yù)測(cè)的SVM回歸模型。同時(shí),本文考慮了交叉概率對(duì)支持向量機(jī)模型預(yù)測(cè)性能影響[15],采用改進(jìn)的 GA-SVM 模型對(duì)地表下沉系數(shù)進(jìn)行預(yù)測(cè),并與PSO-SVM、傳統(tǒng)GA-SVM、網(wǎng)格尋優(yōu)算法結(jié)果進(jìn)行比較,以期選擇更為合適的SVM尋優(yōu)算法。
SVM是構(gòu)建在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小的框架上,基于有限的樣本信息,既要提高訓(xùn)練樣本的學(xué)習(xí)精度,又要在無(wú)錯(cuò)誤地識(shí)別任意樣本的本領(lǐng)之間保持平衡,以期獲得最好的推廣能力。
核函數(shù)當(dāng)中的系數(shù)c及參數(shù)g對(duì)SVM模型機(jī)能改變較大,因而有必要通過特定算法來(lái)選取最優(yōu)數(shù)值。當(dāng)前常用的優(yōu)化法包括網(wǎng)格參數(shù)、GA、PSO。其流程如圖1~圖3所示[15]。
圖1 網(wǎng)格參數(shù)尋優(yōu)算法流程
圖2 GA算法流程
圖3 PSO算法流程
樣本數(shù)據(jù)來(lái)至文獻(xiàn)[3]的表1數(shù)據(jù)。與文獻(xiàn)[3]一致,第1~34組的數(shù)據(jù)作為訓(xùn)練數(shù)集,第35~40組的數(shù)據(jù)作為檢驗(yàn)數(shù)集。通過上訴3種尋優(yōu)方式對(duì)SVM模型參數(shù)c和g進(jìn)行優(yōu)化求解,得到3種不同的c和g值,見圖4~圖6。由圖4~圖6可知,GA算法、PSO算法、網(wǎng)格參數(shù)尋優(yōu)算法計(jì)算得到的c和g分別為67.4424,12.8566;79.2548,0.7809;8,0.1250,3種算法得到的c、g值差別較大。GA算法的均方誤差δMSE值最小,PSO算法次之;PSO算法與網(wǎng)格參數(shù)尋優(yōu)算法的結(jié)果相差不大。
圖4 網(wǎng)格參數(shù)尋優(yōu)算法結(jié)果
圖5 GA 參數(shù)尋優(yōu)算法結(jié)果
圖6 PSO參數(shù)尋優(yōu)算法結(jié)果
分別采用以上3種算法優(yōu)化的c和g值構(gòu)建各自的SVM模型,使用3種模型分別對(duì)樣本空間的訓(xùn)練樣本和測(cè)試樣本進(jìn)行回歸預(yù)測(cè)。圖7~圖9為不同尋優(yōu)算法的回歸預(yù)測(cè)結(jié)果。
圖7 網(wǎng)格參數(shù)尋優(yōu)算法驗(yàn)證結(jié)果
圖8 GA尋優(yōu)算法驗(yàn)證結(jié)果
圖9 PSO尋優(yōu)算法驗(yàn)證結(jié)果
從圖7~圖9可看出,GA算法、PSO算法、網(wǎng)格參數(shù)尋優(yōu)算法獲得的SVM模型在訓(xùn)練集上的回歸系數(shù)分別為 0.95472,0.93528,0.91515,說明GA算法的回歸效果最好。網(wǎng)格參數(shù)尋優(yōu)算法、PSO算法的測(cè)試集回歸系數(shù)分別為0.94253,0.91604,反映了網(wǎng)格參數(shù)尋優(yōu)的推廣性較強(qiáng)。而GA算法的測(cè)試樣本回歸系數(shù)最差,說明其泛化能力較差。文獻(xiàn)[15]認(rèn)為 SVM 模型的性能會(huì)受到交叉概率的影響,為了提高GA算法預(yù)測(cè)性能,采用基于交叉概率尋優(yōu)的GA算法對(duì)SVM模型的c、g進(jìn)行尋優(yōu),結(jié)果見圖10。同樣,采用改進(jìn)后的GA模型對(duì)訓(xùn)練樣本及預(yù)測(cè)樣本進(jìn)行回歸預(yù)測(cè)(見圖11)。由圖11可知,基于交叉概率的GA算法可以改善模型的預(yù)測(cè)準(zhǔn)確度,回歸系數(shù)為0.95271。其測(cè)試集回歸系數(shù)較未考慮交叉概率大,說明考慮交叉概率的GA算法具有很強(qiáng)的泛化能力,最優(yōu)參數(shù)c為63.6334,g為0.030232,交叉概率p為0.1511。
圖10 改進(jìn)的GA參數(shù)尋優(yōu)算法結(jié)果
圖11 改進(jìn)的GA尋優(yōu)算法結(jié)果
本文通過對(duì)我國(guó)典型地表移動(dòng)觀測(cè)站實(shí)際案例建立SVM機(jī)模型,采用了不同的算法對(duì)模型相關(guān)參數(shù)進(jìn)行尋優(yōu),并基于最優(yōu)參數(shù)對(duì)地表下沉系數(shù)進(jìn)行預(yù)測(cè),得出改進(jìn)的GA算法考慮了交叉概率對(duì)預(yù)測(cè)性能的影響,更適合地表下沉系數(shù)預(yù)測(cè)分析。該算法的預(yù)測(cè)回歸系數(shù)最高,可以達(dá)到0.95271,網(wǎng)格參數(shù)尋優(yōu)及 PSO算法的預(yù)測(cè)回歸系數(shù)分別達(dá)到0.94253和0.91604;SVM模型在預(yù)測(cè)地表下沉系數(shù)的應(yīng)用中具有可行性,特別是在地表沉降案例較少的情況下,即不需要大量的地表沉降數(shù)據(jù)進(jìn)行模型的訓(xùn)練。影響地表下沉系數(shù)的因素較為復(fù)雜,本文為計(jì)算方便進(jìn)行了簡(jiǎn)化,建立的支持向量機(jī)模型尚不完善,但為地表下沉系數(shù)的快速預(yù)測(cè)分析提供了新的方法。