• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于改進(jìn)極限學(xué)習(xí)機(jī)的泥石流發(fā)生預(yù)測(cè)

      2020-09-15 02:14:38鼎,曾
      關(guān)鍵詞:學(xué)習(xí)機(jī)鄰域泥石流

      曾 鼎,曾 勇

      (1.蘭州理工大學(xué)土木工程學(xué)院,甘肅 蘭州 730050; 2.西南交通大學(xué)土木工程學(xué)院,四川 成都 610031)

      0 引 言

      泥石流是一種山區(qū)常見(jiàn)地質(zhì)災(zāi)害,具有突發(fā)性、流量大、破壞力強(qiáng)等特點(diǎn),常常會(huì)沖毀公路、鐵路以及村鎮(zhèn),給人們帶來(lái)巨大的生命財(cái)產(chǎn)損失,對(duì)其進(jìn)行提前預(yù)測(cè)具有極其重要的意義。然而,泥石流形成原因復(fù)雜,影響因素眾多,而且目前對(duì)其形成機(jī)理認(rèn)識(shí)仍然不足,要建立一個(gè)確定性的預(yù)測(cè)模型非常困難[1]。

      近年來(lái),許多國(guó)內(nèi)外學(xué)者采用不同的統(tǒng)計(jì)分析方法建立泥石流預(yù)測(cè)預(yù)報(bào)模型。BRF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、Fisher判別法、Bayes判別分析法等方法[2-4]被引入到泥石流的預(yù)測(cè)預(yù)報(bào)中,并取得了較好的效果。但這些方法都存在各自的局限性,比如,BP神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu);BRF神經(jīng)網(wǎng)絡(luò)中,如果不能獲取最優(yōu)樣本,就無(wú)法逼近最優(yōu)解[5]。將極限學(xué)習(xí)機(jī)(ELM)算法應(yīng)用到泥石流預(yù)測(cè)中,該算法通過(guò)對(duì)隱含層神經(jīng)元數(shù)量的設(shè)置,訓(xùn)練輸入層矩陣得到輸出權(quán)重并對(duì)預(yù)測(cè)集輸出層進(jìn)行分類,其特點(diǎn)在于可以隨機(jī)設(shè)定輸入層和隱含層之間的權(quán)值和隱含層的閾值,并且確定之后不需對(duì)其進(jìn)行調(diào)整,隱含層和輸出層之間的權(quán)值不需要通過(guò)迭代調(diào)整,而是直接由Moore-Penrose廣義逆矩陣的解得來(lái),相比于其他算法,大大地減小了運(yùn)行時(shí)間和操作過(guò)程。由于隱含層權(quán)值的選擇具有隨機(jī)性,這樣雖然增強(qiáng)了算法的泛化能力,但是對(duì)分類的穩(wěn)定性造成了不利影響。因此,本文利用DBSCAN密度聚類算法[7]對(duì)ELM算法進(jìn)行改進(jìn)和優(yōu)化,并將其應(yīng)用到泥石流災(zāi)害的預(yù)測(cè)預(yù)報(bào)中。

      1 DBSCAN聚類算法

      DBSCAN是一種基于密度空間聚類的經(jīng)典算法,它通過(guò)檢查數(shù)據(jù)集中每個(gè)點(diǎn)的鄰域Eps來(lái)搜索簇,當(dāng)在點(diǎn)p的Eps鄰域中點(diǎn)的個(gè)數(shù)比最少點(diǎn)數(shù)量MinPts要大時(shí),創(chuàng)建一個(gè)核心對(duì)象為p的簇。在聚類過(guò)程當(dāng)中,它不需要提前給出聚類所形成簇的數(shù)量,并且可以發(fā)現(xiàn)任意形狀的聚類以及辨別出對(duì)數(shù)據(jù)具有干擾的點(diǎn)。

      在DBSCAN算法中,將數(shù)據(jù)點(diǎn)分為核心點(diǎn)、邊界點(diǎn)和噪聲點(diǎn)。當(dāng)某點(diǎn)的鄰域Eps內(nèi)含有點(diǎn)的個(gè)數(shù)不小于最少點(diǎn)數(shù)量MinPts時(shí),將該點(diǎn)定義為核心點(diǎn);某點(diǎn)的鄰域Eps內(nèi)含有點(diǎn)的個(gè)數(shù)小于最少點(diǎn)數(shù)量MinPts,但是落在核心點(diǎn)的鄰域內(nèi)時(shí),將該點(diǎn)定義為邊界點(diǎn);既不屬于核心點(diǎn)又不屬于邊界點(diǎn)則稱為噪音點(diǎn)。點(diǎn)之間的關(guān)系分為直接密度可達(dá)、密度可達(dá)和密度相連3種。當(dāng)點(diǎn)q在核心點(diǎn)p的Eps鄰域當(dāng)中時(shí),稱點(diǎn)q從核心點(diǎn)p直接密度可達(dá);對(duì)于數(shù)據(jù)樣本點(diǎn)q1,q2,…,qn,有q1=q,qn=p,當(dāng)所有點(diǎn)都有qi+1從qi直接密度可達(dá)時(shí),q從p密度可達(dá);當(dāng)點(diǎn)b同時(shí)處于點(diǎn)p的鄰域和點(diǎn)q的領(lǐng)域時(shí),點(diǎn)p和點(diǎn)q密度相連。

      DBSCAN算法的目的就是尋找密度相連點(diǎn)的最大集合[8]。DBSACN通過(guò)不斷聚集核心點(diǎn)密度可達(dá)的對(duì)象,形成一個(gè)簇,并且不斷合并所有密度可達(dá)的簇,當(dāng)沒(méi)有新的點(diǎn)加入時(shí),則聚類完成。通過(guò)分析DBSCAN算法可以發(fā)現(xiàn),DBSCAN只需確定鄰域Eps和最少點(diǎn)數(shù)量MinPts,便可獲得良好的聚類結(jié)果。

      2 極限學(xué)習(xí)機(jī)的改進(jìn)

      2.1 極限學(xué)習(xí)機(jī)理論

      極限學(xué)習(xí)機(jī)是2006年由Huang等人[9-10]在Moore-Penrose廣義逆矩陣的基礎(chǔ)上提出的一種單隱層前饋神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法。該算法在訓(xùn)練過(guò)程中,不需要設(shè)置調(diào)整輸入層與隱含層之間的初始權(quán)值和隱含層閾值,只需對(duì)隱含層之間的節(jié)點(diǎn)個(gè)數(shù)進(jìn)行確定,便可通過(guò)最小二乘法計(jì)算輸出權(quán)值完成訓(xùn)練。

      對(duì)于任意的數(shù)據(jù)集xi=[xi1,xi2,…,xin]T∈Rn,n為向量特征空間的維數(shù);ti=[ti1,ti2,…,tin]T∈Rm,ti為xi對(duì)應(yīng)的分類,m為類別數(shù)。一個(gè)含有L個(gè)單隱含層節(jié)點(diǎn),Ln,激活函數(shù)為g(x)的單隱含層前饋神經(jīng)網(wǎng)絡(luò)可表示為:

      (1)

      其中,βi=[β1,β2,…,βm]T為隱含層第i個(gè)節(jié)點(diǎn)與輸出層之間的連接權(quán)值;wi=[w1,w2,…,wn]T為輸入層與隱含層第i個(gè)節(jié)點(diǎn)之間的連接權(quán)值;bi=[b1,b2,…,bn]T為隱含層第i個(gè)節(jié)點(diǎn)的偏置,式(1)可化簡(jiǎn)為:

      Hβ=T

      (2)

      其中,H為隱含層的輸出矩陣,即:

      (3)

      當(dāng)算法中選定的函數(shù)g(x)無(wú)限可微時(shí),輸入權(quán)值w和隱含層偏置b可以隨機(jī)初始化。輸出權(quán)值β可通過(guò)求解min ‖Hβ-T‖的最小二乘解獲得,即:

      β=H*T

      (4)

      其中,H*為矩陣H的Moore-Penrose的廣義逆。

      2.2 改進(jìn)的ELM算法

      在極限學(xué)習(xí)機(jī)算法中,輸出權(quán)值由隨機(jī)產(chǎn)生的初始權(quán)值和閾值計(jì)算得到,每次的分類結(jié)果都會(huì)隨初始權(quán)值和閾值的不同而產(chǎn)生微小變化,當(dāng)輸入層的數(shù)據(jù)類別混亂時(shí),會(huì)對(duì)極限學(xué)習(xí)機(jī)的穩(wěn)定性和精度造成不利影響。為了提高預(yù)測(cè)結(jié)果的穩(wěn)定性和準(zhǔn)確率,將DBSCAN聚類算法引入到極限學(xué)習(xí)機(jī)算法模型中,利用DBSCAN聚類算法的特點(diǎn),在無(wú)需確定聚類結(jié)果個(gè)數(shù)的情況下,就能得到差異性良好的類別,從而提高預(yù)測(cè)模型的穩(wěn)定性和精度。

      改進(jìn)的ELM算法處理過(guò)程主要分為3個(gè)部分:1)對(duì)訓(xùn)練集和預(yù)測(cè)集同時(shí)進(jìn)行聚類,得到K個(gè)不同的子集;2)利用K個(gè)不同子集中的訓(xùn)練集訓(xùn)練分類器,得到K個(gè)具有差異性的分類器;3)利用不同的分類器處理對(duì)應(yīng)的預(yù)測(cè)集。具體改進(jìn)的ELM算法實(shí)現(xiàn)如下:

      1)處理樣本數(shù)據(jù)。為了方便聚類算法的處理和排除偶然性,將訓(xùn)練集和預(yù)測(cè)集數(shù)據(jù)寫成nm型矩陣,然后對(duì)數(shù)據(jù)的組序進(jìn)行隨機(jī)處理。

      2)選擇最恰當(dāng)鄰域Eps和最少點(diǎn)數(shù)量MinPts。為了保證每一類分類器都具有實(shí)際意義,所選擇的鄰域Eps和最少點(diǎn)數(shù)量MinPts要使得聚類完成后,每一個(gè)簇類密度差異在一定范圍內(nèi),即:

      P(xi+1)-P(xi)ε

      (5)

      其中,P(xi)=|Ne(x)|,εMax,Ne(x)為核心點(diǎn)的鄰域Eps所代表的范圍,Max為用戶指定的最大差異值。

      3)利用DBSCAN算法進(jìn)行聚類分析。當(dāng)聚類結(jié)果不滿足式(5)時(shí),重新進(jìn)行步驟2,直到所得聚類結(jié)果符合需求。

      4)將不同類別中的訓(xùn)練集進(jìn)行分類。確定每個(gè)分類器的神經(jīng)元個(gè)數(shù)。神經(jīng)元個(gè)數(shù)的選擇是ELM算法的核心部分,隨著神經(jīng)元個(gè)數(shù)的增加,預(yù)測(cè)精度會(huì)隨之上升,但上升至一定程度之后,增加神經(jīng)元數(shù)量反而會(huì)導(dǎo)致精度趨于不穩(wěn)定。因此,在選擇神經(jīng)元個(gè)數(shù)時(shí),需要綜合考慮算法的準(zhǔn)確性和穩(wěn)定性。

      5)利用訓(xùn)練集訓(xùn)練分類器。將分類所得到的K個(gè)訓(xùn)練集分別進(jìn)行訓(xùn)練,得到K個(gè)分類器;同時(shí),為了確保改進(jìn)的ELM方法的有效性,將所有訓(xùn)練集組成的一個(gè)集合進(jìn)行訓(xùn)練,得到一個(gè)對(duì)比分類器。

      6)將不同類別的預(yù)測(cè)集放到對(duì)應(yīng)的分類器中進(jìn)行預(yù)測(cè)分類,統(tǒng)計(jì)分類結(jié)果;將分類結(jié)果與實(shí)際結(jié)果相比較,計(jì)算預(yù)測(cè)精度。

      7)當(dāng)步驟3中預(yù)測(cè)集數(shù)據(jù)形成單獨(dú)一類情況時(shí),此時(shí)該預(yù)測(cè)集數(shù)據(jù)相當(dāng)于DBSCAN算法中的噪聲點(diǎn),為了保證預(yù)測(cè)結(jié)果的可行性和準(zhǔn)確度,將所有訓(xùn)練集置于同一分類器中進(jìn)行訓(xùn)練形成訓(xùn)練集分類器,然后將單獨(dú)一類的預(yù)測(cè)集數(shù)據(jù)放于訓(xùn)練集分類器來(lái)預(yù)測(cè)結(jié)果。

      3 改進(jìn)的ELM算法在泥石流發(fā)生預(yù)測(cè)中的應(yīng)用

      3.1 預(yù)測(cè)因子的選取

      泥石流的預(yù)測(cè)預(yù)報(bào)必須建立在泥石流形成條件研究基礎(chǔ)上,泥石流形成的條件主要有地形、地質(zhì)和降雨3大類[11]。通過(guò)相關(guān)研究成果的總結(jié),選取與泥石流3大形成條件密切相關(guān)的6個(gè)因子作為輸入指標(biāo)[12],分別為有效集水區(qū)面積、主溝長(zhǎng)度、集水區(qū)平均坡度、累計(jì)雨量、峰值雨量與崩塌率。其中,累計(jì)雨量與峰值雨量可以反映研究區(qū)域的降雨條件;有效集水區(qū)面積與主溝長(zhǎng)度和區(qū)域的地形有關(guān),可以反映出研究區(qū)域的地形地貌條件;崩塌率和平均坡度則反映出研究區(qū)域的地質(zhì)條件。

      為便于與傳統(tǒng)ELM算法和其他算法進(jìn)行對(duì)比,泥石流預(yù)測(cè)采用文獻(xiàn)[12]中的33組數(shù)據(jù),見(jiàn)表1。選取23組作為訓(xùn)練集,其余10組數(shù)據(jù)作為預(yù)測(cè)集。

      表1 泥石流相關(guān)數(shù)據(jù)

      3.2 結(jié)果及分析

      在ELM算法當(dāng)中,選取Sigmoid函數(shù)作為激活函數(shù),輸入權(quán)值w和隱含層偏置b隨機(jī)初始化。為了獲得最佳的聚類效果,選擇區(qū)分度最高的集水區(qū)平均坡度和主溝長(zhǎng)度作為聚類依據(jù),為了保證獲得正常數(shù)目的類別數(shù)并且區(qū)分出噪聲點(diǎn),設(shè)置最少點(diǎn)數(shù)量MinPts=2;分別對(duì)鄰域Eps=1、Eps=1.5、Eps=2和Eps=2.5的情況進(jìn)行聚類,結(jié)果分別如圖1~圖4所示。

      圖1 鄰域?yàn)?時(shí)的聚類

      圖2 鄰域?yàn)?.5時(shí)的聚類

      圖3 鄰域?yàn)?時(shí)的聚類

      圖4 鄰域?yàn)?.5時(shí)的聚類

      從圖1~圖4分析可得,當(dāng)Eps增大時(shí),類簇?cái)?shù)和噪聲點(diǎn)逐漸減少。Eps取1時(shí),有5個(gè)類簇,9個(gè)噪聲點(diǎn)存在;Eps取1.5時(shí),有6個(gè)類簇,3個(gè)噪聲點(diǎn)存在;Eps取2時(shí),有2個(gè)類簇,3個(gè)噪聲點(diǎn)存在;Eps取2.5時(shí),有2個(gè)類簇,2個(gè)噪聲點(diǎn)存在。隨著鄰域的增大,類簇?cái)?shù)先增大后減小至不變,當(dāng)類簇?cái)?shù)在一定鄰域范圍內(nèi)保持2類不變時(shí),說(shuō)明根據(jù)數(shù)據(jù)特征將數(shù)據(jù)分為2類,對(duì)應(yīng)為泥石流與非泥石流,此時(shí)聚類良好;從圖1~圖4中可看出,當(dāng)Eps增加,噪聲點(diǎn)慢慢減少,說(shuō)明隨著Eps的增加,數(shù)據(jù)的特征逐漸消失,但過(guò)多的噪聲點(diǎn)對(duì)訓(xùn)練器分類產(chǎn)生干擾性大,所以,選擇Eps=2的聚類結(jié)果時(shí),聚類良好且保持原有的特征。

      將上述聚類所得結(jié)果類別分別訓(xùn)練,得到2個(gè)ELM分類器。分析2個(gè)不同類別中的數(shù)據(jù),將預(yù)測(cè)集分別代入各自對(duì)應(yīng)的分類器中進(jìn)行判別分類。對(duì)于剩余的3個(gè)噪聲點(diǎn),將訓(xùn)練集中的數(shù)據(jù)進(jìn)行統(tǒng)一訓(xùn)練得到訓(xùn)練集分類器,并將噪聲點(diǎn)數(shù)據(jù)代入訓(xùn)練集分類器中進(jìn)行類別判定,3個(gè)ELM分類器所得結(jié)果與實(shí)際結(jié)果進(jìn)行比較,結(jié)果如圖5所示。

      圖5 ELM處理結(jié)果

      對(duì)相同的訓(xùn)練集和預(yù)測(cè)集采取傳統(tǒng)的ELM分類方法,與本文方法進(jìn)行對(duì)比實(shí)驗(yàn),為比較改進(jìn)的ELM算法與傳統(tǒng)ELM算法的差異,將每個(gè)分類器的隱含層神經(jīng)元個(gè)數(shù)都設(shè)置為200;為排除實(shí)驗(yàn)偶然性,對(duì)相同數(shù)據(jù)進(jìn)行50次實(shí)驗(yàn),統(tǒng)計(jì)實(shí)驗(yàn)平均精度,如圖6所示。由圖6可知,改進(jìn)的ELM算法的精度和穩(wěn)定性相比于傳統(tǒng)的ELM算法得到了大幅提升。

      圖6 改進(jìn)的ELM與傳統(tǒng)ELM實(shí)驗(yàn)精度對(duì)比

      為分析本文方法對(duì)于泥石流發(fā)生預(yù)測(cè)的普適性,對(duì)相同數(shù)據(jù)集建立BP神經(jīng)網(wǎng)絡(luò)模型并與文獻(xiàn)[12]的Fisher判別模型的精度進(jìn)行對(duì)比,所得結(jié)果如表2所示。從表2可以看出,改進(jìn)的ELM方法的預(yù)測(cè)準(zhǔn)確率達(dá)到91.6%,對(duì)泥石流的發(fā)生預(yù)測(cè)精度有了較大的提升。

      表2 不同方法的預(yù)測(cè)精度

      4 結(jié)束語(yǔ)

      本文將DBSCAN引入到極限學(xué)習(xí)機(jī)中,綜合泥石流發(fā)生影響因子提出了一種基于改進(jìn)極限學(xué)習(xí)機(jī)的泥石流發(fā)生預(yù)測(cè)方法。通過(guò)分析與驗(yàn)證,可以得出以下結(jié)論:

      1)在極限學(xué)習(xí)機(jī)訓(xùn)練過(guò)程中,利用DBSCAN算法對(duì)ELM訓(xùn)練集進(jìn)行聚類處理,將所得類簇分別訓(xùn)練得到不同的ELM分類器,提高了算法的分類準(zhǔn)確率。

      2)通過(guò)分析聚類結(jié)果,選用合理的鄰域值,提高了算法的穩(wěn)定性。

      3)與傳統(tǒng)ELM方法相比,改進(jìn)的ELM算法的穩(wěn)定性和平均精度均有大幅度提升;對(duì)比BP模型與Fisher判別法,本文方法的預(yù)測(cè)準(zhǔn)確率有明顯提高,對(duì)預(yù)測(cè)樣本的平均預(yù)測(cè)精度可達(dá)91.6%,對(duì)泥石流發(fā)生的預(yù)測(cè)具有良好的應(yīng)用前景。

      猜你喜歡
      學(xué)習(xí)機(jī)鄰域泥石流
      稀疏圖平方圖的染色數(shù)上界
      泥石流
      雜文月刊(2018年21期)2019-01-05 05:55:28
      極限學(xué)習(xí)機(jī)綜述
      基于鄰域競(jìng)賽的多目標(biāo)優(yōu)化算法
      基于極限學(xué)習(xí)機(jī)參數(shù)遷移的域適應(yīng)算法
      “民謠泥石流”花粥:唱出自己
      海峽姐妹(2017年6期)2017-06-24 09:37:36
      分層極限學(xué)習(xí)機(jī)在滾動(dòng)軸承故障診斷中的應(yīng)用
      泥石流
      關(guān)于-型鄰域空間
      機(jī)械班長(zhǎng)
      三门峡市| 宾川县| 德阳市| 碌曲县| 中宁县| 遂宁市| 尼玛县| 焉耆| 黄梅县| 梧州市| 桐城市| 都昌县| 连平县| 岫岩| 灌南县| 大余县| 贞丰县| 永登县| 富裕县| 临城县| 佛冈县| 石棉县| 金平| 哈密市| 革吉县| 东兴市| 康平县| 丹棱县| 五台县| 屏山县| 都江堰市| 宜丰县| 庄河市| 扬州市| 皮山县| 怀柔区| 天峨县| 铜川市| 万全县| 额敏县| 鄂伦春自治旗|