徐根祺 , 溫宗周 , 李麗敏 , 馬婧 , 姚怡
(1. 西安交通工程學(xué)院電氣工程學(xué)院,西安 710300;2. 西安工程大學(xué)電子信息學(xué)院 ,西安710048;3. 中國葛洲壩集團(tuán)第三工程有限公司,西安710065;4. 西安理工大學(xué),西安710048;5. 西安科技大學(xué)高新學(xué)院城市建設(shè)學(xué)院,西安710109)
我國幅員遼闊,地質(zhì)環(huán)境多變,常年受到地質(zhì)災(zāi)害侵襲[1]。泥石流災(zāi)害具有爆發(fā)頻率高、發(fā)生區(qū)域廣、不易監(jiān)測(cè)及不確定性等特點(diǎn), 嚴(yán)重威脅著人民生命財(cái)產(chǎn)安全[2-3]。 目前世界上對(duì)泥石流的研究已經(jīng)具備了較為系統(tǒng)的理論和方法, 例如泥石流的定義、判別、分類及性質(zhì)、形成機(jī)制及影響因子、發(fā)生規(guī)模及頻率、空間分布及范圍、風(fēng)險(xiǎn)性及危害性、預(yù)測(cè)及預(yù)警等[4-10]。 研究技術(shù)也越來越成熟,除了基礎(chǔ)的資料收集、野外踏勘及室內(nèi)定性評(píng)價(jià)外,還包括物理實(shí)驗(yàn)?zāi)P汀?數(shù)值模擬,GIS、RS、GPS 技術(shù)及現(xiàn)代非線性理論的應(yīng)用等[11-12]。
世界各國對(duì)泥石流的系統(tǒng)研究工作中,有學(xué)者通過貝葉斯理論分析泥石流的風(fēng)險(xiǎn)性[13],有科研人員建立了三維平臺(tái)地質(zhì)災(zāi)害評(píng)價(jià)系統(tǒng)對(duì)泥石流災(zāi)害進(jìn)行分析[14],也有研究者將支持向量機(jī)和BP 神經(jīng)網(wǎng)絡(luò)應(yīng)用于泥石流預(yù)測(cè)比較[15],還有研究人員提出了一種基于遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的區(qū)域泥石流易發(fā)性評(píng)價(jià)模型[16]。
然而對(duì)于這些研究方法而言,無論是泥石流災(zāi)害歷史數(shù)據(jù)的數(shù)量,還是對(duì)數(shù)據(jù)進(jìn)行分析評(píng)判所采用的算法,都會(huì)影響最終的準(zhǔn)確性。 為了解決目前研究中泥石流災(zāi)害數(shù)據(jù)量不足、數(shù)據(jù)獲取困難且預(yù)警準(zhǔn)確率不高的問題,本文設(shè)計(jì)了用于泥石流災(zāi)害影響因子數(shù)據(jù)采集和災(zāi)害預(yù)警的泥石流災(zāi)害預(yù)警系統(tǒng),并利用最優(yōu)路徑森林算法對(duì)所采集的數(shù)據(jù)進(jìn)行分析評(píng)判,最終預(yù)測(cè)出泥石流災(zāi)害發(fā)生的概率。
本系統(tǒng)中需要采集的信息包括:降雨量、土壤含水率、孔隙水壓力、地聲、次聲、斷線和流速,用到的相應(yīng)傳感器分別為:雨量傳感器、土壤含水率傳感器、孔隙水壓力傳感器、地聲傳感器、次聲傳感器、斷線傳感器和流速傳感器。傳感器將采集到的數(shù)據(jù)以近距離無線通信方式向現(xiàn)場(chǎng)預(yù)警單元傳輸,現(xiàn)場(chǎng)預(yù)警單元負(fù)責(zé)接收傳感器數(shù)據(jù)并對(duì)數(shù)據(jù)進(jìn)行分析,之后再經(jīng)遠(yuǎn)距離無線通信方式向遠(yuǎn)程監(jiān)控單元傳輸,最后由遠(yuǎn)程監(jiān)控單元進(jìn)行綜合評(píng)判并對(duì)災(zāi)害做出預(yù)警提示。
本系統(tǒng)由數(shù)據(jù)采集單元、現(xiàn)場(chǎng)預(yù)警單元、通信單元、報(bào)警單元、遠(yuǎn)程監(jiān)控單元和客戶端組成,系統(tǒng)總體結(jié)構(gòu)如圖1 所示。
圖1 系統(tǒng)總體結(jié)構(gòu)Fig. 1 System architecture
泥石流災(zāi)害多級(jí)預(yù)警系統(tǒng)綜合運(yùn)用無線射頻、GPRS 遠(yuǎn)距離無線傳輸和多傳感器融合等技術(shù),將可能爆發(fā)泥石流的山區(qū)的影響因子信息逐級(jí)傳送,現(xiàn)場(chǎng)預(yù)警單元和遠(yuǎn)程監(jiān)控單元分級(jí)對(duì)泥石流災(zāi)害進(jìn)行預(yù)警。
為了實(shí)現(xiàn)監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)和功能的擴(kuò)展,本文采用一體化的形式將所有傳感器無線數(shù)據(jù)采集單元的通信接口集成在一起。無線數(shù)據(jù)采集單元由包括射頻單元、電源單元、RS232 通信單元、脈沖通信單元、最小系統(tǒng)單元、RS485 通信單元和AD 通信單元在內(nèi)的多個(gè)模塊共同構(gòu)成。 除了電源單元和最小系統(tǒng)單元外, 現(xiàn)場(chǎng)預(yù)警單元的基本構(gòu)成部分還包括GPRS 單元、人機(jī)交互單元、無線射頻單元和脈沖通信單元。
根據(jù)泥石流災(zāi)害監(jiān)測(cè)預(yù)警系統(tǒng)的需求,將無線射頻單元用于無線數(shù)據(jù)采集單元和現(xiàn)場(chǎng)預(yù)警單元之間的信息傳輸;將GPRS 無線通信單元和人機(jī)交互單元用于現(xiàn)場(chǎng)預(yù)警單元; 脈沖數(shù)據(jù)采集接口和RS485 接口用于無線數(shù)據(jù)采集單元。 考慮到MSP430F149 芯片具有超低功耗、低電壓和低成本等優(yōu)點(diǎn)[17],本設(shè)計(jì)中將其用于無線數(shù)據(jù)采集單元。
現(xiàn)場(chǎng)預(yù)警單元采用STM32F103 作為微處理器?,F(xiàn)場(chǎng)預(yù)警單元和無線數(shù)據(jù)采集單元工作時(shí)所需電源均由充電控制器、 鋰電池和太陽能光伏板組成的電源單元提供。程序下載模式采用SWD 方法。為實(shí)現(xiàn)可供現(xiàn)場(chǎng)工作人員操作的影響因子狀態(tài)查詢和參數(shù)設(shè)定等功能, 現(xiàn)場(chǎng)預(yù)警單元采用TFT-LCD 顯示器作為人機(jī)交互單元。 因SIM5310 芯片具有性價(jià)比高、適用范圍廣等諸多優(yōu)點(diǎn)[5],故遠(yuǎn)程監(jiān)控單元和現(xiàn)場(chǎng)預(yù)警單元之間選擇使用該芯片進(jìn)行通信。 考慮到AS32_TTL_100通信距離長和超低功耗的特點(diǎn),現(xiàn)場(chǎng)預(yù)警單元和無線數(shù)據(jù)采集單元之間通過該芯片進(jìn)行通信。泥石流災(zāi)害監(jiān)測(cè)預(yù)警系統(tǒng)硬件框圖如圖2 所示。
圖2 泥石流災(zāi)害預(yù)警系統(tǒng)硬件示意Fig. 2 Hardware block diagram of debris flow warning system
該監(jiān)測(cè)預(yù)警系統(tǒng)由多種傳感器組成,需要進(jìn)行監(jiān)測(cè)采集的數(shù)據(jù)較多,且數(shù)據(jù)呈現(xiàn)分布不均勻、種類多樣復(fù)雜的特點(diǎn)[18-20],所以在系統(tǒng)監(jiān)測(cè)設(shè)計(jì)中,傳感器的選型顯得尤為重要。 經(jīng)分析監(jiān)測(cè)預(yù)警系統(tǒng)所需數(shù)據(jù)的精度,結(jié)合市場(chǎng)上多種傳感器信息,本部分完成傳感器的選型工作,其使用的主要傳感器及參數(shù)如表1 所列。
由于造成泥石流災(zāi)害的各影響因子信息具有種類不一、量綱各異以及數(shù)據(jù)不平衡等特點(diǎn),因此將多種不同類型的傳感器引入到泥石流災(zāi)害預(yù)警系統(tǒng)的設(shè)計(jì)當(dāng)中。 系統(tǒng)中數(shù)據(jù)收集工作由各無線傳感器采集單元完成,各傳感器都有相應(yīng)的監(jiān)控分機(jī),監(jiān)控分機(jī)能夠控制傳感器、 獲取傳感器的數(shù)據(jù)信息以及通過無線射頻單元發(fā)送數(shù)據(jù)。 系統(tǒng)中所有的傳感器構(gòu)成分布式無線傳感器自組網(wǎng),該網(wǎng)絡(luò)結(jié)構(gòu)簡單,維護(hù)和維修工作也較為便捷。 分布式無線傳感器自組網(wǎng)設(shè)計(jì)的核心是電源供電單元, 該模塊是泥石流災(zāi)害預(yù)警系統(tǒng)安全穩(wěn)定工作的可靠保障, 但是由于本系統(tǒng)的應(yīng)用場(chǎng)所多為溝壑縱橫、環(huán)境惡劣的山區(qū),設(shè)備安裝不便且供電困難,因此本設(shè)計(jì)采用太陽能結(jié)合蓄電池的方式為系統(tǒng)供電。 日間,太陽能板將太陽能轉(zhuǎn)為電能以保障系統(tǒng)運(yùn)行,同時(shí)為蓄電池充電。 夜間,在沒有太陽能的情況下,系統(tǒng)依靠蓄電池維持其正常工作。 圖3 所示為電源供電原理圖。
表1 傳感器選型及參數(shù)Table 1 Sensor selection and parameters
圖3 電源供電原理示意Fig.3 Power supply principle block diagram
本系統(tǒng)的關(guān)鍵是要保證泥石流災(zāi)害預(yù)警的準(zhǔn)確性和實(shí)時(shí)性。 因此,此處將最優(yōu)路徑森林[21](OPF)算法引入本系統(tǒng)對(duì)泥石流災(zāi)害發(fā)生概率進(jìn)行預(yù)測(cè)。
最優(yōu)路徑森林算法的實(shí)現(xiàn)包括2 個(gè)過程: 訓(xùn)練過程和分類過程,該方法類屬于有監(jiān)督分類,是一種基于最優(yōu)路徑的分類方法。 在訓(xùn)練階段,競爭過程從原型計(jì)算開始,找到屬于不同標(biāo)簽的類邊界的元素。為此,首先構(gòu)建完全圖(如圖4(a)所示),然后在原始圖上計(jì)算最小生成樹(MST),再將具有不同標(biāo)簽的連接元素標(biāo)記為原型。圖4(b)顯示了帶有界限原型的MST。之后,就可以開始原型之間的競爭過程,用以構(gòu)建最優(yōu)路徑森林,如圖4(c)所示。通過從驗(yàn)證集(圖4(d)中的藍(lán)色三角形)中取樣并將其連接到所有訓(xùn)練樣本來進(jìn)行分類。 計(jì)算到達(dá)所有訓(xùn)練節(jié)點(diǎn)的距離并用于加權(quán)弧。 最后,每個(gè)訓(xùn)練節(jié)點(diǎn)通過為測(cè)試樣本提供路徑成本函數(shù)從而計(jì)算出路徑成本(沿路徑的最大弧長),并且提供最小路徑成本的訓(xùn)練節(jié)點(diǎn)將征服所有的測(cè)試樣本,該過程如圖4(e)所示。
圖4 最優(yōu)路徑森林實(shí)現(xiàn)過程Fig. 4 Optimal path forest realization process
訓(xùn)練過程中, 將總的樣本集合Z 分為訓(xùn)練集Z1和驗(yàn)證集Z2,用Z1進(jìn)行分類器的訓(xùn)練。 假設(shè)Z1的樣本數(shù)為N, 其中每個(gè)樣本ai具有M 個(gè)屬性, 分別為ai1,ai2,…,aiM。首先構(gòu)建由 N 個(gè)樣本組成的完全圖 A,完全圖的每一個(gè)節(jié)點(diǎn)都是訓(xùn)練集Z1的一個(gè)樣本,對(duì)于完全圖中的所有節(jié)點(diǎn), 兩兩之間都由弧進(jìn)行連接,弧的權(quán)值aiM通過節(jié)點(diǎn)間的Euclid 距離來表示(也可用其它距離表示,如Canberra 距離等)。
首先根據(jù)完全圖A 生成最小生成樹MST, 接著在所生成的MST 中, 需要求解2 個(gè)不同類節(jié)點(diǎn)間的連接弧,這2 個(gè)不同類別的節(jié)點(diǎn)就是OPF 中樹的根節(jié)點(diǎn)(由于不同類別節(jié)點(diǎn)間的連接弧可能不止一個(gè),因此同類別樹的根節(jié)點(diǎn)可能也有多個(gè))。路徑為多個(gè)節(jié)點(diǎn)構(gòu)成的節(jié)點(diǎn)序列 π=<s1,s2,…,sk>,其中(si,si+1)∈A 且 1≤i≤k-1。 像π= s1( )這樣只擁有一個(gè)節(jié)點(diǎn)的路徑,將其定義為簡單路徑。 為每條路徑π 指定一個(gè)成本函數(shù)f,則存在成本 f(π)與該路徑對(duì)應(yīng)。 路徑 π 為最優(yōu)路徑的充分必要條件為:對(duì)于和該路徑擁有共同終點(diǎn)sk的其它任一路徑成立f(π)。 用 π·<s,t>表示弧<s,t>與以 s 為終點(diǎn)的路徑 π 構(gòu)成的路徑。 對(duì)于最優(yōu)路徑森林OPF 中的每一條路徑, 根據(jù)路徑成本函數(shù)fmax,即可求出其成本。再由最優(yōu)根節(jié)點(diǎn)的原理可得出各節(jié)點(diǎn)成本函數(shù)fmax和成本的表示方法:
位于路徑π 上的全體兩兩相鄰的節(jié)點(diǎn)之間的最大距離用fmax(π)表示,其中路徑π 為非平凡路徑。全部路徑中擁有相同終點(diǎn)且成本最小的路徑稱為最優(yōu)路徑。 最優(yōu)路徑森林OPF 算法的目標(biāo)即為尋求根節(jié)點(diǎn)的集合S 到訓(xùn)練集Z1的每個(gè)節(jié)點(diǎn)的最優(yōu)路徑以構(gòu)建最優(yōu)路徑森林,與此同時(shí)能夠求出每一個(gè)節(jié)點(diǎn)的最優(yōu)路徑成本C(t)、位于最優(yōu)路徑上的前驅(qū)節(jié)點(diǎn)s=Pre(t)和該節(jié)點(diǎn)類別 L(R(s))(R(s)為 s 所在的最優(yōu)路徑樹的根節(jié)點(diǎn))。
以下為求取節(jié)點(diǎn)t 的類別的步驟:首先求出節(jié)點(diǎn)s、t 之間距離 d(s,t)的最大值;接著求得位于最優(yōu)路徑上的節(jié)點(diǎn)t 的前驅(qū)節(jié)點(diǎn)s 的成本C(s);然后以上述二者的最大值作為節(jié)點(diǎn)t 的成本C(t);再接下來求解其前驅(qū)節(jié)點(diǎn)最優(yōu)路徑上的根節(jié)點(diǎn)的類別L(R(s));最后 L(R(s))的類別就是節(jié)點(diǎn) t 的類別。
分類過程中,首先在驗(yàn)證集Z2中任取一個(gè)元素t(即對(duì)于?t∈Z2),計(jì)算節(jié)點(diǎn)t 到訓(xùn)練集Z1中所有元素的距離。然后考慮連接訓(xùn)練集Z1中所有節(jié)點(diǎn)路徑的成本,找到使得節(jié)點(diǎn)t 的成本最小的路徑,則該路徑就是最優(yōu)路徑P*(t),t 的成本就是最優(yōu)路徑中節(jié)點(diǎn)t 的成本, 節(jié)點(diǎn)t 同該最優(yōu)路徑的根節(jié)點(diǎn)具有相同的類別,即 L(t)=λ(R(t) )。
其中 C(t)=min{max{C(s),d(s,t) } },?s∈Z1。
完成泥石流災(zāi)害監(jiān)測(cè)預(yù)警系統(tǒng)設(shè)計(jì)后,將本系統(tǒng)用于陜西省山陽縣境內(nèi)泥石流災(zāi)害多發(fā)區(qū),對(duì)泥石流災(zāi)害影響因子進(jìn)行收集, 部分傳感器采集的樣本數(shù)據(jù)如表2 所列。 同時(shí)結(jié)合地形地貌因素,最終選取出6 個(gè)主要影響因子對(duì)泥石流發(fā)生概率進(jìn)行預(yù)測(cè), 通過對(duì)多地區(qū)泥石流災(zāi)害相關(guān)參數(shù)變化的研究并參考相關(guān)文獻(xiàn)[8,22-24],總結(jié)出各影響因子與泥石流發(fā)生概率的關(guān)系及表征意義, 如表3所列[8]。
從所有數(shù)據(jù)中按時(shí)間序列選取2 000 組數(shù)據(jù)作為數(shù)據(jù)集,將其中1 800 組作為訓(xùn)練樣本;剩余200 組作為驗(yàn)證樣本,將數(shù)據(jù)做歸一化處理后,利用最優(yōu)路徑森林算法對(duì)預(yù)警準(zhǔn)確率和訓(xùn)練時(shí)間進(jìn)行驗(yàn)證,并將最優(yōu)路徑森林算法的預(yù)測(cè)結(jié)果分別與常用的遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)、邏輯回歸和支持向量機(jī)進(jìn)行了對(duì)比,結(jié)果如表4 所列。
表2 部分樣本數(shù)據(jù)Table 2 Part of the sample data
表3 影響因子表征意義及分級(jí)Table 3 Significance and classification of influence factors
表4 4 種模型驗(yàn)證樣本預(yù)測(cè)結(jié)果Table 4 Forecast results of four models 單位:%
從表4 結(jié)果可以看出, 實(shí)驗(yàn)結(jié)果中最優(yōu)路徑森林算法的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果相比更接近于實(shí)際值,而遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)、邏輯回歸和支持向量機(jī)的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果相差較大。
除預(yù)測(cè)結(jié)果以外, 通過準(zhǔn)確率和訓(xùn)練時(shí)間對(duì)4 種模型的性能進(jìn)行比較,結(jié)果如表5 所列。
表5 4 種模型準(zhǔn)確率和訓(xùn)練時(shí)間對(duì)比Table 5 Comparison of accuracy and training time
表5 數(shù)據(jù)表明,相較于遺傳算法優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)、邏輯回歸和支持向量機(jī),最優(yōu)路徑森林具有較高的準(zhǔn)確率和較快的訓(xùn)練時(shí)間。
此外,同時(shí)通過準(zhǔn)確率,精確度、誤報(bào)率和漏報(bào)率4 個(gè)指標(biāo), 對(duì)該系統(tǒng)的預(yù)測(cè)效果進(jìn)行定量分析,結(jié)果如表6 所列。
表6 分析結(jié)果對(duì)比Table 6 Comparison of analysis results
通過與 GA_BP 模型、Logistic 模型和 SVM 模型進(jìn)行對(duì)比,表6 結(jié)果顯示最優(yōu)路徑森林的準(zhǔn)確率和精確度較高,而誤報(bào)率和漏報(bào)率較低。 以上結(jié)果表明在泥石流發(fā)生過程中采用監(jiān)測(cè)預(yù)警系統(tǒng)對(duì)泥石流災(zāi)害影響因子進(jìn)行采集,并在系統(tǒng)中引入適當(dāng)?shù)乃惴ň涂梢詫?duì)泥石流災(zāi)害發(fā)生的概率進(jìn)行預(yù)測(cè),進(jìn)而對(duì)發(fā)生概率較大的災(zāi)害及時(shí)做出預(yù)警。
從泥石流災(zāi)害防治的目的出發(fā),通過對(duì)泥石流災(zāi)害研究方法的分析,從總體結(jié)構(gòu)、整體方案以及軟件設(shè)計(jì)3 方面設(shè)計(jì)了一套集監(jiān)測(cè)、采集、分析、評(píng)價(jià)等功能于一體的泥石流災(zāi)害監(jiān)測(cè)預(yù)警系統(tǒng)。將該系統(tǒng)應(yīng)用于實(shí)際工程案例中,結(jié)果表明本系統(tǒng)既能夠?qū)δ嗍鳛?zāi)害影響因子進(jìn)行實(shí)時(shí)監(jiān)測(cè),還能夠?qū)λO(jiān)測(cè)到的數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果自行對(duì)泥石流災(zāi)害進(jìn)行預(yù)警,將本系統(tǒng)用于泥石流災(zāi)害防治是可行的,為現(xiàn)階段的泥石流災(zāi)害研究提供了一種新的手段。