郝 婧, 劉 強(qiáng)
(中國海洋大學(xué)工程學(xué)院, 山東 青島 266100)
隨著全球氣候變暖加劇,中國沿海地區(qū)遭受臺(tái)風(fēng)風(fēng)暴潮災(zāi)害頻率不斷增加,人員和財(cái)產(chǎn)的損失逐漸加大,嚴(yán)重威脅人民健康安全和經(jīng)濟(jì)社會(huì)發(fā)展[1]。因此,對(duì)臺(tái)風(fēng)風(fēng)暴潮進(jìn)行快速、有效和準(zhǔn)確的損失評(píng)估,是保障海洋經(jīng)濟(jì)可持續(xù)發(fā)展刻不容緩的研究課題,是防災(zāi)減災(zāi)的重要環(huán)節(jié)。
災(zāi)害損失的評(píng)估方法在災(zāi)害理論上來說主要分為兩大類,一類是基于統(tǒng)計(jì)模型的評(píng)估,另一類是基于風(fēng)險(xiǎn)關(guān)聯(lián)的評(píng)估[2]?;诮y(tǒng)計(jì)模型的評(píng)估,國外有FCHLPM[3]、FPHL[4]和HAZUS[5]模型等,國內(nèi)學(xué)者趙昕等[6]運(yùn)用投入產(chǎn)出模型從經(jīng)濟(jì)學(xué)角度進(jìn)行了風(fēng)暴潮損失評(píng)估分析?;陲L(fēng)險(xiǎn)關(guān)聯(lián)的評(píng)估,主要包括危險(xiǎn)概率評(píng)估、脆弱性曲線和指標(biāo)體系評(píng)估等[2]。Manik等[7]通過GIS分析物理和人口變量,評(píng)估了沿岸風(fēng)暴潮的脆弱性;Yang等[8-9]基于擴(kuò)展卡爾曼濾波和極限理論建立了中國風(fēng)暴潮災(zāi)害風(fēng)險(xiǎn)預(yù)測(cè)模型,實(shí)現(xiàn)了對(duì)直接經(jīng)濟(jì)損失和傷亡人口的預(yù)測(cè)。目前,很多學(xué)者將機(jī)器學(xué)習(xí)方法應(yīng)用于風(fēng)暴潮損失評(píng)估。Sun等[10]、江斯琦等[11]、劉曉慶等[12]使用XGBoost算法、BP神經(jīng)網(wǎng)絡(luò)和ELman神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法有效的對(duì)風(fēng)暴潮災(zāi)害的各方面損失進(jìn)行定量預(yù)測(cè)?;趯?duì)已有的災(zāi)害研究,各模型均有其優(yōu)缺點(diǎn),為進(jìn)一步提高傳統(tǒng)模型的評(píng)估效果和普適性,本文應(yīng)用天牛須搜索(BAS)算法優(yōu)化ELman神經(jīng)網(wǎng)絡(luò)進(jìn)行臺(tái)風(fēng)風(fēng)暴潮損失測(cè)度,評(píng)估結(jié)果表明該方法進(jìn)一步提高了預(yù)測(cè)精確度。
廣東省坐落于中國東南沿海地區(qū),位于太平洋西岸,每年臺(tái)風(fēng)風(fēng)暴潮的成災(zāi)率高且經(jīng)濟(jì)損失過重,因此本文選取了廣東省1995—2018年的50組記錄完整的臺(tái)風(fēng)風(fēng)暴潮信息及損失數(shù)據(jù)。其中臺(tái)風(fēng)風(fēng)暴潮信息、災(zāi)害損失和氣候數(shù)據(jù)主要來源于自然資源部和《中國風(fēng)暴潮災(zāi)害史料集》[13],人口、設(shè)施和經(jīng)濟(jì)等數(shù)據(jù)主要來源于廣東省統(tǒng)計(jì)局。
快速準(zhǔn)確的測(cè)度災(zāi)害損失的前提是建立合理全面的災(zāi)害損失指標(biāo)體系,依托風(fēng)險(xiǎn)評(píng)估理論,結(jié)合臺(tái)風(fēng)風(fēng)暴潮的形成機(jī)制和實(shí)際數(shù)據(jù)的易取性,從氣候變化、危險(xiǎn)性、易損性和防災(zāi)減災(zāi)能力4個(gè)角度構(gòu)建損失評(píng)估指標(biāo)體系。其中,氣候變化5個(gè)指標(biāo)包括X11沿海海平面高度、X12年平均降雨量、X13年平均氣溫、X14年日照時(shí)數(shù)、X15二氧化碳濃度;危險(xiǎn)性6個(gè)指標(biāo)包括X21最大增水、X22中心最低氣壓、X23最大風(fēng)力、X24最大風(fēng)速、X25超警戒水位、X26災(zāi)害過程持續(xù)日數(shù);易損性8個(gè)指標(biāo)包括X31總?cè)丝?、X32人口密度、X33人口自然增長(zhǎng)率、X34地區(qū)生產(chǎn)總值、X35人均地區(qū)生產(chǎn)總值、X36海洋生產(chǎn)總值、X37耕地面積、X38大陸海岸線長(zhǎng)度;防災(zāi)減災(zāi)能力6個(gè)指標(biāo)包括X41森林覆蓋率、X42醫(yī)療衛(wèi)生機(jī)構(gòu)數(shù)、X43衛(wèi)生機(jī)構(gòu)人員、X44醫(yī)療機(jī)構(gòu)床位數(shù)、X45人均可支配收入、X46電話普及率。災(zāi)情選取了X01受災(zāi)人口、X02死亡(含失蹤)人數(shù)、X03直接經(jīng)濟(jì)損失、X04農(nóng)田受災(zāi)面積、X05海水養(yǎng)殖受災(zāi)面積、X06海岸工程損毀、X07倒塌房屋、X08船只損毀8個(gè)指標(biāo)進(jìn)行損失評(píng)估。
1.2.1 熵權(quán)法-灰色關(guān)聯(lián)分析 災(zāi)害損失的發(fā)生由多種因素導(dǎo)致,單一的指標(biāo)無法全面刻畫災(zāi)害信息和社會(huì)因素,但簡(jiǎn)約冗余因素可以提高預(yù)測(cè)效率和評(píng)估準(zhǔn)確性?;疑P(guān)聯(lián)分析法對(duì)于小樣本無規(guī)律評(píng)價(jià)問題具有較高的決策準(zhǔn)確性,是建立在客觀數(shù)據(jù)的基礎(chǔ)上,計(jì)算評(píng)價(jià)指標(biāo)與最優(yōu)理想方案的接近度[14]。針對(duì)于本文選取的8個(gè)災(zāi)情評(píng)估指標(biāo),原始的灰色關(guān)聯(lián)分析使用平權(quán)處理或?qū)<掖蚍钟?jì)算關(guān)聯(lián)度,不能使權(quán)重達(dá)到最好的分配。但熵權(quán)法可以充分利用客觀數(shù)據(jù)的信息來確定權(quán)重,進(jìn)行客觀賦權(quán),避免了主觀臆斷對(duì)結(jié)果的影響。
1.2.2 影響因子預(yù)處理 根據(jù)熵權(quán)法的公式步驟[14],計(jì)算出災(zāi)情評(píng)估8個(gè)因子的權(quán)重,如表1所示。將灰色關(guān)聯(lián)分析中災(zāi)情評(píng)估的8個(gè)因子賦予權(quán)重后,根據(jù)步驟[15]得出各評(píng)價(jià)指標(biāo)的關(guān)聯(lián)度進(jìn)行排序,篩選出前12個(gè)指標(biāo)為預(yù)測(cè)的輸入因子,其中:氣候變化相關(guān)因子包括年平均降雨量X12、年平均氣溫X13、年日照小時(shí)X14、二氧化碳濃度X15;危險(xiǎn)性相關(guān)因子有最大增水X21、超警戒水位X25、最大風(fēng)速X24、最大風(fēng)力X23、災(zāi)害過程持續(xù)日數(shù)X26、中心最低氣壓X22;易損性相關(guān)因子包括人口自然增長(zhǎng)率X33;防災(zāi)減災(zāi)能力相關(guān)因子包括森林覆蓋率X41(見表2)。
表1 災(zāi)情評(píng)估指標(biāo)的權(quán)重值Table 1 Weight value of disaster assessment index
表2 前12個(gè)指標(biāo)的關(guān)聯(lián)度Table 2 Correlation degree of top 12 indicators
ELman神經(jīng)網(wǎng)絡(luò)是在1990年由ELman提出的動(dòng)態(tài)遞歸神經(jīng)網(wǎng)絡(luò),在前饋網(wǎng)絡(luò)結(jié)構(gòu)的隱含層中增加了一個(gè)承接層,作為延時(shí)算子來記憶和存儲(chǔ)隱含層前一時(shí)刻的輸出值,使該網(wǎng)絡(luò)具有時(shí)變特性,相比前饋式BP神經(jīng)網(wǎng)絡(luò)具有更強(qiáng)的網(wǎng)絡(luò)穩(wěn)定性和計(jì)算能力[16],其結(jié)構(gòu)如圖1所示。
(u1為第一個(gè)輸入層的輸入向量;un為第n個(gè)輸入層的輸入向量;x為隱含層節(jié)點(diǎn)向量,xc1為第一個(gè)承接層的反饋狀態(tài)向量;xcn為第n個(gè)承接層的反饋狀態(tài)向量;y為輸出層的輸出向量;w1為承接層到隱含層的連接權(quán)值;w2為輸入層到隱含層的連接權(quán)值;w3為隱含層到輸出層的連接權(quán)值。u1 is the input vector of the first input layer; un is the input vector of the nth input layer; x is the hidden layer node vector; xc1 is the feedback state vector of the first undertaking layer; xcn is the feedback state vector of the nth undertaking layer; y is the output vector of the output layer; w1 is the connection weight from the undertaking layer to the hidden layer; w2 is the connection weight of the input layer to the hidden layer; w3 is the connection weight from the hidden layer to the output layer.)
Elman神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型表達(dá)式為:
y(n)=g(w3x(n)),
(1)
x(n)=f(w1xc(n)+w2(u(n-1))),
(2)
xc(n)=x(n-1)。
(3)
式中:y為輸出層的輸出向量;n為輸入層的樣本數(shù)量;g為輸出層神經(jīng)元的傳遞函數(shù);w1、w2和w3分別為承接層到隱含層、輸入層到隱含層和隱含層到輸出層的連接權(quán)值;x為隱含層節(jié)點(diǎn)向量;xc為承接層的反饋狀態(tài)向量;f為中間層神經(jīng)元的傳遞函數(shù),常采用Sigmoid函數(shù)。
天牛須搜索(Beetle Antennae Search,BAS)算法[17]是受天牛覓食原理啟發(fā)的新型智能算法,天牛無法分辨食物的方位,需依靠食物氣味的強(qiáng)弱來找到食物。食物的氣味相當(dāng)于函數(shù),此函數(shù)在三維空間的任意不同值點(diǎn),天牛通過兩須感知?dú)馕兜膹?qiáng)弱,目的是尋找空間內(nèi)氣味值最強(qiáng)的點(diǎn),通過這一原理來求解函數(shù)的最優(yōu)值。
BAS算法步驟如下[18]:
(1)建立天牛須朝向的隨機(jī)向量且歸一化處理:
(4)
式中:n為空間維度;rands為隨機(jī)函數(shù):
(2)建立天牛左右須空間向量:
(5)
(3)確定均方根誤差MSE為適應(yīng)度函數(shù)fitness來判斷左右須氣味強(qiáng)弱,函數(shù)表達(dá)式為:
(6)
(4)迭代更新天牛位置:
(7)
式中:δt為第t次迭代時(shí)的步長(zhǎng)因子;sign為符號(hào)函數(shù)。
傳統(tǒng)ELman神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),連接權(quán)值和閾值通常依賴于訓(xùn)練者的試錯(cuò)訓(xùn)練和先驗(yàn)經(jīng)驗(yàn),沒有一定的理論基礎(chǔ)依據(jù),往往導(dǎo)致全局搜索性差且易導(dǎo)致訓(xùn)練失敗。BAS算法作為高效的全局尋優(yōu)算法,其優(yōu)化后的權(quán)值閾值能較大程度的提高訓(xùn)練效果和網(wǎng)絡(luò)性能,避免隨機(jī)初始化導(dǎo)致網(wǎng)絡(luò)陷入局部最優(yōu)、網(wǎng)絡(luò)不穩(wěn)定等問題。
BAS-ELman模型構(gòu)建具體步驟如下[16,18]。
(1)確定ELman網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。
(2)建立天牛左右須空間向量和設(shè)置步長(zhǎng)因子。
(3)確定均方根誤差MSE為適應(yīng)度評(píng)價(jià)函數(shù)f,迭代停止時(shí)函數(shù)值最小的味值為該模型最優(yōu)解。
(4)迭代更新得出最優(yōu)解,判斷適應(yīng)度函數(shù)值是否達(dá)到精度要求,滿足則生成最優(yōu)解,否則繼續(xù)迭代更新。
(5)將BAS算法優(yōu)化后的最優(yōu)權(quán)值閾值帶入ELman神經(jīng)網(wǎng)絡(luò)進(jìn)行二次訓(xùn)練,直至誤差收斂至給定精度,訓(xùn)練結(jié)束,形成最終的臺(tái)風(fēng)風(fēng)暴潮損失測(cè)度模型。
本次實(shí)驗(yàn)按時(shí)間序列選取較近年份的10個(gè)樣本為測(cè)試集,其余40個(gè)樣本為訓(xùn)練集,神經(jīng)網(wǎng)絡(luò)部分使用MATLAB自帶的神經(jīng)網(wǎng)絡(luò)工具箱。使用熵權(quán)法-灰色關(guān)聯(lián)分析篩選的12個(gè)指標(biāo)作為輸入因子,災(zāi)情評(píng)估中的受災(zāi)人口、直接經(jīng)濟(jì)損失、海水養(yǎng)殖受災(zāi)面積、海岸工程損毀分別作為輸出因子。引入均方根誤差(Root mean square error, RMSE)進(jìn)行參數(shù)選擇,歸一化均方根誤差(Normalized root mean square error, NRMSE)、相關(guān)系數(shù)(Related coefficient, CC)和單次運(yùn)行時(shí)間作為模型評(píng)估的檢驗(yàn)指標(biāo)。NRMSE越接近于0、CC越接近于1的預(yù)測(cè)效果越好,精確度越高,計(jì)算公式如下[19]:
(8)
(9)
經(jīng)過多次反復(fù)實(shí)驗(yàn),受災(zāi)人口評(píng)估的BAS-Elman神經(jīng)網(wǎng)絡(luò)采用12-2-1的結(jié)構(gòu),步長(zhǎng)更改系數(shù)eta為0.994;直接經(jīng)濟(jì)損失評(píng)估模型采用12-5-1結(jié)構(gòu),eta為0.988;海水養(yǎng)殖受災(zāi)面積評(píng)估模型采用12-10-1結(jié)構(gòu),eta為0.99;海岸工程損毀評(píng)估模型采用12-3-1結(jié)構(gòu),eta為0.995,迭代次數(shù)和d0均為200次和0.5。
為了測(cè)試BAS-ELman(以下均稱:優(yōu)化BAS-Elman)模型相較于其他算法是否具有優(yōu)越性,本文選擇傳統(tǒng)的ELman神經(jīng)網(wǎng)絡(luò)、BAS-BP、隨機(jī)森林(Random forest,RF)和支持向量回歸(Support vector machine for regression,SVR)模型進(jìn)行比較。同時(shí),為了體現(xiàn)熵權(quán)法對(duì)灰色關(guān)聯(lián)分析客觀賦權(quán)的有效性,采用傳統(tǒng)平權(quán)處理的灰色關(guān)聯(lián)分析篩選出12個(gè)新輸入因子后的模型,作為對(duì)比BAS-ELman(以下均稱:BAS-Elman)模型。結(jié)果見表3、圖2所示。
表3 四種損失指標(biāo)測(cè)試集擬合結(jié)果Table 3 Fitting results of four loss indicators test sets
綜上可以看出,4種災(zāi)情評(píng)估指標(biāo)均呈現(xiàn)優(yōu)化BAS-ELman相比于傳統(tǒng)的ELman的擬合效果更好,NRMSE平均優(yōu)化0.241,CC平均提高0.095;優(yōu)化BAS-ELman相比于BAS-BP的誤差更低,NRMSE平均優(yōu)化0.223,CC平均提高0.156;優(yōu)化BAS-ELman的預(yù)測(cè)效果優(yōu)于隨機(jī)森林模型,NRMSE平均優(yōu)化0.704,CC平均提高0.235;優(yōu)化BAS-ELman較支持向量回歸模型的預(yù)測(cè)誤差更好,NRMSE平均優(yōu)化0.501,CC平均提高0.083,雖然支持向量回歸模型在海水養(yǎng)殖受災(zāi)面積的預(yù)測(cè)CC值較優(yōu),但NRMSE值較大,因此從總體的擬合效果來看,優(yōu)化BAS-ELman模型的預(yù)測(cè)準(zhǔn)確性更高。熵權(quán)法客觀賦權(quán)灰色關(guān)聯(lián)分析的BAS-ELman模型比傳統(tǒng)模型的預(yù)測(cè)精度要好,NRMSE平均優(yōu)化0.094,CC平均提高0.115。單次預(yù)測(cè)的支持向量回歸模型收斂速度最快,優(yōu)化BAS-ELman模型相比于其他3個(gè)模型均較緩慢,但相差不大。從圖2的多個(gè)峰值預(yù)測(cè)效果可以看出,對(duì)于中小型臺(tái)風(fēng)風(fēng)暴潮的預(yù)測(cè)效果較好,但對(duì)于出現(xiàn)重大災(zāi)害時(shí)的預(yù)測(cè)效果還需提高。從4種評(píng)估指標(biāo)和6個(gè)回歸模型的整體預(yù)測(cè)效果來看,優(yōu)化BAS-ELman回歸預(yù)測(cè)模型的預(yù)測(cè)效果最佳、精確度較高,對(duì)臺(tái)風(fēng)風(fēng)暴潮損失測(cè)度方面具有較高的適用性。
((a)受災(zāi)人口擬合結(jié)果Fitting result of affected population;(b)直接經(jīng)濟(jì)損失擬合結(jié)果Fitting result of direct economic loss;(c)海水養(yǎng)殖受災(zāi)面積擬合結(jié)果。Fitting result of affected area of mariculture;(d)海岸工程損毀擬合結(jié)果Fitting result of damage of coastal engineering.)
本文從氣候變化、危險(xiǎn)性、易損性和防災(zāi)減災(zāi)能力4個(gè)方面構(gòu)建臺(tái)風(fēng)風(fēng)暴潮損失評(píng)估指標(biāo)體系,基于8個(gè)災(zāi)情評(píng)估指標(biāo)篩選主要影響因子,通過熵權(quán)法對(duì)灰色關(guān)聯(lián)分析進(jìn)行8個(gè)災(zāi)情評(píng)估指標(biāo)的客觀賦權(quán),篩選出與災(zāi)害損失相關(guān)性較大的12個(gè)指標(biāo)作為輸入因子。經(jīng)模型預(yù)測(cè)效果對(duì)比,表明熵權(quán)法優(yōu)化灰色關(guān)聯(lián)分析后篩選的指標(biāo)有更好的評(píng)估效果。
使用BAS優(yōu)化ELman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,將優(yōu)化后的權(quán)值和閾值帶入ELman模型中,經(jīng)對(duì)照傳統(tǒng)ELman神經(jīng)網(wǎng)絡(luò)、BAS-BP、隨機(jī)森林、支持向量回歸模型的預(yù)測(cè)效果有較大提高,避免了ELman算法出現(xiàn)的隨機(jī)初始化導(dǎo)致網(wǎng)絡(luò)陷入局部最優(yōu)的問題,預(yù)測(cè)模型具有較好的適用性。
本次實(shí)驗(yàn)較好的對(duì)受災(zāi)人口、直接經(jīng)濟(jì)損失、海水養(yǎng)殖受災(zāi)面積和海岸工程損毀4種臺(tái)風(fēng)風(fēng)暴潮損失進(jìn)行了測(cè)度,為今后研究提供了新的方法。但在樣本數(shù)據(jù)搜集時(shí),完整數(shù)據(jù)較少,重大災(zāi)情的評(píng)估樣本不足,對(duì)模型整體影響較大。需提高輸入指標(biāo)的全面性,尤其氣候類數(shù)據(jù)搜集應(yīng)加強(qiáng)GIS和遙感工具的使用,進(jìn)一步提高災(zāi)害損失測(cè)度的準(zhǔn)確性,為防災(zāi)減災(zāi)工作提供依據(jù)。