盧夢瑤,劉德虎,魯雪麗,梁 衡,孫媛媛,劉亞林,宋廷強,范海生
(1青島科技大學信息科學技術學院,山東青島 266000;2珠海市嶺南大數據研究院,廣東珠海 519000)
洪澇災害無疑是目前世界上發(fā)生次數最為頻繁且破壞性最為嚴重的自然災害之一。湖北省由于特殊的自然地理條件,平均每年都會發(fā)生或大或小的洪澇災害[1],不但直接引起人員傷亡、財產損失、農作物被毀,還造成一系列其他災害,如滑坡、泥石流、疫病的出現。洪水中攜帶各種污水和垃圾,嚴重威脅生態(tài)環(huán)境和社會發(fā)展[2]。根據EM-DAT災難數據庫統(tǒng)計,2010—2021年在中國發(fā)生的洪澇災害事件中,涉及到湖北省的有36次,湖北省發(fā)展深受其害[3]。因此,對湖北省展開洪澇災害風險分析、指導農業(yè)生產和社會發(fā)展迫在眉睫。
洪澇災害的發(fā)生受自然因素及社會因素等共同影響,成因復雜。對洪澇災害進行準確模擬預報是有一定困難的,為了避免洪災對社會及農業(yè)造成的傷害,開展有效的災前風險管理,得到風險區(qū)劃圖對于指導防災減災工作具有現實意義[4]。因此,許多學者都針對洪澇災害風險性展開研究。在指標選擇上,趙曉宇等[5]選用降雨、水位、水量進行評估;SAHA等[6]利用土地數據,確定研究區(qū)洪澇災害的風險性;楊建瑩等[7]選擇氣象、災情史料和農作物生育期資料對特定作物在洪澇中的風險進行評估;HAZEM[8]則選取了氣象、水文數據進行風險評估;莫建飛[9]基于遙感、氣象、地理和社會數據構建風險評估指標體系。在評價方法上,經歷了從歷史災情法到指標體系法的過程。李柏年[10]基于歷史災情統(tǒng)計數據,通過回歸的方法分析洪澇風險;VAHID等[11]、李莉[12]都采用層次分析法,對收集的災情指標進行加權,繪制了伊朗南部班達爾阿巴斯市的洪水風險圖;Qiang[13]提出了一種基于混合差分進化算法的自適應模糊聚類迭代模型,通過簡單的自適應調整可以反映各種決策者的偏好,并快速獲得合理的評估結果;YANG等[14]將多標準決策技術、基于理想解的相似性排序技術與香農熵方法相結合進行評估。
綜上所述,當前研究在指標體系的構建方面已取得大量研究成果,但仍存在一些不足之處,例如:表示防減災能力的指標(如地區(qū)醫(yī)療水平數據、防洪設施數據)獲取難度大、時效性差,很難較好的體現地區(qū)災情應急能力的現狀;再者,在評價指標體系的建立中存在一定的主觀因素(如層次分析法及多準則決策等方法中的指標確權)[15]。針對以上問題,本研究對部分醫(yī)療衛(wèi)生數據的獲取采用網絡爬蟲技術,以保障數據的時效性,建立準確可靠的指標數據庫;最后,通過機器學習算法降低人為因素的影響,有效構建洪澇災害評估模型。
湖北省(如圖1所示)介于29°01′53″—33°6′47″N、108°21′42″—116°07′50″E,位于中國中部長江上中游流域,內有漢江流域;地勢呈東、西、北三面環(huán)山之態(tài);地處亞熱帶,全省除高山地區(qū)屬高山氣候外,大部分地區(qū)屬亞熱帶季風性濕潤氣候,夏季高溫多雨;汛期時間長易引發(fā)洪澇,給湖北省發(fā)展形成重大隱患。據《湖北省氣象災害年鑒》統(tǒng)計,自2012—2018年,7年間湖北省因洪澇災害導致5547.8萬人受災,農作物受災面積達到496.47萬hm2,造成直接經濟損失1137.04億元。繪制湖北省洪澇災害風險區(qū)劃圖,對指導城市發(fā)展、政府減災政策都具有重要意義[16]。
圖1 湖北省行政區(qū)劃圖
本文所使用的數據資料主要包括湖北省逐月降雨數據(2000—2020年)和逐日降雨數據(2016—2020年),來源于中國氣象數據網(http://data.cma.cn/);湖北省行政邊界數據,根據統(tǒng)計年鑒內容進行部分合并修訂,本文共劃分為88個區(qū)縣;水系數據,來源于地理國情監(jiān)測云平臺(http://www.dsac.cn/);DEM高程數據,來源于地理空間數據云中心(http://www.gscloud.cn/);湖北省地區(qū)生產總值、人口數、耕地面積,來源于湖北省統(tǒng)計年鑒[17];湖北省緊急避難場所、診所和綜合醫(yī)院分布數據,來源于高德地圖api接口爬取。
將收集的數據進行整理,得到15個洪澇災害風險評估指標因子。由于數據類型不同、格式差異大,在指標計算之前需對所有的數據進行預處理操作。
洪澇災害發(fā)生過程即為特定孕災環(huán)境中致災因子要素作用在承災體上而形成災害。洪澇災害與影響因子之間是復雜的、多變量的非線性關系,與研究區(qū)的地質、地貌、土地覆蓋等諸多因素密切相關。針對特定的研究區(qū)域,搜集盡可能全面的影響因子并對其進行優(yōu)化選取是實現洪澇準確評估的前提和保證[18]。
本研究在構建湖北省洪澇災害風險評估模型選取指標時,綜合考慮所選指標是否能夠反映湖北省洪澇風險的實際情況以及各指標因子的客觀性、相對獨立性和可獲取性。
圖2 技術路線圖
(1)致災因子是引起災害的動力因子,對于洪澇災害最主要的因素為降雨。通常致災因子強度越大、頻次越高,所造成的損失也就越大,災害風險也越高。本研究利用湖北省2000—2020年主汛期(6—8月)月降雨量和2016—2020年日降雨量,得到平均降雨量、連續(xù)降雨天數指數、降雨強度指數3個指標。
(2)孕災環(huán)境敏感性是指災害發(fā)生區(qū)域下墊面的自然條件,對于災害的發(fā)生具有正向或反向的作用,是具有相對穩(wěn)定性的[19]。本研究選取湖北省地面高程(DEM)數據、河網等級、坡度數據、水系數據(水面面積、水線長度)作為孕災環(huán)境敏感性評價指標。
(3)洪澇災害直接或間接作用于承災體[20],它隨洪澇災害的發(fā)生過程而表現出來。人口和財產越集中,災害發(fā)生后造成的損失也越大,易損性越強。本研究選取人口密度、耕地面積、地區(qū)生產總值作為承載體易損性的評價指標。
(4)防災減災能力是指所選研究區(qū)域應對洪澇災害發(fā)生的能力以及降低風險的作用。如果地區(qū)經濟發(fā)達、則災害應急能力強。當災害發(fā)生后,由于及時有效的減災手段,受災害的影響越小,選取緊急避難場所、綜合醫(yī)院、診所分布數據和人均生產總值作為防災減災能力的評價指標。
2.2.1 氣象數據 本研究利用ArcGIS將降雨網格數據依次進行轉柵格數據、重投影、按掩膜提取、重采樣、柵格轉點、與湖北省縣級行政區(qū)劃要素數據進行空間連接[21],得到湖北省各縣的降雨數據。
根據國家氣象中心發(fā)布的降水量等級標準[22]和國家氣候中心發(fā)布的暴雨災害等級[23]等級標準。按表1將日降水量劃分為7個等級,按表2將連續(xù)降雨天數劃分為4個等級,并分分別賦予權重。計算得到降雨等級指數X2和降雨強度指數X3。
表1 日降雨數據等級劃分
表2 連續(xù)日降雨天數等級劃分
對于88個區(qū)縣,第m個區(qū)域,日降雨量等級指數如式(1)所示。
式中:RLi表示降雨等級為i;表示第m個區(qū)域降雨等級為RLi;days()A表示A情況的天數;X2m表示第m個區(qū)域的日降雨等級值。
對于88個區(qū)縣,第m個區(qū)域,連續(xù)降雨天數指數如式(2)所示。
式中:CRLi表示連續(xù)降雨天數等級為i;表示第m個區(qū)域連續(xù)降雨天數等級為CRLi;X3m表示第m個區(qū)域的連續(xù)降雨天數指數值。
2.2.2 災害應急數據 防減災能力能在一定程度上能降低災害發(fā)生的破壞性,醫(yī)療衛(wèi)生應急狀況對洪澇災害發(fā)生后的及時救險有著重要影響。
本研究采取網絡爬蟲改善相關指標獲取,爬蟲獲取診所、緊急避難場所和綜合醫(yī)院的分布情況,作為研究區(qū)醫(yī)療應急指數的指標[24]。
(1)獲取位置信息。應用爬蟲技術,調用高德地圖api接口,發(fā)送請求,獲取目標類型坐標信息(GCJ-02火星坐標系)。
(2)轉換地理坐標。GCJ-02對真實的坐標進行人為的加偏處理,爬取得到的GCJ-02地理分布信息數進行坐標轉換,轉換后得到WGS84坐標系下的坐標數據。
(3)轉為矢量數據。在ArcGIS中轉換為點要素,得到3個指標分布情況如圖3所示。采用空間分析工具與湖北省行政矢量數據作空間連接,獲取到各個縣區(qū)與應急醫(yī)療能力相關指標的分布密度。
圖3 爬蟲數據點矢量圖
2.2.3 其他指標計算 利用ArcGIS分析工具,對湖北省DEM高程數據做表面分析,得到坡度和坡向,并與縣區(qū)劃數據作空間連接,得到湖北省各縣平均高程、坡度和坡向數據。
利用湖北省統(tǒng)計年鑒中的人口、耕地面積、地區(qū)生產總值數據得到人口密度、人均生產總值和地均生產總值。預處理后本文得到15個指標如表3所示。
表3 模型建立所用指標一覽表
不同的指標對洪澇災害的影響不同,因此需要根據實際情況對不同的影響因子進行賦權。現有指標確權技術中,層次分析法、專家打分法、多準則決策等受研究者及專家主觀影響,基于這一問題,本研究采用PCA確定指標權重來消除模型建立中主觀因素的影響。
PCA算法是一種典型的非監(jiān)督機器學習算法,是將具有一定相關性的多個指標因素,通過變換選擇出眾多因子中更為重要的因子的一種統(tǒng)計方法[25]。PCA通過計算出各個因子的方差貢獻率而表示不同因子的重要性,以各指標的方差貢獻率作為指標的權重。
第j個特征的均值為:。第i個樣本的特征向量為:。
主成分分析確定權重的過程[26]:
(1)PCA操作之前,需要先進行去均值化。公式如式(3)所示。
(2)求協(xié)方差矩陣。樣本集的協(xié)方差矩陣如式(4)所示。
協(xié)方差矩陣為n×n大小的方陣,有n個特征向量。協(xié)方差公司如(5)所示。
按照公式(6)計算協(xié)方差矩陣C。
(3)根據式(7)求C的特征值和對應的特征向量。
構造拉格朗日函數,如式(8)所示。
求導得到公式(9)。
x投影后的方差就是協(xié)方差矩陣的特征值,協(xié)方差矩陣的最大特征值即為最大方差值,最佳投影方向即為最大特征值對應的特征向量,以此類推。
(4)確定權重。將n個特征按照特征值從大到小排序,第一個即為方差貢獻率最大的第一主成分,若第一主成分貢獻率不夠,再選擇第二主成分,第三主成分,…,第P主成分,按照方差貢獻率得到對應的權重數值[27],從而建立完整的指標體系。
在洪澇災害風險評估模型建立過程中,為消除各個指標量綱之間數據級不統(tǒng)一的問題,對所有指標采取歸一化處理操作。
各指標因子歸一化處理如公式(10)所示。
式中:Nij為j個點第i個指標的歸一化結果,Xij為j個點第i個值的指標數值。
對模型指標體系中各指標進行計算并且歸一化處理,以統(tǒng)一致量化標準。
根據氣象災害系統(tǒng)理論,氣象災害風險主要由致災因子、孕災環(huán)境、承災體、防災減災能力共同決定[28],其中防災減災能力與洪澇災害風險呈負相關關系[29]。本文構建湖北省洪澇災害風險評估指標體系如表3所示,綜合風險表達式如式(11)~(15)所示。
式中:FDRI為綜合風險指數;HF為危險性指數;SDE為敏感性指數;CV為易損性指數;ER為防減災能力指數。X1~X15為本文所用的15個指標,WHF、WSDE、WCV、WER及weightXi為4個方面和各指標對洪澇災害風險影響的權重值,由PCA得出。
本研究在模型建立中,提出采用PCA算法4個方面下各指標因子權重,得到模型指標體系如表4所示。
表4 湖北省洪澇災害風險評估指標權重
圖4為湖北省洪澇災害致災因子危險性示意圖,易致災地區(qū)主要分布在湖北省東部和西南部地區(qū)。湖北省處于亞熱帶季風區(qū),光能充足,熱量豐富,無霜期長,降水充沛,雨熱同季。平均降水量在800~1600 mm,降水地域分布呈由南向北遞減趨勢。由于湖北省獨特的位置和氣候,湖北省西北部地區(qū)致災風險性較低,如房縣、鄖縣和谷城等地區(qū);西南部宜恩、五峰、宜都與東部鄂州、黃石、武漢市區(qū)、羅田等地區(qū)洪澇災害致災風險性較高,主要原因是該地區(qū)降雨頻次強且雨量大,且長江流經,造成汛期洪澇易發(fā)。
圖4 湖北省洪澇災害致災因子危險性圖
圖5為湖北省孕災環(huán)境敏感性等級區(qū)劃圖。湖北省孕災環(huán)境敏感性整體呈現由東部到西部、由中部地區(qū)往外逐漸減弱的趨勢。高敏感性地區(qū)主要分布在湖北省中東部地區(qū),主要原因是武漢、鄂州、黃石、孝感、荊州、仙桃、潛江、天門的全部地域以及襄陽、荊門、黃岡、咸寧、隨州等地市的絕大部分地域位于低海拔區(qū)域,高程低導致水平面線相對高,且有長江和漢江流經,河網密度大造成汛期水量積蓄;中東部又多為平坡地不易疏導水流,而西部及東部南北部多為坡地及山地土壤蓄水能力差,造成武漢、仙桃、潛江等地孕災環(huán)境敏感性較強[30]。
圖5 湖北省洪澇災害孕災環(huán)境敏感性
圖6為湖北省洪澇災害承災體易損性等級區(qū)劃圖。湖北省整體上是中東部地區(qū)易損性高而西部地區(qū)大都易損性較低。西部高低易損性低主要是因為人口密度小、經濟相較中東部而言不發(fā)達;而中部及東部人口相對密集、經濟發(fā)展水平高,導致易損性強,尤其武漢市地域作為湖北省第一經濟大市,災害一旦波及將造成巨大的破壞,易損性極高。
圖6 湖北省洪澇災害承載體易損性圖
圖7為湖北省防減災能力分布圖。東部地區(qū)設置的災害緊急避難場所數量相對多、綜合醫(yī)院和診所的分布也更為密集,災害發(fā)生后具有較好的醫(yī)療衛(wèi)生應急條件;同時東部地區(qū)人均GDP水平高,有更多的財力可以支持當地各項防減災項目落實和災后的經濟重建。因此湖北省對于洪澇災害的防減災能力較強的地區(qū)主要分布在東部,如武漢市和黃石地區(qū);而西部地區(qū)經濟發(fā)展相對緩慢,防減災能力相對較低。
圖7 湖北省洪澇災害防減災能力圖
通過本研究中提出的模型,繪制得到了湖北省洪澇風險區(qū)劃圖,如圖8所示。
圖8 湖北省洪澇災害綜合風險等級圖
根據2010—2018年湖北省氣象災害年鑒,洪澇發(fā)生地(表5所示)多處于本研究風險區(qū)劃圖的高風險區(qū)及重風險區(qū),與本研究得到的洪澇災害綜合風險分布基本吻合。
表5 湖北省洪澇受災區(qū)
湖北省西部地區(qū)多林地,經濟發(fā)展相對緩慢、人口密度較小,對災害敏感性低,西北部降雨指數相對低、河網水系分布也較為稀疏不易積水,西南部地區(qū)降雨指數高,但是海拔高、地形陡不易形成表面徑流,且西部地區(qū)多為抗洪性相對高的林地,洪災風險相對小;東部地區(qū)經濟水平高、人口密集,地勢較平緩、海拔低,水系分布密集容易形成強烈的徑流導致洪澇,造成地表設施被毀、農田積水現象[31],給湖北發(fā)展帶來巨大損失,雖然中東部經濟發(fā)展快、醫(yī)療能力高,具有較好的災情應急和災后重建能力,但災害造成的傷害是不可逆的,根據洪澇風險區(qū)劃圖適當的調整經濟發(fā)展結構是避免損失的最有效措施。洪澇災害風險評價是預防洪澇的重要手段和區(qū)域防災減災的基礎,評價結果可為區(qū)域洪澇災害監(jiān)督預測、防洪減災措施的制定與城建規(guī)劃提供依據,風險區(qū)分布可以指導生產,做到更好的災情監(jiān)測。
(1)針對湖北省自然因素及社會因素,從危險性、暴露性、易損性和減災能力4個方面選取15個風險評估指標,采用網絡爬蟲、GIS分析、PCA構建指標體系,在一定程度上改進了現有研究技術中數據難獲取、數據質量低、確權過程研究者主觀性大的問題,最終建立湖北省洪澇災害風險評估模型。以縣區(qū)為基本單元,進行湖北省洪澇風險評估,并繪制湖北省洪澇災害風險等級區(qū)劃圖。
(2)湖北省洪澇致災因素主要為降雨和地勢,且高風險區(qū)分布在中東部耕地及城建地區(qū),中風險區(qū)多分布在鄂西南林地地區(qū)。
(3)洪澇是一種極為復雜的自然災害現象,未來的相關課題研究應依據洪澇災害形成的機理,選擇更為全面且適合研究區(qū)的指標數據,也可以細化評價單元,建立更加精細的評估模型。結果會更加貼合實際現象,給當地社會發(fā)展和農業(yè)生產帶來更好的指導。