胡茂川,張龍海,劉丙軍,楊 輝,王寶華,楊 芳
(1. 水利部珠江河口治理與保護重點實驗室,廣州 510610;2. 中山大學(xué) 土木工程學(xué)院,廣州 510275;3. 廣州市水務(wù)規(guī)劃勘測設(shè)計研究院有限公司,廣州 510641;4.珠江水利科學(xué)研究院,廣州 510610)
當前全球氣候變暖問題不斷加劇,加上快速城市化導(dǎo)致下墊面和局部氣候的改變,極端天氣事件的發(fā)生頻次與強度呈現(xiàn)逐漸上升趨勢,使得中國內(nèi)澇災(zāi)害問題愈發(fā)嚴重[1-3]。廣州市作為粵港澳大灣區(qū)的城市之一,內(nèi)澇頻發(fā),且強度呈上升趨勢[4-5]。常態(tài)化的內(nèi)澇問題對廣州市的正常運行以及公共安全造成了巨大影響,經(jīng)濟發(fā)展也受到了威脅。如2020年5月22日,特大暴雨發(fā)生導(dǎo)致廣州市區(qū)內(nèi)多處產(chǎn)生積水,道路橋梁、地鐵站等處受災(zāi)嚴重,交通受到嚴重阻礙[6]。因此,深入了解廣州市近些年的內(nèi)澇時空分布,對于廣州市防災(zāi)減災(zāi)管理具有重要意義。
城市內(nèi)澇信息獲取方式眾多,如遙感監(jiān)測、災(zāi)后調(diào)查、社交媒體等[7-9]。其中,社交媒體數(shù)據(jù)由于來源廣泛、獲取成本低,近年來在災(zāi)害防治中受到廣泛的關(guān)注。已有研究表明通過探索數(shù)據(jù)分析方法和空間單元,大規(guī)模的社交媒體數(shù)據(jù)在反映自然災(zāi)害發(fā)生時間和地點上,取得了良好的進展和應(yīng)用[10-12].李想[13]使用聚類法處理社交媒體數(shù)據(jù)中的災(zāi)害信息,并將地址信息經(jīng)緯度化,對現(xiàn)有的災(zāi)情地點數(shù)據(jù)庫進行補充完善。Nikita等[14]對Twitter中的災(zāi)害信息進行數(shù)據(jù)挖掘,利用話題標簽實現(xiàn)了快速分類聚集并估計了災(zāi)害影響區(qū)域。
社交媒體種類豐富,其中新浪微博在國內(nèi)具有最廣泛的用戶基礎(chǔ)。據(jù)統(tǒng)計,截止2021年第三季度,微博月活躍人數(shù)達到了5.73億,其中94%為移動端,日活躍人數(shù)達到了2.48億。微博中包含有發(fā)布時間、地理定位等記錄災(zāi)害信息的各類數(shù)據(jù)[15]。王波等[16]基于微博簽到數(shù)據(jù)構(gòu)建公眾感知指數(shù)和公眾情緒指數(shù),從時間、空間兩個維度分析居民對暴雨洪澇響應(yīng)的時空格局。肖楊[17]基于微博文本來判別暴雨內(nèi)澇災(zāi)情,并將機器學(xué)習(xí)算法應(yīng)用于輿情分析中,為相關(guān)應(yīng)急管理部門的災(zāi)害預(yù)警提供了一定的參考。
當前,社交媒體數(shù)據(jù)在城市內(nèi)澇災(zāi)害中的應(yīng)用尚不多見,且面向單次災(zāi)害事件[18-20],針對同類災(zāi)害的歷史發(fā)生規(guī)律分析的研究較為少見。伍智超等[21]利用微博數(shù)據(jù)統(tǒng)計分析了武漢市2015—2019年內(nèi)澇時空分布特征。在內(nèi)澇問題嚴重的粵港澳大灣區(qū)尚未有相關(guān)研究。本文在分析廣州市暴雨時空分布特征的基礎(chǔ)上,爬取2017—2021年的微博數(shù)據(jù)中廣州市內(nèi)澇相關(guān)信息,從內(nèi)澇的空間變化情況、時間變化情況以及在不同行政區(qū)的內(nèi)澇情形差異等方面對廣州市近年的內(nèi)澇形勢進行分析,并探討了其對暴雨的響應(yīng)情況,為廣州市內(nèi)澇防治工作提供參考。
降雨數(shù)據(jù)來源于廣東省水利廳汛情發(fā)布系統(tǒng),包括2017—2021年廣州市245個站點的場次降雨數(shù)據(jù)。由于站點分布較均勻且流域內(nèi)地形起伏變化不大,本文基于各站點的場次降雨數(shù)據(jù),通過算術(shù)平均法得到廣州市行政區(qū)劃內(nèi)各區(qū)的場次面雨量,分析廣州市各區(qū)的暴雨分布特征,并將24 h累計面雨量超過50 mm的雨量時間作為微博內(nèi)澇相關(guān)信息爬取的時間邊界條件。
目前獲取微博數(shù)據(jù)的途徑主要有3種:① 微博API(Application Programming Interface);② 第三方爬蟲軟件;③ 網(wǎng)絡(luò)爬蟲技術(shù)。為使數(shù)據(jù)獲取流程具有更高的目的性和指向性,提高研究系統(tǒng)性和高效性,本研究開發(fā)了基于XPath路徑語言的python網(wǎng)絡(luò)爬蟲程序,該程序主要包括:① 登錄微博,獲取cookie;② Requests庫收集、解析微博頁面源代碼;③ 根據(jù)關(guān)鍵詞(見表1)與時間篩選出符合條件的微博文本和簽到數(shù)據(jù)。內(nèi)澇關(guān)鍵詞的選取主要參考了王藎梓[22]的相關(guān)文獻,具體詳見表1。時間上設(shè)定為歷史場次暴雨發(fā)生的時間段。
表1 內(nèi)澇關(guān)鍵詞
本研究收集了廣州市2017—2021年發(fā)生的場次暴雨對應(yīng)的內(nèi)澇簽到數(shù)據(jù)(包含文本信息、用戶打卡點、時間),由于微博爬取的數(shù)據(jù)較為復(fù)雜,對爬取的簽到數(shù)據(jù)進行了以下處理:
(1) 由于得到的數(shù)據(jù)包含了其他省份的簽到數(shù)據(jù),故需要研究區(qū)以外的數(shù)據(jù)進行剔除,這一部分主要是通過Matlab編程進行識別篩選;
(2) 通過人工判讀去除文本內(nèi)容與內(nèi)澇無關(guān)對應(yīng)的簽到數(shù)據(jù),比如“選擇來這家公司,我真是腦子進水了?!薄凹依锕艿辣?,衛(wèi)生間和客廳被水淹了”等。將處理后微博數(shù)據(jù)通過百度地圖API確定其空間位置。
2017—2021年廣州市發(fā)生了31場24 h雨量大于50 mm的暴雨事件,其中19場24 h雨量大于100 mm。暴雨發(fā)生最多的是2018年,共發(fā)生了9場暴雨事件,最大為281.2 mm(發(fā)生于2018年6月8日);2017年緊隨其后,發(fā)生了8場暴雨事件,相比于2018年,2017年的最大暴雨量均較??;2019和2021年的暴雨事件數(shù)量上較接近,有5場左右;2020年暴雨事件最少,只有3場。從場次暴雨對應(yīng)的月份來看,廣州市暴雨事件多發(fā)于5、6月份,其次是7月和8月,最后才是9月。
2017—2021年廣州市各區(qū)發(fā)生的暴雨次數(shù)如圖1所示。白云區(qū)發(fā)生的暴雨次數(shù)最多(27次);其次是荔灣區(qū),暴雨次數(shù)為26次;在其后的是從化區(qū)、花都區(qū)、海珠區(qū)、黃埔區(qū)和番禺區(qū),均在5 a間發(fā)生了20場暴雨左右;相較而言,天河區(qū)、南沙區(qū)、增城區(qū)和越秀區(qū)發(fā)生暴雨的次數(shù)較少,均在15次左右。從發(fā)生次數(shù)在各區(qū)的分布來看,暴雨在廣州北部及中部兩側(cè)區(qū)域發(fā)生較多。
圖1 2017—2021年廣州市各區(qū)暴雨發(fā)生次數(shù)
各區(qū)的最大暴雨量分布如圖2所示。從化區(qū)在這5 a間的最大暴雨量是各區(qū)中最大的,達到281.2 mm。緊隨其后的是黃埔區(qū)與花都區(qū),其最大暴雨量都達到了220 mm以上;其次是白云區(qū)和荔灣區(qū),最大暴雨量為175 mm左右;增城區(qū)、越秀區(qū)、海珠區(qū)、天河區(qū)和番禺區(qū)最大場次暴雨量均比較接近,在155 mm左右;較其他區(qū)而言,南沙區(qū)的最大暴雨量最小,只有123.8 mm??偟膩碚f,最大場次暴雨量的分布呈現(xiàn)從北向南遞減的態(tài)勢。
圖2 2017—2021年廣州市各區(qū)最大場次暴雨量
2017—2021年廣州市內(nèi)澇數(shù)分布如圖3所示。2018年廣州市內(nèi)澇最為嚴重(259次),其次是2019年(125次)、2020年(122次),最后是2021年(74次)和2017年(63次)。月尺度上,廣州市內(nèi)澇主要發(fā)生于5月和6月(見圖4),其中,2018年6月內(nèi)澇數(shù)接近150次,這主要與2018年臺風艾尼云在廣州引發(fā)的強降雨事件相關(guān)。
圖3 2017—2021年基于微博爬取的廣州市內(nèi)澇數(shù)
圖4 2017—2021年各月基于微博爬取的廣州市內(nèi)澇數(shù)
廣州市2017—2021年內(nèi)澇點空間分布如圖5所示。近5 a廣州市內(nèi)澇主要出現(xiàn)于白云區(qū)、越秀區(qū)、海珠區(qū)、天河區(qū)。緊鄰這些區(qū)域的番禺區(qū)、黃埔區(qū)、增城區(qū)、荔灣區(qū)也有一些澇點,其余各區(qū)在這五年間內(nèi)澇發(fā)生數(shù)相對較少。廣州市內(nèi)澇主要發(fā)生于主城區(qū),內(nèi)澇影響程度以其為中心四周擴散有所減弱的態(tài)勢。
圖5 2017—2021年廣州市內(nèi)澇點分布情況
整體而言,廣州市轄區(qū)的內(nèi)澇年際變化情況與廣州市整體變化情況不完全一致,廣州市內(nèi)澇時空分布差異與各區(qū)降雨、下墊面、高程和排水系統(tǒng)等差異有關(guān)。2018年廣州內(nèi)澇最為嚴重,但對于黃埔區(qū)、增城區(qū)和從化區(qū)而言,其內(nèi)澇數(shù)并不是5 a中最多的。這與2018年廣州市的內(nèi)澇主要成因是強臺風引發(fā)的風暴潮增水災(zāi)害相關(guān),從化和增城因地理位置關(guān)系,受風暴潮影響相對較小。2020年黃埔區(qū)、增城區(qū)內(nèi)澇發(fā)生數(shù)是該區(qū)5 a中最多的。2020年“5·22”廣州特大暴雨,黃埔區(qū)降雨量達到了176.2 mm,增城區(qū)降雨量達到了155.4 mm,位于所有區(qū)中的前兩位,其中增城區(qū)也是該次暴雨事件的重災(zāi)區(qū)。
從圖1和圖5可知,內(nèi)澇空間分布與暴雨次數(shù)空間分布總體上一致,近5 a廣州市內(nèi)澇發(fā)生次數(shù)年變化與暴雨次數(shù)的年分布也較為一致。2018年廣州市內(nèi)澇發(fā)生次數(shù)最多,2018年廣州市暴雨次數(shù)和最大雨量也是近5 a中最多的。城市內(nèi)澇發(fā)生最直接影響因素之一就是極端暴雨,通過微博獲取的內(nèi)澇時空分布與暴雨時空分布總體一致,可以反映出微博內(nèi)澇信息具有一定的精度和可行度。
從圖5可知,廣州市內(nèi)澇多集中于越秀、海珠、天河及白云區(qū)左下部等主城區(qū)域。Zhang等[23]通過對來自廣州市水務(wù)局防汛抗旱中心的廣州歷史澇點數(shù)據(jù)分析也得出了類似結(jié)論。可見,基于微博獲取的內(nèi)澇信息具有較高的可信度。王藎梓[22]對比基于微博獲取的內(nèi)澇信息和上海市歷史澇情,證明微博內(nèi)澇信息可覆蓋和補充官方觀測數(shù)據(jù),具有較高的精度。本研究中由于缺少詳細的歷史澇點數(shù)據(jù),微博內(nèi)澇信息的精度仍需進一步的驗證。
雖然廣州市內(nèi)澇時空分布總體上與暴雨時空分布一致,但兩者并不完全相同。部分市轄區(qū)如從化區(qū)和花都區(qū)近5 a內(nèi)的暴雨次數(shù)和最大暴雨量都相對較大,但微博內(nèi)澇簽到數(shù)并不多,而有些區(qū)如天河區(qū)的暴雨次數(shù)和最大暴雨量相對其他區(qū)較少但提取出的內(nèi)澇相關(guān)微博簽到數(shù)卻很多。這一現(xiàn)象的產(chǎn)生與各區(qū)的城市化程度、排水管網(wǎng)以及人口分布均有關(guān)系。如天河區(qū)人口密度較大,微博活躍人數(shù)多,內(nèi)澇發(fā)生時發(fā)博數(shù)可能會更多,并且由于城市化程度較高,不透水面積大加上排水管網(wǎng)失修損害等也會加劇內(nèi)澇災(zāi)害的發(fā)生,就算是暴雨量較小也可能會發(fā)生較嚴重的內(nèi)澇,同時這個區(qū)域離珠江河口近,易受風暴潮和天文大潮影響;而花都區(qū)和從化區(qū)的人口密度和城市化程度較低,再加上地勢較高,雖然雨量很大,但內(nèi)澇的發(fā)生數(shù)和相關(guān)微博簽到數(shù)可能較少。
本研究在利用廣州歷史降雨站點數(shù)據(jù)計算各行政區(qū)面降雨量的基礎(chǔ)上,分析了2017—2021年廣州市暴雨時空特征,之后利用python爬蟲程序從微博數(shù)據(jù)中爬取了廣州市2017—2021年的微博內(nèi)澇簽到數(shù)據(jù),經(jīng)過去噪后,基于百度地圖API進行空間定位,分析近5 a廣州市內(nèi)澇時空分布情況,形成結(jié)論如下:
(1) 微博簽到數(shù)據(jù)能較為直觀地展示廣州內(nèi)澇分布情況,具有較高的可信度。
(2) 內(nèi)澇主要出現(xiàn)于越秀區(qū)、荔灣區(qū)、海珠區(qū)和天河區(qū),其次是白云區(qū)、番禺區(qū)、黃埔區(qū)。
(3) 2018年廣州市受內(nèi)澇影響最大,其次為2020、2019年和2021年,而2017年相對受影響最小。
(4) 月尺度上,廣州內(nèi)澇多發(fā)生于5月和6月。
(5) 廣州市轄區(qū)的內(nèi)澇年際變化情況與廣州市整體變化情況不完全一致。
(6) 受城市化、排水能力、人口及潮位等因素影響,廣州市內(nèi)澇時空分布總體上與暴雨時空分布一致,但不完全相同。
本研究還存在一些不足和改進之處,如:微博數(shù)據(jù)受人口密度影響較大,人口分布較少的區(qū)域信息相對較少;由于微博數(shù)據(jù)對于地名描述較為模糊,借用百度地圖API進行空間定位會產(chǎn)生一定的誤差,微博反爬限制也可能會導(dǎo)致部分內(nèi)澇信息缺失等。本次研究主要是基于微博數(shù)據(jù)對內(nèi)澇進行定性的分析,而定量(水位、水量)信息對于未來內(nèi)澇的趨勢分析與評價更為重要,后續(xù)可通過文本信息提取來進行一些定量分析以提高可信度。