• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于自然語言識別的上海市報(bào)警災(zāi)情數(shù)據(jù)識別及其氣象災(zāi)害特征分析研究

      2021-07-26 09:07:50辰,潘順,嚴(yán)
      自然災(zāi)害學(xué)報(bào) 2021年3期
      關(guān)鍵詞:詞項(xiàng)災(zāi)情分詞

      楊 辰,潘 順,嚴(yán) 巖

      (上海市氣象災(zāi)害防御技術(shù)中心,上海 200030)

      上海是一個(gè)特大型城市,人口密度高,經(jīng)濟(jì)密度大,城市運(yùn)行極易遭受氣象影響[1-2],同時(shí)在全球氣候變化的大背景下,各種自然災(zāi)害和極端氣候事件的發(fā)生頻率和強(qiáng)度也呈現(xiàn)出逐漸增強(qiáng)的趨勢[3-4]。近年來,上海災(zāi)害性天氣時(shí)有發(fā)生,2018年更是在1個(gè)月內(nèi)接連遭遇3次臺風(fēng)的直接登陸,給城市的安全穩(wěn)定運(yùn)行帶來了較大的挑戰(zhàn)。

      目前已有不少學(xué)者開展了針對氣象災(zāi)害的時(shí)空特征分析及風(fēng)險(xiǎn)評估研究,但所用災(zāi)害數(shù)據(jù)大多來源于氣象信息員上報(bào)及相關(guān)災(zāi)情普查資料[5-9],受制于災(zāi)情收集渠道,數(shù)據(jù)量較為有限,且從災(zāi)害發(fā)生到數(shù)據(jù)收集入庫往往需要較長的時(shí)間,難以支撐對受災(zāi)情況進(jìn)行快速分析研判的需要。近年來,隨著互聯(lián)網(wǎng)和社交平臺的發(fā)展,利用微博來獲取災(zāi)情和檢測突發(fā)事件的相關(guān)研究也越來越多,但主要涉及地震等災(zāi)害的識別[10-12],專門針對氣象災(zāi)害方面的研究較少[13-15],且微博數(shù)據(jù)中混雜了大量的非災(zāi)害信息,增加了信息識別和數(shù)據(jù)清洗的難度。相比之下,110災(zāi)情數(shù)據(jù)具備較為規(guī)整的地址和災(zāi)害描述信息,且數(shù)據(jù)的時(shí)效性較強(qiáng),可支持基于災(zāi)情信息的準(zhǔn)實(shí)時(shí)分析研判,對于城市運(yùn)行氣象風(fēng)險(xiǎn)具有較好的指征意義。因此本文利用上海市應(yīng)急聯(lián)動平臺接報(bào)的110氣象災(zāi)情數(shù)據(jù)進(jìn)行挖掘分析,并基于關(guān)鍵詞識別+LDA方法實(shí)現(xiàn)對氣象災(zāi)情的主題建模,在此基礎(chǔ)上,結(jié)合氣象觀測數(shù)據(jù)開展了災(zāi)情分布的特征分析,為氣象災(zāi)害的快速識別匹配和結(jié)構(gòu)化提取提供了一定的技術(shù)支撐,同時(shí)也為基于災(zāi)情信息的城市精細(xì)化管理決策提供了參考。

      1 研究資料與方法

      1.1 研究資料

      數(shù)據(jù)資料主要包括2010-2019年的氣象災(zāi)害數(shù)據(jù)及同期氣象觀測數(shù)據(jù)。災(zāi)害數(shù)據(jù)來源于市民電話報(bào)警,通過接警員將報(bào)警電話記錄為文字描述信息錄入系統(tǒng),并經(jīng)由上海市應(yīng)急聯(lián)動平臺實(shí)時(shí)接入上海市氣象局值班業(yè)務(wù)平臺,數(shù)據(jù)字段包括日期時(shí)間、事件發(fā)生地址、接警員記錄的災(zāi)情文字描述以及根據(jù)報(bào)警人所在位置識別的經(jīng)緯度信息等。由于災(zāi)情經(jīng)緯度識別為報(bào)警人所在位置,在異地報(bào)警的情況下,經(jīng)緯度坐標(biāo)會存在較大偏差,因此本文在進(jìn)行空間位置匹配分析的過程中,基于百度地圖開放平臺[16]和高德開放平臺[17]提供的接口對報(bào)警信息中記錄的災(zāi)情發(fā)生地址進(jìn)行經(jīng)緯度解析,并剔除與原經(jīng)緯度偏差大于0.05°的災(zāi)情記錄。由于暴雨、大風(fēng)等氣象災(zāi)情主要發(fā)生在6-10月的汛期,其占比超過10a全部災(zāi)情數(shù)的95.5%,因此本研究選用6-10月的災(zāi)情數(shù)據(jù)進(jìn)行分析建模,所用災(zāi)情數(shù)據(jù)共計(jì)32349條。

      氣象觀測數(shù)據(jù)包含了2010-2019年共254個(gè)自動氣象觀測站記錄的雨量、氣溫、風(fēng)速、風(fēng)向等信息,時(shí)間分辨率為1 h。為保證數(shù)據(jù)的連續(xù)性,研究中剔除了數(shù)據(jù)記錄時(shí)段不足研究時(shí)段30%的站點(diǎn),最終選取了143個(gè)自動氣象站參與分析。在與降雨和大風(fēng)災(zāi)情的匹配分析中,按經(jīng)緯度位置分別獲取距離災(zāi)情位置最近和次近的氣象站信息,如距離最近的自動站點(diǎn)該時(shí)次缺測數(shù)據(jù),則采用次近站點(diǎn)的同時(shí)次數(shù)據(jù)進(jìn)行填充,用于暴雨和大風(fēng)的致災(zāi)條件分析。

      1.2 方法

      由于110氣象災(zāi)情具備較完整的案發(fā)地址和災(zāi)情文字描述,因此本文基于上述文本信息,在R語言環(huán)境下,采用Jieba中文分詞引擎進(jìn)行分詞,并對分詞后的文本進(jìn)行停用詞處理,在此基礎(chǔ)上,采用關(guān)鍵詞提取與隱含狄利克雷分布(LDA)相結(jié)合的方式對災(zāi)情描述信息進(jìn)行主題聚類,識別暴雨、大風(fēng)、雷電和冰雹四類氣象災(zāi)種,并進(jìn)一步分析氣象災(zāi)害的時(shí)空特征,以及致災(zāi)的氣象條件。

      1.2.1 中文分詞

      中文分詞就是將中文語料按照一定規(guī)則重新組合成詞序列的過程。目前常用的中文分詞工具有ICTCLAS、SegmentCN、Jieba等,本文選用JiebaR分詞包進(jìn)行災(zāi)情文本的分詞處理,并采用混合分詞引擎,即結(jié)合最大概率法和隱式馬爾科夫模型的方式進(jìn)行。由于該分詞方法的效果與分詞詞典有很大關(guān)系,因此本文針對災(zāi)情描述信息采用Jieba自帶的分詞詞典,而對于災(zāi)情地址信息的提取,則基于搜狗細(xì)胞詞典中的“上海地名街道名”詞庫[18]進(jìn)行處理。

      1.2.2 停用詞處理

      停用詞是指文本中那些沒有實(shí)際意義但又可能大量出現(xiàn)的詞項(xiàng),比如“的”,“是”等等。這些詞使用頻率過高,往往會對分析造成干擾,因此需要進(jìn)行停用詞處理。本文根據(jù)110災(zāi)情信息的特點(diǎn),除了識別常用的中文停用詞以外,還去除了諸如“上址”、“到場”、“民警”、“通知”、“分局”等詞項(xiàng)。

      1.2.3 LDA主題聚類

      注:圖中α和β分別為θ和φ的超參數(shù); θ表示文本下主題的分布; φ表示主題下詞項(xiàng)的分布; Z表示某詞項(xiàng)所對應(yīng)的主題; wt表示構(gòu)成某文本的詞項(xiàng); N表示詞的個(gè)數(shù); M表示語料庫中文本的數(shù)量; k表示某文本所可能具有的主題數(shù)。

      LDA(隱含狄利克雷分布)是由Blei等人[19]于2003年提出的三層貝葉斯主題模型,其結(jié)構(gòu)包含文本層、主題層以及單詞層,目的是通過無監(jiān)督學(xué)習(xí)的方法從文本中發(fā)現(xiàn)隱含的語義維度。LDA模型的基本思想是每條文本由多個(gè)主題以多項(xiàng)式分布構(gòu)成,每個(gè)主題又由多個(gè)單詞以多項(xiàng)式分布構(gòu)成,而多項(xiàng)式分布的先驗(yàn)概率分布為狄利克雷分布[20]。LDA目前被廣泛應(yīng)用于文本主題識別、文本分類、文本相似度計(jì)算等文本挖掘的熱門研究領(lǐng)域[21]。圖1為LDA的貝葉斯網(wǎng)絡(luò)圖。

      本文基于關(guān)鍵詞識別+LDA的方法對災(zāi)情描述信息進(jìn)行主題聚類,由于雷電和冰雹災(zāi)情占比很少,因此首先基于關(guān)鍵詞提取的方式,識別雷電和冰雹災(zāi)種,然后基于R建立語料庫,結(jié)合LDA主題模型參數(shù)先驗(yàn)知識[22]得到經(jīng)驗(yàn)性取值方法,對暴雨和大風(fēng)進(jìn)行文本分類。經(jīng)過以上分類處理后,得到近10a中6-10月的氣象災(zāi)害共32 294條,其中暴雨災(zāi)害16 866條,大風(fēng)災(zāi)害14 859條,雷電災(zāi)害517條,冰雹災(zāi)害52條。

      1.2.4 TF-IDF關(guān)鍵詞提取

      在對氣象災(zāi)情進(jìn)行分類的基礎(chǔ)上,利用TF-IDF(詞頻-逆文檔頻率)算法提取主題對應(yīng)的關(guān)鍵詞,TF-IDF可以識別在災(zāi)情描述中出現(xiàn)次數(shù)較多并且很少出現(xiàn)在其他文本語料中的詞項(xiàng),從而突出不同災(zāi)種對應(yīng)的災(zāi)情影響及承災(zāi)體等關(guān)鍵詞信息。任何給定詞項(xiàng)的逆文檔頻率定義為[23]:

      (1)

      其中,ndocuments為語料庫中的文檔總數(shù),ndocuments containing term為包含該詞項(xiàng)的文檔數(shù)。

      2 結(jié)果與分析

      2.1 災(zāi)情類別分析

      2.1.1 氣象災(zāi)害分類準(zhǔn)確度檢驗(yàn)

      根據(jù)本文預(yù)設(shè)的主題數(shù),基于關(guān)鍵詞識別+LDA方法共分類了暴雨、大風(fēng)、雷電和冰雹四類氣象災(zāi)情。為了檢驗(yàn)?zāi)P椭黝}分類的準(zhǔn)確性,本文以分類災(zāi)情數(shù)為單位采用分層隨機(jī)采樣方法,從每一類結(jié)果中分別隨機(jī)抽取10%的樣本,總計(jì)3 230個(gè)樣本參與人工檢驗(yàn)判別,檢驗(yàn)結(jié)果如表1所示。

      從混淆矩陣(表1)中可以看到,基于關(guān)鍵詞識別+LDA方法可以較好地對上海汛期的氣象災(zāi)情類別進(jìn)行識別和提取,分類總體精度達(dá)到98.9%,可以滿足對氣象災(zāi)害快速識別提取的需要。除雷電和冰雹外,暴雨、大風(fēng)災(zāi)情的分類精確率分別達(dá)到98.9%和96.5%,其中風(fēng)災(zāi)的誤判主要集中在臺風(fēng)天氣導(dǎo)致的次生災(zāi)害,如造成的道路塌陷及道路護(hù)欄被積水沖散等;而暴雨分類中同樣存在部分與大風(fēng)災(zāi)情的混淆。此外,人工判別還識別出部分非氣象災(zāi)害,如非氣象原因造成的小區(qū)停電以及水管爆裂導(dǎo)致的路面積水等。

      表1 氣象災(zāi)情分類人工檢驗(yàn)結(jié)果Table 1 Results of the manual test for meteorological disasters classification

      2.1.2 災(zāi)種對應(yīng)詞頻比較分析

      圖2為暴雨和大風(fēng)災(zāi)情的詞項(xiàng)頻率分布圖,圖中所出現(xiàn)的詞項(xiàng)在暴雨和大風(fēng)災(zāi)情描述中至少都出現(xiàn)過一次??梢钥吹綀D中接近直線的詞在兩類災(zāi)情中具有相似的頻率,如“車窗”、“摔倒”、“路口”、“馬路”,以及高頻端的“臺風(fēng)”、“轎車”等,而遠(yuǎn)離直線的詞表示在不同災(zāi)種的災(zāi)情表述中出現(xiàn)頻率存在較大差異。例如,在大風(fēng)災(zāi)情中頻繁出現(xiàn)的“砸壞”、“刮倒”、“大樹”、“廣告牌”、“信號燈”等詞很少在暴雨災(zāi)情中出現(xiàn);同樣,“抽水”、“水深”、“家中”、“進(jìn)水”、“積水”等詞項(xiàng)和描述水深的關(guān)鍵詞(如腳踝、膝蓋、大腿等定性描述以及不同數(shù)字和“厘米”或“公分”組合的定量描述)則很少在大風(fēng)災(zāi)情中出現(xiàn)。

      圖2 暴雨和大風(fēng)災(zāi)情詞項(xiàng)頻率分布Table 2 Frequency distribution of torrential rain and gale disaster terms

      2.1.3 類型關(guān)鍵詞及詞云分析

      采用TF-IDF方法分類別進(jìn)行關(guān)鍵詞提取,并基于提取的關(guān)鍵詞進(jìn)行詞云分析??梢钥吹奖┯隇?zāi)情關(guān)鍵詞中“積水”和“進(jìn)水”的占比最高,其次為“家中”、“轎車”等承災(zāi)體描述,以及“水深”、“膝蓋”、“拋錨”等受災(zāi)程度的表述。同樣,大風(fēng)災(zāi)情中,主要關(guān)鍵詞為“轎車”、“樹”、“雨棚”、“電線”等承災(zāi)體信息以及“砸壞”、“吹倒”、“掉落”等災(zāi)害影響描述。

      注:圖a為所有災(zāi)種的詞云,圖b、c、d分別為暴雨、大風(fēng)和雷電災(zāi)種對應(yīng)的詞云。

      2.1.4 災(zāi)情共現(xiàn)詞項(xiàng)分析

      詞項(xiàng)網(wǎng)絡(luò)圖(圖4)可以分析災(zāi)情描述中成對出現(xiàn)的詞項(xiàng)頻率,并對該關(guān)系網(wǎng)絡(luò)進(jìn)行繪圖。從暴雨(圖4a)和大風(fēng)(圖4b)的詞項(xiàng)網(wǎng)絡(luò)圖中都可以看到一些清晰的聚類,如暴雨災(zāi)情中,“積水”、“公分”、“家中”、“膝蓋”、“消防”、“水深”、“轎車”等形成了比較顯著的詞項(xiàng)聚簇;而對于大風(fēng)災(zāi)情,“臺風(fēng)”、“傷”、“樹”、“轎車”、“砸”、“影響”、“交通”、“車道”等詞項(xiàng)同樣存在較強(qiáng)的聚類現(xiàn)象。分析表明災(zāi)情描述中的關(guān)鍵詞均存在較強(qiáng)的共現(xiàn)情況,可以形成較為清晰的聚類結(jié)構(gòu)。

      圖4 暴雨和大風(fēng)災(zāi)情的詞項(xiàng)網(wǎng)絡(luò)Fig.4 Term network of torrential rain and gale disasters

      2.1.5 災(zāi)害承災(zāi)體和受災(zāi)影響分析

      基于上述關(guān)鍵詞提取結(jié)果,文中還進(jìn)行了暴雨、大風(fēng)和雷電災(zāi)種的災(zāi)害承災(zāi)體分析,并進(jìn)一步區(qū)分為一級承災(zāi)體和次級承災(zāi)體。結(jié)果表明,暴雨災(zāi)情中,73.9%的承災(zāi)體信息可以經(jīng)由災(zāi)情描述進(jìn)行識別和提取,其中,房屋、車輛和道路的受災(zāi)比例最高,占比分別達(dá)到38.6%、27.4%和13.4%;對于大風(fēng)災(zāi)害,可以識別98.9%的承災(zāi)體信息,受災(zāi)比例最高的承災(zāi)體分別是樹、房屋和雨棚,占比分別達(dá)到21.5%、13.1%和12.8%,此外,大風(fēng)災(zāi)情描述中還可以提取出較多的次級承災(zāi)體信息,其中以大風(fēng)吹倒行道樹或吹落構(gòu)筑物砸壞車輛的占比最高,表明大風(fēng)災(zāi)情具有一定的傳遞作用;對于雷電災(zāi)害,可以識別97.9%的承災(zāi)體信息,受災(zāi)比例最高的承災(zāi)體分別為電力設(shè)施、房屋和電線。

      在此基礎(chǔ)上,本文還針對暴雨災(zāi)情中積水深度的定量表述進(jìn)行了識別和提取,并將諸如“腳踝”、“膝蓋”、“大腿”等文字描述分別轉(zhuǎn)換為定量的積水深度。結(jié)果表明,積水深度以30~50 cm的頻次為最多,其次為10~20 cm,對于個(gè)別區(qū)域如地下室、車庫等也出現(xiàn)過報(bào)警描述超過200 cm的積水災(zāi)情。

      2.2 災(zāi)情時(shí)間分布特征

      從災(zāi)情逐年分布(圖5(a))可以看到,近10a上海6-10月的110氣象災(zāi)情年際差異較大,災(zāi)情發(fā)生最多的是2012年,為9 679條,最少為2010年,僅124條。近10a中受災(zāi)較為嚴(yán)重的年份分別是2012年、2013年和2019年,而臺風(fēng)和持續(xù)性強(qiáng)降水是造成災(zāi)情大量爆發(fā)的主要原因。2012年上海受“海葵”臺風(fēng)影響,2012年8月8日-8月9日,48小時(shí)接報(bào)災(zāi)情8 328條(暴雨災(zāi)情2 998條,大風(fēng)災(zāi)情5 324條,雷電災(zāi)情6條),占該年度6-10月災(zāi)情總數(shù)的86%;2013年受“菲特”臺風(fēng)和“0913”強(qiáng)降雨影響,災(zāi)情數(shù)分別為4 542條和966條,占該年6-10月災(zāi)情數(shù)的85%;2019年上海接連遭遇“利奇馬”、“米娜”臺風(fēng)影響,分別造成了4 568、1 123起氣象災(zāi)害。

      災(zāi)害的逐月分布(圖5(b))上,8月份氣象災(zāi)害發(fā)生數(shù)量最多,為18 268條,占近10a中6-10月災(zāi)情總數(shù)的56%,其次為10月份的6 144條,占災(zāi)情總數(shù)的18%,再次為6月份的3 513條,占比11%。

      本文還分別統(tǒng)計(jì)了工作日(圖5(c))和非工作日(圖5(d))氣象災(zāi)情的逐小時(shí)分布,可以看到工作日的災(zāi)情分布呈現(xiàn)出明顯的雙峰特征,早高峰出現(xiàn)在08時(shí),近10a災(zāi)情數(shù)為1 617條,晚高峰出現(xiàn)在16時(shí),災(zāi)情數(shù)為2 178條,與市民出行的早晚高峰時(shí)間基本對應(yīng);節(jié)假日的災(zāi)情時(shí)間分布同樣呈現(xiàn)出雙峰特征,但早高峰不明顯,7-10時(shí)災(zāi)情都呈現(xiàn)出高發(fā)趨勢,同時(shí)晚高峰的時(shí)間較工作日有所提前,出現(xiàn)在15時(shí),災(zāi)情數(shù)為967條。

      圖5 2009-2018年6-10月氣象災(zāi)情時(shí)間分布Fig.5 Temporal distribution of meteorological disaster from June to October during 2009-1018

      2.3 災(zāi)情空間分布特征

      2.3.1 災(zāi)情密度空間分析

      暴雨(圖6(a))和大風(fēng)(圖6(b))的災(zāi)情空間分布較為一致,災(zāi)情密度都以中心城區(qū)為最高,分別為77個(gè)/km2和47個(gè)/km2,其次為緊鄰中心城區(qū)的外環(huán)以內(nèi)區(qū)域以及各區(qū)的城市副中心,如嘉定鎮(zhèn)、寶山友誼路街道、奉賢南橋鎮(zhèn)、浦東惠南鎮(zhèn)以及青浦和松江城區(qū)等,總體上看暴雨和大風(fēng)災(zāi)情的高發(fā)區(qū)域都與城市人員密集區(qū)相重合。

      圖6 災(zāi)情核密度圖Fig.6 Kernel density map of disaster

      2.3.2 基于中文分詞的災(zāi)情路段分析

      根據(jù)搜狗細(xì)胞詞典中的“上海地名街道名”詞庫進(jìn)行受災(zāi)路段的提取,結(jié)果表明,在暴雨和大風(fēng)影響下,部分路段多次受災(zāi)。其中“滬青平公路”、“共和新路”、“場中路”、“滬太路”、“浦東大道”等路段遭受暴雨和大風(fēng)災(zāi)害都較為頻繁,受災(zāi)年份主要集中在2012年、2013年、2015年和2019年,與災(zāi)情逐年分布趨勢相吻合。除以上路段外,暴雨災(zāi)情中,“真南路”、“滬松公路”、“北青公路”等路段歷史上受災(zāi)次數(shù)也較多;大風(fēng)災(zāi)情中,受災(zāi)較多的路段還包括“滬南公路”、“川南奉公路”和“龍吳路”等,如圖7所示。

      圖7 災(zāi)情發(fā)生路段頻數(shù)分析Fig.7 Frequency analysis of roads where disasters occurred

      2.4 氣象與災(zāi)情的特征分析

      2.4.1 暴雨致災(zāi)氣象條件分析

      分析發(fā)生暴雨災(zāi)情對應(yīng)的整點(diǎn)時(shí)次以及災(zāi)情發(fā)生前1~23 h有觀測記錄的自動站小時(shí)雨強(qiáng),繪制暴雨致災(zāi)雨量時(shí)序分布圖。從圖8中可以看出,平均小時(shí)雨強(qiáng)和小時(shí)雨強(qiáng)最大值均出現(xiàn)在暴雨災(zāi)情發(fā)生前1 h,說明短時(shí)強(qiáng)降雨是引起暴雨災(zāi)害的主要因素。此外,災(zāi)情發(fā)生前1~3 h的降雨強(qiáng)度呈現(xiàn)逐漸降低的趨勢,表明暴雨致災(zāi)還存在一定的累積效應(yīng),長時(shí)間的較強(qiáng)降雨同樣是引發(fā)內(nèi)澇災(zāi)害的重要因素。

      2.4.2 大風(fēng)致災(zāi)氣象條件分析

      分析發(fā)生大風(fēng)災(zāi)害對應(yīng)的整點(diǎn)時(shí)次以及災(zāi)害發(fā)生前1-23 h有觀測記錄的自動站小時(shí)極大風(fēng)速,繪制大風(fēng)致災(zāi)風(fēng)力時(shí)序分布圖。從圖9中可以看出,平均小時(shí)極大風(fēng)速最大值同樣出現(xiàn)在大風(fēng)災(zāi)害發(fā)生前1 h,且在大風(fēng)災(zāi)害發(fā)生前,隨著時(shí)間推移,小時(shí)極大風(fēng)速平均值逐漸減小,但風(fēng)力極大值相差并不明顯,表明大風(fēng)報(bào)災(zāi)存在一定的延后效應(yīng),而瞬時(shí)大風(fēng)是致災(zāi)的主要原因。

      3 結(jié)論與討論

      研究基于R語言環(huán)境,以2010-2019年氣象災(zāi)情數(shù)據(jù)為研究資料,采用Jieba中文分詞引擎對自然語言描述的氣象災(zāi)情進(jìn)行分詞,并對分詞后的文本進(jìn)行停用詞處理。在此基礎(chǔ)上,采用關(guān)鍵詞提取與LDA相結(jié)合的方法對災(zāi)情描述信息進(jìn)行主題聚類,識別暴雨、大風(fēng)、雷電和冰雹四類氣象災(zāi)害。結(jié)果表明,采用關(guān)鍵詞提取和LDA相結(jié)合的方法可以較好地對上海汛期的氣象災(zāi)害類別進(jìn)行識別和提取,分類總體精度達(dá)到98.9%,可以滿足對氣象災(zāi)害快速識別提取的需要。

      在災(zāi)情分類的基礎(chǔ)上,本文還進(jìn)一步分析了暴雨和大風(fēng)災(zāi)害的詞頻和關(guān)鍵詞特征。結(jié)果表明,暴雨和大風(fēng)災(zāi)情中,除了部分詞項(xiàng)在兩種災(zāi)情描述中均較為常見以外,大多數(shù)的詞項(xiàng)分布存在較為明顯的差異,且高頻詞大多包含承災(zāi)體和災(zāi)情影響的表述信息。此外,暴雨和大風(fēng)災(zāi)情詞項(xiàng)均存在較強(qiáng)的共現(xiàn)情況,可以形成較為清晰的聚類結(jié)構(gòu)?;跒?zāi)害承災(zāi)體和受災(zāi)影響的進(jìn)一步分析表明,暴雨災(zāi)情中,房屋、車輛和道路的受災(zāi)比例最高,占比分別達(dá)到38.6%、27.4%和13.4%,在受災(zāi)程度方面,積水深度以30~50 cm的頻次為最多,其次為10~20 cm,個(gè)別區(qū)域如地下室、車庫等也出現(xiàn)過報(bào)警描述超過200 cm的積水災(zāi)情。對于大風(fēng)災(zāi)害,受災(zāi)比例最高的承災(zāi)體分別是樹、房屋和雨棚,占比分別達(dá)到21.5%、13.1%和12.8%。此外,大風(fēng)災(zāi)情描述中還可以提取出較多的次級承災(zāi)體信息,其中以大風(fēng)吹倒行道樹或吹落構(gòu)筑物砸壞車輛的占比最高,表明大風(fēng)災(zāi)害具有一定的傳遞作用。

      本文還分析了災(zāi)害發(fā)生的時(shí)空分布特征,并結(jié)合氣象觀測數(shù)據(jù),分析了暴雨和大風(fēng)災(zāi)害的致災(zāi)氣象條件。結(jié)果表明,近10a上海市6-10月的110氣象災(zāi)情年際差異較大,受災(zāi)較為嚴(yán)重的年份分別是2012年、2013年和2019年,而臺風(fēng)和持續(xù)性強(qiáng)降水是造成災(zāi)情大量爆發(fā)的主要原因;災(zāi)害的逐月分布上,8月份氣象災(zāi)害發(fā)生數(shù)量最多,其次為10月份。災(zāi)情的逐時(shí)分布呈現(xiàn)出雙峰特征,且工作日更為明顯,早晚高峰分別對應(yīng)08時(shí)和16時(shí)。暴雨和大風(fēng)的災(zāi)情空間分布均以中心城區(qū)為最高,其次為緊鄰中心城區(qū)的外環(huán)以內(nèi)區(qū)域以及各區(qū)的城市副中心,且基于路名提取結(jié)果,“滬青平公路”等6條路段遭受暴雨和大風(fēng)災(zāi)害都較為頻繁,受災(zāi)年份主要集中在2012年、2013年、2015年和2019年。此外,結(jié)合氣象觀測資料分析,暴雨災(zāi)情中短時(shí)強(qiáng)降雨和長時(shí)間的較強(qiáng)降雨是引起暴雨災(zāi)害的重要因素,而大風(fēng)災(zāi)情中,致災(zāi)主要由瞬時(shí)大風(fēng)引起。

      本文采用自然語言處理方法,基于110氣象災(zāi)情數(shù)據(jù)進(jìn)行分析,可以對影響災(zāi)種、承災(zāi)體及受災(zāi)程度等信息進(jìn)行快速識別,為氣象災(zāi)情的快速收集和結(jié)構(gòu)化提取提供了一定的技術(shù)支撐,很大程度上解決了傳統(tǒng)災(zāi)情收集中存在的時(shí)效性問題,也為相關(guān)研究的開展提供了一個(gè)新的思路。該研究可以對基于災(zāi)情信息的城市精細(xì)化管理決策提供一定的參考依據(jù)。此外,基于110災(zāi)情數(shù)據(jù)資料,如何采用基于數(shù)據(jù)驅(qū)動的研究方法,建立氣象條件與災(zāi)情發(fā)生之間的關(guān)聯(lián),從而提高對氣象災(zāi)害發(fā)生的影響預(yù)報(bào)和風(fēng)險(xiǎn)預(yù)警能力,還有待進(jìn)一步研究。

      猜你喜歡
      詞項(xiàng)災(zāi)情分詞
      2022年6月全球?yàn)?zāi)情
      2021年12月全球?yàn)?zāi)情
      長慶油田:災(zāi)情就是命令
      結(jié)巴分詞在詞云中的應(yīng)用
      自然種類詞項(xiàng)二難、卡茨解決與二維框架
      值得重視的分詞的特殊用法
      災(zāi)情再顯城市短板
      高考分詞作狀語考點(diǎn)歸納與疑難解析
      英語詞項(xiàng)搭配范圍及可預(yù)見度
      依據(jù)語篇中多層次信息的句法分析方法
      大家(2011年9期)2011-08-15 00:45:37
      阿图什市| 梁平县| 天柱县| 黄冈市| 安溪县| 台北市| 若羌县| 驻马店市| 平乡县| 临夏县| 侯马市| 邛崃市| 土默特右旗| 金山区| 襄樊市| 屯昌县| 灌阳县| 布拖县| 扬州市| 密云县| 武宁县| 南京市| 凉山| 阿拉尔市| 萨嘎县| 垫江县| 马龙县| 许昌县| 台湾省| 嘉善县| 太和县| 霍邱县| 乳山市| 祁阳县| 南宫市| 田阳县| 黑龙江省| 雅安市| 潮安县| 武宣县| 扶风县|