錢昭勇 陳梅
摘 要
處理突發(fā)事件需要多個部門相互合作,現(xiàn)階段,針對信息的共享以及綜合利用還存在欠缺,尤其是多維屬性的數(shù)據(jù)方面。本文針對城市突發(fā)事件應急系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)進行研究。
【關(guān)鍵詞】數(shù)據(jù)挖掘 應急系統(tǒng) 突發(fā)事件
1 背景及相關(guān)技術(shù)介紹
現(xiàn)階段,地理信息技術(shù)得到了廣泛應用,由此使得各個行業(yè)存儲了海量的數(shù)據(jù),以上數(shù)據(jù)對指導和推動行業(yè)的發(fā)展起到了重要作用。下面通過相關(guān)技術(shù)介紹,為研究數(shù)據(jù)挖掘技術(shù)在突發(fā)事件應急系統(tǒng)中的應用奠定理論基礎。
1.1 突發(fā)事件可視化表達
地理信息系統(tǒng)(GIS)立足于地理空間數(shù)據(jù)庫的基礎上,基于計算機軟、硬件技術(shù),對數(shù)據(jù)實施收集、整理、分析、判斷,并加以模擬和顯示,同時,借助于地理模型分析方法,適時提供多種空間和動態(tài)的地理信息,為地理研究、綜合評價、管理、定量分析和決策服務而建立的一類計算機應用系統(tǒng)。在實際生活中,GIS被廣泛運用到突發(fā)事件應用系統(tǒng)可視化表達中。
1.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘中重要的組成部分包含聚類分析,利用聚類,人們可以對較為密集或者稀疏的區(qū)域進行區(qū)分,由此來辨別全局的分析模式和數(shù)據(jù)屬性間的關(guān)聯(lián)。聚類分析也即從給定的數(shù)據(jù)集中搜索數(shù)據(jù)對象之間的有價值聯(lián)系。在數(shù)據(jù)分析中,通過聚類分析,將數(shù)據(jù)被劃分成多個類,接著,在每個類中搜索模式或有價值的信息,在這種情況下,數(shù)據(jù)挖掘的其它技術(shù)將被運用到聚類分析的結(jié)果上。一般來講,利用聚類算法,挖掘突發(fā)事件中的海量數(shù)據(jù),發(fā)現(xiàn)突發(fā)事件高發(fā)或頻發(fā)區(qū)域,同時,對某些事件的相關(guān)信息進行分析。
1.3 突發(fā)事件應急系統(tǒng)數(shù)據(jù)的模型設計
通常來說,城市突發(fā)事件空間信息模型包括以下概念。第一,地理位置。突發(fā)事件空間信息的基類,描述空間地理位置信息。包含信息名稱描述以及空間信息的概括描述。第二,位置。描述地理位置的坐標值,包含經(jīng)度以及維度。第三,地域。它主要描述一個具體的地理空間內(nèi)容。第四,中心地區(qū)。城市突發(fā)事件空間信息中地域的中心區(qū)域。第五,區(qū)域范圍。描述城市突發(fā)事件影響的空間的范圍。第六,行政區(qū)劃。描述事件發(fā)生地所屬的行政區(qū)劃。
2 突發(fā)事件應急系統(tǒng)數(shù)據(jù)挖掘算法設計
突發(fā)事件應急系統(tǒng)的數(shù)據(jù)庫存儲海量歷史數(shù)據(jù)記錄,通常來說,每條記錄屬性超過數(shù)十維,在這種情況下,如果想要高維顯示事件,就需要對具體的數(shù)據(jù)記錄規(guī)范實施分析,并從記錄中自動提取文字描述的事件地點,接著,完成向GIS系統(tǒng)精確地理坐標的轉(zhuǎn)換,同時,要實現(xiàn)其他屬性數(shù)據(jù)在格式、內(nèi)容上的變換,對轉(zhuǎn)換后的屬性信息進行帥選,使事件處置記錄能融合到GIS系統(tǒng)中。本文重點介紹GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,實現(xiàn)突發(fā)事件應急系統(tǒng)數(shù)據(jù)庫地理信息自動精確轉(zhuǎn)換。算法流程圖如圖1-1所示。
GeoCoding算法包含兩方面。
(1)地址標準化。也就是把突發(fā)事件關(guān)聯(lián)的街道、建筑等地址當成是標準化進行處理。例如,把街道地址變成較為熟悉、常用的格式等。
(2)地址匹配。也即確定具有地址事件的空間位置并且將其繪制在地圖上,地址匹配的目標是為任何輸入的地址數(shù)據(jù)返回最準確的匹配結(jié)果。首先它在街道級別的地址范圍內(nèi)進行精確匹配,如果沒有找到匹配的地址,它會在上一級的地址范圍內(nèi)進行搜尋,直到找到匹配結(jié)果為止。最后,完成匹配的地址數(shù)據(jù)建立空間坐標,從而能夠在地圖上表示出此地址數(shù)據(jù)所代表的空間位置。
2.2 GeoCoding應用
對城市突發(fā)事件空間信息進行編碼的時候,由于許多空間數(shù)據(jù)記錄是非標準的,結(jié)果利用上述算法可能遇到如下問題:
(1)模糊地址,如果地圖選擇的對象以街道為基礎,則有許多地址表達模糊,并且和多個街道地址相匹配。導致GeoCoding無法自動映射到準確的位置。如果地址粒度存在著差異,數(shù)據(jù)庫中保存的地址數(shù)據(jù)的具體類型并不一直,由此所表達的空間范圍大小也存在著差異。所以,需要確定數(shù)據(jù)屬于街道地址級別抑或是城鎮(zhèn)級別,或者是區(qū)域級別。
(2)精確度問題?;跀?shù)據(jù)庫中地址數(shù)據(jù)所表達的地理準確度。假設試圖定位到電纜、犯罪現(xiàn)場或者消防龍頭,就要求較高的準確度,要基于街道一級的地址實施地理編碼。
3 突發(fā)事件空間數(shù)據(jù)分析平臺的實現(xiàn)
3.1 數(shù)據(jù)層
在數(shù)據(jù)層中,收集、整理人防、消防、公安、水利、電力等事件信息庫作為包含時空信息的多維多類型事件庫。
3.2 通用平臺
通用平臺實現(xiàn)算法和基礎功能,為上層應用提供支撐,城市突發(fā)事件空間分析平臺設計以開源的數(shù)據(jù)挖掘包WEKA作為基礎,可提高設計、實現(xiàn)效率。通用平臺包括基礎算法庫和通用組件層?;A算法庫集成上述分析算法,通用組件層則是突發(fā)事件多維度時空挖掘、分析的公共基礎。
3.3 應用支撐層
應用支撐層利用下層算法和通用組件提供的基礎功能實現(xiàn)與業(yè)務相關(guān)的功能模塊,為應急系統(tǒng)提供應用功能。第一,精確化指揮支持模塊。第二,應急效率評估支持模塊。第三,應急資源部署支持模塊。第四,事件的時空模式預測支持模塊。通過歷史事件時間、空間模式的挖掘,實現(xiàn)對未來事件時空模式的預測支持。
參考文獻
[1]何東.公共體育信息處理系統(tǒng)研究與開發(fā)[D].重慶大學,2009,123-128.
[2]張興科,王浩.通過數(shù)據(jù)挖掘技術(shù)預測學生學習成績[J].科技信息,2011,6(9):22-25.
[3]梁協(xié)雄,雷汝煥,曹長修.現(xiàn)代數(shù)據(jù)挖掘技術(shù)研究進展[J].重慶大學學報,2013,27(3):47-52.
作者單位
貴州大學計算機科學與技術(shù)學院 貴州省貴陽市 550025endprint
摘 要
處理突發(fā)事件需要多個部門相互合作,現(xiàn)階段,針對信息的共享以及綜合利用還存在欠缺,尤其是多維屬性的數(shù)據(jù)方面。本文針對城市突發(fā)事件應急系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)進行研究。
【關(guān)鍵詞】數(shù)據(jù)挖掘 應急系統(tǒng) 突發(fā)事件
1 背景及相關(guān)技術(shù)介紹
現(xiàn)階段,地理信息技術(shù)得到了廣泛應用,由此使得各個行業(yè)存儲了海量的數(shù)據(jù),以上數(shù)據(jù)對指導和推動行業(yè)的發(fā)展起到了重要作用。下面通過相關(guān)技術(shù)介紹,為研究數(shù)據(jù)挖掘技術(shù)在突發(fā)事件應急系統(tǒng)中的應用奠定理論基礎。
1.1 突發(fā)事件可視化表達
地理信息系統(tǒng)(GIS)立足于地理空間數(shù)據(jù)庫的基礎上,基于計算機軟、硬件技術(shù),對數(shù)據(jù)實施收集、整理、分析、判斷,并加以模擬和顯示,同時,借助于地理模型分析方法,適時提供多種空間和動態(tài)的地理信息,為地理研究、綜合評價、管理、定量分析和決策服務而建立的一類計算機應用系統(tǒng)。在實際生活中,GIS被廣泛運用到突發(fā)事件應用系統(tǒng)可視化表達中。
1.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘中重要的組成部分包含聚類分析,利用聚類,人們可以對較為密集或者稀疏的區(qū)域進行區(qū)分,由此來辨別全局的分析模式和數(shù)據(jù)屬性間的關(guān)聯(lián)。聚類分析也即從給定的數(shù)據(jù)集中搜索數(shù)據(jù)對象之間的有價值聯(lián)系。在數(shù)據(jù)分析中,通過聚類分析,將數(shù)據(jù)被劃分成多個類,接著,在每個類中搜索模式或有價值的信息,在這種情況下,數(shù)據(jù)挖掘的其它技術(shù)將被運用到聚類分析的結(jié)果上。一般來講,利用聚類算法,挖掘突發(fā)事件中的海量數(shù)據(jù),發(fā)現(xiàn)突發(fā)事件高發(fā)或頻發(fā)區(qū)域,同時,對某些事件的相關(guān)信息進行分析。
1.3 突發(fā)事件應急系統(tǒng)數(shù)據(jù)的模型設計
通常來說,城市突發(fā)事件空間信息模型包括以下概念。第一,地理位置。突發(fā)事件空間信息的基類,描述空間地理位置信息。包含信息名稱描述以及空間信息的概括描述。第二,位置。描述地理位置的坐標值,包含經(jīng)度以及維度。第三,地域。它主要描述一個具體的地理空間內(nèi)容。第四,中心地區(qū)。城市突發(fā)事件空間信息中地域的中心區(qū)域。第五,區(qū)域范圍。描述城市突發(fā)事件影響的空間的范圍。第六,行政區(qū)劃。描述事件發(fā)生地所屬的行政區(qū)劃。
2 突發(fā)事件應急系統(tǒng)數(shù)據(jù)挖掘算法設計
突發(fā)事件應急系統(tǒng)的數(shù)據(jù)庫存儲海量歷史數(shù)據(jù)記錄,通常來說,每條記錄屬性超過數(shù)十維,在這種情況下,如果想要高維顯示事件,就需要對具體的數(shù)據(jù)記錄規(guī)范實施分析,并從記錄中自動提取文字描述的事件地點,接著,完成向GIS系統(tǒng)精確地理坐標的轉(zhuǎn)換,同時,要實現(xiàn)其他屬性數(shù)據(jù)在格式、內(nèi)容上的變換,對轉(zhuǎn)換后的屬性信息進行帥選,使事件處置記錄能融合到GIS系統(tǒng)中。本文重點介紹GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,實現(xiàn)突發(fā)事件應急系統(tǒng)數(shù)據(jù)庫地理信息自動精確轉(zhuǎn)換。算法流程圖如圖1-1所示。
GeoCoding算法包含兩方面。
(1)地址標準化。也就是把突發(fā)事件關(guān)聯(lián)的街道、建筑等地址當成是標準化進行處理。例如,把街道地址變成較為熟悉、常用的格式等。
(2)地址匹配。也即確定具有地址事件的空間位置并且將其繪制在地圖上,地址匹配的目標是為任何輸入的地址數(shù)據(jù)返回最準確的匹配結(jié)果。首先它在街道級別的地址范圍內(nèi)進行精確匹配,如果沒有找到匹配的地址,它會在上一級的地址范圍內(nèi)進行搜尋,直到找到匹配結(jié)果為止。最后,完成匹配的地址數(shù)據(jù)建立空間坐標,從而能夠在地圖上表示出此地址數(shù)據(jù)所代表的空間位置。
2.2 GeoCoding應用
對城市突發(fā)事件空間信息進行編碼的時候,由于許多空間數(shù)據(jù)記錄是非標準的,結(jié)果利用上述算法可能遇到如下問題:
(1)模糊地址,如果地圖選擇的對象以街道為基礎,則有許多地址表達模糊,并且和多個街道地址相匹配。導致GeoCoding無法自動映射到準確的位置。如果地址粒度存在著差異,數(shù)據(jù)庫中保存的地址數(shù)據(jù)的具體類型并不一直,由此所表達的空間范圍大小也存在著差異。所以,需要確定數(shù)據(jù)屬于街道地址級別抑或是城鎮(zhèn)級別,或者是區(qū)域級別。
(2)精確度問題?;跀?shù)據(jù)庫中地址數(shù)據(jù)所表達的地理準確度。假設試圖定位到電纜、犯罪現(xiàn)場或者消防龍頭,就要求較高的準確度,要基于街道一級的地址實施地理編碼。
3 突發(fā)事件空間數(shù)據(jù)分析平臺的實現(xiàn)
3.1 數(shù)據(jù)層
在數(shù)據(jù)層中,收集、整理人防、消防、公安、水利、電力等事件信息庫作為包含時空信息的多維多類型事件庫。
3.2 通用平臺
通用平臺實現(xiàn)算法和基礎功能,為上層應用提供支撐,城市突發(fā)事件空間分析平臺設計以開源的數(shù)據(jù)挖掘包WEKA作為基礎,可提高設計、實現(xiàn)效率。通用平臺包括基礎算法庫和通用組件層?;A算法庫集成上述分析算法,通用組件層則是突發(fā)事件多維度時空挖掘、分析的公共基礎。
3.3 應用支撐層
應用支撐層利用下層算法和通用組件提供的基礎功能實現(xiàn)與業(yè)務相關(guān)的功能模塊,為應急系統(tǒng)提供應用功能。第一,精確化指揮支持模塊。第二,應急效率評估支持模塊。第三,應急資源部署支持模塊。第四,事件的時空模式預測支持模塊。通過歷史事件時間、空間模式的挖掘,實現(xiàn)對未來事件時空模式的預測支持。
參考文獻
[1]何東.公共體育信息處理系統(tǒng)研究與開發(fā)[D].重慶大學,2009,123-128.
[2]張興科,王浩.通過數(shù)據(jù)挖掘技術(shù)預測學生學習成績[J].科技信息,2011,6(9):22-25.
[3]梁協(xié)雄,雷汝煥,曹長修.現(xiàn)代數(shù)據(jù)挖掘技術(shù)研究進展[J].重慶大學學報,2013,27(3):47-52.
作者單位
貴州大學計算機科學與技術(shù)學院 貴州省貴陽市 550025endprint
摘 要
處理突發(fā)事件需要多個部門相互合作,現(xiàn)階段,針對信息的共享以及綜合利用還存在欠缺,尤其是多維屬性的數(shù)據(jù)方面。本文針對城市突發(fā)事件應急系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)進行研究。
【關(guān)鍵詞】數(shù)據(jù)挖掘 應急系統(tǒng) 突發(fā)事件
1 背景及相關(guān)技術(shù)介紹
現(xiàn)階段,地理信息技術(shù)得到了廣泛應用,由此使得各個行業(yè)存儲了海量的數(shù)據(jù),以上數(shù)據(jù)對指導和推動行業(yè)的發(fā)展起到了重要作用。下面通過相關(guān)技術(shù)介紹,為研究數(shù)據(jù)挖掘技術(shù)在突發(fā)事件應急系統(tǒng)中的應用奠定理論基礎。
1.1 突發(fā)事件可視化表達
地理信息系統(tǒng)(GIS)立足于地理空間數(shù)據(jù)庫的基礎上,基于計算機軟、硬件技術(shù),對數(shù)據(jù)實施收集、整理、分析、判斷,并加以模擬和顯示,同時,借助于地理模型分析方法,適時提供多種空間和動態(tài)的地理信息,為地理研究、綜合評價、管理、定量分析和決策服務而建立的一類計算機應用系統(tǒng)。在實際生活中,GIS被廣泛運用到突發(fā)事件應用系統(tǒng)可視化表達中。
1.2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘中重要的組成部分包含聚類分析,利用聚類,人們可以對較為密集或者稀疏的區(qū)域進行區(qū)分,由此來辨別全局的分析模式和數(shù)據(jù)屬性間的關(guān)聯(lián)。聚類分析也即從給定的數(shù)據(jù)集中搜索數(shù)據(jù)對象之間的有價值聯(lián)系。在數(shù)據(jù)分析中,通過聚類分析,將數(shù)據(jù)被劃分成多個類,接著,在每個類中搜索模式或有價值的信息,在這種情況下,數(shù)據(jù)挖掘的其它技術(shù)將被運用到聚類分析的結(jié)果上。一般來講,利用聚類算法,挖掘突發(fā)事件中的海量數(shù)據(jù),發(fā)現(xiàn)突發(fā)事件高發(fā)或頻發(fā)區(qū)域,同時,對某些事件的相關(guān)信息進行分析。
1.3 突發(fā)事件應急系統(tǒng)數(shù)據(jù)的模型設計
通常來說,城市突發(fā)事件空間信息模型包括以下概念。第一,地理位置。突發(fā)事件空間信息的基類,描述空間地理位置信息。包含信息名稱描述以及空間信息的概括描述。第二,位置。描述地理位置的坐標值,包含經(jīng)度以及維度。第三,地域。它主要描述一個具體的地理空間內(nèi)容。第四,中心地區(qū)。城市突發(fā)事件空間信息中地域的中心區(qū)域。第五,區(qū)域范圍。描述城市突發(fā)事件影響的空間的范圍。第六,行政區(qū)劃。描述事件發(fā)生地所屬的行政區(qū)劃。
2 突發(fā)事件應急系統(tǒng)數(shù)據(jù)挖掘算法設計
突發(fā)事件應急系統(tǒng)的數(shù)據(jù)庫存儲海量歷史數(shù)據(jù)記錄,通常來說,每條記錄屬性超過數(shù)十維,在這種情況下,如果想要高維顯示事件,就需要對具體的數(shù)據(jù)記錄規(guī)范實施分析,并從記錄中自動提取文字描述的事件地點,接著,完成向GIS系統(tǒng)精確地理坐標的轉(zhuǎn)換,同時,要實現(xiàn)其他屬性數(shù)據(jù)在格式、內(nèi)容上的變換,對轉(zhuǎn)換后的屬性信息進行帥選,使事件處置記錄能融合到GIS系統(tǒng)中。本文重點介紹GeoCoding算法。
2.1 GeoCoding
借助GeoCoding算法,實現(xiàn)突發(fā)事件應急系統(tǒng)數(shù)據(jù)庫地理信息自動精確轉(zhuǎn)換。算法流程圖如圖1-1所示。
GeoCoding算法包含兩方面。
(1)地址標準化。也就是把突發(fā)事件關(guān)聯(lián)的街道、建筑等地址當成是標準化進行處理。例如,把街道地址變成較為熟悉、常用的格式等。
(2)地址匹配。也即確定具有地址事件的空間位置并且將其繪制在地圖上,地址匹配的目標是為任何輸入的地址數(shù)據(jù)返回最準確的匹配結(jié)果。首先它在街道級別的地址范圍內(nèi)進行精確匹配,如果沒有找到匹配的地址,它會在上一級的地址范圍內(nèi)進行搜尋,直到找到匹配結(jié)果為止。最后,完成匹配的地址數(shù)據(jù)建立空間坐標,從而能夠在地圖上表示出此地址數(shù)據(jù)所代表的空間位置。
2.2 GeoCoding應用
對城市突發(fā)事件空間信息進行編碼的時候,由于許多空間數(shù)據(jù)記錄是非標準的,結(jié)果利用上述算法可能遇到如下問題:
(1)模糊地址,如果地圖選擇的對象以街道為基礎,則有許多地址表達模糊,并且和多個街道地址相匹配。導致GeoCoding無法自動映射到準確的位置。如果地址粒度存在著差異,數(shù)據(jù)庫中保存的地址數(shù)據(jù)的具體類型并不一直,由此所表達的空間范圍大小也存在著差異。所以,需要確定數(shù)據(jù)屬于街道地址級別抑或是城鎮(zhèn)級別,或者是區(qū)域級別。
(2)精確度問題?;跀?shù)據(jù)庫中地址數(shù)據(jù)所表達的地理準確度。假設試圖定位到電纜、犯罪現(xiàn)場或者消防龍頭,就要求較高的準確度,要基于街道一級的地址實施地理編碼。
3 突發(fā)事件空間數(shù)據(jù)分析平臺的實現(xiàn)
3.1 數(shù)據(jù)層
在數(shù)據(jù)層中,收集、整理人防、消防、公安、水利、電力等事件信息庫作為包含時空信息的多維多類型事件庫。
3.2 通用平臺
通用平臺實現(xiàn)算法和基礎功能,為上層應用提供支撐,城市突發(fā)事件空間分析平臺設計以開源的數(shù)據(jù)挖掘包WEKA作為基礎,可提高設計、實現(xiàn)效率。通用平臺包括基礎算法庫和通用組件層?;A算法庫集成上述分析算法,通用組件層則是突發(fā)事件多維度時空挖掘、分析的公共基礎。
3.3 應用支撐層
應用支撐層利用下層算法和通用組件提供的基礎功能實現(xiàn)與業(yè)務相關(guān)的功能模塊,為應急系統(tǒng)提供應用功能。第一,精確化指揮支持模塊。第二,應急效率評估支持模塊。第三,應急資源部署支持模塊。第四,事件的時空模式預測支持模塊。通過歷史事件時間、空間模式的挖掘,實現(xiàn)對未來事件時空模式的預測支持。
參考文獻
[1]何東.公共體育信息處理系統(tǒng)研究與開發(fā)[D].重慶大學,2009,123-128.
[2]張興科,王浩.通過數(shù)據(jù)挖掘技術(shù)預測學生學習成績[J].科技信息,2011,6(9):22-25.
[3]梁協(xié)雄,雷汝煥,曹長修.現(xiàn)代數(shù)據(jù)挖掘技術(shù)研究進展[J].重慶大學學報,2013,27(3):47-52.
作者單位
貴州大學計算機科學與技術(shù)學院 貴州省貴陽市 550025endprint