劉旭斌,齊鳳亮,于 健,李培軍,魏克剛,許舒人
?
基于時空信息的假幣犯罪熱點區(qū)域探測系統(tǒng)
劉旭斌1,3,齊鳳亮2,于 健2,李培軍3,魏克剛3,許舒人3
(1. 中國科學(xué)院大學(xué),北京 100049;2. 公安部物證鑒定中心,北京 100038; 3. 中國科學(xué)院軟件研究所 軟件工程技術(shù)研究開發(fā)中心,北京 100190)
目前已有的犯罪熱點分析方式是通過計算犯罪率或使用空間聚類方法,這些方法沒有有效的利用時間信息,無法準(zhǔn)確反映犯罪分布特征,且很難靈活地從不同層級去判斷熱點,同時在地圖中進行實時渲染。本文采用基于時空數(shù)據(jù)場的層次聚類算法分析假幣收繳數(shù)據(jù),挖掘犯罪熱點,設(shè)計并實現(xiàn)了假幣犯罪熱點區(qū)域探測系統(tǒng),通過時空數(shù)據(jù)場理論可以充分融合時空信息,而層次聚類算法可以實現(xiàn)分級聚類,從而滿足警方不同層級查看熱點區(qū)域的需求。
時空信息;時空數(shù)據(jù)場;熱點區(qū)域探測;層次聚類
近些年來假幣犯罪案件逐年增多,銀行收繳假幣事件也越來越頻繁,這在一定程度上影響了社會經(jīng)濟穩(wěn)定發(fā)展,因此,警方逐漸加大了對假幣犯罪的打擊力度。在假幣的流通過程中,部分地區(qū)會因為人口數(shù)量、教育程度以及經(jīng)濟狀況等原因易成為受害重災(zāi)區(qū),即假幣犯罪熱點區(qū)域,故從流通熱點角度出發(fā)打擊假幣犯罪是一種行之有效的方式。隨著犯罪數(shù)據(jù)的累積,如何有效挖掘數(shù)據(jù)中潛在的價值為警方提供決策支持成為了亟待解決的問題。本文旨在通過分析大量假幣犯罪數(shù)據(jù),發(fā)現(xiàn)假幣流通中熱點區(qū)域,從而幫助警方更加快速的分析案件。
傳統(tǒng)的假幣犯罪熱點分析方式是通過計算某段時間內(nèi)各個區(qū)域的犯罪率來判斷熱點區(qū)域,但這很難靈活地從不同層級去判斷熱點,沒有很好的融合時間和空間信息,而且無法實時地在地圖中進行渲染。雖然目前已有研究人員通過數(shù)據(jù)挖掘技術(shù)來發(fā)掘熱點,但大多只考慮了時間或空間因素,導(dǎo)致分析出的熱點無法全面準(zhǔn)確地揭示犯罪分布特征。本文采用基于時空數(shù)據(jù)場的層次聚類算法分析銀行收繳假幣熱點區(qū)域,從而反映假幣犯罪熱點,通過時空數(shù)據(jù)場理論可以很好地將時空信息融合在一起綜合考慮,而層次聚類算法通過分級聚類,可滿足警方宏觀和微觀查看熱點區(qū)域的需求,最終使用熱力圖的方式進行展示,更加清晰直觀。
犯罪地理學(xué)指出,犯罪行為從一開始就與地理環(huán)境密切相關(guān)[1,2],大量研究也表明犯罪具有明顯的時空聚集特性,即存在“犯罪熱點”[3-6]。熱點區(qū)域探測的研究方法融合了犯罪學(xué)、環(huán)境地理學(xué)、統(tǒng)計學(xué)、地理信息科學(xué)以及制圖學(xué)等多學(xué)科理論及相關(guān)技術(shù)。熱點區(qū)域分析指在特定時間區(qū)間內(nèi),對過往歷史數(shù)據(jù)進行統(tǒng)計分析或采用聚類等機器學(xué)習(xí)技術(shù),分析出犯罪高發(fā)區(qū)域,并結(jié)合信息可視化技術(shù),在地圖上采用熱力圖方式展示。目前已有很多學(xué)者對此開展研究,提出了一些可行的探測方法,主要分為“基于區(qū)域統(tǒng)計數(shù)據(jù)的熱點探測方法”和“基于離散點的熱點探測方法”。
基于區(qū)域統(tǒng)計數(shù)據(jù)的探測方法大多是通過計算各個轄區(qū)的犯罪率、人口總量以及案件總量等統(tǒng)計指標(biāo),從而識別出一段時間內(nèi)的熱點犯罪區(qū)域或者某轄區(qū)的熱點犯罪時間段。該方法易受統(tǒng)計指標(biāo)選取和可變區(qū)域單元等因素影響。
基于離散點的探測方法主要是指點模式分析中的空間聚類方法,主要有犯罪位置數(shù)量統(tǒng)計法、分割法、層級聚類法、密度估計法等[7,8]。層級聚類法可以通過人為改變聚類參數(shù)來調(diào)整聚集規(guī)模,并按照一定規(guī)則產(chǎn)生層級不等的聚集,滿足了警方對犯罪熱點宏觀與微觀的不同處置要求[9]。掃描統(tǒng)計法使用了不同半徑的圓形掃描窗口搜索整個研究區(qū)域,從而監(jiān)測點數(shù)據(jù)的顯著聚集情況,采用了蒙特卡洛模擬檢驗顯著性[10]。
以往的研究多集中于犯罪空間聚集情況的識別和探測,對于數(shù)據(jù)的時間信息缺乏足夠重視和深度挖掘[11,12]。近些年來,越來越多的學(xué)者將時間信息作為犯罪時空分布研究的重要因素,只有結(jié)合時空信息,才能完整準(zhǔn)確地表達犯罪地理分布特征。對此,一些學(xué)者提出了若干代表性方法。例如,為了將時間信息融入到點集分析中,Brunsdon等提出了時空核密度估計法,得到可放置于時空立方體中的三維核密度估計面。而通過使用圓柱體替換空間掃描統(tǒng)計法中圓形的掃描窗口,可將其擴展到時空維度,得到時空掃描統(tǒng)計法。Nakaya等在一項犯罪時空分析的研究中,將日本京都2003年到2004年街頭偷盜案件的數(shù)據(jù)分布于時空立方體中,綜合了前述的時空核密度法和時空掃描統(tǒng)計法兩種分析方法,較好地識別和解讀了研究區(qū)域內(nèi)的犯罪熱點及其隨時間的變化轉(zhuǎn)移情況[13]。
由于熱點探測的目標(biāo)是方便警務(wù)人員從宏觀和微觀兩個方面觀察熱點區(qū)域,層次聚類算法中不同的層級聚類滿足了宏觀和微觀的探測需求,該算法的停止閾值(聚類個數(shù))參數(shù)由警務(wù)人員指定,而其他聚類算法提前確定參數(shù)大多比較困難,采用層次聚類可以將參數(shù)交由警務(wù)人員確定,故增加了算法分析的可靠性。同時,如果只考慮空間信息,無法全面準(zhǔn)確地揭示犯罪分布特征,故本文結(jié)合時空信息進行探測分析。綜合考慮,本文提出了一種基于時空信息的層次聚類算法進行假幣流通中的熱點區(qū)域探測。
通過分析業(yè)務(wù)數(shù)據(jù),將銀行收繳假幣數(shù)據(jù)的特點歸納如下:
(1)同一個人在一次被收繳中存在多次錄入情況,具體表現(xiàn)為同一個人在很短的時間間隔內(nèi),被同一家銀行支行錄入多次收繳記錄;
(2)每個城市的銀行支行的地點是確定的,如果只基于距離做分析的話,不論時間段如何選擇,只要這些支行在該段時間內(nèi)收繳過至少一次,則會導(dǎo)致探測出的熱點區(qū)域基本都一樣;
(3)收繳事件過多,且存在多個收繳事件點處于同一位置,但時間不同,基于時空信息聚類,兩個事件可能會被劃分到兩個區(qū)域中,但他們在地圖上屬于同一個點,所以基于事件聚類顯然不合理;
針對第一個問題,本文認(rèn)為同一個人在同一銀行支行同一天被收繳多次的時候,可以認(rèn)為只收繳了一次,將這幾條記錄合并為一次收繳事件,具體表現(xiàn)為收繳金額疊加、冠字號并入一個集合。
針對第二個問題,本文將融合時間和空間信息,作為聚類的基礎(chǔ)數(shù)據(jù),當(dāng)時間區(qū)間不同時,地理位置上的同一點可表達為不同的值,因此,在聚類時,會更加合理的表達點的聚集性。
針對第三個問題,本文采用基于銀行支行位置點聚類,當(dāng)時間區(qū)間確定時,如果同一個位置點存在多個收繳事件,則該位置的時間信息有多個,這樣與其他位置點計算勢能以及差異度時,無法確定使用哪一個時間,而熱點探測的目標(biāo)是分析該時間區(qū)間內(nèi)的平均熱點區(qū)域,故本文采取將多個收繳事件的收繳時間求均值,作為該位置點的時間屬性。
早在1837年,物理學(xué)家法拉第就提出了場的概念,用于描述物體間的非接觸相互作用。數(shù)據(jù)場理論[14]借鑒物理學(xué)中場的思想,在抽象的數(shù)域空間中引入了物體間的相互作用及其場描述方法。數(shù)據(jù)場中對象之間的相互作用可以通過定量的勢能函數(shù)來實現(xiàn),任何一個數(shù)據(jù)對象的狀態(tài)是場中所有其他對象共同作用的結(jié)果,其勢能值將成為數(shù)據(jù)對象之間度量相似度的標(biāo)準(zhǔn),從而實現(xiàn)數(shù)據(jù)對象檢測和聚集區(qū)域的分類。
時空數(shù)據(jù)場銀行收繳假幣數(shù)據(jù),尤其是收繳假幣點,不僅包含空間地理信息,而且還包含了豐富的時間信息。對于一個收繳點,它剛剛形成時的能量最強,而且隨著時間的推移能量會衰減,所以兩點之間相互作用的強度與時間有關(guān)系。
由上一小節(jié)可知,我們將計算所有收繳點在場中的疊加勢能值,然后基于此進行層次聚類。然而,由公式(4)可知,存在未知影響因子σ,且其對結(jié)果影響較大,故我們將根據(jù)公式(3)對其進行優(yōu)化求解。
實質(zhì)上,影響因子σ的最優(yōu)值是具有單一變量的非線性函數(shù),即最小化勢能熵,minH(σ)。目前存在許多算法可以解決這個最優(yōu)化問題,例如簡單的啟發(fā)式算法、隨機搜索方法和模擬退火等。本文采用黃金分割算法來求解影響因子σ的最優(yōu)值,但由于黃金分割算法需要確定最初的搜索閉區(qū)間,而σ∈(0,+∞),故需要找到一種方法求出最初的合理搜索區(qū)間。進退法可以用于確定一維無約束優(yōu)化問題中的初始搜索區(qū)間,故本文采用了一種融合了進退法和黃金分割算法的方法來解決一維無約束優(yōu)化問題,求出σ的最優(yōu)解。算法詳細(xì)描述如下:
輸入:收繳點數(shù)據(jù)集D = {x | xi= (lngi,lati,ti), i = 1, 2, 3…n}
σ初始值a
σ步長縮放因子m
輸出:最優(yōu)解
1: a1 = a, h1 = H(D, a1), a2 = a1*m, h2 = H(D, a2)
3: a3 = a2*h, h3 = H(D, a3)
5: a1 = a2, a2 = a3, h2 = h3, a3 = a2*h, h3 = H(D, a3)
6: end while
7: end if
9: swap(a1, a2), swap(f1, f2), a3 = a2/h, h3 = H(D, a3)
11: a1 = a2, a2 = a3, h2 = h3, a3 = a2/h, h3 = H(D, a3)
12: end while
13: end if
14: left = min(a1, a3), right = max(a1, a3)
15: σr= left + 0.618034 * (right - left), σl= left + right -σr
16: h2 = H(D, σr), h1 = H(D, σl)
19: right =σr, σr=σl, h2 = h1, σl= left + right -σr, h1 = H(D, σl)
20: end if
21: else
22: left =σl, σl=σr, h1 = h2, σr= left + right -σl, h2 = H(D, σr)
23: end else
24: end while
25: return 1.618 * (right + left)/2
輸入:S: 所有簇的label,每個簇代表一個收 繳點
d: 兩兩簇之間的差異值矩陣
N: 最終輸出的簇的個數(shù)
輸出:N個簇
1: procedure LABEL(L)
2: L1 = []
3: N = (number of rows in L) + 1
4: U = new UNION-FIND(N)
7: U.UNION(a, b)
8: end for
9: return L1
10: endprocedure
11: class UNION-FIND
12: method CONSTRUCTOR(N)
13: parent = new int[2N ? 1]
14: parent[0, . . . , 2N ? 2] all is None
15: end method
16: method UNION (m, n)
17: parent[m] = nextlabel
18: parent[n] = nextlabel
19: nextlabel = nextlabel + 1
20: end method
21: method EFFICIENT- FIND(n)
22: p = n
23: while parent[n] is not None do
24: n = parent[n]
25: end while
27: p, parent[p] = parent[p], n
28: end while
29: return n
30: end method
31: end class
32: procedure MST-LINKAGE(S, d, N)
33: L = MST-LINKAGE-CORE(S, d)
34: Stably sort L with respect to the third column.
35: L = LABEL(L)
36: L = RECOVERY (L, S, N)
37: return L
38: endprocedure
39: procedure MST-LINKAGE-CORE (S0, d)
40: L = []
41: c = (any element of S0)
42: D0[s] = 1 for s 2 S0 {c}
43: for i in (1, . . ., |S0| ? 1) do
44: Si= Si?1 {c}
45: for s in Sido
46: Di[s] = min{Di?1[s], d[s, c]}
47: end for
49: Append (c, n, Di[n]) to L
50: c = n
51: end for
52: return L
53: end procedure
54: procedure RECOVERY (L, S, N)
55: tmp = [], valid = []
56: for label in S do:
57: Append ({label}) to tmp, Append (True) to valid
58: end for
59: for step in [0,1…,size(S)-N-1]:
60: a = L[step][0], b = L[step][1], Append (True) to valid
62: end for
63: ret = []
64: for i in [0,1…,size(valid)-1]:
65: if valid[i] == True:
66: Append (tmp[i]) to ret
67: end if
68: end for
69: return ret
假幣犯罪熱點探測分析包括四個部分,分別為熱點聚類分析、時空信息計算、熱力值計算和用戶查詢處理四個小模塊。圖1是熱點探測分析的流程圖,介紹了用戶查詢模塊,熱點聚類分析模塊,時空信息計算模塊和熱力值計算模塊是如何協(xié)作完成熱點區(qū)域探測分析的。
圖1 熱點探測分析流程圖
如圖1所示,熱點探測聚類分析的主要功能是根據(jù)用戶指定的時間和空間范圍生成對應(yīng)的熱力圖,首先是用戶查詢處理模塊接收用戶的查詢條件,主要包括時間段和區(qū)域(精確到縣級別),根據(jù)這些查詢條件從數(shù)據(jù)庫中查詢出所有符合的收繳記錄。然后熱點聚類分析模塊通過統(tǒng)計計算這些收繳記錄,得到各個銀行點以及其在這段時間內(nèi)的收繳信息,由時空信息計算模塊計算銀行點的時空屬性,之后進行時空數(shù)據(jù)場公式中的影響因子參數(shù)優(yōu)化,優(yōu)化時需要調(diào)用時空信息計算模塊來計算各個參數(shù)取值時的勢能熵。當(dāng)參數(shù)最優(yōu)值確定后,計算此時的各個銀行點勢能值,接下來熱點聚類分析模塊基于此勢能值進行層次聚類,得到各個熱點區(qū)域,再將此聚類信息傳入熱力值計算模塊,通過結(jié)合其他收繳屬性特征和各個區(qū)域的勢能值,熱力值計算模塊可以計算得到各個區(qū)域的熱點值大小,然后由熱點聚類分析模塊將此熱力值加入到聚類結(jié)果中,返回給用戶查詢處理模塊,最后返回探測結(jié)果。
該模塊主要的作用是計算每個聚類銀行點的時空屬性,由于空間點信息已確定,故此處介紹銀行點處的時間信息計算。
首先,遍歷每一個銀行點在選定時間范圍內(nèi)的所有收繳事件,根據(jù)被收繳人姓名、身份證號、收繳時間、收繳地點屬性判斷是否為同一個人同一天在同一家銀行多次被收繳,若是,則將這兩個事件合并為一個,合并策略是收繳金額相加。然后使用合并完的收繳事件來計算該銀行點處的時間屬性。用戶的目標(biāo)旨在查詢一段時間一個區(qū)域范圍內(nèi)的收繳熱點,當(dāng)用戶選定時間范圍時,更希望看到的是該段時間內(nèi)的平均熱點。故本系統(tǒng)在處理此處的時間融合時,采取的策略是簡單的將合并完事件的時間值求平均,作為該銀行點在這段時間內(nèi)的收繳時間。
在計算完銀行點收繳時間的均值后,然后根據(jù)第四章介紹的公式(2)和(4),計算出該區(qū)域內(nèi)所有的銀行點處的勢能值,根據(jù)公式(3),計算勢 能熵。
根據(jù)各銀行點處的勢能值,可以計算出兩兩銀行點之間的勢能差,作為這兩點的差異度,故我們可以計算得到差異度矩陣。聚類算法的目標(biāo)是使得類中對象之間差異度越小越好,而類間對象之間的差異度越大越好。將差異度矩陣輸入到第五章介紹的層次聚類算法中進行分析,同時,可以指定聚類的個數(shù),增加了系統(tǒng)靈活度。該模塊類圖如下圖2所示。
圖2 熱點聚類模塊類圖
類圖中的STCluster類關(guān)聯(lián)HotVal類和STCal類,其中HotVal類對應(yīng)熱力值計算模塊,STCal類對應(yīng)時空信息計算模塊,而STCluster類則對應(yīng)熱點聚類分析模塊。STCluster類中的preDeal()方法統(tǒng)計各個銀行點上的收繳事件以及進行預(yù)處理,getSamples()方法負(fù)責(zé)對原有銀行點采樣,getOptimalFactor()方法獲取最優(yōu)的影響因子參數(shù),execCluster()方法則是進行聚類過程計算。
通過層次聚類獲得了各個聚類簇,但這無法反應(yīng)各個簇所在區(qū)域的假幣收繳熱點情況,故需要計算各個簇的熱力值,然后在熱力圖中進行熱度渲染。
經(jīng)過對假幣犯罪數(shù)據(jù)的經(jīng)驗分析,我們篩選出冠字號、收繳金額這兩個屬性,同時再結(jié)合計算出的勢能值以及該簇內(nèi)收繳事件的發(fā)生量,通過將這些信息進行融合,來計算熱力值。計算公式如下:
該模塊主要負(fù)責(zé)接收用戶查詢請求,調(diào)用其他模塊處理請求,并返回數(shù)據(jù)給前端進行展示。
當(dāng)瀏覽器端接收到返回的熱點探測結(jié)果后,會在前端進行地圖上的熱力圖渲染。熱點區(qū)域探測結(jié)果的可視化,主要包括若干個熱點區(qū)域的疊加可視化、某一熱點區(qū)域的可視化、各個銀行點的位置展示以及各個銀行點的統(tǒng)計信息展示。同時,將以列表形式展示各個熱點區(qū)域的信息,包括銀行數(shù)量、平均收繳時間等。
首先,數(shù)據(jù)展示模塊用列表形式來展示熱點探測結(jié)果的統(tǒng)計信息。如圖3。
圖3 熱點區(qū)域探測-探測結(jié)果列表
圖3表示2016.05.01到2016.05.14期間云南省的熱點探測結(jié)果,其中熱點劃分個數(shù)為3。通過上圖可以看到,該結(jié)果列表顯示了各個熱點的一些統(tǒng)計信息,包括該熱點包含的銀行數(shù)量、該熱點的熱度相對大?。礋崃χ担┖驮谶@段時間內(nèi)的平均收繳時間點。
在結(jié)果列表頁面,用戶可勾選某一個或某幾個熱點,點擊渲染,即可在地圖上渲染指定熱點的熱力圖。
如圖4所示,該熱力圖展示了熱點編號為2的熱力區(qū)域范圍。通過該圖,可以清晰查看在指定時間段內(nèi)其中一個熱點的大致區(qū)域,從而反應(yīng)假幣流通中的一個熱點區(qū)域。
圖5展示了熱點編號1和2的疊加熱點區(qū)域。相較于一個熱點區(qū)域的展示,多個熱點的疊加能夠更加精確地反應(yīng)假幣流通中熱點情況,上圖通過兩個熱點的疊加,可以方便用戶更加便捷的發(fā)現(xiàn)假幣收繳的熱點集中區(qū)域,可以知道,疊加區(qū)域的假幣流通更為頻繁。同時,通過使用不能深淺的顏色繪制熱點區(qū)域,能夠更加形象展示各個熱點區(qū)域的熱力值大小,顏色越深,熱力值越大,表示該區(qū)域的假幣流通更為頻繁。
為了使用戶分析熱力圖時更加全面,在渲染熱力圖的同時,在地圖中標(biāo)注出了各個銀行點的位置,用戶通過點擊標(biāo)注點,即可查看該銀行點的收繳情況等信息。具體如圖6所示。
以上展示了熱點劃分個數(shù)為3時的探測效果,當(dāng)劃分個數(shù)設(shè)置為1時,可以從更宏觀的角度觀察熱點的大致區(qū)域分布。具體如圖7所示,從該圖可以看出全省熱點犯罪的大致區(qū)域,而劃分個數(shù)為3時,展示的熱點區(qū)域劃分更加精細(xì)。
圖5 熱點區(qū)域探測-熱力圖疊加渲染結(jié)果
圖6 熱點區(qū)域探測-銀行點收繳情況
圖7 熱點區(qū)域探測-熱力圖渲染結(jié)果
本文分析大量假幣收繳數(shù)據(jù)的特征,通過時空數(shù)據(jù)場的方法將假幣收繳事件中的時空信息融合起來,采用層次聚類法探測不同層級的熱點區(qū)域,幫助警務(wù)人員從宏觀和微觀兩個角度觀察熱點區(qū)域,同時顯示熱點信息以及收繳基本信息。在下一步工作中,我們將會基于歷史假幣犯罪熱點區(qū)域預(yù)測未來的熱點區(qū)域,幫助警方進行犯罪預(yù)防。
[1] 孫峰華, 李世泰, 黃麗萍. 中外犯罪地理規(guī)律實證研究.人文地理, 2006, 21(5): 14-18.
[2] 孫峰華, 魏曉. 犯罪地理學(xué)研究的新進展. 人文地理, 2004, 19(5): 60-63.
[3] Johnson S D. Repeat burglary victimization: A tale of two theories. Journal of Experimental Criminology, 2008, 4(3): 215-240.
[4] 趙勇, 劉民, 柏書華, 等. 系列入室盜竊案件的犯罪距離研究.中國人民公安大學(xué)學(xué)報: 社會科學(xué)版, 2010(2): 143-149.
[5] Grubesic T H, Mack E A. Spatial-temporal interaction of urban crime. Journal of Quantitative Criminology, 2008, 24(3): 285-306.
[6] Bowers K J, Johnson S D. Domestic burglary repeats and space-time clusters. European Journal of Criminology, 2005, 2(1): 67-92.
[7] 孫吉貴, 劉杰, 趙連宇. 聚類算法研究. 軟件學(xué)報, 2008, 19(1): 48-61.
[8] 鄧敏, 劉啟亮, 李光強, 等. 基于場論的空間聚類算法.遙感學(xué)報, 2010, 14(4): 702-709.
[9] Levine N. CrimeStat III. Washington DC: the National Institute of Justice, 2009.
[10] Kulldorff M. A spatial scan statistic[J]. Communications in Statistics - Theory and Methods. 1997, 26(6): 1481-1496.
[11] Felson M, Poulsen E. Simple indicators of crime by time of day[J]. International Journal of Forecasting. 2003, 19(4): 595-601.
[12] Ratcliffe J H. The hotspot matrix: A framework for the spatio-temporal targeting of crime reduction[J]. Police Practice and Research. 2004, 5(1): 5-23.
[13] Nakaya T, Yano K. Visualising crime clusters in a space-time cube: An exploratory data-analysis approach using space-time kernel density estimation and scan statistics[J]. Transactions in GIS. 2010, 14(3): 223-239.
[14] Li Deyi, Du Yi. Artificial intelligence with uncertainty[M]. Beijing: National Defence Industry Press, 2005.
Hot Spot Detection System for Counterfeit Currency Crime Based on Spatio Temporal Information
LIU Xu-bin1,3, QI Feng-liang2, YU Jian2, LI Pei-jun3, WEI Ke-gang3, XU Shu-ren3
(1. University of Chinese Academy of Sciences, Beijing 100049, China; 2. Institute of Forensic Sciences, Ministry of Public Security, Beijing 100038, China; 3. Technology Center of Software Engineering, Institute of Software, Chinese Academy of Sciences, Beijing 100190, China)
At present, the analysis of crime hotspots is by calculating crime rate or using spatial clustering method. These methods do not use time information effectively and cannot accurately reflect the characteristics of crime distribution, and it is difficult to flexibly determine hotspots from different levels while performing real-time rendering in maps. This paper adopts a hierarchical clustering algorithm based on spatio-temporal data field to analyze the data of counterfeit currency seizures, mine criminal hotspots, and design and implement a hot currency area detection system for counterfeit currency crimes. Spatio-temporal data field theory can fully integrate spatio-temporal information, and hierarchical clustering algorithm can achieve hierarchical clustering, so as to meet the needs of police at different levels to view hot spots.
Spatio-temporal information; Spatio-temporal data field; Hot spot detection; Hierarchical clustering
TP 317
A
10.3969/j.issn.1003-6970.2018.10.020
劉旭斌(1992-),男,碩士,分布式計算、數(shù)據(jù)挖掘;齊鳳亮(1983-),男,碩士,情報分析、文件檢驗;于健(1988-),男,碩士,反假幣情報分析;李培軍(1976-),男,碩士,CCF會員,大數(shù)據(jù)、商業(yè)智能;魏克剛(1977-),男,碩士,計算機軟件、軟件工程;許舒人(1961-),男,學(xué)士,CCF高級會員、計算機應(yīng)用委員會委員,網(wǎng)絡(luò)分布計算和軟件工程。
劉旭斌,齊鳳亮,于健,等. 基于時空信息的假幣犯罪熱點區(qū)域探測系統(tǒng)[J]. 軟件,2018,39(10):97-104