丁偉杰周 凱沈守楓
(1.浙江警察學(xué)院 大數(shù)據(jù)與網(wǎng)絡(luò)安全研究院,浙江杭州 310053;2.基于大數(shù)據(jù)架構(gòu)的公安信息化應(yīng)用公安部重點(diǎn)實(shí)驗(yàn)室,浙江杭州 310053;3.浙江工業(yè)大學(xué) 信息工程學(xué)院,浙江杭州 310023;4.浙江工業(yè)大學(xué) 應(yīng)用數(shù)學(xué)系,浙江杭州 310023)
犯罪問題一直是影響人民群眾生活以及社會(huì)文明發(fā)展的重大問題.近年來,隨著移動(dòng)互聯(lián)網(wǎng)快速發(fā)展,犯罪事件傳播的速度越來越快,對(duì)警方提出了更高的挑戰(zhàn).因此,亟需提升犯罪數(shù)據(jù)分析能力.犯罪事件數(shù)據(jù)分析從統(tǒng)計(jì),描述性數(shù)據(jù)分析到關(guān)聯(lián),探索性數(shù)據(jù)分析的轉(zhuǎn)變成為當(dāng)前犯罪數(shù)據(jù)分析領(lǐng)域的一個(gè)重要變化,犯罪模式發(fā)展逐漸成為當(dāng)前學(xué)界研究的熱點(diǎn)[1].就犯罪規(guī)律分析和犯罪模式研究來說,犯罪時(shí)空分析在揭示犯罪事件基于時(shí)間和空間維度的態(tài)勢變化,犯罪形態(tài)演變規(guī)律方面有著比較明顯的優(yōu)勢[2].因此,在犯罪模式研究中時(shí)空演變模式占據(jù)非常重要的地位,對(duì)分析犯罪傳播規(guī)律,快速定位犯罪源頭提供理論性支持.
目前,對(duì)于城市犯罪時(shí)空演變趨勢描述方式以統(tǒng)計(jì)方法為主.如基于標(biāo)準(zhǔn)化犯罪強(qiáng)度指數(shù)的圖形數(shù)據(jù)對(duì)比法[3],基于非參數(shù)統(tǒng)計(jì)思想研究在多個(gè)分析尺度下城市各類犯罪事件時(shí)空同現(xiàn)模式[4],用復(fù)雜網(wǎng)絡(luò)的思想引入網(wǎng)絡(luò)平均度,聚集系數(shù)等特征參數(shù)研究城市犯罪的時(shí)空分布特性[5],用時(shí)間序列方法,結(jié)合地理信息構(gòu)建對(duì)犯罪情報(bào)進(jìn)行分析[6].然而這些研究方法大多從數(shù)據(jù)所呈現(xiàn)的規(guī)律著手建立模型分析城市犯罪的時(shí)空演變過程,并不能較準(zhǔn)確地刻畫城市犯罪的傳播規(guī)律.為克服上述文獻(xiàn)的不足之處,本文從研究城市犯罪的時(shí)空傳播規(guī)律出發(fā),建立熱傳導(dǎo)方程刻畫犯罪指數(shù)的演變規(guī)律.犯罪的時(shí)空傳播特點(diǎn)與熱力學(xué)的熱傳導(dǎo)模式有一定相似之處,如可以將犯罪源比作熱源,傳播模式亦從高犯罪指數(shù)區(qū)域向低犯罪指數(shù)區(qū)域傳播.熱傳導(dǎo)方程是一個(gè)非常重要的數(shù)學(xué)物理模型,可以用于描述研究區(qū)域內(nèi)溫度隨時(shí)間的變化狀況,常被借鑒應(yīng)用于描述污染物(包括水污染,空氣污染等)的時(shí)空演變模式以及各類傳染病的時(shí)空傳播模型.三維熱傳導(dǎo)方程可表示為[7-8]
其中u(x,y,z,t)表示位置(x,y,z)處的熱量,f表示熱源,γ表示材料的熱傳導(dǎo)系數(shù).
目前應(yīng)用熱力學(xué)模型研究犯罪時(shí)空演變的文獻(xiàn)幾乎是一片空白.§2結(jié)合犯罪傳播特征,引入城市內(nèi)區(qū)域治安管理能力因子以及犯罪源因子建立城市犯罪指數(shù)的熱傳導(dǎo)方程,并采用差分離散方式構(gòu)建反問題.§3將所建立的方程應(yīng)用于杭州市某區(qū)各街道2018-2020年的犯罪指數(shù)傳播特性分析,定量化估計(jì)各街道的治安管理能力與犯罪源定位.§4總結(jié)本文所作的工作.
城市內(nèi)各區(qū)域犯罪指數(shù)變化受到相鄰區(qū)域犯罪指數(shù)傳播,區(qū)域自身對(duì)犯罪防控,區(qū)域自身犯罪指數(shù)發(fā)展等影響,可設(shè)為
其中h1(x,y,t)表示時(shí)刻t坐標(biāo)為(x,y)區(qū)域犯罪指數(shù)受相鄰區(qū)域犯罪指數(shù)的影響程度,h2(x,y,t)表示時(shí)刻t坐標(biāo)為(x,y)區(qū)域犯罪指數(shù)受自身防控的影響程度,h3(x,y,t)表示時(shí)刻t坐標(biāo)為(x,y)區(qū)域犯罪指數(shù)受自身犯罪指數(shù)發(fā)展的負(fù)面影響程度.假設(shè)犯罪指數(shù)在各方向的傳播方式皆相同,則區(qū)域犯罪指數(shù)受相鄰區(qū)域影響程度的函數(shù)可以表達(dá)為
其中γ為不隨時(shí)間變化的常數(shù)傳播系數(shù),表征犯罪指數(shù)在相鄰區(qū)域間的傳播速度.考慮到每個(gè)區(qū)域的治安管理能力不同,故對(duì)犯罪指數(shù)的抑制作用也各不相同.當(dāng)研究犯罪指數(shù)受自身防控影響程度時(shí),可以表達(dá)為
其中系數(shù)g(x,y)表示坐標(biāo)為(x,y)區(qū)域治安管理能力,可假設(shè)g(x,y) 是一個(gè)不隨時(shí)間變化,僅隨空間變化的量.當(dāng)研究區(qū)域犯罪指數(shù)自身發(fā)展影響程度時(shí),引入αi表示標(biāo)號(hào)為i的犯罪源強(qiáng)度,記為
式中(xi,yi)表示標(biāo)號(hào)為i的犯罪源位置坐標(biāo).假設(shè)在本文研究中,αi為不隨時(shí)間變化,僅隨空間變化的量.因此,將公式(3)-(5)代入公式(2)可得到犯罪指數(shù)的時(shí)空演變模型
此熱傳導(dǎo)方程的初始條件,即初始時(shí)刻各區(qū)域的犯罪指數(shù)分布為
設(shè)?Ω為所討論的城市邊界,邊界條件表達(dá)為
求解如上熱傳導(dǎo)方程獲得模型參數(shù)γ,g(x,y),αi便可定量估計(jì)各區(qū)域治安管理能力以及判讀是否為犯罪源地區(qū).但解析表達(dá)式的構(gòu)造并非易事,因此這里以有限差分形式構(gòu)建上述方程的反問題.對(duì)城市內(nèi)各區(qū)域進(jìn)行標(biāo)號(hào)i1,2,3,···,n,區(qū)域中心位置為犯罪源的預(yù)選位置即(xi,yi).將時(shí)間維度和空間維度進(jìn)行離散,犯罪指數(shù)隨時(shí)間的離散形式為
這里僅考慮傳統(tǒng)犯罪模式(不考慮新型涉網(wǎng)犯罪),犯罪指數(shù)傳播模式為犯罪指數(shù)較高區(qū)域傳播至相鄰犯罪指數(shù)較低區(qū)域.定義鄰接矩陣E(eij)n×n以刻畫城市內(nèi)n個(gè)區(qū)域的連通狀況.如果eij1,說明標(biāo)號(hào)為i與標(biāo)號(hào)為j的兩個(gè)區(qū)域相互鄰接,否則,eij0.定義距離矩陣D(dij)n×n以刻畫城市內(nèi)n個(gè)區(qū)域間的相互距離.如果兩個(gè)區(qū)域不相鄰eij0,他們之間的距離定義為無窮大,即dij∞.當(dāng)討論h1(x,y,t)時(shí),其空間離散形式為
當(dāng)討論h2(x,y,t)時(shí),其空間離散形式為
當(dāng)討論h3(x,y,t)時(shí),其空間離散形式為
將公式(9)-(12)代入公式(6)可以得到迭代方程組
初始條件的離散化表達(dá)為
上式中,p(xi,yi)表示初始時(shí)刻標(biāo)號(hào)為i區(qū)域的犯罪指數(shù).與熱傳導(dǎo)方程的邊界條件不同,這里的邊界指犯罪指數(shù)最高的區(qū)域以及犯罪指數(shù)最低的區(qū)域.
具體流程見Algorithm 1.
為了驗(yàn)證上述時(shí)空演變模型的可行性,本文收集杭州市某區(qū)(記為B區(qū))范圍內(nèi)23條街道2018-2020年以月為單位的發(fā)案數(shù)據(jù).
圖1 B區(qū)23條街道2018年數(shù)據(jù)
圖2 B區(qū)23條街道2019年數(shù)據(jù)
圖3 B區(qū)23條街道2020年數(shù)據(jù)
以傳統(tǒng)案件有效報(bào)警數(shù)量衡量犯罪指數(shù)得到數(shù)據(jù)C(cik)23×36,利用本文所建立的時(shí)空演變模型推斷B區(qū)內(nèi)犯罪傳播速率,各街道的治安防控指數(shù)以及鎖定犯罪源.
B區(qū)內(nèi)各街道的連通狀況示意圖如圖4所示,圖中以街道中心位置進(jìn)行表示.從圖4中可以發(fā)現(xiàn),標(biāo)號(hào)22街道遠(yuǎn)離其余街道,標(biāo)號(hào)1-21,23號(hào)街道之間距離較為接近.
圖4 B區(qū)標(biāo)號(hào)22街道遠(yuǎn)離其余街道
2018年1月,各街道的犯罪指數(shù)柱狀圖如圖5所示,并以此作為時(shí)空模型的初始條件.從圖5中可以發(fā)現(xiàn),標(biāo)號(hào)為1,2,5,12,14-16,19,20街道的犯罪指數(shù)初始條件較高.標(biāo)號(hào)為3,4,6,7,10,13,23街道的犯罪指數(shù)初始條件較低.
圖5 B區(qū)各街道連通狀況示意圖
運(yùn)用梯度速降法求解優(yōu)化模型(16)可得整體正確達(dá)到82%.區(qū)域間傳播系數(shù)γ1.1782×10-5.區(qū)域治安管理能力參數(shù)g如表1與圖6所示.
表1 B區(qū)各街道治安管理指數(shù)
圖6 B區(qū)各街道治安管理指數(shù)
從圖6中可以發(fā)現(xiàn),標(biāo)號(hào)3,4街道治安管理指數(shù)很低,是有關(guān)部門需要引起高度重視的區(qū)域.標(biāo)號(hào)6,9-11街道的治安指數(shù)較高.結(jié)合當(dāng)?shù)孛窬慕?jīng)驗(yàn),近年來全國地方區(qū)域治安總體形勢由接觸性犯罪占主導(dǎo)地位到非接觸性犯罪為主的態(tài)勢轉(zhuǎn)變.B區(qū)作為常住人口120多萬,暫住人口120多萬的行政區(qū)域也具備該特點(diǎn).B區(qū)涵蓋主城區(qū),城鄉(xiāng)結(jié)合部,農(nóng)村等多種類型,互聯(lián)網(wǎng)經(jīng)濟(jì)行業(yè),新興工業(yè),傳統(tǒng)制造業(yè),農(nóng)業(yè)等多種經(jīng)濟(jì)形式并存,經(jīng)濟(jì)結(jié)構(gòu)比較復(fù)雜.標(biāo)號(hào)3和4 兩個(gè)街道由于外來人口較多,就業(yè)人口成分復(fù)雜,犯罪案件發(fā)案量及其比例均較高,展現(xiàn)出治安管理指數(shù)較低的情況.而標(biāo)號(hào)6,9-11街道在犯罪打防控管方面采取了相應(yīng)的工作機(jī)制改革和精準(zhǔn)宣防的防控手段,表現(xiàn)出治安態(tài)勢基本面向好的趨勢.
區(qū)域治安管理能力參數(shù)α如表2與圖7所示.
表2 B區(qū)各街道犯罪源指數(shù)
圖7 B區(qū)各街道治安管理能力參數(shù)
從圖7中可以發(fā)現(xiàn),標(biāo)號(hào)1,2,9,14,20街道最有可能成為B區(qū)的犯罪源所在地.標(biāo)號(hào)7,12,13,22,23街道最不可能成為B區(qū)的犯罪源所在地.
許多研究證實(shí),犯罪基本空間格局在很大程度上具有相對(duì)穩(wěn)定性[9-10],這為學(xué)者開展犯罪時(shí)空統(tǒng)計(jì)研究提供了理論依據(jù).由于缺乏對(duì)犯罪傳播機(jī)制的理論性洞察和定量分析,犯罪時(shí)空研究很難支撐犯罪模式發(fā)現(xiàn)和犯罪源頭分析.文章推導(dǎo)城市犯罪指數(shù)在時(shí)間維度,空間維度傳播的熱傳導(dǎo)方程模型,并通過非線性規(guī)劃模型估計(jì)方程參數(shù),從而實(shí)現(xiàn)城市各區(qū)域治安管理能力的評(píng)價(jià)以及犯罪源的定位.相較于傳統(tǒng)方法,文章所提出的時(shí)空演變模型是從機(jī)理層面對(duì)犯罪傳播模式的深入探索.為驗(yàn)證模型以及算法的可行性與有效性,文章搜集杭州市B區(qū)2018年-2020年的犯罪數(shù)據(jù),計(jì)算模型參數(shù)對(duì)B區(qū)各街道的治安管理能力進(jìn)行評(píng)價(jià),并對(duì)犯罪源進(jìn)行定位.結(jié)合當(dāng)?shù)孛窬?jīng)驗(yàn),文章所得到的結(jié)果與真實(shí)情況高度吻合.因此,可以將該方法推廣至省市級(jí)的犯罪源頭定位,從而實(shí)現(xiàn)警力資源的高效部署.