譚立云
(華北科技學(xué)院理學(xué)院,河北 三河065201)
經(jīng)查詢(xún)2019 年我國(guó)國(guó)家統(tǒng)計(jì)局官網(wǎng),我國(guó)2019 年31 個(gè)省、直轄市和自治區(qū)交通事故總數(shù)為247646 起,其中最多的省份是湖北高達(dá)23168 起,最低的省份是西藏,共468 起。為了對(duì)總體情況進(jìn)行更好了解,我們利用Geoda 空間統(tǒng)計(jì)分析軟件來(lái)進(jìn)行空間探索和分析。
在Geoda 空間統(tǒng)計(jì)分析軟件中,箱形圖是一種特殊的四分位數(shù)地圖,是在四分位地圖基礎(chǔ)上,再加上兩個(gè)異常值,這種地圖實(shí)際與“箱形”沒(méi)任何聯(lián)系,只是其構(gòu)思是從箱線(xiàn)圖演化而成,故稱(chēng)箱形圖,它尤其強(qiáng)調(diào)具有異常值的地域單位。所謂異常值是指那些大于Q3+1.5d,或小于Q1-1.5d,其中d=Q3-Q1,稱(chēng)為四分位距,異常值又可以分為極端和溫和兩種:那些大于Q3+3d,或小于Q1-3d 的異常值稱(chēng)為極端異常值,而那些小于或等于Q3+3d,或大于或等于Q1-3d 的異常值稱(chēng)為溫和異常值。在Geoda 中很容易做出箱形圖,這里取溫和異常值,見(jiàn)圖1。
圖1 交通事故箱線(xiàn)圖分布圖
從圖1 可以看出,有一個(gè)高的溫和異常值,這是湖北省,沒(méi)有低溫和異常值;交通事故低的省份(即小于Q1)集中在西藏、寧夏、甘肅、青海、湖南、海南、北京、上海等8 個(gè)地區(qū);Q1和Q2之間的省份有新疆、內(nèi)蒙古、東三省、重慶及河等7 個(gè)地區(qū);Q2和Q3之間的省份有云南、山西、陜西、四川、天津、浙江、江蘇、江西等8 個(gè)地區(qū);大于Q3的省份有貴州、廣西、廣東、河南、山東、安徽和福建等7 個(gè)地區(qū)。交通事故總量表現(xiàn)出的聚集性非常明顯。
在Geoda 空間統(tǒng)計(jì)分析軟件中,很容易進(jìn)行空間聚類(lèi),圖2是聚為四類(lèi)時(shí)的聚類(lèi)圖,從聚類(lèi)圖中可以看出這四類(lèi)基本都是地理位置靠近且成片在一起的,這里的聚類(lèi)圖與線(xiàn)形圖略有出入,地理位置特征更加明顯。
圖2 空間聚類(lèi)(4 類(lèi))圖
莫蘭1950 年提出了全局自相關(guān)莫蘭指數(shù)I,它是最早應(yīng)用于檢驗(yàn)空間關(guān)聯(lián)性和集聚問(wèn)題的指標(biāo),反映了整個(gè)研究區(qū)域內(nèi),各個(gè)地域單元與鄰近地域單元之間的相似性,其計(jì)算公式為:
莫蘭指數(shù)I 取值介于-1 與1 之間,大于0 表示正相關(guān),值越大表明具有相似的屬性集聚在一起(即高值與高值鄰接、低值與低值鄰接),小于0表示負(fù)相關(guān),值越接近-1,表明具有相異的屬性集聚在一起(即高值與低值鄰接、低值與高值鄰接),接近0,則表示屬性是隨機(jī)分布的,或者說(shuō)不具有空間自相關(guān)性。
本案例中用GeoDa 計(jì)算得到全局自相關(guān)莫蘭指數(shù)I=0.111>0,表現(xiàn)出正相關(guān),即表現(xiàn)出高指與高值鄰接、低值與低值鄰接。圖3 表示的高值與高值鄰接的行政區(qū),圖4 表現(xiàn)的是低值與低值鄰接的行政區(qū)
圖3 高值- 高值鄰接的行政區(qū)示意圖
圖4 低值與低值鄰接的行政區(qū)示意圖
以下考察GDP 與交通事故總量之間的回歸關(guān)系,通過(guò)采取普通最小二乘回歸、空間滯后回歸和空間誤差回歸三種模型進(jìn)行對(duì)比后發(fā)現(xiàn),本模型最合適的模型是空間誤差回歸模型。
空間誤差回歸模型是如下的模型:
其中Y,X,W 分別表示GDP、交通事故總量、空間權(quán)重矩陣??臻g權(quán)重我們這里取得按共邊或共頂點(diǎn)及視為鄰接,采取“后”方式計(jì)算權(quán)重矩陣。
最后得到的模型如表1(這里只展示回歸系數(shù),其他信息均刪除)。
表1
即我們得到GDP 與交通事故總量的回歸模型為:
GDP=9972.60+2.63628* 交通事故總數(shù)
但從模型檢驗(yàn)結(jié)果可以看出來(lái),參數(shù)λ 不顯著,常數(shù)也不夠顯著,模型較為粗糙,GDP 與交通事故總量二者之間的正向關(guān)系我們可以理解,我們目前的經(jīng)濟(jì)發(fā)展在一定程度上還是粗放型,經(jīng)濟(jì)越發(fā)達(dá)的省份交通事故越多,從前面的箱形圖、聚類(lèi)圖都可以印證這一點(diǎn)。
通常數(shù)據(jù)都具有空間地理位置,因此我們?cè)谶M(jìn)行數(shù)據(jù)分析時(shí),最理想的方法應(yīng)該是采取利用空間數(shù)據(jù)分析方法。我們對(duì)2019 年我國(guó)31 個(gè)行政區(qū)的交通事故總量進(jìn)行了分析,表現(xiàn)出較強(qiáng)的聚集性,即高值與高值鄰接,低值與低值鄰接。我們進(jìn)一步對(duì)GDP與交通事故總數(shù)關(guān)系時(shí)發(fā)現(xiàn),經(jīng)濟(jì)越發(fā)達(dá)的地區(qū),交通事故總數(shù)越多,在發(fā)展經(jīng)濟(jì)時(shí)應(yīng)該尊重人的生活,堅(jiān)持人民至上、生命至上。