董靜 張淑美
摘要:本文以空間數(shù)據(jù)模型所提出的空間統(tǒng)計的分類標(biāo)準(zhǔn)為基礎(chǔ),將空間統(tǒng)計方法分為空間點模式分析、面狀數(shù)據(jù)的空間模式分析以及地統(tǒng)計分析,對空間統(tǒng)計方法進行了一一闡述,在對理論進行研究的同時選取其中較為典型的部分方法結(jié)合實際在ARCGIS中進行應(yīng)用?;贏RCGIS進行空間統(tǒng)計方法的研究,能夠幫助我們更深入的了解空間統(tǒng)計方法,也便于我們以更為簡單、方便的方式去使用這些方法,使其面向的受眾更為大眾化,普及到社會生產(chǎn)生活的很多方面,從而推動空間統(tǒng)計方法的研究以及空間統(tǒng)計學(xué)的發(fā)展。
關(guān)鍵詞:空間統(tǒng)計學(xué);空間統(tǒng)計方法;ARCGIS
1緒論
空間統(tǒng)計學(xué)是近年來的研究熱點 , 常出現(xiàn)在地理學(xué)、計算機科學(xué)、生態(tài)學(xué)、環(huán)境學(xué)、生物學(xué)等諸多領(lǐng)域中, 影響著社會發(fā)展的很多方面。尤其在地學(xué)研究中, 應(yīng)用空間統(tǒng)計學(xué)分析方法分析問題更是常態(tài)。
GIS技術(shù)與空間統(tǒng)計方法的融合使用,在一次次的實驗中證明了它的優(yōu)勢,因此,可以預(yù)料基于GIS技術(shù)的空間統(tǒng)計方法的研究會是未來空間統(tǒng)計學(xué)發(fā)展的一大趨勢。
2空間統(tǒng)計方法
2.1空間點模式分析
在地理信息系統(tǒng)研究中任何一個帶有位置屬性的對象都可以被抽象為一個空間點特征。這些點特征有的是具體的地理實體,有的是事件發(fā)生的地點。因此這種根據(jù)點對象的空間位置來分析他們的空間分布模式的方法稱為空間點模式。空間點模式分析是空間統(tǒng)計分析的方法之一常應(yīng)用于流行病學(xué)、犯罪學(xué)、生態(tài)學(xué)等領(lǐng)域,有著十分重要的應(yīng)用價值??臻g點模式的分析方法有很多,我們以點對象在空間分布上的聚集性和離散性為基礎(chǔ),將其分為基于密度的方法和基于距離的方法,前者的方法主要為樣方分析法和核密度法;而后者的主要方法為最鄰近指數(shù)法、G-函數(shù)、K-函數(shù)等方法,其中最常用的是K函數(shù)。
2.2面狀數(shù)據(jù)的空間模式
2.2.1空間接近性
對于各面積單元之間的“距離關(guān)系”我們用空間接近性來定義,測度空間接近性其實就是利用面積單元之間的距離定義接近性。
2.2.2空間權(quán)重矩陣
空間權(quán)重矩陣可以對面積單元的空間鄰接性進行定量化測度。如果說空間接近性是用來描述不同距離關(guān)系下的地理相互作用,那么空間權(quán)重矩陣則用來描述面積單元之間的接近性程度。
2.2.3空間自相關(guān)
空間自相關(guān)分析在一定程度上可以反映空間事物的分布是否具有自相關(guān)性,是空間統(tǒng)計中的一種重要方法。在空間統(tǒng)計分析中,通過自相關(guān)分析可以直觀的分析出現(xiàn)象間的改變是否存在相關(guān)性,且分析不同觀察對象的同一屬性變量,可稱之為自相關(guān)。空間自相關(guān)反映的是一個空間區(qū)域單元上的某種地理現(xiàn)象或某一屬性值與鄰近區(qū)域單元上同一現(xiàn)象或?qū)傩灾档南嚓P(guān)程度,是一種檢測與量化從多個標(biāo)定點中取樣值變異的空間依賴性的空間統(tǒng)計方法。
空間自相關(guān)分析分為全局性和局部性,全局空間自相關(guān)分析用于分析整體范圍內(nèi)某一屬性間相關(guān)程度,但其不能確定演變過程中產(chǎn)生顯著影響的集聚簇的位置。局部空間自相關(guān)是全局的補充,用于分析局部地區(qū)之間某一理現(xiàn)象或某一屬性的相關(guān)程度。
2.3地統(tǒng)計分析
2.3.1探索性空間數(shù)據(jù)分析
探索性空間數(shù)據(jù)分析 ( Exploratory Spatial Data Analysis,ESDA) 是對實驗樣本不做假設(shè)的統(tǒng)計分析方法,讓樣本數(shù)據(jù)自己說話,實現(xiàn)對數(shù)據(jù)的分析。ESDA利用統(tǒng)計學(xué)原理和圖形圖表相結(jié)合,通過對事物或現(xiàn)象空間分布格局的描述與可視化,從而發(fā)現(xiàn)空間集聚和空間異常,以揭示研究對象之間的空間相互作用機制。ESDA 基于數(shù)據(jù)驅(qū)動的,是一種具有識別功能的空間數(shù)據(jù)分析方法,注重發(fā)現(xiàn)空間數(shù)據(jù)的分布模式,用來發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的重要信息或規(guī)律。
在使用地統(tǒng)計分析時首先使用ESDA工具處理相關(guān)數(shù)據(jù),然后再更具數(shù)據(jù)分析結(jié)果更準(zhǔn)確的選擇合適的插值方法和參數(shù)設(shè)置。
每個ESDA工具都在處理完數(shù)據(jù)后給出相應(yīng)的結(jié)果視圖,如直方圖、QQ概率圖、趨勢分析、voronoi地圖、半變異/協(xié)方差函數(shù)云圖、正協(xié)方差函數(shù)云圖等,并在單獨的窗口顯示出來。
2.3.2確定性插值法
確定性插值法一般是用數(shù)學(xué)函數(shù)進行插值研究區(qū)域內(nèi)部屬性的相關(guān)性,通??煞譃閮深悾壕_性插值方法和非精確性插值方法。顧名思義,前者給出的樣點值與實測值相等;后者預(yù)測出的樣點值一般與實測值不相等,但使用非精確插值法可以使輸出表面較為平緩。精確性插值法包括反距離加權(quán)法和徑向基函數(shù)插值法,而非精確性插值法則包括全局多項式內(nèi)插法和局部多項式插值法,其中反距離權(quán)重插值法是在確定性插值方法中最具代表性的。
2.3.3地統(tǒng)計插值法
克里金插值法是地統(tǒng)計插值法中最為典型的方法,是基于變異函數(shù)和結(jié)構(gòu)分析,將被插值的要素看做區(qū)域化變量并進行無偏估計且得到最優(yōu)解。包括普通克里金、簡單克里金、通用克里金、概率克里金等。
克里金插值法基于空間結(jié)構(gòu)分析進行估值,在估值前首先考慮屬性在地理位置上的變異分布,確定一個范圍,然后用該范圍內(nèi)的采樣點來估計其他待測點的屬性值。
克里金插值方法應(yīng)用步驟:
①輸入采樣點數(shù)據(jù),并對所選區(qū)域進行網(wǎng)格化處理;
②對原始數(shù)據(jù)進行檢驗、分析,根據(jù)實際情況剔除明顯差異點;
③利用ESDA的相應(yīng)方法對數(shù)據(jù)進行處理;
④利用變異函數(shù)進行計算,便于了解變量的空間結(jié)構(gòu);
⑤克里金插值估計
3基于ARCGIS的空間統(tǒng)計方法應(yīng)用
前面三章概述的是空間統(tǒng)計方法的由來以及相關(guān)基本理論,為了更好的理解并研究空間統(tǒng)計方法,因此本章主要從上述的空間統(tǒng)計方法中選取較為典型的幾種方法,基于ARCGIS10.4對數(shù)據(jù)進行處理應(yīng)用。
3.1利用核密度函數(shù)分析中國城鎮(zhèn)密度分布狀況
3.1.1數(shù)據(jù)來源
數(shù)據(jù)來源:GaotHR | 中國國家基礎(chǔ)地理信息系統(tǒng)數(shù)據(jù),CSDN分享
數(shù)據(jù)內(nèi)容:中國國界線.shp 中國省界線.shp 中國省市駐點.shp 中國縣鎮(zhèn)駐點.shp
3.1.2操作方法與步驟
使用核密度分析法,以各城鎮(zhèn)內(nèi)縣城駐點為樣本點,進而對城鎮(zhèn)密度進行分析。
首先在ArcGIS工具箱中找到所需工具,配置所需參數(shù)。首先選擇要輸入的點要素,Population字段表示各要素的population值,而從概念上來說,假設(shè)每個點上方均覆蓋著一個平滑曲面,而該曲面與下方的平面所圍成的空間的體積等于此點的 Population 字段值,因此,在無特殊要求下,Population字段值指定為NONE,不更改,使得每一個要素只計數(shù)一次;輸出柵格則自選路徑;輸出像元是指輸出的柵格集的像元,可根據(jù)需要進行設(shè)置,若未進行專門設(shè)置,系統(tǒng)一般會根據(jù)情況默認(rèn)設(shè)置;此外,其他設(shè)置皆可默認(rèn)選項。同時,還要進行環(huán)境配置,參數(shù)根據(jù)要輸出的柵格內(nèi)圖像的范圍設(shè)定。
3.1.3數(shù)據(jù)分析
由以上分析結(jié)果,能夠非常直觀的展現(xiàn)出我國城鎮(zhèn)的密度分布。如圖可知,我國城鎮(zhèn)在中部地區(qū)分布的更為密集,尤其河北地區(qū),而西北地區(qū)、東北地區(qū)則分布的較為為稀疏,尤其西藏與寧夏、新疆交界處。這同時也反映了我國地區(qū)發(fā)展的現(xiàn)狀,因此若掌握此數(shù)據(jù),可以由此為國家的下一步發(fā)展做規(guī)劃。
3.2基于空間自相關(guān)的芝加哥各區(qū)人口分布冷熱點分析
3.2.1數(shù)據(jù)來源
數(shù)據(jù)來源:CSDN
數(shù)據(jù)內(nèi)容:芝加哥行政區(qū)劃.shp ?芝加哥人口分布.csv
3 .2.2操作方法與步驟
首先將芝加哥人口分布.csv導(dǎo)入ArcMap并轉(zhuǎn)換成shapefile,然后基于芝加哥行政區(qū)劃的面要素對其進行屬性連接,連接完成即表明芝加哥行政區(qū)劃的屬性表中包含了人口分布數(shù)據(jù),此時,通過該圖層屬性工具中符號系統(tǒng)下數(shù)量分級就可以獲得芝加哥各區(qū)的一個簡略的人口密度分布圖。
當(dāng)然,上述只是一種基于面要素所蘊含的字段數(shù)值直接表明的分布圖,并沒有涉及空間之間的相關(guān)性。因此,我們還需要更定量的統(tǒng)計各區(qū)的人口分布情況,即利用熱點分析工具進行處理。
首先對數(shù)據(jù)進行全局性的統(tǒng)計,用于檢驗數(shù)據(jù)的分布模式。打開空間統(tǒng)計工具箱,選擇其中的空間自相關(guān)(Moran’s I)分析工具,因為是基于芝加哥行政區(qū)劃的面要素去考慮各區(qū)人口的相關(guān)性,所以在輸入要素類中選擇芝加哥行政區(qū)劃shapefile數(shù)據(jù),即airbnb_Chicago 2015;然后在輸入字段選擇population即可,記住要選擇生成報表。分析成功后,可以得到結(jié)果報表。報表中,P值是遠遠小于0.05的,且圖示顯示為集聚,可知數(shù)據(jù)在統(tǒng)計上顯著的呈現(xiàn)集聚,這是全局分析的結(jié)果。接下來探究局部,即研究人口分布的局部上的冷、熱點分布。仍在空間統(tǒng)計工具箱中,選擇熱點分析(Getis-Ord Gi*)。
熱點分析參數(shù)設(shè)置參考自相關(guān)分析參數(shù)設(shè)置,但要注意空間關(guān)系概念化下選擇反距離加權(quán)法。熱點分析完成得到輸出要素,然后將分布圖加以添加各類地圖要素得到成圖,即圖2。其中,紅色區(qū)域為人口分布熱點區(qū),藍色部分則為冷點區(qū)。
3.2.3數(shù)據(jù)分析
由圖中冷、熱點分布可以看出,Chicago西北地區(qū)如Avondale是人口熱點區(qū),且其周圍也普遍是熱點區(qū)域,而對應(yīng)的如South Deering則是冷點區(qū),其周邊地區(qū)人口密度也較低。此圖充分體現(xiàn)了各區(qū)人口密度之間的相關(guān)性。若金融公司開展業(yè)務(wù)或政府進行建設(shè),都可以根據(jù)這種具有人口密度相關(guān)性的熱點圖結(jié)合自己的項目進行建設(shè)。
3.3基于克里金插值法的中國年降水量分布分析
我們可以利用空間統(tǒng)計學(xué)中的地統(tǒng)計方法,如克里格插值方法等去研究一些氣象現(xiàn)象。
3.3.1數(shù)據(jù)來源
數(shù)據(jù)來源:GaotHR | 中國國家基礎(chǔ)地理信息系統(tǒng)數(shù)據(jù),中國氣象數(shù)據(jù)網(wǎng)
數(shù)據(jù)內(nèi)容:中國國界線.shp 中國省界線.shp ?中國地面國際交換點氣候資料日值數(shù)據(jù)集中降水量數(shù)據(jù)
3.3.2操作方法與步驟
使用克里金插值法,以某一年的降水量為樣本數(shù)據(jù),對中國年降水量進行分析。
首先將所需數(shù)據(jù)導(dǎo)入ArcMAP,克里金插值法使用前需要利用交叉驗證和對備用模型進行比較,進而選擇最優(yōu)的插值模型,因此我們可以使用地統(tǒng)計向?qū)нM行操作,即在菜單空白處右擊,選擇Geostatistical Analyst進行選取,然后進行界面,開始設(shè)置。由數(shù)據(jù)對象和統(tǒng)計方法可知數(shù)據(jù)集中數(shù)據(jù)字段分別為降水量和高程值,選擇普通克里金類型,趨勢的移除階數(shù)為一次得到年降水量分布的趨勢。利用ArcGIS工具箱中的平均最近鄰工具,得到結(jié)果中的NNObserved即為步長大小。完成以上插值參數(shù)設(shè)置后,得到結(jié)果圖,然后進行掩膜法提取所需形狀.
由于為降水量分布圖,故還需要對圖像進行降水量分層并繪制等值線。最終成圖為圖3
3.3.3數(shù)據(jù)分析
如圖,江蘇安徽等地區(qū)以及福建、上海等沿海地區(qū)屬于藍色區(qū)域,且顏色較深,可知這些地區(qū)的降水量較為充足,而新疆、寧夏等地區(qū)屬于紅色地區(qū),且新疆寧夏交界處紅色最深,說這些地區(qū)降水較少。因此,可以據(jù)此分析出當(dāng)?shù)剞r(nóng)作物情況以及當(dāng)?shù)厝嗣竦纳盍?xí)慣等,如降水量較少地區(qū),當(dāng)?shù)剞r(nóng)作物為了適應(yīng)天氣必然選擇耐旱作物,甚至無法進行農(nóng)業(yè)種植;而降雨量較多地區(qū)可能會偏向種植水稻等作物。
4總結(jié)與展望
本文從空間統(tǒng)計學(xué)的發(fā)展入手,詳細解釋了空間統(tǒng)計方法的由來,并闡述了空間統(tǒng)計方法發(fā)展與應(yīng)用的必要性。在對理論基礎(chǔ)進行研究后,為了更加深刻的了解這些方法,又選取了幾種較為典型的方法基于ARCGIS對空間數(shù)據(jù)進行了詳細的處理和應(yīng)用。如此,理論與應(yīng)用相結(jié)合,使得基于ARCGIS的空間統(tǒng)計方法研究得以簡介明了的進行。
參考文獻
[1] 佘冰,朱欣焰,咼維,徐曉. 基于空間點模式分析的城市管理事件空間分布及演化——以武漢市江漢區(qū)為例[J]. 地理科學(xué)進展,2013,32(06):924-931.
[2] 冒小棟,劉瓊芳. 江西省人口分布空間自相關(guān)分析[J]. 華東交通大學(xué)學(xué)報,2014,31(02):131-138.
[3] 沈體雁,馮等田,孫鐵山. 空間計量經(jīng)濟學(xué)[M]. 北京:北京大學(xué)出版社,2010.
[4] 劉湘南, 黃方, 王平. GIS空間分析原理與方法[M]. 科學(xué)出版社, 2005.