陳叢
(福建師范大學(xué)協(xié)和學(xué)院,福建 福州 350108)
自相關(guān)作為一種常用的數(shù)學(xué)工具在不同領(lǐng)域有不同含義。隨著時間的推移,自相關(guān)這個概念被擴展應(yīng)用于各個研究領(lǐng)域,如圖像處理、通信工程、醫(yī)學(xué)研究、地理科學(xué)等??臻g自相關(guān)這一研究領(lǐng)域的理論基礎(chǔ)是由美國地理學(xué)家W.R.Tobler所指出的空間相關(guān)性的存在。地理學(xué)第一定律[1]可以表述為:“Everything is related to everything else,but near things are more related than distant things.”空間自相關(guān)使統(tǒng)計學(xué)在地理學(xué)領(lǐng)域中獲得了更大程度的運用,它的發(fā)展推動了空間統(tǒng)計學(xué)、計量地理學(xué)等學(xué)科的發(fā)展;這種相關(guān)性也可以擴展到圖像分析領(lǐng)域。
空間自相關(guān)既可研究地理對象,判斷不同對象之間的空間聯(lián)系;也可針對圖像中像元的特定屬性展開計算分析,反映出一個單元與鄰近單元的關(guān)聯(lián)程度,并由此來判斷圖像的空間結(jié)構(gòu)??臻g自相關(guān)包括三種情況:空間不相關(guān)即區(qū)域內(nèi)像元的屬性值呈隨機分布,無特定規(guī)律;空間負相關(guān)表示區(qū)域內(nèi)相距較近的像元的屬性值的相似程度低于相距較遠的像元的屬性值相似程度;空間正相關(guān)則與負相關(guān)相反,并可以根據(jù)像元的屬性值大小將聚集區(qū)分為高值聚集和低值聚集??臻g自相關(guān)的程度由空間自相關(guān)指數(shù)的數(shù)值來體現(xiàn)。
空間自相關(guān)分析包括全局空間自相關(guān)分析和局部空間自相關(guān)分析[2],其結(jié)果可以揭示圖像中隱含的聚集性。全局分析主要著眼于研究整個區(qū)域的總體空間分布;而局部分析則著眼于各個單元的屬性在空間中的局部分布,度量每個單元與其鄰近區(qū)域的局部相關(guān)程度。下文中我們主要針對Moran's I和Getis G指數(shù)進行分析。
計算空間自相關(guān)指數(shù),空間權(quán)重矩陣(Spatial Weight Matrix)[3]的構(gòu)建是不可忽略的環(huán)節(jié)。針對不同領(lǐng)域的應(yīng)用特點和不同的實際計算需求,我們需要選擇不同的權(quán)重矩陣構(gòu)造方式[4],從而提高計算結(jié)果的準確性。三種計算方法中,歐式距離的計算結(jié)果比較精確,但計算量大;其余兩種方法的計算過程簡單,但結(jié)果存在一定的計算誤差[5]。綜合比較后,我們采取城區(qū)距離的方法構(gòu)造空間權(quán)重矩陣。
1948年,Moran提出了全局Moran’s I指數(shù),其計算公式[6]為:
其中,Xi表示區(qū)域i的某個指定屬性(在數(shù)字圖像中表示某像元的屬性值);Wij表示區(qū)域i與j的空間權(quán)重值,即權(quán)重矩陣W中第i行第j列的值;-X表示屬性均值;n表示變量(區(qū)域)個數(shù)。全局Moran's I指數(shù)的取值范圍為[-1,1]。指數(shù)值為0時,屬性X的值在空間上表現(xiàn)為隨機分布;指數(shù)值越接近1,表現(xiàn)為空間位置上相近的區(qū)域?qū)傩灾当容^遠的區(qū)域?qū)傩灾蹈嗨?,即區(qū)域內(nèi)存在的空間正相關(guān)的程度越高;指數(shù)值越接近-1,表現(xiàn)為空間位置上相近的區(qū)域?qū)傩灾当容^遠的區(qū)域?qū)傩詢A向于更不相似,即區(qū)域內(nèi)存在的空間負相關(guān)的程度越高。該指數(shù)的取值受區(qū)域聚集程度的影響較大,能夠較為敏感地感知聚集范圍的變化趨勢,但并不能確定聚集屬于高值聚集還是低值聚集[7]。
為了度量研究對象在局部層面上的空間自相關(guān)程度,Anselin在全局Moran's I指數(shù)的基礎(chǔ)上提出了局部Moran's Ii指數(shù),其計算公式[8]為:
公式(2)中各變量含義與公式(1)中相同,局部Moran's Ii指數(shù)的取值范圍為全體實數(shù)。指數(shù)值高于數(shù)學(xué)期望值,說明研究區(qū)域可能存在局部空間正相關(guān);指數(shù)值低于數(shù)學(xué)期望值,說明研究區(qū)域可能存在局部的空間負相關(guān)。每個研究區(qū)域的局部指數(shù)均反映了該區(qū)域與鄰近區(qū)域的相關(guān)程度,根據(jù)計算公式,局域Moran's Ii指數(shù)實質(zhì)上是對全局Moran's I指數(shù)的分解;整個區(qū)域的局部指數(shù)之和理論上應(yīng)與全局指數(shù)成正比。
由于Moran's I指數(shù)在識別空間自相關(guān)聚集類型時存在一定的缺陷,1992年,Getis和Ord提出了全局Getis指數(shù),簡稱G指數(shù),其計算公式[6]為:
全局Getis指數(shù)的取值范圍為全體實數(shù)。G指數(shù)同樣可以通過標準化統(tǒng)計量Z進行檢驗,“當(dāng)Z(G)的值大于零時表示研究區(qū)域存在高值聚集,當(dāng)Z(G)的值小于零時表示研究區(qū)域存在低值聚集[7]”。
為了更好地進行局部空間自相關(guān)分析,1995年,Getis和Ord對全局Getis指數(shù)進行了改進,提出了局部Getis指數(shù),簡稱 Gi指數(shù)[9],其計算公式[10]為:
Gi指數(shù)的取值為全體實數(shù),該指數(shù)同樣也可以通過標準化統(tǒng)計量Z進行檢驗,當(dāng)指數(shù)值大于零時表示存在高值聚集,當(dāng)指數(shù)值小于零時表示存在低值聚集。
從計算公式上分析,Getis(全局和局部)指數(shù)是通過鄰近位置上的屬性值的乘積衡量相關(guān)程度。根據(jù)計算公式可知,對同一個研究區(qū)域計算時,分母部分總是一個固定值,而分子的值由鄰近空間位置上的屬性值決定。如果鄰近的屬性值都是高的,則指數(shù)值也高,從而體現(xiàn)出高值聚集;如果鄰近的屬性值都是低的,則指數(shù)值也低,從而體現(xiàn)出低值聚集。
本文繼續(xù)使用65*65隨機灰度圖[5]進行實驗設(shè)計。由基礎(chǔ)實驗可知,全局Moran's I指數(shù)能夠描述某區(qū)域的整體屬性分布,判斷此區(qū)域是否存在聚集,同時對聚集范圍的變化趨勢比較敏感。但是,該指數(shù)只能從總體上給出一個指標,無法確定聚集的類型,也無法確定聚集區(qū)域的中心位置[5]。
隨著權(quán)重間隔d從1擴大至65,基于隨機灰度圖像計算所得的全局Getis指數(shù)值擴大趨勢明顯,但總體均小于1,表現(xiàn)為圖像中不存在明顯的空間自相關(guān),即圖像呈現(xiàn)隨機分布,與圖像的來源相符合。
基于全局Getis指數(shù)的計算原理進行分析,該指數(shù)并不考慮像元本身屬性值與均值間的差異,而是直接使用屬性值計算,因此計算結(jié)果均大于零。基于隨機圖像,隨著權(quán)重間隔的不斷擴大,像元的鄰接區(qū)域也不斷擴大,其鄰接像元的數(shù)量增多,從而使分母和分子的值不斷接近,最終表現(xiàn)為指數(shù)值的不斷擴大。若圖像中存在聚集,像元本身的屬性值與鄰近像元的值相近,從而擴大分子的數(shù)值,減小分子與分母的差異,擴大最終的指數(shù)值,指示出聚集特征。
在隨機灰度圖像的左上角3行3列聚集區(qū)域中代入不同屬性值(0至255)分別計算,所得全局Getis指數(shù)值的變化趨勢基本相同,曲線基本重合;指數(shù)值在同一權(quán)重間隔下的差異值處于10-3的數(shù)量級。但是,在同一權(quán)重間隔下,使用屬性值0至255依次代入時,全局Getis指數(shù)值的變化呈現(xiàn)出一定規(guī)律性,偏向于低于均值的聚集值,如圖1所示。根據(jù)這一特征,可將全局Getis指數(shù)用于判斷聚集的類型。在圖1中l(wèi)ine1直線表示了原圖像在權(quán)重間隔為15時的全局Getis指數(shù)值;line2曲線表示同一權(quán)重間隔下使用0至255依次代入時計算所得的指數(shù)值。同時,權(quán)重間隔越大時,計算所得的曲線越接近于直線。
圖1 不同屬性值代入的全局Getis指數(shù)值(權(quán)重距離為15)
但是全局Getis指數(shù)對于聚集范圍的變化并不敏感。當(dāng)聚集區(qū)域從左上角3行3列擴大到5行5列、7行7列、9行9列時,指數(shù)值的變化較小,曲線基本重合。
接下來,我們需要驗證指數(shù)檢測聚集中心位置的敏銳性。選擇上文實驗中相關(guān)性相對顯著的9行9列的聚集區(qū)域(灰度值設(shè)為250,高值聚集)進行實驗,設(shè)定權(quán)重間隔為1,計算該區(qū)域沿對角線從圖像左上角向右下角移動的過程中指數(shù)值的變化。低值聚集時,聚集區(qū)域位于圖像兩個角點時指數(shù)值高于聚集區(qū)域位于圖像內(nèi)部區(qū)域,如圖2(屬性值為50)所示;而存在高值聚集時其規(guī)律正好相反。當(dāng)該聚集區(qū)域在四個邊緣移動時同樣有類似的規(guī)律,可以較好地判斷聚集區(qū)域是否位于或接近角點位置。
圖2 全局Getis指數(shù)的邊緣檢測
綜合上述結(jié)果,單核聚集時,全局Moran's I指數(shù)在檢測聚集的存在及聚集范圍的變化方面具有一定的優(yōu)勢,但是無法區(qū)分聚集類型和聚集中心的位置;而全局Getis指數(shù)在一定程度上可以區(qū)分聚集類型。在邊緣檢測上,全局Getis指數(shù)的指向性會優(yōu)于全局Moran's I指數(shù)。
總體上,全局空間自相關(guān)指數(shù)對于聚集中心的指向性都不夠明確,因而在下一步的實驗中將嘗試通過局部空間自相關(guān)指數(shù)確定空間聚集的細節(jié)指標。對于局部Moran's I指數(shù)和局部Getis Gi指數(shù)的計算我們側(cè)重于在隨機圖像上添加了聚集區(qū)域后的分析。
3.2.1 局部Moran's Ii指數(shù)的計算
基于隨機灰度圖像,我們設(shè)定屬性值50用于模擬低值聚集,屬性值250用于模擬高值聚集。在單核聚集的情況下,設(shè)定聚集區(qū)域為21行21列的范圍?;谀M聚集后的圖像,實驗計算了局部Moran's Ii指數(shù)并使用Matlab將結(jié)果用圖像方式(圖3)進行呈現(xiàn)。
圖3 局部Moran’s Ii指數(shù)
3.2.2 局部Getis Gi指數(shù)的計算
局部Getis Gi指數(shù)的計算結(jié)果如圖4所示。該指數(shù)同樣具有較強的檢測聚集中心位置的能力,同時在聚集范圍的檢測上會稍強于局部Moran's Ii指數(shù),檢測所得的范圍大小更接近于實際區(qū)域面積;但在聚集區(qū)域邊角點的計算與檢測中會稍弱于局部Moran's Ii指數(shù)。無論聚集中心處于什么圖像位置,局部Getis Gi指數(shù)都能夠檢測到聚集;由于受到邊緣像元的影響,聚集范圍的大小有所變化。
圖4 局部Getis Gi指數(shù)
現(xiàn)實圖像中單核聚集比較少見,多核聚集則大規(guī)模存在。我們以雙核聚集為例,設(shè)置聚集區(qū)域為21行21列,其中一塊為高值聚集(屬性值為250),另一塊為低值聚集(屬性值為50)。圖5表示了兩塊聚集區(qū)域所在位置,以8行8列圖像中的兩塊3行3列聚集為例,其中黑色表示低值聚集,灰色表示高值聚集,白色表示原有隨機屬性值;本文使用圖中列出的十二種方案完成指數(shù)計算。
圖5 雙核聚集方案
固定權(quán)重間隔d為1,計算全局Moran's I指數(shù),結(jié)果如表1所示。根據(jù)計算結(jié)果,結(jié)合聚集區(qū)域所在位置分析可得,全局Moran's I指數(shù)對于聚集位置的改變并不敏感,從總體上來說,邊緣位置的識別略高于內(nèi)部區(qū)域;當(dāng)雙核同為高值聚集或低值聚集時,該指數(shù)識別高值聚集的能力明顯高于低值聚集。使用上述方案對全局Getis指數(shù)進行計算時,方案九至十二的計算結(jié)果略高于一至八,顯示出聚集中心位于邊緣區(qū)域與位于內(nèi)部區(qū)域的區(qū)別,且差異值高于全局Moran's I指數(shù)的結(jié)果。由此說明,多核聚集時,全局Getis指數(shù)對于聚集位置的判斷與識別仍然優(yōu)于全局Moran's I指數(shù)。
基于上述12種方案使用局部指數(shù)進行計算,結(jié)果所反映出的局部Moran's Ii指數(shù)和局部Getis Gi指數(shù)的差別與單核聚集時基本相同。
表1 全局Moran’s I指數(shù)
基于隨機灰度圖,本文通過設(shè)置單核聚集、多核聚集、移動聚集中心、改變聚集區(qū)域大小、權(quán)重間隔、高值聚集、低值聚集等比較了全局和局部的Moran's I指數(shù)、Getis指數(shù),根據(jù)實驗結(jié)果可以總結(jié)出以下規(guī)律:
(1)無聚集時,兩種全局指數(shù)都能正確地反映出圖像的隨機特征。隨著權(quán)重間隔的擴大,全局Moran's I指數(shù)呈現(xiàn)出振蕩中相關(guān)程度逐漸減小的規(guī)律,比全局Getis指數(shù)更符合實際。
(2)存在聚集時,兩種全局指數(shù)都能夠檢測到聚集,但是全局Getis指數(shù)檢測低值聚集的能力強于高值聚集;同時全局Moran's I指數(shù)無法區(qū)分聚集的類型。
(3)全局Moran's I指數(shù)對聚集范圍的變化較敏感,能夠以此指示研究區(qū)域內(nèi)某種現(xiàn)象的變化趨勢;全局Getis指數(shù)則能夠較好地區(qū)分聚集位于圖像邊緣或圖像內(nèi)部。
(4)局部Moran's Ii指數(shù)對于邊角區(qū)域的檢測能力較強,但是無法區(qū)分聚集的類型,所檢測到的聚集范圍總是小于實際的聚集范圍。而相同條件下,局部Getis Gi指數(shù)雖然檢測邊角聚集的能力較弱,但是在聚集中心、聚集范圍的檢測上正確性更高。
綜上所述,總體考慮指數(shù)對于聚集類型、聚集范圍、聚集中心位置等方面的指向性,從全局角度上看,Moran's I指數(shù)的性能優(yōu)于Getis指數(shù);從局部角度上分析,Getis Gi指數(shù)的性能優(yōu)于Moran's Ii指數(shù)。
[1]Tobler W R.A Computer Movie Simulating Urban Growth in the Detroit Region[J].Economic Geography,1970,46(2):234-240.
[2]Getis A,Ord J K.Local spatial statistics:An overview[A].Spatial Analysis:Modelling in a GIS Environment[C].John Wiley&Sons.1996,261-277.
[3]張曉萌,付燕.圖像分割技術(shù)研究[J].科技情報開發(fā)與經(jīng)濟,2007,17(18):183-184.
[4]陰國富.基于閾值法的圖像分割技術(shù)[J].現(xiàn)代電子技術(shù),2007,30(23):107-108.
[5]陳叢.基于隨機灰度圖的全局Moran’s I指數(shù)的計算與分析[J].電腦知識與技術(shù),2014,10(26):6149-6154.
[6]SAWADA M.Golbal Spatial Autocorrelation Indices-Moran’s I,Geary’s C and the General Cross-Product Statistic.http://www.lpc.uottawa.ca/publications/Moransi/Moran.htm.2006-05-16
[7]張松林,張昆.全局空間自相關(guān)Moran指數(shù)和G系數(shù)對比研究[J].中山大學(xué)學(xué)報(自然科學(xué)版),2007,46(4),93-97.
[8]Anselin,L.The Local Indicators of Spatial Association-LISA[J].Geographical Analysis,1995,27(2):93-116.
[9]Ord JK,Getis A.Local spatial autocorrelation statistics:distributional issues and an application[J].Geographical Analysis,1995,27(4):286-306.
[10]Getis A,Ord JK.The analysis of spatial association by use of distance statistics[J].Geographical Analysis,1992,24(3):189-206.