梁哲恒,謝輝榮,謝剛生
(1. 廣東南方數(shù)碼科技股份有限公司,廣東 廣州 510665; 2. 華南農(nóng)業(yè)大學(xué),廣東 廣州 510640)
?
空間點群目標(biāo)相似度計算模型及應(yīng)用
梁哲恒1,謝輝榮2,謝剛生1
(1. 廣東南方數(shù)碼科技股份有限公司,廣東 廣州 510665; 2. 華南農(nóng)業(yè)大學(xué),廣東 廣州 510640)
Study on the Calculation Model of Spatial Grouped Point Object Similarity and Its Application
LIANG Zheheng,XIE Huirong,XIE Gangsheng
摘要:為了研究點群目標(biāo)的相似性問題,整合了與點群目標(biāo)有關(guān)的拓?fù)潢P(guān)系、方向關(guān)系、距離關(guān)系、分布范圍和分布密度5種要素,這5種要素是影響點群目標(biāo)相似度的主要因子。根據(jù)這5種因子的特點,提出了各個因子相似度的計算模型,最后得到了點群目標(biāo)之間相似度的總體計算模型。經(jīng)過驗證,該方法能準(zhǔn)確地計算點群目標(biāo)之間的相似程度,符合人們的日常認(rèn)知。
關(guān)鍵詞:空間關(guān)系;相似性;點群目標(biāo)
空間目標(biāo)的相似性在人類認(rèn)知過程中具有重要的作用,是進行歸納、分類和類比的基礎(chǔ)。空間目標(biāo)的相似性在空間認(rèn)知中起著同樣的作用[1]。同一尺度空間下的不同目標(biāo)之間,相似性的研究可以提供空間數(shù)據(jù)的查詢和檢索[2]、數(shù)據(jù)集成和互操作[3]、數(shù)據(jù)挖掘等方面的應(yīng)用;并在不同尺度空間下的同一目標(biāo)進行匹配和綜合質(zhì)量評價[4]。
在心理學(xué)和認(rèn)知科學(xué)中,相似關(guān)系研究得較多,但在地理空間中的應(yīng)用,相似關(guān)系一直以來研究得較少。一方面由于空間相似關(guān)系比較復(fù)雜、可計算性差[5],地理空間的相似關(guān)系的計算要考慮的因素很多,如空間關(guān)系、空間分布、幾何特征、語義特征等[1]??臻g相似關(guān)系研究與模式識別、圖像檢索密切相關(guān)。模式識別中主要針對單一目標(biāo)的相似性研究[6],圖像檢索主要是以柵格圖像為主[7]。國內(nèi)外學(xué)者作了諸多探討和研究,如Bruns等引入心理學(xué)中的變換模型[8];Li等在此基礎(chǔ)上引入拓?fù)潢P(guān)系、方向關(guān)系和距離關(guān)系,并提出計算模型[1]。
點群目標(biāo)是空間目標(biāo)的重要組成部分,有一定的研究價值[9]。本文考慮到視覺識別的Gestalt原則,以及影響空間點群目標(biāo)的拓?fù)潢P(guān)系、距離關(guān)系、方向關(guān)系、分布范圍和分布密度,對空間點群目標(biāo)相似度進行整體度量,并以試驗驗證結(jié)果的可靠性。
一、點群信息與點群相似度
1. 相似度的定義
Holt在考慮了空間尺度和空間上下文關(guān)系之后,對空間目標(biāo)相似度的定義如下:在某一特定的粒度(比例尺)和內(nèi)容(專題屬性)上被認(rèn)為是相似的兩個區(qū)域。但該定義過于籠統(tǒng)和模糊,文獻[4]用集合學(xué)的方法對空間相似性進行了定義,具有清晰的數(shù)學(xué)描述。
2. 點群信息
空間目標(biāo)可以從目標(biāo)屬性、空間變量和幾何特征[9]等幾個角度認(rèn)識。點群目標(biāo)的信息普遍由統(tǒng)計信息、專題信息、拓?fù)湫畔ⅰ⒍攘啃畔10]決定,但根據(jù)Bruns提出的觀點,空間目標(biāo)的幾何特征中拓?fù)潢P(guān)系、方向關(guān)系和距離關(guān)系是最關(guān)鍵的幾個因素[11],應(yīng)該突出某些參數(shù)的重要性。因此,本文分別從空間拓?fù)潢P(guān)系、空間方向關(guān)系、空間距離關(guān)系、點群分布范圍、點群分布密度[8]幾個方面進行研究,最后得到計算點群相似度的公式。
二、點群目標(biāo)相似度的計算方法
點群目標(biāo)具有聚合的性質(zhì),其分布輪廓與凸殼有密切聯(lián)系,因此用凸殼來逼近點群的全局結(jié)構(gòu)[11]。凸殼是覆蓋點群目標(biāo)的最小凸圖形,在實際的應(yīng)用中,凸殼起著重要作用,如公路規(guī)劃中,各個鄉(xiāng)、鎮(zhèn)、村建立點集凸殼,可科學(xué)規(guī)劃環(huán)形公路;且凸殼直徑具有一定的方向性,符合人們的日常認(rèn)知。本文對點群目標(biāo)建立凸殼,計算凸殼的直徑,并通過凸殼直徑確定定長值K;以凸殼直徑與水平方向的夾角來表示方向;在此基礎(chǔ)上,用凸殼的面積與點群的點的個數(shù)計算點群的分布范圍和分布密度。如圖1、圖2所示。
圖1 點群目標(biāo)的凸殼
圖2 凸殼直徑
1. 拓?fù)湎嗨贫?/p>
點群之間的拓?fù)潢P(guān)系可以用點的鄰居來表示,如圖3所示。點的鄰居可以是定長距離鄰居、k個最近鄰居、Voronoi鄰居等。選擇定長距離鄰居作為點群拓?fù)湫畔⒌拿枋鰠?shù),主要是由于可以根據(jù)實際情況設(shè)定鄰居的長度。通過嘗試不同的定長距離d,記錄每個點的拓?fù)溧従觽€數(shù),拓?fù)湎嗨贫鹊挠嬎愎綖?/p>
(1)
式中,D為點群目標(biāo)鄰居的數(shù)量;n為點群目標(biāo)點的個數(shù)。
圖3 點群的拓?fù)溧従?/p>
2. 方向關(guān)系相似度
點群的方向可以表示點群目標(biāo)分布的大體趨勢,點群凸多邊形的直徑可以看成點群分布的主要方向,用凸殼多邊形的直徑與水平線之間的夾角θ表示點群目標(biāo)分布的方向,θ取值范圍為[0,π]。當(dāng)兩凸殼直徑夾角相差180°時,兩目標(biāo)的相似度為1,這符合人們的認(rèn)知。其相似性的公式為
(2)
式中,θ1、θ2分別為點群目標(biāo)凸殼直徑與水平線的夾角。
3. 分布范圍相似度
在點群周圍構(gòu)建凸殼,凸殼的面積大致能夠反映點群的分布范圍。點群目標(biāo)的分布范圍大致上可以用凸殼的面積S計算,其公式如下
(3)
式中,S為點群的凸殼面積。
4. 點群分布密度相似度
點群目標(biāo)的分布密度可以表示點群分布的疏密程度。點群密度的計算公式為點群數(shù)目與凸殼面積的比值。其點數(shù)與凸殼面積的比值大致上表示點群的分布密度,因此,可以用以下公式表示點群的分布密度相似度
(4)
5. 距離關(guān)系相似度
計算點群目標(biāo)的距離相似度,本文借助的是最小外接矩形(minimum bounding rectangle, MBR)。點群目標(biāo)的最小外接矩形能夠大致反映點群目標(biāo)分布的形狀及集中程度,如圖4所示。做出點群目標(biāo)的最小外接矩形,求出外接矩形的長和寬,由此可求得
(5)
式中,A、B為MBR的長和寬。其中MBR長和寬的比值反映了點群目標(biāo)的分布的密集程度。
圖4 最小外接矩形
6. 點群目標(biāo)相似度的計算
考慮到點群目標(biāo)的幾何特征,對點群目標(biāo)進行總體計算,其計算公式如下
(6)
上式為點群目標(biāo)相似性的整體計算模型。根據(jù)數(shù)值分析和概率論的研究,幾何平均值要比算術(shù)平均值在處理差異性方面更加具有穩(wěn)定性,因此,對點群目標(biāo)的總體相似性應(yīng)用幾何平均值。
三、試驗和結(jié)論
為了驗證點群相似程度算法的正確性,選擇某公交站點的分布情況。圖5為幾年前的公交車站的分布情況,圖6為現(xiàn)在公交車站的分布情況,圖7為不相關(guān)的某些點集。分別對這3個點群求各個因子的相似度及總體相似度,結(jié)果見表1、表2。
圖5 點群1
圖6 點群2
圖7 點群3
由表1可知,點群1和點群2之間的各因子的度量結(jié)果都比較接近,點群1與點群3之間、點群2與點群3之間的各個度量值差距比較大。
表1 各因子的統(tǒng)計結(jié)果
表2 點群各影響因素的相似度及總體相似度
由表2的計算結(jié)果可以得到以下結(jié)論:
1) 點群1和點群2之間各個因素的相似度都很高,說明同一點群目標(biāo)在一定的時間段內(nèi)的變化不大。
2) 點群1與點群3之間,點群2與點群3之間的各要素相似程度都很小,說明互不相關(guān)的點群目標(biāo)之間相關(guān)程度很小。
3) 點群1和點群2之間的分布密度相似度很小,由于在同一區(qū)域,點群數(shù)目的變化比較大,而點群目標(biāo)的影響范圍變化不大,導(dǎo)致計算點群目標(biāo)之間的分布密度相似度時,出現(xiàn)不一致性。
4) 此結(jié)果符合人們的日常認(rèn)知,可以作為比較兩個點群目標(biāo)之間相似度的一般方法。
四、結(jié)束語
本文提出點群目標(biāo)之間相似度的計算模型,并通過試驗證明了此算法可以較為準(zhǔn)確地計算點群目標(biāo)之間的相似程度,為同一尺度下的不同目標(biāo)之間的數(shù)據(jù)查詢、互操作、數(shù)據(jù)挖掘方面提供支持,希望對實際的計算分析能提供一定的參考。
參考文獻:
[1]LI B,FONSECA F. TDD-A Comprehensive Model for Qualitative Spatial Similarity Assessment[J]. Spatial Cognition & Computation an Interdisciplinary Journal,2006,6(1):31-62.
[2]GOODCHILD M F, EGENHOFER M J, KEMP K K, et al. Introduction to the Varenius project.[J]. International Journal of Geographical Information Science, 1999, 13(8):731-745.
[3]FRONTIERA P, LARSON R, RADKE J. A Comparison of Geometric Approaches to Assessing Spatial Similarity for GIR[J]. International Journal of Geographical Information Science, 2008, 22(3):337-360.
[4]閆浩文,褚衍東.多尺度地圖空間相似關(guān)系基本問題研究[J].地理與地理信息科學(xué),2009,25(4):42-44.
[5]陳春希,凌子燕,廖超明.基于遙感與GIS技術(shù)的景觀格局自相似性的尺度效應(yīng)研究——以防城港市為例[J].測繪通報,2012(5):50-52.
[6]陳飛,張榮,何華貴.城市多尺度空間數(shù)據(jù)庫的實現(xiàn)方法[J].測繪通報,2014(S2):252-255.
[7]郭仁忠.空間分析[M].北京:高等教育出版社,2001:240-244.
[8]ARKIN E M, CHEW L P, HUTTENLOCHER D P, et al.An Efficiently Computer Metric for Comparing Polygonal Shapes [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1991, 3(13):209-215.
[9]WANG J Z, LI J, WIEDERHOLD G. Simplicity: Semantics-Sensitive Integrated Matching for Picture Libraries[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 9(23):947-963.
[10]BRUNS H T, EGENHOFER M J. Similarity of Spatial Scenes[C]∥Seventh Symposium on Spatial Data Handling.London:[s.n.], 1998:31-42.
[11]劉濤,杜清運,閆浩文.空間點群目標(biāo)相似度計算[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2011,36(10):1149-1153.
[12]LI Z L, HUANG P Z. Quantitative Measures for Spatial Information of Maps[J]. International Journal of Geographical Information Science, 2002, 16(7):699-709.
[13]毋河海.凸殼原理在點群目標(biāo)綜合中的應(yīng)用[J] .測繪工程,1997,6(1):1-6.
[14]郝燕玲,唐文靜,趙玉新,等.基于空間相似性的面實體匹配算法研究[J].測繪學(xué)報,2008,37(4):501-506.
中圖分類號:P208
文獻標(biāo)識碼:B
文章編號:0494-0911(2016)03-0111-04
作者簡介:梁哲恒(1977—),男,碩士,工程師,主要研究方向為GIS軟件開發(fā)管理。E-mail:zheheng.liang@southgis.com
收稿日期:2015-11-16; 修回日期: 2016-01-07
引文格式: 梁哲恒,謝輝榮,謝剛生. 空間點群目標(biāo)相似度計算模型及應(yīng)用[J].測繪通報,2016(3):111-114.DOI:10.13474/j.cnki.11-2246.2016.0100.